JP3171626B2 - Character recognition processing area / processing condition specification method - Google Patents

Character recognition processing area / processing condition specification method

Info

Publication number
JP3171626B2
JP3171626B2 JP33963291A JP33963291A JP3171626B2 JP 3171626 B2 JP3171626 B2 JP 3171626B2 JP 33963291 A JP33963291 A JP 33963291A JP 33963291 A JP33963291 A JP 33963291A JP 3171626 B2 JP3171626 B2 JP 3171626B2
Authority
JP
Japan
Prior art keywords
line
character recognition
processing
area
recognition processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP33963291A
Other languages
Japanese (ja)
Other versions
JPH05151388A (en
Inventor
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP33963291A priority Critical patent/JP3171626B2/en
Publication of JPH05151388A publication Critical patent/JPH05151388A/en
Application granted granted Critical
Publication of JP3171626B2 publication Critical patent/JP3171626B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)
  • Processing Or Creating Images (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、原稿の画像を読み取っ
て文字認識処理するシステムに係り、特に、かかるシス
テムに対し原稿の処理領域とその処理条件を指定する
に関する。
BACKGROUND OF THE INVENTION This invention is, read the image of the original document
In particular, a method of designating a document processing area and its processing conditions for such a system.
About the law .

【0002】[0002]

【従来の技術】従来、原稿の処理領域を指定する場合、
マーカー(カラー・フェルトペン等)を用いて処理領域
を囲む線を原稿に直接書き込み、これを認識させる方式
(例えば特開平2−253377号)、または、タブレ
ットを用いて、あるいは原稿画像を表示させたディスプ
レイ画面上でマウス等を用いて、領域を座標で指定する
方式(例えば特開昭63−86015号)が採用されて
いる。そして、指定した領域に対し、どのような処理を
行なうか(処理条件もしくは内容)の指定には、領域指
定後に処理選択用のキーを用いて行なう方式が一般に採
用されている。
2. Description of the Related Art Conventionally, when a processing area of a document is designated,
Using a marker (such as a color felt-tip pen), a line surrounding the processing area is directly written on the original and recognized (for example, JP-A-2-253377), or using a tablet or displaying the original image. (For example, Japanese Patent Application Laid-Open No. 63-86015) in which a region is designated by coordinates on a display screen using a mouse or the like. To specify what kind of processing (processing condition or content) is to be performed on a specified area, a method is generally used in which a key for processing selection is used after the area is specified.

【0003】[0003]

【発明が解決しようとする課題】しかし、領域の指定
と、それに対する処理条件もしくは内容の指定を別々に
行なう方式は、指定作業が煩わしいばかりか、多数の原
稿を処理したい場合に、原稿毎に処理領域と処理条件が
異なるのが普通であるので、一枚処理するごとに処理を
中断し、領域と処理条件を指定して処理を再開するとい
う作業の繰り返しとなり、連続処理(バッチ処理)がで
きないという大きな問題がある。
However, the method of separately designating the area and designating the processing conditions or contents for the area is not only troublesome in the designation operation, but also requires processing of a large number of originals for each original. Since the processing area and the processing conditions are usually different, the process of interrupting the processing each time one sheet is processed, resuming the processing by designating the area and the processing conditions is repeated, and the continuous processing (batch processing) is performed. There is a big problem that you can not.

【0004】本発明の目的は、文字認識処理システムに
おいて、簡単な作業で文字認識処理領域とその処理条件
を指定でき、かつ多数の原稿のバッチ処理にも不都合の
ない処理領域及び処理条件の指定方法を提供することに
ある。
An object of the present invention is to provide a character recognition processing system.
In a simple operation, the character recognition processing area and its processing conditions
The present invention provides a method for specifying a processing area and a processing condition which can specify a processing area and which is not inconvenient for batch processing of a large number of documents.

【0005】[0005]

【課題を解決するための手段】本発明の骨子は次の通り
である。原稿の文字認識処理領域及び処理条件を指定す
る場合、カラー・フェルトペン等のマーカーを用いて、
処理対象領域を囲む線図形を原稿に直接書き込むが、こ
の際に書き込む線図形として、処理条件に対応して予め
定義された形状特徴を持つ図形を選ぶ。文字認識処理シ
ステムでは、該原稿を読み取り、該読み取った原稿画像
より、原稿にマーカーで書き込まれた線図形を認識し、
線図形の範囲を文字認識処理領域と決定し、また、線図
形の形状特徴より処理条件(文字方向、行方向)を決定
する。ここで、線図形の形状特徴には、線図形の辺を構
成する線分に矢印をつける、線分の本数や連続性や長さ
の違いなどを用いる。
The gist of the present invention is as follows. When specifying the character recognition processing area and processing conditions of the manuscript, use a marker such as a color felt-tip pen,
A line figure surrounding the processing target area is directly written on the document. At this time, a figure having a shape characteristic defined in advance corresponding to the processing condition is selected as the line figure to be written. In the character recognition processing system, the original is read, and from the read original image, a line figure written on the original with a marker is recognized,
The range of the line figure is determined as the character recognition processing area, and the processing conditions (character direction, line direction) are determined from the shape characteristics of the line figure. Here, the shape features of the line figure include the sides of the line figure.
Add an arrow to the line segment to be formed, the number, continuity, and length of the line segment
Use the differences.

【0006】[0006]

【作用】このように、文字認識の処理条件に対応した形
状特徴を持つ線図形を原稿に直接書き込むことによっ
て、文字認識処理領域と処理条件を一度に指定すること
ができ、指定作業が極めて簡単である。
As described above, by directly writing a line figure having a shape characteristic corresponding to the character recognition processing condition on the document, the character recognition processing area and the processing condition can be specified at once, and the specification work is extremely simple. It is.

【0007】また、多数の原稿を文字認識処理したい場
合に、予め全部の原稿に必要な線図形を書き込んでおく
だけで、文字認識処理システムにおいて、各原稿に対し
処理領域と処理条件を決定しながら必要な処理を順次行
なうことによって、多数の原稿の連続文字認識処理(バ
ッチ処理)が可能である。
Further, when a large number of originals are to be subjected to character recognition processing, only by writing necessary line figures on all the originals in advance, the character recognition processing system determines a processing area and processing conditions for each original. By successively performing the necessary processing, continuous character recognition processing (batch processing) for a large number of documents is possible.

【0008】[0008]

【実施例】以下、本発明の実施例を図面を用い説明す
る。
Embodiments of the present invention will be described below with reference to the drawings.

【0009】図1は、後述の各実施例に係る光学的文字
認識処理システムの概略構成を示す。このシステムの概
要は、スキャナ1によって原稿を読み取って、そのイメ
ージを領域・条件決定装置2に入力し、この領域・条件
決定装置2で、原稿上のマーカーの線図形を認識するこ
とによって処理領域と処理条件を決定する。この決定内
容と原稿イメージをイメージ処理装置3に送り、ここで
処理領域に対し、決定された処理条件による処理を施
し、処理後のイメージを出力装置4によって出力すると
いうものである。
FIG. 1 shows an optical character according to each embodiment described later.
1 shows a schematic configuration of a recognition processing system. The outline of this system is as follows. An original is read by a scanner 1 and an image thereof is input to an area / condition determining device 2. And processing conditions. The determined contents and the original image are sent to the image processing device 3, where processing is performed on the processing area according to the determined processing conditions, and the processed image is output by the output device 4.

【0010】より具体的には、イメージ処理装置3にお
いては、指定された領域に対し、指定された条件にて認
識処理を行ない、認識結果を出力装置4によりプリント
アウト、画面表示あるいは記憶媒体への格納等を行なう
ことになる。
More specifically, the image processing device 3
In other words, the recognition process is performed on the specified area under the specified conditions, and the recognition result is printed out by the output device 4, displayed on a screen, or stored in a storage medium.

【0011】図2は、領域・条件決定装置2の概略ブロ
ック図である。スキャナ1より入力された原稿イメージ
は、イメージ処理装置3へ送られるとともにイメージバ
ッファ11に格納される。マーカー線分検出部12は、
イメージバッファ11より原稿イメージを読み込み、マ
ーカーで原稿に直接書き込まれた線図形の線分を抽出
し、抽出された線分の情報より線図形認識部13でマー
カーの線図形を認識する。条件決定部14は、認識され
た線図形の形状特徴と、予め処理条件毎に定義された線
図形の形状特徴とを照合し、形状特徴が一致した処理条
件をイメージ処理装置3へ通知する。また領域決定部1
5は、認識された線図形に外接する矩形の左上角と右下
角の座標を検出し、領域情報としてイメージ処理装置3
へ通知する。
FIG. 2 is a schematic block diagram of the area / condition determining device 2. The original image input from the scanner 1 is sent to the image processing device 3 and the image
Buffer 11. The marker line segment detection unit 12 includes:
The original image is read from the image buffer 11, the line segment of the line figure directly written on the original is extracted by the marker, and the line figure of the marker is recognized by the line figure recognition unit 13 based on the information of the extracted line segment. The condition determining unit 14 compares the recognized shape feature of the line figure with the shape feature of the line figure defined in advance for each processing condition, and notifies the image processing apparatus 3 of the processing condition whose shape feature matches. Also, the area determination unit 1
5 detects a rectangle of the upper left corner and lower right corner coordinates which circumscribes the recognized line drawing, image processing apparatus 3 as the area information
Notify to

【0012】なお、ここでの2値イメージから線図形を
認識する処理などは公知技術によって容易に実現できる
ものである。また、マーカーの線分の検出等の技術は、
例えば特開平2−25377号公報に詳しく述べられて
いる。以下、各実施例について具体的に説明する。
The processing for recognizing a line figure from a binary image can be easily realized by a known technique. In addition, techniques such as marker line segment detection
For example, it is described in detail in JP-A-2-25377. Hereinafter, each embodiment will be specifically described.

【0013】実施例1 本実施例は、光学的文字認識システムにおいて、一辺を
矢印とした矩形が、領域指定のための線図形として用い
られ、この線図形の一辺の矢印の向きによって、文字認
識の処理条件の一つである文字方向を指定する。
Embodiment 1 In this embodiment, in an optical character recognition system, a rectangle having one side as an arrow is used as a line figure for specifying an area, and character recognition is performed according to the direction of the arrow on one side of the line figure.
Specifies the character direction, which is one of the processing conditions for knowledge .

【0014】すなわち、図3に示す如き図形51a〜5
4bが、文字方向に対応して定義される。文字方向を上
向きとして指定する場合、図形51aまたは51bを選
び、これをマーカーにより原稿に記入する。これ以外の
文字方向も同様である。システムの条件決定部14は、
原稿上の線図形の矢印の向きを、文字方向を決定するた
めの形状特徴として用いることができる。
That is, as shown in FIG.
4b is defined corresponding to the character direction. When the character direction is specified as upward, the figure 51a or 51b is selected, and this is written on the manuscript with the marker. The same applies to other character directions. The system condition determination unit 14
The direction of the arrow of the line figure on the document can be used as a shape feature for determining the character direction.

【0015】例えば図4に示す原稿56の場合、マーカ
ーで記入された線図形57は図3の図形53aまたは5
3bと同じ形状特徴を持っている。また、線図形58
は、図3の図形51aまたは51bと形状特徴が同じで
ある。
For example, in the case of the original 56 shown in FIG. 4 , the line graphic 57 written by the marker is the graphic 53a or 5 in FIG.
It has the same shape characteristics as 3b. Also, a line figure 58
Is figure 51a or 51b and the shape characteristics of FIG. 3 are the same.

【0016】この原稿56の場合、システムにおいて、
領域・条件決定装置2は、原稿上の線図形57,58を
認識し、それぞれの外接矩形の範囲を処理領域として決
定し、また線図形57の領域の文字方向を左向きと決定
し、線図形58の領域の文字方向を上向きと決定する。
そして、イメージ処理装置3は、線図形57の領域に対
して、文字方向が左向きであるという条件で認識処理を
行ない、また線図形58の領域に対して、文字方向が上
向きであるとして認識処理を行なう。
In the case of the original 56 , in the system,
The area / condition determination device 2 recognizes the line figures 57 and 58 on the document, determines the range of each circumscribed rectangle as a processing area, determines the character direction of the area of the line figure 57 to the left, and The character direction of the area 58 is determined to be upward.
Then, the image processing apparatus 3 performs recognition processing on the area of the line graphic 57 under the condition that the character direction is leftward, and recognizes that the character direction is upward on the area of the line graphic 58. Perform

【0017】なお、矢印に代えて、他の記号を辺の線分
の先端に記入するようにしてもよい。これは後述の実施
例2、3においても同様である。
Note that, instead of the arrow, another symbol may be written at the tip of the side line segment. This is the implementation
The same applies to Examples 2 and 3 .

【0018】実施例2 本実施例は、光学的文字認識システムにおいて、一辺を
矢印とした矩形が、領域指定のための線図形として用い
られ、この線図形の一辺の矢印の方向によって、文字認
識の処理条件の一つである行方向を指定する。
Embodiment 2 In this embodiment, in an optical character recognition system , a rectangle having one side as an arrow is used as a line figure for designating an area, and character recognition is performed according to the direction of the arrow on one side of this line figure.
Specifies the line direction, which is one of the processing conditions of the knowledge .

【0019】図5に、行方向に対応して定義された線図
形の形状を示す。行方向を垂直方向として指定する場
合、図形61aまたは61bを選び、これをマーカーに
より原稿に記入する。行方向を水平方向とする場合も同
様である。システムの条件決定部14は、線図形の矢印
の方向を、行方向を決定するための形状特徴として用い
ることができる。
FIG . 5 shows the shape of a line figure defined corresponding to the row direction. When the row direction is designated as the vertical direction , the figure 61a or 61b is selected, and this is written on the manuscript with the marker. The same applies when the row direction is horizontal.
It is like. The condition determining unit 14 of the system can use the direction of the arrow of the line graphic as a shape feature for determining the row direction.

【0020】例えば図6に示す原稿65の場合、マーカ
ーで記入された線図形66は図5の図形61aまたは6
1bと同じ形状特徴を持っている。また、線図形67
は、 の図形62aまたは62bと同じ形状特徴が同
じである。
For example, in the case of the original 65 shown in FIG. 6 , the line graphic 66 written with the marker is the graphic 61a or 6a in FIG.
It has the same shape characteristics as 1b. Also, the line graphic 67
Is the same shape feature a figure 62a or 62b in FIG. 5 are the same.

【0021】この原稿65の場合、システムにおいて、
領域・条件決定装置2は、原稿上の線図形66,67を
認識し、それぞれの外接矩形の範囲を処理領域として決
定し、また線図形66の領域の行方向を垂直方向と決定
し、線図形67の領域の行方向を水平方向と決定する。
そして、イメージ処理装置3は、線図形66の領域に対
し、認識条件である行方向が垂直方向であるとして認識
処理を行ない、また線図形67の領域に対し行方向が水
方向であるとして認識処理を行なう。
In the case of the original 65 , the system
The area / condition determination device 2 recognizes the line figures 66 and 67 on the document, determines the range of each circumscribed rectangle as a processing area, determines the row direction of the area of the line figure 66 as the vertical direction , The row direction of the region of FIG. 67 is determined as the horizontal direction .
Then, the image processing device 3, the recognition for a region of the line drawing 66, as a recognition condition row direction performs a recognition process as a vertical direction, also with respect to areas of the line drawing 67 the row direction is a horizontal direction Perform processing.

【0022】実施例3 本実施例は、光学的文字認識システムにおいて、領域を
指定するために原稿に記入する矩形の上辺または右辺の
線分(第1の線分)に付けた片矢印(第1の矢印)の向
きによって文字方向を指定し、また矩形の下辺または左
辺の線分(第2の線分)に両矢印(第2の矢印)を付け
ることによって行方向を指定する。具体的には、図7に
示した図形71〜74と図形75,76を組み合わせた
線図形を、文字認識の処理条件のために用いる。
Embodiment 3 This embodiment is directed to an optical character recognition system in which the upper side or right side of a rectangle to be written on a document to specify an area is designated.
The character direction is specified by the direction of the single arrow (first arrow) attached to the line segment (first line segment), and the double arrow ( second line segment) is added to the lower or left side line segment (second line segment) of the rectangle . (2 arrow) to specify the row direction. Specifically, a line figure obtained by combining the figures 71 to 74 and the figures 75 and 76 shown in FIG. 7 is used as a processing condition for character recognition.

【0023】システムの条件決定部14は、原稿上の線
図形の上辺または右辺の矢印の向きを文字方向を決定す
るための形状特徴として用いることができ、また線図形
の下辺または左辺の矢印の有無を行方向決定のための形
状特徴として用いることができる。
The condition determining unit 14 of the system can use the direction of the arrow on the upper side or right side of the line figure on the document as a shape feature for determining the character direction, and can use the direction of the arrow on the lower side or left side of the line figure. Presence or absence can be used as a shape feature for determining the row direction.

【0024】例えば図8に示す原稿77の場合、マーカ
ーで記入された線図形78は図7の図形73の形状特徴
と図形76の形状特徴を持っている。また、線図形79
は、図7の図形71,75の両方の形状特徴を持ってい
る。
[0024] For example, in the case of the document 77 shown in FIG. 8, line figure 78 filled with a marker has the shape features of shape features and figure 76 figure 73 in FIG. Also, the line graphic 79
Has the shape features of both figures 71 and 75 in FIG.

【0025】この原稿77の場合、システムにおいて、
領域・条件決定装置2は、原稿上の線図形78,79を
認識し、それぞれの外接矩形の範囲を処理領域として決
定し、また線図形78の領域の行方向を垂直方向、文字
方向を左向きと決定し、線図形79の領域の行方向を水
方向、文字方向を上向きと決定する。そして、イメー
ジ処理装置3は、指定された各領域に対し、それぞれ決
定した認識条件にて文字認識処理を実行する。
In the case of the original 77, the system
The area / condition determination device 2 recognizes the line figures 78 and 79 on the document, determines the range of each circumscribed rectangle as a processing area, and sets the line direction of the line figure 78 to the vertical direction and the character direction to the left. It determines that the row direction in the horizontal direction of the area of the line drawing 79, determines the character direction and upward. Then, the image processing device 3 performs a character recognition process on each of the designated areas under the determined recognition conditions.

【0026】実施例4 本実施例は、光学的文字認識システムにおいて、線図形
として図9に示す図形81,82が用いられる。この線
図形は、行方向に一致する2辺が2本線とされる。シス
テムの領域・条件決定装置2は、線図形の辺の線本数を
文字認識の処理条件決定のための形状特徴として用いる
ことができる。
Embodiment 4 In this embodiment, figures 81 and 82 shown in FIG. 9 are used as line figures in an optical character recognition system. In this line figure, two sides corresponding to the row direction are two lines. The area / condition determination device 2 of the system determines the number of lines on the side of the line figure.
It can be used as a shape feature for determining processing conditions for character recognition .

【0027】例えば図10に示す原稿83の場合、マー
カーで記入された線図形84は図9の図形81の形状特
徴を持ち、線図形85は図9の図形82の形状特徴を持
っている。したがって、システムにおいて、線図形84
の領域に対しては行方向を垂直方向として認識処理し、
線図形85の領域に対しては行方向を水平方向として認
識処理する。
In the case of the document 83 shown in FIG. 10, for example, a line drawing 84 filled with a marker has a shape characteristic of figure 81 in FIG. 9, line drawing 85 has a shape characteristic of figure 82 in FIG. Therefore, in the system, the line figure 84
For the area of, the line direction is recognized as the vertical direction ,
For the region of the line graphic 85, the recognition process is performed with the row direction as the horizontal direction .

【0028】実施例5 本実施例は、光学的文字認識システムにおいて、線図形
として図11に示す図形91,92が用いられる。この
線図形は、行方向に一致する2辺が点線(破線)とされ
る。システムの領域・条件決定装置2は、線図形の辺の
連続性を文字認識の処理条件決定のための形状特徴とし
て用いることができる。
Embodiment 5 In this embodiment, figures 91 and 92 shown in FIG. 11 are used as line figures in an optical character recognition system. In this line figure, two sides coinciding with the row direction are dotted lines (broken lines). The area / condition determination device 2 of the system can use the continuity of the sides of the line graphic as a shape feature for determining the processing conditions for character recognition .

【0029】例えば図12に示す原稿93の場合、マー
カーで記入された線図形94図11の図形91の形状
特徴を持ち、線図形95は図11の図形92の形状特徴
を持っている。したがって、システムにおいて、線図形
94の領域に対しては行方向を垂直方向として認識処理
し、線図形95の領域に対しては行方向を水平方向とし
て認識処理する。
In the case of the document 93 shown in FIG. 12, for example, a line drawing 94 filled with a marker has a shape characteristic of figure 91 in FIG. 11, a line drawing 95 has a shape characteristic of figure 92 in Figure 11. Accordingly, in the system, recognition processing is performed on the area of the line graphic 94 with the row direction as the vertical direction , and on the area of the line graphic 95, the recognition processing is performed with the row direction as the horizontal direction .

【0030】実施例6 本実施例は、光学的文字認識システムにおいて、原稿上
の処理領域を指定するために、図13に示す図形10
1,102の如き線図形を用いる。この線図形は、行方
向と一致しない2辺の長さを半分程度にすることによっ
て、文字認識の処理条件の一つである行方向を指定す
る。システムの領域・条件決定部2においては、原稿上
の線図形の短い辺の位置を文字認識の処理条件決定のた
めの形状特徴として用いることができる。
Embodiment 6 In this embodiment, an optical character recognition system is used to specify a processing area on a manuscript as shown in FIG.
A line figure such as 1,102 is used. This line figure specifies the line direction, which is one of the processing conditions for character recognition, by reducing the length of two sides that do not match the line direction to about half. In the area / condition determining unit 2 of the system, the position of the short side of the line figure on the document can be used as a shape feature for determining the processing conditions for character recognition .

【0031】例えば図14に示す原稿103の場合、マ
ーカーで記入された線図形104は図13の図形101
の形状特徴を持ち、線図形105は図13の図形102
の形状特徴を持っている。したがって、システムにおい
て、線図形104の領域に対しては行方向を垂直方向
して認識処理し、線図形105の領域に対しては行方向
を水平方向として認識処理する。
For example, in the case of the original 103 shown in FIG. 14 , the line figure 104 written with the marker is the figure 101 shown in FIG.
The line figure 105 is the figure 102 in FIG.
It has the shape characteristics. Therefore, in the system, the recognition process is performed on the region of the line graphic 104 with the row direction as the vertical direction, and the recognition process is performed on the region of the line graphic 105 with the row direction as the horizontal direction .

【0032】実施例7 本実施例は、光学的文字認識システムにおいて、原稿上
の処理領域を指定するために、図15に示す図形11
1,112の如き線図形を用いる。この線図形は、辺を
1重線であるか2重線であるかによって、文字認識の処
理条件の一つである文字種(漢字/英字)を指定する。
ただし、ここで「漢字」とは一般的な日本語文であるこ
とを意味し、「英字」とは英文であることを意味してい
る。なお、3種類以上の文字種を指定する場合には、3
重線、4重線といったような多重線を用いた図形も追加
して定義ればよい。システムの領域・条件決定部2にお
いては、原稿上の線図形の各辺を構成する線の本数を
字認識の処理条件決定のための形状特徴として用いるこ
とができる。
Embodiment 7 In this embodiment, in the optical character recognition system , a graphic 11 shown in FIG.
A line figure such as 1,112 is used. This line figure is subjected to character recognition depending on whether the side is a single line or a double line.
Specify the character type (Kanji / English) that is one of the logical conditions .
Here, “kanji” means a general Japanese sentence, and “English character” means an English sentence. When three or more character types are specified, 3
A figure using multiple lines such as a multiple line and a multiple line may be additionally defined. In the region-condition determining unit 2 of the system, sentence number of lines constituting each side of the line figure on a document
It can be used as a shape feature for determining processing conditions for character recognition .

【0033】例えば図16に示す原稿113の場合、マ
ーカーで記入された線図形114は図15の図形111
の形状特徴を持ち、線図形115は図15の図形112
の形状特徴を持っている。したがって、システムにおい
て、線図形114の領域に対しては文字種を英字として
認識処理し、線図形115の領域に対しては文字種を漢
字として認識処理する。
For example, in the case of the original 113 shown in FIG. 16 , the line figure 114 written with the marker is replaced with the figure 111 in FIG.
15 , and the line figure 115 is the figure 112 in FIG.
It has the shape characteristics. Therefore, in the system, the character type is recognized as alphabetic for the region of the line graphic 114, and the character type is recognized as kanji for the region of the line graphic 115.

【0034】本実施例においては指定する処理条件は文
字種であったが、同様の辺の線本数の違いによって、文
字方向または行方向を指定することも可能である。
In this embodiment, the processing condition to be specified is a character type. However, it is also possible to specify a character direction or a line direction depending on the difference in the number of lines on the same side.

【0035】実施例8 本実施例は、光学的文字認識システムにおいて、原稿上
の処理領域を指定する際に用いる線図形として、文字種
が漢字(一般的な日本語文)であるか英字(英文)であ
るかによって、図17に示す図形121のような実線の
矩形または図形122のような点線(破線)の矩形を用
いる。なお、3種類以上の文字種を指定するために、1
点鎖線、2点鎖線といった連続性の違う線種を用いた図
形を定義してもよい。システムの領域・条件決定部2に
おいては、原稿上の線図形の各辺を構成する線の連続性
(線種)の違いを、文字認識の処理条件決定のための形
状特徴として用いることができる。
Embodiment 8 In this embodiment, in the optical character recognition system, the character type is a kanji (a general Japanese sentence) or an English character (an English sentence) as a line figure used for designating a processing area on a document. Is used, a solid rectangle such as the graphic 121 shown in FIG. 17 or a dotted rectangle (the broken line) such as the graphic 122 is used. To specify three or more character types, 1
A figure using a line type having different continuity, such as a chain line or a two-point chain line, may be defined. In the area / condition determination unit 2 of the system, a difference in the continuity (line type) of lines constituting each side of the line figure on the document can be used as a shape feature for determining processing conditions for character recognition. .

【0036】例えば図18に示す原稿123の場合、マ
ーカーで記入された線図形124は図17の図形122
の形状特徴を持ち、線図形125は図17の図形121
の形状特徴を持っている。したがって、システムにおい
て、線図形124の領域に対しては文字種を英字として
認識処理し、線図形125の領域に対しては文字種を漢
字として認識処理する。
For example, in the case of the original 123 shown in FIG. 18 , the line graphic 124 written with the marker is replaced with the graphic 122 shown in FIG.
The line figure 125 is a figure 121 in FIG.
It has the shape characteristics. Accordingly, in the system, the character type is recognized as an alphabet for the area of the line graphic 124, and the character type is recognized as a kanji for the area of the line graphic 125.

【0037】本実施例は処理条件として文字種を指定し
たが、同様の線の連続性によって文字方向や行方向の指
定を行なうことも可能である。
In this embodiment, the character type is specified as the processing condition. However, it is also possible to specify the character direction and the line direction by the similar continuity of the line.

【0038】[0038]

【発明の効果】以上、詳細に説明した如く、発明によれ
ば、処理条件に対応した形状特徴を持つ線図形を原稿に
直接書き込むことによって、原稿画像を読み取って文字
認識処理する文字認識システムに対し、処理領域と処理
条件を一度に指定することができ、指定作業が極めて簡
単になる。特に文字認識システムでは、領域毎に処理条
件を指定するための多くのパラメータの入力が必要とな
ため、指定作業を大幅に簡略化することができ、また
複数の原稿に予め必要な線図形を書き込んでおくだけ
で、複数原稿の連続処理(バッチ処理)が可能となる。
As described in detail above, according to the present invention, a line image having a shape characteristic corresponding to a processing condition is directly written on an original, so that an original image is read and a character is read.
The processing area and processing conditions can be specified at a time for the character recognition system that performs the recognition processing, and the specification work becomes extremely simple . In particular, in a character recognition system, it is necessary to input many parameters for designating processing conditions for each area, so that the designation operation can be greatly simplified, and a line figure required in advance for a plurality of originals can be formed. By simply writing, continuous processing (batch processing) of a plurality of documents becomes possible.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の各実施例に係る文字認識処理システム
の概略構成を示す図である。
FIG. 1 is a diagram showing a schematic configuration of a character recognition processing system according to each embodiment of the present invention.

【図2】領域・条件決定装置の構成例を示すブロック図
である。
FIG. 2 is a block diagram illustrating a configuration example of a region / condition determination device.

【図3】実施例1において用いられる線図形の説明図で
ある。
FIG. 3 is an explanatory diagram of a line figure used in the first embodiment.
is there.

【図4】実施例1における原稿への線図形の記入例を示
す図である。
FIG. 4 shows an example of writing a line figure on an original in the first embodiment .
FIG.

【図5】実施例2において用いられる線図形の説明図で
ある。
FIG. 5 is an explanatory diagram of a line figure used in a second embodiment.
is there.

【図6】実施例2における原稿への線図形の記入例を示
す図である。
FIG. 6 shows an example of writing a line figure on an original in the second embodiment .
FIG.

【図7】実施例3において用いられる線図形の説明図で
ある。
FIG. 7 is an explanatory diagram of a line figure used in a third embodiment.
is there.

【図8】実施例3における原稿への線図形の記入例を示
す図である。
FIG. 8 shows an example of writing a line figure on a document in a third embodiment .
FIG.

【図9】実施例4において用いられる線図形の説明図で
ある。
FIG. 9 is an explanatory diagram of a line figure used in a fourth embodiment.
is there.

【図10】実施例4における原稿への線図形の記入例を
示す図である。
FIG. 10 is a diagram illustrating an example of writing a line figure on a document according to the fourth embodiment .
FIG.

【図11】実施例5において用いられる線図形の説明図
である。
FIG. 11 is an explanatory diagram of a line figure used in a fifth embodiment.
It is.

【図12】実施例5における原稿への線図形の記入例を
示す図である。
FIG. 12 is a diagram illustrating an example of writing a line figure on a document in a fifth embodiment .
FIG.

【図13】実施例6において用いられる線図形の説明図
である。
FIG. 13 is an explanatory diagram of a line figure used in a sixth embodiment.
It is.

【図14】実施例6における原稿への線図形の記入例を
示す図である。
FIG. 14 is a diagram illustrating an example of writing a line figure on a document according to the sixth embodiment .
FIG.

【図15】実施例7において用いられる線図形の説明図
である。
FIG. 15 is an explanatory diagram of a line figure used in a seventh embodiment.
It is.

【図16】実施例7における原稿への線図形の記入例を
示す図である。
FIG. 16 shows an example of writing a line figure on a document in the seventh embodiment .
FIG.

【図17】実施例8において用いられる線図形の説明図
である。
FIG. 17 is an explanatory diagram of a line figure used in the eighth embodiment.
It is.

【図18】実施例8における原稿への線図形の記入例を
示す図である。
FIG. 18 is a diagram illustrating an example of writing a line figure on a document according to the eighth embodiment .
FIG.

【符号の説明】[Explanation of symbols]

1 スキャナ 2 領域・条件決定装置 3 イメージ処理装置 4 出力装置 11 イメージバッファ 12 マーカー線分検出部 13 線図形認識部 14 条件決定部 15 領域決定部 REFERENCE SIGNS LIST 1 scanner 2 region / condition determining device 3 image processing device 4 output device 11 image buffer 12 marker line segment detecting unit 13 line figure recognizing unit 14 condition determining unit 15 region determining unit

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82 H04N 1/387 G06T 11/60 ──────────────────────────────────────────────────続 き Continued on the front page (58) Field surveyed (Int.Cl. 7 , DB name) G06K 9/00-9/82 H04N 1/387 G06T 11/60

Claims (5)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 原稿の画像を読み取り、文字認識処理す
るシステムにおける文字認識の処理領域・処理条件指定
方法であって、原稿上の文字認識処理領域を線図形で囲み、処理条件を
該線図形の辺を構成する線分に矢印をつけて示した 原稿
を読み取り、該原稿に記入された線図形を認識し、該線
図形で囲まれた領域を文字認識処理領域と決定するとと
もに、該線図形の辺を構成する線分の矢印の向きにより
文字認識処理の文字方向あるいは行方向を決定すること
を特徴とする文字認識の処理領域・処理条件指定方法。
1. A method for designating a character recognition processing area and processing condition in a system for reading an image of a document and performing character recognition processing, wherein the character recognition processing area on the document is surrounded by a line figure, and the processing condition is defined.
A document indicated by adding an arrow to a line segment constituting a side of the line figure is read, a line figure written on the document is recognized, and an area surrounded by the line figure is determined as a character recognition processing area. A character recognition processing region / processing condition specification method, wherein the character direction or the line direction of the character recognition processing is determined based on the direction of an arrow of a line segment constituting a side of the line figure .
【請求項2】 原稿の画像を読み取り、文字認識処理す
るシステムにおける文字認識の処理領域・処理条件指定
方法であって、原稿上の文字認識処理領域を線図形で囲み、処理条件を
該線図形の辺を構成する第1の線分に第1の矢印を、第
2の線分に第2の矢印をつけて示した原稿を読み取り、
該原稿に記入された線図形を認識し、該線図形で囲まれ
た領域を文字認識処理領域と決定するとともに、該線図
形の辺を構成する第1の線分の第1の矢印の向きにより
文字認識処理の文字方向を決定し、第2の線分の第2の
矢印の向きにより行方向を決定することを特徴とする文
字認識の処理領域・処理条件指定方法。
2. A method for designating a character recognition processing area and processing condition in a system for reading an image of a document and performing character recognition processing, wherein the character recognition processing area on the document is surrounded by a line figure, and the processing condition is defined.
A first arrow is placed on a first line segment forming a side of the line graphic,
Read the original indicated by adding a second arrow to line 2
Recognize the line figure entered in the manuscript, and
Is determined as a character recognition processing area, and
Depending on the direction of the first arrow of the first line segment forming the side of the shape
The character direction of the character recognition process is determined, and the second
A sentence characterized by determining the line direction according to the direction of the arrow
How to specify the processing area and processing conditions for character recognition.
【請求項3】 原稿の画像を読み取り、文字認識処理す
るシステムにおける文字認識の処理領域・処理条件指定
方法であって、原稿上の文字認識処理領域を線図形で囲み、処理条件を
該線図形の辺を構成する線分の本数の違いで示した原稿
を読み取り、該原稿に記入された線図形を認識し、該線
図形で囲まれた領域を文字認識処理領域と決定するとと
もに、該線図形の特定本数を示す線分の方向により文字
認識処理の文字方向あるいは行方向を決定することを特
徴とする文字認識の処理領域・処理条件指定方法。
3. A method for specifying a character recognition processing area and processing condition in a system for reading an image of a document and performing character recognition processing, wherein the character recognition processing area on the document is surrounded by a line figure, and the processing condition is defined.
Original indicated by the difference in the number of line segments constituting the sides of the line figure
Is read, and the line figure written on the original is recognized.
To determine the area surrounded by the figure as the character recognition processing area
In the first place, the character is determined by the direction of the line segment indicating the specific number of the line figure.
Specially, it determines the character direction or line direction of the recognition process.
How to specify the character recognition processing area and processing conditions.
【請求項4】 原稿の画像を読み取り、文字認識処理す
るシステムにおける文字認識の処理領域・処理条件指定
方法であって、原稿上の文字認識処理領域を線図形で囲み、処理条件を
該線図形の辺を構成する線分の連続性の違いで示した原
稿を読み取り、該原稿に記入された線図形を認識し、該
線図形で囲まれた領域を文字認識処理領域と決定すると
ともに、該線図 形の特定の連続性を示す線分の方向によ
り文字認識処理の文字方向あるいは行方向を決定するこ
とを特徴とする文字認識の処理領域・処理条件指定方
法。
4. A method for specifying a character recognition processing area and processing condition in a system for reading an image of a document and performing character recognition processing, wherein the character recognition processing area on the document is surrounded by a line figure, and the processing condition is defined.
The original represented by the difference in the continuity of the line segments constituting the sides of the line figure
Read the manuscript, recognize the line figure written on the manuscript,
If the area surrounded by the line figure is determined as the character recognition processing area
Both the direction of the line segment indicating a certain continuity of 該線diagram form
Character direction or line direction for character recognition
Character recognition processing area and processing condition specification method
Law.
【請求項5】 原稿の画像を読み取り、文字認識処理す
るシステムにおける文字認識の処理領域・処理条件指定
方法であって、 原稿上の文字認識処理領域を線図形で囲み、処理条件を
該線図形の辺を構成する線分の長さの違いで示した原稿
を読み取り、該原稿に記入された線図形を認識し、該線
図形の特定の長さを示す線分の方向により文字認識処理
の文字方向あるいは行方向を決定することを特徴とする
文字認識の処理領域・処理条件指定方法。
5. An image of a document is read and subjected to character recognition processing.
Of processing area and processing conditions for character recognition in different systems
A method for enclosing a character recognition processing area on a document with a line figure and setting processing conditions
Original indicated by the difference in the length of the line segment constituting the side of the line figure
Is read, and the line figure written on the original is recognized.
Character recognition processing according to the direction of the line segment indicating the specific length of the figure
Character direction or line direction is determined
How to specify the processing area and processing conditions for character recognition.
JP33963291A 1991-11-28 1991-11-28 Character recognition processing area / processing condition specification method Expired - Fee Related JP3171626B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33963291A JP3171626B2 (en) 1991-11-28 1991-11-28 Character recognition processing area / processing condition specification method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33963291A JP3171626B2 (en) 1991-11-28 1991-11-28 Character recognition processing area / processing condition specification method

Publications (2)

Publication Number Publication Date
JPH05151388A JPH05151388A (en) 1993-06-18
JP3171626B2 true JP3171626B2 (en) 2001-05-28

Family

ID=18329337

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33963291A Expired - Fee Related JP3171626B2 (en) 1991-11-28 1991-11-28 Character recognition processing area / processing condition specification method

Country Status (1)

Country Link
JP (1) JP3171626B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10289288A (en) * 1997-04-16 1998-10-27 Canon Inc Method and device for image processing
JP3895892B2 (en) * 1999-09-22 2007-03-22 株式会社東芝 Multimedia information collection management device and storage medium storing program
JP2002288178A (en) * 2001-03-23 2002-10-04 Toshiba Corp Multimedia information collection and management device and program
JP2008192032A (en) 2007-02-07 2008-08-21 Fuji Xerox Co Ltd Document processing device, document processing method, and program
JP6500376B2 (en) * 2014-06-26 2019-04-17 株式会社リコー INFORMATION PROCESSING SYSTEM, INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND PROGRAM

Also Published As

Publication number Publication date
JPH05151388A (en) 1993-06-18

Similar Documents

Publication Publication Date Title
US6640010B2 (en) Word-to-word selection on images
US8520224B2 (en) Method of scanning to a field that covers a delimited area of a document repeatedly
JP2002279433A (en) Method and device for retrieving character in video
US8605297B2 (en) Method of scanning to a field that covers a delimited area of a document repeatedly
JP3171626B2 (en) Character recognition processing area / processing condition specification method
JP2002015280A (en) Device and method for image recognition, and computer- readable recording medium with recorded image recognizing program
Sandnes Lost in OCR-translation: pixel-based text reflow to the rescue: magnification of archival raster image documents in the browser without horizontal scrolling
US5854860A (en) Image filing apparatus having a character recognition function
JP2000322417A (en) Device and method for filing image and storage medium
JP4501731B2 (en) Image processing device
JPH0554072A (en) Digital translation device
JP4548062B2 (en) Image processing device
US20210303790A1 (en) Information processing apparatus
JPH11187231A (en) Image retrieving device and image retrieval method
JPS60153567A (en) Method for extracting area in printed document picture
JP2022019257A (en) Information processing device, information processing method, and program
JPH0895546A (en) Image data display device
JPS6292080A (en) Pattern recognizing device
JPS62293475A (en) Picture processor
JPH08263591A (en) Device and method for character recognition
JPS61249179A (en) Character frame automatic extracting system
JPH05128304A (en) Tablie and graphic discriminating method
JPH02105981A (en) Conversational type character recognition system
JPH11306172A (en) Document data processor and its program recording medium
JPH1011530A (en) Image input and output method and device therefor

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090323

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100323

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees