JP3412999B2 - Image processing apparatus and method - Google Patents

Image processing apparatus and method

Info

Publication number
JP3412999B2
JP3412999B2 JP01004696A JP1004696A JP3412999B2 JP 3412999 B2 JP3412999 B2 JP 3412999B2 JP 01004696 A JP01004696 A JP 01004696A JP 1004696 A JP1004696 A JP 1004696A JP 3412999 B2 JP3412999 B2 JP 3412999B2
Authority
JP
Japan
Prior art keywords
block
type
item
blocks
setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP01004696A
Other languages
Japanese (ja)
Other versions
JPH09204494A (en
Inventor
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP01004696A priority Critical patent/JP3412999B2/en
Priority to US08/786,913 priority patent/US6201894B1/en
Publication of JPH09204494A publication Critical patent/JPH09204494A/en
Application granted granted Critical
Publication of JP3412999B2 publication Critical patent/JP3412999B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、所定のフォーマッ
トを有する原稿画像に含まれる罫線で囲まれた領域に存
在する文字を認識し、入力された原稿画像のフォーマッ
トを認識する画像処理装置及びその方法に関するもので
ある。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image processing apparatus for recognizing a character existing in a region surrounded by ruled lines included in a document image having a predetermined format and recognizing a format of an inputted document image, and its image processing apparatus. It is about the method.

【0002】[0002]

【従来の技術】従来、原稿画像に含まれる罫線で囲まれ
た領域内に存在する文字を認識する文字認識装置は、あ
らかじめ該領域の構成が決まっている特定のフォーマッ
トからなる原稿画像の領域内に存在する文字だけしか認
識できなかった。
2. Description of the Related Art Conventionally, a character recognition device for recognizing a character existing in an area surrounded by a ruled line included in an original image has a structure in which the area of the original image having a predetermined format is predetermined. I could only recognize the characters that exist in.

【0003】[0003]

【発明が解決しようとする課題】そのため、上記従来の
文字認識装置では、複数種類のフォーマットを有する原
稿画像に適用できず、利用性が乏しいという問題点があ
った。そのため、特定のフォーマットに限らず、複数種
類のフォーマットを有する原稿画像に含まれる領域内に
存在する文字を認識するには、原稿画像のフォーマット
を認識できる画像認識装置も必要とされていた。また、
スキャナ等で特定のフォーマットからなる原稿画像に含
まれる罫線で囲まれた領域に含まれる文字を読み取る際
には、その読み取り位置を正確に位置決めしなけらばな
らず、文字認識処理における操作に手間がかかるという
問題点があった。
Therefore, the above-described conventional character recognition device has a problem that it cannot be applied to original images having a plurality of types of formats, and its usability is poor. Therefore, it is not limited to a specific format,
Within the area included in the original image having a similar format
To recognize the existing characters, format the original image
There was also a need for an image recognition device capable of recognizing. Also,
When reading the characters contained in the area surrounded by the ruled lines included in the document image of a specific format with a scanner, etc., the reading position must be accurately positioned, which is troublesome for the operation in the character recognition process. There was a problem that it cost.

【0004】本発明は上記の問題点に鑑みてなされたも
のであり、複数種類のフォーマットを有する原稿画像に
関し、入力された原稿画像のフォーマットを認識でき、
かつ原稿画像に含まれる罫線で囲まれた領域の構成を識
別することで、複数種類のフォーマットを有する原稿画
像に含まれる該領域内に存在する文字を認識することが
できる画像処理装置及びその方法を提供することを目的
としている。また、原稿画像に含まれる罫線で囲まれた
領域内に存在する文字の認識処理における操作の作業効
率を向上する画像処理装置及びその方法を提供すること
を目的としている。
The present invention has been made in view of the above problems, and relates to a document image having a plurality of formats, the format of the inputted document image can be recognized,
An image processing apparatus and method capable of recognizing a character existing in a region included in a document image having a plurality of formats by identifying the configuration of a region surrounded by a ruled line included in the document image Is intended to provide. Another object of the present invention is to provide an image processing apparatus and method for improving the work efficiency of the operation in the recognition processing of the characters existing in the area surrounded by the ruled lines included in the original image.

【0005】[0005]

【課題を解決するための手段】上記の目的を達成するた
めの本発明による画像処理装置は以下の構成を備える。
即ち、入力された原稿画像を複数のブロックに分割する
分割手段と、前記分割手段で分割された複数のブロック
の内、特定位置に存在するブロックに基づいて、前記原
稿画像の第1のタイプを識別するタイプ識別手段と、前
記タイプ識別手段で識別された第1のタイプに対する前
記原稿画像中の項目の識別の鍵となるキーブロックに関
するキーブロック情報に基づいて、前記分割手段で分割
された複数のブロックから前記キーブロックを検出する
キーブロック検出手段と、前記キーブロック検出手段で
検出されたキーブロックに対して所定の位置にあるブロ
ックの形状と数とに基づいて第2のタイプを判定し、当
該判定された第2のタイプに従って、各ブロックに対応
する項目の項目識別子を設定する識別子設定手段とを有
する。
An image processing apparatus according to the present invention for achieving the above object has the following configuration.
That is, the first type of the original image is determined based on the dividing unit that divides the input original image into a plurality of blocks and the block existing at a specific position among the plurality of blocks divided by the dividing unit. A plurality of types divided by the dividing unit based on a type identifying unit for identifying and a key block information about a key block that is a key for identifying an item in the document image for the first type identified by the type identifying unit. Key block detecting means for detecting the key block from the block, and the second type is determined based on the shape and number of blocks at predetermined positions with respect to the key block detected by the key block detecting means. And an identifier setting means for setting an item identifier of an item corresponding to each block according to the determined second type.

【0006】また、好ましくは、更に、前記ブロック内
に存在する文字を認識する文字認識手段を有する。
[0006] Further, preferably, it further comprises a character recognition means for recognizing a character existing in the block.

【0007】また、好ましくは、更に、前記識別子設定
手段で設定された識別子に基づいて、前記文字認識手段
における各ブロックの文字認識処理順序を設定する処理
順序設定手段を有する。
Further, preferably, further, there is provided processing order setting means for setting the character recognition processing order of each block in the character recognition means based on the identifier set by the identifier setting means.

【0008】また、好ましくは、更に、前記識別子設定
手段で設定された識別子に基づいて、各ブロック内に存
在する文字の組み方向を設定する組方向設定手段を有す
る。
Further, preferably, further, there is a set direction setting means for setting a set direction of a character existing in each block based on the identifier set by the identifier setting means.

【0009】また、好ましくは、前記タイプ識別手段
は、前記分割手段で分割された複数のブロックの内、特
定位置に存在するブロックの形状に基づいて、前記原稿
画像の第1のタイプを識別する。
Preferably, the type identifying means identifies the first type of the original image based on the shape of a block existing at a specific position among the plurality of blocks divided by the dividing means. .

【0010】また、好ましくは、前記キーブロック情報
とは、前記キーブロックに含まれるタイトルに関する情
報と該キーブロックの位置情報とを含む。
Further, preferably, the key block information includes information regarding a title included in the key block and position information of the key block.

【0011】上記の目的を達成するための本発明による
画像処理方法は以下の構成を備える。即ち、入力された
原稿画像を複数のブロックに分割する分割工程と、前記
分割工程で分割された複数のブロックの内、特定位置に
存在するブロックに基づいて、前記原稿画像の第1のタ
イプを識別するタイプ識別工程と、前記タイプ識別工程
で識別された第1のタイプに対する前記原稿画像中の項
目の識別の鍵となるキーブロックに関するキーブロック
情報に基づいて、前記分割工程で分割された複数のブロ
ックから前記キーブロックを検出するキーブロック検出
工程と、前記キーブロック検出工程で検出されたキーブ
ロックに対して所定の位置にあるブロックの形状と数と
に基づいて第2のタイプを判定し、当該判定された第2
のタイプに従って、各ブロックに対応する項目の項目識
別子を設定する識別子設定工程とを有する。
An image processing method according to the present invention for achieving the above object has the following configuration. That is, the first type of the original image is determined based on the dividing step of dividing the input original image into a plurality of blocks and the block existing at a specific position among the plurality of blocks divided in the dividing step. A plurality of pieces divided in the dividing step based on a type identifying step and a key block information about a key block that is a key for identifying an item in the document image for the first type identified in the type identifying step. Determining the second type based on the key block detecting step of detecting the key block from the block and the shape and number of blocks at predetermined positions with respect to the key block detected in the key block detecting step. , The determined second
An identifier setting step of setting the item identifiers of the items corresponding to the blocks according to the type.

【0012】[0012]

【0013】[0013]

【0014】[0014]

【発明の実施の形態】以下、図面を参照して本発明の好
適な実施の形態を詳細に説明する。図1は本実施の形態
の画像処理装置の機能構成を示すブロック図である。図
1において、101はスキャナであり、原稿画像に光を
照射し、その反射光を読み取り電気信号に変換する。ま
た、スキャナ101より読み込まれた原稿画像は、イメ
ージデータとしてRAM107のVRAM領域に格納さ
れる。102はスキャナインターフェースであり、スキ
ャナ101で得られた電気信号を2値のデジタル電気信
号に変換し、他の装置構成要素に伝送する。103はポ
インティングデバイスとして機能するマウスであり、マ
ウス103を移動することでディスプレイ108上に表
示されるカーソル100を移動する。また、画面に表示
されるメニューにカーソル100を位置し、そのメニュ
ー上で付帯するボタン(不図示)を用いてドラッグ操
作、クリック操作を行うことで、その内容を実行するこ
とができる。104はマウスインタフェースであり、マ
ウス103からの信号を受け、それを他の装置構成要素
に伝送する。114はKB(キーボード)であり、キー
ボードを介してデータの入力や命令の実行を行う。11
3はKBインターフェースであり、KB114からの信
号を受け、それを他の装置構成要素に伝送する。
BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is a block diagram showing the functional arrangement of the image processing apparatus according to this embodiment. In FIG. 1, 101 is a scanner, which irradiates a document image with light and reads the reflected light to convert it into an electric signal. Further, the original image read by the scanner 101 is stored in the VRAM area of the RAM 107 as image data. A scanner interface 102 converts an electric signal obtained by the scanner 101 into a binary digital electric signal and transmits the binary digital electric signal to other device constituent elements. Reference numeral 103 denotes a mouse that functions as a pointing device. By moving the mouse 103, the cursor 100 displayed on the display 108 is moved. The contents can be executed by positioning the cursor 100 on a menu displayed on the screen and performing a drag operation or a click operation using a button (not shown) attached on the menu. A mouse interface 104 receives a signal from the mouse 103 and transmits it to another device component. Reference numeral 114 denotes a KB (keyboard), which inputs data and executes instructions via the keyboard. 11
Reference numeral 3 is a KB interface, which receives a signal from the KB 114 and transmits it to another device component.

【0015】105はCPUであり、装置全体の制御及
び後述する領域分割等の本発明で説明される処理や認識
処理を実行する。106はROMであり、CPU105
が実行する制御プログラム、各種処理プログラムやフォ
ントデータ等の各種データを格納している。107はR
AMであり、原稿画像の展開や領域分割処理のための作
業領域等として用いる。また、スキャナ101より読み
込まれたイメージデータ(2値画像データ)を格納する
ための所定の記憶領域としてVRAM領域を持つ。10
8はディスプレイであり、RAM107のVRAM領域
に格納されているイメージデータや本実施の形態で実行
される罫線抽出処理結果等を表示する。109はディス
プレイインターフェースである。
Reference numeral 105 denotes a CPU, which executes control of the entire apparatus and processing such as area division described later and the recognition processing described in the present invention. 106 is a ROM, and the CPU 105
It stores various data such as a control program executed by the computer, various processing programs, and font data. 107 is R
AM, which is used as a work area or the like for developing a document image and area division processing. Further, it has a VRAM area as a predetermined storage area for storing image data (binary image data) read by the scanner 101. 10
A display 8 displays the image data stored in the VRAM area of the RAM 107, the ruled line extraction processing result executed in this embodiment, and the like. 109 is a display interface.

【0016】110はFDD(フロッピーディスクドラ
イブ)であり、FDを装着しデータの読み書きが可能で
ある。また、装着されたFD(不図示)に後述する処理
フローのプログラムを書き込み、該プログラムを本装置
のRAM107に読み込むことで処理を実行させること
ができる。111はFDDインターフェースである。そ
して、112は各装置構成要素を接続するバスである。
Reference numeral 110 denotes an FDD (floppy disk drive), which is equipped with the FD and can read and write data. Further, it is possible to execute a process by writing a program of a processing flow described later in the attached FD (not shown) and reading the program into the RAM 107 of the present apparatus. 111 is an FDD interface. Further, 112 is a bus for connecting the respective components of the apparatus.

【0017】次に本実施の形態で実行される処理につい
て、図2のフローチャートを用いて説明する。図2は本
実施の形態で実行される処理の処理フローを示すフロー
チャートである。図2は本実施の形態で実行される処理
フローを示すフローチャートである。
Next, the processing executed in this embodiment will be described with reference to the flowchart of FIG. FIG. 2 is a flowchart showing a processing flow of processing executed in this embodiment. FIG. 2 is a flowchart showing the processing flow executed in this embodiment.

【0018】尚、本実施の形態で実行される処理は、あ
らかじめ原稿画像を構成する罫線で囲まれる領域(以
下、この領域を項目と呼ぶ)が決まっているような、例
えば、図10に示すような戸籍文書等に適用した場合に
ついて説明するが、これに限定されるものではない。例
えば、構成が決まっている原稿画像であるならば、どの
ようなものでも良い。
The processing executed in the present embodiment is shown in, for example, FIG. 10 in which an area surrounded by ruled lines forming an original image (hereinafter, this area is referred to as an item) is determined in advance. The case where the invention is applied to such a family register document will be described, but the invention is not limited to this. For example, any original image may be used as long as it has a predetermined configuration.

【0019】まず、ステップS201で、原稿画像をス
キャナ101で読み込み2値画像データに変換する。ス
テップS202で、得られた2値画像データに対して、
2値画像データに含まれる属性(写真、図形、文字等)
毎に領域を分割する領域分割処理を行う。本実施の形態
では、領域分割処理において、特に、項目を抽出した場
合、その項目の座標データ等の情報をブロックデータと
して図3のように記憶する。
First, in step S201, the original image is read by the scanner 101 and converted into binary image data. In step S202, for the obtained binary image data,
Attributes included in binary image data (photos, figures, characters, etc.)
Region division processing is performed to divide the region for each. In the present embodiment, in the area division processing, particularly when an item is extracted, information such as coordinate data of the item is stored as block data as shown in FIG.

【0020】ここで、図3に示されるブロックデータに
ついて説明する。図3は本実施の形態のブロックデータ
の構成を示す図である。図3は、RAM107に展開さ
れる2値画像データに含まれる項目の位置を示すための
始点座標(X1,Y1)、終点座標(X2,Y2)、有
効フラグ、項目識別ID、認識順序、属性、組方向の情
報を格納する。始点座標は、図10に示されるような各
項目の右上角の位置座標、終点座標は、各項目の左下角
の位置座標を示す。有効フラグは、抽出された項目が有
効であるか否かを示す。項目識別IDは、後述する設定
方法によって各項目の項目識別IDを格納する。認識順
序は、各項目に記入されている文字を認識する場合の認
識順序を格納する。
Now, the block data shown in FIG. 3 will be described. FIG. 3 is a diagram showing the configuration of block data according to the present embodiment. FIG. 3 shows start point coordinates (X1, Y1), end point coordinates (X2, Y2) for indicating the position of an item included in the binary image data expanded in the RAM 107, valid flag, item identification ID, recognition order, and attribute. , Stores information on the set direction. The start point coordinates indicate the position coordinates of the upper right corner of each item as shown in FIG. 10, and the end point coordinates indicate the position coordinates of the lower left corner of each item. The valid flag indicates whether or not the extracted item is valid. The item identification ID stores the item identification ID of each item according to the setting method described later. The recognition order stores the recognition order when recognizing the characters entered in each item.

【0021】属性は、領域分割処理で分割単位である属
性を格納する。本発明の場合、項目(罫線で囲まれた領
域)内にテキストデータが存在する場合は、その旨を示
す属性が格納され、有効フラグに「1」が格納される。
また、項目(罫線で囲まれた領域)内にテキストデータ
が存在しない場合は、その旨を示す属性が格納され、有
効フラグに「0」が格納される。また、組方向は、各項
目に記入されている文字の方向(縦書きあるいは横書
き)を示す情報を格納する。
The attribute stores an attribute which is a division unit in the area division processing. In the case of the present invention, when text data exists in an item (area surrounded by ruled lines), an attribute indicating that fact is stored and “1” is stored in the valid flag.
If the text data does not exist in the item (area surrounded by ruled lines), an attribute indicating that fact is stored and “0” is stored in the valid flag. The set direction stores information indicating the direction (vertical writing or horizontal writing) of the characters written in each item.

【0022】次に、ステップS203で、原稿画像の項
目の構成を示すフォーマット情報からその原稿画像の項
目の構成を分類し、その原稿画像を構成する項目を識別
する項目識別処理を行う。尚、原稿画像の項目の構成を
識別する場合、その原稿画像を領域分割して得られるブ
ロックの位置、形状、面積、数等によって、その原稿画
像の項目の構成の種類を分類し、各項目を識別する。ま
た、フォーマット情報はあらかじめROM106に記憶
されているものとする。
Next, in step S203, the item configuration of the document image is classified from the format information indicating the configuration of the item of the document image, and the item identification process for identifying the item configuring the document image is performed. When identifying the configuration of the item of the document image, the type of configuration of the item of the document image is classified according to the position, shape, area, number, etc. of blocks obtained by dividing the document image into regions, and each item is classified. Identify. Further, it is assumed that the format information is stored in the ROM 106 in advance.

【0023】また、本実施の形態の原稿画像として用い
る戸籍文書の項目を分類し識別するために、各項目を分
類し識別するためのID(項目識別ID)を図4の
(a)〜(c)のように定義する。そして、各項目のI
Dを組み合わせることによって戸籍文書の項目を分類し
識別する。ここで、図4の(a)〜(c)に示されるI
D(項目識別ID)について説明する。
Further, in order to classify and identify the items of the family register document used as the manuscript image of the present embodiment, IDs (item identification IDs) for classifying and identifying the respective items are shown in FIGS. Define as in c). And I of each item
The items of the family register document are classified and identified by combining D. Here, I shown in (a) to (c) of FIG.
The D (item identification ID) will be described.

【0024】図4の(a)は、戸籍文書の項目の構成
(以下、ページタイプと呼ぶ)の種別を定義するIDで
あり、戸籍文書の最上右にある罫線に囲まれたブロック
領域(図10参照)に書かれている、「筆頭者」あるい
は「非筆頭者」を種別として定義している。図4の
(b)は、戸籍文書のページの記載者の種別を定義する
IDであり、図4の(b)に示されるような種別のID
が定義されている。図4の(c)は、戸籍文書を構成す
る項目の項目名を定義するIDであり、図4の(c)に
示されるような種別のIDが定義されている。
FIG. 4A shows an ID that defines the type of the composition (hereinafter referred to as page type) of the items of the family register document, and is the block area surrounded by the ruled line at the top right of the family register document (see FIG. 10)), "leader" or "non-leader" is defined as the type. 4B is an ID that defines the type of the person who wrote the page of the family register document, and the ID of the type as shown in FIG. 4B.
Is defined. 4C is an ID that defines the item names of the items that make up the family register document, and the IDs of the types shown in FIG. 4C are defined.

【0025】次に、ステップS203で実行される項目
識別処理の詳細を、図6を用いて説明する。図6は本実
施の形態の項目識別処理の詳細な処理フローを示すフロ
ーチャートである。まず、ステップS601で、戸籍文
書のページタイプの種別を分類し識別する。この識別の
方法としては、戸籍文書の最右上にあるブロック(項
目)の形状によって、その戸籍文書のページタイプを識
別する。
Details of the item identification processing executed in step S203 will be described below with reference to FIG. FIG. 6 is a flowchart showing a detailed processing flow of the item identification processing of this embodiment. First, in step S601, the page type types of the family register document are classified and identified. As a method of this identification, the page type of the family register document is identified by the shape of the block (item) at the upper right of the family register document.

【0026】尚、戸籍文書のページタイプ、筆頭者が記
載されているページタイプ(以下、「筆頭者タイプ」と
呼ぶ)と、筆頭者が記載されていないページタイプ(以
下、「非筆頭者タイプ」と呼ぶ)の2種類がある。ま
た、識別の方法としては、例えば、戸籍文書の最右上の
ブロックの幅がその高さよりも長い場合は「筆頭者タイ
プ」として識別し、それ以外は「非筆頭者タイプ」とし
て識別することでページタイプを識別する。あるいは、
最右上のブロックの幅が、そのブロックのY1座標と同
じY1座標を持つブロックの幅よりも大きい場合は「筆
頭者タイプ」として識別し、一方、最右上のブロックの
幅が、そのブロックのY1座標と同じY1座標を持つブ
ロックの幅が同じである場合は「非筆頭者タイプ」とし
て識別することもできる。
The page type of the family register document, the page type in which the first person is described (hereinafter referred to as "first person type"), and the page type in which the first person is not described (hereinafter, "non-first person type") There are two types). As an identification method, for example, if the width of the upper right block of the family register document is longer than its height, it is identified as the "first person type", and the others are identified as the "non-first person type". Identify the page type. Alternatively,
If the width of the upper right block is larger than the width of the block having the same Y1 coordinate as the Y1 coordinate of the block, it is identified as the "leader type", while the width of the upper right block is the Y1 coordinate of the block. When the width of the block having the same Y1 coordinate as the coordinate is the same, it can be identified as the "non-first person type".

【0027】再び、フローチャートの説明に戻る。ステ
ップS601において、戸籍文書の最右上のブロックの
幅がその高さよりも長い場合は「筆頭者タイプ」として
識別し、ステップS604に進む。一方、戸籍文書の最
右上のブロックの幅がその高さよりも短い場合は「非筆
頭者タイプ」として識別し、ステップS602に進む。
Returning to the description of the flow chart again. In step S601, if the width of the upper right block of the family register document is longer than its height, the block is identified as "first person type", and the process proceeds to step S604. On the other hand, if the width of the upper right block of the family register document is shorter than its height, the block is identified as "non-leader type" and the process proceeds to step S602.

【0028】戸籍文書のページタイプが識別されたなら
ば、次に、更に詳細な戸籍文書の識別と項目の識別の鍵
となるブロック(以下、KEYブロックと呼ぶ)を、戸
籍文書に構成される各項目の相対的な位置関係に検出す
る。まず、ページタイプが「筆頭者タイプ」の場合、ス
テップS604で、「本籍」というタイトルがついてい
るブロックと、編製された年月日が記載されている欄の
最初の行のブロックと、入籍データ等が記載されている
欄の最初の行のブロックと、「父」というタイトルがつ
いているブロックをそれぞれKEY0〜3ブロックとし
て検出し、各ブロックデータのアドレスを図5に示すよ
うなKEYブロックデータ構造体に記憶する。
Once the page type of the family register document has been identified, a block (hereinafter referred to as a KEY block) that is a key for further detailed family register document identification and item identification is configured in the family register document. The relative position of each item is detected. First, in the case where the page type is the "first-person type", in step S604, the block titled "Main registry", the block in the first row of the column in which the edited date is described, and the registration data The block in the first row of the column in which "etc." and the block with the title "Father" are detected as KEY0 to 3 blocks, and the address of each block data is as shown in FIG. Remember in the body.

【0029】ここで図5に示すKEYブロックデータ構
造体について説明する。図5は本実施の形態のKEYブ
ロックデータ構造体の構成を示す図である。図5におい
て、KEYブロック構造体は、戸籍文書を構成する項目
の識別の鍵となる項目の情報を記憶するものであり、図
に示すような6つのKEY0〜5ブロックが存在する。
そして、ページタイプの種別に応じて検出すべきKEY
ブロックが検出され、その検出されたKEYブロックの
ブロックデータを記憶する。
Now, the KEY block data structure shown in FIG. 5 will be described. FIG. 5 is a diagram showing the configuration of the KEY block data structure of the present embodiment. In FIG. 5, the KEY block structure stores the information of the items that are the key for identifying the items constituting the family register document, and there are six KEY0 to 5 blocks as shown in the figure.
Then, the KEY to be detected according to the type of page type
A block is detected and the block data of the detected KEY block is stored.

【0030】次に、ステップS605で、検出したKE
Y0〜3ブロックを用いて、各KEY0〜3ブロックと
共通する情報を持つ項目毎に、更に詳細に項目を抽出
し、抽出した項目に対し、項目識別IDを設定する。こ
の設定の詳細については、図7のフローチャートを用い
て後述する。一方、ページタイプが「非筆頭者タイプ」
の場合、ステップS602で、1人目の入籍データが記
載されている欄の最初の行のブロックと、1人目の
「父」というタイトルがついているブロックと、2人目
の入籍データ等が記載されている欄の最初の行のブロッ
クと、2人目の「父」というタイトルがついているブロ
ックをそれぞれKEY2〜5ブロックとして検出し、そ
の検出されたKEY2〜5ブロックのブロックデータを
KEYブロック構造体に記憶する。
Next, in step S605, the detected KE
Using the Y0 to 3 blocks, the items are extracted in more detail for each item having information common to each of the KEY0 to 3 blocks, and the item identification ID is set for the extracted items. Details of this setting will be described later with reference to the flowchart of FIG. 7. On the other hand, the page type is "non-leader type"
In this case, in step S602, the block in the first row of the column in which the registration data of the first person is described, the block titled “Father” of the first person, the registration data of the second person, etc. are described. The block in the first row of the column where the column is present and the block with the title "Father" of the second person are respectively detected as KEY2 to 5 blocks, and the block data of the detected KEY2 to 5 blocks are stored in the KEY block structure. To do.

【0031】次に、ステップS603で、検出したKE
Y2〜5ブロックを用いて、各KEY2〜5ブロックと
共通する情報を持つ項目毎に、更に詳細に項目を抽出
し、抽出した項目に対し、項目識別IDを設定する。こ
の設定の詳細については、図8のフローチャートを用い
て後述する。まず、ページタイプが「筆頭者タイプ」の
場合の項目識別IDを設定する処理について、図7のフ
ローチャートを用いて説明する。
Next, in step S603, the detected KE
Using the Y2 to 5 blocks, the items are extracted in more detail for each item having information common to each of the KEY2 to 5 blocks, and the item identification ID is set for the extracted items. Details of this setting will be described later with reference to the flowchart of FIG. First, the process of setting the item identification ID when the page type is the “first person type” will be described with reference to the flowchart of FIG. 7.

【0032】図7は本実施の形態のページタイプが「筆
頭者タイプ」の場合の項目識別IDを設定する処理の処
理フローを示すフローチャートである。まず、ステップ
S701で、KEY0ブロック(図10の「本籍」とい
うタイトルがついているブロック)の下にある3つの同
じ幅を持つブロックに対して、それぞれ項目識別IDを
設定する。ステップS702で、KEY1ブロック(図
10の編製事項が記載されている欄の最初の行のブロッ
ク)からKEY1ブロックを含めて左に4個のブロック
およびその下にあるブロックは、同じ項目群(編製事項
の欄)とみなせるブロックであるので、これらのブロッ
クに項目識別IDを設定する。
FIG. 7 is a flow chart showing the processing flow of the processing for setting the item identification ID when the page type of this embodiment is the "first person type". First, in step S701, an item identification ID is set for each of the three blocks having the same width below the KEY0 block (the block with the title “main registry” in FIG. 10). In step S702, the four blocks to the left including the KEY1 block from the KEY1 block (the block in the first row of the column in which the editing items are described in FIG. 10) and the blocks below the same block have the same item group (editing). Since the blocks can be regarded as items), item identification IDs are set in these blocks.

【0033】ステップS703で、KEY2ブロック
(図10の入籍データ等が記載されている欄の最初の行
のブロック)からKEY2ブロックを含めて左に10個
のブロックは、同じ項目群(入籍データ等の欄)とみな
せるブロックであるので、これらのブロックに項目識別
IDを設定する。ステップS704で、KEY2ブロッ
クを含む項目群の下にあるブロックは、KEY3ブロッ
ク(図10の「父」というタイトルがついているブロッ
ク)からKEY3ブロックを含めて左にあるKEY3ブ
ロックと同じY1座標を持つブロックが存在し、そのブ
ロック数を計数する。そして、ステップS705で、計
数されたブロック数に基づいて、KEY2ブロックを含
む項目群の下にあるブロックの項目識別IDを設定す
る。この設定の詳細については、図9のフローチャート
を用いて後述する。
In step S703, 10 blocks including the KEY2 block from the KEY2 block (the block in the first row in the column where the registration data etc. are described in FIG. 10) have the same item group (enrollment data etc.). Column), item identification IDs are set in these blocks. In step S704, the block below the item group including the KEY2 block has the same Y1 coordinate as the KEY3 block on the left including the KEY3 block from the KEY3 block (the block titled “father” in FIG. 10). There are blocks, and the number of blocks is counted. Then, in step S705, the item identification IDs of the blocks below the item group including the KEY2 block are set based on the counted number of blocks. Details of this setting will be described later with reference to the flowchart of FIG.

【0034】次に、ページタイプが「非筆頭者タイプ」
の場合の項目識別IDを設定する処理について、図8の
フローチャートを用いて説明する。図8は本実施の形態
のページタイプが「非筆頭者タイプ」の場合の項目識別
IDを設定する処理の処理フローを示すフローチャート
である。まず、ステップS801で、KEY2ブロック
(入籍データ等が記載されている欄の最初の行のブロッ
ク)からKEY2ブロックを含めて左に9個のブロック
は、同じ項目群(入籍データ等の欄)とみなせるブロッ
クであるので、これらのブロックに項目識別IDを設定
する。
Next, the page type is "non-first person type".
In the case of, the process of setting the item identification ID will be described with reference to the flowchart of FIG. FIG. 8 is a flowchart showing a processing flow of processing for setting an item identification ID when the page type of the present embodiment is “non-first person type”. First, in step S801, nine blocks to the left including the KEY2 block from the KEY2 block (the block in the first row of the column in which the enrollment data etc. are written) have the same item group (enrollment data etc. column). Since these blocks can be regarded, item identification IDs are set in these blocks.

【0035】ステップS802で、KEY4ブロック
(2人目の入籍データ等が記載されている欄の最初の行
のブロック)からKEY4ブロックを含めて左に9個の
ブロックは、同じ項目群(2人目の入籍データ等の欄)
とみなせるブロックであるので、これらのブロックに項
目識別IDを設定する。ステップS803で、KEY2
ブロックを含む項目群の下にあるブロックは、KEY3
ブロック(「父」というタイトルがついているブロッ
ク)からKEY3ブロックを含めて左にあるKEY3ブ
ロックと同じY1座標を持つブロックが存在し、そのブ
ロック数を計数する。そして、ステップS804で、計
数されたブロック数に基づいて、KEY2ブロックを含
む項目群の下にあるブロックの項目識別IDを設定す
る。
In step S802, nine blocks to the left of the KEY4 block (the block in the first row of the column in which the second person's enrollment data etc. are written) including the KEY4 block have the same item group (the second one). (Registration data column)
Since these blocks can be regarded as, the item identification IDs are set in these blocks. In step S803, KEY2
The block below the item group including the block is KEY3.
There is a block having the same Y1 coordinate as the KEY3 block on the left, including the KEY3 block from the block (the block having the title "Father"), and the number of blocks is counted. Then, in step S804, the item identification ID of a block below the item group including the KEY2 block is set based on the counted number of blocks.

【0036】ステップS805で、KEY4ブロックを
含む項目群の下にあるブロックは、KEY5ブロック
(2人目の「父」というタイトルがついているブロッ
ク)からKEY5ブロックを含めて左にあるKEY5ブ
ロックと同じY1座標を持つブロックが存在し、そのブ
ロック数を計数する。そして、ステップS806で、計
数されたブロック数に基づいて、KEY4ブロックを含
む項目群の下にあるブロックの項目識別IDを設定す
る。
In step S805, the block below the item group including the KEY4 block is the same as the KEY5 block on the left including the KEY5 block from the KEY5 block (the block having the title "father" of the second person) Y1. There is a block with coordinates, and the number of blocks is counted. Then, in step S806, the item identification ID of a block below the item group including the KEY4 block is set based on the counted number of blocks.

【0037】次に、入籍データ等の欄の下にあるブロッ
クの項目識別IDを設定する処理の詳細について、図9
のフローチャートを用いて説明する。図9は本実施の形
態の入籍データ等の欄の下にあるブロックの項目識別I
Dを設定する処理の処理フローを示すフローチャートで
ある。尚、図9のフローチャートは、図7のフローチャ
ートのステップS704、図8のフローチャートのステ
ップS804、ステップS805で実行される処理であ
るが、ここでは図7のフローチャートのステップS70
4、つまり、ページタイプが「筆頭者タイプ」の戸籍文
書である場合を、例に挙げて説明する。また、図8のフ
ローチャートのステップS804、ステップS805、
つまり、ページタイプが「非筆頭者タイプ」の戸籍文書
である場合については、同様の処理で実現されるので、
ここでは省略する。
Next, the details of the process of setting the item identification ID of the block below the entry data field will be described with reference to FIG.
This will be described with reference to the flowchart of. FIG. 9 shows an item identification I of a block below the entry data column in this embodiment.
7 is a flowchart showing a processing flow of processing for setting D. The flowchart of FIG. 9 is the processing executed in step S704 of the flowchart of FIG. 7, step S804 and step S805 of the flowchart of FIG. 8, but here, step S70 of the flowchart of FIG.
4, that is, a case where the page type is a family register document of “first person type” will be described as an example. In addition, steps S804 and S805 of the flowchart of FIG.
In other words, if the page type is a family register document of "non-first person type", it is realized by the same process.
It is omitted here.

【0038】まず、ステップS901で、計数されたブ
ロック数を判定し、ブロック数が4の場合は、実父母の
みが記載されているタイプ(以下、「実子タイプ」と呼
ぶ)と判定して、ステップS902に進む。また、ブロ
ック数が5の場合は、養父あるいは養母のどちらか一方
のみが記載されているタイプ(以下、「養子タイプA」
と呼ぶ)と判定して、ステップS905に進む。更に、
ブロック数が6の場合は、養父および養母の両方が記載
されているタイプ(以下、「養子タイプB」と呼ぶ)と
判定して、ステップS909に進む。
First, in step S901, the counted number of blocks is determined. If the number of blocks is 4, it is determined that the type is the type in which only the actual parents are described (hereinafter referred to as "real child type"). It proceeds to step S902. If the number of blocks is 5, only one of the adopted father or adopted mother is listed (hereinafter, "adopted type A").
Is called) and the process proceeds to step S905. Furthermore,
If the number of blocks is 6, it is determined that both the adopted father and adopted mother are described (hereinafter referred to as “adopted type B”), and the process proceeds to step S909.

【0039】計数されたブロック数が4の場合、つま
り、「実子タイプ」である場合、ステップS902で、
KEY3ブロックから左に2番目のブロックの形状が横
長であるか否かを判定する。横長である場合(ステップ
S902でYES)、「既婚(夫か妻)タイプ」と判定
して、ステップS903に進む。一方、横長でない場合
(ステップS902でNO)、「未婚タイプ」と判定し
て、ステップS904に進む。
If the counted number of blocks is 4, that is, if it is the "real child type", then in step S902,
It is determined whether or not the shape of the second block to the left of the KEY3 block is horizontally long. If it is horizontally long (YES in step S902), it is determined to be “married (husband or wife) type” and the process proceeds to step S903. On the other hand, if it is not horizontally long (NO in step S902), it is determined as “unmarried type” and the process proceeds to step S904.

【0040】ステップS903では、「実子タイプ」及
び「既婚(夫か妻)タイプ」として、KEY3ブロック
との相対位置関係から項目識別IDを設定する。また、
ステップS904では、「実子タイプ」及び「未婚タイ
プ」として、KEY3ブロックとの相対位置関係から項
目識別IDを設定する。計数されたブロック数が5の場
合、つまり、「養子タイプA」である場合、ステップS
905で、KEY3ブロックから左に3番目のブロック
の形状が横長であるか否かを判定する。横長である場合
(ステップS905でYES)、「既婚(夫か妻)タイ
プ」と判定して、ステップS906に進む。一方、横長
でない場合(ステップS905でNO)、「未婚タイ
プ」と判定して、ステップS907に進む。
In step S903, the item identification ID is set as the "real child type" and the "married (husband or wife) type" from the relative positional relationship with the KEY3 block. Also,
In step S904, the item identification IDs are set as the “real child type” and the “unmarried type” based on the relative positional relationship with the KEY3 block. If the number of counted blocks is 5, that is, if the "adopted type A" is selected, step S
At 905, it is determined whether the shape of the third block to the left of the KEY3 block is horizontally long. If it is horizontally long (YES in step S905), it is determined to be “married (husband or wife) type” and the process proceeds to step S906. On the other hand, if it is not horizontally long (NO in step S905), it is determined to be “unmarried type” and the process proceeds to step S907.

【0041】ステップS906では、「実子タイプ」及
び「既婚(夫か妻)タイプ」として、KEY3ブロック
との相対位置関係から項目識別IDを設定する。また、
ステップS907では、「実子タイプ」及び「未婚タイ
プ」として、KEY3ブロックとの相対位置関係から項
目識別IDを設定する。計数されたブロック数が6の場
合、つまり、「養子タイプB」である場合、ステップS
909で、KEY3ブロックから左に4番目のブロック
の形状が横長であるか否かを判定する。横長である場合
(ステップS909でYES)、「既婚(夫か妻)タイ
プ」と判定して、ステップS910に進む。一方、横長
でない場合(ステップS909でNO)、「未婚タイ
プ」と判定して、ステップS911に進む。
In step S906, the item identification ID is set as the "real child type" and the "married (husband or wife) type" from the relative positional relationship with the KEY3 block. Also,
In step S907, the item identification IDs are set as the “real child type” and the “unmarried type” from the relative positional relationship with the KEY3 block. If the number of counted blocks is 6, that is, if the “adopted type B” is selected, step S
At 909, it is determined whether the shape of the fourth block to the left of the KEY3 block is horizontally long. If it is horizontally long (YES in step S909), it is determined to be “married (husband or wife) type” and the process proceeds to step S910. On the other hand, if it is not horizontally long (NO in step S909), it is determined as “unmarried type” and the process proceeds to step S911.

【0042】ステップS910では、「実子タイプ」及
び「既婚(夫か妻)タイプ」として、KEY3ブロック
との相対位置関係から項目識別IDを設定する。また、
ステップS911では、「実子タイプ」及び「未婚タイ
プ」として、KEY3ブロックとの相対位置関係から項
目識別IDを設定する。次に、上述の図2のフローチャ
ートのステップS203において実行される具体的な処
理の過程を、図10〜図12を用いて説明する。
In step S910, the item identification ID is set as the "real child type" and the "married (husband or wife) type" from the relative positional relationship with the KEY3 block. Also,
In step S911, the item identification IDs are set as the “real child type” and the “unmarried type” from the relative positional relationship with the KEY3 block. Next, a specific process of the process executed in step S203 of the flowchart of FIG. 2 will be described with reference to FIGS.

【0043】例えば、図10のような戸籍文書の原稿画
像に対して、図2のステップS202で説明される領域
分割処理を施した結果として、図11に示すような複数
の項目のブロックB1101〜B1136が得られたと
する。そして、図11の領域分割結果に対し、図2のス
テップS203で説明される項目識別処理を行うと、こ
の場合、最右上のブロックB1101の幅が高さより長
く、かつ他の同じY1座標を持つブロックの幅とは異な
るので「筆頭者タイプ」と判定される。
For example, as a result of performing the area division processing described in step S202 of FIG. 2 on the original image of the family register document as shown in FIG. 10, a plurality of item blocks B1101 as shown in FIG. It is assumed that B1136 is obtained. Then, when the item identification processing described in step S203 of FIG. 2 is performed on the area division result of FIG. 11, in this case, the width of the upper right block B1101 is longer than the height and has the same other Y1 coordinates. Since it is different from the block width, it is determined to be the "leader type".

【0044】そして、ページタイプが「筆頭者タイプ」
と判定されたので、最右上のブロックB1101を
『「本籍」というタイトルがついているブロック(KE
Y0)』とみなし、KEYブロックデータとしてそのア
ドレスを記録する。次に、KEY0ブロックの左に隣接
し、KEY0ブロックのY1座標が同じブロックB11
05を『編製事項が記載されている欄の最初の行のブロ
ック(KEY1)』とみなし、KEYブロックデータと
してそのアドレスを記憶する。
Then, the page type is “first person type”
Since it was determined that the block B1101 in the upper right corner is the block with the title “Main registry” (KE
Y0) ”and record the address as KEY block data. Next, a block B11 adjacent to the left of the KEY0 block and having the same Y1 coordinate of the KEY0 block
05 is regarded as "a block (KEY1) in the first row of the column in which the editing items are described", and its address is stored as KEY block data.

【0045】次に、KEY0ブロックのY1座標と同じ
Y1座標を持ち、KEY1ブロックよりも高さが大き
く、そのX2座標が最も右にあるブロックB1109を
『入籍データ等が記載されている欄の最初の行のブロッ
ク(KEY2)』とみなし、KEYブロックデータとし
てそのアドレスを記録する。さらにそのブロックB11
09の下に隣接するブロックB1123を『「父」とい
うタイトルがついているブロック(KEY3)』とみな
して、KEYブロックデータとしてそのアドレスを記憶
する。
Next, the block B1109 having the same Y1 coordinate as the Y1 coordinate of the KEY0 block, having a height higher than that of the KEY1 block, and having its X2 coordinate on the far right is "first in the column where the enrollment data etc. is described." Row block (KEY2) ”and its address is recorded as KEY block data. Furthermore, the block B11
The block B1123 adjacent under 09 is regarded as a "block (KEY3) titled" Father "", and its address is stored as KEY block data.

【0046】次に、上述のように検出した各KEYブロ
ックと共通する情報を持つ項目毎に、更に詳細にブロッ
クを抽出する。そして、抽出した各ブロックに項目識別
IDを設定する。まず、ページタイプが「筆頭者タイ
プ」であるので、KEY0ブロックの下には3つの同じ
幅を持ったブロックB1102〜B1104が存在す
る。そのため、KEY0ブロックも含めてそれぞれのブ
ロックに項目識別IDを設定する。例えば、ブロックB
1101の項目識別IDは図4の(a)〜(c)を用い
ると、 1000(ページタイプが筆頭者)+000(筆頭者の
ページの記載者)+10(本籍というタイトル)=10
10 が項目識別IDとして設定される。同様にして、他のブ
ロックB1102〜B1104の項目識別IDはそれぞ
れ1011〜1013が設定される。
Next, blocks are extracted in more detail for each item having information common to each of the KEY blocks detected as described above. Then, the item identification ID is set in each of the extracted blocks. First, since the page type is the “leader type”, there are three blocks B1102 to B1104 having the same width under the KEY0 block. Therefore, the item identification ID is set in each block including the KEY0 block. For example, block B
4A to 4C are used for the item identification ID 1101, 1000 (page type is the first person) +000 (the person who describes the page of the first person) +10 (the title of the main domicile) = 10
10 is set as the item identification ID. Similarly, the item identification IDs of the other blocks B1102 to B1104 are set to 1011 to 1013, respectively.

【0047】次に、KEY1ブロックからKEY1ブロ
ックを含めて左に4個のブロックB1105〜B110
8及びその下にあるブロックB1119〜B1122は
KEY1ブロックと共通する情報を持つブロックである
ので、それぞれのブロックに対応する項目識別IDを設
定する。この場合、それぞれの項目識別IDは1020
〜1027が設定される。
Next, from the KEY1 block to the left including the KEY1 block, four blocks B1105 to B110 are provided.
8 and the blocks B1119 to B1122 below it are blocks having information in common with the KEY1 block, and therefore item identification IDs corresponding to the respective blocks are set. In this case, each item identification ID is 1020
-1027 is set.

【0048】次に、KEY2ブロックからKEY2ブロ
ックを含めて左に10個のブロックB1109〜B11
18はKEY2ブロックと共通する情報を持つブロック
であるので、それぞれのブロックに対応する項目識別I
Dを設定する。この場合、それぞれの項目識別IDは1
109〜1118が設定される。次に、KEY2ブロッ
クの下にあるブロックはKEY3ブロックからKEY2
ブロックを含めて左にある個数によって、更に項目識別
IDを設定する。
Next, from the KEY2 block to the KEY2 block, the ten blocks B1109 to B11 on the left side are included.
Since 18 is a block having information common to the KEY2 block, the item identification I corresponding to each block
Set D. In this case, each item identification ID is 1
109 to 1118 are set. Next, the blocks under the KEY2 block are the KEY3 block to the KEY2 block.
Item identification IDs are further set according to the number on the left including blocks.

【0049】図10に示される戸籍文書の場合は、その
個数が6個であるので、養父および養母の両方が記載さ
れているタイプ(「養父タイプB」)であると判定され
る。また、更にKEY3ブロックから左に4番目のブロ
ックB1133の形状が横長であるので、「既婚(夫か
妻)タイプ」であると判定される。その結果、KEY3
ブロックのY1座標と同じY1座標をもつブロックに対
して右から、ブロックB1123はKEY3ブロックそ
のものであり『「父」とタイトルがついているブロッ
ク』と判定され、項目識別IDは1030が設定され
る。
In the case of the family register document shown in FIG. 10, since the number is 6, it is determined that both the adoptive father and the adoptive mother are the described type (“adoptive father type B”). Further, since the shape of the fourth block B1133 to the left of the KEY3 block is horizontally long, it is determined to be a "married (husband or wife) type". As a result, KEY3
From the right with respect to the block having the same Y1 coordinate as the block Y1 coordinate, the block B1123 is determined to be the KEY3 block itself, which is a “block titled“ father ””, and the item identification ID is set to 1030.

【0050】また、ブロックB1126は『「母」とタ
イトルがついているブロック』と判定され、項目識別I
Dは1032が設定される。ブロックB1129は
『「養父」とタイトルがついているブロック』と判定さ
れ、項目識別IDは1040が設定される。ブロックB
1132は『「養母」とタイトルがついているブロッ
ク』と判定され、項目識別IDは1042が設定され
る。ブロックB1133は『「夫」または「妻」と記載
されるブロック』と判定され、項目識別IDは1050
が設定される。ブロックB1135は『「出生」とタイ
トルがついているブロック』と判定され、項目識別ID
は1070が設定される。
Further, the block B1126 is judged as "a block having a title of" mother "", and the item identification I
As for D, 1032 is set. The block B1129 is determined to be a “block titled“ Adoptive Father ””, and the item identification ID is set to 1040. Block B
1132 is determined to be "a block having a title of" foster mother "", and item identification ID 1042 is set. The block B1133 is determined to be a “block described as“ husband ”or“ wife ””, and the item identification ID is 1050.
Is set. The block B1135 is determined to be “a block with the title“ Birth ””, and the item identification ID
Is set to 1070.

【0051】次に、「父」、「母」、「養父」、「養
母」、「夫」または「妻」、「出生」の各ブロックの直
下のブロックは、各々の「名前」または「出生年月日」
が記載されているブロックと判定され、ブロックB11
24には、項目識別IDとして1031が設定される。
ブロックB1127には、項目識別IDとして1033
が設定される。ブロックB1128には、項目識別ID
として1041が設定される。ブロックB1131に
は、項目識別IDとして1043が設定される。ブロッ
クB1134には、項目識別IDとして1051が設定
される。ブロックB1136には、項目識別IDとして
1071が設定される。
Next, the blocks immediately below the "father", "mother", "foster father", "foster mother", "husband" or "wife" and "birth" blocks are their "name" or "birth" respectively. date"
Is determined to be the block in which B11
In item 24, 1031 is set as the item identification ID.
The block B1127 contains 1033 as the item identification ID.
Is set. The block B1128 has an item identification ID.
Is set as 1041. In the block B1131, 1043 is set as the item identification ID. In the block B1134, 1051 is set as the item identification ID. In the block B1136, 1071 is set as the item identification ID.

【0052】次に、ブロックB1124とB1127の
直下のブロックB1125は「続柄」が記載されている
ブロックと判定され、ブロックB1125には、項目識
別IDとして1034が設定される。また、ブロックB
1128とB1131の直下のブロックB1130は
「続柄」が記載されているブロックと判定され、ブロッ
クB1130には、項目識別IDとして1034が設定
される。
Next, the block B1125 immediately below the blocks B1124 and B1127 is determined to be a block in which "relationship" is described, and 1034 is set in the block B1125 as an item identification ID. Also, block B
A block B1130 immediately below 1128 and B1131 is determined to be a block in which “relationship” is described, and 1034 is set as an item identification ID in the block B1130.

【0053】このようにして、各項目は図12に示すよ
うな項目識別IDが設定されることになる。以上説明し
たように、ステップS201〜ステップS203で実行
される処理によって、特定のフォーマットを持つ戸籍文
書に限らず、複数種類のフォーマットを有する戸籍文書
(原稿画像)を認識することができる。次に、ステップ
S204で、ステップS203で各項目に設定された項
目識別IDの小さい方から順に、テキストデータが存在
する項目に対してのみ行う文字認識処理の処理順序を設
定する処理順序設定処理を行う。また、各項目に設定さ
れた処理順序は、対応するブロックデータの認識順序に
格納される。一方、テキストデータが存在しない項目に
対応するブロックデータには、「−1」を格納し文字認
識処理を行わないことを示すフラグとする。例えば、図
12に示されるような項目識別IDの値が設定された各
項目に対して、処理順序設定処理を行うと、図13に示
されるようなテキストデータが存在する項目に、処理順
序1〜19が設定される。
In this way, the item identification ID as shown in FIG. 12 is set for each item. Explained above
As described in step S201 to step S203
Depending on the processing performed, family register statements with a specific format
Not only a book, but a family register document with multiple formats
(Original image) can be recognized. Next, in step S204, a processing order setting process for setting the processing order of the character recognition processing performed only for the items in which the text data exists, in order from the smallest item identification ID set in each item in step S203. To do. The processing order set for each item is stored in the recognition order of the corresponding block data. On the other hand, "-1" is stored in the block data corresponding to the item where the text data does not exist, and a flag indicating that the character recognition processing is not performed is set. For example, when the processing order setting process is performed on each item for which the value of the item identification ID is set as shown in FIG. 12, the processing order 1 is set for the item in which the text data as shown in FIG. 13 exists. -19 are set.

【0054】ステップS205で、ステップS204で
処理順序が設定された項目に存在するテキストデータの
組方向を設定する組方向設定処理を行う。尚、組方向の
設定方法は、例えば、図14に示されるような項目識別
IDの値と対応した組方向のデータベースをあらかじめ
ROM106に記憶しておき、この記憶されたデータベ
ースと、処理対象の項目に項目識別IDを比較すること
で、各項目に存在するテキストデータの組方向を設定す
る。
In step S205, a set direction setting process for setting the set direction of the text data existing in the item for which the processing order has been set in step S204 is performed. Note that, for the method of setting the set direction, for example, a database of the set direction corresponding to the value of the item identification ID as shown in FIG. 14 is stored in the ROM 106 in advance, and the stored database and the item to be processed are set. By comparing the item identification IDs with, the set direction of the text data existing in each item is set.

【0055】ステップS206で、ステップS204で
設定された処理順序に従って、各項目に存在するテキス
トデータに対応する文字を認識する文字認識処理を行
う。尚、文字認識処理は、既知の文字認識方法を用いて
行うものとし、文字を認識できる方法ならば、どのよう
なものでも良い。以上説明したように、本発明によれ
ば、戸籍文書に含まれる項目の構成を識別することで、
各項目に存在する文字を認識することができる。
In step S206, character recognition processing for recognizing the character corresponding to the text data existing in each item is performed according to the processing order set in step S204. The character recognition process is performed using a known character recognition method, and any method that can recognize the character may be used. As described above, according to the present invention, by identifying the configuration of items included in a family register document,
Characters that exist in each item can be recognized.

【0056】また、上述の領域分割処理と、項目識別処
理と、処理順序設定処理と、組方向設定処理と、文字認
識処理を設けて各項目に設定された処理順序で、各項目
に存在するテキストデータに対応する文字の認識を行う
ことをできるようにすることにより、複数種類のフォー
マットの文字認識処理順序が正確になり、スキャナ等で
イメージを読み取る際の項目のずれに対処でき、操作性
を向上させ、処理全体の時間の短縮を図ることができ
る。
The above-described area division processing, item identification processing, processing order setting processing, set direction setting processing, and character recognition processing are provided for each item in the processing order set for each item. By making it possible to recognize the characters corresponding to the text data, the character recognition processing order of multiple types of formats becomes accurate, and it is possible to deal with the deviation of items when reading an image with a scanner etc. Can be improved and the time required for the entire process can be shortened.

【0057】尚、上述のステップS202の領域分割処
理を行う前に、原稿画像に含まれる罫線を抽出する罫線
抽出処理を更に追加した構成にすることも可能である。
このような罫線抽出処理を行う構成にすることで、領域
分割処理を行う前に原稿画像の種類を識別することがで
きる。例えば、図2のフローチャートのステップS20
2の領域分割処理前に、上述の構成を付加した図15に
示されるようなフローチャートによって、容易に実現さ
れる。
It is also possible to add a ruled line extracting process for extracting a ruled line included in the original image before performing the area dividing process in step S202.
With such a configuration for performing ruled line extraction processing, it is possible to identify the type of document image before performing the area division processing. For example, step S20 of the flowchart of FIG.
It is easily realized by the flowchart as shown in FIG.

【0058】図15は本実施の形態の他の構成によって
実行される処理の処理フローを示すフローチャートであ
る。まず、ステップS1501で、原稿画像をスキャナ
101で読み込み2値画像データに変換する。ステップ
S1502で、得られた2値画像データに対して、2値
画像データに含まれる罫線を抽出する罫線抽出処理を行
う。そして、抽出した罫線の座標データ等の情報をブロ
ックデータとして図3のように記憶する。
FIG. 15 is a flow chart showing a processing flow of processing executed by another configuration of the present embodiment. First, in step S1501, the original image is read by the scanner 101 and converted into binary image data. In step S1502, the obtained binary image data is subjected to ruled line extraction processing for extracting the ruled lines included in the binary image data. Then, information such as the coordinate data of the extracted ruled lines is stored as block data as shown in FIG.

【0059】ステップS1503で、得られた2値画像
データに対して、2値画像データに含まれる属性(写
真、図形、文字等)毎に領域を分割する領域分割処理を
行う。本実施の形態では、領域分割処理において、特
に、項目を抽出した場合、その項目の座標データ等の情
報をブロックデータとして図3のように記憶する。そし
て、分割した項目の座標データ等の情報をブロックデー
タとして図3のように記憶する。次に、ステップS15
04で、原稿画像の項目の構成を示すフォーマット情報
からその原稿画像の項目の構成を分類し、その原稿画像
を構成する項目を識別する項目識別処理を行う。尚、項
目識別処理は、図2のステップS203と同様なので、
その詳細は省略する。
In step S1503, the obtained binary image data is subjected to area division processing for dividing an area for each attribute (photograph, figure, character, etc.) included in the binary image data. In the present embodiment, in the area division processing, particularly when an item is extracted, information such as coordinate data of the item is stored as block data as shown in FIG. Then, information such as coordinate data of the divided items is stored as block data as shown in FIG. Next, step S15
In 04, the item configuration of the document image is classified based on the format information indicating the configuration of the item of the document image, and the item identification process for identifying the item configuring the document image is performed. The item identification process is the same as step S203 in FIG.
The details are omitted.

【0060】ステップS1505で、ステップS150
4で各項目に設定された項目識別IDの小さい方から順
に、テキストデータが存在する項目に対してのみ行う文
字認識処理の処理順序を設定する処理順序設定処理を行
う。ステップS1506で、ステップS1505で処理
順序が設定された項目に存在するテキストデータの組方
向を設定する組方向設定処理を行う。ステップS150
7で、ステップS1505で設定された処理順序に従っ
て、各項目に存在するテキストデータに対応する文字を
認識する文字認識処理を行う。
In step S1505, step S150
In step 4, in order from the smallest item identification ID set for each item, a processing order setting process for setting the processing order of the character recognition process to be performed only on the item having the text data is performed. In step S1506, a grouping direction setting process for setting the grouping direction of the text data existing in the item for which the processing order has been set in step S1505 is performed. Step S150
In step S7, a character recognition process for recognizing the character corresponding to the text data existing in each item is performed according to the processing order set in step S1505.

【0061】例えば、罫線抽出処理を図10の戸籍文書
に対して実行した場合に、図16に示されるような処理
結果が得られたとする。この場合、罫線1601や罫線
1602や罫線1603が存在すれば、ページタイプが
「筆頭者タイプ」の戸籍文書であると識別される。一
方、罫線1601や罫線1602が無く、罫線1603
のX1座標が上端の罫線1604または下端の罫線16
05と同じであれば、ページタイプが「非筆頭者タイ
プ」の戸籍文書であると識別される。
For example, it is assumed that when the ruled line extraction processing is executed on the family register document of FIG. 10, a processing result as shown in FIG. 16 is obtained. In this case, if the ruled line 1601, the ruled line 1602, or the ruled line 1603 exists, the page type is identified as a family register document of “first person type”. On the other hand, there is no ruled line 1601 or ruled line 1602, but ruled line 1603
X1 coordinate of the top ruled line 1604 or the bottom ruled line 16
If the same as 05, the page type is identified as a family register document of “non-first person type”.

【0062】また、組方向設定処理において、組方向の
設定を各テキストデータが含まれる項目の幅、高さの長
短によって判別することも可能である。この場合、各テ
キストデータが含まれる項目の項目識別IDに対応する
組方向のデータベースを用意する必要がなくなり、RO
M106等の記憶媒体の記憶容量を節約することが可能
となる。
In the set direction setting process, it is also possible to determine the set direction based on the width and height of the item containing each text data. In this case, it is not necessary to prepare a database in the set direction corresponding to the item identification ID of the item including each text data, and RO
It is possible to save the storage capacity of the storage medium such as M106.

【0063】尚、本発明は、複数の機器(例えばホスト
コンピュータ、インタフェース機器、リーダ、プリンタ
等)から構成されるシステムに適用しても、一つの機器
からなる装置(例えば、複写機、ファクシミリ装置等)
に適用してもよい。また、本発明の目的は、前述した実
施形態の機能を実現するソフトウェアのプログラムコー
ドを記録した記憶媒体を、システムあるいは装置に供給
し、そのシステムあるいは装置のコンピュータ(または
CPUやMPU)が記憶媒体に格納されたプログラムコ
ードを読出し実行することによっても、達成されること
は言うまでもない。
Even when the present invention is applied to a system composed of a plurality of devices (eg, host computer, interface device, reader, printer, etc.), a device composed of one device (eg, copying machine, facsimile device) etc)
May be applied to. Further, an object of the present invention is to supply a storage medium recording a program code of software that realizes the functions of the above-described embodiments to a system or apparatus, and the computer (or CPU or MPU) of the system or apparatus stores the storage medium. It is needless to say that it is achieved by reading and executing the program code stored in.

【0064】この場合、記憶媒体から読出されたプログ
ラムコード自体が上述した実施の形態の機能を実現する
ことになり、そのプログラムコードを記憶した記憶媒体
は本発明を構成することになる。プログラムコードを供
給するための記憶媒体としては、例えば、フロッピディ
スク、ハードディスク、光ディスク、光磁気ディスク、
CD−ROM、CD−R、磁気テープ、不揮発性のメモ
リカード、ROMなどを用いることができる。
In this case, the program code itself read from the storage medium realizes the function of the above-described embodiment, and the storage medium storing the program code constitutes the present invention. As a storage medium for supplying the program code, for example, a floppy disk, a hard disk, an optical disk, a magneto-optical disk,
A CD-ROM, a CD-R, a magnetic tape, a non-volatile memory card, a ROM or the like can be used.

【0065】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施の形態の機能
が実現される場合も含まれることは言うまでもない。
Further, not only the functions of the above-described embodiment are realized by executing the program code read by the computer, but also the OS (operating system) running on the computer based on the instructions of the program code. It is needless to say that this also includes the case where the above) performs a part or all of the actual processing and the processing realizes the functions of the above-described embodiments.

【0066】更に、記憶媒体から読出されたプログラム
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPUなどが実際の処理の一部または全部を行い、その
処理によって前述した実施形態の機能が実現される場合
も含まれることは言うまでもない。
Further, after the program code read from the storage medium is written in the memory provided in the function expansion board inserted in the computer or the function expansion unit connected to the computer, based on the instruction of the program code, It goes without saying that a case where the CPU or the like included in the function expansion board or the function expansion unit performs some or all of the actual processing and the processing realizes the functions of the above-described embodiments is also included.

【0067】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードを格納することになるが、簡単に説
明すると、図17のメモリマップ例に示す各モジュール
を記憶媒体に格納することになる。すなわち、図17で
は、少なくとも「記憶モジュール」、「分割モジュー
ル」、「識別モジュール」、「割当モジュール」および
「認識モジュール」の各モジュールのプログラムコード
を記憶媒体に格納すればよい。
When the present invention is applied to the above-mentioned storage medium, the storage medium stores the program code corresponding to the above-mentioned flow chart. Briefly, in the memory map example of FIG. Each module shown will be stored in the storage medium. That is, in FIG. 17, at least the program code of each of the “storage module”, the “division module”, the “identification module”, the “assignment module”, and the “recognition module” may be stored in the storage medium.

【0068】尚、「記憶モジュール」は、複数種類の所
定のフォーマットを有する原稿画像に関するフォーマッ
ト情報を記憶媒体に記憶する。「分割モジュール」は、
所定のフォーマットを有する原稿画像を複数の領域に分
割する。「識別モジュール」は、分割される領域の特徴
に基づいて、前記所定のフォーマットを有する原稿画像
の種類を識別する。「割当モジュール」は、識別された
種類に対応する所定のフォーマットを有する原稿画像の
フォーマット情報を、該原稿画像の分割される領域に割
り当てる。「認識モジュール」は、フォーマット情報を
割り当てられた領域に存在する文字を認識する。
The "storage module" stores format information relating to document images having a plurality of predetermined formats in a storage medium. "Split module" is
A document image having a predetermined format is divided into a plurality of areas. The "identification module" identifies the type of document image having the predetermined format based on the characteristics of the divided areas. The "assignment module" assigns the format information of the document image having a predetermined format corresponding to the identified type to the divided areas of the document image. The "recognition module" recognizes the character existing in the area to which the format information is assigned.

【0069】[0069]

【発明の効果】以上の説明からも明らかなように、複数
種類のフォーマットを有する原稿画像に関し、入力され
た原稿画像のフォーマットを認識でき、かつ原稿画像に
含まれる罫線で囲まれた領域の構成を識別することで、
複数種類のフォーマットを有する原稿画像に含まれる該
領域内に存在する文字を認識することができる画像処理
装置及びその方法を提供できる。また、原稿画像に含ま
れる罫線で囲まれた領域内に存在する文字の認識処理に
おける操作の作業効率を向上する画像処理装置及びその
方法を提供できる。
As is apparent from the above description, regarding an original image having a plurality of types of formats, the format of the input original image can be recognized, and the area surrounded by the ruled lines included in the original image is configured. By identifying
It is possible to provide an image processing apparatus and method capable of recognizing characters existing in the area included in a document image having a plurality of formats. Further, it is possible to provide an image processing apparatus and its method that improve the work efficiency of the operation in the recognition processing of the characters existing in the area surrounded by the ruled lines included in the document image.

【0070】[0070]

【図面の簡単な説明】[Brief description of drawings]

【図1】本実施の形態の文字認識装置の機能構成を示す
ブロック図である。
FIG. 1 is a block diagram showing a functional configuration of a character recognition device of the present embodiment.

【図2】本実施の形態で実行される処理の処理フローを
示すフローチャートである。
FIG. 2 is a flowchart showing a processing flow of processing executed in this embodiment.

【図3】本実施の形態のブロックデータの構成を示す図
である。
FIG. 3 is a diagram showing a configuration of block data according to the present embodiment.

【図4】本実施の形態の項目識別IDの構成を示すであ
る。
FIG. 4 shows a structure of an item identification ID according to the present embodiment.

【図5】本実施の形態のKEYブロックデータ構造体の
構成を示す図である。
FIG. 5 is a diagram showing a configuration of a KEY block data structure according to the present embodiment.

【図6】本実施の形態の項目識別処理の詳細な処理フロ
ーを示すフローチャートである。
FIG. 6 is a flowchart showing a detailed processing flow of item identification processing according to the present embodiment.

【図7】本実施の形態のページタイプが「筆頭者タイ
プ」の場合の項目識別IDを設定する処理の処理フロー
を示すフローチャートである。
FIG. 7 is a flowchart showing a processing flow of processing for setting an item identification ID when the page type of the present embodiment is “first person type”.

【図8】本実施の形態のページタイプが「非筆頭者タイ
プ」の場合の項目識別IDを設定する処理の処理フロー
を示すフローチャートである。
FIG. 8 is a flowchart showing a processing flow of processing for setting an item identification ID when the page type of the present embodiment is “non-first person type”.

【図9】本実施の形態の入籍データ等の欄の下にあるブ
ロックに項目識別IDを設定する処理の処理フローを示
すフローチャートである。
FIG. 9 is a flowchart showing a processing flow of processing for setting an item identification ID in a block below a field of enrollment data etc. according to the present embodiment.

【図10】本実施の形態の原稿画像の例を示す図であ
る。
FIG. 10 is a diagram showing an example of a document image according to the present embodiment.

【図11】本実施の形態の原稿画像に対して実行した領
域分割処理の処理結果を示す図である。
FIG. 11 is a diagram showing a processing result of area division processing executed on a document image according to the present embodiment.

【図12】本実施の形態の原稿画像に対して設定した項
目識別IDの設定結果を示す図である。
FIG. 12 is a diagram showing a setting result of an item identification ID set for a document image according to the present embodiment.

【図13】本実施の形態の原稿画像に対して設定した処
理順序の設定結果を示す図である。
FIG. 13 is a diagram showing a setting result of a processing order set for a document image according to the present embodiment.

【図14】本実施の形態の項目識別IDと組方向の関係
を示す図である。
FIG. 14 is a diagram showing a relationship between an item identification ID and a set direction according to the present embodiment.

【図15】本実施の形態の他の構成によって実行される
処理の処理フローを示すフローチャートである。
FIG. 15 is a flowchart showing a processing flow of processing executed by another configuration of the present embodiment.

【図16】本実施の形態の原稿画像に対して実行した罫
線抽出処理の処理結果を示す図である。
FIG. 16 is a diagram showing a processing result of ruled line extraction processing executed on a document image according to the present embodiment.

【図17】本発明で実行される処理フローのプログラム
を記憶させたFDのメモリマップの構造を示す図であ
る。
FIG. 17 is a diagram showing a structure of a memory map of an FD in which a program of a processing flow executed in the present invention is stored.

【符号の説明】[Explanation of symbols]

101 スキャナ 102 スキャナインタフェース 103 マウス 104 マウスインタフェース 105 CPU 106 ROM 107 RAM 108 ディスプレイ 109 ディスプレイインタフェース 110 FDD 111 FDDインタフェース 112 バス 113 KBインタフェース 114 KB 101 scanner 102 Scanner interface 103 mouse 104 mouse interface 105 CPU 106 ROM 107 RAM 108 display 109 display interface 110 FDD 111 FDD interface 112 bus 113 KB interface 114 KB

フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/00- 9/76 G06T 11/60 Front page continued (58) Fields surveyed (Int.Cl. 7 , DB name) G06K 9 / 00- 9/76 G06T 11/60

Claims (12)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 入力された原稿画像を複数のブロックに
分割する分割手段と、 前記分割手段で分割された複数のブロックの内、特定位
置に存在するブロックに基づいて、前記原稿画像の第1
のタイプを識別するタイプ識別手段と、 前記タイプ識別手段で識別された第1のタイプに対する
前記原稿画像中の項目の識別の鍵となるキーブロックに
関するキーブロック情報に基づいて、前記分割手段で分
割された複数のブロックから前記キーブロックを検出す
るキーブロック検出手段と、 前記キーブロック検出手段で検出されたキーブロックに
対して所定の位置にあるブロックの形状と数とに基づい
て第2のタイプを判定し、当該判定された第2のタイプ
に従って、各ブロックに対応する項目の項目識別子を設
定する識別子設定手段とを有することを特徴とする画像
処理装置。
1. A first division of the original image based on a division unit that divides the input original image into a plurality of blocks, and a block existing at a specific position among the plurality of blocks divided by the division unit.
The type discriminating means for discriminating the type, and the dividing means for dividing based on the key block information about the key block which is the key for identifying the item in the original image with respect to the first type identified by the type identifying means. A second type based on a key block detecting means for detecting the key block from a plurality of generated blocks, and the shape and number of blocks at predetermined positions with respect to the key block detected by the key block detecting means. And an identifier setting means for setting an item identifier of an item corresponding to each block according to the determined second type.
【請求項2】 更に、前記ブロック内に存在する文字を
認識する文字認識手段を有することを特徴とする請求項
1に記載の画像処理装置。
2. The image processing apparatus according to claim 1, further comprising character recognition means for recognizing a character existing in the block.
【請求項3】 更に、前記識別子設定手段で設定された
識別子に基づいて、前記文字認識手段における各ブロッ
クの文字認識処理順序を設定する処理順序設定手段を有
することを特徴とする請求項2に記載の画像処理装置。
3. The method according to claim 2, further comprising processing order setting means for setting a character recognition processing order of each block in the character recognition means based on the identifier set by the identifier setting means. The image processing device described.
【請求項4】 更に、前記識別子設定手段で設定された
識別子に基づいて、各ブロック内に存在する文字の組み
方向を設定する組方向設定手段を有することを特徴とす
る請求項1乃至3のいずれか1項に記載の画像処理装
置。
4. The method according to claim 1, further comprising set direction setting means for setting a set direction of a character existing in each block based on the identifier set by the identifier setting means. The image processing apparatus according to any one of items.
【請求項5】 前記タイプ識別手段は、前記分割手段で
分割された複数のブロックの内、特定位置に存在するブ
ロックの形状に基づいて、前記原稿画像の第1のタイプ
を識別することを特徴とする請求項1に記載の画像処理
装置。
5. The type identifying means identifies the first type of the original image based on the shape of a block existing at a specific position among a plurality of blocks divided by the dividing means. The image processing apparatus according to claim 1.
【請求項6】 前記キーブロック情報とは、前記キーブ
ロックに含まれるタイトルに関する情報と該キーブロッ
クの位置情報とを含むことを特徴とする請求項1に記載
の画像処理装置。
6. The image processing apparatus according to claim 1, wherein the key block information includes information regarding a title included in the key block and position information of the key block.
【請求項7】 入力された原稿画像を複数のブロックに
分割する分割工程と、 前記分割工程で分割された複数のブロックの内、特定位
置に存在するブロックに基づいて、前記原稿画像の第1
のタイプを識別するタイプ識別工程と、 前記タイプ識別工程で識別された第1のタイプに対する
前記原稿画像中の項目の識別の鍵となるキーブロックに
関するキーブロック情報に基づいて、前記分割工程で分
割された複数のブロックから前記キーブロックを検出す
るキーブロック検出工程と、 前記キーブロック検出工程で検出されたキーブロックに
対して所定の位置にあるブロックの形状と数とに基づい
て第2のタイプを判定し、当該判定された第2のタイプ
に従って、各ブロックに対応する項目の項目識別子を設
定する識別子設定工程とを有することを特徴とする画像
処理方法。
7. A first division of the original image based on a division step of dividing the input original image into a plurality of blocks, and a block existing at a specific position among the plurality of blocks divided in the division step.
A type identification step for identifying the type of the document, and a division in the division step based on key block information regarding a key block that is a key for identifying an item in the original image with respect to the first type identified in the type identification step. A second type based on a key block detecting step of detecting the key block from a plurality of generated blocks, and a shape and number of blocks at predetermined positions with respect to the key block detected in the key block detecting step. And an identifier setting step of setting an item identifier of an item corresponding to each block according to the determined second type.
【請求項8】 更に、前記ブロック内に存在する文字を
認識する文字認識工程を有することを特徴とする請求項
7に記載の画像処理方法。
8. The image processing method according to claim 7, further comprising a character recognition step of recognizing a character existing in the block.
【請求項9】 更に、前記識別子設定工程で設定された
識別子に基づいて、前記文字認識工程における各ブロッ
クの文字認識処理順序を設定する処理順序設定工程を有
することを特徴とする請求項8に記載の画像処理方法。
9. The method according to claim 8, further comprising a processing order setting step of setting a character recognition processing order of each block in the character recognition step based on the identifier set in the identifier setting step. The described image processing method.
【請求項10】 更に、前記識別子設定工程で設定され
た識別子に基づいて、各ブロック内に存在する文字の組
み方向を設定する組方向設定工程を有することを特徴と
する請求項7乃至9のいずれか1項に記載の画像処理方
法。
10. The method according to claim 7, further comprising a set direction setting step for setting a set direction of a character existing in each block based on the identifier set in the identifier setting step. The image processing method according to any one of items.
【請求項11】 前記タイプ識別工程は、前記分割工程
で分割された複数のブロックの内、特定位置に存在する
ブロックの形状に基づいて、前記原稿画像の第1のタイ
プを識別することを特徴とする請求項7に記載の画像処
理方法。
11. The type identifying step identifies a first type of the original image based on a shape of a block existing at a specific position among a plurality of blocks divided in the dividing step. The image processing method according to claim 7.
【請求項12】 前記キーブロック情報とは、前記キー
ブロックに含まれるタイトルに関する情報と該キーブロ
ックの位置情報とを含むことを特徴とする請求項7に記
載の画像処理方法。
12. The image processing method according to claim 7, wherein the key block information includes information regarding a title included in the key block and position information of the key block.
JP01004696A 1996-01-23 1996-01-24 Image processing apparatus and method Expired - Fee Related JP3412999B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP01004696A JP3412999B2 (en) 1996-01-24 1996-01-24 Image processing apparatus and method
US08/786,913 US6201894B1 (en) 1996-01-23 1997-01-22 Method and apparatus for extracting ruled lines or region surrounding ruled lines

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01004696A JP3412999B2 (en) 1996-01-24 1996-01-24 Image processing apparatus and method

Publications (2)

Publication Number Publication Date
JPH09204494A JPH09204494A (en) 1997-08-05
JP3412999B2 true JP3412999B2 (en) 2003-06-03

Family

ID=11739465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01004696A Expired - Fee Related JP3412999B2 (en) 1996-01-23 1996-01-24 Image processing apparatus and method

Country Status (1)

Country Link
JP (1) JP3412999B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3637771B2 (en) * 1997-11-25 2005-04-13 三菱電機株式会社 Document editing output device
JP4510535B2 (en) * 2004-06-24 2010-07-28 キヤノン株式会社 Image processing apparatus, control method therefor, and program
JP2021047693A (en) * 2019-09-19 2021-03-25 富士ゼロックス株式会社 Information processing apparatus and program

Also Published As

Publication number Publication date
JPH09204494A (en) 1997-08-05

Similar Documents

Publication Publication Date Title
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
JP3694149B2 (en) Image search apparatus, image search key text generation method, program for causing a computer to function as the apparatus, and computer-readable recording medium on which a program for causing the computer to execute the method is recorded
JP5663866B2 (en) Information processing apparatus and information processing program
US6201894B1 (en) Method and apparatus for extracting ruled lines or region surrounding ruled lines
JP4785655B2 (en) Document processing apparatus and document processing method
JPH11184894A (en) Method for extracting logical element and record medium
JP5446877B2 (en) Structure identification device
JP2006221569A (en) Document processing system, document processing method, program, and storage medium
JP5786630B2 (en) Information processing apparatus and information processing program
JP3412999B2 (en) Image processing apparatus and method
EP1202213B1 (en) Document format identification apparatus and method
JP2015005100A (en) Information processor, template generation method, and program
JP2008108114A (en) Document processor and document processing method
JP2018055256A (en) Information processing apparatus, information processing method, and program
JP5910222B2 (en) Information processing apparatus and information processing program
JP3814334B2 (en) Image processing apparatus and method
JP3554097B2 (en) Image processing apparatus and method
JP5476884B2 (en) Image processing apparatus and image processing program
US8059138B2 (en) Image processing and arranging system, image processing and arranging method, and computer readable medium for image processing and arranging
JP3412998B2 (en) Image processing apparatus and method
JPH10207981A (en) Document recognition method
JP6682827B2 (en) Information processing apparatus and information processing program
JP7404943B2 (en) Information processing device and information processing program
JP3581471B2 (en) Image processing apparatus and method
JP2001028032A (en) Image information processor and mark sheet

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030307

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080328

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090328

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100328

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100328

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120328

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees