JP2003030584A - Document recognizing device, region identifying method for document image, and program and recording medium therefor - Google Patents

Document recognizing device, region identifying method for document image, and program and recording medium therefor

Info

Publication number
JP2003030584A
JP2003030584A JP2001211476A JP2001211476A JP2003030584A JP 2003030584 A JP2003030584 A JP 2003030584A JP 2001211476 A JP2001211476 A JP 2001211476A JP 2001211476 A JP2001211476 A JP 2001211476A JP 2003030584 A JP2003030584 A JP 2003030584A
Authority
JP
Japan
Prior art keywords
character
area
rectangle
region
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001211476A
Other languages
Japanese (ja)
Other versions
JP4616522B2 (en
Inventor
Toshio Miyazawa
利夫 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001211476A priority Critical patent/JP4616522B2/en
Publication of JP2003030584A publication Critical patent/JP2003030584A/en
Application granted granted Critical
Publication of JP4616522B2 publication Critical patent/JP4616522B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve the character extracting precision. SOLUTION: Whether or not a region other than characters is present in a region identified as a character region attribute is judged, and when it is judged that any region other than characters is present in the region identified as the character region attribute, the region identified as the character region attribute is re-divided. Thus, even when any region other than characters such as seal impressions or graphics enters the region judged as characters as the result of the area division, the region identified as the character region attribute is re-divided so that the region other than characters can be eliminated. Thus, the character extracting precision can be improved.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、文書画像データ中
に混在する文字領域と文字以外の領域とを識別分類する
文書認識装置、文書画像の領域識別方法、プログラム及
び記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document recognition apparatus, a document image area identification method, a program and a storage medium for identifying and classifying mixed character areas and areas other than characters in document image data.

【0002】[0002]

【従来の技術】従来、文書画像中の文字列や文字領域
(コラム)の識別方法としては、各種の方式が知られて
いる。
2. Description of the Related Art Conventionally, various methods are known as a method of identifying a character string or a character area (column) in a document image.

【0003】例えば、特開平06-020092号公報には、文
書画像中から空白部を抽出し、この空白部の繋がりから
なる空白セパレータを領域分割線として扱って領域を分
割することにより、文書画像中の文字列や文字領域(コ
ラム)を抽出する方法が提案されている。
For example, in Japanese Patent Laid-Open No. 06-020092, a blank image is extracted from a document image, and a blank separator formed by the connection of the blank regions is treated as a region dividing line to divide the document image. A method of extracting a character string or a character area (column) inside has been proposed.

【0004】また、黒画素の射影ヒストグラムを利用
し、黒画素の分布の高い部分を文字列の範囲とする方法
も知られている(秋山、増田「周辺分布、線密度、外接
矩形特徴を併用した文書画像の領域識別」電子通信学会
論文誌 86/8 Vol J69−D))。
There is also known a method of using a projection histogram of black pixels to set a portion having a high black pixel distribution as a range of a character string (Akiyama, Masuda "peripheral distribution, linear density, circumscribed rectangle feature are used together. Area Identification of Document Image ", IEICE Transactions 86/8 Vol J69-D)).

【0005】[0005]

【発明が解決しようとする課題】ところで、従来の文書
画像中の文字列や文字領域(コラム)を抽出する方法に
よれば、領域識別処理の後に行われる文字認識のための
行切り出し処理において、文字領域には印鑑や図領域な
どは混在していないものとして処理を行っている。
By the way, according to the conventional method for extracting a character string or a character area (column) in a document image, in the line cutting processing for character recognition performed after the area identification processing, The processing is performed assuming that the stamp area and the drawing area are not mixed in the character area.

【0006】しかしながら、現実には、印鑑や図など文
字以外の領域が、領域分割の結果として文字と判定され
た領域に入り込むことがある。このような場合には、従
来の方法では、文書画像中の文字列や文字領域(コラ
ム)から文字行を切り出す行切りだし処理を行うことが
できず、文字抽出精度が低下するという問題があった。
However, in reality, an area other than a character such as a seal stamp or a drawing may enter an area determined to be a character as a result of area division. In such a case, the conventional method cannot perform a line cutting process that cuts out a character line from a character string or a character area (column) in a document image, resulting in a problem that the character extraction accuracy is reduced. It was

【0007】本発明の目的は、文字抽出精度を向上させ
ることである。
An object of the present invention is to improve the accuracy of character extraction.

【0008】[0008]

【課題を解決するための手段】請求項1記載の発明の文
書認識装置は、文書画像データ中に混在する文字領域と
文字以外の領域とを識別分類する文書認識装置におい
て、文字領域属性と識別された領域内に含まれる黒画素
の連結成分に外接する矩形を前記文書画像データより抽
出する外接矩形抽出手段と、文字領域属性と識別された
領域内に文字以外の領域が存在するか否かを前記外接矩
形抽出手段により抽出された前記矩形に係る情報に基づ
き判定する非文字領域判定手段と、この非文字領域判定
手段により文字領域属性と識別された領域内に文字以外
の領域が存在すると判定された場合、当該文字領域属性
と識別された領域を再分割する再分割手段と、を備え
る。
According to another aspect of the present invention, there is provided a document recognition device for identifying and classifying a character area and a non-character area mixed in document image data. Circumscribing rectangle extraction means for extracting a rectangle circumscribing the connected component of black pixels contained in the specified region from the document image data, and whether or not a region other than the character exists in the region identified as the character region attribute. And a non-character area determining means for determining based on the information related to the rectangle extracted by the circumscribing rectangle extracting means, and if there is an area other than a character in the area identified as the character area attribute by the non-character area determining means. If it is determined, the subdivision means for subdividing the area identified as the character area attribute is provided.

【0009】したがって、文字領域属性と識別された領
域内に文字以外の領域が存在するか否かが判定され、文
字領域属性と識別された領域内に文字以外の領域が存在
すると判定された場合、当該文字領域属性と識別された
領域が再分割される。これにより、印鑑や図など文字以
外の領域が領域分割の結果として文字と判定された領域
に入り込んだ場合であっても、当該文字領域属性と識別
された領域を再度分割することで文字以外の領域を排除
することが可能になるので、文字抽出精度を向上させる
ことが可能になる。
Therefore, it is determined whether or not an area other than the character exists in the area identified as the character area attribute, and it is determined that an area other than the character exists in the area identified as the character area attribute. The area identified as the character area attribute is subdivided. As a result, even when an area other than a character such as a seal stamp or a drawing enters the area determined to be a character as a result of the area division, the area identified as the character area attribute is divided again to remove the area other than the character. Since it is possible to eliminate the area, it is possible to improve the character extraction accuracy.

【0010】請求項2記載の発明は、請求項1記載の文
書認識装置において、前記非文字領域判定手段における
前記矩形に係る情報は、前記矩形内部をすべて黒画素と
仮定し、1画素ライン毎の黒画素の座標の最大値及び最
小値である。
According to a second aspect of the present invention, in the document recognition apparatus according to the first aspect, the information regarding the rectangle in the non-character region determining means is assumed to be black pixels in the inside of the rectangle, and every pixel line. Is the maximum value and the minimum value of the black pixel coordinates.

【0011】したがって、文字領域属性と識別された領
域内に文字以外の領域が存在するか否かの判定が容易に
なる。
Therefore, it becomes easy to determine whether or not an area other than a character exists in the area identified as the character area attribute.

【0012】請求項3記載の発明は、請求項2記載の文
書認識装置において、前記再分割手段は、1画素ライン
毎の黒画素の座標の最大値及び最小値に応じて文字行及
び行間を判定し、この行間部分で文字領域属性と識別さ
れた領域を再分割する。
According to a third aspect of the present invention, in the document recognition apparatus according to the second aspect, the subdivision means sets a character line and a line space according to a maximum value and a minimum value of coordinates of black pixels for each pixel line. It is determined, and the area identified as the character area attribute is re-divided in this line spacing.

【0013】したがって、再分割が容易になる。Therefore, the subdivision becomes easy.

【0014】請求項4記載の発明は、請求項3記載の文
書認識装置において、前記行間と判定された領域の前記
矩形に係る情報を用いて、文字以外の領域が存在するか
否かを判定する。
According to a fourth aspect of the present invention, in the document recognition apparatus according to the third aspect, it is determined whether or not there is an area other than a character by using information related to the rectangle of the area determined to be the line spacing. To do.

【0015】したがって、行間と判定された領域には文
字は存在しないことから、文字以外の領域が存在するか
否かの判定が容易になる。
Therefore, since there is no character in the area determined to be the space between lines, it becomes easy to determine whether or not there is an area other than the character.

【0016】請求項5記載の発明は、請求項1ないし4
のいずれか一記載の文書認識装置において、再分割後、
文字認識を行った結果の確からしさを示す指標(確信
度)を算出し、この確信度が低い部分は、文字以外の領
域とする。
The invention according to claim 5 is the invention according to claims 1 to 4.
In the document recognition device according to any one of,
An index (certainty factor) indicating the certainty of the result of character recognition is calculated, and the portion with low certainty factor is defined as an area other than the character.

【0017】したがって、より分割精度を向上させるこ
とが可能になる。
Therefore, it is possible to further improve the division accuracy.

【0018】請求項6記載の発明の文書画像の領域識別
方法は、文書画像データ中に混在する文字領域と文字以
外の領域とを識別分類する文書画像の領域識別方法であ
って、文字領域属性と識別された領域内に含まれる黒画
素の連結成分に外接する矩形を前記文書画像データより
抽出する外接矩形抽出工程と、文字領域属性と識別され
た領域内に文字以外の領域が存在するか否かを前記外接
矩形抽出工程により抽出された前記矩形に係る情報に基
づき判定する非文字領域判定工程と、この非文字領域判
定工程により文字領域属性と識別された領域内に文字以
外の領域が存在すると判定された場合、当該文字領域属
性と識別された領域を再分割する再分割工程と、を含
む。
A document image area identification method according to a sixth aspect of the present invention is a document image area identification method for identifying and classifying a mixed character area and non-character area in document image data. A circumscribing rectangle extraction step of extracting a rectangle circumscribing a connected component of black pixels included in the area identified as from the document image data, and whether an area other than a character exists in the area identified as the character area attribute A non-character area determination step of determining whether or not based on the information related to the rectangle extracted by the circumscribing rectangle extraction step, and an area other than a character in the area identified as the character area attribute by the non-character area determination step And a subdivision step of subdividing the area identified as the character area attribute when it is determined to exist.

【0019】したがって、文字領域属性と識別された領
域内に文字以外の領域が存在するか否かが判定され、文
字領域属性と識別された領域内に文字以外の領域が存在
すると判定された場合、当該文字領域属性と識別された
領域が再分割される。これにより、印鑑や図など文字以
外の領域が領域分割の結果として文字と判定された領域
に入り込んだ場合であっても、当該文字領域属性と識別
された領域を再度分割することで文字以外の領域を排除
することが可能になるので、文字抽出精度を向上させる
ことが可能になる。
Therefore, it is determined whether or not an area other than the character exists in the area identified as the character area attribute, and it is determined that the area other than the character exists in the area identified as the character area attribute. The area identified as the character area attribute is subdivided. As a result, even when an area other than a character such as a seal stamp or a drawing enters the area determined to be a character as a result of the area division, the area identified as the character area attribute is divided again to remove the area other than the character. Since it is possible to eliminate the area, it is possible to improve the character extraction accuracy.

【0020】請求項7記載の発明は、請求項6記載の文
書画像の領域識別方法において、前記非文字領域判定工
程における前記矩形に係る情報は、前記矩形内部をすべ
て黒画素と仮定し、1画素ライン毎の黒画素の座標の最
大値及び最小値である。
According to a seventh aspect of the present invention, in the area identification method for a document image according to the sixth aspect, the information regarding the rectangle in the non-character region determination step is assumed to be black pixels inside the rectangle. It is the maximum value and the minimum value of the coordinates of the black pixel for each pixel line.

【0021】したがって、文字領域属性と識別された領
域内に文字以外の領域が存在するか否かの判定が容易に
なる。
Therefore, it becomes easy to determine whether or not an area other than a character exists in the area identified as the character area attribute.

【0022】請求項8記載の発明は、請求項7記載の文
書画像の領域識別方法において、前記再分割工程は、1
画素ライン毎の黒画素の座標の最大値及び最小値に応じ
て文字行及び行間を判定し、この行間部分で文字領域属
性と識別された領域を再分割する。
According to an eighth aspect of the invention, in the method of identifying the area of a document image according to the seventh aspect, the subdivision step is 1
A character line and a line space are determined according to the maximum value and the minimum value of the black pixel coordinates for each pixel line, and the region identified as the character region attribute is redivided in the line space portion.

【0023】したがって、再分割が容易になる。Therefore, the subdivision becomes easy.

【0024】請求項9記載の発明は、請求項8記載の文
書画像の領域識別方法において、前記行間と判定された
領域の前記矩形に係る情報を用いて、文字以外の領域が
存在するか否かを判定する。
According to a ninth aspect of the present invention, in the document image area identification method according to the eighth aspect, it is determined whether or not an area other than a character exists by using information about the rectangle of the area determined to be the line spacing. To determine.

【0025】したがって、行間と判定された領域には文
字は存在しないことから、文字以外の領域が存在するか
否かの判定が容易になる。
Therefore, since there is no character in the area determined to be the space between lines, it becomes easy to determine whether or not there is an area other than the character.

【0026】請求項10記載の発明は、請求項6ないし
9のいずれか一記載の文書画像の領域識別方法におい
て、再分割後、文字認識を行った結果の確からしさを示
す指標(確信度)を算出し、この確信度が低い部分は、
文字以外の領域とする。
The invention according to claim 10 is an index (confidence) indicating the certainty of the result of character recognition after subdivision in the area identification method of the document image according to any one of claims 6 to 9. And the part with low confidence is
Area other than characters.

【0027】したがって、より分割精度を向上させるこ
とが可能になる。
Therefore, it is possible to further improve the division accuracy.

【0028】請求項11記載の発明のプログラムは、文
書画像データ中に混在する文字領域と文字以外の領域と
の識別分類をコンピュータに実行させるためのプログラ
ムであって、前記コンピュータに、文字領域属性と識別
された領域内に含まれる黒画素の連結成分に外接する矩
形を前記文書画像データより抽出する外接矩形抽出機能
と、文字領域属性と識別された領域内に文字以外の領域
が存在するか否かを前記外接矩形抽出機能により抽出さ
れた前記矩形に係る情報に基づき判定する非文字領域判
定機能と、この非文字領域判定機能により文字領域属性
と識別された領域内に文字以外の領域が存在すると判定
された場合、当該文字領域属性と識別された領域を再分
割する再分割機能と、を実行させる。
The program according to the invention of claim 11 is a program for causing a computer to perform classification and classification of a character area and a non-character area that are mixed in document image data. A circumscribing rectangle extraction function for extracting a rectangle circumscribing the connected component of black pixels contained in the area identified as the above from the document image data, and whether an area other than a character exists in the area identified as the character area attribute A non-character area determination function that determines whether or not there is a non-character area determination function based on the information related to the rectangle extracted by the circumscribing rectangle extraction function, and an area other than a character exists in the area identified as the character area attribute by the non-character area determination function. If it is determined that the character area attribute exists, a re-division function of re-dividing the area identified as the character area attribute is executed.

【0029】したがって、文字領域属性と識別された領
域内に文字以外の領域が存在するか否かが判定され、文
字領域属性と識別された領域内に文字以外の領域が存在
すると判定された場合、当該文字領域属性と識別された
領域が再分割される。これにより、印鑑や図など文字以
外の領域が領域分割の結果として文字と判定された領域
に入り込んだ場合であっても、当該文字領域属性と識別
された領域を再度分割することで文字以外の領域を排除
することが可能になるので、文字抽出精度を向上させる
ことが可能になる。
Therefore, it is determined whether or not an area other than the character exists in the area identified as the character area attribute, and it is determined that the area other than the character exists in the area identified as the character area attribute. The area identified as the character area attribute is subdivided. As a result, even when an area other than a character such as a seal stamp or a drawing enters the area determined to be a character as a result of the area division, the area identified as the character area attribute is divided again to remove the area other than the character. Since it is possible to eliminate the area, it is possible to improve the character extraction accuracy.

【0030】請求項12記載の発明は、請求項11記載
のプログラムにおいて、前記非文字領域判定機能におけ
る前記矩形に係る情報は、前記矩形内部をすべて黒画素
と仮定し、1画素ライン毎の黒画素の座標の最大値及び
最小値である。
According to a twelfth aspect of the present invention, in the program according to the eleventh aspect, the information regarding the rectangle in the non-character area determining function assumes that the inside of the rectangle is all black pixels, and black for each pixel line. It is the maximum value and the minimum value of the pixel coordinates.

【0031】したがって、文字領域属性と識別された領
域内に文字以外の領域が存在するか否かの判定が容易に
なる。
Therefore, it becomes easy to determine whether or not an area other than a character exists in the area identified as the character area attribute.

【0032】請求項13記載の発明は、請求項12記載
のプログラムにおいて、前記再分割機能は、1画素ライ
ン毎の黒画素の座標の最大値及び最小値に応じて文字行
及び行間を判定し、この行間部分で文字領域属性と識別
された領域を再分割する。
According to a thirteenth aspect of the present invention, in the program according to the twelfth aspect, the subdivision function determines a character line and a line space according to a maximum value and a minimum value of coordinates of black pixels for each pixel line. , The area identified as the character area attribute is re-divided in the space between the lines.

【0033】したがって、再分割が容易になる。Therefore, the subdivision becomes easy.

【0034】請求項14記載の発明は、請求項13記載
のプログラムにおいて、前記行間と判定された領域の前
記矩形に係る情報を用いて、文字以外の領域が存在する
か否かを判定する。
According to a fourteenth aspect of the present invention, in the program according to the thirteenth aspect, it is determined whether or not there is an area other than characters by using the information related to the rectangle of the area determined to be the line spacing.

【0035】したがって、行間と判定された領域には文
字は存在しないことから、文字以外の領域が存在するか
否かの判定が容易になる。
Therefore, since there is no character in the area determined to be the space between lines, it becomes easy to determine whether or not there is an area other than the character.

【0036】請求項15記載の発明は、請求項11ない
し14のいずれか一記載のプログラムにおいて、再分割
後、文字認識を行った結果の確からしさを示す指標(確
信度)を算出し、この確信度が低い部分は、文字以外の
領域とする。
According to a fifteenth aspect of the present invention, in the program according to any one of the eleventh to fourteenth aspects, after subdivision, an index (confidence) indicating the certainty of the result of character recognition is calculated, The part with low confidence is an area other than characters.

【0037】したがって、より分割精度を向上させるこ
とが可能になる。
Therefore, it is possible to further improve the division accuracy.

【0038】請求項16記載の発明のコンピュータに読
み取り可能な記憶媒体は、請求項11ないし15のいず
れか一記載のプログラムを記憶した。
A computer-readable storage medium according to a sixteenth aspect of the present invention stores the program according to any one of the eleventh to fifteenth aspects.

【0039】したがって、この記憶媒体をコンピュータ
にインストールすることにより、請求項11ないし15
のいずれか一記載のプログラムと同様の作用を得ること
が可能になる。
Therefore, by installing this storage medium in a computer, the storage medium according to claims 11 to 15 can be obtained.
It is possible to obtain the same operation as that of the program described in any one of 1.

【0040】[0040]

【発明の実施の形態】本発明の実施の一形態を図1ない
し図6に基づいて説明する。
BEST MODE FOR CARRYING OUT THE INVENTION An embodiment of the present invention will be described with reference to FIGS.

【0041】図1は、文書認識装置1のハードウェア構
成を概略的に示すブロック図である。図1に示すよう
に、文書認識装置1は、この文書認識装置1の各部を集
中的に制御するCPU(Central Processing Unit)2
を備えており、このCPU2には、BIOSなどを記憶
した読出し専用メモリであるROM(Read Only Memor
y)3と、各種データを書換え可能に記憶するRAM(R
andom Access Memory)4とがバス5で接続されてい
る。さらにバス5には、外部記憶となるHDD(HardDi
sk Drive)6と、CD(Compact Disc)−ROM7を読
み取るCD−ROMドライブ8と、文書認識装置1とネ
ットワーク9との通信を司る通信制御装置10と、入力
部として機能するキーボードやマウスなどの入力装置1
1と、CRT(Cathode Ray Tube)、LCD(Liquid C
rystal Display)などの出力装置12と、画像入力部と
して機能するスキャナなどの画像入力装置13とが、図
示しないI/Oを介して接続されている。
FIG. 1 is a block diagram schematically showing the hardware configuration of the document recognition device 1. As shown in FIG. 1, a document recognition device 1 includes a CPU (Central Processing Unit) 2 that centrally controls each unit of the document recognition device 1.
The CPU 2 has a read-only memory (ROM) that is a read-only memory that stores a BIOS and the like.
y) 3 and a RAM (R
andom Access Memory) 4 is connected by a bus 5. Further, the bus 5 has an HDD (HardDi
sk Drive) 6, a CD-ROM drive 8 for reading a CD (Compact Disc) -ROM 7, a communication control device 10 for controlling communication between the document recognition device 1 and the network 9, a keyboard, a mouse, etc. functioning as an input unit. Input device 1
1, CRT (Cathode Ray Tube), LCD (Liquid C)
An output device 12 such as a crystal display) and an image input device 13 such as a scanner that functions as an image input unit are connected via an I / O (not shown).

【0042】RAM4は、各種データを書換え可能に記
憶する性質を有していることから、CPU2の作業エリ
アとして機能する。
The RAM 4 functions as a work area of the CPU 2 because it has a property of rewritably storing various data.

【0043】また、HDD6には、各種のプログラムを
格納するプログラムファイルが格納されている。
Further, the HDD 6 stores program files for storing various programs.

【0044】図1に示すCD−ROM7は、この発明の
記憶媒体を実施するものであり、所定のプログラムが記
憶されている。CPU2は、CD−ROM7に記憶され
ているプログラムをCD−ROMドライブ8で読み取
り、HDD6にインストールする。これにより、文書認
識装置1は、後述するような各種の処理を行なうことが
可能な状態となる。
The CD-ROM 7 shown in FIG. 1 embodies the storage medium of the present invention and stores a predetermined program. The CPU 2 reads the program stored in the CD-ROM 7 with the CD-ROM drive 8 and installs it in the HDD 6. As a result, the document recognition device 1 is in a state in which it is possible to perform various types of processing described below.

【0045】なお、記憶媒体としては、CD−ROM7
のみならず、DVDなどの各種の光ディスク、各種光磁
気ディスク、フロッピー(登録商標)ディスクなどの各
種磁気ディスク等、半導体メモリ等の各種方式のメディ
アを用いることができる。また、通信制御装置10を介
してインターネットなどのネットワーク9からプログラ
ムをダウンロードし、HDD6にインストールするよう
にしてもよい。この場合に、送信側のサーバでプログラ
ムを記憶している記憶装置も、この発明の記憶媒体であ
る。なお、プログラムは、所定のOS(Operating Syst
em)上で動作するものであってもよいし、その場合に後
述の各種処理の一部の実行をOSに肩代わりさせるもの
であってもよいし、ワープロソフトなど所定のアプリケ
ーションソフトやOSなどを構成する一群のプログラム
ファイルの一部として含まれているものであってもよ
い。
A CD-ROM 7 is used as a storage medium.
In addition, various types of media such as various optical disks such as DVDs, various magneto-optical disks, various magnetic disks such as floppy (registered trademark) disks, and semiconductor memories can be used. Alternatively, the program may be downloaded from the network 9 such as the Internet via the communication control device 10 and installed in the HDD 6. In this case, the storage device that stores the program in the server on the transmission side is also the storage medium of the present invention. In addition, the program is a predetermined OS (Operating Syst
em) may be used, or in this case, the OS may be allowed to execute a part of various processes described below, or a predetermined application software such as word processing software or an OS may be used. It may be included as a part of a group of program files constituting the program.

【0046】次に、文書認識装置1のCPU2がプログ
ラムに基づいて制御されることにより実現される各種機
能について説明する。図2は、文書認識装置1の機能ブ
ロック図である。
Next, various functions realized by the CPU 2 of the document recognition apparatus 1 being controlled based on a program will be described. FIG. 2 is a functional block diagram of the document recognition device 1.

【0047】領域識別部14は、例えば画像入力装置1
3から入力されてメモリ(RAM4等)に記憶された文
書画像を領域識別し、文字領域、表領域、図領域、写真
領域などに分類する。なお、文書の領域属性は、黒ラン
の密度を用いて判断する等の手法により求めることが可
能であるが、この手法は従来より公知であるため、その
説明は省略する。
The area identification section 14 is, for example, the image input device 1.
The document image input from the memory 3 and stored in the memory (RAM 4 or the like) is identified, and the document image is classified into a character region, a table region, a drawing region, a photograph region, and the like. Note that the area attribute of a document can be obtained by a method such as using the density of black runs to make a determination, but since this method has been publicly known, its description is omitted.

【0048】図領域抽出部15は、領域識別部14にお
いて文字領域として分類された領域内に、実線(印鑑や
図等)が混入しているか否かを判定する。実線(印鑑や
図等)が混入しているか否かの判定手法は従来より公知
であるため、その説明は省略する。
The drawing area extracting unit 15 determines whether or not a solid line (seal stamp, drawing, etc.) is mixed in the area classified as a character area by the area identifying unit 14. A method for determining whether or not a solid line (seal stamp, drawing, etc.) is mixed is conventionally known, and therefore its description is omitted.

【0049】領域分割部16は、図領域抽出部15にお
いて文字領域として分類された領域内に実線(印鑑や図
等)が混入していると判断された場合、対象文字領域を
再分割し、文字認識部17に渡す。
When it is judged that the solid line (seal stamp, drawing, etc.) is mixed in the area classified as the character area by the figure area extracting section 15, the area dividing section 16 re-divides the target character area, It is passed to the character recognition unit 17.

【0050】文字認識部17は、行切り出し処理及び文
字切り出し処理によって1文字の文字を切り出すととも
に、切り出した文字に対する文字認識処理のマッチング
処理により、文字候補を選択する。
The character recognition unit 17 cuts out one character by the line cutout process and the character cutout process, and selects a character candidate by the matching process of the character recognition process for the cut out character.

【0051】なお、図領域抽出部15において文字領域
として分類された領域内に実線(印鑑や図等)が混入し
ていないと判断された場合は、図領域抽出部15におい
て文字領域として分類された領域はそのまま文字認識部
17に渡される。
If it is determined that the solid line (seal stamp, drawing, etc.) is not included in the area classified as the character area by the drawing area extracting unit 15, the area is classified as the character area by the drawing area extracting unit 15. The area that has been opened is passed to the character recognition unit 17 as it is.

【0052】ここで、本実施の形態の特長的な機能を発
揮する図領域抽出部15及び領域分割部16における処
理の流れについて図3を参照しつつ詳細に説明する。ま
ず、ステップS1においては、領域識別部14において
文字領域として分類された領域について、領域座標デー
タ(入力画像を1/4に圧縮した1/4圧縮画像で抽出
された始点、終点のX,Y座標)を用いて該当領域が縦
長領域であるか否かを判断し、該当領域が縦長領域であ
る場合には、該当領域を排除する(以降の処理を行わな
い)。
Here, the flow of processing in the drawing area extracting unit 15 and the area dividing unit 16 that exerts the characteristic function of this embodiment will be described in detail with reference to FIG. First, in step S1, for the area classified as a character area by the area identification unit 14, area coordinate data (X, Y of the start point and the end point extracted by the 1/4 compressed image obtained by compressing the input image into 1/4) is used. (Coordinates) is used to determine whether or not the corresponding area is a vertically long area. If the corresponding area is a vertically long area, the corresponding area is excluded (the subsequent processing is not performed).

【0053】加えて、ステップS2においては、該当領
域の行方向が「縦」であるか否かを判断し、該当領域の
行方向が「縦」である場合には、該当領域を排除する
(以降の処理を行わない)。
In addition, in step S2, it is determined whether or not the row direction of the relevant area is "vertical". If the row direction of the relevant area is "vertical", the relevant area is excluded ( Do not perform subsequent processing).

【0054】次いで、ステップS3において、候補領域
の検出を行う。より詳細には、まず、上記の処理で検出
された文字領域のオリジナル画像に対して矩形抽出処理
を行い、矩形座標データを得る。ここに、外接矩形抽出
手段の機能が実行される。ここで、1/4圧縮画像を用
いないのは、圧縮画像を用いると矩形同士が接触して大
きな矩形となってしまうからである。この後の処理で矩
形座標情報から強制分割位置を推定するため、矩形同士
が接触して大きな矩形となってしまった場合には、推定
精度があがらないという問題が発生するためである。そ
して、このような矩形抽出処理の結果求まった文字領域
内の矩形がすべて黒画素であると仮定し、各ラインごと
(Y座標ごと)に文字領域内で最も小さいX座標(図4
に示す太実線:minXs(y))と、最も大きいX座標(図
4に示す太破線:maxXe(y))とを求める。
Next, in step S3, candidate areas are detected. More specifically, first, rectangle extraction processing is performed on the original image of the character area detected by the above processing to obtain rectangle coordinate data. Here, the function of the circumscribing rectangle extracting means is executed. Here, the reason why the 1/4 compressed image is not used is that when the compressed image is used, the rectangles come into contact with each other and become a large rectangle. This is because the forced division position is estimated from the rectangular coordinate information in the subsequent process, so that if the rectangles come into contact with each other to form a large rectangle, the estimation accuracy will not increase. Then, it is assumed that all the rectangles in the character area obtained as a result of the rectangle extraction processing are black pixels, and the smallest X coordinate in the character area is calculated for each line (for each Y coordinate).
The thick solid line: minXs (y)) and the largest X coordinate (thick broken line: maxXe (y) shown in FIG. 4) are obtained.

【0055】minXs(y)とmaxXe(y)とのyの値は、該当
領域座標の始点(area.Ys)から終点(area.Ye)の値を取
るが、ここで上記の範囲を0〜99の100個のデータ
に正規化する。 minXs(y),maxXs(y) →(正規化)→ minXs
(Y),maxXe(Y) 但しY=(y−area.Ys)/(area.Ye−area.Ys)×10
0 以上により、領域内矩形のX座標の最大値、最小値が各
画素行ごとに求められる。
The values of y of minXs (y) and maxXe (y) take from the start point (area.Ys) to the end point (area.Ye) of the coordinates of the relevant area, and the above range is 0 to. Normalize to 100 data of 99. minXs (y), maxXs (y) → (normalization) → minXs
(Y), maxXe (Y) where Y = (y-area.Ys) / (area.Ye-area.Ys) × 10
From the above, the maximum value and the minimum value of the X coordinate of the rectangle in the area are obtained for each pixel row.

【0056】次いで、この領域内矩形のX座標の最大
値、最小値の値から、複数行が接触しているか否かを判
断する。複数行の左側が接触している例(図4(a)参
照)では、X座標の最小値に注目し、最小値が領域の始
点Xsに連続して寄っているところを行とする。また、
行間は、X座標の最小値が領域の終点Xeに近くなるこ
とから、連続してXeに寄っているところを行間とす
る。そして、「行−行間−行」の組み合わせが検出され
た領域を複数行が接触している(つまり、印鑑や図等が
混入している)と判定し、図5に示すように、行間の中
心で領域を強制分割する。なお、複数行の右側が接触し
ている例(図4(b)参照)では、X座標の最大値に注
目し同様の処理を行うことになる。これにより、文字領
域が再分割され、候補領域の検出処理(ステップS3)
が終了する。ここに、非文字領域判定手段の機能及び再
分割手段の機能が実行される。
Then, it is determined whether or not a plurality of lines are in contact with each other from the maximum and minimum values of the X coordinate of the rectangle in this area. In the example in which the left sides of a plurality of lines are in contact (see FIG. 4A), attention is paid to the minimum value of the X coordinate, and the line where the minimum value continuously approaches the start point Xs of the area is set. Also,
Since the minimum value of the X coordinate is close to the end point Xe of the area, the space between lines is defined as the space between successive lines. Then, it is determined that a plurality of lines are in contact with each other in the area where the combination of “line-line spacing-line” is detected (that is, a seal or a figure is mixed), and as shown in FIG. Forcibly divide the area at the center. In addition, in the example in which the right sides of a plurality of lines are in contact (see FIG. 4B), the same process is performed paying attention to the maximum value of the X coordinate. As a result, the character area is subdivided, and the candidate area is detected (step S3).
Ends. Here, the function of the non-character area determining means and the function of the re-dividing means are executed.

【0057】最後に、ステップS4に進み、最終判定処
理を実行する。最終判定は、再分割された文字領域内に
実線(印鑑や図等)が混入しているか否かを判定するも
のであって、行間と判定された領域に存在する矩形に実
線(印鑑や図等)が存在するか否かを判定し、矩形に実
線(印鑑や図等)が存在する場合にはその矩形を図領域
とするものである。
Finally, the process proceeds to step S4 to execute the final judgment process. The final judgment is to determine whether or not a solid line (seal stamp, figure, etc.) is mixed in the re-divided character area, and the solid line (seal stamp or figure) is added to the rectangle existing in the area determined to be the line space. Etc.) is present. If a solid line (seal stamp, drawing, etc.) exists in the rectangle, the rectangle is used as the drawing area.

【0058】なお、上記では座標の凹凸情報から行を横
に分割する例を説明したが、凹凸情報を用いて、図6に
示すように凸部で図や写真と思われる図領域部分を縦方
向に分割するようにしても良い。
In the above description, an example in which a line is divided horizontally based on the unevenness information of the coordinates has been described. However, by using the unevenness information, a figure area portion which is considered to be a figure or a photograph is vertically formed by a convex portion as shown in FIG. You may make it divide | segment into a direction.

【0059】また、これらの分割の後、文字認識を行っ
た結果の確からしさを示す指標(確信度)を算出し、確
信度が低い(確からしさが低い)部分は、図領域とする
ことで、より分割精度を向上させることも可能である。
After these divisions, an index (certainty) indicating the certainty of the result of character recognition is calculated, and the portion with low certainty (low certainty) is set as the drawing area. It is also possible to further improve the division accuracy.

【0060】なお、本実施の形態においては、行方向横
向きである横書き文書に関して説明をしたが、これに限
るものではなく、行方向縦向きである縦書き文書に適用
することも可能である。
Although the present embodiment has been described with respect to a horizontal writing document having a horizontal orientation in the row direction, the present invention is not limited to this and can be applied to a vertical writing document having a vertical orientation in the row direction.

【0061】ここに、文字領域属性と識別された領域内
に文字以外の領域が存在するか否かが判定され、文字領
域属性と識別された領域内に文字以外の領域が存在する
と判定された場合、当該文字領域属性と識別された領域
が再分割される。これにより、印鑑や図など文字以外の
領域が領域分割の結果として文字と判定された領域に入
り込んだ場合であっても、当該文字領域属性と識別され
た領域を再度分割することで文字以外の領域を排除する
ことが可能になるので、文字抽出精度を向上させること
が可能になる。
Here, it is determined whether or not an area other than the character exists in the area identified as the character area attribute, and it is determined that the area other than the character exists in the area identified as the character area attribute. In this case, the area identified as the character area attribute is redivided. As a result, even when an area other than a character such as a seal stamp or a drawing enters the area determined to be a character as a result of the area division, the area identified as the character area attribute is divided again to remove the area other than the character. Since it is possible to eliminate the area, it is possible to improve the character extraction accuracy.

【0062】[0062]

【発明の効果】請求項1記載の発明の文書認識装置によ
れば、文書画像データ中に混在する文字領域と文字以外
の領域とを識別分類する文書認識装置において、文字領
域属性と識別された領域内に含まれる黒画素の連結成分
に外接する矩形を前記文書画像データより抽出する外接
矩形抽出手段と、文字領域属性と識別された領域内に文
字以外の領域が存在するか否かを前記外接矩形抽出手段
により抽出された前記矩形に係る情報に基づき判定する
非文字領域判定手段と、この非文字領域判定手段により
文字領域属性と識別された領域内に文字以外の領域が存
在すると判定された場合、当該文字領域属性と識別され
た領域を再分割する再分割手段と、を備え、文字領域属
性と識別された領域内に文字以外の領域が存在するか否
かを判定し、文字領域属性と識別された領域内に文字以
外の領域が存在すると判定した場合、当該文字領域属性
と識別された領域を再分割することにより、印鑑や図な
ど文字以外の領域が領域分割の結果として文字と判定さ
れた領域に入り込んだ場合であっても、当該文字領域属
性と識別された領域を再度分割することで文字以外の領
域を排除することができるので、文字抽出精度を向上さ
せることができる。
According to the document recognition apparatus of the first aspect of the invention, in the document recognition apparatus for distinguishing and classifying the mixed character area and non-character area in the document image data, the character area attribute is identified. A circumscribing rectangle extracting means for extracting a rectangle circumscribing a connected component of black pixels contained in the region from the document image data, and determining whether or not a region other than a character exists in the region identified as the character region attribute. A non-character area determining unit that determines based on the information about the rectangle extracted by the circumscribing rectangle extracting unit, and a non-character area is determined to exist in the area identified as the character area attribute by the non-character area determining unit. In the case where the area identified by the character area attribute is re-divided, it is determined whether or not an area other than the character exists in the area identified by the character area attribute. If it is determined that there is an area other than characters in the area identified as the area attribute, the area identified as the character area attribute is re-divided so that the area other than the character such as a seal or a figure is divided as a result of the area division. Even when it enters the area determined to be a character, the area other than the character can be excluded by dividing the area identified as the character area attribute again, so that the character extraction accuracy can be improved. it can.

【0063】請求項2記載の発明によれば、請求項1記
載の文書認識装置において、前記非文字領域判定手段に
おける前記矩形に係る情報は、前記矩形内部をすべて黒
画素と仮定し、1画素ライン毎の黒画素の座標の最大値
及び最小値であることにより、文字領域属性と識別され
た領域内に文字以外の領域が存在するか否かの判定を容
易に行うことができる。
According to the second aspect of the present invention, in the document recognition apparatus according to the first aspect, the information regarding the rectangle in the non-character area determining means is assumed to be a black pixel inside the rectangle, With the maximum value and the minimum value of the coordinates of the black pixel for each line, it is possible to easily determine whether or not there is an area other than the character in the area identified as the character area attribute.

【0064】請求項3記載の発明によれば、請求項2記
載の文書認識装置において、前記再分割手段は、1画素
ライン毎の黒画素の座標の最大値及び最小値に応じて文
字行及び行間を判定し、この行間部分で文字領域属性と
識別された領域を再分割することにより、再分割を容易
に行うことができる。
According to the third aspect of the present invention, in the document recognition apparatus according to the second aspect, the subdivision means determines a character line and a character line according to the maximum value and the minimum value of the coordinates of the black pixel for each pixel line. Re-division can be easily performed by determining the space between lines and re-dividing the region identified as the character region attribute in this space between lines.

【0065】請求項4記載の発明によれば、請求項3記
載の文書認識装置において、前記行間と判定された領域
の前記矩形に係る情報を用いて、文字以外の領域が存在
するか否かを判定することにより、行間と判定された領
域には文字は存在しないことから、文字以外の領域が存
在するか否かの判定を容易に行うことができる。
According to the fourth aspect of the invention, in the document recognition apparatus according to the third aspect, it is determined whether or not there is an area other than a character by using the information related to the rectangle of the area determined to be the line spacing. By determining, since there is no character in the area determined to be the line spacing, it can be easily determined whether or not there is an area other than the character.

【0066】請求項5記載の発明によれば、請求項1な
いし4のいずれか一記載の文書認識装置において、再分
割後、文字認識を行った結果の確からしさを示す指標
(確信度)を算出し、この確信度が低い部分は、文字以
外の領域とすることにより、より分割精度を向上させる
ことができる。
According to the invention described in claim 5, in the document recognition apparatus according to any one of claims 1 to 4, after the subdivision, an index (confidence) indicating the certainty of the result of character recognition is obtained. It is possible to further improve the division accuracy by calculating and calculating the portion with low confidence as a region other than the character.

【0067】請求項6記載の発明の文書画像の領域識別
方法によれば、文書画像データ中に混在する文字領域と
文字以外の領域とを識別分類する文書画像の領域識別方
法であって、文字領域属性と識別された領域内に含まれ
る黒画素の連結成分に外接する矩形を前記文書画像デー
タより抽出する外接矩形抽出工程と、文字領域属性と識
別された領域内に文字以外の領域が存在するか否かを前
記外接矩形抽出工程により抽出された前記矩形に係る情
報に基づき判定する非文字領域判定工程と、この非文字
領域判定工程により文字領域属性と識別された領域内に
文字以外の領域が存在すると判定された場合、当該文字
領域属性と識別された領域を再分割する再分割工程と、
を含み、文字領域属性と識別された領域内に文字以外の
領域が存在するか否かを判定し、文字領域属性と識別さ
れた領域内に文字以外の領域が存在すると判定した場
合、当該文字領域属性と識別された領域を再分割するこ
とにより、印鑑や図など文字以外の領域が領域分割の結
果として文字と判定された領域に入り込んだ場合であっ
ても、当該文字領域属性と識別された領域を再度分割す
ることで文字以外の領域を排除することができるので、
文字抽出精度を向上させることができる。
According to the document image area identification method of the sixth aspect of the present invention, there is provided a document image area identification method for distinguishing and classifying mixed character areas and non-character areas in document image data. A circumscribing rectangle extraction step of extracting a rectangle circumscribing a connected component of black pixels included in the area identified as the area attribute from the document image data, and an area other than a character exists in the area identified as the character area attribute. A non-character area determination step of determining whether or not to perform based on the information on the rectangle extracted by the circumscribing rectangle extraction step, and a character other than a character in the area identified as the character area attribute by the non-character area determination step. If it is determined that the area exists, a subdivision step of subdividing the area identified as the character area attribute,
If it is determined that an area other than the character exists in the area identified as the character area attribute and the area other than the character exists in the area identified as the character area attribute, the character By redistributing the area identified as the area attribute, even if a non-character area such as a seal or a figure enters the area determined to be the character as a result of the area split, the area is identified as the character area attribute. Since the area other than the character can be excluded by dividing the area that has been
The character extraction accuracy can be improved.

【0068】請求項7記載の発明によれば、請求項6記
載の文書画像の領域識別方法において、前記非文字領域
判定工程における前記矩形に係る情報は、前記矩形内部
をすべて黒画素と仮定し、1画素ライン毎の黒画素の座
標の最大値及び最小値であることにより、文字領域属性
と識別された領域内に文字以外の領域が存在するか否か
の判定を容易に行うことができる。
According to the seventh aspect of the present invention, in the document image area identification method according to the sixth aspect, the information regarding the rectangle in the non-character area determining step is assumed to be all black pixels inside the rectangle. With the maximum and minimum values of the black pixel coordinates for each pixel line, it is possible to easily determine whether or not an area other than a character exists in the area identified as the character area attribute. .

【0069】請求項8記載の発明によれば、請求項7記
載の文書画像の領域識別方法において、前記再分割工程
は、1画素ライン毎の黒画素の座標の最大値及び最小値
に応じて文字行及び行間を判定し、この行間部分で文字
領域属性と識別された領域を再分割することにより、再
分割を容易に行うことができる。
According to the eighth aspect of the present invention, in the document image area identification method according to the seventh aspect, the subdivision step is performed according to the maximum value and the minimum value of the coordinates of the black pixel for each pixel line. Re-division can be easily performed by determining a character line and a line space, and re-dividing the region identified as the character region attribute in the line space portion.

【0070】請求項9記載の発明によれば、請求項8記
載の文書画像の領域識別方法において、前記行間と判定
された領域の前記矩形に係る情報を用いて、文字以外の
領域が存在するか否かを判定することにより、行間と判
定された領域には文字は存在しないことから、文字以外
の領域が存在するか否かの判定を容易に行うことができ
る。
According to the invention of claim 9, in the area identification method of the document image according to claim 8, there is an area other than a character by using the information related to the rectangle of the area determined to be the line spacing. By determining whether or not there is no character in the area determined to be the line spacing, it is possible to easily determine whether or not there is an area other than the character.

【0071】請求項10記載の発明によれば、請求項6
ないし9のいずれか一記載の文書画像の領域識別方法に
おいて、再分割後、文字認識を行った結果の確からしさ
を示す指標(確信度)を算出し、この確信度が低い部分
は、文字以外の領域とすることにより、より分割精度を
向上させることができる。
According to the invention of claim 10, claim 6
In the document image area identification method according to any one of 1 to 9, an index (confidence factor) indicating the certainty of the result of character recognition is calculated after the subdivision, and the portion with low confidence factor is not a character. By setting the area to, the division accuracy can be further improved.

【0072】請求項11記載の発明のプログラムによれ
ば、文書画像データ中に混在する文字領域と文字以外の
領域との識別分類をコンピュータに実行させるためのプ
ログラムであって、前記コンピュータに、文字領域属性
と識別された領域内に含まれる黒画素の連結成分に外接
する矩形を前記文書画像データより抽出する外接矩形抽
出機能と、文字領域属性と識別された領域内に文字以外
の領域が存在するか否かを前記外接矩形抽出機能により
抽出された前記矩形に係る情報に基づき判定する非文字
領域判定機能と、この非文字領域判定機能により文字領
域属性と識別された領域内に文字以外の領域が存在する
と判定された場合、当該文字領域属性と識別された領域
を再分割する再分割機能と、を実行させ、文字領域属性
と識別された領域内に文字以外の領域が存在するか否か
を判定し、文字領域属性と識別された領域内に文字以外
の領域が存在すると判定した場合、当該文字領域属性と
識別された領域を再分割することにより、印鑑や図など
文字以外の領域が領域分割の結果として文字と判定され
た領域に入り込んだ場合であっても、当該文字領域属性
と識別された領域を再度分割することで文字以外の領域
を排除することができるので、文字抽出精度を向上させ
ることができる。
According to the program of the eleventh aspect of the present invention, there is provided a program for causing a computer to perform classification / discrimination between a character area and a non-character area mixed in the document image data. A circumscribing rectangle extraction function for extracting a rectangle circumscribing a connected component of black pixels included in the area identified as the area attribute from the document image data, and an area other than a character exists in the area identified as the character area attribute. A non-character area determination function for determining whether or not to perform based on the information related to the rectangle extracted by the circumscribing rectangle extraction function, and a character other than a character in the area identified as the character area attribute by the non-character area determination function. When it is determined that the area exists, the subdivision function of subdividing the area identified as the character area attribute is executed, and the area identified as the character area attribute is executed. If there is an area other than a character in the area, and if it is determined that an area other than a character exists in the area identified as the character area attribute, the area identified as the character area attribute should be subdivided. Even if an area other than a character, such as a seal stamp or a drawing, enters an area determined to be a character as a result of area division, the area other than the character is divided by dividing the area identified with the character area attribute again. Can be eliminated, so that the character extraction accuracy can be improved.

【0073】請求項12記載の発明によれば、請求項1
1記載のプログラムにおいて、前記非文字領域判定機能
における前記矩形に係る情報は、前記矩形内部をすべて
黒画素と仮定し、1画素ライン毎の黒画素の座標の最大
値及び最小値であることにより、文字領域属性と識別さ
れた領域内に文字以外の領域が存在するか否かの判定を
容易に行うことができる。
According to the invention of claim 12, claim 1
In the program according to 1, the information regarding the rectangle in the non-character area determination function is a maximum value and a minimum value of the coordinates of the black pixel for each pixel line, assuming that the inside of the rectangle is all black pixels. It is possible to easily determine whether or not an area other than a character exists in the area identified as the character area attribute.

【0074】請求項13記載の発明によれば、請求項1
2記載のプログラムにおいて、前記再分割機能は、1画
素ライン毎の黒画素の座標の最大値及び最小値に応じて
文字行及び行間を判定し、この行間部分で文字領域属性
と識別された領域を再分割することにより、再分割を容
易に行うことができる。
According to the invention of claim 13, claim 1
In the program described in 2, the subdivision function determines a character line and a line space according to a maximum value and a minimum value of a black pixel coordinate for each pixel line, and an area identified as a character area attribute in the line space portion. Can be easily re-divided.

【0075】請求項14記載の発明によれば、請求項1
3記載のプログラムにおいて、前記行間と判定された領
域の前記矩形に係る情報を用いて、文字以外の領域が存
在するか否かを判定することにより、行間と判定された
領域には文字は存在しないことから、文字以外の領域が
存在するか否かの判定を容易に行うことができる。
According to the invention of claim 14, claim 1
In the program described in 3, the information regarding the rectangle of the area determined to be the line spacing is used to determine whether or not there is an area other than the character, so that a character is present in the area determined to be the line spacing. Therefore, it is possible to easily determine whether or not there is an area other than the character.

【0076】請求項15記載の発明によれば、請求項1
1ないし14のいずれか一記載のプログラムにおいて、
再分割後、文字認識を行った結果の確からしさを示す指
標(確信度)を算出し、この確信度が低い部分は、文字
以外の領域とすることにより、より分割精度を向上させ
ることができる。
According to the invention of claim 15, claim 1
In the program according to any one of 1 to 14,
After the redivision, an index (confidence factor) indicating the certainty of the result of character recognition is calculated, and the part with a low confidence factor is an area other than the character, so that the division accuracy can be further improved. .

【0077】請求項16記載の発明のコンピュータに読
み取り可能な記憶媒体によれば、請求項11ないし15
のいずれか一記載のプログラムを記憶したことにより、
この記憶媒体をコンピュータにインストールすること
で、請求項11ないし15のいずれか一記載のプログラ
ムと同様の作用・効果を得ることができる。
According to the computer-readable storage medium of the sixteenth aspect of the present invention, the eleventh to fifteenth aspects are provided.
By storing the program described in any one of,
By installing this storage medium in a computer, it is possible to obtain the same actions and effects as the program according to any one of claims 11 to 15.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施の一形態の文書認識装置のハード
ウェア構成を概略的に示すブロック図である。
FIG. 1 is a block diagram schematically showing a hardware configuration of a document recognition device according to an embodiment of the present invention.

【図2】文書認識装置の機能ブロック図である。FIG. 2 is a functional block diagram of a document recognition device.

【図3】図領域抽出部及び領域分割部における処理の流
れを示すフローチャートである。
FIG. 3 is a flowchart showing a flow of processing in a diagram area extracting unit and an area dividing unit.

【図4】領域内矩形抽出結果に基づいて領域内矩形のX
座標の最大値、最小値を求めた例を示す説明図である。
FIG. 4 is a diagram showing an X of an in-region rectangle based on an in-region rectangle extraction result.
It is explanatory drawing which shows the example which calculated | required the maximum value and minimum value of a coordinate.

【図5】強制分割位置の一例を示す説明図である。FIG. 5 is an explanatory diagram showing an example of a forced division position.

【図6】強制分割位置の他の一例を示す説明図である。FIG. 6 is an explanatory diagram showing another example of the forced division position.

【符号の説明】[Explanation of symbols]

1 文書認識装置 7 記憶媒体 1 Document recognition device 7 storage media

Claims (16)

【特許請求の範囲】[Claims] 【請求項1】 文書画像データ中に混在する文字領域と
文字以外の領域とを識別分類する文書認識装置におい
て、 文字領域属性と識別された領域内に含まれる黒画素の連
結成分に外接する矩形を前記文書画像データより抽出す
る外接矩形抽出手段と、 文字領域属性と識別された領域内に文字以外の領域が存
在するか否かを前記外接矩形抽出手段により抽出された
前記矩形に係る情報に基づき判定する非文字領域判定手
段と、 この非文字領域判定手段により文字領域属性と識別され
た領域内に文字以外の領域が存在すると判定された場
合、当該文字領域属性と識別された領域を再分割する再
分割手段と、を備えることを特徴とする文書認識装置。
1. In a document recognition device for distinguishing and classifying mixed character areas and areas other than characters in document image data, a rectangle circumscribing a connected component of black pixels included in the area identified as a character area attribute. Circumscribing rectangle extracting means for extracting from the document image data, and whether or not a region other than a character exists in a region identified as a character region attribute, based on the information relating to the rectangle extracted by the circumscribing rectangle extracting device. Based on the non-character area determination means based on the non-character area determination means based on the non-character area determination means based on the non-character area determination means based on the non-character area determination means based on the non-character area determination means based on the non-character area determination means based on the non-character area determination means. A document recognition device, comprising: a re-division unit for dividing.
【請求項2】 前記非文字領域判定手段における前記矩
形に係る情報は、前記矩形内部をすべて黒画素と仮定
し、1画素ライン毎の黒画素の座標の最大値及び最小値
であることを特徴とする請求項1記載の文書認識装置。
2. The information relating to the rectangle in the non-character region determining means is a maximum value and a minimum value of coordinates of black pixels for each pixel line, assuming that the inside of the rectangle is all black pixels. The document recognition device according to claim 1.
【請求項3】 前記再分割手段は、1画素ライン毎の黒
画素の座標の最大値及び最小値に応じて文字行及び行間
を判定し、この行間部分で文字領域属性と識別された領
域を再分割することを特徴とする請求項2記載の文書認
識装置。
3. The subdivision means determines a character line and a line space according to the maximum value and the minimum value of the coordinates of the black pixel for each pixel line, and determines the region identified as the character region attribute in the line space portion. The document recognition device according to claim 2, wherein the document recognition device is divided again.
【請求項4】 前記行間と判定された領域の前記矩形に
係る情報を用いて、文字以外の領域が存在するか否かを
判定することを特徴とする請求項3記載の文書認識装
置。
4. The document recognition apparatus according to claim 3, wherein it is determined whether or not there is an area other than a character by using information about the rectangle of the area determined to be the line spacing.
【請求項5】 再分割後、文字認識を行った結果の確か
らしさを示す指標(確信度)を算出し、この確信度が低
い部分は、文字以外の領域とすることを特徴とする請求
項1ないし4のいずれか一記載の文書認識装置。
5. After the subdivision, an index (certainty factor) indicating the certainty of the result of character recognition is calculated, and the portion with low certainty factor is an area other than the character. The document recognition device according to any one of 1 to 4.
【請求項6】 文書画像データ中に混在する文字領域と
文字以外の領域とを識別分類する文書画像の領域識別方
法であって、 文字領域属性と識別された領域内に含まれる黒画素の連
結成分に外接する矩形を前記文書画像データより抽出す
る外接矩形抽出工程と、 文字領域属性と識別された領域内に文字以外の領域が存
在するか否かを前記外接矩形抽出工程により抽出された
前記矩形に係る情報に基づき判定する非文字領域判定工
程と、 この非文字領域判定工程により文字領域属性と識別され
た領域内に文字以外の領域が存在すると判定された場
合、当該文字領域属性と識別された領域を再分割する再
分割工程と、を含むことを特徴とする文書画像の領域識
別方法。
6. A document image area identification method for identifying and classifying a character area and a non-character area mixed in document image data, wherein black pixels included in an area identified as a character area attribute are concatenated. A circumscribing rectangle extracting step of extracting a rectangle circumscribing a component from the document image data; and a step of extracting whether a region other than a character exists in a region identified as a character region attribute by the circumscribing rectangle extracting process. A non-character area determination step that is determined based on the information related to the rectangle, and if it is determined that an area other than a character exists in the area that is identified as a character area attribute by this non-character area determination step, it is identified as the character area attribute. And a subdivision step of subdividing the created area.
【請求項7】 前記非文字領域判定工程における前記矩
形に係る情報は、前記矩形内部をすべて黒画素と仮定
し、1画素ライン毎の黒画素の座標の最大値及び最小値
であることを特徴とする請求項6記載の文書画像の領域
識別方法。
7. The information regarding the rectangle in the non-character region determining step is a maximum value and a minimum value of coordinates of black pixels for each pixel line, assuming that the inside of the rectangle is all black pixels. The area identification method of the document image according to claim 6.
【請求項8】 前記再分割工程は、1画素ライン毎の黒
画素の座標の最大値及び最小値に応じて文字行及び行間
を判定し、この行間部分で文字領域属性と識別された領
域を再分割することを特徴とする請求項7記載の文書画
像の領域識別方法。
8. The subdivision step determines a character line and a line space according to the maximum value and the minimum value of the coordinates of black pixels for each pixel line, and determines an area identified as a character area attribute in the line space portion. The area identification method of the document image according to claim 7, wherein the area division is performed again.
【請求項9】 前記行間と判定された領域の前記矩形に
係る情報を用いて、文字以外の領域が存在するか否かを
判定することを特徴とする請求項8記載の文書画像の領
域識別方法。
9. The area identification of a document image according to claim 8, wherein it is determined whether or not an area other than a character exists by using information about the rectangle of the area determined to be the line spacing. Method.
【請求項10】 再分割後、文字認識を行った結果の確
からしさを示す指標(確信度)を算出し、この確信度が
低い部分は、文字以外の領域とすることを特徴とする請
求項6ないし9のいずれか一記載の文書画像の領域識別
方法。
10. An index (certainty factor) indicating the certainty of the result of character recognition after re-division, and the portion with low certainty factor is an area other than the character. 6. The document image area identification method according to any one of 6 to 9.
【請求項11】 文書画像データ中に混在する文字領域
と文字以外の領域との識別分類をコンピュータに実行さ
せるためのプログラムであって、前記コンピュータに、 文字領域属性と識別された領域内に含まれる黒画素の連
結成分に外接する矩形を前記文書画像データより抽出す
る外接矩形抽出機能と、 文字領域属性と識別された領域内に文字以外の領域が存
在するか否かを前記外接矩形抽出機能により抽出された
前記矩形に係る情報に基づき判定する非文字領域判定機
能と、 この非文字領域判定機能により文字領域属性と識別され
た領域内に文字以外の領域が存在すると判定された場
合、当該文字領域属性と識別された領域を再分割する再
分割機能と、を実行させることを特徴とするプログラ
ム。
11. A program for causing a computer to identify and classify a mixed character region and non-character region in document image data, the program being included in a region identified as a character region attribute by the computer. A circumscribed rectangle extraction function for extracting a rectangle circumscribing a connected component of black pixels from the document image data, and a circumscribed rectangle extraction function for determining whether or not a region other than a character exists in a region identified as a character region attribute. A non-character area determination function that is determined based on the information related to the rectangle extracted by, and if it is determined that an area other than a character exists in the area that is identified as a character area attribute by the non-character area determination function, A program for executing a subdivision function for subdividing an area identified as a character area attribute.
【請求項12】 前記非文字領域判定機能における前記
矩形に係る情報は、前記矩形内部をすべて黒画素と仮定
し、1画素ライン毎の黒画素の座標の最大値及び最小値
であることを特徴とする請求項11記載のプログラム。
12. The information relating to the rectangle in the non-character region determining function is a maximum value and a minimum value of coordinates of black pixels for each pixel line, assuming that the inside of the rectangle is all black pixels. The program according to claim 11, wherein:
【請求項13】 前記再分割機能は、1画素ライン毎の
黒画素の座標の最大値及び最小値に応じて文字行及び行
間を判定し、この行間部分で文字領域属性と識別された
領域を再分割することを特徴とする請求項12記載のプ
ログラム。
13. The subdivision function determines a character line and a line space according to a maximum value and a minimum value of a black pixel coordinate for each pixel line, and determines an area identified as a character area attribute in the line space portion. 13. The program according to claim 12, wherein the program is divided again.
【請求項14】 前記行間と判定された領域の前記矩形
に係る情報を用いて、文字以外の領域が存在するか否か
を判定することを特徴とする請求項13記載のプログラ
ム。
14. The program according to claim 13, wherein it is determined whether or not an area other than a character exists by using information about the rectangle of the area determined to be the line spacing.
【請求項15】 再分割後、文字認識を行った結果の確
からしさを示す指標(確信度)を算出し、この確信度が
低い部分は、文字以外の領域とすることを特徴とする請
求項11ないし14のいずれか一記載のプログラム。
15. An index (certainty factor) indicating the certainty of the result of character recognition after the subdivision is calculated, and the portion with the low certainty factor is an area other than the character. 15. The program according to any one of 11 to 14.
【請求項16】 請求項11ないし15のいずれか一記
載のプログラムを記憶したことを特徴とするコンピュー
タに読み取り可能な記憶媒体。
16. A computer-readable storage medium storing the program according to any one of claims 11 to 15.
JP2001211476A 2001-07-12 2001-07-12 Document recognition apparatus, document image region identification method, program, and storage medium Expired - Fee Related JP4616522B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001211476A JP4616522B2 (en) 2001-07-12 2001-07-12 Document recognition apparatus, document image region identification method, program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001211476A JP4616522B2 (en) 2001-07-12 2001-07-12 Document recognition apparatus, document image region identification method, program, and storage medium

Publications (2)

Publication Number Publication Date
JP2003030584A true JP2003030584A (en) 2003-01-31
JP4616522B2 JP4616522B2 (en) 2011-01-19

Family

ID=19046783

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001211476A Expired - Fee Related JP4616522B2 (en) 2001-07-12 2001-07-12 Document recognition apparatus, document image region identification method, program, and storage medium

Country Status (1)

Country Link
JP (1) JP4616522B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100424716C (en) * 2005-10-07 2008-10-08 株式会社理光 Image processing device, image processing method, and computer program product
US7747089B2 (en) 2006-06-12 2010-06-29 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method, and image processing program
CN117495950A (en) * 2023-12-29 2024-02-02 山东五思信息科技有限公司 Test paper sealing line positioning method and system based on density clustering

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58201182A (en) * 1982-05-20 1983-11-22 Nippon Telegr & Teleph Corp <Ntt> Character and graph demarcating method
JPH04270483A (en) * 1990-11-16 1992-09-25 Seiko Epson Corp Character information detector
JPH04303278A (en) * 1990-12-29 1992-10-27 Gold Star Co Ltd Character-string separating method for compressed image
JPH06150055A (en) * 1992-11-06 1994-05-31 Matsushita Electric Ind Co Ltd Character recognizing device
JPH08115380A (en) * 1994-10-18 1996-05-07 Canon Inc Device and method for image processing
JP2001134712A (en) * 1999-11-02 2001-05-18 Canon Inc Device and method for processing image

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58201182A (en) * 1982-05-20 1983-11-22 Nippon Telegr & Teleph Corp <Ntt> Character and graph demarcating method
JPH04270483A (en) * 1990-11-16 1992-09-25 Seiko Epson Corp Character information detector
JPH04303278A (en) * 1990-12-29 1992-10-27 Gold Star Co Ltd Character-string separating method for compressed image
JPH06150055A (en) * 1992-11-06 1994-05-31 Matsushita Electric Ind Co Ltd Character recognizing device
JPH08115380A (en) * 1994-10-18 1996-05-07 Canon Inc Device and method for image processing
JP2001134712A (en) * 1999-11-02 2001-05-18 Canon Inc Device and method for processing image

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100424716C (en) * 2005-10-07 2008-10-08 株式会社理光 Image processing device, image processing method, and computer program product
US7747089B2 (en) 2006-06-12 2010-06-29 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method, and image processing program
CN117495950A (en) * 2023-12-29 2024-02-02 山东五思信息科技有限公司 Test paper sealing line positioning method and system based on density clustering
CN117495950B (en) * 2023-12-29 2024-03-26 山东五思信息科技有限公司 Test paper sealing line positioning method and system based on density clustering

Also Published As

Publication number Publication date
JP4616522B2 (en) 2011-01-19

Similar Documents

Publication Publication Date Title
US10803338B2 (en) Method and device for recognizing the character area in a image
WO2018103608A1 (en) Text detection method, device and storage medium
CN112069991A (en) PDF table information extraction method and related device
CN113887375A (en) Text recognition method, device, equipment and storage medium
US9684844B1 (en) Method and apparatus for normalizing character included in an image
JP2003030584A (en) Document recognizing device, region identifying method for document image, and program and recording medium therefor
JP3215163B2 (en) Ruled line identification method and area identification method
KR102285269B1 (en) Image analysis apparatus and method for utilizing the big data base GEO AI
JP4162195B2 (en) Image processing apparatus and image processing program
WO2023152809A1 (en) Image processing device, image processing method, and program
KR102395599B1 (en) System and method to recognize line objects in image drawings based on deep learning
JPH10187887A (en) Device, method for identifying type face and information recording medium
JPH11143990A (en) Method and device for recognizing character and recording medium in which method for recognizing character is recorded
JPH1166230A (en) Device, method, and medium for document recognition
JPH0573718A (en) Area attribute identifying system
JPH0816719A (en) Character segmenting character recognition method, method and device by using same
JP2002074264A (en) Picture processor, its processing method and recording medium
JP3220226B2 (en) Character string direction determination method
JPH1049676A (en) Method for recognizing ruled line
JPH11242716A (en) Image processing method and storage medium
JPH1166225A (en) Device and method for table information extraction and record medium
CN115272801A (en) Method and device for obtaining training sample, and method and device for model training
JP2001266070A (en) Device and method for recognizing character and storage medium
JPH06150062A (en) Character recognizing device
JPH1021332A (en) Non-linear normalizing method

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041004

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080111

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080620

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101022

R150 Certificate of patent or registration of utility model

Ref document number: 4616522

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131029

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees