JP2005071014A - Document image processor, document image processing method, program and storage medium - Google Patents
Document image processor, document image processing method, program and storage medium Download PDFInfo
- Publication number
- JP2005071014A JP2005071014A JP2003298566A JP2003298566A JP2005071014A JP 2005071014 A JP2005071014 A JP 2005071014A JP 2003298566 A JP2003298566 A JP 2003298566A JP 2003298566 A JP2003298566 A JP 2003298566A JP 2005071014 A JP2005071014 A JP 2005071014A
- Authority
- JP
- Japan
- Prior art keywords
- document image
- keyword
- image processing
- group
- processing method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000003672 processing method Methods 0.000 title claims description 40
- 238000012545 processing Methods 0.000 claims description 55
- 238000012217 deletion Methods 0.000 claims description 5
- 230000037430 deletion Effects 0.000 claims description 5
- 238000000034 method Methods 0.000 description 24
- 238000011161 development Methods 0.000 description 16
- 230000018109 developmental process Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 10
- 238000011156 evaluation Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 208000028571 Occupational disease Diseases 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、文書画像を検索可能な体系で保存する文書画像処理装置、文書画像処理方法、プログラムおよび記憶媒体に関し、特に登録時に、文字認識を用いて自動分類を行う文書画像処理装置、文書画像処理方法、プログラムおよび記憶媒体に関する。 The present invention relates to a document image processing apparatus, a document image processing method, a program, and a storage medium that store document images in a searchable system, and more particularly to a document image processing apparatus that performs automatic classification using character recognition at the time of registration. The present invention relates to a processing method, a program, and a storage medium.
電子文書管理システム等の文書画像処理装置は、文字情報を含む電子文書を保存しておき、該電子文書をキーワードを用いて検索できるように構成される。 A document image processing apparatus such as an electronic document management system is configured to store an electronic document including character information and to search the electronic document using a keyword.
保存すべき原稿は、イメージスキャナなどによって文書画像データとして入力され、該文書画像データをフォルダ等に登録(ファイリング)する。 A document to be stored is input as document image data by an image scanner or the like, and the document image data is registered (filed) in a folder or the like.
このような電子文書管理システムには、文書画像をファイリングする際に、キャビネットやフォルダ等を用いて、階層的なグループ分けが可能なものがあり、検索範囲指定が容易になるなど、より操作性に優れたファイリング機能が実現される。 Some of these electronic document management systems are capable of hierarchical grouping using filing cabinets, folders, etc. when filing document images, making it easier to specify search ranges and more operability. An excellent filing function is realized.
しかし、一般に文書画像登録の階層はオペレータの判断に委ねられており、オペレータは登録すべき文書画像を判断するために、ファイリング体系を把握しておかなければならない。また、このような判断をともなう登録作業自体煩雑である。 However, in general, the hierarchy of document image registration is left to the operator's judgment, and the operator must grasp the filing system in order to judge the document image to be registered. Moreover, the registration work itself with such a determination is complicated.
そこで、入力された文書画像を分類するための階層をキーワードに対応付けて登録する電子文書管理システムが提案されている。この電子文書管理システムでは、入力された文書画像を文字認識し、文字認識結果のテキストデータについてキーワードを検索し、最も多く検出されたキーワードに基づいて、文書画像を対応する階層に分類する。(特許文献1参照)
また、帳票のレイアウトとそのタイトル位置をレイアウト辞書に格納する電子文書管理システムが提案されている。この電子文書管理システムでは、入力された帳票とレイアウト辞書とのマッチング処理を行い、一致とみなされたレイアウトにおいて、タイトル位置に記入されている文字等を読み取り、帳票を特定する。(特許文献2参照)
There has also been proposed an electronic document management system for storing a form layout and its title position in a layout dictionary. In this electronic document management system, matching processing between the input form and the layout dictionary is performed, and characters and the like written in the title position are read in the layout regarded as matching, and the form is specified. (See Patent Document 2)
しかしながら、特許文献1の電子文書管理システムでは、文書画像に含まれる全ての文字を認識するため、登録処理に長時間を要し、また検出キーワードの個数により分類の優先順位を決定するため、登録すべき階層のキーワードと異なる単語が多数出現した場合、誤分類の可能性が高まる。
However, the electronic document management system of
特許文献2の電子文書管理システムでは、特定されたレイアウトにおいてタイトル位置の文字を読み取るため、キーワードを抽出できるレイアウトの帳票でなければ登録処理することができず、用途が限定される。さらに帳票をあらかじめレイアウト辞書に格納するという煩雑な作業が不可欠であり、また分類登録については考慮されていない。
In the electronic document management system of
本発明は、このような従来の問題点を解消すべく創案されたもので、文書画像を高速かつ高精度に分類することを目的とする。 The present invention has been developed to solve such conventional problems, and an object thereof is to classify document images with high speed and high accuracy.
本発明に係る文書画像処理装置は、文書画像を複数のグループに分類するためのキーワードと分類先のグループとを関連付けて管理するキーワード管理手段と、前記文書画像における所定属性の領域の画像からテキスト情報を取得する文字認識手段と、前記取得したテキスト情報内に前記キーワードが含まれるか否か検索するキーワード検索手段と、前記キーワード検索手段による検索結果に基づいて、前記文書画像を少なくともいずれかのグループに分類する分類手段と、を備える。 A document image processing apparatus according to the present invention includes a keyword management unit that manages a keyword for classifying a document image into a plurality of groups and a group to be classified, and a text from an image of a predetermined attribute area in the document image. Character recognition means for acquiring information, keyword search means for searching whether or not the keyword is included in the acquired text information, and at least one of the document images based on a search result by the keyword search means Classification means for classifying into groups.
本発明に係る文書画像処理方法は、文書画像を複数のグループに分類するためのキーワードと分類先のグループとを関連付けておき、文書画像を該キーワードに基づいてグループに分類する文書画像処理方法であって、文書画像における所定属性の領域の画像からテキスト情報を取得する文字認識ステップと、前記取得したテキスト情報内に前記キーワードが含まれるか否か検索するキーワード検索ステップと、前記キーワード検索ステップによる検索結果に基づいて、前記文書画像を少なくともいずれかのグループに分類する分類ステップと、を備える。 A document image processing method according to the present invention is a document image processing method in which keywords for classifying document images into a plurality of groups are associated with classification target groups, and the document images are classified into groups based on the keywords. A character recognition step of acquiring text information from an image of a predetermined attribute area in the document image, a keyword search step of searching whether or not the keyword is included in the acquired text information, and the keyword search step. A classification step of classifying the document images into at least one group based on the search result.
本発明によれば、文書画像を高速かつ高精度に分類し得る。 According to the present invention, document images can be classified with high speed and high accuracy.
次に、本発明に係る文書画像処理装置および文書画像処理方法の実施例1を図面に基づいて説明する。 Next, a first embodiment of a document image processing apparatus and a document image processing method according to the present invention will be described with reference to the drawings.
図1は、本発明に係る文書画像処理装置の実施例1を示すブロック図、図2は、図1の文書画像処理装置で実行される、文書画像処理方法の実施例1における新規グループを作成する処理を示すフローチャート、図3は、文書画像処理方法の実施例1における文書画像入力の処理を示すフローチャート、図4は、図3における領域分割、属性付加の処理を示すフローチャート、図5は、文書画像処理方法の実施例1において生成されるキーワード管理テ−ブルを示す表、図6は、文書画像処理方法の実施例1で生成されたグループおよび階層の体系の例を示す図、図7は、文書画像処理方法の実施例1において新規グループを生成するための画面を示す図、図8は、図4のステップS404、405における領域分類の第1の処理ルールを示す図、図9は、図4のステップS404、405における領域分類の第2の処理ルールを示す図、図10は、図4のステップS404、405における領域分類の第3の処理ルールを示す図、図11は、図4のステップS404、405における領域分類の第4の処理ルールを示す図、図12は、図4のステップS404、405における領域分類の第5の処理ルールを示す図、図13は、図4のステップS404、405における領域分類の第6の処理ルールを示す図、図14は、文書画像処理装置の実施例1で読みだし可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図、図15は、文書画像処理方法の変形例において管理されるリンク数の表を示す表である。 FIG. 1 is a block diagram showing a first embodiment of a document image processing apparatus according to the present invention, and FIG. 2 creates a new group in the first embodiment of the document image processing method executed by the document image processing apparatus of FIG. 3 is a flowchart showing the document image input process in the first embodiment of the document image processing method, FIG. 4 is a flowchart showing the region dividing and attribute adding process in FIG. 3, and FIG. FIG. 6 is a table showing a keyword management table generated in the first embodiment of the document image processing method. FIG. 6 is a diagram showing an example of a group and hierarchy system generated in the first embodiment of the document image processing method. FIG. 8 shows a screen for generating a new group in the first embodiment of the document image processing method, and FIG. 8 shows a first processing rule for area classification in steps S404 and 405 of FIG. 9 is a diagram showing a second processing rule for area classification in steps S404 and 405 of FIG. 4, and FIG. 10 is a diagram showing a third processing rule for area classification in steps S404 and 405 of FIG. 11 is a diagram showing a fourth processing rule for area classification in steps S404 and 405 of FIG. 4, FIG. 12 is a diagram showing a fifth processing rule for area classification in steps S404 and 405 of FIG. FIG. 14 is a diagram showing a sixth processing rule for area classification in steps S404 and S405 in FIG. 4, and FIG. 14 is a memory of a storage medium for storing various data processing programs that can be read out in the first embodiment of the document image processing apparatus. FIG. 15 is a table for explaining the map, and FIG. 15 is a table showing a table of the number of links managed in the modification of the document image processing method.
図1において、本実施例の文書画像処理装置は、磁気ディスク等の外部記憶装置104およびイメージスキャナ108を備え、文書画像データを外部記憶装置104から読み込み、あるいは文書画像の原稿を直接イメージスキャナ108で読み取る。文書画像処理装置は全体制御のためのCPU101を備え、CPU101の制御プログラムはROM102に格納されている。イメージスキャナ108から入力された文書画像はRAM103に保持され、ROM102内の制御プログラムにより、分類、登録のための処理を実行する。分類、登録のためのキーワード管理テーブル等は制御プログラムとともにROM102に格納され、あるいは必要なキーワード管理テーブルごとに、外部記憶装置104からRAM103に読み込まれる。 In FIG. 1, the document image processing apparatus of this embodiment includes an external storage device 104 such as a magnetic disk and an image scanner 108, and reads document image data from the external storage device 104 or directly reads a document image document. Read with. The document image processing apparatus includes a CPU 101 for overall control, and a control program for the CPU 101 is stored in the ROM 102. The document image input from the image scanner 108 is held in the RAM 103, and processing for classification and registration is executed by the control program in the ROM 102. A keyword management table or the like for classification and registration is stored in the ROM 102 together with the control program, or is read from the external storage device 104 into the RAM 103 for each necessary keyword management table.
なお必要に応じ、文書画像処理に先立って入力された文書画像のノイズ除去等の前処理を実行するようにしてもよい。 If necessary, preprocessing such as noise removal of the input document image may be executed prior to the document image processing.
図1において、105はディスプレイ、106はキーボード、107はマウス等のポインティングデバイスである。また、109はネットワークインターフェースであり、図示しない遠隔地に存在する装置と通信し、プログラム、認識辞書、データ等を送受信し得る。 In FIG. 1, 105 is a display, 106 is a keyboard, and 107 is a pointing device such as a mouse. Reference numeral 109 denotes a network interface, which can communicate with a device located at a remote place (not shown) to transmit / receive a program, a recognition dictionary, data, and the like.
また、イメージスキャナ108やディスプレイ105は、文書画像処理装置に内蔵されるものに限らず、外部装置として外部インターフェースを介して文書画像処理装置に接続されることにより、本実施例を構成するようにしても構わない。 In addition, the image scanner 108 and the display 105 are not limited to those built in the document image processing apparatus, but are configured as external devices connected to the document image processing apparatus via an external interface so that this embodiment is configured. It doesn't matter.
本発明は汎用的なコンピュータでも実施可能であり、その場合、媒体等で提供される制御プログラムを外部記憶装置104に記憶し、オペレータの指示等によりCPU101で実行するように構成されてもよい。 The present invention can also be implemented by a general-purpose computer. In this case, a control program provided by a medium or the like may be stored in the external storage device 104 and executed by the CPU 101 according to an operator's instruction or the like.
次に図1の文書画像処理装置によって実行される文書画像処理方法を説明する。 Next, a document image processing method executed by the document image processing apparatus of FIG. 1 will be described.
図6は文書画像処理方法によって分類される文書画像のグループ、階層の体系の例を示す。 FIG. 6 shows an example of a system of groups and hierarchies of document images classified by the document image processing method.
図6では、「報告書」という最上位のグループの下に、システム部の報告書を登録する「システム部報告」のグループ、開発部の報告書を登録する「開発部」のグループが設けられている。「開発部」のグループには課ごとに、「開発課報告」と「評価課報告」のグループが設けられている。 In FIG. 6, a “system department report” group for registering a system department report and a “development department” group for registering a development department report are provided under the highest group “report”. ing. The “Development Department” group has a “Development Section Report” and an “Evaluation Section Report” group for each section.
図6のグループ、階層の体系は、オペレータのキーボード、ポインティングデバイスの操作によって、ディスプレイ105上に表示し得る。 The group and hierarchy system of FIG. 6 can be displayed on the display 105 by the operation of the operator's keyboard and pointing device.
新たなグループを生成する際には、図6の表示においてグループの属する階層を指定し、図7に示す入力ボックスによってグループのフォルダ名とキーワードを指定する。キーワードはグループの分類に使用される。 When creating a new group, the hierarchy to which the group belongs is specified in the display of FIG. 6, and the folder name and keyword of the group are specified by the input box shown in FIG. Keywords are used for group classification.
例えば図6の「報告書」のグループの下に、「管理課報告」のグループを新たに生成する場合、図6上で登録する階層を指定するとともに、図7の入力ボックスでフォルダ名「管理課報告」およびキーワード「管理課」を入力し、登録する。 For example, when a group of “Management Section Report” is newly generated under the “Report” group of FIG. 6, the hierarchy to be registered in FIG. 6 is specified, and the folder name “Management” is entered in the input box of FIG. Enter the section report and the keyword "management section" and register.
図2は、新規グループ生成の処理を示すフローチャートである。 FIG. 2 is a flowchart showing a new group generation process.
まずステップS201で、オペレータがグループの階層を指定するとともに、キーボード106やマウス107を用いてグループ作成を指示し、グループ名や分類のためのキーワードを入力する。 First, in step S201, the operator specifies a group hierarchy, instructs the group creation using the keyboard 106 and the mouse 107, and inputs a group name and a keyword for classification.
次にステップS202に進み、図5に示すキーワード管理テーブルを修正する。 In step S202, the keyword management table shown in FIG. 5 is corrected.
キーワード管理テーブルには、フォルダ名、キーワード、関連するグループ一覧、リンクが生成された文書画像、が登録される。 In the keyword management table, a folder name, a keyword, a related group list, and a document image in which a link is generated are registered.
例えば図6のグループ、階層体系に図7の新たなグループを追加した状態でのキーワード管理テーブルは、図5のように「管理課報告」のフォルダが作成されて追加されることになる。 For example, the keyword management table in the state where the new group of FIG. 7 is added to the group and hierarchy system of FIG. 6 is added by creating a “Management Section Report” folder as shown in FIG.
すなわち、報告書のグループは、フォルダ名が「報告書」、キーワードが「報告書」、関連グループが「システム部報告」、「開発部」、「管理課報告」である。システム部報告のグループは、フォルダ名が「システム部報告」、キーワードが「システム部」、関連グループが「報告書」である。開発部のグループは、フォルダ名が「開発部」、キーワードが「開発部」、関連グループが「報告書」、「開発部報告」、「評価課報告」である。管理課報告のグループは、フォルダ名が「管理課報告」、キーワードが「管理課」、関連グループが「報告書」である。開発課報告のグループは、フォルダ名が「開発課報告」、キーワードが「開発課」、関連グループが「開発部」である。評価課報告のグループは、フォルダ名が「評価課報告」、キーワードが「評価課」、関連グループが「開発部」である。さらに各グループについて、リンクが生成された文書画像の一覧が登録される。 That is, the report group has the folder name “Report”, the keyword “Report”, and the related groups “System Department Report”, “Development Department”, and “Management Section Report”. The group of the system department report has the folder name “system department report”, the keyword “system department”, and the related group “report”. In the group of the development department, the folder name is “development department”, the keyword is “development department”, the related groups are “report”, “development department report”, and “evaluation section report”. In the management section report group, the folder name is “management section report”, the keyword is “management section”, and the related group is “report”. The group of the development section report has the folder name “development section report”, the keyword “development section”, and the related group “development department”. In the evaluation section report group, the folder name is “evaluation section report”, the keyword is “evaluation section”, and the related group is “development department”. Further, for each group, a list of document images in which links are generated is registered.
例えば、システム部報告書のグループにはシステム部報告書1〜jに対するリンクが生成され、開発課報告書のグループには開発課告書1〜kに対するリンクが生成され、評価課報告書のグループには評価課報告書1〜mに対するリンクが生成される。 For example, links to system department reports 1 to j are generated in the system department report group, links to development department reports 1 to k are generated in the development section report group, and evaluation section report groups. The link for the evaluation section reports 1 to m is generated.
図3は、文書画像を入力する際の処理を示すフローチャートである。 FIG. 3 is a flowchart showing processing when inputting a document image.
まずステップS301において、イメージスキャナ108等により文書画像を読み取り、保存し、ステップS302で入力画像を領域分割し、分割されたそれぞれの領域に属性を付加する。ステップS302の処理は図4で詳述する。 First, in step S301, the document image is read and stored by the image scanner 108 or the like, and the input image is divided into regions in step S302, and attributes are added to the divided regions. The processing in step S302 will be described in detail with reference to FIG.
なお領域分割を行う前に、分割精度を高めるための画像処理を行ってもよい。 Note that image processing for improving the division accuracy may be performed before the region division.
領域分割および属性付加後の文書画像について、ステップS303においてキーワードを検索する領域を選択する。例えば、「タイトル」、「見出し」および「キャプション」などの属性が付与された領域内の文字をキーワードの検索対象とする。この選択条件はあらかじめ決めておくが、オペレータの操作で条件を変更する方法も採用し得る。これによって、キーワードが存在する可能性が高い領域を特定でき、検索処理速度を高めることができる。 In step S303, a region for searching for a keyword is selected for the document image after region division and attribute addition. For example, characters in an area to which attributes such as “title”, “heading”, and “caption” are assigned are searched for keywords. This selection condition is determined in advance, but a method of changing the condition by an operator's operation can also be adopted. As a result, it is possible to specify an area where a keyword is highly likely to exist, and to increase the search processing speed.
選択された領域について、ステップS304において文字認識を実行し、さらにステップS305によって該文字認識結果にキーワードが含まれるか検索する。なお、文字認識を行う際は、選択された領域に対応する元画像を用いて文字認識してもよいし、文字認識に適した解像度の画像に変換してから行っても構わない。また、本実施例のキーワード検索では、該文字認識結果がキーワードと部分一致するかどうか検索するものとするが、部分一致の代わりに完全一致としても構わない。 Character recognition is executed for the selected area in step S304, and further, in step S305, it is searched whether a keyword is included in the character recognition result. When character recognition is performed, character recognition may be performed using an original image corresponding to the selected region, or may be performed after conversion to an image having a resolution suitable for character recognition. Further, in the keyword search of the present embodiment, whether or not the character recognition result partially matches with the keyword is searched, but a complete match may be used instead of the partial match.
そして、該検索結果に基づいて、図5のキーワード管理テーブルにおいて、検索されたキーワードと一致したグループが識別されることになる。 Based on the search result, a group that matches the searched keyword is identified in the keyword management table of FIG.
ステップS306において、検索されたキーワードに関連付けられたグループに対して、保存されている入力文書画像へのリンク情報を追加する。 In step S306, link information to the stored input document image is added to the group associated with the searched keyword.
なお文字認識結果がキーワード管理テーブル内の複数のキーワードとマッチングした場合、各キーワードに対応する全てのグループについて、リンク情報を追加してもよい。この場合、同一の文書画像を、複数のグループから参照し得る。なお、図15に示すように、1個の文書画像が関連付けられたグループの個数をリンク数として登録しておくことにより、文書画像削除時の管理が容易になる。 If the character recognition result matches a plurality of keywords in the keyword management table, link information may be added for all groups corresponding to each keyword. In this case, the same document image can be referred to from a plurality of groups. As shown in FIG. 15, by registering the number of groups associated with one document image as the number of links, management at the time of document image deletion is facilitated.
文字認識結果とキーワードとのマッチングに関しては、文字認識の誤認識による分類漏れを防ぐため、キーワードが完全に一致しなくても、リンクを追加する方法も採用してもよい。例えば、「職業病」というキーワードに対し、認識結果が「識業病」となっていてもキーワードとマッチングしたと判断する。これによって文字認識の冗長度を高めることができる。 As for the matching between the character recognition result and the keyword, a method of adding a link may be adopted even if the keyword does not completely match in order to prevent omission of classification due to erroneous recognition of character recognition. For example, it is determined that the keyword “occupational disease” matches the keyword even if the recognition result is “intellectual disease”. Thereby, the redundancy of character recognition can be increased.
さらには、文字認識処理の過程において抽出された候補文字の組み合わせを作成し、これら候補文字の組み合わせから、キーワードとマッチングするものを抽出してもよい。これによって文字認識の冗長度をさらに高めることができる。 Further, a combination of candidate characters extracted in the process of character recognition processing may be created, and a candidate that matches a keyword may be extracted from the combination of candidate characters. This can further increase the redundancy of character recognition.
グループの分類方法として、1個のグループに複数のキーワードを対応させることも可能であり、この場合、複数のキーワードを「かつ」、「または」等の論理演算子で演算した結果によって指定してもよい。 As a group classification method, it is also possible to associate a plurality of keywords with one group. In this case, a plurality of keywords are designated by the result of operation with a logical operator such as “and” or “or”. Also good.
ステップS302の処理は、図4のフローチャートによって実行される。 The process of step S302 is executed according to the flowchart of FIG.
まずステップS401において、入力文書画像を間引く(縮小する)ために、所定のM×N画素単位の領域(M,Nは予め設定された整数。例えば、16画素×16画素単位の領域)に分割する。 First, in step S401, in order to thin out (reduce) the input document image, the input document image is divided into predetermined M × N pixel unit areas (M and N are preset integers, for example, 16 pixel × 16 pixel unit areas). To do.
ステップS402に進み、分割された各領域(例えば8×8画素なら、64画素中)において黒画素が全く存在しない領域を0(白)、黒画素が1画素でも存在すれば1(黒)として、間引き画像を作成する。 Proceeding to step S402, in each divided area (for example, 64 pixels if 8 × 8 pixels), an area where no black pixel exists is 0 (white), and if there is even one black pixel, 1 (black) is set. Create a thinned image.
例えば入力文書画像を8×8=64画素単位の領域に分割する。64画素の中に1画素でも黒画素があればその領域を黒とすることで、入力文書画像の1/64の画素数の間引き画像を生成する。 For example, the input document image is divided into regions of 8 × 8 = 64 pixels. If there is even one black pixel among the 64 pixels, the area is set to black, thereby generating a thinned image of 1/64 pixels of the input document image.
これによって、処理対象の領域が減少し、処理速度を高めることができる。 Thereby, the area to be processed is reduced, and the processing speed can be increased.
次にステップS403、S404、405において、所定のルールに基づいて同一属性の領域を連結して、小矩形を生成する。 Next, in steps S403, S404, and 405, regions having the same attribute are connected based on a predetermined rule to generate a small rectangle.
例えば、まず、間引き画像における連結画素を抽出して小矩形を生成すると、間引き画像を用いているため、近接するいくつかの文字は1つの小矩形として抽出される。さらに、所定ルールの第1として、小矩形群において、各小矩形の縦横比が大きく、隣接する矩形短辺相互が近接している場合、小矩形群(CL1〜CL3)を結合して新たな小矩形を生成し、文字行に分類(図8参照)。 For example, when a small rectangle is generated by extracting connected pixels in a thinned image, several adjacent characters are extracted as one small rectangle because the thinned image is used. Further, as a first predetermined rule, in the small rectangle group, when the aspect ratio of each small rectangle is large and adjacent rectangular short sides are close to each other, the small rectangle groups (CL1 to CL3) are combined to form a new one. Small rectangles are generated and classified into character lines (see FIG. 8).
所定ルールの第2として、文字行に分類された小矩形群において、各小矩形の短辺長さがほぼ同じで、小矩形がほぼ等間隔に並んでいる場合、小矩形群を「本文」(SN1)の属性を与える(図9参照)。 As a second predetermined rule, in the small rectangle group classified into the character line, when the short sides of the small rectangles are substantially the same and the small rectangles are arranged at almost equal intervals, the small rectangle group is referred to as “text”. The attribute of (SN1) is given (see FIG. 9).
所定ルールの第3として、グラフの上もしくは下に隣接した小矩形群(CAP)は「キャプション」の属性を与える(図10参照)。 As a third predetermined rule, a small rectangle group (CAP) adjacent to the top or bottom of the graph gives a “caption” attribute (see FIG. 10).
所定ルールの第4として、本文属性ではない文字行のうち、文書画像(DOC)の上部に存在し、かつ文字サイズが大きい小矩形群(T1)は「タイトル」の属性を与える(図11参照)。 As a fourth predetermined rule, among the character lines that are not the body attribute, the small rectangle group (T1) that exists above the document image (DOC) and has a large character size gives the attribute of “title” (see FIG. 11). ).
所定ルールの第5として、本文部ではない文字行のうち、本文部(SN1、SN2)に挟まれた位置に存在する小矩形群(T2)は「見出し」の属性を与える(図12参照)。 As a fifth predetermined rule, among the character lines that are not the body part, the small rectangle group (T2) that is located between the body parts (SN1, SN2) gives the attribute of “heading” (see FIG. 12). .
所定ルールの第6として、文字行と判断されなかった領域について、領域の大きさが小さければ「ノイズ」(N)と判断する(図13参照)。 As a sixth predetermined rule, an area that is not determined to be a character line is determined to be “noise” (N) if the area size is small (see FIG. 13).
文字行以外の領域については、「グラフ」や「イメージ」を分類するルールが設定されている。例えば、所定ルールの第7として、ハーフトーンの写真領域や、不定形の図面領域は「イメージ」の属性を与え、所定ルールの第8として、主に表、図形等を含む線画領域を「グラフ」の属性を与える。 Rules for classifying “graphs” and “images” are set for areas other than character lines. For example, as a seventh rule, a halftone photo area or an irregular drawing area is given an “image” attribute. As a eighth rule, a line drawing area mainly including a table, a figure, etc. Attribute.
なお領域分類の方法は以上に限定されるものではなく、その他の領域分類手法を用いてもよい。 The region classification method is not limited to the above, and other region classification methods may be used.
ステップS403においては、第1のルールに基づいて、各領域を文字行の領域とその他の領域に分類する。 In step S403, each area is classified into a character line area and other areas based on the first rule.
ステップS404においては、第2〜第5のルールに基づいて、「本文」、「キャプション」、「タイトル」、「見出し」の小矩形群を生成し、これらに分類されなかった領域をその他に分類する。 In step S404, based on the second to fifth rules, small rectangles of “text”, “caption”, “title”, and “heading” are generated, and regions that are not classified into these are classified into others. To do.
ステップS405において、文字行と判断されなかった領域については、第6のルールに基づいて「ノイズ」を抽出し、また第7、第8のルールに基づいて「グラフ」および「イメージ」を分類する。 In step S405, “noise” is extracted based on the sixth rule, and “graph” and “image” are classified based on the seventh and eighth rules for the area that is not determined to be a character line. .
以上の分類結果に基づき、小矩形に、ステップS406で「本文」、「タイトル」、「キャプション」、「見出し」、「その他の文字行」、「グラフ」、「イメージ」の属性を付加する。「ノイズ」についてはステップS407で削除する。 Based on the above classification results, attributes of “text”, “title”, “caption”, “headline”, “other character line”, “graph”, and “image” are added to the small rectangle in step S406. “Noise” is deleted in step S407.
このようにして分割した領域に属性が付与されるので、先に説明したようにステップS303において属性に基づき選択した領域に基づき、所望の属性を有する領域を文字認識してキーワードを得ることができるようになる。 Since the attribute is given to the divided area in this way, as described above, based on the area selected based on the attribute in step S303, the keyword having the desired attribute can be recognized and the keyword can be obtained. It becomes like this.
以上説明したように、実施例1によれば、所望の属性を有する領域の文字認識結果に基づいて複数のグループに分類が可能であり、オペレータの期待と異なるグループへ分類される可能性が減少する効果がある。また、文字認識で誤認識が生じても、キーワードとのマッチングが行われ、漏れずに分類される効果がある。 As described above, according to the first embodiment, it is possible to classify into a plurality of groups based on the character recognition result of a region having a desired attribute, and the possibility of being classified into a group different from the operator's expectation is reduced. There is an effect to. Further, even if erroneous recognition occurs in character recognition, matching with a keyword is performed, and there is an effect that classification is performed without omission.
図14は、本発明に係る文書画像処理装置で実行可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを示す図である。 FIG. 14 is a diagram showing a memory map of a storage medium for storing various data processing programs that can be executed by the document image processing apparatus according to the present invention.
メモリマップにおいて、「ディレクトリ情報」には各プログラム、データのディレクトリの情報が格納され、「第1のデータ処理プログラム」には図2のフローチャートの処理プログラムが格納され、「第1のデータ処理プログラム」には図3、図4のフローチャートの処理プログラムが格納さている。 In the memory map, the directory information of each program and data is stored in the “directory information”, the processing program of the flowchart of FIG. 2 is stored in the “first data processing program”, and the “first data processing program” ”Stores the processing program of the flowcharts of FIGS. 3 and 4.
なお、特に図示しないが、各種プログラムに従属するデータ、例えば認識辞書なども上記ディレクトリにおいて管理され、また、各種プログラムをコンピュータにインストールするためのプログラム等が記憶される場合もある。 Although not specifically illustrated, data depending on various programs, such as a recognition dictionary, is also managed in the directory, and a program for installing various programs in a computer may be stored.
次に、本発明に係る文書画像処理装置および文書処理方法の実施例2を図面に基づいて説明する。 Next, a second embodiment of the document image processing apparatus and the document processing method according to the present invention will be described with reference to the drawings.
図16は、文書画像処理方法の実施例2において生成されるキーワード管理テ−ブルを示す表、図17は、文書画像処理方法の実施例2における文書画像入力の処理を示すフローチャート、図18は、文書画像処理方法の実施例2における文書画像削除の処理を示すフローチャートである。
FIG. 16 is a table showing keyword management tables generated in the second embodiment of the document image processing method, FIG. 17 is a flowchart showing the document image input process in the second embodiment of the document image processing method, and FIG. FIG. 10 is a flowchart showing document image deletion processing in
実施例2では、複数のオペレータそれぞれが独立に文書画像を分類するキーワードやグループを設定することができる。 In the second embodiment, each of a plurality of operators can set a keyword and a group for classifying document images independently.
実施例2の文書画像処理装置は、実施例1と同様、図1のブロック図で表現される。 The document image processing apparatus according to the second embodiment is expressed by the block diagram of FIG.
図16において、実施例2で生成されるキーワード管理テーブルは、各キーワードに対応するオペレータ、グループ(フォルダ名)を管理する。 In FIG. 16, the keyword management table generated in the second embodiment manages operators and groups (folder names) corresponding to each keyword.
図16のキーワード管理テーブルにおいて、オペレータ1が2つのグループ「フォルダ11」と「フォルダ12」を作成し、「フォルダ11」にキーワード「A」を関連付け、「フォルダ12」にキーワード「C」を関連付け、一方、オペレータ2が3つのグループ「フォルダ21」、「フォルダ22」、「フォルダ23」を作成し、「フォルダ21」、「フォルダ22」、「フォルダ23」にキーワード「B」、「C」、「D」をそれぞれ関連付けている。
In the keyword management table of FIG. 16, the
すなわちオペレータを1つの属性としてキーワード管理テーブルを管理するので、実施例1よりも多様な検索、登録態様を採用し得る。 That is, since the keyword management table is managed with the operator as one attribute, various search and registration modes can be adopted as compared with the first embodiment.
図17のフローチャートにおいて、文書画像の入力処理は以下の処理により実行される。 In the flowchart of FIG. 17, the document image input process is executed by the following process.
図17のフローチャートにおけるステップS401〜S404は、実施例1のステップ301〜S304(図3)と同様であり、説明を省略する。
Steps S401 to S404 in the flowchart of FIG. 17 are the same as
ステップS405においては、文字認識結果に対する検索キーワードを、キーワード管理テーブル全体とせずに、キーワード範囲を限定することが可能である。つまり、分類先のグループを限定できることになる。 In step S405, the keyword range can be limited without making the search keyword for the character recognition result the entire keyword management table. That is, the group of classification destinations can be limited.
すなわち、入力された文書画像の分類範囲を、例えばオペレータ2に限定し得る。これによって、オペレータ2が設定したキーワードのみが検索対象となり、オペレータ2個人で管理したい帳票の管理等に有効である。また、全てのオペレータで共有すべき文書画像を管理する場合、全てのキーワードを検索範囲とする。また、オペレータの数人で共有すべき文書画像を管理する場合、その数人のオペレータそれぞれのキーワードを検索範囲とする。
That is, the classification range of the input document image can be limited to the
次に、ステップS406において、ステップS405で設定された検索範囲に基づいてキーワードを検索し、ステップS407において、マッチングしたキーワードに関連付けられたグループすべてにリンク情報を付加するとともに、実施例1の図15同様、文書画像にリンク数の情報を記憶しておく。 Next, in step S406, a keyword is searched based on the search range set in step S405. In step S407, link information is added to all groups associated with the matched keyword, and FIG. Similarly, information on the number of links is stored in the document image.
例えば、キーワード「C」が検索されたとき、「フォルダ12」と「フォルダ22」にリンク情報が追加され、リンク数を「2」増やす。 For example, when the keyword “C” is searched, link information is added to “folder 12” and “folder 22”, and the number of links is increased by “2”.
図18のフローチャートにおいて、オペレータが文書画像を削除する場合、以下の処理が実行される。 In the flowchart of FIG. 18, when the operator deletes a document image, the following processing is executed.
例えば、「フォルダ12」および「フォルダ22」にリンクされた前記文書画像(図16)はリンク数が「2」であるが、ステップS501において、オペレータがその文書画像のリンクを「フォルダ22」から削除したとき、ステップS502において、文書画像処理装置はその文書画像のリンク数が「1」であるか否か判断する。 For example, the document image (FIG. 16) linked to “Folder 12” and “Folder 22” has the number of links “2”. In step S501, the operator links the document image from “Folder 22”. When deleted, in step S502, the document image processing apparatus determines whether or not the number of links of the document image is “1”.
ここでは、リンク数「2」であるので、ステップS503に進み、文書画像処理装置は「フォルダ22」における文書画像に対するリンク情報を消すとともに、文書画像のリンク数を「1」だけ減らして「1」とする。 Here, since the number of links is “2”, the process advances to step S503, and the document image processing apparatus deletes the link information for the document image in “folder 22” and reduces the number of links of the document image by “1” to “1”. "
一方、文書画像のリンク数が「1」であったときは、ステップS501のグループからの削除によりリンク数が「0」となるので、ステップS502からステップS504に進み、リンク情報とともに文書画像そのものも削除する。 On the other hand, when the number of links of the document image is “1”, the number of links becomes “0” due to deletion from the group in step S501, and thus the process proceeds from step S502 to step S504. delete.
実施例2では、複数のオペレータが個別にキーワードを設定でき、それぞれのグループに文書画像を分類することができる。 In the second embodiment, keywords can be individually set by a plurality of operators, and document images can be classified into respective groups.
また、複数グループへのリンクをリンク数によって管理するので、各グループのための文書画像コピーを生成する必要がなく、記憶領域を節約し得る。 Further, since links to a plurality of groups are managed by the number of links, it is not necessary to generate a document image copy for each group, and a storage area can be saved.
なお、実施例2では、複数のオペレータ(利用者)それぞれに対してキーワードとフォルダを設定するものとしたが、例えば、前記オペレータの代わりに所属部署(所属グループ)それぞれに対して設定されるものとしても構わない。 In the second embodiment, a keyword and a folder are set for each of a plurality of operators (users). For example, a keyword and a folder are set for each department (affiliation group) instead of the operator. It does not matter.
本発明に係る文書画像処理装置、文書画像処理方法は、登録時にオペレータの煩雑な操作を要することなく、領域分割を実行するとともに、必要な属性のみを文字認識することで、処理時間を短縮する。また、分類に有効な文字列が含まれる部分のみを処理対象とするので、高精度に文書画像を分類し得る。 The document image processing apparatus and the document image processing method according to the present invention reduce the processing time by performing region segmentation and recognizing only necessary attributes without requiring a complicated operation at the time of registration. . In addition, since only a portion including a character string effective for classification is processed, document images can be classified with high accuracy.
101 CPU
102 ROM
103 RAM
104 外部記憶装置
105 ディスプレイ
106 キーボード
107 ポインティングデバイス
108 スキャナ部
109 ネットワークインターフェース
101 CPU
102 ROM
103 RAM
104 External storage device 105 Display 106 Keyboard 107 Pointing device 108 Scanner unit 109 Network interface
Claims (20)
前記文書画像における所定属性の領域の画像からテキスト情報を取得する文字認識手段と、
前記取得したテキスト情報内に前記キーワードが含まれるか否か検索するキーワード検索手段と、
前記キーワード検索手段による検索結果に基づいて、前記文書画像を少なくともいずれかのグループに分類する分類手段と、
を備えた文書画像処理装置。 A keyword management unit that associates and manages keywords for classifying document images into a plurality of groups and a group to be classified;
Character recognition means for acquiring text information from an image of a predetermined attribute area in the document image;
Keyword search means for searching whether or not the keyword is included in the acquired text information;
Classification means for classifying the document images into at least one group based on a search result by the keyword search means;
A document image processing apparatus comprising:
ことを特徴とする請求項1記載の文書画像処理装置。 The keyword search means searches for keywords managed by the keyword management means by limiting the group to be classified.
The document image processing apparatus according to claim 1, wherein:
前記キーワード検索手段は、対象となるオペレータを指定することにより、前記分類先のグループを限定して、前記キーワードを検索することを特徴とする請求項2に記載の文書画像処理装置。 The keyword management means manages an operator in association with the keyword and the group,
The document image processing apparatus according to claim 2, wherein the keyword search unit searches for the keyword by specifying a target operator to limit the group to be classified.
該文書画像をいずれかのグループから削除すべきときに、該グループにおける該文書画像のリンク情報を削除するとともに、該文書画像の該リンク数を減じ、該リンク数が「0」となったときに該文書画像を削除する削除手段を、
さらに備えることを特徴とする請求項1乃至8のいずれかに記載の文書画像処理装置。 The classification means associates the document image with a link number indicating the number of groups to which the document image belongs,
When the document image is to be deleted from any group, the link information of the document image in the group is deleted, the number of links of the document image is reduced, and the number of links becomes “0” Delete means for deleting the document image,
The document image processing apparatus according to claim 1, further comprising:
文書画像における所定属性の領域の画像からテキスト情報を取得する文字認識ステップと、
前記取得したテキスト情報内に前記キーワードが含まれるか否か検索するキーワード検索ステップと、
前記キーワード検索ステップによる検索結果に基づいて、前記文書画像を少なくともいずれかのグループに分類する分類ステップと、
を備えた文書画像処理方法。 A document image processing method for associating a keyword for classifying a document image into a plurality of groups and a group to be classified, and classifying the document image into a group based on the keyword,
A character recognition step of acquiring text information from an image of a predetermined attribute area in the document image;
A keyword search step for searching whether or not the keyword is included in the acquired text information;
A step of classifying the document images into at least one group based on a search result obtained by the keyword search step;
A document image processing method comprising:
ことを特徴とする請求項10記載の文書画像処理方法。 The keyword search step searches the keywords managed in the keyword management step by limiting the group to be classified.
The document image processing method according to claim 10.
前記キーワード検索ステップは、対象となるオペレータを指定することにより、前記分類先のグループを限定して、前記キーワードを検索することを特徴とする請求項11に記載の文書画像処理方法。 The document image processing method manages an operator in association with the keyword and the group,
12. The document image processing method according to claim 11, wherein the keyword searching step searches for the keyword by specifying a target operator to limit the group to be classified.
該文書画像をいずれかのグループから削除すべきときに、該グループにおける該文書画像のリンク情報を削除するとともに、該文書画像の該リンク数を減じ、該リンク数が「0」となったときに該文書画像を削除する削除ステップを、
さらに備えることを特徴とする請求項10乃至17のいずれかに記載の文書画像処理方法。 The classification step associates the document image with a link number indicating the number of groups to which the document image belongs,
When the document image is to be deleted from any group, the link information of the document image in the group is deleted, the number of links of the document image is reduced, and the number of links becomes “0” A deletion step of deleting the document image
The document image processing method according to claim 10, further comprising:
A computer-readable storage medium storing the computer-executable program according to claim 19.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003298566A JP2005071014A (en) | 2003-08-22 | 2003-08-22 | Document image processor, document image processing method, program and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003298566A JP2005071014A (en) | 2003-08-22 | 2003-08-22 | Document image processor, document image processing method, program and storage medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005071014A true JP2005071014A (en) | 2005-03-17 |
Family
ID=34404031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003298566A Withdrawn JP2005071014A (en) | 2003-08-22 | 2003-08-22 | Document image processor, document image processing method, program and storage medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005071014A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1702949A1 (en) | 2005-03-14 | 2006-09-20 | Seiko Epson Corporation | Ink cartridge and method for producing the same |
JP2008176625A (en) * | 2007-01-19 | 2008-07-31 | Seiko Epson Corp | Character recognition result management apparatus and method, and computer program |
JP2008181506A (en) * | 2006-12-28 | 2008-08-07 | Canon Marketing Japan Inc | Information processor, control method, information processing system, program and computer-readable storage medium |
US7860316B2 (en) | 2005-11-18 | 2010-12-28 | Samsung Electronics Co., Ltd. | Image forming apparatus that automatically creates an index and a method thereof |
CN113815332A (en) * | 2021-10-28 | 2021-12-21 | 李贝贝 | Information processing method based on big data |
CN115297215A (en) * | 2021-08-05 | 2022-11-04 | 京瓷办公信息系统株式会社 | Image processing apparatus and image forming apparatus |
-
2003
- 2003-08-22 JP JP2003298566A patent/JP2005071014A/en not_active Withdrawn
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1702949A1 (en) | 2005-03-14 | 2006-09-20 | Seiko Epson Corporation | Ink cartridge and method for producing the same |
US7860316B2 (en) | 2005-11-18 | 2010-12-28 | Samsung Electronics Co., Ltd. | Image forming apparatus that automatically creates an index and a method thereof |
US8369623B2 (en) | 2005-11-18 | 2013-02-05 | Samsung Electronics Co., Ltd. | Image forming apparatus that automatically creates an index and a method thereof |
JP2008181506A (en) * | 2006-12-28 | 2008-08-07 | Canon Marketing Japan Inc | Information processor, control method, information processing system, program and computer-readable storage medium |
JP2009134755A (en) * | 2006-12-28 | 2009-06-18 | Canon Marketing Japan Inc | Information processor, control method thereof, information processing system, program, and computer readable recording medium |
JP2008176625A (en) * | 2007-01-19 | 2008-07-31 | Seiko Epson Corp | Character recognition result management apparatus and method, and computer program |
CN115297215A (en) * | 2021-08-05 | 2022-11-04 | 京瓷办公信息系统株式会社 | Image processing apparatus and image forming apparatus |
CN115297215B (en) * | 2021-08-05 | 2024-05-14 | 京瓷办公信息系统株式会社 | Image processing device and image forming device |
CN113815332A (en) * | 2021-10-28 | 2021-12-21 | 李贝贝 | Information processing method based on big data |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4181892B2 (en) | Image processing method | |
JP5059545B2 (en) | Image processing apparatus and image processing method | |
JP2816241B2 (en) | Image information retrieval device | |
US7876471B2 (en) | Image processing apparatus, control method and program thereof which searches for corresponding original electronic data based on a paper document | |
US20080263036A1 (en) | Document search apparatus, document search method, program, and storage medium | |
US9710524B2 (en) | Image processing apparatus, image processing method, and computer-readable storage medium | |
JP5665125B2 (en) | Image processing method and image processing system | |
US20090183115A1 (en) | Document searching apparatus, document searching method, and computer-readable recording medium | |
JP4785655B2 (en) | Document processing apparatus and document processing method | |
JP2007317034A (en) | Image processing apparatus, image processing method, program, and recording medium | |
US8090728B2 (en) | Image processing apparatus, control method thereof, and storage medium that stores program thereof | |
JP2009193356A (en) | Image processing apparatus, image processing method, program, and storage medium | |
US20060008113A1 (en) | Image processing system and image processing method | |
JP2007049388A (en) | Image processing apparatus and control method thereof, and program | |
JP4261988B2 (en) | Image processing apparatus and method | |
US8023735B2 (en) | Image processing apparatus for extracting representative characteristic from image data and storing image data to be associated with representative characteristic | |
US8181108B2 (en) | Device for editing metadata of divided object | |
JP2009211554A (en) | Image processor, image processing method, computer program, and storage medium | |
JP2005071014A (en) | Document image processor, document image processing method, program and storage medium | |
JP2601111B2 (en) | Document element retrieval device | |
JP2022185874A (en) | Information processing device, information processing system, information processing method, and program | |
JP2004334340A (en) | Image processing method and device | |
JP2008257537A (en) | Information registration device, information retrieval device, information retrieval system, information registration program, and information retrieval program | |
JP6012700B2 (en) | Information processing apparatus, information processing method, information processing system, and computer program | |
JP2009303149A (en) | Image processing apparatus, image processing method and computer control program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060606 |
|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20061107 |