JP2007286710A - Information processor and information processing method, and computer program - Google Patents

Information processor and information processing method, and computer program Download PDF

Info

Publication number
JP2007286710A
JP2007286710A JP2006110502A JP2006110502A JP2007286710A JP 2007286710 A JP2007286710 A JP 2007286710A JP 2006110502 A JP2006110502 A JP 2006110502A JP 2006110502 A JP2006110502 A JP 2006110502A JP 2007286710 A JP2007286710 A JP 2007286710A
Authority
JP
Japan
Prior art keywords
color
marker
registered
area
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006110502A
Other languages
Japanese (ja)
Inventor
Etsuko Ito
悦子 伊藤
Atsushi Ito
篤 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006110502A priority Critical patent/JP2007286710A/en
Publication of JP2007286710A publication Critical patent/JP2007286710A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide processing constitution for a mark index that discriminates a correct marker color from a document where correct and incorrect marker colors are mixed and registers it. <P>SOLUTION: An information processor is configured to analyze a marker color from an added document given an additional entry using a color marker and perform property judgment processing for document information based upon the marker color through a regular marker color judgment section 404, and the information processor discriminates the correct marker color by analyzing a color region having contact regions of a plurality of different colors. After recording of a marker color which is recorded by mistake, the correct marker color is recorded according to a predetermined rule, and analytic algorithm corresponding to the recording rule is applied to discriminate the correct marker color. With this constitution, efficient and accurate character string extraction/attribute imparting processing using the marker pen can be performed. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、情報処理装置、および情報処理方法、並びにコンピュータ・プログラムに関する。さらに詳細には、本発明は、色マーカーによるインデックス付与として行なわれるマーカーペンによる文字列抽出/属性付与処理を実行する情報処理装置、および情報処理方法、並びにコンピュータ・プログラムに関する。   The present invention relates to an information processing apparatus, an information processing method, and a computer program. More specifically, the present invention relates to an information processing apparatus, an information processing method, and a computer program for executing character string extraction / attribute assignment processing with a marker pen performed as index assignment with a color marker.

文書ドキュメントに対するデータ処理分野において、例えば文書画像データから文書領域毎の属性を取得し、属性毎に画像領域を分類した後に、文字認識処理(OCR:Optical Character Recognition)を行い、分類されたテキストデータを生成してデータベースに保存するという処理がインデックス抽出処理として知られている。このインデックス抽出処理を開示した従来技術としては、例えば特許文献1,2がある。   In the field of data processing for document documents, for example, attributes for each document area are obtained from document image data, and after classifying the image areas for each attribute, character recognition processing (OCR: Optical Character Recognition) is performed to classify the text data. The process of generating and storing in a database is known as an index extraction process. For example, Patent Documents 1 and 2 are known as prior arts that disclose this index extraction processing.

また、予め決められた文書フォームを規定し、この文書フォームに追記可能な追記領域を設定し、その指定追記領域に、位置情報を埋め込み、ドキュメントからの追記情報抽出時に、原本との照合を不要として効率的に追記情報を取得する構成が特許文献3に記載されている。さらに、ドキュメントの分割領域に、領域を識別する情報を埋め込み、追記情報の抽出時に領域から効率的に追記情報の抽出を行なう処理構成が特許文献4に記載されている。
特開平5−342326号公報 特開2002−123815号公報 特開2003−271942号公報 特開2003−18393号公報
Also, a pre-determined document form is defined, a write-once area that can be added to this document form is set, position information is embedded in the designated write-on area, and verification with the original is not required when extracting postscript information from the document Patent Document 3 describes a configuration for efficiently acquiring additional write information. Further, Patent Document 4 discloses a processing configuration in which information for identifying a region is embedded in a divided region of a document, and additional information is efficiently extracted from the region when additional information is extracted.
JP-A-5-342326 JP 2002-123815 A JP 2003-271842 A JP 2003-18393 A

上述したように、ドキュメントに含まれる様々なデータを種類(属性)毎に区分、いわゆるカテゴライズしてデータベースなどの記憶部に属性を対応付けたデータとして分類保存する様々な技術が提案されている。しかし、文書ドキュメントに含まれる文書領域の属性判定処理の自動化には限界があり、属性判定および設定処理自体は、人(オペレータ)による処理を必要としているのが現状である。   As described above, various techniques have been proposed in which various data included in a document are classified according to type (attribute), that is, categorized and classified and stored as data in which attributes are associated with a storage unit such as a database. However, there is a limit to automating the attribute determination process for the document area included in the document document, and the attribute determination and setting process itself requires processing by a person (operator).

オペレータの判断によって属性判定を行なう場合、例えば、日付データ部については赤のマーカー、文書名データ部については青のマーカーで色づけをするなど、予め設定されたマーカー色と属性との対応情報に基づいてオペレータが様々な色のマーカーを利用して、ドキュメント上の文字に対してマーカー色の設定を行う。   When attribute determination is performed based on the operator's determination, for example, the date data portion is colored with a red marker, and the document name data portion is colored with a blue marker, based on correspondence information between preset marker colors and attributes. The operator uses the markers of various colors to set the marker colors for the characters on the document.

次に、マーカー色の設定されたドキュメントをカラースキャナによって読み取り、ドキュメント上のマーカー色を判別して、そのマーカー色の付与された文字情報をOCR(Optical Character Recognition)によって解読する。さらに、解読文字情報をテキストデータとしてデータベースに格納する際、テキストデータに対応する属性値として、マーカー色から判別される属性、例えば日付、文書名などの属性情報を対応付けて格納する。この処理はマーカーペンによる文字列抽出/属性付与処理と呼ばれる。   Next, the document in which the marker color is set is read by the color scanner, the marker color on the document is discriminated, and the character information to which the marker color is added is decoded by OCR (Optical Character Recognition). Further, when the decrypted character information is stored as text data in the database, an attribute discriminated from the marker color, for example, attribute information such as date and document name is stored in association with the attribute value corresponding to the text data. This process is called a character string extraction / attribute assignment process using a marker pen.

このようなマーカーペンによる文字列抽出/属性付与処理において、マーカー色の設定処理は、オペレータによって実行される。従って、マークミスを皆無にすることは不可能である。マークミスに気づいた場合、オペレータはマーカーによる追記のない原稿を再出力して再び全てのマーク設定をやり直すか、またはPCなどのディスプレイにスキャナ読み取り画像を表示して、原稿画像を1枚1枚検閲して、誤りをチェックして、データベースに格納される属性値を適宜変更するなどの処理を実行する必要があった。このように、マークミスに対応する処理は、オペレータによる再処理や検証処理が必要となり、マーカーペンによる文字列抽出/属性付与処理の効率低下を招いていた。   In such character string extraction / attribute assignment processing using the marker pen, the marker color setting processing is executed by the operator. Therefore, it is impossible to eliminate all mark mistakes. If the operator notices a mark error, the operator re-outputs the original document without any additional writing by the marker and redoes all the mark settings again, or displays the scanned image on a display such as a PC and prints the original image one by one. It was necessary to perform processing such as censoring, checking for errors, and appropriately changing attribute values stored in the database. As described above, the processing corresponding to the mark mistake requires reprocessing or verification processing by the operator, which causes a reduction in efficiency of the character string extraction / attribute assignment processing by the marker pen.

本発明は、上述の問題点に鑑みてなされたものであり、属性設定処理として実行される色マーカーによる追記設定に誤りが発生した場合、マークミスのあるドキュメントをそのまま利用して正しいマーカーで再追記を行い、この再追記ドキュメントを適用して、正しい属性値を解析する処理を効率的に実行可能とした情報処理装置、および情報処理方法、並びにコンピュータ・プログラムを提供することを目的とする。   The present invention has been made in view of the above-described problems. When an error occurs in the additional writing setting by the color marker executed as the attribute setting process, the document with a mark mistake is used as it is and the correct marker is used again. An object of the present invention is to provide an information processing apparatus, an information processing method, and a computer program that can perform additional processing and efficiently execute processing for analyzing correct attribute values by applying the re-added document.

本発明の第1の側面は、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理装置であり、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上の色情報を取得する色領域抽出部と、前記色領域抽出部において抽出された色領域中、複数の異なる色の接触領域を持つ色領域の解析を実行して、正しいマーカー色を識別する正規マーカー色判定部と、前記正規マーカー色判定部において決定された正規マーカー色に対応して登録された属性を、該マーカーの設定領域の記録情報に対応する属性と判定する属性判定部とを有することを特徴とする情報処理装置にある。   A first aspect of the present invention is an information processing apparatus that executes an attribute determination process for document information based on a marker color added to a document. The information processing apparatus inputs a postscript document with a marker color added to the document, and A color area extraction unit that obtains the upper color information and a color area having a plurality of different color contact areas in the color area extracted by the color area extraction unit are analyzed to identify the correct marker color A normal marker color determination unit; and an attribute determination unit that determines an attribute registered corresponding to the normal marker color determined by the normal marker color determination unit as an attribute corresponding to the recording information of the marker setting area. The information processing apparatus is characterized by comprising:

さらに、本発明の情報処理装置の一実施態様において、前記正規マーカー色判定部は、前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色と、登録されていない非登録色のいずれであるかを判別する登録色判定部と、混色による非登録色について、混色の元色である登録色を解析する元色部解析部と、登録色領域と、混色領域を統合する統合処理部と、前記統合処理部の統合結果に基づいて、正規マーカー色を選択するマーカー色選択部とを有する構成であることを特徴とする。   Furthermore, in one embodiment of the information processing apparatus according to the present invention, the regular marker color determination unit includes a registered color registered in advance as a write-once marker color for colors included in the color region extracted by the color region extraction unit. A non-registered non-registered color, a registered color determining unit, a non-registered color by mixed color, a primary color part analyzing unit for analyzing the registered color that is the original color of the mixed color, and a registered color area And an integrated processing unit that integrates the mixed color areas, and a marker color selection unit that selects a normal marker color based on the integration result of the integrated processing unit.

さらに、本発明の情報処理装置の一実施態様において、前記マーカー色選択部は、前記統合処理部において生成された複数の統合領域について、色領域内の文字列方向の長さを比較し、より長い統合領域に対応するマーカー色を正規マーカー色として選択する処理を実行する構成であることを特徴とする。   Furthermore, in one embodiment of the information processing device of the present invention, the marker color selection unit compares the lengths in the character string direction in the color region for the plurality of integrated regions generated by the integration processing unit, and more It is the structure which performs the process which selects the marker color corresponding to a long integrated area | region as a regular marker color.

さらに、本発明の情報処理装置の一実施態様において、前記情報処理装置は、予め追記マーカー色として登録された登録色に基づいて生成される混色についての登録情報としての混色情報テーブルを記憶部に保持し、前記元色部解析部は、前記混色情報テーブルに基づいて、混色による非登録色について、混色の元色である登録色を解析する処理を実行する構成であることを特徴とする。   Furthermore, in an embodiment of the information processing apparatus according to the present invention, the information processing apparatus stores in the storage unit a color mixture information table as registration information on color mixture generated based on a registered color registered in advance as a write-once marker color. The original color part analysis unit is configured to execute a process of analyzing a registered color which is a mixed color original color for a non-registered color due to the mixed color based on the mixed color information table.

さらに、本発明の情報処理装置の一実施態様において、前記正規マーカー色判定部は、前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色と、登録されていない非登録色のいずれであるかを判別する登録色判定部と、非登録色領域を登録色領域に統合する統合処理部と、前記統合処理部の統合結果としての統合領域を構成する登録色を正規マーカー色として選択するマーカー色選択部とを有する構成であることを特徴とする。   Furthermore, in one embodiment of the information processing apparatus according to the present invention, the regular marker color determination unit includes a registered color registered in advance as a write-once marker color for colors included in the color region extracted by the color region extraction unit. A registration color determination unit that determines which of the non-registered non-registered colors, an integrated processing unit that integrates the non-registered color region into the registered color region, and an integrated region as an integration result of the integrated processing unit And a marker color selection unit that selects a registered color to be configured as a normal marker color.

さらに、本発明の情報処理装置の一実施態様において、前記正規マーカー色判定部は、前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色の領域を抽出する登録色判定部と、前記登録色判定部において抽出された登録色領域の面積または位置を解析し、解析情報に基づいて正規マーカー色を選択するマーカー色選択部とを有する構成であることを特徴とする。   Furthermore, in one embodiment of the information processing apparatus according to the present invention, the regular marker color determination unit has a registered color registered in advance as a write-once marker color for a color included in the color region extracted by the color region extraction unit. A configuration having a registered color determination unit that extracts a region, and a marker color selection unit that analyzes the area or position of the registered color region extracted by the registered color determination unit and selects a normal marker color based on the analysis information It is characterized by being.

さらに、本発明の情報処理装置の一実施態様において、前記マーカー色選択部は、前記登録色判定部において抽出された登録色領域中、面積が小さい登録色領域、または、前記登録色判定部において抽出された登録色領域中、より外周に記録位置のある登録色領域を構成する登録色を正規マーカー色として選択する処理を実行する構成であることを特徴とする。   Furthermore, in an embodiment of the information processing apparatus of the present invention, the marker color selection unit includes a registered color region having a small area in the registered color region extracted by the registered color determination unit, or the registered color determination unit. In the extracted registered color area, a process for selecting a registered color constituting a registered color area having a recording position on the outer periphery as a normal marker color is executed.

さらに、本発明の情報処理装置の一実施態様において、前記情報処理装置は、さらに、前記色領域抽出部において抽出された色領域上または色領域近傍にある記号の検出処理、または前記色領域の形状の解析に基づいて、該色領域に設定されたマーカー色の有効性判定処理を行なう有効性判定部を有することを特徴とする。   Furthermore, in an embodiment of the information processing apparatus of the present invention, the information processing apparatus further detects a symbol on or near the color area extracted by the color area extraction unit, or It is characterized by having an effectiveness determination unit that performs an effectiveness determination process for the marker color set in the color region based on the analysis of the shape.

さらに、本発明の第2の側面は、情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理方法であり、色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上の色情報を取得する色領域抽出ステップと、正規マーカー色判定部において、前記色領域抽出部において抽出された色領域中、複数の異なる色の接触領域を持つ色領域の解析を実行して、正しいマーカー色を識別する正規マーカー色判定ステップと、属性判定部において、前記正規マーカー色判定部において決定された正規マーカー色に対応して登録された属性を、該マーカーの設定領域の記録情報に対応する属性と判定する属性判定ステップとを有することを特徴とする情報処理方法にある。   Furthermore, a second aspect of the present invention is an information processing method for executing an attribute determination process for document information based on a marker color added to a document in an information processing apparatus. A color region extraction step of inputting a postscript document in which a marker color is added and acquiring color information on the postscript document, and a normal marker color determination unit, and a plurality of different colors among the color regions extracted by the color region extraction unit A normal marker color determination step for identifying a correct marker color by executing an analysis of a color region having a contact area of the image, and registering the attribute determination unit corresponding to the normal marker color determined by the normal marker color determination unit And an attribute determination step for determining the attribute as an attribute corresponding to the recording information in the setting area of the marker In the information processing method characterized by.

さらに、本発明の情報処理方法の一実施態様において、前記正規マーカー色判定ステップは、前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色と、登録されていない非登録色のいずれであるかを判別する登録色判定ステップと、混色による非登録色について、混色の元色である登録色を解析する元色部解析ステップと、登録色領域と、混色領域を統合する統合処理ステップと、前記統合処理ステップにおける統合結果に基づいて、正規マーカー色を選択するマーカー色選択ステップとを有することを特徴とする。   Furthermore, in one embodiment of the information processing method of the present invention, the regular marker color determination step includes a registered color registered in advance as a write-once marker color for colors included in the color area extracted by the color area extraction unit. A registered color determining step for determining which of the unregistered non-registered colors, an original color part analyzing step for analyzing a registered color that is the original color of the mixed color, and a registered color area for the non-registered color due to the mixed color And an integration processing step for integrating the color mixture regions, and a marker color selection step for selecting a normal marker color based on the integration result in the integration processing step.

さらに、本発明の情報処理方法の一実施態様において、前記マーカー色選択ステップは、前記統合処理ステップにおいて生成された複数の統合領域について、色領域内の文字列方向の長さを比較し、より長い統合領域に対応するマーカー色を正規マーカー色として選択する処理を実行することを特徴とする。   Furthermore, in one embodiment of the information processing method of the present invention, the marker color selection step compares the lengths in the character string direction in the color regions for the plurality of integrated regions generated in the integration processing step, and more A process of selecting a marker color corresponding to a long integrated region as a normal marker color is performed.

さらに、本発明の情報処理方法の一実施態様において、前記情報処理装置は、予め追記マーカー色として登録された登録色に基づいて生成される混色についての登録情報としての混色情報テーブルを記憶部に保持し、前記元色部解析ステップは、前記混色情報テーブルに基づいて、混色による非登録色について、混色の元色である登録色を解析する処理を実行することを特徴とする。   Furthermore, in an embodiment of the information processing method of the present invention, the information processing apparatus stores a color mixing information table as registration information on color mixing generated based on a registered color registered in advance as a write-once marker color. The original color part analyzing step is characterized in that, based on the color mixture information table, for a non-registered color by color mixture, a process of analyzing a registered color that is a color mixture original color is executed.

さらに、本発明の情報処理方法の一実施態様において、前記正規マーカー色判定ステップは、前記色領域抽出ステップにおいて抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色と、登録されていない非登録色のいずれであるかを判別する登録色判定ステップと、非登録色領域を登録色領域に統合する統合処理ステップと、前記統合処理ステップにおける統合結果としての統合領域を構成する登録色を正規マーカー色として選択するマーカー色選択ステップとを有することを特徴とする。   Furthermore, in one embodiment of the information processing method of the present invention, the regular marker color determination step includes a registered color registered in advance as a write-once marker color for colors included in the color region extracted in the color region extraction step. A registration color determination step for determining which of the non-registered colors is not registered, an integration processing step for integrating the non-registration color region into the registration color region, and an integration region as an integration result in the integration processing step. And a marker color selection step of selecting a registered color to be configured as a normal marker color.

さらに、本発明の情報処理方法の一実施態様において、前記正規マーカー色判定ステップは、前記色領域抽出ステップにおいて抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色の領域を抽出する登録色判定ステップと、前記登録色判定ステップにおいて抽出された登録色領域の面積または位置を解析し、解析情報に基づいて正規マーカー色を選択するマーカー色選択ステップとを有することを特徴とする。   Furthermore, in one embodiment of the information processing method of the present invention, the regular marker color determination step includes a registration color registered in advance as a write-once marker color for the color included in the color region extracted in the color region extraction step. A registered color determining step for extracting a region; and a marker color selecting step for analyzing the area or position of the registered color region extracted in the registered color determining step and selecting a normal marker color based on the analysis information. Features.

さらに、本発明の情報処理方法の一実施態様において、前記マーカー色選択ステップは、前記登録色判定ステップにおいて抽出された登録色領域中、面積が小さい登録色領域、または、前記登録色判定ステップにおいて抽出された登録色領域中、より外周に記録位置のある登録色領域を構成する登録色を正規マーカー色として選択する処理を実行することを特徴とする。   Furthermore, in one embodiment of the information processing method of the present invention, the marker color selecting step includes a registered color region having a small area in the registered color region extracted in the registered color determining step, or the registered color determining step. In the extracted registered color area, a process of selecting a registered color constituting a registered color area having a recording position on the outer periphery as a normal marker color is executed.

さらに、本発明の情報処理方法の一実施態様において、前記情報処理方法は、さらに、有効性判定部において、前記色領域抽出ステップで抽出された色領域上または色領域近傍にある記号の検出処理、または前記色領域の形状の解析に基づいて、該色領域に設定されたマーカー色の有効性判定処理を行なう有効性判定ステップを有することを特徴とする。   Furthermore, in an embodiment of the information processing method of the present invention, the information processing method further includes a detection process of a symbol on or near the color area extracted in the color area extraction step in the validity determination unit. Or, based on the analysis of the shape of the color area, there is a validity determination step for performing a validity determination process for the marker color set in the color area.

さらに、本発明の第3の側面は、情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行させるコンピュータ・プログラムであり、色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上の色情報を取得させる色領域抽出ステップと、正規マーカー色判定部において、前記色領域抽出部において抽出された色領域中、複数の異なる色の接触領域を持つ色領域の解析を実行して、正しいマーカー色を識別させる正規マーカー色判定ステップと、属性判定部において、前記正規マーカー色判定部において決定された正規マーカー色に対応して登録された属性を、該マーカーの設定領域の記録情報に対応する属性と判定させる属性判定ステップとを実行させることを特徴とするコンピュータ・プログラムにある。   Furthermore, a third aspect of the present invention is a computer program for causing an information processing apparatus to execute an attribute determination process for document information based on a marker color added to a document. A color region extraction step for inputting a postscript document in which a marker color is added and acquiring color information on the postscript document, and a plurality of different colors among the color regions extracted by the color region extraction unit in the normal marker color determination unit In the normal marker color determination step for identifying the correct marker color by executing the analysis of the color region having the contact area, and the attribute determination unit, corresponding to the normal marker color determined in the normal marker color determination unit Attribute determined to be the attribute corresponding to the recording information in the setting area of the marker In a computer program, characterized in that to execute a constant step.

なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能なコンピュータシステムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体、例えば、CDやFD、MOなどの記録媒体、あるいは、ネットワークなどの通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータシステム上でプログラムに応じた処理が実現される。   Note that the computer program of the present invention is a recording medium provided in a computer-readable format for a computer system capable of executing various program codes, for example, a recording medium such as a CD, FD, or MO. A computer program that can be provided by a medium or a communication medium such as a network. By providing such a program in a computer-readable format, processing corresponding to the program is realized on the computer system.

本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。   Other objects, features, and advantages of the present invention will become apparent from a more detailed description based on embodiments of the present invention described later and the accompanying drawings. In this specification, the system is a logical set configuration of a plurality of devices, and is not limited to one in which the devices of each configuration are in the same casing.

本発明の構成によれば、例えば、文書ドキュメントに対するマーカーペンによる文字列抽出/属性付与処理、すなわち、色マーカーによる追記のなされた追記ドキュメントからマーカー色を解析して、マーカー色に基づくドキュメント情報の属性判定処理を実行する構成において、追記ドキュメント上の色情報を取得し、抽出した色領域中、複数の異なる色の接触領域を持つ色領域の解析を実行して、正しいマーカー色を識別する構成とした。具体的には、誤って記録されたマーカー色の記録後に、予め決められたルールに従って正しいマーカー色の記録を実行し、その記録ルールに対応する解析アルゴリズムを適用して正しいマーカー色を判別する構成としたので、全てのマーカー色の設定やり直し等の再処理を行なうことなく効率的で確実なマーカーペンによる文字列抽出/属性付与処理が可能となる。   According to the configuration of the present invention, for example, a character string extraction / attribute assignment process using a marker pen for a document document, that is, a marker color is analyzed from a postscript document added with a color marker, and document information based on the marker color is analyzed. In the configuration for executing the attribute determination process, the color information on the postscript document is acquired, and the extracted color region is analyzed for a color region having a plurality of different color contact regions to identify the correct marker color It was. Specifically, after recording the erroneously recorded marker color, the correct marker color is recorded according to a predetermined rule, and an analysis algorithm corresponding to the recording rule is applied to determine the correct marker color Therefore, efficient and reliable character string extraction / attribute assignment processing with a marker pen can be performed without performing reprocessing such as re-setting of all marker colors.

以下、図面を参照しながら本発明の実施形態に係る情報処理装置、および情報処理方法、並びにコンピュータ・プログラムの詳細について説明する。   Details of an information processing apparatus, an information processing method, and a computer program according to embodiments of the present invention will be described below with reference to the drawings.

まず、図1、図2を参照してマーカーペンによる文字列抽出/属性付与処理の概要について説明する。マーカーペンによる文字列抽出/属性付与処理は、例えば文書ドキュメントに対して、オペレータが、ドキュメント上の文字列などの情報を、カテゴリに応じて設定された特定色のマーカーでチェックする処理を行い、この処理後のドキュメントをスキャナで読み取り、その読み取り画像データから、マーカー色を判別して、ドキュメント上の情報分類を行ない、ドキュメントに対するインデックス情報としてデータベースに格納する処理である。   First, an outline of character string extraction / attribute assignment processing using a marker pen will be described with reference to FIGS. 1 and 2. Character string extraction / attribute assignment processing using a marker pen performs, for example, a process in which an operator checks information such as a character string on a document with a marker of a specific color set according to a category for a document document, In this process, the document after this processing is read by the scanner, the marker color is discriminated from the read image data, the information on the document is classified, and stored in the database as index information for the document.

例えば、ドキュメントが商品見積もり書などである場合、マーカーの色に応じて、
オレンジ:依頼者、
緑:購入品、
青:購入価格、
赤:回答者、
など、情報の種類に応じて、予め利用するマーカー色が対応付けられており、オペレータがドキュメント上から、これらの情報に対応する情報を選択して、それぞれに割り当てられたマーカーでチェックをする。その後、PC等の情報処理装置において、スキャナで読み取った画像データからマーカーの色情報を取得して、各色情報の指示部分の文書情報などを例えば文字認識(OCR)処理などにより、データ化を行い、その文書ドキュメントに対応するインデックス情報としてデータベースに格納する。
For example, if the document is a product quote, etc., depending on the color of the marker,
Orange: Client,
Green: Purchased item
Blue: purchase price,
Red: Respondent,
The marker colors used in advance are associated with each other according to the type of information, and the operator selects information corresponding to these pieces of information from the document, and checks with the markers assigned to each. Thereafter, in an information processing apparatus such as a PC, the color information of the marker is acquired from the image data read by the scanner, and the document information of the indicated portion of each color information is converted into data by, for example, character recognition (OCR) processing. And stored in the database as index information corresponding to the document document.

例えば、図1に示す情報処理装置51は、データベース54に格納された文書ドキュメントを、プリンタ52を介して出力する。図に示す原本ドキュメント11である。オペレータは、この原本ドキュメント11対して、予め設定された情報種類と利用マーカー色の対応に基づいて、マーカーによる追記を行なう。この結果が図に示す追記ドキュメント12である。   For example, the information processing apparatus 51 illustrated in FIG. 1 outputs a document document stored in the database 54 via the printer 52. This is an original document 11 shown in the figure. The operator adds information to the original document 11 using a marker based on the correspondence between the preset information type and the use marker color. This result is the postscript document 12 shown in the figure.

例えば、追記ドキュメントには、赤、青、緑のマーキング21〜23がなされており、これらは、予め定められたルールに基づいてマーキングされたものである。例えば、マーカーの色と情報種類(属性)の対応が、
オレンジ:依頼者、
緑:購入品、
青:購入価格、
赤:回答者、
として設定されている。この追記ドキュメント12はスキャナ53によって読み取られて、情報処理装置51においてデータ処理がなされ、処理対象文書ドキュメントに対応するインデックス情報の設定処理がなされる。
For example, red, blue, and green markings 21 to 23 are made on the postscript document, and these are marked based on a predetermined rule. For example, the correspondence between the marker color and the information type (attribute)
Orange: Client,
Green: Purchased item
Blue: purchase price,
Red: Respondent,
Is set as The postscript document 12 is read by the scanner 53 and subjected to data processing in the information processing apparatus 51, and index information setting processing corresponding to the processing target document document is performed.

図2を参照して、情報処理装置51において実行されるマーカーペンによる文字列抽出/属性付与処理の具体例について説明する。図2に示す追記ドキュメント100は、オペレータによって、マーカー色の設定された追記ドキュメント100である。マーカーの色と属性の対応は、
オレンジ:依頼者、
緑:購入品、
青:購入価格、
赤:回答者、
である。
With reference to FIG. 2, a specific example of character string extraction / attribute assignment processing by the marker pen executed in the information processing apparatus 51 will be described. The postscript document 100 shown in FIG. 2 is the postscript document 100 in which the marker color is set by the operator. The correspondence between marker colors and attributes
Orange: Client,
Green: Purchased item
Blue: purchase price,
Red: Respondent,
It is.

追記ドキュメントのマーカー色設定領域101は「スキャナ」の文字が記録された領域であり、オペレータはこのマーカー色設定領域の属性を[購入品]であると判定し、購入品に対して設定されたマーカー色=[緑]を用いてマーカー色を設定する。
マーカー色設定領域102は「ST123」の文字が記録された領域であり、オペレータはこのマーカー色設定領域の属性を[依頼者識別子(依頼者No.)]であると判定し、依頼者に対して設定されたマーカー色=[オレンジ]を用いてマーカー色を設定する。
The marker color setting area 101 of the postscript document is an area in which the characters “scanner” are recorded. The operator determines that the attribute of the marker color setting area is “purchased product” and is set for the purchased product. Marker color is set using marker color = [green].
The marker color setting area 102 is an area in which the characters “ST123” are recorded. The operator determines that the attribute of the marker color setting area is [requester identifier (requester No.)], and asks the requester. Set the marker color using the marker color set to [Orange].

マーカー色設定領域103は「B社」の文字が記録された領域であり、オペレータはこのマーカー色設定領域の属性を[回答者]であると判定し、回答者に対して設定されたマーカー色=[赤]を用いてマーカー色を設定する。
マーカー色設定領域104は「¥2120」の文字が記録された領域であり、オペレータはこのマーカー色設定領域の属性を[購入価格]であると判定し、購入価格に対して設定されたマーカー色=[青]を用いてマーカー色を設定する。
The marker color setting area 103 is an area in which the characters “Company B” are recorded. The operator determines that the attribute of the marker color setting area is “respondent”, and the marker color set for the respondent = Use [Red] to set the marker color.
The marker color setting area 104 is an area in which the characters “¥ 2120” are recorded. The operator determines that the attribute of the marker color setting area is “purchase price”, and the marker color set for the purchase price. = Use [Blue] to set the marker color.

この追記ドキュメント100はスキャナ53によって読み取られ、情報処理装置51に入力されてマーカーペンによる文字列抽出/属性付与処理が実行される。情報処理装置51の記憶部には、図に示すマーカー色と属性の対応を示すマーカー色属性対応テーブル71が格納されている。すなわち、
マーカー色=オレンジ:属性=依頼者、
マーカー色=緑:属性=購入品、
マーカー色=青:属性=購入価格、
マーカー色=赤:属性=回答者、
これらのマーカー色と属性の対応情報を有するテーブルである。
The additional writing document 100 is read by the scanner 53 and input to the information processing apparatus 51, and character string extraction / attribute assignment processing is performed by the marker pen. The storage unit of the information processing apparatus 51 stores a marker color attribute correspondence table 71 indicating correspondence between marker colors and attributes shown in the figure. That is,
Marker color = Orange: Attribute = Requester
Marker color = green: attribute = purchased item,
Marker color = blue: attribute = purchase price
Marker color = red: attribute = respondent,
It is a table having correspondence information between these marker colors and attributes.

情報処理装置51は、スキャナで読み取った画像データからマーカーの色情報を取得して、このマーカー色属性対応テーブル71を参照して各色情報の設定領域にある文字情報などの属性を決定する。各色情報の設定領域にある文字情報は、例えば文字認識(OCR)処理などによりテキストデータ化を施し、属性値とともにデータベース54に格納する。   The information processing apparatus 51 acquires marker color information from the image data read by the scanner, and refers to the marker color attribute correspondence table 71 to determine attributes such as character information in the setting area of each color information. The character information in the setting area of each color information is converted into text data by, for example, character recognition (OCR) processing and stored in the database 54 together with attribute values.

データベースに格納されるデータの一例が、図に示す解析データ72である。解析データ72は、色マーカーの各色に対応する属性ごとに分類したデータを格納したテーブルである。このように、情報処理装置51は、各追記ドキュメントのマーカーペンによる文字列抽出/属性付与処理によって読み取られたデータを、各属性ごとに分類整理を行い、図に示す解析データ72を生成してデータベース54に格納する。なお、図に示す解析データ72は、マーカーペンによる文字列抽出/属性付与処理によって生成可能なデータの一例を示すものであり、この他にも、様々な形態のデータが生成可能である。   An example of data stored in the database is analysis data 72 shown in the figure. The analysis data 72 is a table storing data classified for each attribute corresponding to each color of the color marker. As described above, the information processing apparatus 51 classifies and arranges the data read by the character string extraction / attribute assignment processing with the marker pen of each additional writing document for each attribute, and generates the analysis data 72 shown in the figure. Store in the database 54. Note that the analysis data 72 shown in the figure shows an example of data that can be generated by the character string extraction / attribute assignment process using the marker pen, and various other forms of data can be generated.

このようにマーカーペンによる文字列抽出/属性付与処理により、効率的なデータ整理が可能となる。しかし、前述したように、各ドキュメントに対してマーカー色の設定を行うのは、人(オペレータ)であり、マークミスの発生は避けられないという問題がある。   Thus, efficient data organization is possible by the character string extraction / attribute assignment processing using the marker pen. However, as described above, it is a person (operator) who sets the marker color for each document, and there is a problem that the occurrence of a mark mistake cannot be avoided.

マークミスが検出されたドキュメントの訂正を行なう場合、再度、マークの設定されていない新規ドキュメントを再プリントして、全てのマークを設定し直すという処理を行なうことが考えられる。しかし、このような処理を行なうと、1枚のドキュメントに多数のマーカー色が設定されている場合、その1つでも誤りがあるとすべてのマークを再度、書き直すといった手間が発生し、その処理において、またマークミスが発生する場合もあり、処理効率を低下させることになる。   When correcting a document in which a mark miss is detected, it is conceivable to perform a process of reprinting a new document with no mark set again and resetting all marks. However, when such a process is performed, if a large number of marker colors are set for one document, there is a trouble of rewriting all the marks again if any one of them is incorrect. In addition, mark mistakes may occur, which reduces processing efficiency.

本発明の情報処理装置の一実施例においては、マークミスの検出された追記ドキュメントをそのまま利用して、誤ったマークを設定したマークミス領域に正しい色マーカーで追記を実行して、その追記情報を解析して正しいマーカー色を判別して属性値の登録を実行する。この処理例について、図3以下を参照して説明する。   In one embodiment of the information processing apparatus according to the present invention, the additional writing information in which a mark mistake is detected is used as it is, and additional writing is performed with a correct color marker in a mark mistake area where an erroneous mark is set. To determine the correct marker color and register the attribute value. This processing example will be described with reference to FIG.

図3は、図2に示す追記ドキュメント100と同様の原稿に対してオペレータがマーカー色を設定した追記ドキュメント110であるが、マーカー色設定領域201がマークミス領域である。本来、マーカー色設定領域201は、「ST123」の文字が記録された領域であり、[依頼者識別子(依頼者No.)]であるので、依頼者に対して設定されたマーカー色=[オレンジ]を用いてマーカー色を設定しなければならないが、誤って、他の属性(購入価格)に対応するマーカー色[青]を用いてマーカー色の設定を行ってしまったマークミス領域である。   FIG. 3 shows a postscript document 110 in which the operator sets a marker color for the same original as the postscript document 100 shown in FIG. 2, but the marker color setting area 201 is a mark miss area. Originally, the marker color setting area 201 is an area in which the characters “ST123” are recorded and is [requester identifier (requester No.)]. Therefore, the marker color set for the requester = [orange ], The marker color has to be set using a marker color [blue] corresponding to another attribute (purchase price), but the marker color has been set by mistake.

本発明の処理構成においては、このようなマークミスの発生ドキュメントが検出された場合、そのマークミスの行われた追記ドキュメントをそのまま適用して、オペレータが正しいマーカー色を用いてマークミス領域に上書きを実行する。本発明の情報処理装置は、このような、誤ったマーカー色と正しいマーカー色とが重なってあるいは接触して記録されたマーカー色設定領域の解析を実行して正しいマーカー色を判定する。   In the processing configuration of the present invention, when such a mark missed document is detected, the additional document with the mark miss is applied as it is, and the operator overwrites the mark miss area with the correct marker color. Execute. The information processing apparatus according to the present invention determines the correct marker color by executing the analysis of the marker color setting area recorded in such a manner that the erroneous marker color and the correct marker color overlap or contact each other.

本発明の情報処理装置において実行するマーカー色解析アルゴリズムとしては、複数のアルゴリズムがあり、これらのアルゴリズムに従ったマーカー色判定を行なうため、アルゴリズムに対応したマーカー記録ルールを適用する。オペレータが、正しいマーカー色を用いてマークミス領域に上書きを実行する場合、情報処理装置の実行するマーカー色解析アルゴリズムに対応するマーカー記録ルールに従って上書きを実行する。   The marker color analysis algorithm executed in the information processing apparatus according to the present invention includes a plurality of algorithms. In order to perform marker color determination according to these algorithms, a marker recording rule corresponding to the algorithm is applied. When the operator uses the correct marker color to overwrite the mark miss area, the operator performs the overwriting according to the marker recording rule corresponding to the marker color analysis algorithm executed by the information processing apparatus.

マーカー記録ルールの1つの例が、図3(a)マーカー記録ルール1である。図3(a)に示す例は、誤ったマーカー色[青](第1追記色)を用いてマーカー色の設定を行ってしまったマークミス領域に、正しいマーカー色[オレンジ](第2追記色)を用いて上書きを行なう場合、正しいマーカー色[オレンジ](第2追記色)を、第1追記色の設定領域より、文字列方向に長く記録するルールである。このように正しいマーカー色である第2追記色の記録を行なう場合、第1追記色の設定領域より、文字列方向に長く記録することをルールとする。   One example of the marker recording rule is the marker recording rule 1 in FIG. In the example shown in FIG. 3A, the correct marker color [orange] (second additional recording) is set in the mark miss area where the marker color has been set using the wrong marker color [blue] (first additional recording color). In the case of overwriting using (color), the rule is that the correct marker color [orange] (second additional recording color) is recorded longer in the character string direction than the first additional recording color setting area. When recording the second additional recording color which is the correct marker color in this way, the rule is to record longer in the character string direction than the first additional recording color setting area.

マーカー色の解析に基づくマーカーペンによる文字列抽出/属性付与処理を実行する情報処理装置は、この第2追記色の記録ルールに対応する解析アルゴリズムに従って、正しいマーカー色[オレンジ](第2追記色)を検出する。   The information processing apparatus that executes the character string extraction / attribute assignment processing with the marker pen based on the analysis of the marker color, in accordance with the analysis algorithm corresponding to the recording rule for the second additional recording color, correct marker color [orange] (second additional recording color) ) Is detected.

図3(a)に示すように、マーカー色設定領域は、
誤ったマーカー色[青](第1追記色)、
正しいマーカー色[オレンジ](第2追記色)と、
2つのマーカー色重なりに基づいて発生する減法混色[紫]、
これら3つの異なる色領域が形成される。
なお、減法混色とは、複数の色の混色によって発生する色であり、減法混色の元となった色は、例えばCMYK色空間やLab色空間、RGB色空間を適用した色解析によって解析可能である。減法混色については、後段で詳細に説明する。
As shown in FIG. 3A, the marker color setting area is
Wrong marker color [blue] (first additional color)
Correct marker color [orange] (second additional color)
Subtractive color mixture [purple] generated based on the overlap of two marker colors
These three different color regions are formed.
The subtractive color mixture is a color generated by a color mixture of a plurality of colors, and the color that is the source of the subtractive color mixture can be analyzed by color analysis using a CMYK color space, a Lab color space, or an RGB color space, for example. is there. Subtractive color mixing will be described in detail later.

マーカーペンによる文字列抽出/属性付与処理を実行する情報処理装置は、予めマーカー色としてテーブル(図2に示す対応テーブル71)に登録されている第1追記色(青)と第2追記色(オレンジ)と、マーカー色としてテーブル登録されていない色であり、登録マーカー色の減法混色(ここでは紫)が接触して存在する色領域について、文字列方向に長い第2追記色を正しい属性色と判定して登録するマーカーペンによる文字列抽出/属性付与処理を実行する。   The information processing apparatus that executes the character string extraction / attribute assignment processing with the marker pen uses the first additional color (blue) and the second additional color (which are registered in advance in the table (corresponding table 71 shown in FIG. 2) as the marker color). The color that is not registered in the table as a marker color and the subtractive color mixture (in this case purple) of the registered marker color is the correct attribute color for the second additional color that is long in the character string direction. The character string extraction / attribute assignment process is executed by the marker pen that is determined and registered.

マーカー記録ルールの異なる例について、図4を参照して説明する。図4(b)マーカー記録ルール2も、図4に示す追記ドキュメント110の誤ったマーカー色[青](第1追記色)を用いてマーカー色の設定を行ってしまったマークミス領域201に対する処理例を示している。   Different examples of the marker recording rule will be described with reference to FIG. In FIG. 4B, the marker recording rule 2 is also processed for the mark miss area 201 in which the marker color is set using the wrong marker color [blue] (first additional recording color) of the additional recording document 110 shown in FIG. An example is shown.

図4(b)マーカー記録ルール2も、正しいマーカー色[オレンジ](第2追記色)を用いて上書きを行なった例であり、正しいマーカー色[オレンジ](第2追記色)を、第1追記色の設定領域を全周囲で広げた領域として記録することを、第2追記色の記録ルールとした例である。情報処理装置は、この第2追記色の記録ルールに対応する解析アルゴリズムに従って、正しいマーカー色[オレンジ](第2追記色)を検出する。   FIG. 4B is also an example in which the marker recording rule 2 is overwritten using the correct marker color [orange] (second additional recording color), and the correct marker color [orange] (second additional recording color) is set to the first marker color [orange] (second additional recording color). Recording an additional write color setting area as an area widened all around is an example of a second additional write color recording rule. The information processing apparatus detects the correct marker color [orange] (second additional recording color) according to the analysis algorithm corresponding to the recording rule for the second additional recording color.

図4(b)の処理例では、マーカー色設定領域は、
誤ったマーカー色[青](第1追記色)のみの領域は存在せず、
正しいマーカー色[オレンジ](第2追記色)と、
2つのマーカー色重なりに基づいて発生する減法混色[紫]、
これら2つの異なる色領域が形成される。
In the processing example of FIG. 4B, the marker color setting area is
There is no region with only the wrong marker color [blue] (first additional color)
Correct marker color [orange] (second additional color)
Subtractive color mixture [purple] generated based on the overlap of two marker colors
These two different color regions are formed.

マーカーペンによる文字列抽出/属性付与処理を実行する情報処理装置は、予めマーカー色としてテーブル(図2に示す対応テーブル71)に登録されている色(オレンジ)と登録されていない色(ここでは紫)の接触領域を検出し、登録されていない色が登録色の減法混色と判定された場合、登録色(オレンジ)を正しい属性色と判定して登録するマーカーペンによる文字列抽出/属性付与処理を実行する。   An information processing apparatus that performs character string extraction / attribute assignment processing with a marker pen uses a color (orange) registered in advance in the table (corresponding table 71 shown in FIG. 2) as a marker color and a color that is not registered (here: When a non-registered color is detected as a subtractive color mixture of the registered color, the character string extraction / attribute assignment by the marker pen that registers and registers the registered color (orange) as the correct attribute color is detected. Execute the process.

情報処理装置は、このように、マーカー色設定領域の色解析に際して、減法混色の解析を実行する。減法混色について図5を参照して説明する。図5には、
(1)CMYK(またはRGB)空間における減法混色の発生状況
(2)Lab空間における減法混色の発生状況
これらの異なる色空間における減法混色の発生状況を説明する図を示してある。
In this way, the information processing apparatus performs subtractive color mixture analysis in the color analysis of the marker color setting area. The subtractive color mixture will be described with reference to FIG. In FIG.
(1) Generation state of subtractive color mixture in CMYK (or RGB) space (2) Generation state of subtractive color mixture in Lab space FIG.

(1)CMYK(またはRGB)空間における減法混色の発生状況を示す図において、各頂点は、C(シアン)、M(マゼンタ)、Y(黄色)、K(黒)、R(赤)、G(緑)、B(青)、W(白)を示している。例えば抽出色を、図に示す抽出色241とする。この抽出色に対して、他の色が混合した場合に生成される色の領域が、図に示す直方体によって示す領域であり、この領域が減法混色の可能性がある部分色空間242である。   (1) In the diagram showing the occurrence of subtractive color mixture in CMYK (or RGB) space, each vertex is C (cyan), M (magenta), Y (yellow), K (black), R (red), G (Green), B (blue), and W (white) are shown. For example, the extracted color is the extracted color 241 shown in the figure. A region of a color generated when other colors are mixed with the extracted color is a region indicated by a rectangular parallelepiped shown in the drawing, and this region is a partial color space 242 in which subtractive color mixing is possible.

すなわち、抽出色と黒(K)を結ぶ直線を対角線とした直方体によって、減法混色の可能性がある部分色空間が示される。従って、例えば、マーカー色としてテーブル登録されていない色がスキャナ読み取り情報から得られた場合、この減法混色の可能性がある部分色空間から逆に混合された色を解析することができる。   That is, a partial color space having a possibility of subtractive color mixture is indicated by a rectangular parallelepiped having a straight line connecting the extracted color and black (K) as a diagonal line. Therefore, for example, when a color that is not registered in the table as the marker color is obtained from the scanner reading information, it is possible to analyze the color mixed in reverse from the partial color space that has the possibility of subtractive color mixing.

例えば、スキャナによって、読み取られた色が赤(R)であり、赤(R)が、マーカー色としてテーブル登録されていない色である場合、赤(R)は、マーカー色としてテーブル登録されている複数のマーカー色の減法混色によって生成された色であると判断できる。混合された色は、図5(1)のCMYK(またはRGB)空間において、M(マゼンタ)、Y(黄色)、R(赤)、W(白)の平面に存在すると判定できる。例えばマーカー色としてテーブル登録されている色が、M(マゼンタ)、Y(黄色)であれば、R(赤)は、M(マゼンタ)とY(黄色)との混色によって生成される色であると判定され、スキャナによって検出されたR(赤)は、M(マゼンタ)とY(黄色)との混色によって生成されたと判定することができる。   For example, when the color read by the scanner is red (R) and red (R) is a color that is not registered in the table as a marker color, red (R) is registered in the table as a marker color. It can be determined that the color is generated by subtractive color mixture of a plurality of marker colors. It can be determined that the mixed color exists in the plane of M (magenta), Y (yellow), R (red), and W (white) in the CMYK (or RGB) space of FIG. For example, if the color registered in the table as the marker color is M (magenta) or Y (yellow), R (red) is a color generated by mixing colors of M (magenta) and Y (yellow). It can be determined that R (red) detected by the scanner is generated by mixing colors of M (magenta) and Y (yellow).

なお、図5(1)は、CMYK(またはRGB)空間における減法混色の発生状況を示す図であるが、CMYK(またはRGB)空間のみならず、図5(2)に示すように、Lab色空間においても、抽出色251に対して、他の色が混合した場合に生成される色の領域として図に示す円錐領域を減法混色の可能性がある部分色空間252を定義することができる。このようにCMYK、RGB、Labなど、様々な色空間において、減法混色の可能性がある部分色空間は個別に定義可能であり、スキャナによる読み取り情報から解析される色情報は様々な設定が利用可能である。   FIG. 5 (1) is a diagram showing the occurrence of subtractive color mixing in the CMYK (or RGB) space, but not only in the CMYK (or RGB) space but also in the Lab color as shown in FIG. 5 (2). Also in the space, a partial color space 252 in which the conical region shown in the figure may be subtractively mixed can be defined as a color region generated when other colors are mixed with the extracted color 251. Thus, in various color spaces such as CMYK, RGB, and Lab, partial color spaces with the possibility of subtractive color mixture can be individually defined, and various settings are used for color information analyzed from information read by the scanner. Is possible.

上述した減法混色情報を適用することで、本発明の情報処理装置は、スキャナによって検出される色情報の解析を実行して、例えば、図3を参照して説明した(a)マーカー記録ルール1や、図4を参照して説明した(b)マーカー記録ルール2に従って記録されたマーカー色設定領域から、正しい属性値に対応する正しいマーカー色を判別する。   By applying the subtractive color mixing information described above, the information processing apparatus of the present invention analyzes the color information detected by the scanner, and for example, (a) Marker recording rule 1 described with reference to FIG. Alternatively, the correct marker color corresponding to the correct attribute value is determined from the marker color setting area recorded according to (b) marker recording rule 2 described with reference to FIG.

本発明の情報処理装置は、スキャンされたドキュメントの色解析に際して、マーカー色としてテーブル登録されていない色を検出した場合、その検出色がマーカー色としてテーブル登録されている色の減法混色であるか否かを判定する処理を実行する。この判定処理には、例えば、図5を参照して説明した様々な色空間情報を適用して、逐次解析することも可能であるが、予め、マーカー色としてテーブル登録されている色の減法混色として生成される色情報を登録したテーブル(混色情報テーブル)を生成して、記憶部に保持し、色解析に際して、この混色情報テーブルを参照する構成とすることで効率的な解析が可能となる。   In the color analysis of a scanned document, when the information processing apparatus of the present invention detects a color not registered in the table as a marker color, whether the detected color is a subtractive color mixture of the color registered in the table as the marker color The process which determines whether or not is executed. For this determination processing, for example, various color space information described with reference to FIG. 5 can be applied and sequentially analyzed. However, subtractive color mixture of colors registered in the table as marker colors in advance is possible. A table (mixed color information table) in which the color information generated as described above is generated, stored in the storage unit, and the color mixed information table is referred to when performing color analysis, thereby enabling efficient analysis. .

図6に、マーカー色としてテーブル登録されている色の減法混色として生成される色情報を登録した混色情報テーブルの例を示す。この混色情報テーブルの例において、予めマーカー色としてテーブル登録されている色は、[緑]、[青]、[オレンジ]の3色である。これらの各色の混色によって発生する色が登録される。
緑と青の混色は[深緑]、
緑とオレンジの混色は[茶]、
青とオレンジの混色は[紫]、
これらの混色情報が登録されている。マーカー色の解析を実行する情報処理装置は、これらの混色情報を登録した混色情報テーブルを参照して、各記録ルールに対応するマーカー色解析アルゴリズムを実行して、正しいマーカー色の判断を実行する。
FIG. 6 shows an example of a color mixture information table in which color information generated as a subtractive color mixture of colors registered in the table as marker colors is registered. In this example of the color mixture information table, the colors registered in advance as marker colors are three colors of [green], [blue], and [orange]. A color generated by mixing these colors is registered.
The mixed color of green and blue is [Dark green]
The mixed color of green and orange is [Brown]
The mixed color of blue and orange is [purple]
These color mixture information is registered. The information processing apparatus that executes the marker color analysis refers to the color mixture information table in which the color mixture information is registered, executes a marker color analysis algorithm corresponding to each recording rule, and determines the correct marker color .

情報処理装置の実行するマーカーペンによる文字列抽出/属性付与処理アルゴリズムについて、図7以下を参照して説明する。図7に示すフローは、図3に示す(a)マーカー記録ルール1に従って記録処理のなされたマーカー色設定領域の解析を実行するアルゴリズムであり、図8はこの解析アルゴリズムの具体的処理例を示す図である。図9に示すフローは、図4に示す(b)マーカー記録ルール2に従って記録処理のなされたマーカー色設定領域の解析を実行するアルゴリズムであり、図10はこの解析アルゴリズムの具体的処理例を示す図である。   A character string extraction / attribute assignment processing algorithm with a marker pen executed by the information processing apparatus will be described with reference to FIG. The flow shown in FIG. 7 is an algorithm for executing the analysis of the marker color setting area subjected to the recording process according to (a) the marker recording rule 1 shown in FIG. 3, and FIG. 8 shows a specific processing example of this analysis algorithm. FIG. The flow shown in FIG. 9 is an algorithm for executing the analysis of the marker color setting area subjected to the recording process in accordance with (b) marker recording rule 2 shown in FIG. 4, and FIG. 10 shows a specific processing example of this analysis algorithm. FIG.

まず、図7に示すフローを参照して、図3に示す(a)マーカー記録ルール1に従って記録処理のなされたマーカー色設定領域の解析を実行するアルゴリズムについて説明する。   First, with reference to the flow shown in FIG. 7, an algorithm for executing the analysis of the marker color setting area subjected to the recording process according to (a) marker recording rule 1 shown in FIG. 3 will be described.

まず、情報処理装置は、ステップS101においてスキャン画像を入力する。このスキャン画像は、図3に示す(a)マーカー記録ルール1に従って記録処理のなされたマーカー色設定領域を含むスキャン画像である。ステップS102では、文字解析(OCR)処理を実行する。なお、この文字解析においては、ドキュメント全体の文字解析を行ってもよいが、マーカー色設定領域およびマーカー色に基づく減法混色の設定領域のみを選択して文字解析を行ってもよい。   First, the information processing apparatus inputs a scanned image in step S101. This scan image is a scan image including a marker color setting area subjected to recording processing in accordance with (a) marker recording rule 1 shown in FIG. In step S102, a character analysis (OCR) process is executed. In this character analysis, character analysis of the entire document may be performed, or character analysis may be performed by selecting only the marker color setting region and the subtractive color setting region based on the marker color.

ステップS103では、色抽出処理を実行する。ドキュメントの原本背景および原本の文字等の記録色と異なる色を抽出する。個々で抽出される色には、テーブル登録されているマーカー色のみならず、テーブル登録されていないマーカー色と異なる色であるが、テーブル登録されているマーカー色に基づいて生成される減法混色に対応する色が含まれる。   In step S103, a color extraction process is executed. A color different from the recorded color of the original background of the document and the original characters is extracted. The color extracted individually is not only the marker color registered in the table, but also a color different from the marker color not registered in the table, but it is a subtractive color mixture generated based on the marker color registered in the table. Corresponding colors are included.

ステップS104では、ステップS103において抽出した色各々について、テーブル登録されているマーカー色(登録色)であるか登録されていない色(非登録色)であるかの判定を行なう。   In step S104, it is determined whether each color extracted in step S103 is a marker color (registered color) registered in the table or an unregistered color (unregistered color).

次に、ステップS105において、ステップS104の色判定で、テーブル登録されていない色(非登録色)とされた色の元の色を判定する。この元色判定処理は、例えば図6を参照して説明した混色情報テーブルを参照して実行される。たとえば、ステップS103において抽出した色として[紫]が抽出され、[紫]がテーブル登録されていない色(非登録色)である場合、[紫]は、登録マーカー色[青]と[オレンジ]の減法混色であり、[紫]の元色は、登録マーカー色[青]と[オレンジ]であると判定される。   Next, in step S105, the original color of the color not registered in the table (non-registered color) is determined in the color determination in step S104. This original color determination processing is executed with reference to, for example, the color mixture information table described with reference to FIG. For example, when [purple] is extracted as the color extracted in step S103, and [purple] is a color that is not registered in the table (non-registered color), [purple] is registered marker colors [blue] and [orange]. The original color of [purple] is determined to be the registered marker colors [blue] and [orange].

次に、ステップS106において、登録色領域と混色領域の統合処理を実行する。この統合処理について、図8を参照して説明する。図8(1)に示すマーカー色設定領域は、先に図3を参照して説明した図3(a)マーカー記録ルール1に示す例と同じであり、第1登録マーカー色(青)と第2登録マーカー色(オレンジ)と、これらの登録マーカー色の減法混色(紫)が接触して存在する。ここで、ステップS105の元色判定処理において、紫の色領域は、登録マーカー色[青]と[オレンジ]の混色であることが解析済みである。   Next, in step S106, an integrated process of the registered color area and the mixed color area is executed. This integration process will be described with reference to FIG. The marker color setting area shown in FIG. 8 (1) is the same as the example shown in FIG. 3 (a) marker recording rule 1 described above with reference to FIG. 3, and the first registered marker color (blue) and the first Two registered marker colors (orange) and a subtractive color mixture (purple) of these registered marker colors are present in contact. Here, in the original color determination process in step S105, it has been analyzed that the purple color region is a mixed color of the registered marker colors [blue] and [orange].

ステップS106では、登録色領域と混色領域の統合処理が行われる。この統合処理は、[紫]の色領域を、[青]および[オレンジ]の色領域とみなして行われる。この統合処理によって、図8(2)に示す登録マーカー色[青]のマーカー色設定領域301と、登録マーカー色[オレンジ]のマーカー色設定領域302の2つの異なるマーカー色設定領域が判別される。   In step S106, the registered color area and the mixed color area are integrated. This integration process is performed by regarding the [purple] color region as the [blue] and [orange] color regions. By this integration process, two different marker color setting areas, a registered marker color [blue] marker color setting area 301 and a registered marker color [orange] marker color setting area 302 shown in FIG. .

ステップS107において、複数色接触領域に含まれる各色の文字列方向の長さを検出し、ステップS108において、文字列方向の長さの長い色領域を正しい属性色(マーカー色)と判定して登録する。   In step S107, the length in the character string direction of each color included in the multi-color contact area is detected, and in step S108, the color area having a long length in the character string direction is determined as the correct attribute color (marker color) and registered. To do.

図8(2)に示す例を用いて、これらの処理について説明する。まず、ステップS107では、図8(2)に示す登録マーカー色[青]のマーカー色設定領域301と、登録マーカー色[オレンジ]のマーカー色設定領域302の2つの異なるマーカー色設定領域の文字列[ST123]方向の長さを計測する。この例では、
登録マーカー色[青]のマーカー色設定領域301の長さ=Lb
登録マーカー色[オレンジ]のマーカー色設定領域302の長さ=Lo
である。
These processes will be described using the example shown in FIG. First, in step S107, character strings in two different marker color setting areas, a registered marker color [blue] marker color setting area 301 and a registered marker color [orange] marker color setting area 302 shown in FIG. [ST123] The length in the direction is measured. In this example,
Length of marker color setting area 301 of registered marker color [blue] = Lb
Length of marker color setting area 302 of registered marker color [orange] = Lo
It is.

ステップS108では、文字列方向の長さの長い色領域を正しい属性色(マーカー色)と判定して登録する。図8(2)に示す例では、
Lb<Lo
であり、
登録マーカー色[オレンジ]のマーカー色設定領域302の長さ=Loが<Lbより長い領域として記録されている。この結果、登録マーカー色[オレンジ]が正しいマーカー色であると判定し、このマーカー色[オレンジ]に対応する属性値を文字列[ST123]の属性としてデータベースに登録する。
In step S108, a color region having a long length in the character string direction is determined as a correct attribute color (marker color) and registered. In the example shown in FIG.
Lb <Lo
And
The length of marker color setting area 302 of registered marker color [orange] = Lo is recorded as an area longer than <Lb. As a result, it is determined that the registered marker color [orange] is the correct marker color, and the attribute value corresponding to the marker color [orange] is registered in the database as the attribute of the character string [ST123].

この処理によって、情報処理装置は、複数のマーカー色が重ね書きされた領域から、正しいマーカー色を正確に選択して、そのマーカー色に対応付けられた属性をデータベースに登録することができる。   By this processing, the information processing apparatus can accurately select the correct marker color from the area where a plurality of marker colors are overwritten, and register the attribute associated with the marker color in the database.

次に、図9に示すフローを参照して、図4に示す(b)マーカー記録ルール2に従って記録処理のなされたマーカー色設定領域の解析を実行するアルゴリズムについて説明する。   Next, an algorithm for executing the analysis of the marker color setting area subjected to the recording process according to (b) marker recording rule 2 shown in FIG. 4 will be described with reference to the flow shown in FIG.

まず、情報処理装置は、ステップS201においてスキャン画像を入力する。このスキャン画像は、図4に示す(b)マーカー記録ルール2に従って記録処理のなされたマーカー色設定領域を含むスキャン画像である。ステップS202では、文字解析(OCR)処理を実行する。なお、この文字解析においては、ドキュメント全体の文字解析を行ってもよいが、マーカー色設定領域およびマーカー色に基づく減法混色の設定領域のみを選択して文字解析を行ってもよい。   First, the information processing apparatus inputs a scan image in step S201. This scan image is a scan image including a marker color setting area subjected to recording processing in accordance with (b) marker recording rule 2 shown in FIG. In step S202, a character analysis (OCR) process is executed. In this character analysis, character analysis of the entire document may be performed, or character analysis may be performed by selecting only the marker color setting region and the subtractive color setting region based on the marker color.

ステップS203では、色抽出処理を実行する。ドキュメントの原本背景および原本の文字等の記録色と異なる色を抽出する。個々で抽出される色には、テーブル登録されているマーカー色のみならず、テーブル登録されていないマーカー色と異なる色であるが、テーブル登録されているマーカー色に基づいて生成される減法混色に対応する色が含まれる。   In step S203, color extraction processing is executed. A color different from the recorded color of the original background of the document and the original characters is extracted. The color extracted individually is not only the marker color registered in the table, but also a color different from the marker color not registered in the table, but it is a subtractive color mixture generated based on the marker color registered in the table. Corresponding colors are included.

ステップS204では、ステップS203において抽出した色各々について、テーブル登録されているマーカー色(登録色)であるか登録されていない色(非登録色)であるかの判定を行なう。   In step S204, it is determined whether each color extracted in step S203 is a marker color (registered color) registered in the table or an unregistered color (non-registered color).

次に、ステップS205において、登録色領域と非登録色(混色)領域の統合処理を実行する。この統合処理について、図10を参照して説明する。図10(1)に示すマーカー色設定領域は、先に図4を参照して説明した図4(b)マーカー記録ルール2に示す例と同じであり、正しいマーカー色[オレンジ](第2追記色)を、誤りのマーカー色(第1追記色=青)をすべてカバーし、かつ全周囲で広げた領域に記録した例である。このマーカー記録領域は、正しいマーカー色(オレンジ)と、登録マーカー色[青]と[オレンジ]の混色である[紫]の領域によって構成される。   Next, in step S205, an integration process of the registered color area and the non-registered color (mixed color) area is executed. This integration process will be described with reference to FIG. The marker color setting area shown in FIG. 10 (1) is the same as the example shown in FIG. 4 (b) marker recording rule 2 described above with reference to FIG. 4, and the correct marker color [orange] (second additional note) In this example, all of the erroneous marker colors (first additional recording color = blue) are covered and expanded in the entire periphery. This marker recording area is composed of a correct marker color (orange) and a [purple] area that is a mixed color of the registered marker colors [blue] and [orange].

ステップS205では、登録色領域に囲まれた非登録色(混色)領域を登録色によって生成された混色であり、元色に登録色[オレンジ]が含まれる色領域であると判断して、オレンジの領域として統合する。すなわち、図10(2)に示すような設定である。   In step S205, it is determined that the non-registered color (mixed color) area surrounded by the registered color areas is a mixed color generated by the registered colors, and the original color includes the registered color [orange]. Integrate as an area. That is, the setting is as shown in FIG.

次に、ステップS206において、ステップS205において統合した領域について、色領域から唯一選択される登録色[オレンジ]を正しい属性色(マーカー色)と判定して登録する。   Next, in step S206, for the region integrated in step S205, the registered color [orange] that is uniquely selected from the color region is determined as the correct attribute color (marker color) and registered.

この処理によって、情報処理装置は、複数のマーカー色が重ね書きされた領域から、正しいマーカー色を正確に選択して、そのマーカー色に対応付けられた属性をデータベースに登録することができる。   By this processing, the information processing apparatus can accurately select the correct marker color from the area where a plurality of marker colors are overwritten, and register the attribute associated with the marker color in the database.

次に、図11、図12を参照して、前述のマーカー記録ルールとは異なる記録ルールを適用した処理例について説明する。図11は、図3、図4と同様、追記ドキュメント110の誤ったマーカー色[青](第1追記色)を用いてマーカー色の設定を行ってしまったマークミス領域201に対する処理例を示している。正しいマーカー色は[オレンジ]である。   Next, with reference to FIGS. 11 and 12, an example of processing in which a recording rule different from the marker recording rule described above is applied will be described. FIG. 11 shows an example of processing for the mark error area 201 in which the marker color is set using the wrong marker color [blue] (first additional recording color) of the additional recording document 110 as in FIGS. 3 and 4. ing. The correct marker color is [orange].

図11(c)に示すように、マーカー記録ルール3は、誤ったマーカー色[青](第1追記色)のマーク領域の全周囲または周囲の一部に、正しいマーカー色[オレンジ]の第2追記色の記録を行うという記録ルールである。図に示すマーカー設定例321が、誤ったマーカー色[青](第1追記色)のマーク領域の全周囲に、正しいマーカー色[オレンジ]の第2追記色の記録を行った例であり、マーカー設定例322が、誤ったマーカー色[青](第1追記色)のマーク領域の周囲の一部に、正しいマーカー色[オレンジ]の第2追記色の記録を行った例である。この例では、異なるマーカー色の重なり部は発生せず、混色領域は出現しない。   As shown in FIG. 11 (c), the marker recording rule 3 has the correct marker color [orange] on the entire circumference or part of the circumference of the mark area with the wrong marker color [blue] (first additional recording color). This is a recording rule for recording two additional recording colors. The marker setting example 321 shown in the figure is an example in which the second additional recording color of the correct marker color [orange] is recorded around the entire mark area of the wrong marker color [blue] (first additional recording color). The marker setting example 322 is an example in which the second additional recording color of the correct marker color [orange] is recorded in a part around the mark area of the wrong marker color [blue] (first additional recording color). In this example, overlapping portions of different marker colors do not occur, and no mixed color region appears.

マーカーペンによる文字列抽出/属性付与処理を実行する情報処理装置は、予めマーカー色としてテーブル(図2に示す対応テーブル71)に登録されている色が複数接触しているマーク領域を検出し、そのマーク領域の面積、または、記録位置を解析して、面積の小さい方、またはマーク領域の外周に記録位置のあるマーカー色を正しい属性色と判定して登録するマーカーペンによる文字列抽出/属性付与処理を実行する。   An information processing apparatus that executes a character string extraction / attribute assignment process using a marker pen detects a mark area in which a plurality of colors registered in the table (corresponding table 71 shown in FIG. 2) as a marker color are in contact with each other, Character string extraction / attribute by marker pen that analyzes the area of the mark area or the recording position and determines the marker color with the recording position on the outer side of the mark area or the outer periphery of the mark area as the correct attribute color Execute the grant process.

図12に示すフローを参照して、図11に示す(c)マーカー記録ルール3に従って記録処理のなされたマーカー色設定領域の解析を実行するアルゴリズムについて説明する。   With reference to the flow shown in FIG. 12, an algorithm for executing the analysis of the marker color setting area subjected to the recording process according to (c) marker recording rule 3 shown in FIG. 11 will be described.

まず、情報処理装置は、ステップS301においてスキャン画像を入力する。このスキャン画像は、図11に示す(c)マーカー記録ルール3に従って記録処理のなされたマーカー色設定領域を含むスキャン画像である。ステップS302では、文字解析(OCR)処理を実行する。なお、この文字解析においては、ドキュメント全体の文字解析を行ってもよいが、マーカー色設定領域のみを選択して文字解析を行ってもよい。   First, the information processing apparatus inputs a scan image in step S301. This scan image is a scan image including a marker color setting area subjected to recording processing according to (c) marker recording rule 3 shown in FIG. In step S302, character analysis (OCR) processing is executed. In this character analysis, character analysis of the entire document may be performed, or character analysis may be performed by selecting only the marker color setting region.

ステップS303では、色抽出処理を実行する。ドキュメントの原本背景および原本の文字等の記録色と異なる色を抽出する。ステップS304では、ステップS303において抽出した色領域各々についての面積または位置の少なくともいずれかを解析する。なお、解析対象とするマーク領域は、複数の異なるマーカー登録色が接して記録されている領域のみでよい。その他の単独の色マーカー記録領域については、従来のマーカーペンによる文字列抽出/属性付与処理が適用される。   In step S303, color extraction processing is executed. A color different from the recorded color of the original background of the document and the original characters is extracted. In step S304, at least one of the area and the position for each color region extracted in step S303 is analyzed. The mark area to be analyzed may be only an area in which a plurality of different marker registration colors are recorded in contact. For other individual color marker recording areas, a conventional character string extraction / attribute assignment process using a marker pen is applied.

次に、ステップS305において、ステップS304で解析した情報、すなわち、複数の異なるマーカー登録色が接して記録されている領域における各マーカー色の面積、または位置情報に基づいて、正しい訂正追記マーカー色を選択する。具体的には、面積の小さい方、またはマーク領域の外周に記録位置のあるマーカー色を正しいマーカー色と判定する。   Next, in step S305, based on the information analyzed in step S304, that is, the area or position information of each marker color in the area where a plurality of different marker registration colors are recorded in contact, the correct correction additional marker color is determined. select. Specifically, a marker color having a recording position on the smaller area or on the outer periphery of the mark area is determined as the correct marker color.

ステップS306では、ステップS305において、正しい訂正追記マーカー色と判定されたマーカー色を正しい属性色と判定してデータベースに登録する。   In step S306, the marker color determined to be the correct corrected additional marker color in step S305 is determined as the correct attribute color and registered in the database.

この処理によって、情報処理装置は、複数のマーカー色が記録された領域から、正しいマーカー色を正確に選択して、そのマーカー色に対応付けられた属性をデータベースに登録することができる。   By this processing, the information processing apparatus can correctly select the correct marker color from the area where a plurality of marker colors are recorded, and register the attribute associated with the marker color in the database.

次に、図13〜図15を参照して、ドキュメントに記録されたマーカーのキャンセル処理例について説明する。これは、本来、マーカー色の設定を行う必要のない領域にオペレータが誤ってマーカー色を設定してしまった場合に、そのマーカー色設定領域が無効、すなわちマーカー色非設定領域とする処理である。   Next, with reference to FIGS. 13 to 15, an example of marker cancellation processing recorded in a document will be described. This is a process in which the marker color setting area is invalid, that is, the marker color non-setting area is set when the operator accidentally sets the marker color in an area where it is not necessary to set the marker color. .

図13は、オペレータがマーカー色を設定した追記ドキュメント350であるが、マーカー色設定領域351がマークミス領域である。マーカー色設定領域351は、本来、いずれのマーカー色も付与すべきでない領域である。本例ではこの領域に登録マーカー色[青]を用いてオペレータがマークを設定してしまった例を示している。   FIG. 13 shows the postscript document 350 in which the operator sets the marker color, but the marker color setting area 351 is a mark miss area. The marker color setting area 351 is an area that should not be provided with any marker color. In this example, the operator sets a mark using the registered marker color [blue] in this area.

このようなマーカー色設定領域をキャンセルする場合のキャンセルルールとして、図13(d)マーカーキャンセルルールを設定し、オペレータはこのルールに従ってマーカーのキャンセルを行なう。図に示すマーカーキャンセル例371は、追記色マーカーの設定領域にかかる位置(文字近傍領域)に予め定めたキャンセル記号を記録する例である。図に示す例では、キャンセル記号は、[レ]である。このキャンセル記号情報は、マーカーペンによる文字列抽出/属性付与処理を実行する情報処理装置に登録され、登録情報に基づいてキャンセル処理が行われる。   As a cancel rule for canceling such a marker color setting area, the marker cancel rule in FIG. 13D is set, and the operator cancels the marker according to this rule. The marker cancel example 371 shown in the figure is an example in which a predetermined cancel symbol is recorded at a position (character vicinity region) related to the setting region of the additional color marker. In the example shown in the figure, the cancel symbol is [Le]. The cancel symbol information is registered in an information processing apparatus that performs character string extraction / attribute assignment processing with a marker pen, and cancel processing is performed based on the registration information.

マーカーキャンセル例372は、追記色マーカーの設定領域にかかる位置に、マーカー色と同色の予め登録された取り消しマークを上書きする例である。図に示す例では、取り消しマークは、[ななめ線]である。この取り消しマークの形状または、マーカー設定領域と取り消しマークの結合領域の形状情報は、マーカーペンによる文字列抽出/属性付与処理を実行する情報処理装置に登録され、登録情報に基づいてキャンセル処理が行われる。なお、キャンセル記号や、取消しマークは、図に示す例以外にも、様々な形状のデータの適用が可能である。   The marker cancellation example 372 is an example in which a previously registered cancellation mark having the same color as the marker color is overwritten at a position related to the setting region of the additional recording color marker. In the example shown in the figure, the cancellation mark is [tanning line]. The shape information of the cancellation mark or the shape setting area of the marker setting area and the cancellation mark is registered in an information processing apparatus that executes a character string extraction / attribute assignment process using a marker pen, and the cancellation process is performed based on the registration information. Is called. In addition to the example shown in the figure, various shapes of data can be applied to the cancel symbol and the cancel mark.

図13に示すマーカーキャンセル例371のようにキャンセル記号を記録するキャンセルルールに従ってマーカー記録のなされたドキュメントに対するマーカーペンによる文字列抽出/属性付与処理アルゴリズムについて、図14に示すフローチャートを参照して説明する。   A character string extraction / attribute assignment processing algorithm using a marker pen for a document recorded with a marker according to a cancel rule for recording a cancel symbol as in the marker cancellation example 371 shown in FIG. 13 will be described with reference to the flowchart shown in FIG. .

まず、情報処理装置は、ステップS401においてスキャン画像を入力する。このスキャン画像は、図13に示すマーカーキャンセル例371のようにキャンセル記号を記録するキャンセルルールに従って記録処理のなされたデータを含むスキャン画像である。ステップS402では、文字解析(OCR)処理を実行する。   First, the information processing apparatus inputs a scan image in step S401. This scan image is a scan image including data that has been subjected to recording processing in accordance with a cancel rule for recording a cancel symbol as in the marker cancellation example 371 shown in FIG. In step S402, a character analysis (OCR) process is executed.

ステップS403では、色抽出処理を実行する。ドキュメントの原本背景および原本の文字等の記録色と異なる色を抽出する。ステップS404では、ステップS403において抽出した色領域の文字近傍に、情報処理装置の記憶部に登録されたキャンセル(否定)記号(例えば[レ])に相当する記号が記載されているか否かを判定する。ステップS405において、キャンセル(否定)記号がないと判定された場合は、ステップS406に進み、マーカー色設定領域のマーカー色を正しい属性対応のマーカー色と判定し、このマーカー色に対応する属性をデータベースに登録する。   In step S403, a color extraction process is executed. A color different from the recorded color of the original background of the document and the original characters is extracted. In step S404, it is determined whether or not a symbol corresponding to a cancel (negative) symbol (for example, [Le]) registered in the storage unit of the information processing device is described in the vicinity of the character in the color region extracted in step S403. To do. If it is determined in step S405 that there is no cancel (negative) symbol, the process proceeds to step S406, where the marker color in the marker color setting area is determined as a marker color corresponding to the correct attribute, and the attribute corresponding to this marker color is stored in the database. Register with.

一方、ステップS405において、キャンセル(否定)記号が検出されたと判定した場合は、ステップS407に進み、マーカー色設定領域のマーカー色は誤記入であり、マーカー色の有効性なしと判断し、属性登録を中止する。   On the other hand, if it is determined in step S405 that a cancel (negative) symbol has been detected, the process proceeds to step S407, where the marker color in the marker color setting area is erroneously entered and it is determined that the marker color is not valid, and attribute registration is performed. Cancel.

次に、図13に示すマーカーキャンセル例372のように取り消しマークを記録するキャンセルルールに従ってマーカー記録のなされたドキュメントに対するマーカーペンによる文字列抽出/属性付与処理アルゴリズムについて、図15に示すフローチャートを参照して説明する。   Next, with reference to the flowchart shown in FIG. 15, the character string extraction / attribute assignment processing algorithm by the marker pen for the document recorded with the marker according to the cancellation rule for recording the cancellation mark as in the marker cancellation example 372 shown in FIG. I will explain.

まず、情報処理装置は、ステップS501においてスキャン画像を入力する。このスキャン画像は、図13に示すマーカーキャンセル例372のように取り消しマークを記録するキャンセルルールに従って記録処理のなされたデータを含むスキャン画像である。ステップS502では、文字解析(OCR)処理を実行する。   First, the information processing apparatus inputs a scan image in step S501. This scan image is a scan image including data that has been subjected to recording processing in accordance with a cancel rule for recording a cancel mark as in the marker cancel example 372 shown in FIG. In step S502, a character analysis (OCR) process is executed.

ステップS503では、色抽出処理を実行する。ドキュメントの原本背景および原本の文字等の記録色と異なる色を抽出する。ステップS504では、ステップS503において抽出した色領域の形状認識を行なう。この形状認識は、情報処理装置に登録された形状との対比処理として実行される。取り消しマークの形状、またはマーカー設定領域と取り消しマークの結合領域の形状情報が情報処理装置の記憶部に登録され、登録情報に基づいて形状判定が行われる。   In step S503, a color extraction process is executed. A color different from the recorded color of the original background of the document and the original characters is extracted. In step S504, the shape of the color region extracted in step S503 is recognized. This shape recognition is executed as a comparison process with the shape registered in the information processing apparatus. The shape information of the cancellation mark, or the shape information of the marker setting area and the combined area of the cancellation mark is registered in the storage unit of the information processing apparatus, and the shape determination is performed based on the registration information.

ステップS505において、取り消しマークが記録された形状に相当する領域がないと判定した場合は、ステップS506に進み、マーカー色設定領域のマーカー色を正しい属性対応のマーカー色と判定し、このマーカー色に対応する属性をデータベースに登録する。   If it is determined in step S505 that there is no area corresponding to the shape in which the cancellation mark is recorded, the process proceeds to step S506, where the marker color in the marker color setting area is determined as the marker color corresponding to the correct attribute, and this marker color is set. Register the corresponding attribute in the database.

一方、ステップS505において、取り消しマークが記録された形状に相当する領域が検出された場合は、ステップS507に進み、マーカー色設定領域のマーカー色は誤記入であり、マーカー色の有効性なしと判断し、属性登録を中止する。   On the other hand, if an area corresponding to the shape in which the cancel mark is recorded is detected in step S505, the process proceeds to step S507, where the marker color in the marker color setting area is erroneously entered and it is determined that the marker color is not valid. And cancel the attribute registration.

このように、本実施例では、マーカーペンによる文字列抽出/属性付与処理を実行する情報処理装置において、予め登録されたキャンセル記号や取り消しマークに相当する記録情報の有無を判断し、これらの記号やマークの検出に基づいて、マーカー色設定領域のマーカーを無効と判断し、属性登録を中止するので、マーカー設定処理のやり直しといった手間を省略することができ、効率的で正確なマーカーインデックス処理が実現される。   As described above, in this embodiment, in the information processing apparatus that executes the character string extraction / attribute assignment process using the marker pen, it is determined whether or not there is recording information corresponding to a cancel symbol or cancellation mark registered in advance, and these symbols are used. Based on the detection of the mark, the marker in the marker color setting area is determined to be invalid, and the attribute registration is canceled, so that it is possible to save time and effort for the marker setting process and to perform efficient and accurate marker index processing. Realized.

次に、上述した処理を実行する本発明の情報処理装置の機能構成について、図16に示すブロック図を参照して説明する。上述した実施例において説明した各種の処理、すなわち、図7、図9、図12、図14、図15の各フローチャートに従った処理は、例えばPC等の情報処理装置において実行されるプログラムに従ってデータ処理部としてのCPUの制御によって行なわれる。図16は、これら一連のデータ処理を説明するために機能別に区分して示したブロック図である。すなわち、本発明の情報処理装置の有するデータ処理実行機能をブロックとして示してある。以下、このブロック図に従って、本発明の情報処理装置の実行機能について説明する。   Next, the functional configuration of the information processing apparatus of the present invention that executes the above-described processing will be described with reference to the block diagram shown in FIG. The various processes described in the above-described embodiments, that is, the processes according to the flowcharts of FIGS. 7, 9, 12, 14, and 15 are performed according to programs executed in an information processing apparatus such as a PC. This is performed under the control of the CPU as the processing unit. FIG. 16 is a block diagram showing the data processing in order to explain the series of data processing. That is, the data processing execution function of the information processing apparatus of the present invention is shown as a block. The execution function of the information processing apparatus of the present invention will be described below with reference to this block diagram.

本発明の情報処理装置は、図16に示すように、様々な色のマーカーによって追記された追記ドキュメントのスキャン画像を入力する画像入力部401、画像入力部401に入力された追記ドキュメント上の文字認識(OCR)を実行する文字認識処理部と、追記ドキュメント上の色領域を抽出する色領域抽出部403と、図7、または図9、または図12のフローに従って、複数の異なる色の接触領域を持つ色領域の解析を実行して、正しいマーカー色を識別する正規マーカー色判定部404と、正規マーカー色判定部404において決定された正規マーカー色に対応して登録された属性を、該マーカーの設定領域の記録情報に対応する属性と判定する属性判定部405と、図14または図15のフローに従って、マーカー色の有効性判定を実行する有効性判定部406と、属性判定部405の決定した属性を文字認識処理部402の解析文字情報の属性として設定してデータベースに登録するデータ登録部407を有する。正規マーカー色判定部404には、登録色判定部411、元色解析部412、統合処理部413、マーカー色選択部414が含まれる。   As shown in FIG. 16, the information processing apparatus according to the present invention includes an image input unit 401 that inputs a scan image of a postscript document that is additionally written with various color markers, and characters on the postscript document that are input to the image input unit 401. A character recognition processing unit that performs recognition (OCR), a color region extraction unit 403 that extracts a color region on a postscript document, and contact regions of a plurality of different colors according to the flow of FIG. 7, FIG. 9, or FIG. The normal marker color determination unit 404 for identifying the correct marker color by executing the analysis of the color region having the following and the attribute registered corresponding to the normal marker color determined by the normal marker color determination unit 404 The attribute determination unit 405 that determines the attribute corresponding to the recording information in the setting area of the marker and the marker color validity determination according to the flow of FIG. With a validity determination unit 406 for performing the data registration unit 407 for registering the determined attribute of the attribute determination unit 405 in the database is set as an attribute of the analysis character information of the character recognition processing unit 402. The regular marker color determination unit 404 includes a registered color determination unit 411, an original color analysis unit 412, an integration processing unit 413, and a marker color selection unit 414.

先に説明した図7のフローチャートに従った処理を実行する構成においては、正規マーカー色判定部404の登録色判定部411は、色領域抽出部403において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色と、登録されていない非登録色のいずれであるかを判別する処理を実行し、元色部解析部412が、混色による非登録色について、混色の元色である登録色を解析し、統合処理部413において、登録色領域と混色領域を統合して、マーカー色選択部414において統合処理部の統合結果に基づいて、正規マーカー色を選択する。マーカー色選択部414は、統合処理部413において生成された複数の統合領域について、色領域内の文字列方向の長さを比較し、より長い統合領域に対応するマーカー色を正規マーカー色として選択する処理を実行する。なお、情報処理装置は、予め追記マーカー色として登録された登録色に基づいて生成される混色についての登録情報としての混色情報テーブルを記憶部に保持し、元色部解析部412は、この混色情報テーブルに基づいて、混色による非登録色について、混色の元色である登録色を解析する処理を実行する。   In the configuration in which the process according to the flowchart of FIG. 7 described above is executed, the registered color determination unit 411 of the normal marker color determination unit 404 performs the following processing on the colors included in the color region extracted by the color region extraction unit 403. A process of determining whether the color is a registered color registered in advance as an additional marker color or an unregistered non-registered color is performed, and the original color part analysis unit 412 determines the original color mixture for the non-registered color due to the mixed color. The registered color, which is a color, is analyzed, the integrated processing unit 413 integrates the registered color region and the mixed color region, and the marker color selection unit 414 selects a normal marker color based on the integration result of the integration processing unit. The marker color selection unit 414 compares the lengths in the character string direction in the color regions for a plurality of integration regions generated by the integration processing unit 413, and selects a marker color corresponding to the longer integration region as a normal marker color Execute the process. Note that the information processing apparatus holds a color mixture information table as registration information about color mixture generated based on the registered color registered in advance as the additional marker color in the storage unit, and the original color part analysis unit 412 Based on the information table, for the non-registered color due to the color mixture, processing for analyzing the registered color that is the original color of the color mixture is executed.

また、先に説明した図9のフローチャートに従った処理を実行する構成においては、正規マーカー色判定部404の登録色判定部411は、色領域抽出部403において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色と、登録されていない非登録色のいずれであるかを判別し、統合処理部413において、非登録色領域を登録色領域に統合する処理を実行し、マーカー色選択部414が統合処理部413の統合結果としての統合領域を構成する登録色を正規マーカー色として選択する。   In the configuration in which the processing according to the flowchart of FIG. 9 described above is executed, the registered color determination unit 411 of the normal marker color determination unit 404 includes colors included in the color region extracted by the color region extraction unit 403. Is determined whether it is a registered color registered in advance as an additional marker color or an unregistered non-registered color, and the integration processing unit 413 executes a process of integrating the non-registered color area into the registered color area Then, the marker color selection unit 414 selects a registered color constituting the integrated region as the integration result of the integration processing unit 413 as a normal marker color.

さらに、先に説明した図12のフローチャートに従った処理を実行する構成においては、正規マーカー色判定部404の登録色判定部411は、色領域抽出部403において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色の領域を抽出し、マーカー色選択部414は、登録色判定部411において抽出された登録色領域の面積または位置を解析し、解析情報に基づいて正規マーカー色を選択する。マーカー色選択部414は、登録色判定部411において抽出された登録色領域中、面積が小さい登録色領域、または、登録色判定部411において抽出された登録色領域中、より外周に記録位置のある登録色領域を構成する登録色を正規マーカー色として選択する処理を実行する。   Furthermore, in the configuration in which the process according to the flowchart of FIG. 12 described above is executed, the registered color determination unit 411 of the normal marker color determination unit 404 includes the color included in the color region extracted by the color region extraction unit 403. The registered color region registered in advance as the additional marker color is extracted, and the marker color selection unit 414 analyzes the area or position of the registered color region extracted by the registered color determination unit 411, and based on the analysis information Select a regular marker color. The marker color selection unit 414 has a recording position on the outer periphery of the registration color region extracted by the registration color determination unit 411, the registration color region having a small area, or the registration color region extracted by the registration color determination unit 411. A process of selecting a registered color constituting a registered color area as a normal marker color is executed.

さらに、先に説明した図14または図15のフローチャートに従った処理を実行する構成においては、有効性判定部406が、色領域抽出部403において抽出された色領域上または色領域近傍にある記号の検出処理、または色領域の形状の解析に基づいて、該色領域に設定されたマーカー色の有効性判定処理を実行する。   Furthermore, in the configuration in which the processing according to the flowchart of FIG. 14 or FIG. 15 described above is executed, the validity determination unit 406 is a symbol on or near the color region extracted by the color region extraction unit 403. Based on this detection processing or analysis of the shape of the color region, the validity determination processing of the marker color set in the color region is executed.

最後に、図17を参照して、本発明の情報処理装置のハードウェア構成例について説明する。図17に示す構成は、例えばPCなどによって構成される情報処理装置であり、スキャナ等のデータ読み取り部531と、プリンタなどのデータ出力部532を備えたハードウェア構成例を示している。   Finally, with reference to FIG. 17, a hardware configuration example of the information processing apparatus of the present invention will be described. The configuration illustrated in FIG. 17 is an information processing apparatus including, for example, a PC, and illustrates a hardware configuration example including a data reading unit 531 such as a scanner and a data output unit 532 such as a printer.

CPU(Central Processing Unit)501は、上述の実施例において説明した図7、図9、図12、図14、図15の各フローチャートに従った各種のデータ処理、すなわち、例えばOCR処理、色領域抽出処理、色判定処理、混色の元色判定処理、色領域統合処理、色領域長さ判定処理、色領域の面積、位置判定処理、キャンセル記号、取り消しマーク検出処理、属性登録処理等の各処理の実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行するデータ処理部である。   A CPU (Central Processing Unit) 501 performs various types of data processing according to the flowcharts of FIGS. 7, 9, 12, 14, and 15 described in the above-described embodiments, that is, for example, OCR processing, color region extraction. Processing, color determination processing, mixed color original color determination processing, color region integration processing, color region length determination processing, color region area, position determination processing, cancel symbol, cancellation mark detection processing, attribute registration processing, etc. A data processing unit that executes processing according to a computer program describing an execution sequence.

ROM(Read Only Memory)502は、CPU501が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)503は、CPU501の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス504により相互に接続されている。   A ROM (Read Only Memory) 502 stores programs used by the CPU 501, calculation parameters, and the like. A RAM (Random Access Memory) 503 stores programs used in the execution of the CPU 501, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 504 including a CPU bus.

ホストバス504は、ブリッジ505を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス506に接続されている。   The host bus 504 is connected to an external bus 506 such as a PCI (Peripheral Component Interconnect / Interface) bus via a bridge 505.

キーボード508、ポインティングデバイス509は、ユーザにより操作される入力デバイスである。ディスプレイ510は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。   A keyboard 508 and a pointing device 509 are input devices operated by the user. The display 510 includes a liquid crystal display device, a CRT (Cathode Ray Tube), or the like, and displays various information as text or image information.

HDD(Hard Disk Drive)511は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU501によって実行するプログラムや情報を記録または再生させる。ハードディスクは、ドキュメントとしての原本ドキュメントや、マーカー色による追記のなされた追記ドキュメント、マーカー色と属性との対応関係テーブル、減法混色に基づく色解析処理に適用する混色情報テーブル、キャンセル記号、取り消しマークなどの情報などを格納する。さらに、各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。   An HDD (Hard Disk Drive) 511 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the CPU 501 and information. The hard disk is an original document as a document, an additional document with additional marker colors, a correspondence table between marker colors and attributes, a mixed color information table applied to color analysis processing based on subtractive color mixing, cancel symbols, cancel marks, etc. Store information such as. Further, various computer programs such as various data processing programs are stored.

ドライブ512は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体521に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース507、外部バス506、ブリッジ505、およびホストバス504を介して接続されているRAM503に供給する。リムーバブル記録媒体521も、ハードディスクと同様のデータ記録領域として利用可能である。   The drive 512 reads data or a program recorded on a removable recording medium 521 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and the data or program is read out from the interface 507 and the external bus 506. , And supplied to the RAM 503 connected via the bridge 505 and the host bus 504. The removable recording medium 521 can also be used as a data recording area similar to a hard disk.

接続ポート514は、外部接続機器522を接続するポートであり、USB,IEEE1394等の接続部を持つ。接続ポート514は、インタフェース507、および外部バス506、ブリッジ505、ホストバス504等を介してCPU501等に接続されている。通信部515は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部531は、ドキュメントの読み取り処理を実行し、データ出力部532は、ドキュメントデータの出力処理を実行する。   The connection port 514 is a port for connecting the external connection device 522 and has a connection unit such as USB or IEEE1394. The connection port 514 is connected to the CPU 501 and the like via the interface 507, the external bus 506, the bridge 505, the host bus 504, and the like. The communication unit 515 is connected to a network and executes data communication processing with the outside. The data reading unit 531 executes document reading processing, and the data output unit 532 executes document data output processing.

なお、図17に示す情報処理装置のハードウェア構成例は、1つの装置例を示すものであり、本発明の情報処理装置は、図17に示す構成に限らず、上述した実施例において説明した処理を実行可能な構成であればよい。   Note that the hardware configuration example of the information processing apparatus shown in FIG. 17 shows one example of the apparatus, and the information processing apparatus of the present invention is not limited to the configuration shown in FIG. Any configuration capable of executing the process may be used.

以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。   The present invention has been described in detail above with reference to specific embodiments. However, it is obvious that those skilled in the art can make modifications and substitutions of the embodiments without departing from the gist of the present invention. In other words, the present invention has been disclosed in the form of exemplification, and should not be interpreted in a limited manner. In order to determine the gist of the present invention, the claims should be taken into consideration.

なお、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。   The series of processes described in the specification can be executed by hardware, software, or a combined configuration of both. When executing processing by software, the program recording the processing sequence is installed in a memory in a computer incorporated in dedicated hardware and executed, or the program is executed on a general-purpose computer capable of executing various processing. It can be installed and run.

例えば、プログラムは記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。あるいは、プログラムはフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することができる。   For example, the program can be recorded in advance on a hard disk or ROM (Read Only Memory) as a recording medium. Alternatively, the program is temporarily or permanently stored on a removable recording medium such as a flexible disk, a CD-ROM (Compact Disc Read Only Memory), an MO (Magneto optical) disk, a DVD (Digital Versatile Disc), a magnetic disk, or a semiconductor memory. It can be stored (recorded). Such a removable recording medium can be provided as so-called package software.

なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。   The program is installed on the computer from the removable recording medium as described above, or is wirelessly transferred from the download site to the computer, or is wired to the computer via a network such as a LAN (Local Area Network) or the Internet. The computer can receive the program transferred in this manner and install it on a recording medium such as a built-in hard disk.

なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。   Note that the various processes described in the specification are not only executed in time series according to the description, but may be executed in parallel or individually according to the processing capability of the apparatus that executes the processes or as necessary. Further, in this specification, the system is a logical set configuration of a plurality of devices, and the devices of each configuration are not limited to being in the same casing.

以上、説明したように、本発明の構成によれば、例えば、文書ドキュメントに対するマーカーペンによる文字列抽出/属性付与処理、すなわち、色マーカーによる追記のなされた追記ドキュメントからマーカー色を解析して、マーカー色に基づくドキュメント情報の属性判定処理を実行する構成において、追記ドキュメント上の色情報を取得し、抽出した色領域中、複数の異なる色の接触領域を持つ色領域の解析を実行して、正しいマーカー色を識別する構成とした。具体的には、誤って記録されたマーカー色の記録後に、予め決められたルールに従って正しいマーカー色の記録を実行し、その記録ルールに対応する解析アルゴリズムを適用して正しいマーカー色を判別する構成としたので、全てのマーカー色の設定やり直し等の再処理を行なうことなく効率的で確実なマーカーペンによる文字列抽出/属性付与処理が可能となる。   As described above, according to the configuration of the present invention, for example, character string extraction / attribute assignment processing by a marker pen for a document document, that is, by analyzing a marker color from a postscript document that has been postscripted by a color marker, In the configuration that executes the document information attribute determination process based on the marker color, obtain the color information on the postscript document, execute the analysis of the color area having a plurality of different color contact areas in the extracted color area, The correct marker color is identified. Specifically, after recording a marker color that has been recorded in error, the correct marker color is recorded in accordance with a predetermined rule, and an analysis algorithm corresponding to the recording rule is applied to determine the correct marker color Therefore, efficient and reliable character string extraction / attribute assignment processing with a marker pen can be performed without performing reprocessing such as re-setting of all marker colors.

マーカーペンによる文字列抽出/属性付与処理の一般的処理例について説明する図である。It is a figure explaining the general processing example of the character string extraction / attribute provision process by a marker pen. マーカーペンによる文字列抽出/属性付与処理の具体的処理例について説明する図である。It is a figure explaining the specific process example of the character string extraction / attribute provision process by a marker pen. 本発明のマーカーペンによる文字列抽出/属性付与処理におけるマーカー記録ルールの一例について説明する図である。It is a figure explaining an example of the marker recording rule in the character string extraction / attribute provision process by the marker pen of this invention. 本発明のマーカーペンによる文字列抽出/属性付与処理におけるマーカー記録ルールの一例について説明する図である。It is a figure explaining an example of the marker recording rule in the character string extraction / attribute provision process by the marker pen of this invention. 減法混色の発生状況について説明する図である。It is a figure explaining the generation | occurrence | production state of subtractive color mixing. 本発明の情報処理装置の記憶部に記録される混色情報テーブルの構成例を示す図である。It is a figure which shows the structural example of the color mixing information table recorded on the memory | storage part of the information processing apparatus of this invention. 本発明の情報処理装置におけるマーカーペンによる文字列抽出/属性付与処理の処理アルゴリズムの一例を説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining an example of the process algorithm of the character string extraction / attribute provision process by the marker pen in the information processing apparatus of this invention. 図7に示すフローに従ったアルゴリズムに対応する具体的な処理例を説明する図である。It is a figure explaining the specific process example corresponding to the algorithm according to the flow shown in FIG. 本発明の情報処理装置におけるマーカーペンによる文字列抽出/属性付与処理の処理アルゴリズムの一例を説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining an example of the process algorithm of the character string extraction / attribute provision process by the marker pen in the information processing apparatus of this invention. 図9に示すフローに従ったアルゴリズムに対応する具体的な処理例を説明する図である。It is a figure explaining the example of a specific process corresponding to the algorithm according to the flow shown in FIG. 本発明のマーカーペンによる文字列抽出/属性付与処理におけるマーカー記録ルールの一例について説明する図である。It is a figure explaining an example of the marker recording rule in the character string extraction / attribute provision process by the marker pen of this invention. 本発明の情報処理装置におけるマーカーペンによる文字列抽出/属性付与処理の処理アルゴリズムの一例を説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining an example of the process algorithm of the character string extraction / attribute provision process by the marker pen in the information processing apparatus of this invention. 本発明のマーカーペンによる文字列抽出/属性付与処理におけるマーカーキャンセルルールの一例について説明する図である。It is a figure explaining an example of the marker cancellation rule in the character string extraction / attribute provision process by the marker pen of this invention. 本発明の情報処理装置におけるマーカーペンによる文字列抽出/属性付与処理の処理アルゴリズムの一例を説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining an example of the process algorithm of the character string extraction / attribute provision process by the marker pen in the information processing apparatus of this invention. 本発明の情報処理装置におけるマーカーペンによる文字列抽出/属性付与処理の処理アルゴリズムの一例を説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining an example of the process algorithm of the character string extraction / attribute provision process by the marker pen in the information processing apparatus of this invention. 本発明の情報処理装置の機能構成例について説明するブロック図である。It is a block diagram explaining the functional structural example of the information processing apparatus of this invention. 本発明の情報処理装置のハードウェア構成例について説明する図である。It is a figure explaining the hardware structural example of the information processing apparatus of this invention.

符号の説明Explanation of symbols

11 原本ドキュメント
21 追記ドキュメント
51 情報処理装置
52 プリンタ
53 スキャナ
54 データベース
71 マーカー色属性対応テーブル
72 解析データ
100 追記ドキュメント
101〜104 マーカー色設定領域
110 追記ドキュメント
201 マーカー色設定領域
241 抽出色
242 減法混色の可能性のある部分空間
251 抽出色
252 減法混色の可能性のある部分空間
301,302 マーカー色設定領域
321 マーカー設定例
322 マーカー設定例
350 追記ドキュメント
351 マーカー色設定領域
371 マーカーキャンセル例
372 マーカーキャンセル例
401 画像入力部
402 文字認識処理部
403 色領域抽出部
404 正規マーカー色判定部
405 属性判定部
406 有効性判定部
407 データ登録部
411 登録色判定部
412 元色判定部
413 統合処理部
414 マーカー色選択部
501 CPU(Central Processing Unit)
502 ROM(Read-Only-Memory)
503 RAM(Random Access Memory)
504 ホストバス
505 ブリッジ
506 外部バス
507 インタフェース
508 キーボード
509 ポインティングデバイス
510 ディスプレイ
511 HDD(Hard Disk Drive)
512 ドライブ
514 接続ポート
515 通信部
521 リムーバブル記録媒体
522 外部接続機器
531 データ読み取り部
532 データ出力部
DESCRIPTION OF SYMBOLS 11 Original document 21 Additional record document 51 Information processing apparatus 52 Printer 53 Scanner 54 Database 71 Marker color attribute correspondence table 72 Analysis data 100 Additional record document 101-104 Marker color setting area 110 Additional record document 201 Marker color setting area 241 Extracted color 242 Subtractive color mixture Possible subspace 251 Extracted color 252 Partial space with possible subtractive color mixing 301, 302 Marker color setting area 321 Marker setting example 322 Marker setting example 350 Additional writing document 351 Marker color setting area 371 Marker cancellation example 372 Marker cancellation example 401 Image input unit 402 Character recognition processing unit 403 Color region extraction unit 404 Regular marker color determination unit 405 Attribute determination unit 406 Validity determination unit 407 Over data registration unit 411 registers color determining section 412 yuan color determining section 413 integration processing unit 414 marker color selection unit 501 CPU (Central Processing Unit)
502 ROM (Read-Only-Memory)
503 RAM (Random Access Memory)
504 Host bus 505 Bridge 506 External bus 507 Interface 508 Keyboard 509 Pointing device 510 Display 511 HDD (Hard Disk Drive)
512 drive 514 connection port 515 communication unit 521 removable recording medium 522 external connection device 531 data reading unit 532 data output unit

Claims (17)

ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理装置であり、
ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上の色情報を取得する色領域抽出部と、
前記色領域抽出部において抽出された色領域中、複数の異なる色の接触領域を持つ色領域の解析を実行して、正しいマーカー色を識別する正規マーカー色判定部と、
前記正規マーカー色判定部において決定された正規マーカー色に対応して登録された属性を、該マーカーの設定領域の記録情報に対応する属性と判定する属性判定部と、
を有することを特徴とする情報処理装置。
An information processing apparatus that executes an attribute determination process for document information based on a marker color added to a document,
A color area extraction unit that inputs a postscript document with a marker color added to the document and obtains color information on the postscript document;
A normal marker color determination unit that identifies a correct marker color by performing an analysis of a color region having a plurality of different color contact regions in the color region extracted by the color region extraction unit;
An attribute determination unit that determines an attribute registered corresponding to the normal marker color determined in the normal marker color determination unit as an attribute corresponding to the recording information of the setting area of the marker;
An information processing apparatus comprising:
前記正規マーカー色判定部は、
前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色と、登録されていない非登録色のいずれであるかを判別する登録色判定部と、
混色による非登録色について、混色の元色である登録色を解析する元色部解析部と、
登録色領域と、混色領域を統合する統合処理部と、
前記統合処理部の統合結果に基づいて、正規マーカー色を選択するマーカー色選択部とを有する構成であることを特徴とする請求項1に記載の情報処理装置。
The regular marker color determination unit
A registered color determination unit for determining whether a color included in the color region extracted by the color region extraction unit is a registered color registered in advance as a postscript marker color or an unregistered non-registered color;
For a non-registered color due to a mixed color, an original color part analysis unit that analyzes a registered color that is the original color of the mixed color;
An integrated processing unit that integrates the registered color area and the mixed color area;
The information processing apparatus according to claim 1, further comprising: a marker color selection unit that selects a normal marker color based on an integration result of the integration processing unit.
前記マーカー色選択部は、
前記統合処理部において生成された複数の統合領域について、色領域内の文字列方向の長さを比較し、より長い統合領域に対応するマーカー色を正規マーカー色として選択する処理を実行する構成であることを特徴とする請求項2に記載の情報処理装置。
The marker color selection unit
For a plurality of integrated regions generated in the integrated processing unit, the length in the character string direction in the color region is compared, and a process of selecting a marker color corresponding to the longer integrated region as a normal marker color is executed. The information processing apparatus according to claim 2, wherein the information processing apparatus is provided.
前記情報処理装置は、
予め追記マーカー色として登録された登録色に基づいて生成される混色についての登録情報としての混色情報テーブルを記憶部に保持し、
前記元色部解析部は、
前記混色情報テーブルに基づいて、混色による非登録色について、混色の元色である登録色を解析する処理を実行する構成であることを特徴とする請求項2に記載の情報処理装置。
The information processing apparatus includes:
A color mixing information table as registration information about color mixing generated based on a registered color registered in advance as a postscript marker color is held in the storage unit,
The original color part analysis part is
The information processing apparatus according to claim 2, wherein the information processing apparatus is configured to execute a process of analyzing a registered color that is an original color of the mixed colors based on the mixed color information table.
前記正規マーカー色判定部は、
前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色と、登録されていない非登録色のいずれであるかを判別する登録色判定部と、
非登録色領域を登録色領域に統合する統合処理部と、
前記統合処理部の統合結果としての統合領域を構成する登録色を正規マーカー色として選択するマーカー色選択部とを有する構成であることを特徴とする請求項1に記載の情報処理装置。
The regular marker color determination unit
A registered color determination unit for determining whether a color included in the color region extracted by the color region extraction unit is a registered color registered in advance as a postscript marker color or an unregistered non-registered color;
An integrated processing unit that integrates unregistered color areas into registered color areas;
The information processing apparatus according to claim 1, further comprising: a marker color selection unit that selects a registered color that constitutes an integration region as an integration result of the integration processing unit as a normal marker color.
前記正規マーカー色判定部は、
前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色の領域を抽出する登録色判定部と、
前記登録色判定部において抽出された登録色領域の面積または位置を解析し、解析情報に基づいて正規マーカー色を選択するマーカー色選択部とを有する構成であることを特徴とする請求項1に記載の情報処理装置。
The regular marker color determination unit
A registered color determination unit that extracts a region of a registered color that is registered in advance as a postscript marker color for colors included in the color region extracted by the color region extraction unit;
2. The marker color selection unit that analyzes the area or position of the registered color region extracted in the registered color determination unit and selects a normal marker color based on the analysis information. The information processing apparatus described.
前記マーカー色選択部は、
前記登録色判定部において抽出された登録色領域中、面積が小さい登録色領域、または、前記登録色判定部において抽出された登録色領域中、より外周に記録位置のある登録色領域を構成する登録色を正規マーカー色として選択する処理を実行する構成であることを特徴とする請求項6に記載の情報処理装置。
The marker color selection unit
A registered color region having a smaller recording area in the registered color region extracted in the registered color determination unit or a registered color region having a recording position on the outer periphery in the registered color region extracted in the registered color determination unit. The information processing apparatus according to claim 6, wherein the processing for selecting a registered color as a normal marker color is executed.
前記情報処理装置は、さらに、
前記色領域抽出部において抽出された色領域上または色領域近傍にある記号の検出処理、または前記色領域の形状の解析に基づいて、該色領域に設定されたマーカー色の有効性判定処理を行なう有効性判定部を有することを特徴とする請求項1に記載の情報処理装置。
The information processing apparatus further includes:
Based on the detection process of the symbol on or near the color area extracted by the color area extraction unit, or the analysis of the shape of the color area, the validity determination process of the marker color set in the color area is performed. The information processing apparatus according to claim 1, further comprising an effectiveness determination unit that performs the determination.
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理方法であり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上の色情報を取得する色領域抽出ステップと、
正規マーカー色判定部において、前記色領域抽出部において抽出された色領域中、複数の異なる色の接触領域を持つ色領域の解析を実行して、正しいマーカー色を識別する正規マーカー色判定ステップと、
属性判定部において、前記正規マーカー色判定部において決定された正規マーカー色に対応して登録された属性を、該マーカーの設定領域の記録情報に対応する属性と判定する属性判定ステップと、
を有することを特徴とする情報処理方法。
In the information processing apparatus, an information processing method for executing attribute determination processing of document information based on a marker color added to a document,
In the color region extraction unit, a color region extraction step of inputting a postscript document in which a marker color is added to the document and obtaining color information on the postscript document;
In the normal marker color determination unit, a normal marker color determination step for performing analysis of a color region having a plurality of different color contact regions in the color region extracted in the color region extraction unit to identify a correct marker color; ,
An attribute determination step of determining, in the attribute determination unit, an attribute registered corresponding to the normal marker color determined in the normal marker color determination unit as an attribute corresponding to the recording information of the setting area of the marker;
An information processing method characterized by comprising:
前記正規マーカー色判定ステップは、
前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色と、登録されていない非登録色のいずれであるかを判別する登録色判定ステップと、
混色による非登録色について、混色の元色である登録色を解析する元色部解析ステップと、
登録色領域と、混色領域を統合する統合処理ステップと、
前記統合処理ステップにおける統合結果に基づいて、正規マーカー色を選択するマーカー色選択ステップとを有することを特徴とする請求項9に記載の情報処理方法。
The regular marker color determination step includes
A registered color determination step for determining whether a color included in the color region extracted by the color region extraction unit is a registered color registered in advance as a postscript marker color or a non-registered color that is not registered;
For a non-registered color due to a mixed color, an original color part analysis step for analyzing a registered color that is the original color of the mixed color;
An integrated processing step for integrating the registered color area and the mixed color area;
The information processing method according to claim 9, further comprising: a marker color selection step of selecting a normal marker color based on an integration result in the integration processing step.
前記マーカー色選択ステップは、
前記統合処理ステップにおいて生成された複数の統合領域について、色領域内の文字列方向の長さを比較し、より長い統合領域に対応するマーカー色を正規マーカー色として選択する処理を実行することを特徴とする請求項10に記載の情報処理方法。
The marker color selection step includes
For a plurality of integrated regions generated in the integrated processing step, performing a process of comparing lengths in the character string direction in the color region and selecting a marker color corresponding to the longer integrated region as a normal marker color The information processing method according to claim 10.
前記情報処理装置は、
予め追記マーカー色として登録された登録色に基づいて生成される混色についての登録情報としての混色情報テーブルを記憶部に保持し、
前記元色部解析ステップは、
前記混色情報テーブルに基づいて、混色による非登録色について、混色の元色である登録色を解析する処理を実行することを特徴とする請求項10に記載の情報処理方法。
The information processing apparatus includes:
A color mixing information table as registration information about color mixing generated based on a registered color registered in advance as a postscript marker color is held in the storage unit,
The original color part analysis step includes
11. The information processing method according to claim 10, wherein a process of analyzing a registered color that is an original color of a mixed color is executed for a non-registered color due to the mixed color based on the mixed color information table.
前記正規マーカー色判定ステップは、
前記色領域抽出ステップにおいて抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色と、登録されていない非登録色のいずれであるかを判別する登録色判定ステップと、
非登録色領域を登録色領域に統合する統合処理ステップと、
前記統合処理ステップにおける統合結果としての統合領域を構成する登録色を正規マーカー色として選択するマーカー色選択ステップとを有することを特徴とする請求項9に記載の情報処理方法。
The regular marker color determination step includes
A registered color determination step for determining whether a color included in the color region extracted in the color region extraction step is a registered color registered in advance as a postscript marker color or an unregistered non-registered color;
An integration processing step for integrating the non-registered color area into the registered color area;
The information processing method according to claim 9, further comprising: a marker color selection step of selecting a registered color that constitutes an integration region as an integration result in the integration processing step as a normal marker color.
前記正規マーカー色判定ステップは、
前記色領域抽出ステップにおいて抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色の領域を抽出する登録色判定ステップと、
前記登録色判定ステップにおいて抽出された登録色領域の面積または位置を解析し、解析情報に基づいて正規マーカー色を選択するマーカー色選択ステップとを有することを特徴とする請求項9に記載の情報処理方法。
The regular marker color determination step includes
A registered color determination step for extracting a registered color area registered in advance as a postscript marker color for colors included in the color area extracted in the color area extracting step;
The information according to claim 9, further comprising: a marker color selection step of analyzing an area or position of the registered color region extracted in the registered color determination step and selecting a normal marker color based on the analysis information. Processing method.
前記マーカー色選択ステップは、
前記登録色判定ステップにおいて抽出された登録色領域中、面積が小さい登録色領域、または、前記登録色判定ステップにおいて抽出された登録色領域中、より外周に記録位置のある登録色領域を構成する登録色を正規マーカー色として選択する処理を実行することを特徴とする請求項14に記載の情報処理方法。
The marker color selection step includes
In the registered color area extracted in the registered color determination step, a registered color area having a small area, or in the registered color area extracted in the registered color determination step, a registered color area having a recording position on the outer periphery is configured. The information processing method according to claim 14, wherein a process of selecting a registered color as a normal marker color is executed.
前記情報処理方法は、さらに、
有効性判定部において、前記色領域抽出ステップで抽出された色領域上または色領域近傍にある記号の検出処理、または前記色領域の形状の解析に基づいて、該色領域に設定されたマーカー色の有効性判定処理を行なう有効性判定ステップを有することを特徴とする請求項9に記載の情報処理方法。
The information processing method further includes:
In the validity determination unit, the marker color set in the color area based on the detection processing of the symbol on or near the color area extracted in the color area extraction step or the analysis of the shape of the color area The information processing method according to claim 9, further comprising a validity determination step for performing a validity determination process.
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行させるコンピュータ・プログラムであり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上の色情報を取得させる色領域抽出ステップと、
正規マーカー色判定部において、前記色領域抽出部において抽出された色領域中、複数の異なる色の接触領域を持つ色領域の解析を実行して、正しいマーカー色を識別させる正規マーカー色判定ステップと、
属性判定部において、前記正規マーカー色判定部において決定された正規マーカー色に対応して登録された属性を、該マーカーの設定領域の記録情報に対応する属性と判定させる属性判定ステップと、
を実行させることを特徴とするコンピュータ・プログラム。
In the information processing apparatus, a computer program for executing an attribute determination process of document information based on a marker color added to a document,
In the color region extraction unit, a color region extraction step of inputting a postscript document in which a marker color is added to the document and acquiring color information on the postscript document,
In the normal marker color determination unit, a normal marker color determination step for performing analysis of a color region having a plurality of different color contact regions in the color region extracted in the color region extraction unit to identify a correct marker color; ,
An attribute determination step for determining, in the attribute determination unit, an attribute registered corresponding to the normal marker color determined by the normal marker color determination unit as an attribute corresponding to the recording information of the setting area of the marker;
A computer program for executing
JP2006110502A 2006-04-13 2006-04-13 Information processor and information processing method, and computer program Pending JP2007286710A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006110502A JP2007286710A (en) 2006-04-13 2006-04-13 Information processor and information processing method, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006110502A JP2007286710A (en) 2006-04-13 2006-04-13 Information processor and information processing method, and computer program

Publications (1)

Publication Number Publication Date
JP2007286710A true JP2007286710A (en) 2007-11-01

Family

ID=38758447

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006110502A Pending JP2007286710A (en) 2006-04-13 2006-04-13 Information processor and information processing method, and computer program

Country Status (1)

Country Link
JP (1) JP2007286710A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007299094A (en) * 2006-04-28 2007-11-15 Fuji Xerox Co Ltd Information processor, information processing method, and computer program
CN112306418A (en) * 2020-11-09 2021-02-02 中国船舶重工集团公司第七0七研究所九江分部 Data recording method based on RawFS in VxWorks environment

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007299094A (en) * 2006-04-28 2007-11-15 Fuji Xerox Co Ltd Information processor, information processing method, and computer program
JP4697035B2 (en) * 2006-04-28 2011-06-08 富士ゼロックス株式会社 Information processing apparatus, information processing method, and computer program
CN112306418A (en) * 2020-11-09 2021-02-02 中国船舶重工集团公司第七0七研究所九江分部 Data recording method based on RawFS in VxWorks environment
CN112306418B (en) * 2020-11-09 2022-10-21 中国船舶重工集团公司第七0七研究所九江分部 Data recording method based on RawFS in VxWorks environment

Similar Documents

Publication Publication Date Title
JP4631749B2 (en) Information processing apparatus, information processing method, and computer program
US8213717B2 (en) Document processing apparatus, document processing method, recording medium and data signal
US8418050B2 (en) Computer readable recording medium on which form data extracting program is recorded, form data extracting apparatus, and form data extracting method
JP2006229670A (en) Image formation device and program
JP4591229B2 (en) Image processing apparatus, image processing method, and computer program
CN106557702A (en) Image processing equipment and image processing method
JP2021043775A (en) Information processing device and program
JP4591230B2 (en) Image processing apparatus, image processing method, and computer program
US20070165261A1 (en) Tampering detection apparatus and tampering detection method for printed document
JP4440283B2 (en) Image processing apparatus, control method thereof, control program, and storage medium
JP2007286710A (en) Information processor and information processing method, and computer program
JP2008276677A (en) Support device for character recognition, character recognition device and program
JP4692316B2 (en) Image processing apparatus, image processing method, and computer program
JP4697035B2 (en) Information processing apparatus, information processing method, and computer program
JP2017187931A (en) Table data conversion method, program, and image reading device
JP2007286711A (en) Information processor and information processing method, and computer program
JP2007219682A (en) Information processor, information processing method, and computer program
JP4379038B2 (en) Image collation apparatus, image collation method, and image collation program
JP4692315B2 (en) Image processing apparatus, image processing method, and computer program
JP5673277B2 (en) Image processing apparatus and program
JP2008129873A (en) System, device, method, and program for managing log information
JP6935832B2 (en) Image processing system
JP4586679B2 (en) Information processing apparatus, information processing method, and computer program
JP4081074B2 (en) Form processing apparatus, form processing method, and form processing program
JP2023170192A (en) Information processing device and information processing program