JP2007299094A - Information processor, information processing method, and computer program - Google Patents

Information processor, information processing method, and computer program Download PDF

Info

Publication number
JP2007299094A
JP2007299094A JP2006124843A JP2006124843A JP2007299094A JP 2007299094 A JP2007299094 A JP 2007299094A JP 2006124843 A JP2006124843 A JP 2006124843A JP 2006124843 A JP2006124843 A JP 2006124843A JP 2007299094 A JP2007299094 A JP 2007299094A
Authority
JP
Japan
Prior art keywords
color
registered
marker
area
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006124843A
Other languages
Japanese (ja)
Other versions
JP4697035B2 (en
Inventor
Etsuko Ito
悦子 伊藤
Atsushi Ito
篤 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006124843A priority Critical patent/JP4697035B2/en
Publication of JP2007299094A publication Critical patent/JP2007299094A/en
Application granted granted Critical
Publication of JP4697035B2 publication Critical patent/JP4697035B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Color Image Communication Systems (AREA)
  • Image Analysis (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an improved configuration for color determination for an additionally written document with a marker color added on the basis of an attribute and for attribute assignment processing. <P>SOLUTION: In a configuration which analyzes a marker color from a color marker added document based on an attribute for a written document to execute attribute determination processing of document information, an extended registered color region corresponding to a registered color is set on the basis of a history of analysis color information regarding a marker color analyzed document, and when an extracted color, which has been determined as a not-registered color, is included in the extended registered color region, an attribute, which has been set in response to the registered color, is set as an attribute corresponding to data included in a marker color added region of the extracted color. According to the present configuration, even when a time-lapse color change in a marker pen, or an exchange of the pen is executed, attribute assignment based on accurate color determination can be performed. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、情報処理装置、および情報処理方法、並びにコンピュータ・プログラムに関する。さらに詳細には、本発明は、色マーカーによるインデックス付与として行なわれるマーカーペンによる文字列抽出/属性付与処理を実行する情報処理装置、および情報処理方法、並びにコンピュータ・プログラムに関する。   The present invention relates to an information processing apparatus, an information processing method, and a computer program. More specifically, the present invention relates to an information processing apparatus, an information processing method, and a computer program for executing character string extraction / attribute assignment processing with a marker pen performed as index assignment with a color marker.

文書ドキュメントに対するデータ処理分野において、例えば文書画像データから文書領域毎の属性を取得し、属性毎に画像領域を分類した後に、文字認識処理(OCR:Optical Character Recognition)を行い、分類されたテキストデータを生成してデータベースに保存するという処理がインデックス抽出処理として知られている。このインデックス抽出処理を開示した従来技術としては、例えば特許文献1,2がある。   In the field of data processing for document documents, for example, attributes for each document area are obtained from document image data, and after classifying the image areas for each attribute, character recognition processing (OCR: Optical Character Recognition) is performed to classify the text data. The process of generating and storing in a database is known as an index extraction process. For example, Patent Documents 1 and 2 are known as prior arts that disclose this index extraction processing.

また、予め決められた文書フォームを規定し、この文書フォームに追記可能な追記領域を設定し、その指定追記領域に、位置情報を埋め込み、ドキュメントからの追記情報抽出時に、原本との照合を不要として効率的に追記情報を取得する構成が特許文献3に記載されている。さらに、ドキュメントの分割領域に、領域を識別する情報を埋め込み、追記情報の抽出時に領域から効率的に追記情報の抽出を行なう処理構成が特許文献4に記載されている。
特開平5−342326号公報 特開2002−123815号公報 特開2003−271942号公報 特開2003−18393号公報
Also, a pre-determined document form is defined, a write-once area that can be added to this document form is set, position information is embedded in the designated write-on area, and verification with the original is not required when extracting postscript information from the document Patent Document 3 describes a configuration for efficiently acquiring additional write information. Further, Patent Document 4 discloses a processing configuration in which information for identifying a region is embedded in a divided region of a document, and additional information is efficiently extracted from the region when additional information is extracted.
JP-A-5-342326 JP 2002-123815 A JP 2003-271842 A JP 2003-18393 A

上述したように、ドキュメントに含まれる様々なデータを種類(属性)毎に区分、いわゆるカテゴライズしてデータベースなどの記憶部に属性を対応付けたデータとして分類保存する様々な技術が提案されている。しかし、文書ドキュメントに含まれる文書領域の属性判定処理の自動化には限界があり、属性判定および設定処理自体は、人(オペレータ)による処理を必要としているのが現状である。   As described above, various techniques have been proposed in which various data included in a document are classified according to type (attribute), that is, categorized and classified and stored as data in which attributes are associated with a storage unit such as a database. However, there is a limit to automating the attribute determination process for the document area included in the document document, and the attribute determination and setting process itself requires processing by a person (operator).

オペレータの判断によって属性判定を行なう場合、例えば、日付データ部については赤のマーカー、文書名データ部については青のマーカーで色づけをするなど、予め設定されたマーカー色と属性との対応情報に基づいてオペレータが様々な色のマーカーを利用して、ドキュメント上の文字に対してマーカー色の設定を行う。   When attribute determination is performed based on the operator's determination, for example, the date data portion is colored with a red marker, and the document name data portion is colored with a blue marker, based on correspondence information between preset marker colors and attributes. The operator uses the markers of various colors to set the marker colors for the characters on the document.

次に、マーカー色の設定されたドキュメントをカラースキャナによって読み取り、ドキュメント上のマーカー色を判別して、そのマーカー色の付与された文字情報をOCR(Optical Character Recognition)によって解読する。さらに、解読文字情報をテキストデータとしてデータベースに格納する際、テキストデータに対応する属性値として、マーカー色から判別される属性、例えば日付、文書名などの属性情報を対応付けて格納する。この処理はマーカーペンによる文字列抽出/属性付与処理と呼ばれる。   Next, the document in which the marker color is set is read by the color scanner, the marker color on the document is discriminated, and the character information to which the marker color is added is decoded by OCR (Optical Character Recognition). Further, when the decrypted character information is stored as text data in the database, an attribute discriminated from the marker color, for example, attribute information such as date and document name is stored in association with the attribute value corresponding to the text data. This process is called a character string extraction / attribute assignment process using a marker pen.

このようなマーカーペンによる文字列抽出/属性付与処理において、ドキュメントに対するマーカー色設定は、オペレータによって実行される。オペレータは、指定色のカラーペンによってマーカー設定を行うが、オペレータの利用するペンは、長期間の利用によって、色の変化を起こす場合がある。また、同じ[赤]であっても使用するペンのメーカーによって、微妙な色の差異が発生することがある。一方、マーカー色の判別を実行するのは、情報処理装置であり、一定の色値データ、例えばRGB値やLab値といった特定の色情報値に基づいて、マーカー色の判別を行なう。従って、オペレータの利用するペンの色の変化や、使用するペンの変更などに基づいて正確なマーカー色判定が不可能となり、属性値判定処理のエラーが発生することかある。   In such a character string extraction / attribute assignment process using a marker pen, marker color setting for a document is executed by an operator. The operator sets a marker with a color pen of a specified color, but the pen used by the operator may cause a color change due to long-term use. Even if the color is the same [Red], there may be a slight difference in color depending on the pen manufacturer. On the other hand, it is the information processing apparatus that executes the determination of the marker color, and determines the marker color based on specific color value data, for example, specific color information values such as RGB values and Lab values. Therefore, accurate marker color determination may be impossible based on a change in the color of the pen used by the operator, a change in the pen used, and an error in attribute value determination processing may occur.

本発明は、上述の問題点に鑑みてなされたものであり、属性設定処理として実行される色マーカーによる追記設定処理において、マーカー色設定を行うオペレータの利用するペンの色が、多少変化した場合でも、色変化を許容するマーカー色認識を行うことで正しい属性値の解析を可能とした情報処理装置、および情報処理方法、並びにコンピュータ・プログラムを提供することを目的とする。   The present invention has been made in view of the above-described problems, and when the pen color used by the operator who performs the marker color setting is slightly changed in the write-once setting process using the color marker executed as the attribute setting process. However, an object of the present invention is to provide an information processing apparatus, an information processing method, and a computer program capable of analyzing a correct attribute value by performing marker color recognition that allows color change.

本発明の第1の側面は、
ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理装置であり、
ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出部と、
前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定部と、
マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定する拡張登録色領域設定部と、
前記登録色判定部において非登録色と判定された抽出色が、前記拡張登録色領域に含まれるか否かを判定する抽出色判定部と、
前記抽出色判定部において、前記抽出色が前記拡張登録色領域に含まれると判定された場合、その登録色に対応して設定された属性を、前記抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定する属性判定部と、
前記拡張登録色領域設定部において設定された色領域に含まれる色値を新たな登録色として追加設定する登録色更新処理部と、
を有することを特徴とする情報処理装置にある。
The first aspect of the present invention is:
An information processing apparatus that executes an attribute determination process for document information based on a marker color added to a document,
A color area extraction unit that inputs a postscript document in which a marker color is added to the document and acquires color information of a marker color postscript area on the postscript document;
A registered color determination unit that determines whether the color included in the color region extracted by the color region extraction unit is a registered color or a non-registered color that is registered in advance as an additional recording marker color;
An extended registered color area setting unit for setting an extended registered color area corresponding to the registered color based on the history of the analysis color information in the marker color analyzed document;
An extracted color determining unit that determines whether or not an extracted color determined as a non-registered color by the registered color determining unit is included in the extended registered color region;
If the extracted color determining unit determines that the extracted color is included in the extended registered color area, the attribute set corresponding to the registered color is included in the marker color additional recording area of the extracted color. An attribute determination unit that determines the attribute corresponding to
A registered color update processing unit for additionally setting a color value included in the color region set in the extended registered color region setting unit as a new registered color;
There is an information processing apparatus characterized by having.

さらに、本発明の情報処理装置の一実施態様において、前記拡張登録色領域設定部は、解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線上に前回の抽出色の色値データに基づく射影点を設定し、該射影点を頂点とする円錐領域を登録色に対応する拡張登録色領域として設定する処理を実行する構成であり、抽出色判定部は、前記登録色判定部において非登録色と判定された抽出色が、前記円錐領域に含まれるか否かを判定する処理を実行する構成であることを特徴とする。   Furthermore, in one embodiment of the information processing apparatus of the present invention, the extended registration color region setting unit generates an approximate curve based on a plurality of history points of color values in the color space of the marker color of the analyzed document, A configuration in which a projection point based on the color value data of the previous extracted color is set on the generated approximate curve, and a process of setting a conical region having the projection point as a vertex as an extended registered color region corresponding to the registered color is executed. And the extracted color determining unit is configured to execute a process of determining whether or not the extracted color determined as a non-registered color by the registered color determining unit is included in the conical region.

さらに、本発明の情報処理装置の一実施態様において、前記拡張登録色領域設定部は、前回の抽出色の色値に対応する近似曲線上の近傍点を頂点とし、近似曲線を含み色値履歴の新しい方向に広がりを設定した円錐領域を拡張登録色領域として設定する処理を実行する構成であることを特徴とする。   Furthermore, in one embodiment of the information processing apparatus of the present invention, the extended registered color area setting unit uses a neighboring point on the approximate curve corresponding to the color value of the previous extracted color as a vertex, and includes an approximate curve and a color value history This is characterized in that a process for setting a conical region having a spread in a new direction as an extended registered color region is executed.

さらに、本発明の情報処理装置の一実施態様において、前記拡張登録色領域設定部は、予め設定した半径rと、高さlの円錐領域を拡張登録色領域として設定する処理を実行する構成であることを特徴とする。   Furthermore, in an embodiment of the information processing apparatus of the present invention, the extended registration color area setting unit executes a process of setting a predetermined radius r and a cone area having a height l as an extended registration color area. It is characterized by being.

さらに、本発明の情報処理装置の一実施態様において、前記拡張登録色領域設定部は、解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線を中心軸とする円柱領域を設定し、該円柱領域を登録色に対応する拡張登録色領域として設定する処理を実行する構成であり、抽出色判定部は、前記登録色判定部において非登録色と判定された抽出色が、前記円柱領域に含まれるか否かを判定する処理を実行する構成であることを特徴とする。   Furthermore, in one embodiment of the information processing apparatus of the present invention, the extended registration color region setting unit generates an approximate curve based on a plurality of history points of color values in the color space of the marker color of the analyzed document, The configuration is such that a cylindrical region having the generated approximate curve as a central axis is set, and the cylindrical region is set as an extended registered color region corresponding to a registered color, and the extracted color determining unit is the registered color determining unit The extracted color determined to be a non-registered color in step 1 is configured to execute processing for determining whether or not the extracted color is included in the cylindrical region.

さらに、本発明の情報処理装置の一実施態様において、前記拡張登録色領域設定部は、予め設定した半径rの円柱領域を拡張登録色領域として設定する処理を実行する構成であることを特徴とする。   Furthermore, in an embodiment of the information processing apparatus of the present invention, the extended registration color area setting unit is configured to execute a process of setting a cylindrical area having a radius r set in advance as an extended registration color area. To do.

さらに、本発明の第2の側面は、
ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理装置であり、
ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出部と、
前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定部と、
同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行する抽出色カウント部と、
前記マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行するカウント数検証部と、
前記カウント数検証部において、抽出予定数未満のマーカー色と、前記登録色判定部において検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、該非登録色を、抽出予定数未満のマーカー色の変更後のマーカー色であると判断し、登録色の更新を実行する登録色更新処理部と、
前記登録色更新処理部において新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定する属性判定部と、
を有することを特徴とする情報処理装置にある。
Furthermore, the second aspect of the present invention provides
An information processing apparatus that executes an attribute determination process for document information based on a marker color added to a document,
A color area extraction unit that inputs a postscript document in which a marker color is added to the document and acquires color information of a marker color postscript area on the postscript document;
A registered color determination unit that determines whether the color included in the color region extracted by the color region extraction unit is a registered color or a non-registered color that is registered in advance as an additional recording marker color;
An extraction color counting unit that counts the number of extractions of each marker color determined to be a corresponding color of the same attribute;
A count number verification unit that performs comparison between the number of extractions of each of the marker colors and the number of extractions corresponding to each marker color in advance;
In the count number verification unit, the addition result of the marker color less than the planned extraction number and the non-registered color extraction count detected by the registered color determination unit is the planned extraction number of marker colors less than the planned extraction number. On the condition, the non-registered color is determined to be the marker color after the change of the marker color less than the number of extraction, and a registered color update processing unit for executing the update of the registered color,
An attribute determination unit for determining a color area newly determined as a registered color in the registered color update processing unit as an attribute set corresponding to the old registered color as an attribute corresponding to data included in the color area;
There is an information processing apparatus characterized by having.

さらに、本発明の第3の側面は、
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理方法であり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出ステップと、
登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定ステップと、
拡張登録色領域設定部において、マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定する拡張登録色領域設定ステップと、
抽出色判定部において、前記登録色判定ステップで非登録色と判定された抽出色が、前記拡張登録色領域に含まれるか否かを判定する抽出色判定ステップと、
属性判定部において、前記抽出色判定ステップで前記抽出色が前記拡張登録色領域に含まれると判定された場合、その登録色に対応して設定された属性を、前記抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定する属性判定ステップと、
登録色更新処理部において、前記拡張登録色領域設定ステップで設定された色領域に含まれる色値を新たな登録色として追加設定する登録色更新処理ステップと、
を有することを特徴とする情報処理方法にある。
Furthermore, the third aspect of the present invention provides
In the information processing apparatus, an information processing method for executing attribute determination processing of document information based on a marker color added to a document,
In the color region extraction unit, a color region extraction step of inputting a postscript document in which a marker color is added to the document and obtaining color information of the marker color additional region on the postscript document;
A registration color determination step for determining whether the color included in the color region extracted in the color region extraction step is a registered color or a non-registered color registered in advance as a postscript marker color in the registered color determination unit; ,
In the extended registration color area setting unit, an extended registration color area setting step for setting an extended registration color area corresponding to the registered color based on the history of analysis color information in the marker color analyzed document;
In the extraction color determination unit, an extraction color determination step for determining whether or not the extraction color determined as a non-registered color in the registration color determination step is included in the extended registration color region;
In the attribute determination unit, if it is determined in the extracted color determination step that the extracted color is included in the extended registered color area, the attribute set corresponding to the registered color is added to the marker color additional recording area of the extracted color. An attribute determination step for determining the attribute corresponding to the data included in the
In a registered color update processing unit, a registered color update processing step of additionally setting a color value included in the color area set in the extended registered color area setting step as a new registered color;
There is an information processing method characterized by comprising:

さらに、本発明の情報処理方法の一実施態様において、前記拡張登録色領域設定ステップは、解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線上に前回の抽出色の色値データに基づく射影点を設定し、該射影点を頂点とする円錐領域を登録色に対応する拡張登録色領域として設定する処理を実行するステップであり、抽出色判定ステップは、前記登録色判定ステップにおいて非登録色と判定された抽出色が、前記円錐領域に含まれるか否かを判定する処理を実行するステップであることを特徴とする。   Furthermore, in one embodiment of the information processing method of the present invention, the extended registered color region setting step generates an approximate curve based on a plurality of history points of color values in the color space of the marker color of the analyzed document, In the step of setting a projection point based on the color value data of the previous extracted color on the generated approximate curve, and setting a cone region having the projection point as a vertex as an extended registered color region corresponding to the registered color And the extracted color determining step is a step of executing a process of determining whether or not the extracted color determined to be a non-registered color in the registered color determining step is included in the conical region.

さらに、本発明の情報処理方法の一実施態様において、前記拡張登録色領域設定ステップは、前回の抽出色の色値に対応する近似曲線上の近傍点を頂点とし、近似曲線を含み色値履歴の新しい方向に広がりを設定した円錐領域を拡張登録色領域として設定する処理を実行するステップであることを特徴とする。   Furthermore, in one embodiment of the information processing method of the present invention, the extended registered color region setting step includes a color value history including an approximate curve, with a neighboring point on the approximate curve corresponding to the color value of the previous extracted color as a vertex. This is a step of executing a process of setting a conical region having a spread in a new direction as an extended registered color region.

さらに、本発明の情報処理方法の一実施態様において、前記拡張登録色領域設定ステップは、予め設定した半径rと、高さlの円錐領域を拡張登録色領域として設定する処理を実行するステップであることを特徴とする。   Furthermore, in an embodiment of the information processing method of the present invention, the extended registration color area setting step is a step of executing a process of setting a cone area having a preset radius r and height l as an extended registration color area. It is characterized by being.

さらに、本発明の情報処理方法の一実施態様において、前記拡張登録色領域設定ステップは、解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線を中心軸とする円柱領域を設定し、該円柱領域を登録色に対応する拡張登録色領域として設定する処理を実行するステップであり、抽出色判定ステップは、前記登録色判定ステップで非登録色と判定された抽出色が、前記円柱領域に含まれるか否かを判定する処理を実行するステップであることを特徴とする。   Furthermore, in one embodiment of the information processing method of the present invention, the extended registered color region setting step generates an approximate curve based on a plurality of history points of color values in the color space of the marker color of the analyzed document, A step of setting a cylindrical region having the generated approximate curve as a central axis and executing the process of setting the cylindrical region as an extended registered color region corresponding to a registered color, and the extracted color determining step is the registered color determining step The step of executing a process of determining whether or not the extracted color determined to be a non-registered color is included in the cylindrical region.

さらに、本発明の情報処理方法の一実施態様において、前記拡張登録色領域設定ステップは、予め設定した半径rの円柱領域を拡張登録色領域として設定する処理を実行するステップであることを特徴とする。   Furthermore, in one embodiment of the information processing method of the present invention, the extended registration color area setting step is a step of executing a process of setting a cylindrical area having a radius r set in advance as an extended registration color area. To do.

さらに、本発明の第4の側面は、
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理方法であり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出ステップと、
登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定ステップと、
抽出色カウント部において、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行する抽出色カウントステップと、
カウント数検証部において、前記マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行するカウント数検証ステップと、
登録色更新処理部において、前記カウント数検証ステップで抽出予定数未満のマーカー色と、前記登録色判定ステップで検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、該非登録色を、抽出予定数未満のマーカー色を変更後のマーカー色であると判断し、登録色の更新を実行する登録色更新処理ステップと、
属性判定部において、前記登録色更新処理ステップで新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定する属性判定ステップと、
を有することを特徴とする情報処理方法にある。
Furthermore, the fourth aspect of the present invention provides
In the information processing apparatus, an information processing method for executing attribute determination processing of document information based on a marker color added to a document,
In the color region extraction unit, a color region extraction step of inputting a postscript document in which a marker color is added to the document and obtaining color information of the marker color additional region on the postscript document;
A registration color determination step for determining whether the color included in the color region extracted in the color region extraction step is a registered color or a non-registered color registered in advance as a postscript marker color in the registered color determination unit; ,
In an extraction color counting unit, an extraction color counting step for counting the number of extractions of each marker color determined to be a corresponding color of the same attribute;
In the count number verification unit, a count number verification step of executing a comparison between the number of extractions of each of the marker colors and the number of extractions corresponding to each marker color in advance,
In the registered color update processing unit, a marker color that is less than the planned number of extractions is obtained by adding the marker color that is less than the planned number of extractions in the count number verification step and the extraction count of the non-registered colors that is detected in the registered color determination step. A registration color update processing step for determining that the non-registered color is a marker color after changing the marker color less than the planned extraction number, and executing the update of the registered color, on the condition that the number of extraction is
In the attribute determination unit, the color area newly determined as the registered color in the registered color update processing step is determined as the attribute corresponding to the data included in the color area as the attribute set corresponding to the old registered color. An attribute determination step;
There is an information processing method characterized by comprising:

さらに、本発明の第5の側面は、
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行させるコンピュータ・プログラムであり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得させる色領域抽出ステップと、
登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別させる登録色判定ステップと、
拡張登録色領域設定部において、マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定させる拡張登録色領域設定ステップと、
抽出色判定部において、前記登録色判定ステップで非登録色と判定された抽出色が、前記拡張登録色領域に含まれるか否かを判定させる抽出色判定ステップと、
属性判定部において、前記抽出色判定ステップで前記抽出色が前記拡張登録色領域に含まれると判定された場合、その登録色に対応して設定された属性を、前記抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定させる属性判定ステップと、
登録色更新処理部において、前記拡張登録色領域設定ステップで設定された色領域に含まれる色値を新たな登録色として追加設定させる登録色更新処理ステップと、
を実行させることを特徴とするコンピュータ・プログラムにある。
Furthermore, the fifth aspect of the present invention provides
In the information processing apparatus, a computer program for executing an attribute determination process of document information based on a marker color added to a document,
In the color area extraction unit, a color area extraction step of inputting a postscript document in which a marker color is added to the document and obtaining color information of the marker color additional area on the postscript document;
A registered color determining step for determining whether the color included in the color region extracted in the color region extracting step is a registered color or a non-registered color registered in advance as an additional marker color; ,
In the extended registration color area setting unit, an extended registration color area setting step for setting an extended registration color area corresponding to the registered color based on the history of analysis color information in the marker color analyzed document;
In the extraction color determination unit, an extraction color determination step for determining whether or not the extracted color determined as a non-registered color in the registered color determination step is included in the extended registered color region;
In the attribute determination unit, if it is determined in the extracted color determination step that the extracted color is included in the extended registered color area, the attribute set corresponding to the registered color is added to the marker color additional recording area of the extracted color. An attribute determination step for determining the attribute corresponding to the data included in
In a registered color update processing unit, a registered color update processing step for additionally setting a color value included in the color area set in the extended registered color area setting step as a new registered color;
In a computer program characterized by causing

さらに、本発明の第6の側面は、
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行させるコンピュータ・プログラムであり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得させる色領域抽出ステップと、
登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別させる登録色判定ステップと、
抽出色カウント部において、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行させる抽出色カウントステップと、
カウント数検証部において、前記マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行させるカウント数検証ステップと、
登録色更新処理部において、前記カウント数検証ステップで抽出予定数未満のマーカー色と、前記登録色判定ステップで検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、該非登録色を、抽出予定数未満のマーカー色を変更後のマーカー色であると判断し、登録色の更新を実行させる登録色更新処理ステップと、
属性判定部において、前記登録色更新処理ステップで新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定させる属性判定ステップと、
を実行させることを特徴とするコンピュータ・プログラムにある。
Furthermore, the sixth aspect of the present invention provides
In the information processing apparatus, a computer program for executing an attribute determination process of document information based on a marker color added to a document,
In the color area extraction unit, a color area extraction step of inputting a postscript document in which a marker color is added to the document and obtaining color information of the marker color additional area on the postscript document;
A registered color determining step for determining whether the color included in the color region extracted in the color region extracting step is a registered color or a non-registered color registered in advance as an additional marker color; ,
In the extraction color counting unit, an extraction color counting step for counting the number of extractions of each marker color determined to be a corresponding color of the same attribute;
In the count number verification unit, a count number verification step for executing a comparison between the number of extraction of each of the marker colors and the number of extractions corresponding to each marker color in advance,
In the registered color update processing unit, a marker color that is less than the planned number of extractions is obtained by adding the marker color that is less than the planned number of extractions in the count number verification step and the extraction count of the non-registered colors that is detected in the registered color determination step. A registration color update processing step for determining that the non-registered color is a marker color after changing the marker color less than the planned extraction number, and executing the update of the registered color, on the condition that the number of extraction is
In the attribute determination unit, the color area newly determined as the registered color in the registered color update processing step is determined as an attribute corresponding to the data included in the color area as an attribute set corresponding to the old registered color. An attribute determination step;
In a computer program characterized by causing

なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能なコンピュータシステムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体、例えば、CDやDVDなどの記録媒体、あるいは、ネットワークなどの通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータシステム上でプログラムに応じた処理が実現される。   The computer program of the present invention is, for example, a storage medium provided in a computer-readable format for a computer system capable of executing various program codes, a communication medium, for example, a recording medium such as a CD or a DVD, Or it is a computer program which can be provided by communication media, such as a network. By providing such a program in a computer-readable format, processing corresponding to the program is realized on the computer system.

本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。   Other objects, features, and advantages of the present invention will become apparent from a more detailed description based on embodiments of the present invention described later and the accompanying drawings. In this specification, the system is a logical set configuration of a plurality of devices, and is not limited to one in which the devices of each configuration are in the same casing.

本発明の一実施例構成によれば、例えば、文書ドキュメントに対するマーカーペンによる文字列抽出/属性付与処理、すなわち、色マーカーによる追記のなされた追記ドキュメントからマーカー色を解析して、マーカー色に基づくドキュメント情報の属性判定処理を実行する構成において、マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定し、非登録色と判定された抽出色が、拡張登録色領域に含まれる場合に、登録色に対応して設定された属性を、抽出色のマーカー色追記領域に含まれるデータ対応の属性として設定する構成としたので、例えばマーカーペンの経時的な色変化、あるいはペンの交換などが実行された場合でも、的確な色判定に基づく属性付与が可能となる。   According to the configuration of one embodiment of the present invention, for example, a character string extraction / attribute assignment process with a marker pen for a document document, that is, a marker color is analyzed from an additional recording document that has been additionally written with a color marker, and is based on the marker color. In the configuration in which the attribute determination process of document information is executed, an extended registered color area corresponding to the registered color is set based on the history of the analyzed color information in the marker color analyzed document, and the extracted color determined to be a non-registered color Since the attribute set corresponding to the registered color when included in the extended registered color area is set as the attribute corresponding to the data included in the marker color additional recording area of the extracted color. Even when a color change or a pen change is executed, it is possible to assign an attribute based on accurate color determination.

また、本発明の一実施例構成によれば、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを行い、予め各マーカー色に対応する抽出予定数との比較を実行して、抽出予定数未満のマーカー色の変更後のマーカー色を判断し、この判断情報に基づいて登録色の更新を実行する構成としたので、オペレータによる登録色更新処理を行なうことなく自動的な更新が可能となり、効率的な処理が実現される。   Further, according to the configuration of one embodiment of the present invention, the number of extractions of each marker color determined as the corresponding color of the same attribute is counted, and the comparison with the planned number of extractions corresponding to each marker color is performed in advance. Since the configuration is such that the marker color after the change of the marker color less than the planned number of extractions is determined and the registered color is updated based on this determination information, automatic update without performing the registered color update process by the operator And efficient processing is realized.

以下、図面を参照しながら本発明の実施形態に係る情報処理装置、および情報処理方法、並びにコンピュータ・プログラムの詳細について説明する。なお、説明は以下の項目に従って行なう。
1.マーカーペンによる文字列抽出/属性付与処理の概要
2.マーカー色の変化を許容した処理例
(2.1)マーカーペンの変色に対応した処理例
(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)
(2.3)マーカーペンの交換に対応した処理例2(異なる色への交換)
3.情報処理装置の構成
Details of an information processing apparatus, an information processing method, and a computer program according to embodiments of the present invention will be described below with reference to the drawings. The description will be made according to the following items.
1. 1. Outline of character string extraction / attribute assignment processing with a marker pen Example of processing allowing change in marker color (2.1) Example of processing corresponding to color change of marker pen (2.2) Example of processing 1 corresponding to replacement of marker pen (exchange to same system color)
(2.3) Processing example 2 corresponding to replacement of marker pen (exchange to a different color)
3. Configuration of information processing equipment

[1.マーカーペンによる文字列抽出/属性付与処理の概要]
まず、図1、図2を参照してマーカーペンによる文字列抽出/属性付与処理の概要について説明する。マーカーペンによる文字列抽出/属性付与処理は、例えば文書ドキュメントに対して、オペレータが、ドキュメント上の文字列などの情報を、カテゴリに応じて設定された特定色のマーカーでチェックする処理を行い、この処理後のドキュメントをスキャナで読み取り、その読み取り画像データから、マーカー色を判別して、ドキュメント上の情報分類を行ない、ドキュメントに対するインデックス情報としてデータベースに格納する処理である。
[1. Outline of character string extraction / attribute assignment processing with marker pen]
First, an outline of character string extraction / attribute assignment processing using a marker pen will be described with reference to FIGS. 1 and 2. Character string extraction / attribute assignment processing using a marker pen performs, for example, a process in which an operator checks information such as a character string on a document with a marker of a specific color set according to a category for a document document, In this process, the document after this processing is read by the scanner, the marker color is discriminated from the read image data, the information on the document is classified, and stored in the database as index information for the document.

例えば、ドキュメントが商品見積もり書などである場合、マーカーの色に応じて、
オレンジ:購入価格、
緑:購入品、
青:依頼者、
赤:回答者、
など、情報の種類に応じて、予め利用するマーカー色が対応付けられており、オペレータがドキュメント上から、これらの情報に対応する情報を選択して、それぞれに割り当てられたマーカーでチェックをする。その後、PC等の情報処理装置において、スキャナで読み取った画像データからマーカーの色情報を取得して、各色情報の指示部分の文書情報などを例えば文字認識(OCR)処理などにより、データ化を行い、その文書ドキュメントに対応するインデックス情報としてデータベースに格納する。
For example, if the document is a product quote, etc., depending on the color of the marker,
Orange: purchase price,
Green: Purchased item
Blue: Client,
Red: Respondent,
The marker colors used in advance are associated with each other according to the type of information, and the operator selects information corresponding to these pieces of information from the document, and checks with the markers assigned to each. Thereafter, in an information processing apparatus such as a PC, the color information of the marker is acquired from the image data read by the scanner, and the document information of the indicated portion of each color information is converted into data by, for example, character recognition (OCR) processing. And stored in the database as index information corresponding to the document document.

例えば、図1に示す情報処理装置51は、データベース54に格納された文書ドキュメントを、プリンタ52を介して出力する。図に示す原本ドキュメント11である。オペレータは、この原本ドキュメント11対して、予め設定された情報種類と利用マーカー色の対応に基づいて、マーカーによる追記を行なう。この結果が図に示す追記ドキュメント12である。   For example, the information processing apparatus 51 illustrated in FIG. 1 outputs a document document stored in the database 54 via the printer 52. This is an original document 11 shown in the figure. The operator adds information to the original document 11 using a marker based on the correspondence between the preset information type and the use marker color. This result is the postscript document 12 shown in the figure.

例えば、追記ドキュメントには、赤、青、緑のマーキング21〜23がなされており、これらは、予め定められたルールに基づいてマーキングされたものである。例えば、マーカーの色と情報種類(属性)の対応が、
オレンジ:購入価格、
緑:購入品、
青:依頼者、
赤:回答者、
として設定されている。この追記ドキュメント12はスキャナ53によって読み取られて、情報処理装置51においてデータ処理がなされ、処理対象文書ドキュメントに対応するインデックス情報の設定処理がなされる。
For example, red, blue, and green markings 21 to 23 are made on the postscript document, and these are marked based on a predetermined rule. For example, the correspondence between the marker color and the information type (attribute)
Orange: purchase price,
Green: Purchased item
Blue: Client,
Red: Respondent,
Is set as The postscript document 12 is read by the scanner 53 and subjected to data processing in the information processing apparatus 51, and index information setting processing corresponding to the processing target document document is performed.

図2を参照して、情報処理装置51において実行されるマーカーペンによる文字列抽出/属性付与処理の具体例について説明する。図2に示す追記ドキュメント100は、オペレータによって、マーカー色の設定された追記ドキュメント100である。マーカーの色と属性の対応は、
オレンジ:購入価格、
緑:購入品、
青:依頼者、
赤:回答者、
である。
With reference to FIG. 2, a specific example of character string extraction / attribute assignment processing by the marker pen executed in the information processing apparatus 51 will be described. The postscript document 100 shown in FIG. 2 is the postscript document 100 in which the marker color is set by the operator. The correspondence between marker colors and attributes
Orange: purchase price,
Green: Purchased item
Blue: Client,
Red: Respondent,
It is.

追記ドキュメントのマーカー色追記領域101は「スキャナ」の文字が記録された領域であり、オペレータはこのマーカー色追記領域の属性を[購入品]であると判定し、購入品に対して設定されたマーカー色=[緑]を用いてマーカー色を設定する。
マーカー色追記領域102は「ST123」の文字が記録された領域であり、オペレータはこのマーカー色追記領域の属性を[依頼者識別子(依頼者No.)]であると判定し、依頼者に対して設定されたマーカー色=[青]を用いてマーカー色を設定する。
The marker color additional recording area 101 of the additional recording document is an area where characters of “scanner” are recorded. The operator determines that the attribute of the marker color additional recording area is “purchased product” and is set for the purchased product. Marker color is set using marker color = [green].
The marker color additional recording area 102 is an area in which the characters “ST123” are recorded. The operator determines that the attribute of the marker color additional recording area is [requester identifier (requester No.)], and asks the requester. The marker color is set using the marker color = [blue].

マーカー色追記領域103は「B社」の文字が記録された領域であり、オペレータはこのマーカー色追記領域の属性を[回答者]であると判定し、回答者に対して設定されたマーカー色=[赤]を用いてマーカー色を設定する。
マーカー色追記領域104は「¥2120」の文字が記録された領域であり、オペレータはこのマーカー色追記領域の属性を[購入価格]であると判定し、購入価格に対して設定されたマーカー色=[オレンジ]を用いてマーカー色を設定する。
The marker color additional recording area 103 is an area in which the characters “Company B” are recorded. The operator determines that the attribute of the marker color additional recording area is “respondent”, and the marker color set for the respondent = Use [Red] to set the marker color.
The marker color additional recording area 104 is an area where characters of “¥ 2120” are recorded. The operator determines that the attribute of the marker color additional recording area is “purchase price”, and the marker color set for the purchase price. = Use [Orange] to set the marker color.

この追記ドキュメント100はスキャナ53によって読み取られ、情報処理装置51に入力されてマーカーペンによる文字列抽出/属性付与処理が実行される。情報処理装置51の記憶部には、図に示すマーカー色と属性の対応を示すマーカー色属性対応テーブル71が格納されている。すなわち、
マーカー色=オレンジ:属性=購入価格、
マーカー色=緑:属性=購入品、
マーカー色=青:属性=依頼者、
マーカー色=赤:属性=回答者、
これらのマーカー色と属性の対応情報を有するテーブルである。
The additional writing document 100 is read by the scanner 53 and input to the information processing apparatus 51, and character string extraction / attribute assignment processing is performed by the marker pen. The storage unit of the information processing apparatus 51 stores a marker color attribute correspondence table 71 indicating correspondence between marker colors and attributes shown in the figure. That is,
Marker color = orange: attribute = purchase price
Marker color = green: attribute = purchased item,
Marker color = blue: attribute = requester,
Marker color = red: attribute = respondent,
It is a table having correspondence information between these marker colors and attributes.

情報処理装置51は、スキャナで読み取った画像データからマーカーの色情報を取得して、このマーカー色属性対応テーブル71を参照して各色情報の設定領域にある文字情報などの属性を決定する。各色情報の設定領域にある文字情報は、例えば文字認識(OCR)処理などによりテキストデータ化を施し、属性値とともにデータベース54に格納する。   The information processing apparatus 51 acquires marker color information from the image data read by the scanner, and refers to the marker color attribute correspondence table 71 to determine attributes such as character information in the setting area of each color information. The character information in the setting area of each color information is converted into text data by, for example, character recognition (OCR) processing and stored in the database 54 together with attribute values.

データベースに格納されるデータの一例が、図に示す解析データ72である。解析データ72は、色マーカーの各色に対応する属性ごとに分類したデータを格納したテーブルである。このように、情報処理装置51は、各追記ドキュメントのマーカーペンによる文字列抽出/属性付与処理によって読み取られたデータを、各属性ごとに分類整理を行い、図に示す解析データ72を生成してデータベース54に格納する。なお、図に示す解析データ72は、マーカーペンによる文字列抽出/属性付与処理によって生成可能なデータの一例を示すものであり、この他にも、様々な形態のデータが生成可能である。   An example of data stored in the database is analysis data 72 shown in the figure. The analysis data 72 is a table storing data classified for each attribute corresponding to each color of the color marker. As described above, the information processing apparatus 51 classifies and arranges the data read by the character string extraction / attribute assignment processing with the marker pen of each additional writing document for each attribute, and generates the analysis data 72 shown in the figure. Store in the database 54. Note that the analysis data 72 shown in the figure shows an example of data that can be generated by the character string extraction / attribute assignment process using the marker pen, and various other forms of data can be generated.

このようにマーカーペンによる文字列抽出/属性付与処理により、効率的なデータ整理が可能となる。しかし、前述したように、ドキュメントに対するマーカー色設定は、オペレータによって実行される。オペレータは、指定色のカラーペンによってマーカー設定を行うが、オペレータの利用するペンは、長期間の利用によって、色の変化を起こす場合がある。また、同じ色、例えば[赤]であっても使用するペンのメーカーによって、微妙な色の差異が発生することがある。一方、マーカー色の判別を実行するのは、情報処理装置であり、一定の色値データ、例えばRGB値やLab値といった特定の色情報値に基づいて、マーカー色の判別を行なう。従って、オペレータの利用するペンの色の変化や、使用するペンの変更などに基づいて正確なマーカー色判定が不可能となり、属性値判定処理のエラーが発生することかある。   Thus, efficient data organization is possible by the character string extraction / attribute assignment processing using the marker pen. However, as described above, the marker color setting for the document is executed by the operator. The operator sets a marker with a color pen of a specified color, but the pen used by the operator may cause a color change due to long-term use. Even if the color is the same, for example, [red], a slight color difference may occur depending on the manufacturer of the pen used. On the other hand, it is the information processing apparatus that executes the determination of the marker color, and determines the marker color based on specific color value data, for example, specific color information values such as RGB values and Lab values. Therefore, accurate marker color determination may be impossible based on a change in the color of the pen used by the operator, a change in the pen used, and an error in attribute value determination processing may occur.

本発明の情報処理装置では、マーカー色設定を行うオペレータの利用するペンの色が、多少変化した場合でも、色変化を許容するマーカー色認識を行うことで正しい属性値の解析を可能とする。本発明の情報処理装置の実行する処理例について、図3以下を参照して説明する。   In the information processing apparatus of the present invention, even when the pen color used by the operator who performs the marker color setting changes slightly, the correct attribute value can be analyzed by performing the marker color recognition that allows the color change. An example of processing executed by the information processing apparatus of the present invention will be described with reference to FIG.

[2.マーカー色の変化を許容した処理例]
図3以下を参照して本発明の情報処理装置の実行する処理、すなわち、マーカー色設定を行うオペレータの利用するペンの色が、多少変化した場合でも、色変化を許容するマーカー色認識を行い正しい属性値の設定を行う構成例について説明する。
[2. Example of processing that allows change in marker color]
The processing executed by the information processing apparatus of the present invention with reference to FIG. 3 and below, that is, the marker color recognition that allows the color change is performed even when the color of the pen used by the operator who performs the marker color setting changes slightly. A configuration example for setting correct attribute values will be described.

(2.1)マーカーペンの変色に対応した処理例
まず、図3を参照して、オペレータの利用するマーカーペンの色の変化が発生する具体的例について説明する。図3(a)は、先に図2を参照して説明したと同様のマーカー色属性対応テーブルである。すなわち、
マーカー色=オレンジ:属性=購入価格、
マーカー色=緑:属性=購入品、
マーカー色=青:属性=依頼者、
マーカー色=赤:属性=回答者、
これらのマーカー色と属性の対応情報を有するテーブルである。
(2.1) Processing Example Corresponding to Marker Pen Discoloration First, a specific example in which a color change of a marker pen used by an operator occurs will be described with reference to FIG. FIG. 3A is a marker color attribute correspondence table similar to that described above with reference to FIG. That is,
Marker color = orange: attribute = purchase price
Marker color = green: attribute = purchased item,
Marker color = blue: attribute = requester,
Marker color = red: attribute = respondent,
It is a table having correspondence information between these marker colors and attributes.

オペレータは、この対応情報に基づいて、ドキュメントに対してマーカー色の設定を実行する。図3(b1)、(b2)はマーカーペンの色の変化が発生する例を示している。図3(b1)は、オレンジのマーカー色によるマーカー色設定例である。1枚目のドキュメントに対するオレンジのマーカーの追記において、ドキュメント上の文字の色(例えば黒インク)が、マーカーに付着してしまい、1枚目のマーカー色追記領域201では、左端から右端に至る範囲で色の変化が発生している。具体的にはマーカー色追記領域201の左端は明るいオレンジであるが、右端では、ドキュメント上の文字の色(例えば黒インク)が交じり合って黒っぽいオレンジになっている。   Based on the correspondence information, the operator sets a marker color for the document. FIGS. 3B1 and 3B2 show examples in which the color change of the marker pen occurs. FIG. 3B1 shows an example of marker color setting with an orange marker color. In the additional writing of the orange marker for the first document, the character color (for example, black ink) on the document adheres to the marker, and in the first marker color additional recording area 201, the range from the left end to the right end. A color change has occurred. Specifically, the left end of the marker color additional recording area 201 is bright orange, but at the right end, the color of characters on the document (for example, black ink) is mixed to become a dark orange.

さらに、オペレータは、2枚目のドキュメントに対して、そのままマーカー色追記を行なうと、ドキュメント上の文字の色(例えば黒インク)が付着し変色したマーカーペンを使用することになり、2枚目のマーカー色追記領域202は、全体が黒っぽいオレンジになってしまう。さらに、2枚目でも同様にドキュメント上の文字の色との交じり合いが発生し、さらにマーカー色が変化してしまう。これを複数回、繰り返すと、変色がひどくなり、例えば、n枚目においては、明らかに1枚目のオレンジマーカー色とは異なる色に変化してしまう。   Further, if the operator adds the marker color to the second document as it is, the operator uses a marker pen in which the character color (for example, black ink) on the document is attached and changed color. The entire marker color additional recording area 202 becomes dark orange. Further, in the second sheet, the character color on the document is mixed and the marker color is changed. If this is repeated a plurality of times, the discoloration becomes severe. For example, the nth sheet clearly changes to a color different from the first orange marker color.

色解析を実行する情報処理装置は、例えばRGBやLabなどの色情報値に基づいて、色解析を行なうので、例えば、1枚目のオレンジマーカー色に対応するLabが登録情報(標準指定色)として情報処理装置に記録さているとすると、n枚目のオレンジマーカー色のマーカー色追記領域203のLab値は、登録情報と異なる値を有するため、登録オレンジ色とは異なる色と判別され、オレンジ色に対応する属性値の認識がなされないことになる。   Since the information processing apparatus that performs color analysis performs color analysis based on color information values such as RGB and Lab, for example, Lab corresponding to the first orange marker color is registered information (standard designated color). Is recorded in the information processing apparatus, the Lab value of the marker color additional recording area 203 of the n-th orange marker color has a value different from the registered information, and thus is determined to be a color different from the registered orange color. The attribute value corresponding to the color is not recognized.

図3(b2)は、青色のマーカー色によるマーカー色設定例である。1枚目のドキュメントに対する青色のマーカーの追記において、ドキュメント上の印鑑の朱肉の色(例えば赤)が、マーカーに付着してしまい、1枚目のマーカー色追記領域221では、左端から右端に至る範囲で色の変化が発生している。具体的にはマーカー色追記領域201の左端は本来のマーカー色である青色であるが、右端では、ドキュメント上の朱肉の色(例えば赤)が交じり合って赤と青の混合色になっている。   FIG. 3B2 shows an example of marker color setting using a blue marker color. In the additional writing of the blue marker for the first document, the vermilion color (for example, red) of the seal on the document is attached to the marker, and the first marker color additional recording area 221 extends from the left end to the right end. There is a color change in the range. Specifically, the left end of the marker color additional recording area 201 is blue, which is the original marker color, but the red color on the document (for example, red) is mixed to form a mixed color of red and blue at the right end. .

さらに、オペレータは、2枚目のドキュメントに対して、そのままマーカー色追記を行なうと、赤と青の混合色に変色したマーカーペンを使用することになり、2枚目のマーカー色追記領域222は、全体が、赤と青の混合色になってしまう。さらに、2枚目でも同様にドキュメント上の印鑑の色との交じり合いが発生し、さらにマーカー色が変化してしまう。これを複数回、繰り返すと、変色がひどくなり、例えば、n枚目においては、明らかに1枚目の青色のマーカー色とは異なる色に変化してしまう。   Furthermore, if the operator adds the marker color to the second document as it is, the marker pen changed to the mixed color of red and blue is used, and the second marker color additional area 222 is The whole becomes a mixed color of red and blue. In addition, the second sheet is similarly mixed with the seal color on the document, and the marker color is changed. If this is repeated a plurality of times, the discoloration becomes severe. For example, the nth sheet clearly changes to a color different from the first blue marker color.

この場合、n枚目のマーカー色追記領域223の色値(例えばLab値)は、情報処理装置の登録情報(Lab値)と異なる値となるため、登録された青色とは異なる色と判別され、青色に対応する属性値の認識がなされないことになる。   In this case, the color value (for example, Lab value) of the n-th marker color additional recording area 223 is different from the registered information (Lab value) of the information processing apparatus, and thus is determined to be different from the registered blue color. Therefore, the attribute value corresponding to blue is not recognized.

本発明の情報処理装置では、このようなマーカー色の変化を許容する色解析および属性値設定処理を実行する。図4を参照して本発明の情報処理装置の実行する色解析処理例の一実施例について説明する。   The information processing apparatus according to the present invention executes color analysis and attribute value setting processing that allows such a change in marker color. An example of color analysis processing executed by the information processing apparatus of the present invention will be described with reference to FIG.

図4の処理例は、マーカー色が、利用数に応じて色変化を発生させる場合、マーカー色の利用数に応じて、情報処理装置の登録色情報を更新して、マーカー色の色変化に追随した色判別を行なう処理例を説明する図である。   In the processing example of FIG. 4, when the marker color causes a color change according to the number of uses, the registered color information of the information processing apparatus is updated according to the number of uses of the marker color to change the color of the marker color. It is a figure explaining the example of a process which performs the color discrimination which followed.

図4(a)は、マーカー追記のなされたドキュメントから抽出されたある1つの属性に対応するマーカー色の読み取り情報に対応するLab値の分布を示している。色解析を実行する情報処理装置は、各属性対応の色に対応するLab値を登録情報として保持している。なお、Labは、
L:明度指数
a:色度
b:色度
これらの各値によって構成される。例えば
属性=購入価格:マーカー色=オレンジ[(L,a,b)=(80,20,80)]、
属性=購入品:マーカー色=緑[(L,a,b)=(80,−70,70)]
属性=依頼者:マーカー色=青[(L,a,b)=(75,−30,−30)]:
属性=回答者:マーカー色=赤[(L,a,b)=(80,50,−25)]:
このような属性対応の色に対応するLab値が、色解析、属性判定を実行する情報処理装置の記憶部に登録情報として保持されている。情報処理装置は、ドキュメントから取得されたマーカー色設定領域のLab値と、登録情報としてのLab値との比較を実行して、追記マーカー色の色判別を実行して属性解析を実行する。
FIG. 4A shows a distribution of Lab values corresponding to marker color reading information corresponding to a certain attribute extracted from a document with a marker added. An information processing apparatus that performs color analysis holds a Lab value corresponding to each attribute-corresponding color as registration information. Note that Lab is
L: Lightness index a: Chromaticity b: Chromaticity These are constituted by these values. For example, attribute = purchase price: marker color = orange [(L, a, b) = (80, 20, 80)],
Attribute = Purchased product: Marker color = Green [(L, a, b) = (80, −70, 70)]
Attribute = Requester: Marker color = Blue [(L, a, b) = (75, −30, −30)]:
Attribute = respondent: marker color = red [(L, a, b) = (80, 50, −25)]:
Lab values corresponding to such attribute-corresponding colors are stored as registration information in the storage unit of the information processing apparatus that performs color analysis and attribute determination. The information processing apparatus performs comparison between the Lab value of the marker color setting area acquired from the document and the Lab value as registration information, performs color determination of the additional marker color, and executes attribute analysis.

図4(a)は、マーカー追記のなされたドキュメントから抽出されたある1つの属性に対応するマーカー色、例えばオレンジ色の読み取り情報に対応するLab値の分布を示している。オペレータによって追記されたマーカー色は、同じ色であっても、筆圧や図3を参照して説明したドキュメント原稿上のインクとの交じり合いなどによって変化することになる。   FIG. 4A shows a distribution of Lab values corresponding to read information of a marker color corresponding to a certain attribute extracted from a document with a marker added, for example, orange. Even if the marker color added by the operator is the same color, it changes depending on the pen pressure and the ink on the document document described with reference to FIG.

マーカー色と登録色の値との比較処理においては、多少の誤差は許容誤差とする処理を行なう。しかし、先に図3を参照して説明したようなマーカー色の変化が発生すると、登録された色値(L,a,b)との差が大きくなり、許容誤差範囲外に至ることがあり、正しい属性値の設定が実行できなくなる。   In the comparison process between the marker color and the registered color value, a process for setting a slight error as an allowable error is performed. However, if a change in marker color as described above with reference to FIG. 3 occurs, the difference from the registered color value (L, a, b) increases, and may be outside the allowable error range. The correct attribute value cannot be set.

そこで、本処理例では、情報処理装置において、マーカー色の利用回数と、検出色の変化を解析し、その解析結果に基づいて、情報処理装置の登録色情報(Lab)の更新を実行する。   Therefore, in the present processing example, the information processing apparatus analyzes the number of times the marker color is used and the change in the detected color, and updates the registered color information (Lab) of the information processing apparatus based on the analysis result.

図4(b)は、本発明の情報処理装置において実行する登録色情報の更新処理を説明する図である。図4(b)に示す色値271〜275は、それぞれ、マーカー追記ドキュメントから読み取られた同じマーカー色(例えばオレンジ)のマーカー追記設定領域のLab色空間における色情報としてのa,b値の推移を示している。すなわち、
1枚目のドキュメントの色値271は、(L,a,b)=(85,6,85)
2枚目のドキュメントの色値272は、(L,a,b)=(85,20,85)
3枚目のドキュメントの色値273は、(L,a,b)=(85,30,70)
n枚目のドキュメントの色値275は、(L,a,b)=(85,70,40)
このように、同じ色マーカー(例えばオレンジ)であっても、ドキュメントの枚数、すなわち、マーカーの利用回数に応じて、マーカー色の色値は変化する。なお、図4(b)にはLab中、abのみからなる2次元空間での色の推移を示している。
FIG. 4B is a diagram for explaining the registration color information update processing executed in the information processing apparatus of the present invention. The color values 271 to 275 shown in FIG. 4B are transitions of a and b values as color information in the Lab color space of the marker additional recording setting area of the same marker color (for example, orange) read from the marker additional recording document. Is shown. That is,
The color value 271 of the first document is (L, a, b) = (85, 6, 85)
The color value 272 of the second document is (L, a, b) = (85, 20, 85)
The color value 273 of the third document is (L, a, b) = (85, 30, 70)
The color value 275 of the nth document is (L, a, b) = (85, 70, 40).
Thus, even for the same color marker (for example, orange), the color value of the marker color changes according to the number of documents, that is, the number of times the marker is used. FIG. 4B shows the color transition in a two-dimensional space consisting only of ab in Lab.

例えば、1枚目のドキュメントの色値271であるLab=(85,6,85)が情報処理装置にオレンジ対応の色値として登録されている場合、追記ドキュメントから読み取られるマーカー領域の色値が、Lab=(85,6,85)および予め設定された許容誤差範囲内であれば、そのマーカー色設定領域は、オレンジ色のマーカー設定領域と判断される。しかし、図3を参照して説明したような、色変化が発生すると許容誤差範囲外になりオレンジ対応の属性値の設定が実行できなくなる。例えば、図4(b)に示すn枚目のドキュメントのマーカー追記色は変色オレンジであり色値275:Lab=(85,70,40)となり、許容誤差範囲ではなく、オレンジ色との判定は実行されない。   For example, when Lab = (85, 6, 85), which is the color value 271 of the first document, is registered as an orange-compatible color value in the information processing apparatus, the color value of the marker area read from the additional writing document is , Lab = (85, 6, 85) and within a preset allowable error range, the marker color setting area is determined to be an orange marker setting area. However, when a color change occurs as described with reference to FIG. 3, it is out of the allowable error range, and setting of attribute values corresponding to orange cannot be performed. For example, the marker additional color of the nth document shown in FIG. 4B is a discolored orange color value 275: Lab = (85, 70, 40), which is not an allowable error range but is determined to be orange. Not executed.

図4を参照して説明する本発明の情報処理装置の処理例では、登録色情報を、追記を実行したドキュメント枚数に応じて、順次更新する。
まず、1枚目のドキュメントの色値271であるLab=(85,6,85)が、初期的なオレンジ色に対応する登録色情報であるとする。
2枚目のドキュメントの色値272であるLab=(85,20,85)は、登録色情報[Lab=(85,6,85)]の許容誤差範囲にあり、情報処理装置において、オレンジ色のマーカー設定領域であると認識されるとする。
In the processing example of the information processing apparatus according to the present invention described with reference to FIG. 4, the registered color information is sequentially updated according to the number of documents for which additional writing has been executed.
First, it is assumed that Lab = (85, 6, 85), which is the color value 271 of the first document, is registered color information corresponding to the initial orange color.
Lab = (85, 20, 85), which is the color value 272 of the second document, is within the allowable error range of the registered color information [Lab = (85, 6, 85)] and is orange in the information processing apparatus. Is recognized as a marker setting area.

ここで、情報処理装置は、1枚目のドキュメントの色値271であるLab=(85,6,85)と、2枚目のドキュメントの色値272であるLab=(85,20,85)を含む円錐領域281をLab空間上に設定する。図に示す高さl(エル)、半径rの円錐領域281である。高さlは、1枚目のドキュメントの色値271と2枚目のドキュメントの色値272との距離以上に設定される。例えば、2点間距離をLとしたときl=L+Δlとして設定する。Δlは許容誤差を勘案して0以上の値として予め定められる。円錐の底面の半径rも許容誤差に基づいて予め設定する。   Here, the information processing apparatus has Lab = (85, 6, 85), which is the color value 271 of the first document, and Lab = (85, 20, 85), which is the color value 272 of the second document. Is set on the Lab space. This is a conical region 281 having a height l (el) and a radius r shown in the figure. The height l is set to be equal to or greater than the distance between the color value 271 of the first document and the color value 272 of the second document. For example, when the distance between two points is L, it is set as l = L + Δl. Δl is determined in advance as a value of 0 or more in consideration of an allowable error. The radius r of the bottom surface of the cone is also set in advance based on the allowable error.

この円錐を拡張登録色領域としてLab空間上で、マーカーの追記ドキュメント枚数に応じて随時設定することで、マーカー色の変化に追随する。例えば、3枚目のドキュメントの、色マーカー設定領域の測定色値(Lab)が、前回までの(1〜2枚目のドキュメント)から取得された色値(Lab)に基づいて設定される高さl(エル)、半径rの円錐領域282の中に存在すれば、その色マーカー設定領域の設定色はオレンジであると判定する。さらに、4枚目のドキュメントの、色マーカー設定領域の測定色値(Lab)が、前回までの(1〜3枚目のドキュメント)から取得された色値(Lab)に基づいて設定される高さl(エル)、半径rの円錐の中に存在すれば、その色マーカー設定領域の設定色はオレンジであると判定する。以下、同様の処理を繰り返す。   By setting the cone as an extended registration color area in the Lab space as needed according to the number of markers to be additionally written, the change in the marker color is followed. For example, the measured color value (Lab) of the color marker setting area of the third document is a high value set based on the color value (Lab) acquired from the previous (first and second documents). If it exists in the cone area 282 having the radius l and the radius r, it is determined that the setting color of the color marker setting area is orange. Further, the measured color value (Lab) of the color marker setting area of the fourth document is a high value set based on the color value (Lab) acquired from the previous (first to third documents). If it exists within a cone of l (el) and radius r, it is determined that the setting color of the color marker setting area is orange. Thereafter, the same processing is repeated.

なお、円錐は、上記した高さl(エル)、半径rの他、前回までの複数の測定色値によって定義される近似曲線によってその形状および設定位置が決定される。具体的には、まず、前回までの抽出色履歴と抽出色の近似曲線を算出する。近似曲線は、前回までの複数の測定色値(Lab値)に基づいて設定する曲線であり、線形近似、多項式近似、移動平均など、様々な処理に基づく近似曲線が利用可能である。次に、円錐の頂点(起点)を近似曲線上に設定する。この頂点の設定は、直前の抽出色のLab値を近似曲線に射影して設定する。例えば、直前の抽出色のLab値に対応する近似曲線上の近傍点、すなわち直前の抽出色のLab値と最短距離にある近似曲線上の点を円錐の頂点(起点)とする。この射影点を起点(頂点)とする長さl、半径rの円錐を設定する。円錐は、近似曲線を含み、色値履歴の新しい方向に広がり(底面)が設定されるように設定する。   The shape and set position of the cone are determined by an approximate curve defined by a plurality of measurement color values up to the previous time, in addition to the above-described height l (el) and radius r. Specifically, first, an extracted color history up to the previous time and an approximate curve of the extracted color are calculated. The approximate curve is a curve set based on a plurality of measurement color values (Lab values) up to the previous time, and approximate curves based on various processes such as linear approximation, polynomial approximation, and moving average can be used. Next, the apex (starting point) of the cone is set on the approximate curve. This vertex is set by projecting the Lab value of the previous extracted color onto an approximate curve. For example, a neighboring point on the approximate curve corresponding to the Lab value of the immediately previous extracted color, that is, a point on the approximate curve that is the shortest distance from the Lab value of the immediately previous extracted color is set as the apex (starting point) of the cone. A cone having a length l and a radius r with the projection point as the starting point (vertex) is set. The cone includes an approximate curve and is set so that the spread (bottom surface) is set in a new direction of the color value history.

例えば、図4に示す円錐領域282は、前回(1〜2回目)までの2つの測定色値によって定義される近似曲線291と、高さl(エル)、半径rとによってその形状および設定位置が決定される。具体的には、例えば、近似曲線291を円錐領域282の内部または側面に設定する。図に示す例では、1枚目のドキュメント色値271からの2枚目のドキュメント色値272の移動方向は、色情報としてのLab中、a値が大きくなり、b値が小さくなる方向である。この場合、3枚目、4枚目・・・と、同様の傾向での色変化が発生することが予測される。この推測に基づいて、近似曲線291に沿った円錐領域282を設定する。すなわち、a値が大きくなり、b値が小さくなる方向に広がり領域を設定した円錐を設定する。   For example, the conical region 282 shown in FIG. 4 has a shape and a set position depending on an approximate curve 291 defined by two measurement color values until the previous time (first to second times), a height l (el), and a radius r. Is determined. Specifically, for example, the approximate curve 291 is set inside or on the side surface of the conical region 282. In the example shown in the figure, the moving direction of the second document color value 272 from the first document color value 271 is a direction in which the a value increases and the b value decreases in Lab as color information. . In this case, it is predicted that the third sheet, the fourth sheet,... Based on this estimation, a conical region 282 along the approximate curve 291 is set. In other words, a cone is set in which an area is set in a direction in which the a value increases and the b value decreases.

円錐の起点(頂点)は、1枚目のドキュメント色値271と2枚目のドキュメントの色値272とに基づいて設定される近似曲線に2枚目のドキュメントの色値272を射影した点とする。近似曲線291上の、2枚目のドキュメントの色値272の射影点を頂点とし、近似曲線291に沿った高さl(エル)、半径rの円錐領域282を設定する。なお、近似曲線としては線形近似、多項式近似、移動平均など、様々な設定に基づく近似曲線が利用可能である。   The starting point (vertex) of the cone is a point obtained by projecting the color value 272 of the second document onto an approximate curve set based on the color value 271 of the first document and the color value 272 of the second document. To do. A conical region 282 having a height l (el) and a radius r along the approximate curve 291 is set with the projection point of the color value 272 of the second document on the approximate curve 291 as a vertex. As the approximate curve, approximate curves based on various settings such as linear approximation, polynomial approximation, and moving average can be used.

以下、同様に、a値が大きくなり、b値が小さくなる方向に広がり領域を設定して、1回目〜3回目の測定値に基づく近似曲線292上における3枚目のドキュメントの色値273の射影点を頂点とした高さl(エル)、半径rの円錐を設定する。この処理を繰り返し実行し、各円錐内部に測定値がある場合は、その属性対応の色(ここではオレンジ)であると判定する。   In the same manner, the color value 273 of the third document on the approximate curve 292 is set on the approximate curve 292 based on the first to third measurement values by setting a spreading area in the direction in which the a value increases and the b value decreases. A cone having a height l (el) and a radius r with the projection point as a vertex is set. This process is repeated, and if there is a measurement value inside each cone, it is determined that the color corresponds to that attribute (here, orange).

これを繰り返して実行すると、n回目の測定値がオレンジであると判定される領域は、図に示す円錐領域283によって規定される領域となる。円錐領域283は、1回目〜n−1回目の測定値に基づく近似曲線293上におけるn−1回目のドキュメントの色値274の射影点を頂点とした高さl(エル)、半径rの円錐である。結果として、n枚目のドキュメントの色値275であるLab=(85,70,40)は、この円錐領域283によって規定されるLab空間内に含まれ、この色Lab=(85,70,40)はオレンジ色であると判定される。   When this is repeated, the region where the nth measurement value is determined to be orange is a region defined by the conical region 283 shown in the figure. The conical region 283 is a cone having a height l (el) and a radius r with the projection point of the color value 274 of the n−1th document on the approximate curve 293 based on the first to (n−1) th measurement values. It is. As a result, Lab = (85, 70, 40), which is the color value 275 of the nth document, is included in the Lab space defined by this conical region 283, and this color Lab = (85, 70, 40). ) Is determined to be orange.

このように、本発明の情報処理装置では、マーカーの追記処理の繰り返しにより変化するマーカー色を追随して、属性対応色として判定する色領域を更新するので、図3を参照して説明したような、マーカーの色変化が発生した場合であっても、誤認識することなく正確な色解析および属性判定が可能となる。   As described above, the information processing apparatus according to the present invention updates the color region determined as the attribute-corresponding color by following the marker color that changes due to the repetition of the marker addition process, and thus has been described with reference to FIG. Even when the color change of the marker occurs, accurate color analysis and attribute determination can be performed without erroneous recognition.

なお、図4を参照して説明した例では、ドキュメントの枚数に応じて円錐を設定して色領域を更新する処理例を説明したが、マーカーを利用した追記処理回数に応じて円錐を設定して色領域を更新する処理を行なう構成としてもよい。例えば、1枚のドキュメントに複数箇所同じマーカーで追記処理を実行する構成などにおいては、このような設定とするのが有効である。   In the example described with reference to FIG. 4, the processing example in which the cone is set according to the number of documents and the color area is updated has been described. However, the cone is set according to the number of additional recording processes using the marker. In this case, the color region may be updated. For example, such a setting is effective in a configuration in which additional processing is executed with the same marker at a plurality of locations in one document.

図5に示すフローチャートを参照して、情報処理装置において実行する本処理例のシーケンスについて説明する。まず、情報処理装置は、ステップS101においてスキャン画像を入力する。このスキャン画像は、図3に示す(a)マーカー色と属性の対応テーブルに従って、オペレータがマーカー色を選択してマーカー色追記のなされたマーカー追記ドキュメントのスキャン画像である。ステップS102では、文字解析(OCR)処理を実行する。なお、この文字解析においては、ドキュメント全体の文字解析を行ってもよいが、マーカー色設定領域のみを選択して文字解析を行ってもよい。   With reference to the flowchart shown in FIG. 5, the sequence of this processing example executed in the information processing apparatus will be described. First, the information processing apparatus inputs a scanned image in step S101. This scan image is a scan image of a marker-added document in which the marker color is additionally recorded by the operator selecting the marker color according to the marker color / attribute correspondence table shown in FIG. In step S102, a character analysis (OCR) process is executed. In this character analysis, character analysis of the entire document may be performed, or character analysis may be performed by selecting only the marker color setting region.

ステップS103では、色抽出処理を実行する。ドキュメントの原本背景および原本の文字等の記録色と異なる色を抽出する。個々で抽出される色には、テーブル登録されているマーカー色のみならず、テーブル登録されていないマーカー色と異なる色が含まれる場合がある。これは、例えば先に図3を参照して説明したようなドキュメント上の原本のインクとの交じり合いなどに起因して発生する。   In step S103, a color extraction process is executed. A color different from the recorded color of the original background of the document and the original characters is extracted. The color extracted individually may include not only the marker color registered in the table but also a color different from the marker color not registered in the table. This occurs, for example, due to the mixing with the original ink on the document as described above with reference to FIG.

ステップS104では、ステップS103において抽出した色各々について、テーブル登録されているマーカー色(登録色)であるか登録されていない色(非登録色)であるかの判定を行なう。   In step S104, it is determined whether each color extracted in step S103 is a marker color (registered color) registered in the table or an unregistered color (unregistered color).

次に、ステップS105において、前回までの抽出色の履歴と抽出色に基づく近似曲線を算出する。これは、図4を参照して説明した処理であり、今回抽出した色値が登録色に対応するか否かを判定するための事前処理である。例えばLab空間において、前回までの抽出色の色値を設定し、その色値に基づく近似曲線を設定する。このように、近似曲線は、前回までの複数の測定色値(Lab値)に基づいて設定される曲線であり、線形近似、多項式近似、移動平均など、様々な処理に基づく近似曲線が利用可能である。   Next, in step S105, an approximate curve based on the history of extracted colors and the extracted colors up to the previous time is calculated. This is the process described with reference to FIG. 4 and is a preliminary process for determining whether or not the color value extracted this time corresponds to the registered color. For example, in the Lab space, the color values of the extracted colors up to the previous time are set, and an approximate curve based on the color values is set. As described above, the approximate curve is a curve set based on a plurality of measurement color values (Lab values) up to the previous time, and approximate curves based on various processes such as linear approximation, polynomial approximation, and moving average can be used. It is.

次に、ステップS106において、円錐の頂点(起点)を近似曲線上に設定する。この頂点の設定は、直前の抽出色のLab値を近似曲線に射影して設定する。例えば、直前の抽出色のLab値に最短距離にある近似曲線上の点を円錐の頂点(起点)とする。次に、ステップS107において、ステップS106で設定した射影点を起点(頂点)とする長さl、半径rの円錐を設定する。円錐は、近似曲線を含む方向に広がり(底面)が設定されるように設定する。   Next, in step S106, the apex (starting point) of the cone is set on the approximate curve. This vertex is set by projecting the Lab value of the previous extracted color onto an approximate curve. For example, the point on the approximate curve that is the shortest distance from the Lab value of the immediately previous extracted color is set as the apex (starting point) of the cone. Next, in step S107, a cone having a length l and a radius r starting from the projection point set in step S106 is set. The cone is set so that the spread (bottom surface) is set in the direction including the approximate curve.

次に、ステップS108において、設定した円錐領域内に今回の抽出色の色値が存在するか否かの解析処理を実行する。ステップS109において、設定した円錐領域内に今回の抽出色の色値が存在すると判定されると、ステップS110に進み、ステップS109において、設定した円錐領域内に今回の抽出色の色値が存在しないと判定された場合は、抽出色は登録色ではないと判断し、処理を終了(次のドキュメントがある場合は次のドキュメントの処理に進む)する。   Next, in step S108, an analysis process is performed to determine whether or not the color value of the current extracted color exists within the set cone area. If it is determined in step S109 that the color value of the current extracted color exists in the set cone area, the process proceeds to step S110, and in step S109, the color value of the current extracted color does not exist in the set cone area. If it is determined that the extracted color is not a registered color, the process ends (if there is a next document, the process proceeds to the next document).

ステップS109において、設定した円錐領域内に今回の抽出色の色値が存在すると判定した場合は、抽出色は登録色であると判断して、ステップS110において、属性対応の登録色の色値情報を更新する。すなわち、今回取得した色値についても、登録属性に対応する色の値であるとする色情報更新を実行する。なお、これまでに抽出された抽出色の履歴のすべてが登録色に対応する色情報として蓄積される。なお、色空間において設定した円錐領域の全て含む色領域を登録色として設定してもよい。   If it is determined in step S109 that the color value of the current extracted color exists within the set cone area, it is determined that the extracted color is a registered color, and in step S110, the color value information of the registered color corresponding to the attribute. Update. That is, the color information update is performed for the color value acquired this time, assuming that it is the color value corresponding to the registered attribute. Note that all of the extracted color histories extracted so far are stored as color information corresponding to the registered colors. Note that a color area including all the conical areas set in the color space may be set as a registered color.

次に、ステップS111において、登録色対応の属性を取得し、属性情報を登録する。例えば、図3(a)に示す(a)マーカー色と属性の対応テーブルに従った処理を実行しているとすると、マーカー色追記領域の抽出色がオレンジであると判定された場合、購入価格の属性であると判断され、マーカー追記のなされた領域の文字情報(OCR解析結果)の対応属性として、[購入価格]という属性が文字情報に対応付けられて情報処理装置の記憶部に格納され登録される。   Next, in step S111, an attribute corresponding to the registered color is acquired and attribute information is registered. For example, assuming that (a) the process according to the marker color / attribute correspondence table shown in FIG. 3A is executed, the purchase price is determined when the extracted color of the marker color additional recording area is determined to be orange. As the corresponding attribute of the character information (OCR analysis result) of the area where the marker is added, the attribute “purchase price” is associated with the character information and stored in the storage unit of the information processing apparatus. be registered.

次に、ステップS112において、今回取得した色値の履歴を、前回までの色値履歴に加えて保存する。この保存データは、次回抽出色の色値解析の際に適用される。すなわち、近似曲線の生成、円錐の設定処理に際に適用される。   Next, in step S112, the color value history acquired this time is saved in addition to the previous color value history. This stored data is applied in the next color value analysis of the extracted color. That is, it is applied when generating an approximate curve and setting a cone.

このような処理によって、順次、新たなドキュメントあるいは新たなマーカー領域からの抽出色の色判定および属性判定に際して、前回までの抽出色履歴に基づく近似曲線が新たに設定され、新たな円錐が設定されて、その円錐領域内に新たな抽出色の色値が含まれるか否かを判断して、属性対応色に相当するか否かを判定する処理を繰り返す。この処理によって、図3を参照して説明したマーカー色の変化が発生した場合においても、情報処理装置において登録色に対応するか否かの判定基準とする色領域を、マーカー色の変化に追随して順次更新するので、誤った判断を起こすことなく正しい色判定及び属性設定が可能となる。なお、本処理例では、色空間としてLab空間を適用した処理例を説明したが、本発明はRGBなどLabと異なる色空間を適用した処理として実行することも可能であり、同様の効果を奏することができる。   By such processing, when determining the color and attribute of the color extracted from a new document or a new marker area, an approximate curve based on the previous extracted color history is newly set, and a new cone is set. Then, it is determined whether or not the color value of the new extracted color is included in the cone area, and the process of determining whether or not it corresponds to the attribute corresponding color is repeated. Even if the marker color change described with reference to FIG. 3 occurs by this processing, the color region used as a criterion for determining whether or not it corresponds to the registered color in the information processing apparatus follows the marker color change. Thus, since the update is performed sequentially, correct color determination and attribute setting are possible without causing erroneous determination. In this processing example, the processing example in which the Lab space is applied has been described. However, the present invention can be executed as a processing in which a color space different from Lab, such as RGB, is applied, and has the same effect. be able to.

(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)
次に、マーカーペンの交換に対応した処理例について、図6以下を参照して説明する。1つのマーカーペンを継続して使用続けると、当然、インクが消耗し、次第に色が薄くなる。具体的には、図6(a)に示すように、ある属性1に対応して利用するマーカーペンがオレンジであるとする。この場合、1本のオレンジ色のマーカーペンを使用して追記を繰り返し実行することを想定する。
(2.2) Processing example 1 corresponding to replacement of marker pen (exchange to same color)
Next, a processing example corresponding to the replacement of the marker pen will be described with reference to FIG. If one marker pen is continuously used, the ink is naturally consumed, and the color gradually becomes lighter. Specifically, as shown in FIG. 6A, it is assumed that the marker pen used corresponding to a certain attribute 1 is orange. In this case, it is assumed that additional writing is repeatedly executed using one orange marker pen.

図6(b)に示すように、1枚目のドキュメントに対しては、登録された色情報:Lab=(80,20,80)に対応する色がドキュメントに記録される。従って、マーカー色追記領域301から読み取られる色の値は、登録色とほぼ一致することになる。しかし、繰り返しマーカー記録を実行していると、インクが消耗し、しだいに色が薄くなり、例えば30枚目あるいは30回目の追記において、マーカー色追記領域302から読み取られる色の値は、登録色と異なる値となり、さらに、継続して同じマーカーペンを利用すると、さらに色が薄くなり、n枚目あるいはn回目の追記において、マーカー色追記領域303から読み取られる色の値は、登録色と明らかに異なる値となる。   As shown in FIG. 6B, for the first document, the color corresponding to the registered color information: Lab = (80, 20, 80) is recorded in the document. Therefore, the color value read from the marker color additional recording area 301 substantially matches the registered color. However, when repeated marker recording is performed, the ink is consumed and the color gradually fades. For example, in the 30th or 30th additional recording, the color value read from the marker color additional recording area 302 is the registered color. Furthermore, if the same marker pen is used continuously, the color becomes lighter, and the color value read from the marker color additional recording area 303 in the nth or nth additional recording is clearly a registered color. It becomes a different value.

このような色の変化は、先に説明した(2.1)マーカーペンの変色に対応した処理例によって対応することができる。すなわち、図4を参照して説明したような近似曲線の設定、円錐領域の設定を実行して登録色に対応する色か否かを判定する色領域を随時更新することで、マーカー色の変化に追随した色判定、属性判定が可能となる。しかし、この処理例では、オペレータは、色の薄くなったマーカーペンの利用を止め、新しいマーカーペンの使用を開始することがある。   Such a color change can be dealt with by the processing example corresponding to the color change of (2.1) marker pen described above. That is, by changing the marker color as necessary by executing the setting of the approximate curve and the setting of the conical region as described with reference to FIG. 4 and determining whether or not the color corresponds to the registered color, the marker color changes. It is possible to perform color determination and attribute determination following the above. However, in this example process, the operator may stop using the lighter marker pen and start using a new marker pen.

このようなペンの交換によって、前回までの履歴に基づく処理では対応が不可能となる。すなわち、n回目の追記が終了した時点でペンの交換を行ったとすると、n回目の抽出色と、新しいペンで追記を実行したn+1回目の追記領域からの抽出色とは明確に異なるものとなり、抽出色履歴に基づく近似曲線に基づいて設定した円錐領域には含まれない色となる。また、同じ色、例えば[オレンジ]であっても、ペンのメーカーによって、その色は異なるものとなり、登録色が固定的である場合は、その交換ペンの色が登録色と異なる色と判定されるという恐れがある。   Such replacement of the pen makes it impossible to cope with processing based on the history up to the previous time. That is, if the pen is replaced when the n-th additional recording is completed, the n-th extracted color is clearly different from the extracted color from the n + 1-th additional recording area where the additional writing is performed with a new pen. The color is not included in the conical region set based on the approximate curve based on the extracted color history. Even if the color is the same, for example [Orange], the color differs depending on the pen manufacturer. If the registered color is fixed, the replacement pen color is determined to be different from the registered color. There is a fear that.

本処理例は、このようなペン交換が発生した場合でも正しい色判定に基づく属性設定を可能とした処理例である。本処理例について、図7を参照して説明する。図7(a)は、マーカー追記のなされたドキュメントから抽出されたある1つの属性に対応するマーカー色、例えばオレンジ色の読み取り情報に対応するLab値の分布を示している。オペレータによって追記されたマーカー色は、図6を参照して説明したように同じ色であっても、次第に色が薄くなり、また、ペンの変更によって突然色が大きく変化することがある。   This processing example is a processing example that enables attribute setting based on correct color determination even when such pen replacement occurs. This processing example will be described with reference to FIG. FIG. 7A shows a distribution of Lab values corresponding to read information of a marker color corresponding to one attribute extracted from a document to which a marker has been added, for example, orange. Even if the marker color added by the operator is the same color as described with reference to FIG. 6, the color gradually becomes light, and the color may suddenly change greatly due to the change of the pen.

前述したように、マーカー色と登録色の値との比較処理においては、多少の誤差は許容誤差とする処理を行なう。しかし、先に図3を参照して説明したようなマーカー色の変化が発生すると、登録された色値(Lab)との差が大きくなり、許容誤差範囲外に至ることがあり、正しい属性値の設定が実行できなくなる。マーカー色の使用回数に基づくなだらかな色の変化に対しては、先に説明した(2.1)マーカーペンの変色に対応した処理例によって対応することができるが、突然のペンの変更には対応できない。   As described above, in the comparison process between the marker color and the registered color value, a process for setting a slight error as an allowable error is performed. However, if a change in the marker color as described above with reference to FIG. 3 occurs, the difference from the registered color value (Lab) becomes large and may be outside the allowable error range. Cannot be set. The gentle color change based on the number of times the marker color is used can be dealt with by the processing example corresponding to the (2.1) marker pen color change described above. I can not cope.

そこで、本処理例では、ペンの変更があった場合でも登録色に相当する色であるとの判断を可能とするため、図7(b)に示すように、抽出色履歴に基づいて設定される近似曲線321を中心とした半径rの円柱領域322を設定し、この円柱領域322に抽出色の色値が含まれる場合には、登録色に対応する色であると判定する処理を実行する。   Therefore, in this processing example, even if the pen is changed, it is possible to determine that the color corresponds to the registered color. Therefore, as shown in FIG. 7B, the color is set based on the extracted color history. A cylindrical region 322 having a radius r centered on the approximate curve 321 is set, and when the color value of the extracted color is included in the cylindrical region 322, processing for determining that the color corresponds to the registered color is executed. .

近似曲線321は、先に説明した(2.1)マーカーペンの変色に対応した処理例において説明した近似曲線であり、過去の抽出色の色値(Lab)に基づいて設定した近似曲線である。本処理例では、この近似曲線321を中心として、さらに、半径rの円柱領域322を拡張登録色領域として設定する。この円柱領域322に抽出色の色値が含まれれば、登録色に対応する色であると判断する。   The approximate curve 321 is the approximate curve described in the processing example corresponding to the color change of the marker pen described above (2.1), and is an approximate curve set based on the color value (Lab) of the past extracted color. . In this processing example, a cylindrical region 322 having a radius r is set as an extended registration color region with the approximate curve 321 as the center. If the color value of the extracted color is included in this cylindrical region 322, it is determined that the color corresponds to the registered color.

例えば、図7(b)に示す色値331が、1回目のドキュメント読み取りにおいて抽出されたマーカー色の抽出色の色値であり、色値332が、同じマーカーペンで追記を行ったn回目の追記のなされたドキュメントから読み取られ抽出されたマーカー色の抽出色の色値である。色値331は、例えば、図6のマーカー色追記領域301から取得された色値に対応する、色値332は、図6のマーカー色追記領域303から取得された色値に対応する。   For example, the color value 331 shown in FIG. 7B is the color value of the extracted color of the marker color extracted in the first document reading, and the color value 332 is the nth time that is additionally written with the same marker pen. This is a color value of an extracted color of a marker color read and extracted from a document to which additional writing has been made. For example, the color value 331 corresponds to the color value acquired from the marker color additional recording area 301 in FIG. 6, and the color value 332 corresponds to the color value acquired from the marker color additional recording area 303 in FIG. 6.

n回目の追記を終了後、オペレータはマーカーペンの交換を行ったとする。しかし、このペンは、それまで使用していたペンとは異なるメーカーのペンであり、同じ色、例えば[オレンジ]であっても色の値は一致していない。図7(b)では、色値333に相当する。しかし、この色値333は、図から理解されるように、近似曲線321を中心として設定された半径rの円柱領域322である拡張登録色領域に含まれ、この円柱領域322に含まれることに基づいて、登録色に相当するとの判断がなされ、正しい属性設定が行われる。なお、半径rの値は、使用するペンの種類の色差などに基づいて予め設定する。設定情報は、情報処理装置に記録される。   It is assumed that after completing the n-th additional writing, the operator replaces the marker pen. However, this pen is a pen made by a different manufacturer from the pen used so far, and the color values of the same color, for example [orange], do not match. In FIG. 7B, this corresponds to the color value 333. However, the color value 333 is included in the extended registration color region, which is a cylindrical region 322 having a radius r set with the approximate curve 321 as the center, as understood from the figure. Based on this, it is determined that the color corresponds to the registered color, and correct attribute setting is performed. Note that the value of the radius r is set in advance based on the color difference of the type of pen used. The setting information is recorded in the information processing apparatus.

情報処理装置は、先に説明した(2.1)マーカーペンの変色に対応した処理例において説明した近似曲線を設定するとともに、半径rの値に基づいて、近似曲線を中心軸とした円柱領域、すなわち、図に示す円柱領域322を拡張登録色領域として設定して、これらの色領域を登録色とする設定を実行し、抽出色と登録色とを比較する。すなわち、抽出色が円柱領域322に含まれる場合には、登録色に相当すると判断して属性設定を実行する。   The information processing apparatus sets the approximate curve described in the processing example corresponding to the color change of the marker pen described above (2.1), and based on the value of the radius r, the cylindrical region having the approximate curve as the central axis That is, the cylindrical region 322 shown in the figure is set as an extended registered color region, and settings for setting these color regions as registered colors are executed, and the extracted color and the registered color are compared. That is, when the extracted color is included in the cylindrical region 322, it is determined that it corresponds to the registered color, and the attribute setting is executed.

図8に示すフローチャートを参照して、情報処理装置において実行する本処理例のシーケンスについて説明する。まず、情報処理装置は、ステップS201においてスキャン画像を入力する。このスキャン画像は、例えば図2に示すマーカー色と属性の対応テーブル71に従って、オペレータがマーカー色を選択してマーカー色追記のなされたマーカー追記ドキュメントのスキャン画像である。ステップS202では、文字解析(OCR)処理を実行する。なお、この文字解析においては、ドキュメント全体の文字解析を行ってもよいが、マーカー色設定領域のみを選択して文字解析を行ってもよい。   With reference to the flowchart shown in FIG. 8, the sequence of this processing example executed in the information processing apparatus will be described. First, the information processing apparatus inputs a scan image in step S201. This scan image is a scan image of a marker-added document in which the marker color is additionally recorded by the operator selecting the marker color according to the marker color / attribute correspondence table 71 shown in FIG. In step S202, a character analysis (OCR) process is executed. In this character analysis, character analysis of the entire document may be performed, or character analysis may be performed by selecting only the marker color setting region.

ステップS203では、色抽出処理を実行する。ドキュメントの原本背景および原本の文字等の記録色と異なる色を抽出する。個々で抽出される色には、テーブル登録されているマーカー色のみならず、テーブル登録されていないマーカー色と異なる色が含まれる場合がある。これは、例えば先に図6、図7を参照して説明したようなマーカーの連続使用による色の希薄化、ペンの交換などに起因して発生する。   In step S203, color extraction processing is executed. A color different from the recorded color of the original background of the document and the original characters is extracted. The color extracted individually may include not only the marker color registered in the table but also a color different from the marker color not registered in the table. This occurs due to, for example, color thinning due to continuous use of markers, pen replacement, and the like as described above with reference to FIGS.

ステップS204では、ステップS203において抽出した色各々について、テーブル登録されているマーカー色(登録色)であるか登録されていない色(非登録色)であるかの判定を行なう。   In step S204, it is determined whether each color extracted in step S203 is a marker color (registered color) registered in the table or an unregistered color (non-registered color).

次に、ステップS205において、前回までの抽出色の履歴と抽出色に基づく近似曲線を算出する。これは、先の(2.1)マーカーペンの変色に対応した処理例において図4を参照して説明した処理である。近似曲線は、前回までの複数の測定色値(Lab値)に基づいて設定される曲線であり、線形近似、多項式近似、移動平均など、様々な処理に基づく近似曲線が利用可能である。   In step S205, an approximate curve based on the history of extracted colors and the extracted colors up to the previous time is calculated. This is the process described with reference to FIG. 4 in the process example corresponding to the previous (2.1) color change of the marker pen. The approximate curve is a curve set based on a plurality of measurement color values (Lab values) up to the previous time, and approximate curves based on various processes such as linear approximation, polynomial approximation, and moving average can be used.

次に、ステップS206において、近似曲線を中心軸とした半径rの円柱状の色領域を設定する。これは、図7を参照して説明した円柱領域322に相当する。次に、ステップS207において、設定した円柱領域内に今回の抽出色の色値が存在するか否かの解析処理を実行する。ステップS208において、設定した円柱領域内に今回の抽出色の色値が存在すると判定されるとステップS209に進み、ステップS208において、設定した円柱領域内に今回の抽出色の色値が存在しないと判定された場合は、抽出色は登録色ではないと判断し、処理を終了(次のドキュメントがある場合は次のドキュメントの処理に進む)する。   Next, in step S206, a cylindrical color region having a radius r with the approximate curve as the central axis is set. This corresponds to the cylindrical region 322 described with reference to FIG. Next, in step S207, analysis processing is performed to determine whether or not the color value of the current extracted color exists within the set cylindrical region. If it is determined in step S208 that the color value of the current extracted color exists in the set cylindrical area, the process proceeds to step S209, and if the color value of the current extracted color does not exist in the set cylindrical area in step S208. If it is determined, it is determined that the extracted color is not a registered color, and the process ends (if there is a next document, the process proceeds to the next document).

ステップS208において、設定した円柱領域内に今回の抽出色の色値が存在すると判定した場合は、抽出色は登録色であると判断して、ステップS209において、属性対応の登録色の色値情報を更新する。すなわち、今回取得した色値についても、登録属性に対応する色の値であるとする色情報更新を実行する。なお、これまでに抽出された抽出色の履歴のすべてが登録色に対応する色情報として蓄積される。なお、色空間において設定した円柱領域の全て含む色領域を登録色として設定してもよい。   If it is determined in step S208 that the color value of the current extracted color exists within the set cylindrical area, it is determined that the extracted color is a registered color, and in step S209, the color value information of the registered color corresponding to the attribute. Update. That is, the color information update is performed for the color value acquired this time, assuming that it is the color value corresponding to the registered attribute. Note that all of the extracted color histories extracted so far are stored as color information corresponding to the registered colors. Note that a color area including all the cylindrical areas set in the color space may be set as a registered color.

次に、ステップS210において、登録色対応の属性を取得し、属性情報を登録する。例えば、図2に示すマーカー色と属性の対応テーブル71に従った処理を実行しているとすると、マーカー色追記領域の抽出色がオレンジであると判定された場合、購入価格の属性であると判断され、マーカー追記のなされた領域の文字情報(OCR解析結果)の対応属性として、[購入価格]という属性が文字情報に対応付けられて情報処理装置の記憶部に格納され登録される。   Next, in step S210, an attribute corresponding to the registered color is acquired and attribute information is registered. For example, assuming that the processing according to the marker color / attribute correspondence table 71 shown in FIG. 2 is being executed, if it is determined that the extracted color of the marker color additional recording area is orange, the attribute is a purchase price. The attribute “purchase price” is stored in the storage unit of the information processing apparatus and registered in association with the character information as the corresponding attribute of the character information (OCR analysis result) of the area where the marker is additionally recorded.

次に、ステップS211において、今回取得した色値の履歴を、前回までの色値履歴に加えて保存する。この保存データは、次の回の抽出色の色値解析の際に適用される。すなわち、近似曲線の生成、円柱領域の設定処理に際に適用される。   Next, in step S211, the color value history acquired this time is saved in addition to the previous color value history. This stored data is applied in the next color value analysis of the extracted color. That is, it is applied when generating an approximate curve and setting a cylindrical region.

このような処理によって、順次、新たなドキュメントあるいは新たなマーカー領域からの抽出色の色判定および属性判定に際して、前回までの抽出色履歴に基づく近似曲線が新たに設定され、新たな円柱領域が設定されて、その円柱領域内に新たな抽出色の色値が含まれるか否かを判断して、属性対応色に相当するか否かを判定する処理を繰り返す。この処理によって、図6、図7を参照して説明したマーカー色の変化およびマーカーペンの交換による色の差異が発生した場合においても、情報処理装置において登録色に対応するか否かの判定基準とする色領域を、マーカー色の変化に追随し、さらに、近似曲線を中心とする所定の半径rの色領域を順次更新して、より広い領域を登録色対応の色と判定するので、誤った判断を起こすことなく正しい色判定及び属性設定が可能となる。なお、本処理例では、色空間としてLab空間を適用した処理例を説明したが、本処理例もRGBなどLabと異なる色空間を適用した処理として実行することも可能であり、同様の効果を奏することができる。   By such processing, an approximate curve based on the previous extracted color history is newly set and a new cylindrical area is set for color determination and attribute determination of the extracted color from a new document or a new marker area sequentially. Then, it is determined whether or not the color value of the new extracted color is included in the cylindrical region, and the process of determining whether or not it corresponds to the attribute corresponding color is repeated. Even if the marker color change and the color difference due to the replacement of the marker pen described with reference to FIGS. 6 and 7 occur as a result of this processing, a criterion for determining whether or not to correspond to the registered color in the information processing apparatus Since the color area with the predetermined radius r centering on the approximate curve is sequentially updated and the wider area is determined as the color corresponding to the registered color. Therefore, correct color determination and attribute setting can be performed without making any determination. In this processing example, the processing example in which Lab space is applied as the color space has been described. However, this processing example can also be executed as processing in which a color space different from Lab, such as RGB, is applied. Can play.

(2.3)マーカーペンの交換に対応した処理例2(異なる色への交換)
次に、マーカーペンの交換に対応した処理例2について、図9以下を参照して説明する。上述した(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)においては、例えば使用マーカーが[オレンジ]であれば、同じ[オレンジ]の新しいペンに交換した場合の対応例であった。しかし、必ずしも、このような同一系色のペンが利用可能な状態にあるとは限らず、いままでに使用していない色のペンを使いはじめるといった場合もある。例えば図2に示すマーカー色と属性の対応テーブル71に従った処理を実行している場合、オペレータは、属性[購入価格]に対応するマーカー色として[オレンジ]を使用したマーカー追記を行なうが、多くのマーカー追記によってインクが消耗し、ペンを交換しようとしたが同一系色のオレンジのマーカーペンが無いといった場合、属性対応色として登録されていない新たな色、例えば[紫]を[オレンジ]の代わりに属性[購入価格]に対応するマーカー色として利用する場合がある。
(2.3) Processing example 2 corresponding to replacement of marker pen (exchange to a different color)
Next, processing example 2 corresponding to the replacement of the marker pen will be described with reference to FIG. In the processing example 1 (exchange to the same color) corresponding to the replacement of the marker pen described in (2.2) above, for example, when the marker used is [orange], the pen is replaced with a new pen of the same [orange] It was an example of correspondence. However, the same color pens are not always available, and there are cases where a pen of a color that has not been used is used. For example, when the processing according to the marker color / attribute correspondence table 71 shown in FIG. 2 is executed, the operator performs marker addition using [orange] as the marker color corresponding to the attribute [purchase price]. If ink is consumed by adding many markers and you try to replace the pen, but there is no orange marker pen of the same color, a new color that is not registered as an attribute-corresponding color, such as [Purple], [Orange] In some cases, it is used as a marker color corresponding to the attribute [purchase price] instead of.

このような場合、色解析を実行する情報処理装置に登録されたマーカー色と属性の対応テーブルをマーカーの色変更に際して、オペレータが登録情報を更新することで対応可能であるが、このような処理をオペレータが行なうことは煩わしい処理であり、処理効率が低下することになる。そこで、本処理例では、このように全く異なる色へのマーカーペンの変更が行われた場合、その新規色のマーカーペンが、どの登録色に対応するペンとして交換された色であるかを自動的に判定して、マーカー色と属性の対応テーブルの自動更新を実行する。この処理例について、図9以下を参照して説明する。   In such a case, the marker color and attribute correspondence table registered in the information processing apparatus that performs color analysis can be handled by updating the registration information by the operator when changing the marker color. It is a troublesome process for the operator to perform, and the processing efficiency decreases. Therefore, in this processing example, when the marker pen is changed to a completely different color as described above, it is automatically determined which registered color the pen corresponding to the new color is replaced with. The marker color / attribute correspondence table is automatically updated. This processing example will be described with reference to FIG.

図9は、ペン交換に伴うマーカー色と属性の対応テーブルの更新処理の一例を説明する図である。ドキュメント1〜n枚目までは、図のマーカー色を追記した追記ドキュメント410に示すような設定、すなわち、マーカー色と属性の対応テーブル415に登録された情報に基づいてオペレータがマーカー追記を行っていた。具体的には、
マーカー色=オレンジ:属性=購入価格、
マーカー色=緑:属性=購入品、
マーカー色=青:属性=依頼者、
マーカー色=赤:属性=回答者、
これらのマーカー色と属性の対応情報に基づいて、オペレータがマーカー追記を実行していた。
FIG. 9 is a diagram for explaining an example of update processing of the marker color / attribute correspondence table associated with pen replacement. For the first to nth documents, the operator performs marker addition based on the settings shown in the additional document 410 in which the marker colors in the figure are added, that is, information registered in the marker color / attribute correspondence table 415. It was. In particular,
Marker color = orange: attribute = purchase price
Marker color = green: attribute = purchased item,
Marker color = blue: attribute = requester,
Marker color = red: attribute = respondent,
Based on the correspondence information between the marker color and the attribute, the operator has added the marker.

この設定情報に基づいてマーカー追記を実行中、[オレンジ]のマーカーペンのインクが消耗したので、オペレータは、[オレンジ]のマーカーペンの使用を中止し、マーカー色と属性の対応テーブル415に登録されていない新たな色として[紫]を選択して、[オレンジ]のマーカーペンの代わりとしてマーカー追記を続行する。   While the marker addition is being executed based on this setting information, since the ink of the [orange] marker pen has been consumed, the operator stops using the [orange] marker pen and registers it in the marker color / attribute correspondence table 415. [Purple] is selected as a new color that has not been added, and marker addition is continued in place of the [orange] marker pen.

この結果、図に示すマーカー色を追記した追記ドキュメント420に示すように、
マーカー色=紫:属性=購入価格、
マーカー色=緑:属性=購入品、
マーカー色=青:属性=依頼者、
マーカー色=赤:属性=回答者、
これらのマーカー色と属性の対応を新たに設定して、オペレータがマーカー追記を行なうことになる。
As a result, as shown in the postscript document 420 in which the marker color shown in the figure is added,
Marker color = purple: attribute = purchase price,
Marker color = green: attribute = purchased item,
Marker color = blue: attribute = requester,
Marker color = red: attribute = respondent,
The correspondence between these marker colors and attributes is newly set, and the operator adds markers.

図に示す1〜n枚目のマーカー色を追記した追記ドキュメント410の購入価格のマーカー色追記領域411は[オレンジ]のマーカー色追記となっているが、n+1枚目のマーカー色を追記した追記ドキュメント420の購入価格のマーカー色追記領域421は[紫]のマーカー色追記に変更されている。本処理例では、このような新規色のマーカーペンによる追記が検出された場合に、自動的に登録情報の更新を実行する。すなわち、
[マーカー色=オレンジ:属性=購入価格]
上記対応情報が登録されたマーカー色と属性の対応テーブル415を、
[マーカー色=紫:属性=購入価格]
上記情報に変更してマーカー色と属性の対応テーブル425に更新する処理を実行する。
The marker color additional recording area 411 of the purchase price of the additional recording document 410 in which the 1st to nth marker colors are added as shown in the figure is the [orange] marker color additional recording, but the additional recording in which the (n + 1) th marker color is added. The marker color additional recording area 421 of the purchase price of the document 420 is changed to [purple] marker color additional recording. In this processing example, when such additional writing with a marker pen of a new color is detected, the registration information is automatically updated. That is,
[Marker color = orange: attribute = purchase price]
A marker color / attribute correspondence table 415 in which the correspondence information is registered,
[Marker color = purple: attribute = purchase price]
A process of changing to the information and updating the marker color / attribute correspondence table 425 is executed.

本処理例の具体的な処理例について、図10を参照して説明する。本処理例においては、ドキュメントの処理枚数と、各マーカー色対応のマーカー色追記領域検出数とを比較して、マーカー色の変更の有無および変更されたマーカー色の判定を実行する。   A specific processing example of this processing example will be described with reference to FIG. In this processing example, the number of processed documents is compared with the number of marker color additional recording areas detected corresponding to each marker color, and the presence / absence of a change in marker color and the determination of the changed marker color are executed.

図10に示す色空間450はLab色空間であり、情報処理装置は、マーカー追記ドキュメントから抽出した色領域の判定色をこの色空間450に配置し、各抽出色毎に、その数をカウントする。本処理例では、処理ドキュメント(原稿)枚数=7とし、
マーカー色=オレンジ:属性=購入価格、
マーカー色=緑:属性=購入品、
マーカー色=青:属性=依頼者、
マーカー色=赤:属性=回答者、
の対応情報を持つマーカー色と属性の対応テーブル415に基づく処理が実行されたものとする。各ドキュメントには、各色(属性)が1つずつ含まれているものとする。
A color space 450 shown in FIG. 10 is a Lab color space, and the information processing apparatus arranges the determination colors of the color area extracted from the marker additional document in the color space 450 and counts the number of each extracted color. . In this processing example, the number of processed documents (originals) = 7,
Marker color = orange: attribute = purchase price
Marker color = green: attribute = purchased item,
Marker color = blue: attribute = requester,
Marker color = red: attribute = respondent,
It is assumed that the processing based on the marker color / attribute correspondence table 415 having the correspondence information is executed. Each document is assumed to include one color (attribute).

情報処理装置は、マーカー色と属性の対応テーブル415に登録された色に対応する抽出色毎にその数をカウントする。図に示す例では、
オレンジ色領域451:カウント数=6、
緑色領域452:カウント数=7、
青色領域453:カウント数=7、
赤領域454:カウント数=7、
これらの各色領域に対応するマーカー色追記領域数がカウントされている。
さらに、マーカー色と属性の対応テーブル415には登録されていない[マーカー色=紫]を示す非登録色対応色値471が検出されている。
The information processing apparatus counts the number of each extracted color corresponding to the color registered in the marker color / attribute correspondence table 415. In the example shown in the figure,
Orange area 451: Count number = 6,
Green region 452: Count number = 7,
Blue region 453: Count number = 7,
Red region 454: Count number = 7,
The number of marker color additional recording areas corresponding to each of these color areas is counted.
Further, an unregistered color corresponding color value 471 indicating [marker color = purple] that is not registered in the marker color / attribute correspondence table 415 is detected.

色解析、属性判定および登録処理を実行する情報処理装置は、この各属性対応登録色の抽出カウント数と、ドキュメント数の比較を実行する。図10に示す処理例において、ドキュメント数=7に対して、カウント数が少ないのは、オレンジのカウント数=6である。さらに、1つの新規抽出色[紫]が検出されている。紫のカウント数は[1]である。   The information processing apparatus that performs color analysis, attribute determination, and registration processing compares the extracted count number of each attribute-corresponding registered color with the number of documents. In the processing example shown in FIG. 10, the orange count number = 6 has a smaller count number than the document number = 7. Furthermore, one new extracted color [purple] is detected. The purple count is [1].

情報処理装置は、カウント数が予定数より少ない抽出色[オレンジ]と新規色[紫]のカウント数の加算数(6+1=7)がドキュメント数=7に等しいことを検証し、この検証に基づいて、マーカー色[オレンジ]からマーカー色[紫]への本稿が実行されたものと判断する。情報処理装置は、この判断に基づいて、
[マーカー色=オレンジ:属性=購入価格]
上記対応情報が登録されたマーカー色と属性の対応テーブル415を、
[マーカー色=紫:属性=購入価格]
上記情報に変更してマーカー色と属性の対応テーブル425に更新する処理を実行する。
The information processing apparatus verifies that the added number (6 + 1 = 7) of the number of counts of the extracted color [orange] and the new color [purple] whose count is less than the planned number is equal to the number of documents = 7, and based on this verification Thus, it is determined that this article has been executed from the marker color [orange] to the marker color [purple]. Based on this determination, the information processing device
[Marker color = orange: attribute = purchase price]
A marker color / attribute correspondence table 415 in which the correspondence information is registered,
[Marker color = purple: attribute = purchase price]
A process of changing to the information and updating the marker color / attribute correspondence table 425 is executed.

この処理によって、マーカー色と属性の対応テーブルは自動更新されるので、オペレータが、テーブルの更新処理を実行する必要がなくなり、効率的な処理が実現される。なお、上記処理例では、1ドキュメントに対して、各属性対応色の設定領域が1箇所とした設定例として説明したが、1つのドキュメントに1つの同じマーカー色設定領域がある場合は、その領域数に応じたカウントを実行する設定とする。例えば、オレンジの設定領域が1ドキュメントに2箇所ある場合は、図10の例では、ドキュメント数=7に対して、オレンジの色抽出が7×2=14となり、カウント数=14であると予測される。この予測に反して、例えば10の[オレンジ]の色のカウントしかなく、[紫]のカウントが4検出されれば、
[オレンジのカウント数=10]+[紫のカウント数=4]=14
となり、ドキュメントに対するオレンジの予定追記利用域数=14に対応するので、[オレンジ]から[紫]へのマーカーペン色の変更が実行されたと判断し、登録色情報の更新、すなわちテーブルの更新を実行する。
By this process, the marker color / attribute correspondence table is automatically updated, so that the operator does not need to execute the table update process, and an efficient process is realized. The above processing example has been described as a setting example in which one attribute-corresponding color setting area is set for one document. However, if one document has one same marker color setting area, that area It is set to execute counting according to the number. For example, when there are two orange setting areas in one document, in the example of FIG. 10, it is predicted that the orange color extraction is 7 × 2 = 14 and the count number = 14 with respect to the document number = 7. Is done. Contrary to this prediction, for example, if there are only 10 [orange] color counts and 4 [purple] counts are detected,
[Orange count = 10] + [Purple count = 4] = 14
Therefore, it corresponds to the number of orange scheduled additional use areas for the document = 14, so it is determined that the marker pen color has been changed from [orange] to [purple], and the registered color information is updated, that is, the table is updated. Execute.

本処理例のシーケンスについて、図11に示すフローチャートを参照して説明する。まず、情報処理装置は、ステップS301においてスキャン画像を入力する。このスキャン画像は、例えば図2に示すマーカー色と属性の対応テーブル71に従って、オペレータがマーカー色を選択してマーカー色追記のなされたマーカー追記ドキュメントのスキャン画像である。ステップS302では、文字解析(OCR)処理を実行する。なお、この文字解析においては、ドキュメント全体の文字解析を行ってもよいが、マーカー色設定領域のみを選択して文字解析を行ってもよい。   The sequence of this processing example will be described with reference to the flowchart shown in FIG. First, the information processing apparatus inputs a scan image in step S301. This scan image is a scan image of a marker-added document in which the marker color is additionally recorded by the operator selecting the marker color according to the marker color / attribute correspondence table 71 shown in FIG. In step S302, character analysis (OCR) processing is executed. In this character analysis, character analysis of the entire document may be performed, or character analysis may be performed by selecting only the marker color setting region.

ステップS303では、色抽出処理を実行する。ドキュメントの原本背景および原本の文字等の記録色と異なる色を抽出する。個々で抽出される色には、テーブル登録されているマーカー色のみならず、テーブル登録されていないマーカー色と異なる色が含まれる場合がある。これは、例えば先に図9,図10を参照して説明したようなマーカーペンの交換に起因して発生する。   In step S303, color extraction processing is executed. A color different from the recorded color of the original background of the document and the original characters is extracted. The color extracted individually may include not only the marker color registered in the table but also a color different from the marker color not registered in the table. This occurs, for example, due to the replacement of the marker pen as described above with reference to FIGS.

ステップS304では、ステップS303において抽出した色各々について、テーブル登録されているマーカー色(登録色)であるか登録されていない色(非登録色)であるかの判定を行なう。   In step S304, it is determined whether each color extracted in step S303 is a marker color (registered color) registered in the table or an unregistered color (unregistered color).

次に、ステップS305において、テーブル登録されているマーカー色(登録色)の抽出数をカウントして、予定数との比較を実行する。図10を参照して説明した処理例では、各抽出色の予定数は[7]となる。ステップS306において、全ての抽出色カウントと予定数が一致したか否かを判定する。一致していれば、マーカーペンの色変更は実行されなかったものと判断され、ステップS308に進み、登録色対応の属性を取得し、属性情報を登録する。例えば、図2に示すマーカー色と属性の対応テーブル71に従った処理を実行しているとすると、マーカー色追記領域の抽出色がオレンジであると判定された場合、購入価格の属性であると判断され、マーカー追記のなされた領域の文字情報(OCR解析結果)の対応属性として、[購入価格]という属性が文字情報に対応付けられて情報処理装置の記憶部に格納され登録される。   Next, in step S305, the number of extracted marker colors (registered colors) registered in the table is counted and compared with the planned number. In the processing example described with reference to FIG. 10, the planned number of each extracted color is [7]. In step S306, it is determined whether all the extracted color counts match the planned number. If they match, it is determined that the color change of the marker pen has not been executed, and the process advances to step S308 to acquire an attribute corresponding to the registered color and register attribute information. For example, assuming that the processing according to the marker color / attribute correspondence table 71 shown in FIG. 2 is being executed, if it is determined that the extracted color of the marker color additional recording area is orange, the attribute is a purchase price. The attribute “purchase price” is stored in the storage unit of the information processing apparatus and registered in association with the character information as the corresponding attribute of the character information (OCR analysis result) of the area where the marker is additionally recorded.

ステップS306において、抽出色カウントと予定数が一致していないものが検出された場合は、ステップS307に進む。ステップS307では、予定数よりカウント数の少ない属性対応の登録色を新規抽出色に変更する登録色更新処理を実行する。この処理は、先に図10を参照して説明した処理、すなわち、
[マーカー色=オレンジ:属性=購入価格]
上記対応情報が登録されたマーカー色と属性の対応テーブル415を、
[マーカー色=紫:属性=購入価格]
上記情報に変更してマーカー色と属性の対応テーブル425に更新する処理に相当する。この登録情報更新処理の後、ステップS308に進み、登録色対応の属性の登録処理を実行する。
If it is detected in step S306 that the extracted color count does not match the planned number, the process proceeds to step S307. In step S307, a registered color update process for changing the registered color corresponding to the attribute having a count number smaller than the planned number to the newly extracted color is executed. This process is the process described above with reference to FIG.
[Marker color = orange: attribute = purchase price]
A marker color / attribute correspondence table 415 in which the correspondence information is registered,
[Marker color = purple: attribute = purchase price]
This corresponds to the process of changing to the above information and updating the marker color / attribute correspondence table 425. After the registration information update process, the process advances to step S308 to execute a registration process for attributes corresponding to registered colors.

本処理例では、上述した処理によってマーカーペンが、それまで使用していた色と全く異なる色に変更された場合でも、情報処理装置側において、マーカーペンの色変更が行われたこと、および、どの属性に対応する色の変更が実行されたかを正確に判断して登録情報、すなわち、マーカー色と属性の対応テーブルの更新を行なうので、オペレータによるテーブルの更新が不用となり、効率的な処理が実現される。なお、本処理例でも、色空間としてLab空間を適用した処理例を説明したが、RGBなどLabと異なる色空間を適用した処理として実行することも可能であり、同様の効果を奏することができる。   In this processing example, even when the marker pen is changed to a color that is completely different from the color that has been used by the above-described processing, the color change of the marker pen is performed on the information processing apparatus side, and The registration information, that is, the correspondence table of marker colors and attributes, is updated by accurately determining which attribute corresponding to the color change has been executed, so that the operator does not need to update the table and efficient processing is performed. Realized. In this processing example, the processing example in which the Lab space is applied has been described. However, the processing can be executed as a processing in which a color space different from Lab, such as RGB, is applied, and similar effects can be achieved. .

[3.情報処理装置の構成]
次に、上述した処理を実行する本発明の情報処理装置の構成について、図12に示すブロック図を参照して説明する。上述した実施例において説明した各種の処理、すなわち、図5、図8、図11の各フローチャートに従った処理は、例えばPC等の情報処理装置において実行されるプログラムに従ってデータ処理部としてのCPUの制御によって行なわれる。図12は、これら一連のデータ処理を説明するために機能別に区分して示したブロック図である。すなわち、本発明の情報処理装置の有するデータ処理実行機能をブロックとして示してある。以下、このブロック図に従って、本発明の情報処理装置の実行する処理について説明する。
[3. Configuration of information processing apparatus]
Next, the configuration of the information processing apparatus of the present invention that executes the above-described processing will be described with reference to the block diagram shown in FIG. Various processes described in the above-described embodiments, that is, processes according to the flowcharts of FIGS. 5, 8, and 11 are performed by the CPU as a data processing unit according to a program executed in an information processing apparatus such as a PC. Controlled. FIG. 12 is a block diagram showing the data processing in order to explain the series of data processing. That is, the data processing execution function of the information processing apparatus of the present invention is shown as a block. Hereinafter, processing executed by the information processing apparatus of the present invention will be described with reference to this block diagram.

本発明の情報処理装置は、図12に示すように、様々な色のマーカーによって追記された追記ドキュメントのスキャン画像を入力する画像入力部481、画像入力部481に入力された追記ドキュメント上の文字認識(OCR)を実行する文字認識処理部482と、追記ドキュメント上の色領域を抽出する色領域抽出部483と、色領域抽出部483において抽出された色が、情報処理装置の保持するテーブル、すなわち、マーカー色と属性の対応テーブルに登録された登録色であるか非登録色であるかを判定する登録色判定部484を有する。   As shown in FIG. 12, the information processing apparatus according to the present invention inputs an image input unit 481 for inputting a scan image of an additional record document added by markers of various colors, and characters on the additional record document input to the image input unit 481. A character recognition processing unit 482 that performs recognition (OCR), a color region extraction unit 483 that extracts a color region on an additional writing document, and a table in which the color extracted by the color region extraction unit 483 is held by the information processing apparatus; That is, it has a registered color determination unit 484 that determines whether the color is a registered color or a non-registered color registered in the marker color / attribute correspondence table.

さらに、前述の(2.1)マーカーペンの変色に対応した処理例において説明した近似曲線と円錐領域の設定、または、(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)において説明した近似曲線と円柱領域の設定を実行する拡張登録色領域設定部485、登録色判定部484において非登録色と判定された抽出色が、拡張登録色領域に含まれるか否かを判定する抽出色判定部486、(2.3)マーカーペンの交換に対応した処理例2(異なる色への交換)において説明した抽出色のカウント処理を実行する抽出色カウント部487、カウント数と予定数との比較を実行するカウント数検証部488を有する。   Further, setting of the approximate curve and the conical area described in the processing example corresponding to the above-described (2.1) marker pen discoloration, or (2.2) processing example 1 corresponding to the replacement of the marker pen (same color) Whether the extracted color determined to be a non-registered color by the extended registered color region setting unit 485 and the registered color determining unit 484 for executing the setting of the approximate curve and the cylindrical region described in (Replacement) to be included in the extended registered color region Extraction color determination unit 486 that determines whether or not, (2.3) Extraction color count unit 487 that executes the extraction color counting process described in the processing example 2 (exchange to a different color) corresponding to the replacement of the marker pen, It has a count number verification unit 488 that executes a comparison between the count number and the planned number.

さらに、
(2.1)マーカーペンの変色に対応した処理例
(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)
(2.3)マーカーペンの交換に対応した処理例2(異なる色への交換)
これらのいずれかの処理によって解析された情報に基づく登録情報の更新を実行する登録更新処理部489、登録情報の記憶部に対する格納処理を実行する更新情報記録部490、登録情報に基づいてマーカー色に対応する属性を取得して属性を判定する属性判定部491と、属性判定部491の決定した属性を文字認識処理部482の解析文字情報の属性として設定してデータベースに登録するデータ登録部492を有する。
further,
(2.1) Processing example corresponding to marker pen discoloration (2.2) Processing example 1 corresponding to marker pen replacement (exchange to same color)
(2.3) Processing example 2 corresponding to replacement of marker pen (exchange to a different color)
Registration update processing unit 489 for executing update of registration information based on information analyzed by any of these processes, update information recording unit 490 for executing storage processing for the storage unit of registration information, marker color based on registration information An attribute determination unit 491 that acquires an attribute corresponding to the attribute and determines the attribute; and a data registration unit 492 that sets the attribute determined by the attribute determination unit 491 as an attribute of the analysis character information of the character recognition processing unit 482 and registers the attribute in the database Have

例えば、先に説明した(2.1)マーカーペンの変色に対応した処理例を実行する構成では、拡張登録色領域設定部485において、解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線上に前回の抽出色の色値データに基づく射影点を設定し、該射影点を頂点とする円錐領域を登録色に対応する拡張登録色領域として設定し、抽出色判定部486において、登録色判定部484で非登録色と判定された抽出色が円錐領域に含まれるか否かを判定する。さらに、属性判定部491において、円錐領域に抽出色が含まれると判定された場合、その登録色に対応して設定された属性を、抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定する処理を実行する。なお、登録色更新処理部489は、拡張登録色領域設定部485において設定された色領域(円錐)に含まれる色値を新たな登録色として追加設定する登録色更新処理を実行する。   For example, in the configuration in which the processing example corresponding to (2.1) marker pen discoloration described above is executed, the extended registered color region setting unit 485 uses a plurality of color values in the color space of the marker color of the analyzed document. An approximate curve is generated based on the history points, and a projection point based on the color value data of the previous extracted color is set on the generated approximate curve, and a conical region having the projection point as a vertex corresponds to a registered color. The extracted color determination unit 486 determines whether or not the extracted color determined as the non-registered color by the registered color determination unit 484 is included in the cone region. Further, when the attribute determination unit 491 determines that the extracted color is included in the cone area, the attribute set corresponding to the registered color is changed to the attribute corresponding to the data included in the marker color additional recording area of the extracted color. The process determined as follows is executed. The registered color update processing unit 489 executes registered color update processing for additionally setting a color value included in the color region (cone) set by the extended registered color region setting unit 485 as a new registered color.

また、先に説明した(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)を実行する構成では、拡張登録色領域設定部485において、解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線を中心軸とする円柱領域を設定し、該円柱領域を登録色に対応する拡張登録色領域として設定する処理を実行する。さらに、抽出色判定部486において、登録色判定部484で非登録色と判定された抽出色が、円柱領域に含まれるか否かを判定する処理を実行する。さらに、属性判定部491において、円柱領域に抽出色が含まれると判定された場合、その登録色に対応して設定された属性を、抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定する処理を実行する。なお、登録色更新処理部489は、拡張登録色領域設定部485において設定された色領域(円柱)に含まれる色値を新たな登録色として追加設定する登録色更新処理を実行する。   In the configuration in which the processing example 1 (exchange to the same color) corresponding to the exchange of the marker pen described above (2.2) is executed, the extended registered color area setting unit 485 performs marker color analysis for the analyzed document. An approximate curve is generated based on a plurality of history points of color values in the color space, a cylindrical area having the generated approximate curve as a central axis is set, and the cylindrical area is set as an extended registered color area corresponding to the registered color Execute the setting process. Further, the extracted color determination unit 486 executes processing for determining whether or not the extracted color determined as the non-registered color by the registered color determination unit 484 is included in the cylindrical region. Further, when the attribute determining unit 491 determines that the extracted color is included in the cylindrical region, the attribute set corresponding to the registered color is changed to the attribute corresponding to the data included in the marker color additional recording region of the extracted color. The process determined as follows is executed. The registered color update processing unit 489 executes registered color update processing for additionally setting a color value included in the color region (cylinder) set by the extended registered color region setting unit 485 as a new registered color.

さらに、(2.3)マーカーペンの交換に対応した処理例2(異なる色への交換)を実行する処理例では、抽出色カウント部487において、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行し、カウント数検証部488において、マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行する。さらに、登録色更新処理部489において、カウント数検証ステップで抽出予定数未満のマーカー色と、登録色判定部484で検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、その非登録色が、抽出予定数未満のマーカー色を変更後のマーカー色であると判断し、登録色の更新を実行し、属性判定部491において、登録色更新処理部489で新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定する処理を実行する。   Furthermore, in the processing example in which (2.3) processing example 2 (exchange to a different color) corresponding to the replacement of the marker pen is executed, each of the marker colors determined as the corresponding color of the same attribute in the extracted color counting unit 487 The number of extractions is counted, and the count number verification unit 488 compares the number of extractions of each marker color with the planned number of extractions corresponding to each marker color in advance. Further, in the registered color update processing unit 489, the result of adding the marker color less than the planned extraction number in the count number verification step and the extraction count of the non-registered color detected by the registered color determination unit 484 is less than the planned extraction number. On the condition that the number of marker colors is to be extracted, it is determined that the non-registered color is a marker color after changing a marker color that is less than the planned number of extractions, the registered color is updated, and the attribute determination unit 491 , A process of determining a color area newly determined as a registered color by the registered color update processing unit 489 as an attribute set corresponding to the old registered color as an attribute corresponding to data included in the color area is executed. To do.

なお、図12に示す構成は、上述した各処理例、すなわち、
(2.1)マーカーペンの変色に対応した処理例
(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)
(2.3)マーカーペンの交換に対応した処理例2(異なる色への交換)
これらをすべて実行可能な構成例として示したが、上記3種の処理の1つの処理のみを実行する構成としてもよい。
In addition, the structure shown in FIG. 12 is each processing example mentioned above, ie,
(2.1) Processing example corresponding to marker pen discoloration (2.2) Processing example 1 corresponding to marker pen replacement (exchange to same color)
(2.3) Processing example 2 corresponding to replacement of marker pen (exchange to a different color)
Although all of these have been shown as configuration examples that can be executed, only one of the above three types of processing may be executed.

最後に、図13を参照して、本発明の情報処理装置のハードウェア構成例について説明する。図13に示す構成は、例えばPCなどによって構成される情報処理装置であり、スキャナ等のデータ読み取り部531と、プリンタなどのデータ出力部532を備えたハードウェア構成例を示している。   Finally, with reference to FIG. 13, a hardware configuration example of the information processing apparatus of the present invention will be described. The configuration illustrated in FIG. 13 is an information processing apparatus configured by, for example, a PC, and illustrates a hardware configuration example including a data reading unit 531 such as a scanner and a data output unit 532 such as a printer.

CPU(Central Processing Unit)501は、上述の実施例において説明した図5、図8、図11の各フローチャートに従った各種のデータ処理、すなわち、例えばOCR処理、色領域抽出処理、拡張登録色領域設定処理、抽出色判定処理、抽出色カウントおよびカウント数検証処理、登録色更新処理、属性登録処理等の各処理の実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行するデータ処理部である。   A CPU (Central Processing Unit) 501 performs various types of data processing according to the flowcharts of FIGS. 5, 8, and 11 described in the above-described embodiment, that is, for example, OCR processing, color area extraction processing, extended registered color area A data processing unit that executes processing in accordance with a computer program describing an execution sequence of each processing such as setting processing, extraction color determination processing, extraction color count and count number verification processing, registered color update processing, and attribute registration processing .

ROM(Read Only Memory)502は、CPU501が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)503は、CPU501の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス504により相互に接続されている。   A ROM (Read Only Memory) 502 stores programs used by the CPU 501, calculation parameters, and the like. A RAM (Random Access Memory) 503 stores programs used in the execution of the CPU 501, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 504 including a CPU bus.

ホストバス504は、ブリッジ505を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス506に接続されている。   The host bus 504 is connected to an external bus 506 such as a PCI (Peripheral Component Interconnect / Interface) bus via a bridge 505.

キーボード508、ポインティングデバイス509は、ユーザにより操作される入力デバイスである。ディスプレイ510は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。   A keyboard 508 and a pointing device 509 are input devices operated by the user. The display 510 includes a liquid crystal display device, a CRT (Cathode Ray Tube), or the like, and displays various information as text or image information.

HDD(Hard Disk Drive)511は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU501によって実行するプログラムや情報を記録または再生させる。ハードディスクは、ドキュメントとしての原本ドキュメントや、マーカー色による追記のなされた追記ドキュメント、マーカー色と属性との対応関係テーブル、属性辞書などを格納する。さらに、各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。   An HDD (Hard Disk Drive) 511 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the CPU 501 and information. The hard disk stores an original document as a document, an additional document added with marker colors, a correspondence table between marker colors and attributes, an attribute dictionary, and the like. Further, various computer programs such as various data processing programs are stored.

ドライブ512は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体521に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース507、外部バス506、ブリッジ505、およびホストバス504を介して接続されているRAM503に供給する。リムーバブル記録媒体521も、ハードディスクと同様のデータ記録領域として利用可能である。   The drive 512 reads data or a program recorded on a removable recording medium 521 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and the data or program is read out from the interface 507 and the external bus 506. , And supplied to the RAM 503 connected via the bridge 505 and the host bus 504. The removable recording medium 521 can also be used as a data recording area similar to a hard disk.

接続ポート514は、外部接続機器522を接続するポートであり、USB,IEEE1394等の接続部を持つ。接続ポート514は、インタフェース507、および外部バス506、ブリッジ505、ホストバス504等を介してCPU501等に接続されている。通信部515は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部531は、ドキュメントの読み取り処理を実行し、データ出力部532は、ドキュメントデータの出力処理を実行する。   The connection port 514 is a port for connecting the external connection device 522 and has a connection unit such as USB or IEEE1394. The connection port 514 is connected to the CPU 501 and the like via the interface 507, the external bus 506, the bridge 505, the host bus 504, and the like. The communication unit 515 is connected to a network and executes data communication processing with the outside. The data reading unit 531 executes document reading processing, and the data output unit 532 executes document data output processing.

なお、図13に示す情報処理装置のハードウェア構成例は、1つの装置例を示すものであり、本発明の情報処理装置は、図13に示す構成に限らず、上述した実施例において説明した処理を実行可能な構成であればよい。   Note that the hardware configuration example of the information processing apparatus shown in FIG. 13 shows one example of the apparatus, and the information processing apparatus of the present invention is not limited to the configuration shown in FIG. Any configuration capable of executing the process may be used.

以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。   The present invention has been described in detail above with reference to specific embodiments. However, it is obvious that those skilled in the art can make modifications and substitutions of the embodiments without departing from the gist of the present invention. In other words, the present invention has been disclosed in the form of exemplification, and should not be interpreted in a limited manner. In order to determine the gist of the present invention, the claims should be taken into consideration.

なお、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。   The series of processes described in the specification can be executed by hardware, software, or a combined configuration of both. When executing processing by software, the program recording the processing sequence is installed in a memory in a computer incorporated in dedicated hardware and executed, or the program is executed on a general-purpose computer capable of executing various processing. It can be installed and run.

例えば、プログラムは記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。あるいは、プログラムはフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することができる。   For example, the program can be recorded in advance on a hard disk or ROM (Read Only Memory) as a recording medium. Alternatively, the program is temporarily or permanently stored on a removable recording medium such as a flexible disk, a CD-ROM (Compact Disc Read Only Memory), an MO (Magneto optical) disk, a DVD (Digital Versatile Disc), a magnetic disk, or a semiconductor memory. It can be stored (recorded). Such a removable recording medium can be provided as so-called package software.

なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。   The program is installed on the computer from the removable recording medium as described above, or is wirelessly transferred from the download site to the computer, or is wired to the computer via a network such as a LAN (Local Area Network) or the Internet. The computer can receive the program transferred in this manner and install it on a recording medium such as a built-in hard disk.

なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。   Note that the various processes described in the specification are not only executed in time series according to the description, but may be executed in parallel or individually according to the processing capability of the apparatus that executes the processes or as necessary. Further, in this specification, the system is a logical set configuration of a plurality of devices, and the devices of each configuration are not limited to being in the same casing.

以上、説明したように、本発明の一実施例構成によれば、例えば、文書ドキュメントに対するマーカーペンによる文字列抽出/属性付与処理、すなわち、色マーカーによる追記のなされた追記ドキュメントからマーカー色を解析して、マーカー色に基づくドキュメント情報の属性判定処理を実行する構成において、マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定し、非登録色と判定された抽出色が、拡張登録色領域に含まれる場合に、登録色に対応して設定された属性を、抽出色のマーカー色追記領域に含まれるデータ対応の属性として設定する構成としたので、例えばマーカーペンの経時的な色変化、あるいはペンの交換などが実行された場合でも、的確な色判定に基づく属性付与が可能となる。   As described above, according to the configuration of one embodiment of the present invention, for example, a character string is extracted / attributed by a marker pen on a document document, that is, a marker color is analyzed from an additional recording document that has been additionally written with a color marker. Then, in the configuration in which the attribute determination process of document information based on the marker color is executed, an extended registered color area corresponding to the registered color is set based on the history of the analyzed color information in the marker color analyzed document, and the non-registered color When the extracted color determined to be included in the extended registered color area, the attribute set corresponding to the registered color is set as the attribute corresponding to the data included in the marker color additional recording area of the extracted color Therefore, for example, even when a color change of a marker pen with time or replacement of a pen is executed, it is based on accurate color determination. Gender grant is made possible.

また、本発明の一実施例構成によれば、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを行い、予め各マーカー色に対応する抽出予定数との比較を実行して、抽出予定数未満のマーカー色を変更後のマーカー色を判断し、この判断情報に基づいて登録色の更新を実行する構成としたので、オペレータによる登録色更新処理を行なうことなく自動的な更新が可能となり、効率的な処理が実現される。   Further, according to the configuration of one embodiment of the present invention, the number of extractions of each marker color determined as the corresponding color of the same attribute is counted, and the comparison with the planned number of extractions corresponding to each marker color is performed in advance. Since the marker color after changing the number of marker colors that are less than the planned number of extractions is determined and the registered color is updated based on this determination information, the update is performed automatically without performing the registered color update process by the operator. Thus, efficient processing is realized.

マーカーペンによる文字列抽出/属性付与処理の一般的処理例について説明する図である。It is a figure explaining the general processing example of the character string extraction / attribute provision process by a marker pen. マーカーペンによる文字列抽出/属性付与処理の具体的処理例について説明する図である。It is a figure explaining the specific process example of the character string extraction / attribute provision process by a marker pen. オペレータの利用するマーカーペンの色の変化が発生する具体的例について説明する図である。It is a figure explaining the specific example in which the change of the color of the marker pen which an operator utilizes occurs. 本発明の情報処理装置の実行する色解析処理例の一実施例について説明する図である。It is a figure explaining one Example of the color analysis process example which the information processing apparatus of this invention performs. 本発明の情報処理装置における処理例について説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining the process example in the information processing apparatus of this invention. 本発明の情報処理装置におけるマーカーペンの交換に対応した処理例について説明する図である。It is a figure explaining the process example corresponding to replacement | exchange of the marker pen in the information processing apparatus of this invention. 本発明の情報処理装置において実行するペン交換が発生した場合でも正しい色判定に基づく属性設定を可能とした処理例について説明する図である。It is a figure explaining the process example which enabled the attribute setting based on the correct color determination even when the pen replacement performed in the information processing apparatus of this invention occurred. 本発明の情報処理装置における処理例について説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining the process example in the information processing apparatus of this invention. 本発明の情報処理装置におけるマーカーペンの交換に対応した処理例2について説明する図である。It is a figure explaining the process example 2 corresponding to replacement | exchange of the marker pen in the information processing apparatus of this invention. 本発明の情報処理装置において実行するマーカーペンの交換に対応した処理例2の具体例について説明する図である。It is a figure explaining the specific example of the process example 2 corresponding to replacement | exchange of the marker pen performed in the information processing apparatus of this invention. 本発明の情報処理装置における処理例について説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining the process example in the information processing apparatus of this invention. 本発明の情報処理装置の機能構成例について説明するブロック図である。It is a block diagram explaining the functional structural example of the information processing apparatus of this invention. 本発明の情報処理装置のハードウェア構成例について説明する図である。It is a figure explaining the hardware structural example of the information processing apparatus of this invention.

符号の説明Explanation of symbols

11 原本ドキュメント
21 追記ドキュメント
51 情報処理装置
52 プリンタ
53 スキャナ
54 データベース
71 マーカー色属性対応テーブル
72 解析データ
100 追記ドキュメント
101〜104 マーカー色追記領域
201〜203 マーカー色追記領域
221〜223 マーカー色追記領域
271〜275 色値
281〜283 円錐領域
291〜293 近似曲線
301〜303 マーカー色追記領域
321 近似曲線
322 円柱領域
331〜333 色値
410,420 追記ドキュメント
411,421 マーカー色追記領域
415,425 マーカー色と属性の対応テーブル
450 色空間
451〜454 色領域
471 非登録色対応色値
481 画像入力部
482 文字認識処理部
483 色領域抽出部
484 登録色判定部
485 拡張登録色領域設定部
486 抽出色判定部
487 抽出色カウント部
488 カウント数検証部
489 登録更新処理部
490 更新情報記録部
491 属性判定部
492 データ登録部
501 CPU(Central Processing Unit)
502 ROM(Read-Only-Memory)
503 RAM(Random Access Memory)
504 ホストバス
505 ブリッジ
506 外部バス
507 インタフェース
508 キーボード
509 ポインティングデバイス
510 ディスプレイ
511 HDD(Hard Disk Drive)
512 ドライブ
514 接続ポート
515 通信部
521 リムーバブル記録媒体
522 外部接続機器
531 データ読み取り部
532 データ出力部
DESCRIPTION OF SYMBOLS 11 Original document 21 Additional record document 51 Information processing apparatus 52 Printer 53 Scanner 54 Database 71 Marker color attribute correspondence table 72 Analysis data 100 Additional record document 101-104 Marker color additional recording area 201-203 Marker color additional recording area 221-223 Marker color additional recording area 271 ˜275 Color value 281 to 283 Conical region 291 to 293 Approximate curve 301 to 303 Marker color additional recording region 321 Approximate curve 322 Cylindrical region 331 to 333 Color value 410 and 420 Additional document 411 and 421 Marker color additional recording region 415 and 425 Marker color and Attribute correspondence table 450 Color space 451 to 454 Color region 471 Non-registered color corresponding color value 481 Image input unit 482 Character recognition processing unit 483 Color region extraction unit 484 Registered color determination 485 Extension Registration color area setting unit 486 extracts color determining unit 487 extracts color counting unit 488 counts the number of verification unit 489 registration update processing unit 490 updates the information recording unit 491 attribute determination unit 492 data registration unit 501 CPU (Central Processing Unit)
502 ROM (Read-Only-Memory)
503 RAM (Random Access Memory)
504 Host bus 505 Bridge 506 External bus 507 Interface 508 Keyboard 509 Pointing device 510 Display 511 HDD (Hard Disk Drive)
512 drive 514 connection port 515 communication unit 521 removable recording medium 522 external connection device 531 data reading unit 532 data output unit

Claims (16)

ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理装置であり、
ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出部と、
前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定部と、
マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定する拡張登録色領域設定部と、
前記登録色判定部において非登録色と判定された抽出色が、前記拡張登録色領域に含まれるか否かを判定する抽出色判定部と、
前記抽出色判定部において、前記抽出色が前記拡張登録色領域に含まれると判定された場合、その登録色に対応して設定された属性を、前記抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定する属性判定部と、
前記拡張登録色領域設定部において設定された色領域に含まれる色値を新たな登録色として追加設定する登録色更新処理部と、
を有することを特徴とする情報処理装置。
An information processing apparatus that executes an attribute determination process for document information based on a marker color added to a document,
A color area extraction unit that inputs a postscript document in which a marker color is added to the document and acquires color information of a marker color postscript area on the postscript document;
A registered color determination unit that determines whether the color included in the color region extracted by the color region extraction unit is a registered color or a non-registered color that is registered in advance as an additional recording marker color;
An extended registered color area setting unit for setting an extended registered color area corresponding to the registered color based on the history of the analysis color information in the marker color analyzed document;
An extracted color determining unit that determines whether or not an extracted color determined as a non-registered color by the registered color determining unit is included in the extended registered color region;
If the extracted color determining unit determines that the extracted color is included in the extended registered color area, the attribute set corresponding to the registered color is included in the marker color additional recording area of the extracted color. An attribute determination unit that determines the attribute corresponding to
A registered color update processing unit for additionally setting a color value included in the color region set in the extended registered color region setting unit as a new registered color;
An information processing apparatus comprising:
前記拡張登録色領域設定部は、
解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線上に前回の抽出色の色値データに基づく射影点を設定し、該射影点を頂点とする円錐領域を登録色に対応する拡張登録色領域として設定する処理を実行する構成であり、
抽出色判定部は、
前記登録色判定部において非登録色と判定された抽出色が、前記円錐領域に含まれるか否かを判定する処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。
The extended registered color area setting unit
An approximate curve is generated based on a plurality of history points of color values in the color space of the marker color of the analyzed document, a projection point based on the color value data of the previous extracted color is set on the generated approximate curve, and the It is a configuration for executing a process of setting a cone area having a projection point as a vertex as an extended registered color area corresponding to a registered color,
The extracted color determination unit
The information processing apparatus according to claim 1, wherein the information processing apparatus is configured to execute a process of determining whether or not an extracted color determined as a non-registered color by the registered color determination unit is included in the conical region. .
前記拡張登録色領域設定部は、
前回の抽出色の色値に対応する近似曲線上の近傍点を頂点とし、近似曲線を含み色値履歴の新しい方向に広がりを設定した円錐領域を拡張登録色領域として設定する処理を実行する構成であることを特徴とする請求項2に記載の情報処理装置。
The extended registered color area setting unit
A configuration that executes processing to set a conical region that has an apex at the nearest point on the approximate curve corresponding to the color value of the previous extracted color and that includes the approximate curve and has a spread in the new direction of the color value history as an extended registered color region The information processing apparatus according to claim 2, wherein the information processing apparatus is an information processing apparatus.
前記拡張登録色領域設定部は、
予め設定した半径rと、高さlの円錐領域を拡張登録色領域として設定する処理を実行する構成であることを特徴とする請求項3に記載の情報処理装置。
The extended registered color area setting unit
The information processing apparatus according to claim 3, wherein the information processing apparatus is configured to execute a process of setting a cone area having a preset radius r and height l as an extended registration color area.
前記拡張登録色領域設定部は、
解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線を中心軸とする円柱領域を設定し、該円柱領域を登録色に対応する拡張登録色領域として設定する処理を実行する構成であり、
抽出色判定部は、
前記登録色判定部において非登録色と判定された抽出色が、前記円柱領域に含まれるか否かを判定する処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。
The extended registered color area setting unit
Generates an approximate curve based on multiple history points of color values in the color space of the marker color of the analyzed document, sets a cylindrical area with the generated approximate curve as the central axis, and corresponds the cylindrical area to the registered color Is configured to execute the process of setting as an extended registered color area,
The extracted color determination unit
The information processing apparatus according to claim 1, wherein the information processing apparatus is configured to execute a process of determining whether or not an extracted color determined as a non-registered color by the registered color determination unit is included in the cylindrical region. .
前記拡張登録色領域設定部は、
予め設定した半径rの円柱領域を拡張登録色領域として設定する処理を実行する構成であることを特徴とする請求項5に記載の情報処理装置。
The extended registered color area setting unit
The information processing apparatus according to claim 5, wherein the information processing apparatus is configured to execute a process of setting a cylindrical area having a radius r set in advance as an extended registration color area.
ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理装置であり、
ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出部と、
前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定部と、
同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行する抽出色カウント部と、
前記マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行するカウント数検証部と、
前記カウント数検証部において、抽出予定数未満のマーカー色と、前記登録色判定部において検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、該非登録色を、抽出予定数未満のマーカー色の変更後のマーカー色であると判断し、登録色の更新を実行する登録色更新処理部と、
前記登録色更新処理部において新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定する属性判定部と、
を有することを特徴とする情報処理装置。
An information processing apparatus that executes an attribute determination process for document information based on a marker color added to a document,
A color area extraction unit that inputs a postscript document in which a marker color is added to the document and acquires color information of a marker color postscript area on the postscript document;
A registered color determination unit that determines whether the color included in the color region extracted by the color region extraction unit is a registered color or a non-registered color that is registered in advance as an additional recording marker color;
An extraction color counting unit that counts the number of extractions of each marker color determined to be a corresponding color of the same attribute;
A count number verification unit that performs comparison between the number of extractions of each of the marker colors and the number of extractions corresponding to each marker color in advance;
In the count number verification unit, the addition result of the marker color less than the planned extraction number and the non-registered color extraction count detected by the registered color determination unit is the planned extraction number of marker colors less than the planned extraction number. On the condition, the non-registered color is determined to be the marker color after the change of the marker color less than the number of extraction, and a registered color update processing unit for executing the update of the registered color,
An attribute determination unit for determining a color area newly determined as a registered color in the registered color update processing unit as an attribute set corresponding to the old registered color as an attribute corresponding to data included in the color area;
An information processing apparatus comprising:
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理方法であり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出ステップと、
登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定ステップと、
拡張登録色領域設定部において、マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定する拡張登録色領域設定ステップと、
抽出色判定部において、前記登録色判定ステップで非登録色と判定された抽出色が、前記拡張登録色領域に含まれるか否かを判定する抽出色判定ステップと、
属性判定部において、前記抽出色判定ステップで前記抽出色が前記拡張登録色領域に含まれると判定された場合、その登録色に対応して設定された属性を、前記抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定する属性判定ステップと、
登録色更新処理部において、前記拡張登録色領域設定ステップで設定された色領域に含まれる色値を新たな登録色として追加設定する登録色更新処理ステップと、
を有することを特徴とする情報処理方法。
In the information processing apparatus, an information processing method for executing attribute determination processing of document information based on a marker color added to a document,
In the color region extraction unit, a color region extraction step of inputting a postscript document in which a marker color is added to the document and obtaining color information of the marker color additional region on the postscript document;
A registration color determination step for determining whether the color included in the color region extracted in the color region extraction step is a registered color or a non-registered color registered in advance as a postscript marker color in the registered color determination unit; ,
In the extended registration color area setting unit, an extended registration color area setting step for setting an extended registration color area corresponding to the registered color based on the history of analysis color information in the marker color analyzed document;
In the extraction color determination unit, an extraction color determination step for determining whether or not the extraction color determined as a non-registered color in the registration color determination step is included in the extended registration color region;
In the attribute determination unit, if it is determined in the extracted color determination step that the extracted color is included in the extended registered color area, the attribute set corresponding to the registered color is added to the marker color additional recording area of the extracted color. An attribute determination step for determining the attribute corresponding to the data included in the
In a registered color update processing unit, a registered color update processing step of additionally setting a color value included in the color area set in the extended registered color area setting step as a new registered color;
An information processing method characterized by comprising:
前記拡張登録色領域設定ステップは、
解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線上に前回の抽出色の色値データに基づく射影点を設定し、該射影点を頂点とする円錐領域を登録色に対応する拡張登録色領域として設定する処理を実行するステップであり、
抽出色判定ステップは、
前記登録色判定ステップにおいて非登録色と判定された抽出色が、前記円錐領域に含まれるか否かを判定する処理を実行するステップであることを特徴とする請求項8に記載の情報処理方法。
The extended registered color area setting step includes:
An approximate curve is generated based on a plurality of history points of color values in the color space of the marker color of the analyzed document, a projection point based on the color value data of the previous extracted color is set on the generated approximate curve, and the A step of executing a process of setting a cone area having a projection point as a vertex as an extended registered color area corresponding to a registered color;
The extraction color judgment step
9. The information processing method according to claim 8, wherein the extracted color determined to be a non-registered color in the registered color determining step is a step of determining whether or not the extracted color is included in the conical region. .
前記拡張登録色領域設定ステップは、
前回の抽出色の色値に対応する近似曲線上の近傍点を頂点とし、近似曲線を含み色値履歴の新しい方向に広がりを設定した円錐領域を拡張登録色領域として設定する処理を実行するステップであることを特徴とする請求項9に記載の情報処理方法。
The extended registered color area setting step includes:
A step of executing a process of setting, as an extended registered color area, a conical area having an apex at the neighboring point on the approximate curve corresponding to the color value of the previous extracted color and including the approximate curve and having spread in the new direction of the color value history The information processing method according to claim 9, wherein:
前記拡張登録色領域設定ステップは、
予め設定した半径rと、高さlの円錐領域を拡張登録色領域として設定する処理を実行するステップであることを特徴とする請求項10に記載の情報処理方法。
The extended registered color area setting step includes:
11. The information processing method according to claim 10, wherein the information processing method is a step of executing a process of setting a cone area having a preset radius r and height l as an extended registration color area.
前記拡張登録色領域設定ステップは、
解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線を中心軸とする円柱領域を設定し、該円柱領域を登録色に対応する拡張登録色領域として設定する処理を実行するステップであり、
抽出色判定ステップは、
前記登録色判定ステップで非登録色と判定された抽出色が、前記円柱領域に含まれるか否かを判定する処理を実行するステップであることを特徴とする請求項8に記載の情報処理方法。
The extended registered color area setting step includes:
Generates an approximate curve based on multiple history points of color values in the color space of the marker color of the analyzed document, sets a cylindrical area with the generated approximate curve as the central axis, and corresponds the cylindrical area to the registered color The step of executing the process of setting as an extended registered color area to be performed,
The extraction color judgment step
9. The information processing method according to claim 8, wherein the extracted color determined to be a non-registered color in the registered color determination step is a step of determining whether or not the extracted color is included in the cylindrical region. .
前記拡張登録色領域設定ステップは、
予め設定した半径rの円柱領域を拡張登録色領域として設定する処理を実行するステップであることを特徴とする請求項12に記載の情報処理方法。
The extended registered color area setting step includes:
13. The information processing method according to claim 12, wherein the information processing method is a step of executing processing for setting a cylindrical region having a radius r set in advance as an extended registration color region.
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理方法であり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出ステップと、
登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定ステップと、
抽出色カウント部において、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行する抽出色カウントステップと、
カウント数検証部において、前記マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行するカウント数検証ステップと、
登録色更新処理部において、前記カウント数検証ステップで抽出予定数未満のマーカー色と、前記登録色判定ステップで検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、該非登録色を、抽出予定数未満のマーカー色を変更後のマーカー色であると判断し、登録色の更新を実行する登録色更新処理ステップと、
属性判定部において、前記登録色更新処理ステップで新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定する属性判定ステップと、
を有することを特徴とする情報処理方法。
In the information processing apparatus, an information processing method for executing attribute determination processing of document information based on a marker color added to a document,
In the color region extraction unit, a color region extraction step of inputting a postscript document in which a marker color is added to the document and obtaining color information of the marker color additional region on the postscript document;
A registration color determination step for determining whether the color included in the color region extracted in the color region extraction step is a registered color or a non-registered color registered in advance as a postscript marker color in the registered color determination unit; ,
In an extraction color counting unit, an extraction color counting step for counting the number of extractions of each marker color determined to be a corresponding color of the same attribute;
In the count number verification unit, a count number verification step of executing a comparison between the number of extractions of each of the marker colors and the number of extractions corresponding to each marker color in advance,
In the registered color update processing unit, a marker color that is less than the planned number of extractions is obtained by adding the marker color that is less than the planned number of extractions in the count number verification step and the extraction count of the non-registered colors that is detected in the registered color determination step. A registration color update processing step for determining that the non-registered color is a marker color after changing the marker color less than the planned extraction number, and executing the update of the registered color, on the condition that the number of extraction is
In the attribute determination unit, the color area newly determined as the registered color in the registered color update processing step is determined as the attribute corresponding to the data included in the color area as the attribute set corresponding to the old registered color. An attribute determination step;
An information processing method characterized by comprising:
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行させるコンピュータ・プログラムであり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得させる色領域抽出ステップと、
登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別させる登録色判定ステップと、
拡張登録色領域設定部において、マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定させる拡張登録色領域設定ステップと、
抽出色判定部において、前記登録色判定ステップで非登録色と判定された抽出色が、前記拡張登録色領域に含まれるか否かを判定させる抽出色判定ステップと、
属性判定部において、前記抽出色判定ステップで前記抽出色が前記拡張登録色領域に含まれると判定された場合、その登録色に対応して設定された属性を、前記抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定させる属性判定ステップと、
登録色更新処理部において、前記拡張登録色領域設定ステップで設定された色領域に含まれる色値を新たな登録色として追加設定させる登録色更新処理ステップと、
を実行させることを特徴とするコンピュータ・プログラム。
In the information processing apparatus, a computer program for executing an attribute determination process of document information based on a marker color added to a document,
In the color area extraction unit, a color area extraction step of inputting a postscript document in which a marker color is added to the document and obtaining color information of the marker color additional area on the postscript document;
A registered color determining step for determining whether the color included in the color region extracted in the color region extracting step is a registered color or a non-registered color registered in advance as an additional marker color; ,
In the extended registration color area setting unit, an extended registration color area setting step for setting an extended registration color area corresponding to the registered color based on the history of analysis color information in the marker color analyzed document;
In the extraction color determination unit, an extraction color determination step for determining whether or not the extracted color determined as a non-registered color in the registered color determination step is included in the extended registered color region;
In the attribute determination unit, if it is determined in the extracted color determination step that the extracted color is included in the extended registered color area, the attribute set corresponding to the registered color is added to the marker color additional recording area of the extracted color. An attribute determination step for determining the attribute corresponding to the data included in
In a registered color update processing unit, a registered color update processing step for additionally setting a color value included in the color area set in the extended registered color area setting step as a new registered color;
A computer program for executing
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行させるコンピュータ・プログラムであり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得させる色領域抽出ステップと、
登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別させる登録色判定ステップと、
抽出色カウント部において、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行させる抽出色カウントステップと、
カウント数検証部において、前記マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行させるカウント数検証ステップと、
登録色更新処理部において、前記カウント数検証ステップで抽出予定数未満のマーカー色と、前記登録色判定ステップで検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、該非登録色を、抽出予定数未満のマーカー色を変更後のマーカー色であると判断し、登録色の更新を実行させる登録色更新処理ステップと、
属性判定部において、前記登録色更新処理ステップで新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定させる属性判定ステップと、
を実行させることを特徴とするコンピュータ・プログラム。
In the information processing apparatus, a computer program for executing an attribute determination process of document information based on a marker color added to a document,
In the color area extraction unit, a color area extraction step of inputting a postscript document in which a marker color is added to the document and obtaining color information of the marker color additional area on the postscript document;
A registered color determining step for determining whether the color included in the color region extracted in the color region extracting step is a registered color or a non-registered color registered in advance as an additional marker color; ,
In the extraction color counting unit, an extraction color counting step for counting the number of extractions of each marker color determined to be a corresponding color of the same attribute;
In the count number verification unit, a count number verification step for executing a comparison between the number of extraction of each of the marker colors and the number of extractions corresponding to each marker color in advance,
In the registered color update processing unit, a marker color that is less than the planned number of extractions is obtained by adding the marker color that is less than the planned number of extractions in the count number verification step and the extraction count of the non-registered colors that is detected in the registered color determination step. A registration color update processing step for determining that the non-registered color is a marker color after changing the marker color less than the planned extraction number, and executing the update of the registered color, on the condition that the number of extraction is
In the attribute determination unit, the color area newly determined as the registered color in the registered color update processing step is determined as an attribute corresponding to the data included in the color area as an attribute set corresponding to the old registered color. An attribute determination step;
A computer program for executing
JP2006124843A 2006-04-28 2006-04-28 Information processing apparatus, information processing method, and computer program Expired - Fee Related JP4697035B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006124843A JP4697035B2 (en) 2006-04-28 2006-04-28 Information processing apparatus, information processing method, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006124843A JP4697035B2 (en) 2006-04-28 2006-04-28 Information processing apparatus, information processing method, and computer program

Publications (2)

Publication Number Publication Date
JP2007299094A true JP2007299094A (en) 2007-11-15
JP4697035B2 JP4697035B2 (en) 2011-06-08

Family

ID=38768548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006124843A Expired - Fee Related JP4697035B2 (en) 2006-04-28 2006-04-28 Information processing apparatus, information processing method, and computer program

Country Status (1)

Country Link
JP (1) JP4697035B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010066865A (en) * 2008-09-09 2010-03-25 Fuji Xerox Co Ltd Difference extraction device and difference extraction program
CN102194116A (en) * 2010-03-15 2011-09-21 株式会社东芝 Document image processing system, document image processing method, and computer readable storage medium storing instructions of a computer program thereof
CN112306418A (en) * 2020-11-09 2021-02-02 中国船舶重工集团公司第七0七研究所九江分部 Data recording method based on RawFS in VxWorks environment

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03201671A (en) * 1989-12-27 1991-09-03 Fuji Xerox Co Ltd Marker editing system for picture recorder
JPH06284270A (en) * 1993-03-29 1994-10-07 Toshiba Corp Image forming device
JPH07322009A (en) * 1994-05-25 1995-12-08 Fuji Xerox Co Ltd Picture processor
JPH0870382A (en) * 1994-08-26 1996-03-12 Canon Inc Image processor
JP2007219682A (en) * 2006-02-15 2007-08-30 Fuji Xerox Co Ltd Information processor, information processing method, and computer program
JP2007233900A (en) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd Information processor, information processing method, and computer program
JP2007286711A (en) * 2006-04-13 2007-11-01 Fuji Xerox Co Ltd Information processor and information processing method, and computer program
JP2007286710A (en) * 2006-04-13 2007-11-01 Fuji Xerox Co Ltd Information processor and information processing method, and computer program

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03201671A (en) * 1989-12-27 1991-09-03 Fuji Xerox Co Ltd Marker editing system for picture recorder
JPH06284270A (en) * 1993-03-29 1994-10-07 Toshiba Corp Image forming device
JPH07322009A (en) * 1994-05-25 1995-12-08 Fuji Xerox Co Ltd Picture processor
JPH0870382A (en) * 1994-08-26 1996-03-12 Canon Inc Image processor
JP2007219682A (en) * 2006-02-15 2007-08-30 Fuji Xerox Co Ltd Information processor, information processing method, and computer program
JP2007233900A (en) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd Information processor, information processing method, and computer program
JP2007286711A (en) * 2006-04-13 2007-11-01 Fuji Xerox Co Ltd Information processor and information processing method, and computer program
JP2007286710A (en) * 2006-04-13 2007-11-01 Fuji Xerox Co Ltd Information processor and information processing method, and computer program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010066865A (en) * 2008-09-09 2010-03-25 Fuji Xerox Co Ltd Difference extraction device and difference extraction program
CN102194116A (en) * 2010-03-15 2011-09-21 株式会社东芝 Document image processing system, document image processing method, and computer readable storage medium storing instructions of a computer program thereof
CN112306418A (en) * 2020-11-09 2021-02-02 中国船舶重工集团公司第七0七研究所九江分部 Data recording method based on RawFS in VxWorks environment
CN112306418B (en) * 2020-11-09 2022-10-21 中国船舶重工集团公司第七0七研究所九江分部 Data recording method based on RawFS in VxWorks environment

Also Published As

Publication number Publication date
JP4697035B2 (en) 2011-06-08

Similar Documents

Publication Publication Date Title
JP4631749B2 (en) Information processing apparatus, information processing method, and computer program
US20100064249A1 (en) Visual indicator in GUI system for notifying user of data storage device
US20070214173A1 (en) Program, method, and apparatus for supporting creation of business process model diagram
CN106557775B (en) Image processing apparatus and image processing method
JP4591229B2 (en) Image processing apparatus, image processing method, and computer program
JP6206202B2 (en) Information processing apparatus and information processing program
JP4697035B2 (en) Information processing apparatus, information processing method, and computer program
US20130063769A1 (en) Information management apparatus and method, information management system, and non-transitory computer readable medium
US11392260B2 (en) Display control device, display control method, and display control program
JP4692316B2 (en) Image processing apparatus, image processing method, and computer program
JP4894378B2 (en) Image processing system and image processing program
US20140152668A1 (en) Information processing apparatus and method and non-transitory computer readable medium
JP2007286711A (en) Information processor and information processing method, and computer program
JP2007286710A (en) Information processor and information processing method, and computer program
JP2007219682A (en) Information processor, information processing method, and computer program
JP2019153230A (en) Information processor and information processing program
JP2004199529A (en) Business form recognition device and business form recognition method
JP4692315B2 (en) Image processing apparatus, image processing method, and computer program
US11606469B2 (en) Image processing system that computerizes document, control method thereof, and storage medium
JP5005633B2 (en) Image search apparatus, image search method, information processing program, and recording medium
JP2008059255A (en) Information input device and program
JP6303531B2 (en) Image processing apparatus and image processing program
US12039635B2 (en) Information processing apparatus, information processing method, and medium
US11481544B2 (en) Form processing apparatus and non-transitory computer readable medium
JP2006134079A (en) Image processing device and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110214

R150 Certificate of patent or registration of utility model

Ref document number: 4697035

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees