JP4697035B2 - 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム - Google Patents

情報処理装置、および情報処理方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP4697035B2
JP4697035B2 JP2006124843A JP2006124843A JP4697035B2 JP 4697035 B2 JP4697035 B2 JP 4697035B2 JP 2006124843 A JP2006124843 A JP 2006124843A JP 2006124843 A JP2006124843 A JP 2006124843A JP 4697035 B2 JP4697035 B2 JP 4697035B2
Authority
JP
Japan
Prior art keywords
color
registered
marker
area
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006124843A
Other languages
English (en)
Other versions
JP2007299094A (ja
Inventor
悦子 伊藤
篤 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2006124843A priority Critical patent/JP4697035B2/ja
Publication of JP2007299094A publication Critical patent/JP2007299094A/ja
Application granted granted Critical
Publication of JP4697035B2 publication Critical patent/JP4697035B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、情報処理装置、および情報処理方法、並びにコンピュータ・プログラムに関する。さらに詳細には、本発明は、色マーカーによるインデックス付与として行なわれるマーカーペンによる文字列抽出/属性付与処理を実行する情報処理装置、および情報処理方法、並びにコンピュータ・プログラムに関する。
文書ドキュメントに対するデータ処理分野において、例えば文書画像データから文書領域毎の属性を取得し、属性毎に画像領域を分類した後に、文字認識処理(OCR:Optical Character Recognition)を行い、分類されたテキストデータを生成してデータベースに保存するという処理がインデックス抽出処理として知られている。このインデックス抽出処理を開示した従来技術としては、例えば特許文献1,2がある。
また、予め決められた文書フォームを規定し、この文書フォームに追記可能な追記領域を設定し、その指定追記領域に、位置情報を埋め込み、ドキュメントからの追記情報抽出時に、原本との照合を不要として効率的に追記情報を取得する構成が特許文献3に記載されている。さらに、ドキュメントの分割領域に、領域を識別する情報を埋め込み、追記情報の抽出時に領域から効率的に追記情報の抽出を行なう処理構成が特許文献4に記載されている。
特開平5−342326号公報 特開2002−123815号公報 特開2003−271942号公報 特開2003−18393号公報
上述したように、ドキュメントに含まれる様々なデータを種類(属性)毎に区分、いわゆるカテゴライズしてデータベースなどの記憶部に属性を対応付けたデータとして分類保存する様々な技術が提案されている。しかし、文書ドキュメントに含まれる文書領域の属性判定処理の自動化には限界があり、属性判定および設定処理自体は、人(オペレータ)による処理を必要としているのが現状である。
オペレータの判断によって属性判定を行なう場合、例えば、日付データ部については赤のマーカー、文書名データ部については青のマーカーで色づけをするなど、予め設定されたマーカー色と属性との対応情報に基づいてオペレータが様々な色のマーカーを利用して、ドキュメント上の文字に対してマーカー色の設定を行う。
次に、マーカー色の設定されたドキュメントをカラースキャナによって読み取り、ドキュメント上のマーカー色を判別して、そのマーカー色の付与された文字情報をOCR(Optical Character Recognition)によって解読する。さらに、解読文字情報をテキストデータとしてデータベースに格納する際、テキストデータに対応する属性値として、マーカー色から判別される属性、例えば日付、文書名などの属性情報を対応付けて格納する。この処理はマーカーペンによる文字列抽出/属性付与処理と呼ばれる。
このようなマーカーペンによる文字列抽出/属性付与処理において、ドキュメントに対するマーカー色設定は、オペレータによって実行される。オペレータは、指定色のカラーペンによってマーカー設定を行うが、オペレータの利用するペンは、長期間の利用によって、色の変化を起こす場合がある。また、同じ[赤]であっても使用するペンのメーカーによって、微妙な色の差異が発生することがある。一方、マーカー色の判別を実行するのは、情報処理装置であり、一定の色値データ、例えばRGB値やLab値といった特定の色情報値に基づいて、マーカー色の判別を行なう。従って、オペレータの利用するペンの色の変化や、使用するペンの変更などに基づいて正確なマーカー色判定が不可能となり、属性値判定処理のエラーが発生することかある。
本発明は、上述の問題点に鑑みてなされたものであり、属性設定処理として実行される色マーカーによる追記設定処理において、マーカー色設定を行うオペレータの利用するペンの色が、多少変化した場合でも、色変化を許容するマーカー色認識を行うことで正しい属性値の解析を可能とした情報処理装置、および情報処理方法、並びにコンピュータ・プログラムを提供することを目的とする。
本発明の第1の側面は、
ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理装置であり、
ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出部と、
前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定部と、
マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定する拡張登録色領域設定部と、
前記登録色判定部において非登録色と判定された抽出色が、前記拡張登録色領域に含まれるか否かを判定する抽出色判定部と、
前記抽出色判定部において、前記抽出色が前記拡張登録色領域に含まれると判定された場合、その登録色に対応して設定された属性を、前記抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定する属性判定部と、
前記拡張登録色領域設定部において設定された色領域に含まれる色値を新たな登録色として追加設定する登録色更新処理部と、
を有することを特徴とする情報処理装置にある。
さらに、本発明の情報処理装置の一実施態様において、前記拡張登録色領域設定部は、解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線上に前回の抽出色の色値データに基づく射影点を設定し、該射影点を頂点とする円錐領域を登録色に対応する拡張登録色領域として設定する処理を実行する構成であり、抽出色判定部は、前記登録色判定部において非登録色と判定された抽出色が、前記円錐領域に含まれるか否かを判定する処理を実行する構成であることを特徴とする。
さらに、本発明の情報処理装置の一実施態様において、前記拡張登録色領域設定部は、前回の抽出色の色値に対応する近似曲線上の近傍点を頂点とし、近似曲線を含み色値履歴の新しい方向に広がりを設定した円錐領域を拡張登録色領域として設定する処理を実行する構成であることを特徴とする。
さらに、本発明の情報処理装置の一実施態様において、前記拡張登録色領域設定部は、予め設定した半径rと、高さlの円錐領域を拡張登録色領域として設定する処理を実行する構成であることを特徴とする。
さらに、本発明の情報処理装置の一実施態様において、前記拡張登録色領域設定部は、解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線を中心軸とする円柱領域を設定し、該円柱領域を登録色に対応する拡張登録色領域として設定する処理を実行する構成であり、抽出色判定部は、前記登録色判定部において非登録色と判定された抽出色が、前記円柱領域に含まれるか否かを判定する処理を実行する構成であることを特徴とする。
さらに、本発明の情報処理装置の一実施態様において、前記拡張登録色領域設定部は、予め設定した半径rの円柱領域を拡張登録色領域として設定する処理を実行する構成であることを特徴とする。
さらに、本発明の第2の側面は、
ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理装置であり、
ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出部と、
前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定部と、
同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行する抽出色カウント部と、
前記マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行するカウント数検証部と、
前記カウント数検証部において、抽出予定数未満のマーカー色と、前記登録色判定部において検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、該非登録色を、抽出予定数未満のマーカー色の変更後のマーカー色であると判断し、登録色の更新を実行する登録色更新処理部と、
前記登録色更新処理部において新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定する属性判定部と、
を有することを特徴とする情報処理装置にある。
さらに、本発明の第3の側面は、
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理方法であり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出ステップと、
登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定ステップと、
拡張登録色領域設定部において、マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定する拡張登録色領域設定ステップと、
抽出色判定部において、前記登録色判定ステップで非登録色と判定された抽出色が、前記拡張登録色領域に含まれるか否かを判定する抽出色判定ステップと、
属性判定部において、前記抽出色判定ステップで前記抽出色が前記拡張登録色領域に含まれると判定された場合、その登録色に対応して設定された属性を、前記抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定する属性判定ステップと、
登録色更新処理部において、前記拡張登録色領域設定ステップで設定された色領域に含まれる色値を新たな登録色として追加設定する登録色更新処理ステップと、
を有することを特徴とする情報処理方法にある。
さらに、本発明の情報処理方法の一実施態様において、前記拡張登録色領域設定ステップは、解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線上に前回の抽出色の色値データに基づく射影点を設定し、該射影点を頂点とする円錐領域を登録色に対応する拡張登録色領域として設定する処理を実行するステップであり、抽出色判定ステップは、前記登録色判定ステップにおいて非登録色と判定された抽出色が、前記円錐領域に含まれるか否かを判定する処理を実行するステップであることを特徴とする。
さらに、本発明の情報処理方法の一実施態様において、前記拡張登録色領域設定ステップは、前回の抽出色の色値に対応する近似曲線上の近傍点を頂点とし、近似曲線を含み色値履歴の新しい方向に広がりを設定した円錐領域を拡張登録色領域として設定する処理を実行するステップであることを特徴とする。
さらに、本発明の情報処理方法の一実施態様において、前記拡張登録色領域設定ステップは、予め設定した半径rと、高さlの円錐領域を拡張登録色領域として設定する処理を実行するステップであることを特徴とする。
さらに、本発明の情報処理方法の一実施態様において、前記拡張登録色領域設定ステップは、解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線を中心軸とする円柱領域を設定し、該円柱領域を登録色に対応する拡張登録色領域として設定する処理を実行するステップであり、抽出色判定ステップは、前記登録色判定ステップで非登録色と判定された抽出色が、前記円柱領域に含まれるか否かを判定する処理を実行するステップであることを特徴とする。
さらに、本発明の情報処理方法の一実施態様において、前記拡張登録色領域設定ステップは、予め設定した半径rの円柱領域を拡張登録色領域として設定する処理を実行するステップであることを特徴とする。
さらに、本発明の第4の側面は、
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理方法であり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出ステップと、
登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定ステップと、
抽出色カウント部において、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行する抽出色カウントステップと、
カウント数検証部において、前記マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行するカウント数検証ステップと、
登録色更新処理部において、前記カウント数検証ステップで抽出予定数未満のマーカー色と、前記登録色判定ステップで検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、該非登録色を、抽出予定数未満のマーカー色を変更後のマーカー色であると判断し、登録色の更新を実行する登録色更新処理ステップと、
属性判定部において、前記登録色更新処理ステップで新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定する属性判定ステップと、
を有することを特徴とする情報処理方法にある。
さらに、本発明の第5の側面は、
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行させるコンピュータ・プログラムであり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得させる色領域抽出ステップと、
登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別させる登録色判定ステップと、
拡張登録色領域設定部において、マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定させる拡張登録色領域設定ステップと、
抽出色判定部において、前記登録色判定ステップで非登録色と判定された抽出色が、前記拡張登録色領域に含まれるか否かを判定させる抽出色判定ステップと、
属性判定部において、前記抽出色判定ステップで前記抽出色が前記拡張登録色領域に含まれると判定された場合、その登録色に対応して設定された属性を、前記抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定させる属性判定ステップと、
登録色更新処理部において、前記拡張登録色領域設定ステップで設定された色領域に含まれる色値を新たな登録色として追加設定させる登録色更新処理ステップと、
を実行させることを特徴とするコンピュータ・プログラムにある。
さらに、本発明の第6の側面は、
情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行させるコンピュータ・プログラムであり、
色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得させる色領域抽出ステップと、
登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別させる登録色判定ステップと、
抽出色カウント部において、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行させる抽出色カウントステップと、
カウント数検証部において、前記マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行させるカウント数検証ステップと、
登録色更新処理部において、前記カウント数検証ステップで抽出予定数未満のマーカー色と、前記登録色判定ステップで検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、該非登録色を、抽出予定数未満のマーカー色を変更後のマーカー色であると判断し、登録色の更新を実行させる登録色更新処理ステップと、
属性判定部において、前記登録色更新処理ステップで新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定させる属性判定ステップと、
を実行させることを特徴とするコンピュータ・プログラムにある。
なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能なコンピュータシステムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体、例えば、CDやDVDなどの記録媒体、あるいは、ネットワークなどの通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータシステム上でプログラムに応じた処理が実現される。
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
本発明の一実施例構成によれば、例えば、文書ドキュメントに対するマーカーペンによる文字列抽出/属性付与処理、すなわち、色マーカーによる追記のなされた追記ドキュメントからマーカー色を解析して、マーカー色に基づくドキュメント情報の属性判定処理を実行する構成において、マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定し、非登録色と判定された抽出色が、拡張登録色領域に含まれる場合に、登録色に対応して設定された属性を、抽出色のマーカー色追記領域に含まれるデータ対応の属性として設定する構成としたので、例えばマーカーペンの経時的な色変化、あるいはペンの交換などが実行された場合でも、的確な色判定に基づく属性付与が可能となる。
また、本発明の一実施例構成によれば、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを行い、予め各マーカー色に対応する抽出予定数との比較を実行して、抽出予定数未満のマーカー色の変更後のマーカー色を判断し、この判断情報に基づいて登録色の更新を実行する構成としたので、オペレータによる登録色更新処理を行なうことなく自動的な更新が可能となり、効率的な処理が実現される。
以下、図面を参照しながら本発明の実施形態に係る情報処理装置、および情報処理方法、並びにコンピュータ・プログラムの詳細について説明する。なお、説明は以下の項目に従って行なう。
1.マーカーペンによる文字列抽出/属性付与処理の概要
2.マーカー色の変化を許容した処理例
(2.1)マーカーペンの変色に対応した処理例
(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)
(2.3)マーカーペンの交換に対応した処理例2(異なる色への交換)
3.情報処理装置の構成
[1.マーカーペンによる文字列抽出/属性付与処理の概要]
まず、図1、図2を参照してマーカーペンによる文字列抽出/属性付与処理の概要について説明する。マーカーペンによる文字列抽出/属性付与処理は、例えば文書ドキュメントに対して、オペレータが、ドキュメント上の文字列などの情報を、カテゴリに応じて設定された特定色のマーカーでチェックする処理を行い、この処理後のドキュメントをスキャナで読み取り、その読み取り画像データから、マーカー色を判別して、ドキュメント上の情報分類を行ない、ドキュメントに対するインデックス情報としてデータベースに格納する処理である。
例えば、ドキュメントが商品見積もり書などである場合、マーカーの色に応じて、
オレンジ:購入価格、
緑:購入品、
青:依頼者、
赤:回答者、
など、情報の種類に応じて、予め利用するマーカー色が対応付けられており、オペレータがドキュメント上から、これらの情報に対応する情報を選択して、それぞれに割り当てられたマーカーでチェックをする。その後、PC等の情報処理装置において、スキャナで読み取った画像データからマーカーの色情報を取得して、各色情報の指示部分の文書情報などを例えば文字認識(OCR)処理などにより、データ化を行い、その文書ドキュメントに対応するインデックス情報としてデータベースに格納する。
例えば、図1に示す情報処理装置51は、データベース54に格納された文書ドキュメントを、プリンタ52を介して出力する。図に示す原本ドキュメント11である。オペレータは、この原本ドキュメント11対して、予め設定された情報種類と利用マーカー色の対応に基づいて、マーカーによる追記を行なう。この結果が図に示す追記ドキュメント12である。
例えば、追記ドキュメントには、赤、青、緑のマーキング21〜23がなされており、これらは、予め定められたルールに基づいてマーキングされたものである。例えば、マーカーの色と情報種類(属性)の対応が、
オレンジ:購入価格、
緑:購入品、
青:依頼者、
赤:回答者、
として設定されている。この追記ドキュメント12はスキャナ53によって読み取られて、情報処理装置51においてデータ処理がなされ、処理対象文書ドキュメントに対応するインデックス情報の設定処理がなされる。
図2を参照して、情報処理装置51において実行されるマーカーペンによる文字列抽出/属性付与処理の具体例について説明する。図2に示す追記ドキュメント100は、オペレータによって、マーカー色の設定された追記ドキュメント100である。マーカーの色と属性の対応は、
オレンジ:購入価格、
緑:購入品、
青:依頼者、
赤:回答者、
である。
追記ドキュメントのマーカー色追記領域101は「スキャナ」の文字が記録された領域であり、オペレータはこのマーカー色追記領域の属性を[購入品]であると判定し、購入品に対して設定されたマーカー色=[緑]を用いてマーカー色を設定する。
マーカー色追記領域102は「ST123」の文字が記録された領域であり、オペレータはこのマーカー色追記領域の属性を[依頼者識別子(依頼者No.)]であると判定し、依頼者に対して設定されたマーカー色=[青]を用いてマーカー色を設定する。
マーカー色追記領域103は「B社」の文字が記録された領域であり、オペレータはこのマーカー色追記領域の属性を[回答者]であると判定し、回答者に対して設定されたマーカー色=[赤]を用いてマーカー色を設定する。
マーカー色追記領域104は「¥2120」の文字が記録された領域であり、オペレータはこのマーカー色追記領域の属性を[購入価格]であると判定し、購入価格に対して設定されたマーカー色=[オレンジ]を用いてマーカー色を設定する。
この追記ドキュメント100はスキャナ53によって読み取られ、情報処理装置51に入力されてマーカーペンによる文字列抽出/属性付与処理が実行される。情報処理装置51の記憶部には、図に示すマーカー色と属性の対応を示すマーカー色属性対応テーブル71が格納されている。すなわち、
マーカー色=オレンジ:属性=購入価格、
マーカー色=緑:属性=購入品、
マーカー色=青:属性=依頼者、
マーカー色=赤:属性=回答者、
これらのマーカー色と属性の対応情報を有するテーブルである。
情報処理装置51は、スキャナで読み取った画像データからマーカーの色情報を取得して、このマーカー色属性対応テーブル71を参照して各色情報の設定領域にある文字情報などの属性を決定する。各色情報の設定領域にある文字情報は、例えば文字認識(OCR)処理などによりテキストデータ化を施し、属性値とともにデータベース54に格納する。
データベースに格納されるデータの一例が、図に示す解析データ72である。解析データ72は、色マーカーの各色に対応する属性ごとに分類したデータを格納したテーブルである。このように、情報処理装置51は、各追記ドキュメントのマーカーペンによる文字列抽出/属性付与処理によって読み取られたデータを、各属性ごとに分類整理を行い、図に示す解析データ72を生成してデータベース54に格納する。なお、図に示す解析データ72は、マーカーペンによる文字列抽出/属性付与処理によって生成可能なデータの一例を示すものであり、この他にも、様々な形態のデータが生成可能である。
このようにマーカーペンによる文字列抽出/属性付与処理により、効率的なデータ整理が可能となる。しかし、前述したように、ドキュメントに対するマーカー色設定は、オペレータによって実行される。オペレータは、指定色のカラーペンによってマーカー設定を行うが、オペレータの利用するペンは、長期間の利用によって、色の変化を起こす場合がある。また、同じ色、例えば[赤]であっても使用するペンのメーカーによって、微妙な色の差異が発生することがある。一方、マーカー色の判別を実行するのは、情報処理装置であり、一定の色値データ、例えばRGB値やLab値といった特定の色情報値に基づいて、マーカー色の判別を行なう。従って、オペレータの利用するペンの色の変化や、使用するペンの変更などに基づいて正確なマーカー色判定が不可能となり、属性値判定処理のエラーが発生することかある。
本発明の情報処理装置では、マーカー色設定を行うオペレータの利用するペンの色が、多少変化した場合でも、色変化を許容するマーカー色認識を行うことで正しい属性値の解析を可能とする。本発明の情報処理装置の実行する処理例について、図3以下を参照して説明する。
[2.マーカー色の変化を許容した処理例]
図3以下を参照して本発明の情報処理装置の実行する処理、すなわち、マーカー色設定を行うオペレータの利用するペンの色が、多少変化した場合でも、色変化を許容するマーカー色認識を行い正しい属性値の設定を行う構成例について説明する。
(2.1)マーカーペンの変色に対応した処理例
まず、図3を参照して、オペレータの利用するマーカーペンの色の変化が発生する具体的例について説明する。図3(a)は、先に図2を参照して説明したと同様のマーカー色属性対応テーブルである。すなわち、
マーカー色=オレンジ:属性=購入価格、
マーカー色=緑:属性=購入品、
マーカー色=青:属性=依頼者、
マーカー色=赤:属性=回答者、
これらのマーカー色と属性の対応情報を有するテーブルである。
オペレータは、この対応情報に基づいて、ドキュメントに対してマーカー色の設定を実行する。図3(b1)、(b2)はマーカーペンの色の変化が発生する例を示している。図3(b1)は、オレンジのマーカー色によるマーカー色設定例である。1枚目のドキュメントに対するオレンジのマーカーの追記において、ドキュメント上の文字の色(例えば黒インク)が、マーカーに付着してしまい、1枚目のマーカー色追記領域201では、左端から右端に至る範囲で色の変化が発生している。具体的にはマーカー色追記領域201の左端は明るいオレンジであるが、右端では、ドキュメント上の文字の色(例えば黒インク)が交じり合って黒っぽいオレンジになっている。
さらに、オペレータは、2枚目のドキュメントに対して、そのままマーカー色追記を行なうと、ドキュメント上の文字の色(例えば黒インク)が付着し変色したマーカーペンを使用することになり、2枚目のマーカー色追記領域202は、全体が黒っぽいオレンジになってしまう。さらに、2枚目でも同様にドキュメント上の文字の色との交じり合いが発生し、さらにマーカー色が変化してしまう。これを複数回、繰り返すと、変色がひどくなり、例えば、n枚目においては、明らかに1枚目のオレンジマーカー色とは異なる色に変化してしまう。
色解析を実行する情報処理装置は、例えばRGBやLabなどの色情報値に基づいて、色解析を行なうので、例えば、1枚目のオレンジマーカー色に対応するLabが登録情報(標準指定色)として情報処理装置に記録さているとすると、n枚目のオレンジマーカー色のマーカー色追記領域203のLab値は、登録情報と異なる値を有するため、登録オレンジ色とは異なる色と判別され、オレンジ色に対応する属性値の認識がなされないことになる。
図3(b2)は、青色のマーカー色によるマーカー色設定例である。1枚目のドキュメントに対する青色のマーカーの追記において、ドキュメント上の印鑑の朱肉の色(例えば赤)が、マーカーに付着してしまい、1枚目のマーカー色追記領域221では、左端から右端に至る範囲で色の変化が発生している。具体的にはマーカー色追記領域201の左端は本来のマーカー色である青色であるが、右端では、ドキュメント上の朱肉の色(例えば赤)が交じり合って赤と青の混合色になっている。
さらに、オペレータは、2枚目のドキュメントに対して、そのままマーカー色追記を行なうと、赤と青の混合色に変色したマーカーペンを使用することになり、2枚目のマーカー色追記領域222は、全体が、赤と青の混合色になってしまう。さらに、2枚目でも同様にドキュメント上の印鑑の色との交じり合いが発生し、さらにマーカー色が変化してしまう。これを複数回、繰り返すと、変色がひどくなり、例えば、n枚目においては、明らかに1枚目の青色のマーカー色とは異なる色に変化してしまう。
この場合、n枚目のマーカー色追記領域223の色値(例えばLab値)は、情報処理装置の登録情報(Lab値)と異なる値となるため、登録された青色とは異なる色と判別され、青色に対応する属性値の認識がなされないことになる。
本発明の情報処理装置では、このようなマーカー色の変化を許容する色解析および属性値設定処理を実行する。図4を参照して本発明の情報処理装置の実行する色解析処理例の一実施例について説明する。
図4の処理例は、マーカー色が、利用数に応じて色変化を発生させる場合、マーカー色の利用数に応じて、情報処理装置の登録色情報を更新して、マーカー色の色変化に追随した色判別を行なう処理例を説明する図である。
図4(a)は、マーカー追記のなされたドキュメントから抽出されたある1つの属性に対応するマーカー色の読み取り情報に対応するLab値の分布を示している。色解析を実行する情報処理装置は、各属性対応の色に対応するLab値を登録情報として保持している。なお、Labは、
L:明度指数
a:色度
b:色度
これらの各値によって構成される。例えば
属性=購入価格:マーカー色=オレンジ[(L,a,b)=(80,20,80)]、
属性=購入品:マーカー色=緑[(L,a,b)=(80,−70,70)]
属性=依頼者:マーカー色=青[(L,a,b)=(75,−30,−30)]:
属性=回答者:マーカー色=赤[(L,a,b)=(80,50,−25)]:
このような属性対応の色に対応するLab値が、色解析、属性判定を実行する情報処理装置の記憶部に登録情報として保持されている。情報処理装置は、ドキュメントから取得されたマーカー色設定領域のLab値と、登録情報としてのLab値との比較を実行して、追記マーカー色の色判別を実行して属性解析を実行する。
図4(a)は、マーカー追記のなされたドキュメントから抽出されたある1つの属性に対応するマーカー色、例えばオレンジ色の読み取り情報に対応するLab値の分布を示している。オペレータによって追記されたマーカー色は、同じ色であっても、筆圧や図3を参照して説明したドキュメント原稿上のインクとの交じり合いなどによって変化することになる。
マーカー色と登録色の値との比較処理においては、多少の誤差は許容誤差とする処理を行なう。しかし、先に図3を参照して説明したようなマーカー色の変化が発生すると、登録された色値(L,a,b)との差が大きくなり、許容誤差範囲外に至ることがあり、正しい属性値の設定が実行できなくなる。
そこで、本処理例では、情報処理装置において、マーカー色の利用回数と、検出色の変化を解析し、その解析結果に基づいて、情報処理装置の登録色情報(Lab)の更新を実行する。
図4(b)は、本発明の情報処理装置において実行する登録色情報の更新処理を説明する図である。図4(b)に示す色値271〜275は、それぞれ、マーカー追記ドキュメントから読み取られた同じマーカー色(例えばオレンジ)のマーカー追記設定領域のLab色空間における色情報としてのa,b値の推移を示している。すなわち、
1枚目のドキュメントの色値271は、(L,a,b)=(85,6,85)
2枚目のドキュメントの色値272は、(L,a,b)=(85,20,85)
3枚目のドキュメントの色値273は、(L,a,b)=(85,30,70)
n枚目のドキュメントの色値275は、(L,a,b)=(85,70,40)
このように、同じ色マーカー(例えばオレンジ)であっても、ドキュメントの枚数、すなわち、マーカーの利用回数に応じて、マーカー色の色値は変化する。なお、図4(b)にはLab中、abのみからなる2次元空間での色の推移を示している。
例えば、1枚目のドキュメントの色値271であるLab=(85,6,85)が情報処理装置にオレンジ対応の色値として登録されている場合、追記ドキュメントから読み取られるマーカー領域の色値が、Lab=(85,6,85)および予め設定された許容誤差範囲内であれば、そのマーカー色設定領域は、オレンジ色のマーカー設定領域と判断される。しかし、図3を参照して説明したような、色変化が発生すると許容誤差範囲外になりオレンジ対応の属性値の設定が実行できなくなる。例えば、図4(b)に示すn枚目のドキュメントのマーカー追記色は変色オレンジであり色値275:Lab=(85,70,40)となり、許容誤差範囲ではなく、オレンジ色との判定は実行されない。
図4を参照して説明する本発明の情報処理装置の処理例では、登録色情報を、追記を実行したドキュメント枚数に応じて、順次更新する。
まず、1枚目のドキュメントの色値271であるLab=(85,6,85)が、初期的なオレンジ色に対応する登録色情報であるとする。
2枚目のドキュメントの色値272であるLab=(85,20,85)は、登録色情報[Lab=(85,6,85)]の許容誤差範囲にあり、情報処理装置において、オレンジ色のマーカー設定領域であると認識されるとする。
ここで、情報処理装置は、1枚目のドキュメントの色値271であるLab=(85,6,85)と、2枚目のドキュメントの色値272であるLab=(85,20,85)を含む円錐領域281をLab空間上に設定する。図に示す高さl(エル)、半径rの円錐領域281である。高さlは、1枚目のドキュメントの色値271と2枚目のドキュメントの色値272との距離以上に設定される。例えば、2点間距離をLとしたときl=L+Δlとして設定する。Δlは許容誤差を勘案して0以上の値として予め定められる。円錐の底面の半径rも許容誤差に基づいて予め設定する。
この円錐を拡張登録色領域としてLab空間上で、マーカーの追記ドキュメント枚数に応じて随時設定することで、マーカー色の変化に追随する。例えば、3枚目のドキュメントの、色マーカー設定領域の測定色値(Lab)が、前回までの(1〜2枚目のドキュメント)から取得された色値(Lab)に基づいて設定される高さl(エル)、半径rの円錐領域282の中に存在すれば、その色マーカー設定領域の設定色はオレンジであると判定する。さらに、4枚目のドキュメントの、色マーカー設定領域の測定色値(Lab)が、前回までの(1〜3枚目のドキュメント)から取得された色値(Lab)に基づいて設定される高さl(エル)、半径rの円錐の中に存在すれば、その色マーカー設定領域の設定色はオレンジであると判定する。以下、同様の処理を繰り返す。
なお、円錐は、上記した高さl(エル)、半径rの他、前回までの複数の測定色値によって定義される近似曲線によってその形状および設定位置が決定される。具体的には、まず、前回までの抽出色履歴と抽出色の近似曲線を算出する。近似曲線は、前回までの複数の測定色値(Lab値)に基づいて設定する曲線であり、線形近似、多項式近似、移動平均など、様々な処理に基づく近似曲線が利用可能である。次に、円錐の頂点(起点)を近似曲線上に設定する。この頂点の設定は、直前の抽出色のLab値を近似曲線に射影して設定する。例えば、直前の抽出色のLab値に対応する近似曲線上の近傍点、すなわち直前の抽出色のLab値と最短距離にある近似曲線上の点を円錐の頂点(起点)とする。この射影点を起点(頂点)とする長さl、半径rの円錐を設定する。円錐は、近似曲線を含み、色値履歴の新しい方向に広がり(底面)が設定されるように設定する。
例えば、図4に示す円錐領域282は、前回(1〜2回目)までの2つの測定色値によって定義される近似曲線291と、高さl(エル)、半径rとによってその形状および設定位置が決定される。具体的には、例えば、近似曲線291を円錐領域282の内部または側面に設定する。図に示す例では、1枚目のドキュメント色値271からの2枚目のドキュメント色値272の移動方向は、色情報としてのLab中、a値が大きくなり、b値が小さくなる方向である。この場合、3枚目、4枚目・・・と、同様の傾向での色変化が発生することが予測される。この推測に基づいて、近似曲線291に沿った円錐領域282を設定する。すなわち、a値が大きくなり、b値が小さくなる方向に広がり領域を設定した円錐を設定する。
円錐の起点(頂点)は、1枚目のドキュメント色値271と2枚目のドキュメントの色値272とに基づいて設定される近似曲線に2枚目のドキュメントの色値272を射影した点とする。近似曲線291上の、2枚目のドキュメントの色値272の射影点を頂点とし、近似曲線291に沿った高さl(エル)、半径rの円錐領域282を設定する。なお、近似曲線としては線形近似、多項式近似、移動平均など、様々な設定に基づく近似曲線が利用可能である。
以下、同様に、a値が大きくなり、b値が小さくなる方向に広がり領域を設定して、1回目〜3回目の測定値に基づく近似曲線292上における3枚目のドキュメントの色値273の射影点を頂点とした高さl(エル)、半径rの円錐を設定する。この処理を繰り返し実行し、各円錐内部に測定値がある場合は、その属性対応の色(ここではオレンジ)であると判定する。
これを繰り返して実行すると、n回目の測定値がオレンジであると判定される領域は、図に示す円錐領域283によって規定される領域となる。円錐領域283は、1回目〜n−1回目の測定値に基づく近似曲線293上におけるn−1回目のドキュメントの色値274の射影点を頂点とした高さl(エル)、半径rの円錐である。結果として、n枚目のドキュメントの色値275であるLab=(85,70,40)は、この円錐領域283によって規定されるLab空間内に含まれ、この色Lab=(85,70,40)はオレンジ色であると判定される。
このように、本発明の情報処理装置では、マーカーの追記処理の繰り返しにより変化するマーカー色を追随して、属性対応色として判定する色領域を更新するので、図3を参照して説明したような、マーカーの色変化が発生した場合であっても、誤認識することなく正確な色解析および属性判定が可能となる。
なお、図4を参照して説明した例では、ドキュメントの枚数に応じて円錐を設定して色領域を更新する処理例を説明したが、マーカーを利用した追記処理回数に応じて円錐を設定して色領域を更新する処理を行なう構成としてもよい。例えば、1枚のドキュメントに複数箇所同じマーカーで追記処理を実行する構成などにおいては、このような設定とするのが有効である。
図5に示すフローチャートを参照して、情報処理装置において実行する本処理例のシーケンスについて説明する。まず、情報処理装置は、ステップS101においてスキャン画像を入力する。このスキャン画像は、図3に示す(a)マーカー色と属性の対応テーブルに従って、オペレータがマーカー色を選択してマーカー色追記のなされたマーカー追記ドキュメントのスキャン画像である。ステップS102では、文字解析(OCR)処理を実行する。なお、この文字解析においては、ドキュメント全体の文字解析を行ってもよいが、マーカー色設定領域のみを選択して文字解析を行ってもよい。
ステップS103では、色抽出処理を実行する。ドキュメントの原本背景および原本の文字等の記録色と異なる色を抽出する。個々で抽出される色には、テーブル登録されているマーカー色のみならず、テーブル登録されていないマーカー色と異なる色が含まれる場合がある。これは、例えば先に図3を参照して説明したようなドキュメント上の原本のインクとの交じり合いなどに起因して発生する。
ステップS104では、ステップS103において抽出した色各々について、テーブル登録されているマーカー色(登録色)であるか登録されていない色(非登録色)であるかの判定を行なう。
次に、ステップS105において、前回までの抽出色の履歴と抽出色に基づく近似曲線を算出する。これは、図4を参照して説明した処理であり、今回抽出した色値が登録色に対応するか否かを判定するための事前処理である。例えばLab空間において、前回までの抽出色の色値を設定し、その色値に基づく近似曲線を設定する。このように、近似曲線は、前回までの複数の測定色値(Lab値)に基づいて設定される曲線であり、線形近似、多項式近似、移動平均など、様々な処理に基づく近似曲線が利用可能である。
次に、ステップS106において、円錐の頂点(起点)を近似曲線上に設定する。この頂点の設定は、直前の抽出色のLab値を近似曲線に射影して設定する。例えば、直前の抽出色のLab値に最短距離にある近似曲線上の点を円錐の頂点(起点)とする。次に、ステップS107において、ステップS106で設定した射影点を起点(頂点)とする長さl、半径rの円錐を設定する。円錐は、近似曲線を含む方向に広がり(底面)が設定されるように設定する。
次に、ステップS108において、設定した円錐領域内に今回の抽出色の色値が存在するか否かの解析処理を実行する。ステップS109において、設定した円錐領域内に今回の抽出色の色値が存在すると判定されると、ステップS110に進み、ステップS109において、設定した円錐領域内に今回の抽出色の色値が存在しないと判定された場合は、抽出色は登録色ではないと判断し、処理を終了(次のドキュメントがある場合は次のドキュメントの処理に進む)する。
ステップS109において、設定した円錐領域内に今回の抽出色の色値が存在すると判定した場合は、抽出色は登録色であると判断して、ステップS110において、属性対応の登録色の色値情報を更新する。すなわち、今回取得した色値についても、登録属性に対応する色の値であるとする色情報更新を実行する。なお、これまでに抽出された抽出色の履歴のすべてが登録色に対応する色情報として蓄積される。なお、色空間において設定した円錐領域の全て含む色領域を登録色として設定してもよい。
次に、ステップS111において、登録色対応の属性を取得し、属性情報を登録する。例えば、図3(a)に示す(a)マーカー色と属性の対応テーブルに従った処理を実行しているとすると、マーカー色追記領域の抽出色がオレンジであると判定された場合、購入価格の属性であると判断され、マーカー追記のなされた領域の文字情報(OCR解析結果)の対応属性として、[購入価格]という属性が文字情報に対応付けられて情報処理装置の記憶部に格納され登録される。
次に、ステップS112において、今回取得した色値の履歴を、前回までの色値履歴に加えて保存する。この保存データは、次回抽出色の色値解析の際に適用される。すなわち、近似曲線の生成、円錐の設定処理に際に適用される。
このような処理によって、順次、新たなドキュメントあるいは新たなマーカー領域からの抽出色の色判定および属性判定に際して、前回までの抽出色履歴に基づく近似曲線が新たに設定され、新たな円錐が設定されて、その円錐領域内に新たな抽出色の色値が含まれるか否かを判断して、属性対応色に相当するか否かを判定する処理を繰り返す。この処理によって、図3を参照して説明したマーカー色の変化が発生した場合においても、情報処理装置において登録色に対応するか否かの判定基準とする色領域を、マーカー色の変化に追随して順次更新するので、誤った判断を起こすことなく正しい色判定及び属性設定が可能となる。なお、本処理例では、色空間としてLab空間を適用した処理例を説明したが、本発明はRGBなどLabと異なる色空間を適用した処理として実行することも可能であり、同様の効果を奏することができる。
(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)
次に、マーカーペンの交換に対応した処理例について、図6以下を参照して説明する。1つのマーカーペンを継続して使用続けると、当然、インクが消耗し、次第に色が薄くなる。具体的には、図6(a)に示すように、ある属性1に対応して利用するマーカーペンがオレンジであるとする。この場合、1本のオレンジ色のマーカーペンを使用して追記を繰り返し実行することを想定する。
図6(b)に示すように、1枚目のドキュメントに対しては、登録された色情報:Lab=(80,20,80)に対応する色がドキュメントに記録される。従って、マーカー色追記領域301から読み取られる色の値は、登録色とほぼ一致することになる。しかし、繰り返しマーカー記録を実行していると、インクが消耗し、しだいに色が薄くなり、例えば30枚目あるいは30回目の追記において、マーカー色追記領域302から読み取られる色の値は、登録色と異なる値となり、さらに、継続して同じマーカーペンを利用すると、さらに色が薄くなり、n枚目あるいはn回目の追記において、マーカー色追記領域303から読み取られる色の値は、登録色と明らかに異なる値となる。
このような色の変化は、先に説明した(2.1)マーカーペンの変色に対応した処理例によって対応することができる。すなわち、図4を参照して説明したような近似曲線の設定、円錐領域の設定を実行して登録色に対応する色か否かを判定する色領域を随時更新することで、マーカー色の変化に追随した色判定、属性判定が可能となる。しかし、この処理例では、オペレータは、色の薄くなったマーカーペンの利用を止め、新しいマーカーペンの使用を開始することがある。
このようなペンの交換によって、前回までの履歴に基づく処理では対応が不可能となる。すなわち、n回目の追記が終了した時点でペンの交換を行ったとすると、n回目の抽出色と、新しいペンで追記を実行したn+1回目の追記領域からの抽出色とは明確に異なるものとなり、抽出色履歴に基づく近似曲線に基づいて設定した円錐領域には含まれない色となる。また、同じ色、例えば[オレンジ]であっても、ペンのメーカーによって、その色は異なるものとなり、登録色が固定的である場合は、その交換ペンの色が登録色と異なる色と判定されるという恐れがある。
本処理例は、このようなペン交換が発生した場合でも正しい色判定に基づく属性設定を可能とした処理例である。本処理例について、図7を参照して説明する。図7(a)は、マーカー追記のなされたドキュメントから抽出されたある1つの属性に対応するマーカー色、例えばオレンジ色の読み取り情報に対応するLab値の分布を示している。オペレータによって追記されたマーカー色は、図6を参照して説明したように同じ色であっても、次第に色が薄くなり、また、ペンの変更によって突然色が大きく変化することがある。
前述したように、マーカー色と登録色の値との比較処理においては、多少の誤差は許容誤差とする処理を行なう。しかし、先に図3を参照して説明したようなマーカー色の変化が発生すると、登録された色値(Lab)との差が大きくなり、許容誤差範囲外に至ることがあり、正しい属性値の設定が実行できなくなる。マーカー色の使用回数に基づくなだらかな色の変化に対しては、先に説明した(2.1)マーカーペンの変色に対応した処理例によって対応することができるが、突然のペンの変更には対応できない。
そこで、本処理例では、ペンの変更があった場合でも登録色に相当する色であるとの判断を可能とするため、図7(b)に示すように、抽出色履歴に基づいて設定される近似曲線321を中心とした半径rの円柱領域322を設定し、この円柱領域322に抽出色の色値が含まれる場合には、登録色に対応する色であると判定する処理を実行する。
近似曲線321は、先に説明した(2.1)マーカーペンの変色に対応した処理例において説明した近似曲線であり、過去の抽出色の色値(Lab)に基づいて設定した近似曲線である。本処理例では、この近似曲線321を中心として、さらに、半径rの円柱領域322を拡張登録色領域として設定する。この円柱領域322に抽出色の色値が含まれれば、登録色に対応する色であると判断する。
例えば、図7(b)に示す色値331が、1回目のドキュメント読み取りにおいて抽出されたマーカー色の抽出色の色値であり、色値332が、同じマーカーペンで追記を行ったn回目の追記のなされたドキュメントから読み取られ抽出されたマーカー色の抽出色の色値である。色値331は、例えば、図6のマーカー色追記領域301から取得された色値に対応する、色値332は、図6のマーカー色追記領域303から取得された色値に対応する。
n回目の追記を終了後、オペレータはマーカーペンの交換を行ったとする。しかし、このペンは、それまで使用していたペンとは異なるメーカーのペンであり、同じ色、例えば[オレンジ]であっても色の値は一致していない。図7(b)では、色値333に相当する。しかし、この色値333は、図から理解されるように、近似曲線321を中心として設定された半径rの円柱領域322である拡張登録色領域に含まれ、この円柱領域322に含まれることに基づいて、登録色に相当するとの判断がなされ、正しい属性設定が行われる。なお、半径rの値は、使用するペンの種類の色差などに基づいて予め設定する。設定情報は、情報処理装置に記録される。
情報処理装置は、先に説明した(2.1)マーカーペンの変色に対応した処理例において説明した近似曲線を設定するとともに、半径rの値に基づいて、近似曲線を中心軸とした円柱領域、すなわち、図に示す円柱領域322を拡張登録色領域として設定して、これらの色領域を登録色とする設定を実行し、抽出色と登録色とを比較する。すなわち、抽出色が円柱領域322に含まれる場合には、登録色に相当すると判断して属性設定を実行する。
図8に示すフローチャートを参照して、情報処理装置において実行する本処理例のシーケンスについて説明する。まず、情報処理装置は、ステップS201においてスキャン画像を入力する。このスキャン画像は、例えば図2に示すマーカー色と属性の対応テーブル71に従って、オペレータがマーカー色を選択してマーカー色追記のなされたマーカー追記ドキュメントのスキャン画像である。ステップS202では、文字解析(OCR)処理を実行する。なお、この文字解析においては、ドキュメント全体の文字解析を行ってもよいが、マーカー色設定領域のみを選択して文字解析を行ってもよい。
ステップS203では、色抽出処理を実行する。ドキュメントの原本背景および原本の文字等の記録色と異なる色を抽出する。個々で抽出される色には、テーブル登録されているマーカー色のみならず、テーブル登録されていないマーカー色と異なる色が含まれる場合がある。これは、例えば先に図6、図7を参照して説明したようなマーカーの連続使用による色の希薄化、ペンの交換などに起因して発生する。
ステップS204では、ステップS203において抽出した色各々について、テーブル登録されているマーカー色(登録色)であるか登録されていない色(非登録色)であるかの判定を行なう。
次に、ステップS205において、前回までの抽出色の履歴と抽出色に基づく近似曲線を算出する。これは、先の(2.1)マーカーペンの変色に対応した処理例において図4を参照して説明した処理である。近似曲線は、前回までの複数の測定色値(Lab値)に基づいて設定される曲線であり、線形近似、多項式近似、移動平均など、様々な処理に基づく近似曲線が利用可能である。
次に、ステップS206において、近似曲線を中心軸とした半径rの円柱状の色領域を設定する。これは、図7を参照して説明した円柱領域322に相当する。次に、ステップS207において、設定した円柱領域内に今回の抽出色の色値が存在するか否かの解析処理を実行する。ステップS208において、設定した円柱領域内に今回の抽出色の色値が存在すると判定されるとステップS209に進み、ステップS208において、設定した円柱領域内に今回の抽出色の色値が存在しないと判定された場合は、抽出色は登録色ではないと判断し、処理を終了(次のドキュメントがある場合は次のドキュメントの処理に進む)する。
ステップS208において、設定した円柱領域内に今回の抽出色の色値が存在すると判定した場合は、抽出色は登録色であると判断して、ステップS209において、属性対応の登録色の色値情報を更新する。すなわち、今回取得した色値についても、登録属性に対応する色の値であるとする色情報更新を実行する。なお、これまでに抽出された抽出色の履歴のすべてが登録色に対応する色情報として蓄積される。なお、色空間において設定した円柱領域の全て含む色領域を登録色として設定してもよい。
次に、ステップS210において、登録色対応の属性を取得し、属性情報を登録する。例えば、図2に示すマーカー色と属性の対応テーブル71に従った処理を実行しているとすると、マーカー色追記領域の抽出色がオレンジであると判定された場合、購入価格の属性であると判断され、マーカー追記のなされた領域の文字情報(OCR解析結果)の対応属性として、[購入価格]という属性が文字情報に対応付けられて情報処理装置の記憶部に格納され登録される。
次に、ステップS211において、今回取得した色値の履歴を、前回までの色値履歴に加えて保存する。この保存データは、次の回の抽出色の色値解析の際に適用される。すなわち、近似曲線の生成、円柱領域の設定処理に際に適用される。
このような処理によって、順次、新たなドキュメントあるいは新たなマーカー領域からの抽出色の色判定および属性判定に際して、前回までの抽出色履歴に基づく近似曲線が新たに設定され、新たな円柱領域が設定されて、その円柱領域内に新たな抽出色の色値が含まれるか否かを判断して、属性対応色に相当するか否かを判定する処理を繰り返す。この処理によって、図6、図7を参照して説明したマーカー色の変化およびマーカーペンの交換による色の差異が発生した場合においても、情報処理装置において登録色に対応するか否かの判定基準とする色領域を、マーカー色の変化に追随し、さらに、近似曲線を中心とする所定の半径rの色領域を順次更新して、より広い領域を登録色対応の色と判定するので、誤った判断を起こすことなく正しい色判定及び属性設定が可能となる。なお、本処理例では、色空間としてLab空間を適用した処理例を説明したが、本処理例もRGBなどLabと異なる色空間を適用した処理として実行することも可能であり、同様の効果を奏することができる。
(2.3)マーカーペンの交換に対応した処理例2(異なる色への交換)
次に、マーカーペンの交換に対応した処理例2について、図9以下を参照して説明する。上述した(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)においては、例えば使用マーカーが[オレンジ]であれば、同じ[オレンジ]の新しいペンに交換した場合の対応例であった。しかし、必ずしも、このような同一系色のペンが利用可能な状態にあるとは限らず、いままでに使用していない色のペンを使いはじめるといった場合もある。例えば図2に示すマーカー色と属性の対応テーブル71に従った処理を実行している場合、オペレータは、属性[購入価格]に対応するマーカー色として[オレンジ]を使用したマーカー追記を行なうが、多くのマーカー追記によってインクが消耗し、ペンを交換しようとしたが同一系色のオレンジのマーカーペンが無いといった場合、属性対応色として登録されていない新たな色、例えば[紫]を[オレンジ]の代わりに属性[購入価格]に対応するマーカー色として利用する場合がある。
このような場合、色解析を実行する情報処理装置に登録されたマーカー色と属性の対応テーブルをマーカーの色変更に際して、オペレータが登録情報を更新することで対応可能であるが、このような処理をオペレータが行なうことは煩わしい処理であり、処理効率が低下することになる。そこで、本処理例では、このように全く異なる色へのマーカーペンの変更が行われた場合、その新規色のマーカーペンが、どの登録色に対応するペンとして交換された色であるかを自動的に判定して、マーカー色と属性の対応テーブルの自動更新を実行する。この処理例について、図9以下を参照して説明する。
図9は、ペン交換に伴うマーカー色と属性の対応テーブルの更新処理の一例を説明する図である。ドキュメント1〜n枚目までは、図のマーカー色を追記した追記ドキュメント410に示すような設定、すなわち、マーカー色と属性の対応テーブル415に登録された情報に基づいてオペレータがマーカー追記を行っていた。具体的には、
マーカー色=オレンジ:属性=購入価格、
マーカー色=緑:属性=購入品、
マーカー色=青:属性=依頼者、
マーカー色=赤:属性=回答者、
これらのマーカー色と属性の対応情報に基づいて、オペレータがマーカー追記を実行していた。
この設定情報に基づいてマーカー追記を実行中、[オレンジ]のマーカーペンのインクが消耗したので、オペレータは、[オレンジ]のマーカーペンの使用を中止し、マーカー色と属性の対応テーブル415に登録されていない新たな色として[紫]を選択して、[オレンジ]のマーカーペンの代わりとしてマーカー追記を続行する。
この結果、図に示すマーカー色を追記した追記ドキュメント420に示すように、
マーカー色=紫:属性=購入価格、
マーカー色=緑:属性=購入品、
マーカー色=青:属性=依頼者、
マーカー色=赤:属性=回答者、
これらのマーカー色と属性の対応を新たに設定して、オペレータがマーカー追記を行なうことになる。
図に示す1〜n枚目のマーカー色を追記した追記ドキュメント410の購入価格のマーカー色追記領域411は[オレンジ]のマーカー色追記となっているが、n+1枚目のマーカー色を追記した追記ドキュメント420の購入価格のマーカー色追記領域421は[紫]のマーカー色追記に変更されている。本処理例では、このような新規色のマーカーペンによる追記が検出された場合に、自動的に登録情報の更新を実行する。すなわち、
[マーカー色=オレンジ:属性=購入価格]
上記対応情報が登録されたマーカー色と属性の対応テーブル415を、
[マーカー色=紫:属性=購入価格]
上記情報に変更してマーカー色と属性の対応テーブル425に更新する処理を実行する。
本処理例の具体的な処理例について、図10を参照して説明する。本処理例においては、ドキュメントの処理枚数と、各マーカー色対応のマーカー色追記領域検出数とを比較して、マーカー色の変更の有無および変更されたマーカー色の判定を実行する。
図10に示す色空間450はLab色空間であり、情報処理装置は、マーカー追記ドキュメントから抽出した色領域の判定色をこの色空間450に配置し、各抽出色毎に、その数をカウントする。本処理例では、処理ドキュメント(原稿)枚数=7とし、
マーカー色=オレンジ:属性=購入価格、
マーカー色=緑:属性=購入品、
マーカー色=青:属性=依頼者、
マーカー色=赤:属性=回答者、
の対応情報を持つマーカー色と属性の対応テーブル415に基づく処理が実行されたものとする。各ドキュメントには、各色(属性)が1つずつ含まれているものとする。
情報処理装置は、マーカー色と属性の対応テーブル415に登録された色に対応する抽出色毎にその数をカウントする。図に示す例では、
オレンジ色領域451:カウント数=6、
緑色領域452:カウント数=7、
青色領域453:カウント数=7、
赤領域454:カウント数=7、
これらの各色領域に対応するマーカー色追記領域数がカウントされている。
さらに、マーカー色と属性の対応テーブル415には登録されていない[マーカー色=紫]を示す非登録色対応色値471が検出されている。
色解析、属性判定および登録処理を実行する情報処理装置は、この各属性対応登録色の抽出カウント数と、ドキュメント数の比較を実行する。図10に示す処理例において、ドキュメント数=7に対して、カウント数が少ないのは、オレンジのカウント数=6である。さらに、1つの新規抽出色[紫]が検出されている。紫のカウント数は[1]である。
情報処理装置は、カウント数が予定数より少ない抽出色[オレンジ]と新規色[紫]のカウント数の加算数(6+1=7)がドキュメント数=7に等しいことを検証し、この検証に基づいて、マーカー色[オレンジ]からマーカー色[紫]への本稿が実行されたものと判断する。情報処理装置は、この判断に基づいて、
[マーカー色=オレンジ:属性=購入価格]
上記対応情報が登録されたマーカー色と属性の対応テーブル415を、
[マーカー色=紫:属性=購入価格]
上記情報に変更してマーカー色と属性の対応テーブル425に更新する処理を実行する。
この処理によって、マーカー色と属性の対応テーブルは自動更新されるので、オペレータが、テーブルの更新処理を実行する必要がなくなり、効率的な処理が実現される。なお、上記処理例では、1ドキュメントに対して、各属性対応色の設定領域が1箇所とした設定例として説明したが、1つのドキュメントに1つの同じマーカー色設定領域がある場合は、その領域数に応じたカウントを実行する設定とする。例えば、オレンジの設定領域が1ドキュメントに2箇所ある場合は、図10の例では、ドキュメント数=7に対して、オレンジの色抽出が7×2=14となり、カウント数=14であると予測される。この予測に反して、例えば10の[オレンジ]の色のカウントしかなく、[紫]のカウントが4検出されれば、
[オレンジのカウント数=10]+[紫のカウント数=4]=14
となり、ドキュメントに対するオレンジの予定追記利用域数=14に対応するので、[オレンジ]から[紫]へのマーカーペン色の変更が実行されたと判断し、登録色情報の更新、すなわちテーブルの更新を実行する。
本処理例のシーケンスについて、図11に示すフローチャートを参照して説明する。まず、情報処理装置は、ステップS301においてスキャン画像を入力する。このスキャン画像は、例えば図2に示すマーカー色と属性の対応テーブル71に従って、オペレータがマーカー色を選択してマーカー色追記のなされたマーカー追記ドキュメントのスキャン画像である。ステップS302では、文字解析(OCR)処理を実行する。なお、この文字解析においては、ドキュメント全体の文字解析を行ってもよいが、マーカー色設定領域のみを選択して文字解析を行ってもよい。
ステップS303では、色抽出処理を実行する。ドキュメントの原本背景および原本の文字等の記録色と異なる色を抽出する。個々で抽出される色には、テーブル登録されているマーカー色のみならず、テーブル登録されていないマーカー色と異なる色が含まれる場合がある。これは、例えば先に図9,図10を参照して説明したようなマーカーペンの交換に起因して発生する。
ステップS304では、ステップS303において抽出した色各々について、テーブル登録されているマーカー色(登録色)であるか登録されていない色(非登録色)であるかの判定を行なう。
次に、ステップS305において、テーブル登録されているマーカー色(登録色)の抽出数をカウントして、予定数との比較を実行する。図10を参照して説明した処理例では、各抽出色の予定数は[7]となる。ステップS306において、全ての抽出色カウントと予定数が一致したか否かを判定する。一致していれば、マーカーペンの色変更は実行されなかったものと判断され、ステップS308に進み、登録色対応の属性を取得し、属性情報を登録する。例えば、図2に示すマーカー色と属性の対応テーブル71に従った処理を実行しているとすると、マーカー色追記領域の抽出色がオレンジであると判定された場合、購入価格の属性であると判断され、マーカー追記のなされた領域の文字情報(OCR解析結果)の対応属性として、[購入価格]という属性が文字情報に対応付けられて情報処理装置の記憶部に格納され登録される。
ステップS306において、抽出色カウントと予定数が一致していないものが検出された場合は、ステップS307に進む。ステップS307では、予定数よりカウント数の少ない属性対応の登録色を新規抽出色に変更する登録色更新処理を実行する。この処理は、先に図10を参照して説明した処理、すなわち、
[マーカー色=オレンジ:属性=購入価格]
上記対応情報が登録されたマーカー色と属性の対応テーブル415を、
[マーカー色=紫:属性=購入価格]
上記情報に変更してマーカー色と属性の対応テーブル425に更新する処理に相当する。この登録情報更新処理の後、ステップS308に進み、登録色対応の属性の登録処理を実行する。
本処理例では、上述した処理によってマーカーペンが、それまで使用していた色と全く異なる色に変更された場合でも、情報処理装置側において、マーカーペンの色変更が行われたこと、および、どの属性に対応する色の変更が実行されたかを正確に判断して登録情報、すなわち、マーカー色と属性の対応テーブルの更新を行なうので、オペレータによるテーブルの更新が不用となり、効率的な処理が実現される。なお、本処理例でも、色空間としてLab空間を適用した処理例を説明したが、RGBなどLabと異なる色空間を適用した処理として実行することも可能であり、同様の効果を奏することができる。
[3.情報処理装置の構成]
次に、上述した処理を実行する本発明の情報処理装置の構成について、図12に示すブロック図を参照して説明する。上述した実施例において説明した各種の処理、すなわち、図5、図8、図11の各フローチャートに従った処理は、例えばPC等の情報処理装置において実行されるプログラムに従ってデータ処理部としてのCPUの制御によって行なわれる。図12は、これら一連のデータ処理を説明するために機能別に区分して示したブロック図である。すなわち、本発明の情報処理装置の有するデータ処理実行機能をブロックとして示してある。以下、このブロック図に従って、本発明の情報処理装置の実行する処理について説明する。
本発明の情報処理装置は、図12に示すように、様々な色のマーカーによって追記された追記ドキュメントのスキャン画像を入力する画像入力部481、画像入力部481に入力された追記ドキュメント上の文字認識(OCR)を実行する文字認識処理部482と、追記ドキュメント上の色領域を抽出する色領域抽出部483と、色領域抽出部483において抽出された色が、情報処理装置の保持するテーブル、すなわち、マーカー色と属性の対応テーブルに登録された登録色であるか非登録色であるかを判定する登録色判定部484を有する。
さらに、前述の(2.1)マーカーペンの変色に対応した処理例において説明した近似曲線と円錐領域の設定、または、(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)において説明した近似曲線と円柱領域の設定を実行する拡張登録色領域設定部485、登録色判定部484において非登録色と判定された抽出色が、拡張登録色領域に含まれるか否かを判定する抽出色判定部486、(2.3)マーカーペンの交換に対応した処理例2(異なる色への交換)において説明した抽出色のカウント処理を実行する抽出色カウント部487、カウント数と予定数との比較を実行するカウント数検証部488を有する。
さらに、
(2.1)マーカーペンの変色に対応した処理例
(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)
(2.3)マーカーペンの交換に対応した処理例2(異なる色への交換)
これらのいずれかの処理によって解析された情報に基づく登録情報の更新を実行する登録更新処理部489、登録情報の記憶部に対する格納処理を実行する更新情報記録部490、登録情報に基づいてマーカー色に対応する属性を取得して属性を判定する属性判定部491と、属性判定部491の決定した属性を文字認識処理部482の解析文字情報の属性として設定してデータベースに登録するデータ登録部492を有する。
例えば、先に説明した(2.1)マーカーペンの変色に対応した処理例を実行する構成では、拡張登録色領域設定部485において、解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線上に前回の抽出色の色値データに基づく射影点を設定し、該射影点を頂点とする円錐領域を登録色に対応する拡張登録色領域として設定し、抽出色判定部486において、登録色判定部484で非登録色と判定された抽出色が円錐領域に含まれるか否かを判定する。さらに、属性判定部491において、円錐領域に抽出色が含まれると判定された場合、その登録色に対応して設定された属性を、抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定する処理を実行する。なお、登録色更新処理部489は、拡張登録色領域設定部485において設定された色領域(円錐)に含まれる色値を新たな登録色として追加設定する登録色更新処理を実行する。
また、先に説明した(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)を実行する構成では、拡張登録色領域設定部485において、解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線を中心軸とする円柱領域を設定し、該円柱領域を登録色に対応する拡張登録色領域として設定する処理を実行する。さらに、抽出色判定部486において、登録色判定部484で非登録色と判定された抽出色が、円柱領域に含まれるか否かを判定する処理を実行する。さらに、属性判定部491において、円柱領域に抽出色が含まれると判定された場合、その登録色に対応して設定された属性を、抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定する処理を実行する。なお、登録色更新処理部489は、拡張登録色領域設定部485において設定された色領域(円柱)に含まれる色値を新たな登録色として追加設定する登録色更新処理を実行する。
さらに、(2.3)マーカーペンの交換に対応した処理例2(異なる色への交換)を実行する処理例では、抽出色カウント部487において、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行し、カウント数検証部488において、マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行する。さらに、登録色更新処理部489において、カウント数検証ステップで抽出予定数未満のマーカー色と、登録色判定部484で検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、その非登録色が、抽出予定数未満のマーカー色を変更後のマーカー色であると判断し、登録色の更新を実行し、属性判定部491において、登録色更新処理部489で新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定する処理を実行する。
なお、図12に示す構成は、上述した各処理例、すなわち、
(2.1)マーカーペンの変色に対応した処理例
(2.2)マーカーペンの交換に対応した処理例1(同一系色への交換)
(2.3)マーカーペンの交換に対応した処理例2(異なる色への交換)
これらをすべて実行可能な構成例として示したが、上記3種の処理の1つの処理のみを実行する構成としてもよい。
最後に、図13を参照して、本発明の情報処理装置のハードウェア構成例について説明する。図13に示す構成は、例えばPCなどによって構成される情報処理装置であり、スキャナ等のデータ読み取り部531と、プリンタなどのデータ出力部532を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)501は、上述の実施例において説明した図5、図8、図11の各フローチャートに従った各種のデータ処理、すなわち、例えばOCR処理、色領域抽出処理、拡張登録色領域設定処理、抽出色判定処理、抽出色カウントおよびカウント数検証処理、登録色更新処理、属性登録処理等の各処理の実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行するデータ処理部である。
ROM(Read Only Memory)502は、CPU501が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)503は、CPU501の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス504により相互に接続されている。
ホストバス504は、ブリッジ505を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス506に接続されている。
キーボード508、ポインティングデバイス509は、ユーザにより操作される入力デバイスである。ディスプレイ510は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)511は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU501によって実行するプログラムや情報を記録または再生させる。ハードディスクは、ドキュメントとしての原本ドキュメントや、マーカー色による追記のなされた追記ドキュメント、マーカー色と属性との対応関係テーブル、属性辞書などを格納する。さらに、各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ512は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体521に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース507、外部バス506、ブリッジ505、およびホストバス504を介して接続されているRAM503に供給する。リムーバブル記録媒体521も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート514は、外部接続機器522を接続するポートであり、USB,IEEE1394等の接続部を持つ。接続ポート514は、インタフェース507、および外部バス506、ブリッジ505、ホストバス504等を介してCPU501等に接続されている。通信部515は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部531は、ドキュメントの読み取り処理を実行し、データ出力部532は、ドキュメントデータの出力処理を実行する。
なお、図13に示す情報処理装置のハードウェア構成例は、1つの装置例を示すものであり、本発明の情報処理装置は、図13に示す構成に限らず、上述した実施例において説明した処理を実行可能な構成であればよい。
以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。
なお、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。
例えば、プログラムは記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。あるいは、プログラムはフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することができる。
なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。
なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
以上、説明したように、本発明の一実施例構成によれば、例えば、文書ドキュメントに対するマーカーペンによる文字列抽出/属性付与処理、すなわち、色マーカーによる追記のなされた追記ドキュメントからマーカー色を解析して、マーカー色に基づくドキュメント情報の属性判定処理を実行する構成において、マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定し、非登録色と判定された抽出色が、拡張登録色領域に含まれる場合に、登録色に対応して設定された属性を、抽出色のマーカー色追記領域に含まれるデータ対応の属性として設定する構成としたので、例えばマーカーペンの経時的な色変化、あるいはペンの交換などが実行された場合でも、的確な色判定に基づく属性付与が可能となる。
また、本発明の一実施例構成によれば、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを行い、予め各マーカー色に対応する抽出予定数との比較を実行して、抽出予定数未満のマーカー色を変更後のマーカー色を判断し、この判断情報に基づいて登録色の更新を実行する構成としたので、オペレータによる登録色更新処理を行なうことなく自動的な更新が可能となり、効率的な処理が実現される。
マーカーペンによる文字列抽出/属性付与処理の一般的処理例について説明する図である。 マーカーペンによる文字列抽出/属性付与処理の具体的処理例について説明する図である。 オペレータの利用するマーカーペンの色の変化が発生する具体的例について説明する図である。 本発明の情報処理装置の実行する色解析処理例の一実施例について説明する図である。 本発明の情報処理装置における処理例について説明するフローチャートを示す図である。 本発明の情報処理装置におけるマーカーペンの交換に対応した処理例について説明する図である。 本発明の情報処理装置において実行するペン交換が発生した場合でも正しい色判定に基づく属性設定を可能とした処理例について説明する図である。 本発明の情報処理装置における処理例について説明するフローチャートを示す図である。 本発明の情報処理装置におけるマーカーペンの交換に対応した処理例2について説明する図である。 本発明の情報処理装置において実行するマーカーペンの交換に対応した処理例2の具体例について説明する図である。 本発明の情報処理装置における処理例について説明するフローチャートを示す図である。 本発明の情報処理装置の機能構成例について説明するブロック図である。 本発明の情報処理装置のハードウェア構成例について説明する図である。
符号の説明
11 原本ドキュメント
21 追記ドキュメント
51 情報処理装置
52 プリンタ
53 スキャナ
54 データベース
71 マーカー色属性対応テーブル
72 解析データ
100 追記ドキュメント
101〜104 マーカー色追記領域
201〜203 マーカー色追記領域
221〜223 マーカー色追記領域
271〜275 色値
281〜283 円錐領域
291〜293 近似曲線
301〜303 マーカー色追記領域
321 近似曲線
322 円柱領域
331〜333 色値
410,420 追記ドキュメント
411,421 マーカー色追記領域
415,425 マーカー色と属性の対応テーブル
450 色空間
451〜454 色領域
471 非登録色対応色値
481 画像入力部
482 文字認識処理部
483 色領域抽出部
484 登録色判定部
485 拡張登録色領域設定部
486 抽出色判定部
487 抽出色カウント部
488 カウント数検証部
489 登録更新処理部
490 更新情報記録部
491 属性判定部
492 データ登録部
501 CPU(Central Processing Unit)
502 ROM(Read-Only-Memory)
503 RAM(Random Access Memory)
504 ホストバス
505 ブリッジ
506 外部バス
507 インタフェース
508 キーボード
509 ポインティングデバイス
510 ディスプレイ
511 HDD(Hard Disk Drive)
512 ドライブ
514 接続ポート
515 通信部
521 リムーバブル記録媒体
522 外部接続機器
531 データ読み取り部
532 データ出力部

Claims (16)

  1. ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理装置であり、
    ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出部と、
    前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定部と、
    マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定する拡張登録色領域設定部と、
    前記登録色判定部において非登録色と判定された抽出色が、前記拡張登録色領域に含まれるか否かを判定する抽出色判定部と、
    前記抽出色判定部において、前記抽出色が前記拡張登録色領域に含まれると判定された場合、その登録色に対応して設定された属性を、前記抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定する属性判定部と、
    前記拡張登録色領域設定部において設定された色領域に含まれる色値を新たな登録色として追加設定する登録色更新処理部と、
    を有することを特徴とする情報処理装置。
  2. 前記拡張登録色領域設定部は、
    解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線上に前回の抽出色の色値データに基づく射影点を設定し、該射影点を頂点とする円錐領域を登録色に対応する拡張登録色領域として設定する処理を実行する構成であり、
    抽出色判定部は、
    前記登録色判定部において非登録色と判定された抽出色が、前記円錐領域に含まれるか否かを判定する処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。
  3. 前記拡張登録色領域設定部は、
    前回の抽出色の色値に対応する近似曲線上の近傍点を頂点とし、近似曲線を含み色値履歴の新しい方向に広がりを設定した円錐領域を拡張登録色領域として設定する処理を実行する構成であることを特徴とする請求項2に記載の情報処理装置。
  4. 前記拡張登録色領域設定部は、
    予め設定した半径rと、高さlの円錐領域を拡張登録色領域として設定する処理を実行する構成であることを特徴とする請求項3に記載の情報処理装置。
  5. 前記拡張登録色領域設定部は、
    解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線を中心軸とする円柱領域を設定し、該円柱領域を登録色に対応する拡張登録色領域として設定する処理を実行する構成であり、
    抽出色判定部は、
    前記登録色判定部において非登録色と判定された抽出色が、前記円柱領域に含まれるか否かを判定する処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。
  6. 前記拡張登録色領域設定部は、
    予め設定した半径rの円柱領域を拡張登録色領域として設定する処理を実行する構成であることを特徴とする請求項5に記載の情報処理装置。
  7. ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理装置であり、
    ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出部と、
    前記色領域抽出部において抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定部と、
    同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行する抽出色カウント部と、
    前記マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行するカウント数検証部と、
    前記カウント数検証部において、抽出予定数未満のマーカー色と、前記登録色判定部において検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、該非登録色を、抽出予定数未満のマーカー色の変更後のマーカー色であると判断し、登録色の更新を実行する登録色更新処理部と、
    前記登録色更新処理部において新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定する属性判定部と、
    を有することを特徴とする情報処理装置。
  8. 情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理方法であり、
    色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出ステップと、
    登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定ステップと、
    拡張登録色領域設定部において、マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定する拡張登録色領域設定ステップと、
    抽出色判定部において、前記登録色判定ステップで非登録色と判定された抽出色が、前記拡張登録色領域に含まれるか否かを判定する抽出色判定ステップと、
    属性判定部において、前記抽出色判定ステップで前記抽出色が前記拡張登録色領域に含まれると判定された場合、その登録色に対応して設定された属性を、前記抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定する属性判定ステップと、
    登録色更新処理部において、前記拡張登録色領域設定ステップで設定された色領域に含まれる色値を新たな登録色として追加設定する登録色更新処理ステップと、
    を有することを特徴とする情報処理方法。
  9. 前記拡張登録色領域設定ステップは、
    解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線上に前回の抽出色の色値データに基づく射影点を設定し、該射影点を頂点とする円錐領域を登録色に対応する拡張登録色領域として設定する処理を実行するステップであり、
    抽出色判定ステップは、
    前記登録色判定ステップにおいて非登録色と判定された抽出色が、前記円錐領域に含まれるか否かを判定する処理を実行するステップであることを特徴とする請求項8に記載の情報処理方法。
  10. 前記拡張登録色領域設定ステップは、
    前回の抽出色の色値に対応する近似曲線上の近傍点を頂点とし、近似曲線を含み色値履歴の新しい方向に広がりを設定した円錐領域を拡張登録色領域として設定する処理を実行するステップであることを特徴とする請求項9に記載の情報処理方法。
  11. 前記拡張登録色領域設定ステップは、
    予め設定した半径rと、高さlの円錐領域を拡張登録色領域として設定する処理を実行するステップであることを特徴とする請求項10に記載の情報処理方法。
  12. 前記拡張登録色領域設定ステップは、
    解析済みドキュメントのマーカー色の色空間上における色値の複数の履歴点に基づいて近似曲線を生成し、生成した近似曲線を中心軸とする円柱領域を設定し、該円柱領域を登録色に対応する拡張登録色領域として設定する処理を実行するステップであり、
    抽出色判定ステップは、
    前記登録色判定ステップで非登録色と判定された抽出色が、前記円柱領域に含まれるか否かを判定する処理を実行するステップであることを特徴とする請求項8に記載の情報処理方法。
  13. 前記拡張登録色領域設定ステップは、
    予め設定した半径rの円柱領域を拡張登録色領域として設定する処理を実行するステップであることを特徴とする請求項12に記載の情報処理方法。
  14. 情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行する情報処理方法であり、
    色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得する色領域抽出ステップと、
    登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別する登録色判定ステップと、
    抽出色カウント部において、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行する抽出色カウントステップと、
    カウント数検証部において、前記マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行するカウント数検証ステップと、
    登録色更新処理部において、前記カウント数検証ステップで抽出予定数未満のマーカー色と、前記登録色判定ステップで検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、該非登録色を、抽出予定数未満のマーカー色を変更後のマーカー色であると判断し、登録色の更新を実行する登録色更新処理ステップと、
    属性判定部において、前記登録色更新処理ステップで新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定する属性判定ステップと、
    を有することを特徴とする情報処理方法。
  15. 情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行させるコンピュータ・プログラムであり、
    色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得させる色領域抽出ステップと、
    登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別させる登録色判定ステップと、
    拡張登録色領域設定部において、マーカー色解析済みドキュメントにおける解析色情報の履歴に基づいて、登録色に対応する拡張登録色領域を設定させる拡張登録色領域設定ステップと、
    抽出色判定部において、前記登録色判定ステップで非登録色と判定された抽出色が、前記拡張登録色領域に含まれるか否かを判定させる抽出色判定ステップと、
    属性判定部において、前記抽出色判定ステップで前記抽出色が前記拡張登録色領域に含まれると判定された場合、その登録色に対応して設定された属性を、前記抽出色のマーカー色追記領域に含まれるデータに対応する属性として決定させる属性判定ステップと、
    登録色更新処理部において、前記拡張登録色領域設定ステップで設定された色領域に含まれる色値を新たな登録色として追加設定させる登録色更新処理ステップと、
    を実行させることを特徴とするコンピュータ・プログラム。
  16. 情報処理装置において、ドキュメントに追記されたマーカー色に基づくドキュメント情報の属性判定処理を実行させるコンピュータ・プログラムであり、
    色領域抽出部において、ドキュメントに対してマーカー色を追記した追記ドキュメントを入力し、追記ドキュメント上のマーカー色追記領域の色情報を取得させる色領域抽出ステップと、
    登録色判定部において、前記色領域抽出ステップで抽出された色領域に含まれる色について、予め追記マーカー色として登録された登録色であるか非登録色であるかを判別させる登録色判定ステップと、
    抽出色カウント部において、同一属性の対応色と判定されるマーカー色各々の抽出数のカウントを実行させる抽出色カウントステップと、
    カウント数検証部において、前記マーカー色各々の抽出数と、予め各マーカー色に対応する抽出予定数との比較を実行させるカウント数検証ステップと、
    登録色更新処理部において、前記カウント数検証ステップで抽出予定数未満のマーカー色と、前記登録色判定ステップで検出された非登録色の抽出カウントとの加算結果が、抽出予定数未満のマーカー色の抽出予定数であることを条件として、該非登録色を、抽出予定数未満のマーカー色を変更後のマーカー色であると判断し、登録色の更新を実行させる登録色更新処理ステップと、
    属性判定部において、前記登録色更新処理ステップで新たに登録色として判断された色領域を旧登録色に対応して設定された属性として、該色領域に含まれるデータに対応する属性として決定させる属性判定ステップと、
    を実行させることを特徴とするコンピュータ・プログラム。
JP2006124843A 2006-04-28 2006-04-28 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム Expired - Fee Related JP4697035B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006124843A JP4697035B2 (ja) 2006-04-28 2006-04-28 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006124843A JP4697035B2 (ja) 2006-04-28 2006-04-28 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2007299094A JP2007299094A (ja) 2007-11-15
JP4697035B2 true JP4697035B2 (ja) 2011-06-08

Family

ID=38768548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006124843A Expired - Fee Related JP4697035B2 (ja) 2006-04-28 2006-04-28 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP4697035B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5200786B2 (ja) * 2008-09-09 2013-06-05 富士ゼロックス株式会社 差分抽出装置及び差分抽出プログラム
JP4792117B2 (ja) * 2010-03-15 2011-10-12 株式会社東芝 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
CN112306418B (zh) * 2020-11-09 2022-10-21 中国船舶重工集团公司第七0七研究所九江分部 一种VxWorks环境下基于RawFS的数据记录方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007219682A (ja) * 2006-02-15 2007-08-30 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2007233900A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2007286711A (ja) * 2006-04-13 2007-11-01 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2007286710A (ja) * 2006-04-13 2007-11-01 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0771186B2 (ja) * 1989-12-27 1995-07-31 富士ゼロックス株式会社 画像記録装置
JPH06284270A (ja) * 1993-03-29 1994-10-07 Toshiba Corp 画像形成装置
JPH07322009A (ja) * 1994-05-25 1995-12-08 Fuji Xerox Co Ltd 画像処理装置
JP3595579B2 (ja) * 1994-08-26 2004-12-02 キヤノン株式会社 画像処理装置及び画像処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007219682A (ja) * 2006-02-15 2007-08-30 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2007233900A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2007286711A (ja) * 2006-04-13 2007-11-01 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2007286710A (ja) * 2006-04-13 2007-11-01 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム

Also Published As

Publication number Publication date
JP2007299094A (ja) 2007-11-15

Similar Documents

Publication Publication Date Title
JP4631749B2 (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
US20070214173A1 (en) Program, method, and apparatus for supporting creation of business process model diagram
JP4591229B2 (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP4697035B2 (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
CN106557775B (zh) 图像处理装置和图像处理方法
JP4692316B2 (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP4894378B2 (ja) 画像処理システムおよび画像処理プログラム
US20140152668A1 (en) Information processing apparatus and method and non-transitory computer readable medium
JP2007286711A (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2007286710A (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2007219682A (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2004199529A (ja) 帳票認識装置および帳票認識方法
JP4692315B2 (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP2019153230A (ja) 情報処理装置及び情報処理プログラム
US11606469B2 (en) Image processing system that computerizes document, control method thereof, and storage medium
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP6303531B2 (ja) 画像処理装置及び画像処理プログラム
US11481544B2 (en) Form processing apparatus and non-transitory computer readable medium
JP2006134079A (ja) 画像処理装置及びプログラム
US11574490B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JP2013058168A (ja) 情報処理装置及び情報処理プログラム
JP6497012B2 (ja) 情報処理装置及び情報処理プログラム
JP2010128894A (ja) データベース生成装置、データベース生成方法及びコンピュータプログラム
JP2023170192A (ja) 情報処理装置、及び情報処理プログラム
JP2023128597A (ja) 文字同定支援プログラム、文字同定支援方法、および情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110214

R150 Certificate of patent or registration of utility model

Ref document number: 4697035

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees