JP2021068289A

JP2021068289A - 画像処理装置、情報処理方法及びプログラム

Info

Publication number: JP2021068289A
Application number: JP2019194478A
Authority: JP
Inventors: 航也島村; Koya Shimamura
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2019-10-25
Filing date: 2019-10-25
Publication date: 2021-04-30

Abstract

【課題】検索対象である文書ファイルに統制された文言のメタデータを付与する技術を提供する。【解決手段】画像形成装置は、取得した原稿画像に対して文字認識処理を行い、文字認識結果を用いて原稿内に記載されている項目とその値をメタデータの候補として抽出する。そして、メタデータ候補を文字列正規化データベースにより正規化し、作成したファイルに付与する。【選択図】図３

Description

本発明は、画像処理装置、情報処理方法及びプログラムに関する。

帳票等の紙文書を画像読み取り装置でスキャンしてデジタル化しストレージに格納する業務フローが存在し、また、デジタル化した文書ファイルを後で利用する際に、格納されたファイルを探すことがある。格納されたファイルをストレージ内から探す際、フォルダを開き、ファイルをひとつずつ開いて探す作業を人手で行うことは大きな負荷となる。
そこで解決する手法として、ファイルにメタデータを付加し、ユーザが入力する検索キーワードから、そのメタデータを用いてファイルの検索を行う手法がある。メタデータとは、ファイル内に記載された内容に関する代表情報及び付帯情報が記載されたデータのことである。より具体的には、メタデータの構成として、抽出項目とその値が対で定義されている。抽出項目とはデータの意味を指す「キー項目」（以下、項目という）で、値とはキー項目に対応する具体的な内容を示す「バリュー値」（以下、値という）を指す。

ファイルにメタデータを付加する際、ファイル内に記載された文言をそのまま付与してしまうと、表記ばらつきによって本質的には同じ意味を指す文言であっても異なる表記でメタデータに付与される場合がある。この場合、検索時に文言が一致せず検索性が低下してしまう可能性がある。また、検索時に用いる検索キーワードも同様に検索者が使用する入力キーワードばらつきによって文言が一致せず検索性が低下してしまう可能性がある。
そこで、あいまい検索技術では同義語辞書又は類義語を持ち、検索時に用いる検索キーワード及び、その同義語すべてで検索する手法がある。その他、特許文献１では、同義語辞書の代わりに、過去にメタデータを付与した類似文書をストレージ内から検索し、類似文書に付与したメタデータを追加付与することにより解決する方法が提案されている。
しかし、すべての同義語・類義語で検索をそれぞれ行ったり、類似文書を検索したりするため、多くの時間を費やしてしまうという課題がある。
これを解決する手法として、特許文献２の手法がある。この手法では、画像検索時に、検索キーワードの同義語及び類義語辞書を用いて統制されたキーワードに正規化し検索を行うことが提案されている。これにより、あいまい検索時の時間が多くかかる課題は解決可能である。

特開２００６−３３８１１４号公報特開２０１１−５３７８１号公報

特許文献２の手法の場合、検索に用いる検索キーワードについては正規化される。一方、検索対象である付与されたメタデータは画像検索に用いるため画像特徴量から一意に決まるため、正規化する必要がないため、正規化されていない。一方、文書検索の場合、文書内に記載されている内容も表記ばらつきしているため、そのままメタデータ化してしまうと検索対象である付与されたメタデータもばらついてしまうため、検索キーワードを正規化したとしても、網羅的に検索できない課題がある。

本発明は、画像に対して文字認識処理を行う文字認識手段と、文字認識結果からメタデータを抽出する抽出手段と、前記メタデータを正規化する正規化手段と、を有することを特徴とする。

本発明によれば、網羅的に検索可能とすることができる。

画像処理システムのシステム構成の一例を示す図である。画像形成装置のハードウェア構成の一例を示す図である。画像形成装置が実行する情報処理の一例を示すフローチャートである。ＯＣＲ関連処理を実行する情報処理の一例を示すフローチャートである。メタデータ抽出処理の例を示す図である。メタデータの値を正規化する情報処理の一例を示すフローチャートである。文字列正規化データベースの一例を示す図である。正規化の一例を示す図である。ファイルの検索を実行する情報処理の一例を示すフローチャートである。変形例１の画像形成装置が実行する情報処理の一例を示すフローチャートである。変形例２の画像形成装置が実行する情報処理の一例を示すフローチャートである。変形例３の文字列正規化データベースの一例を示す図である。

以下、本発明の実施形態について図面に基づいて説明する。

＜実施形態１＞
（システム構成）
図１は、画像処理システムのシステム構成の一例を示す図である。図１に示すように、画像形成装置１００はＬＡＮ１０２に接続され、Ｉｎｔｅｒｎｅｔ１０３等を介してＰＣ等の端末１０１等と通信可能になっている。なお、本実施形態の実現にあたっては、ＰＣ等の端末１０１に関しては、必ずしも必要なくてもよく、画像形成装置１００のみの構成だけでもよい。画像形成装置１００は画像処理装置の一例である。
画像形成装置１００は、表示操作部、スキャナ部及び、プリンタ部を有する複合機（ＭＦＰ）であり、スキャナ部を用いて文書原稿をスキャンするスキャン端末として利用することが可能である。また、画像形成装置１００は、タッチパネル、又はハードボタン等の表示操作部を有し、メタデータの付与内容を表示したり、ユーザからの指示を受け付けたりするためのユーザインタフェースの表示を行ったりする。

なお、本実施形態では、画像形成装置１００単体で、スキャン処理、ＯＣＲ関連処理、メタデータ選択処理、メタデータ付与処理、ファイル送信を行う例について説明するが、その一部を他の端末１０１で行うように構成したシステムであってもよい。例えば、まず、スキャン処理とファイル分割処理とを画像形成装置１００で実行して、スキャン画像を他の端末１０１にネットワークを介して送信する。そして、他の端末１０１においてＯＣＲ関連処理及びメタデータ選択処理を実行し、付与するメタデータを画像形成装置１００に返信して、画像形成装置でファイルを生成及びメタデータ付与処理をしてファイル送信をしてもよい。

（画像形成装置１００のハードウェア構成）
図２は、画像形成装置１００のハードウェア構成の一例を示す図である。制御部１１０では、ＣＰＵ１１１、記憶装置１１２（ＲＯＭ１１８、ＲＡＭ１１９、ＨＤＤ１２０）、プリンタＩ／Ｆ部１１３、ネットワークＩ／Ｆ部１１４、スキャナＩ／Ｆ部１１５、表示操作Ｉ／Ｆ部１１６がシステムバス１１７を介して互いに通信可能に接続されている。制御部１１０は、画像形成装置１００全体の動作を制御する。
ＣＰＵ１１１は、記憶装置１１２に記憶された制御プログラムを読み出し実行することにより、後述の図３、図４、図６、図９−図１１のフローチャートにおける各処理（読取制御、画像処理、表示制御等）を実行する。記憶装置１１２は、プログラム、画像データ、メタデータ、設定データ及び、処理結果データ等を格納し保持する。
記憶装置１１２には、不揮発性メモリであるＲＯＭ１１８、揮発性メモリであるＲＡＭ１１９及び、大容量記憶領域であるＨＤＤ１２０等がある。
ＲＯＭ１１８は、制御プログラム等を保持する不揮発性メモリであり、ＣＰＵ１１１はその制御プログラムを読み出し、処理を実行することによって画像形成装置１００の制御を行う。
ＲＡＭ１１９は、ＣＰＵ１１１の主メモリ、ワークエリア等の一時記憶領域として用いられる揮発性メモリである。

ネットワークＩ／Ｆ部１１４は、制御部１１０又は画像形成装置１００を、システムバス１１７を介してＬＡＮ１０２に接続する。
ネットワークＩ／Ｆ部１１４は、ＬＡＮ１０２上の外部装置に画像データを送信したり、ＬＡＮ１０２上の外部装置から各種情報を受信したりする。
スキャナＩ／Ｆ部１１５は、スキャナ部１２２と制御部１１０とを、システムバス１１７を介して接続する。スキャナ部１２２は、文書原稿を読み取ってスキャン画像データを生成し、スキャナＩ／Ｆ部１１５を介してスキャン画像データを制御部１１０に入力する。
表示操作部Ｉ／Ｆ部１１６は、表示操作部１２３と制御部１１０とを、システムバス１１７を介して接続する。表示操作部１２３には、タッチパネル機能を有する液晶表示部及びハードボタン等が備えられている。
プリンタＩ／Ｆ部１１３は、プリンタ部１２１と制御部１１０とを、システムバス１１７を介して接続する。プリンタ部１２１は、ＣＰＵ１１１で生成された画像データをプリンタＩ／Ｆ部１１３を介して受信し、受信した画像データを用いて記録紙へのプリント処理を行う。
以上のように、本実施形態に係る画像形成装置１００では、上記のハードウェア構成によって、画像処理機能を提供することができる。

（フローチャートを用いた本実施形態の詳細説明）
本実施形態では、画像形成装置１００が文書原稿を読み取り、ファイルに付与するメタデータの取得のため、ＯＣＲ処理を行う。そして、ＯＣＲ結果を基にファイルに付与するメタデータ候補を取得する。取得したメタデータの候補を基にメタデータの文字列を正規化処理し、作成したファイルに付与を行う。付与されたメタデータに対し、ユーザによる確認及び修正処理が終わると、ファイルの送信を行う。ＯＣＲ処理は、文字認識処理の一例である。また、ＯＣＲ結果は、文字認識結果の一例である。
図３は、画像形成装置１００が実行する情報処理の一例を示すフローチャートである。
表示操作部１２３からユーザの指示を受け付けると、ステップＳ３０１において、スキャナ部１２２は、原稿フィーダ又は原稿台から文書原稿を読み取る。ＣＰＵ１１１は、スキャナ部１２２より画像データを取得する。

ステップＳ３０２において、ＣＰＵ１１１は、ステップＳ３０１で取得した画像に対して、ＯＣＲ関連処理を実行する。ＯＣＲ関連処理の詳細については後述する。
ステップＳ３０３において、ＣＰＵ１１１は、ステップＳ３０２で行ったＯＣＲ結果から抽出項目及び抽出値の取得処理を実行する。抽出項目及び抽出値の取得処理の詳細については後述する。
ステップＳ３０４において、ＣＰＵ１１１は、ステップＳ３０３で取得した抽出項目及び抽出値から付与するメタデータの候補を決定する。付与するメタデータ候補決定の詳細については後述する。
ステップＳ３０５において、ＣＰＵ１１１は、ステップＳ３０４で決定したメタデータの候補文字列を、事前にＨＤＤ１２０に保持された文字列正規化データベースを用いて正規化変換処理を行う。メタデータの正規化処理の詳細については後述する。

ステップＳ３０６において、ＣＰＵ１１１は、ステップＳ３０１で取得した画像からファイルを作成する。本実施形態ではＰＤＦ（ＰｏｒｔａｂｌｅＤｏｃｕｍｅｎｔＦｏｒｍａｔ）化の例を示す。
ステップＳ３０７において、ＣＰＵ１１１は、ステップＳ３０６で作成したＰＤＦファイルに対し、Ｓ３０５で決定されたメタデータをファイルに付与する。ＰＤＦファイルには、ＸＭＬ形式の文書メタデータを設定することができる。付与するメタデータには、作成者氏名、著作権情報、作成日時といった一般的なファイルに付与されている情報が含まれている。これに加えて、キーワードという任意の情報を付与することができる。なお、それらの情報は検索ユーティリティで使用することが可能である。また、本実施形態では作成したＰＤＦファイルに対しメタデータを付与する例を示すが、本実施形態はこれに限定されるものではない。ＰＤＦファイルと異なるデータとして別にメタデータのテキスト情報を保持し、クラウドストレージ等に送信する場合には、ファイルとは別に設定することもできる。
ステップＳ３０８において、ＣＰＵ１１１は、ステップＳ３０７で作成したファイルを、ＬＡＮ１０２を通じて送信先に送信する。

（ＯＣＲ関連処理（Ｓ３０２）の詳細説明）
ＯＣＲ関連処理の詳細について、図４を用いて説明する。図４は、画像データ一枚に対して、ＯＣＲとその前処理を含めたＯＣＲ関連処理を実行する情報処理の一例を示すフローチャートである。
ステップＳ４０１において、ＣＰＵ１１１は、画像データから傾きの角度を検出し、検出した傾きだけ逆方向に画像を回転することで、傾きを補正した画像データを取得する。傾き補正の対象となる傾きとは、スキャナ部１２２による読み取り時に、原稿フィーダ内のローラの摩耗等が原因でまっすぐに原稿が読み取られなかったり、原稿の印刷時にまっすぐ印字できなかったりするような傾きである。傾き検出では、ＣＰＵ１１１は、画像データ内に含まれるオブジェクトを検出し、水平方向又は鉛直方向に隣り合うオブジェクト群を連結する。ＣＰＵ１１１は、連結されたオブジェクトの中心位置を結んだ角度が、水平方向又は鉛直方向からどれだけ傾いているかを取得することで傾きを求める。なお、傾き検出は上記の方法に限るものではない。例えば、ＣＰＵ１１１は、画像データ内に含まれるオブジェクトの中心座標を取得し、０．１度単位で中心座標群を回転させながら、中心座標群が水平方向又は垂直方向に並ぶ割合がもっとも高い角度を傾きとして求めてもよい。この傾き補正によって、画像の傾きを補正することで、後述する回転補正及びブロックセレクション処理、ＯＣＲのそれぞれの処理精度を上げることができる。

ステップＳ４０２において、ＣＰＵ１１１は、ステップＳ４０１で取得した傾き補正後の画像に対して、原稿内の文字が正立する向きになるように、９０度単位で画像を回転補正した画像を得る。ＣＰＵ１１１は、ステップＳ４０１で取得した傾き補正後の画像を基準画像として、基準画像と９０回転した画像、１８０度回転した画像、２７０度回転した画像の４枚の画像を用意する。そして、ＣＰＵ１１１は、それぞれの画像に対し、高速処理可能な簡易的なＯＣＲ処理を実行して、一定値以上の確信度を持って認識された文字の数が最も多い画像を回転補正後画像として取得する。なお、回転補正の方法は上記に限るものではない。
ステップＳ４０３において、ＣＰＵ１１１は、ステップＳ４０２で取得した回転補正後画像に対し、ブロックセレクション処理を実行する。ブロックセレクション処理とは、画像を前景領域と背景領域に分類した上で、前景領域をテキストブロック及びそれ以外のブロックに分割する判定処理である。ＣＰＵ１１１は、白黒に二値化された画像を基に、領域ごとに文字領域（ＴＥＸＴ）、線領域（ＬＩＮＥ）、表領域（ＴＡＢＬＥ）、写真領域（ＰＨＯＴＯ）、図画領域（ＰＩＣＴＵＲＥ）を決定する。得られた文字領域（ＴＥＸＴ）のブロック情報は、後述のＯＣＲ処理で用いられる。
ステップＳ４０４において、ＣＰＵ１１１は、ステップＳ４０３で取得したテキストブロックに対してＯＣＲを実行し、各テキストブロックに対応する文字列を結果として取得する。

（抽出項目及び抽出値の取得処理（Ｓ３０３）の詳細説明）
抽出項目及び抽出値の取得処理の詳細について説明する。抽出項目及び抽出値の取得処理は、ＣＰＵ１１１が、ＯＣＲ関連処理（Ｓ３０２）で取得したＯＣＲ結果を用いて、原稿内に記載されている項目とその値を取得する。ここで、項目とはデータの意味を指す「キー項目」を指す。値とは、それに対応する具体的な内容を示す「バリュー値」を指す。また、抽出項目及び抽出値が対になったデータのことをメタデータと呼ぶ。図５（Ａ）（Ｂ）を用いて具体的に説明する。図５（Ａ）は、請求書等の帳票原稿の例である。図５（Ｂ）は、請求書等の帳票原稿から情報取得する領域を示した例である。例えば、ＣＰＵ１１１は、図５（Ｂ）５０２に示すように項目「請求先会社名」という項目に対し、具体的な情報として会社名である「ＡＢＣ（株）」を取得する。その他、ＣＰＵ１１１は、図５（Ｂ）５０３に示すように項目「請求元会社名」に対し「株式会社あいう」及び、図５（Ｂ）５０５に示すように「請求番号」に対し「１２３４」をそれぞれ取得する。抽出項目及び抽出値の取得処理の方法は様々あるが、例えば、ＣＰＵ１１１は、取得したい項目の項目名を保持しておき、ＯＣＲ結果で保持している項目名と一致していることを見つけた場合、その文字列が記載されたブロックセレクション処理結果から座標値を取得する。ＣＰＵ１１１は、項目を取得した文字領域ブロックに最も近い右側、下側領域、右下側領域の文字ブロックのＯＣＲ結果を取得することで抽出項目及び抽出値の取得処理が可能である。また、項目名が記載されていない場合には、ＣＰＵ１１１は、文字列のパターンから推定することもできる。例えば、図５（Ｂ）５０４に示すように日付を示す「２０１９年４月１日」の場合、ＣＰＵ１１１は、推定によって「ＹＹＹＹ年Ｍ月Ｄ日」の並びパターンになっていることを正規表現等の手法で推定する。その結果、ＣＰＵ１１１は、項目「（請求）日付」に対し「２０１９年４月１日」と判定することもできる。その他、ＣＰＵ１１１は、文字位置の情報及びフォントサイズの情報を基に、判定できるものもある。具体的には、文字位置の情報で画像の上部にあり、フォントサイズの情報で周囲の文字よりも大きい場合には、ＣＰＵ１１１は、書類名と推定し、図５（Ｂ）５０１に示すように項目「書類名」は「請求明細書」と判定することもできる。具体的に取得する内容としては、書類名情報、会社名情報、会社の電話番号、住所等の情報、担当者又は作成者等の個人特定情報、請求日又は納品日等の日付情報、請求書ナンバー等の独自のナンバー情報、件名又は案件名情報、その他内訳等の詳細情報がある。その他にも様々な手法は様々あるが、ＯＣＲ結果から抽出項目及び抽出値の取得できるものであればよい。

（付与するメタデータ候補決定（Ｓ３０４）の詳細説明）
付与するメタデータ候補決定の詳細について説明する。付与するメタデータ候補決定は、ＣＰＵ１１１が、抽出項目及び抽出値の取得処理（Ｓ３０３）で取得した抽出項目及び抽出値の情報から、付与すべきメタデータの選定を行う。
取得された項目及び値の中から、メタデータとして設定する項目を選定する項目については、事前にユーザがファイルを後で検索するために付与するメタデータを設定できる。その他にも、自動的にシステムが設定することもできる。具体的には、ＣＰＵ１１１は、抽出項目及び抽出値の取得処理（Ｓ３０３）で取得した情報から、設定に応じて、例えば、書類名情報と請求元会社名情報、請求先会社名情報、請求番号情報、請求日付情報を選定し、その項目と値を取得する。

（メタデータの正規化処理（Ｓ３０５）の詳細説明）
メタデータの正規化処理の詳細について、図６を用いて説明する。図６は、付与するメタデータ候補決定Ｓ３０４で決定したメタデータの値を正規化する情報処理の一例を示すフローチャートである。
ステップＳ６０１において、ＣＰＵ１１１は、付与メタデータの値に設定されている文字列を取得する。
ステップＳ６０２において、ＣＰＵ１１１は、文字列正規化データベースから対応する値データを検索する。文字列正規化データベースは、抽出した候補バリュー値を正規化された値に変換するための辞書のことである。文字列正規化データベースの例を図７に示す。文字列正規化データベースには、情報として通し番号を示す（Ｎｏ．）６１０、区分６１１、候補バリュー値６１２、正規化値６１３が収録されている。ＣＰＵ１１１は、ステップＳ６０１において取得したバリュー値を、文字列正規化データベースの候補バリュー値６１２内から検索を行う。図５（Ｂ）の例で具体例を説明する。書類名情報は、項目「書類名」に対し値は５０１で記載された「請求明細書」が取得されている。「請求明細書」の文言を６１２から検索すると、Ｎｏ．１の６２０に記載されていることがわかる。項目「請求元会社名」、「請求先会社名」では会社の種類を示す「株式会社」を示す文言はそれぞれ５０２が「＊＊（株）」、５０３「株式会社＊＊」となっている。この記載を６１２から検索すると、Ｎｏ．１００のそれぞれ６２１、６２２に記載されていることがわかる。項目「請求日付」では日付の記載が５０４の「２０１９年４月１日」となっている。この記載を６１２から検索すると、Ｎｏ．２００の６２３に記載されていることがわかる。なお、日付については、独自の記載方法もあり、例えば元号で記載された年の情報を西暦に変換する処理を行ったうえで検索を行うこともできる。

ステップＳ６０３において、ＣＰＵ１１１は、文字列正規化データベースから正規化値を取得する。ステップＳ６０２において検索した値に対応する正規化値６１３を取得する。この処理にて、それぞれ正規化値を取得する。具体的には、「請求明細書」は「請求書」、「ＡＢＣ（株）」は「ＡＢＣ株式会社」、「株式会社あいう」は「株式会社あいう（変更なし）」、「２０１９年４月１日」に「２０１９０４０１」にそれぞれ正規化変換される。
ステップＳ６０４において、ＣＰＵ１１１は、付与メタデータの値を設定する。ステップＳ６０３で正規化された結果を最終的に付与するメタデータとして設定を行う。
ステップＳ６０１からステップＳ６０４までの処理で、図５（Ｂ）の結果を処理した結果を図８に示す。それぞれ取得された値が変換されていることがわかる。
以上、ステップＳ３０１からステップＳ３０８までの処理を行うことで、文書内に記載されている文言を利用してメタデータを付与することができる。その中で、設定されたメタデータの値としては表記ばらつきがある文言から統制された文言に正規化したものが設定され、メタデータとして付与され格納される。

（検索処理の詳細説明）
ステップＳ３０１からステップＳ３０８までの処理で生成されたメタデータが付与されたファイルを検索する際の情報処理について説明する。検索処理の詳細について、図９を用いて説明する。図９は、ユーザが入力した検索キーワードを基にメタデータが付与されたファイルの検索を実行する情報処理の一例を示すフローチャートである。
ステップＳ９０１において、ＣＰＵ１１１は、ユーザがキーボード等を用いて入力した検索キーワードを受け取る。
ステップＳ９０２において、ＣＰＵ１１１は、取得した検索キーワードの文字列を正規化処理する。処理内容としては、前述のメタデータの正規化処理（Ｓ３０５）と同様の処理であり、ＣＰＵ１１１は、検索キーワード文言の表記ばらつきを統制された文言に置き換える処理を行う。
ステップＳ９０２において、ＣＰＵ１１１は、ステップＳ９０２において変換された検索キーワードを用いて検索処理を実行する。メタデータが付与されたファイルが格納されているストレージに対し、それぞれのファイルのメタデータの値の文言と、検索キーワードの文字列一致を判定する。ＣＰＵ１１１は、文字列一致があるファイルに対しては検索結果としてファイルが格納されているファイルパスの情報、ファイル自体を提示する。ＣＰＵ１１１は、逆に、文字列一致がないファイルに対しては、何も実施しない。
以上、ステップＳ９０１からステップＳ９０３までの処理を行うことで、検索キーワードの文言を表記ばらつきがある文言から統制された文言に正規化されて検索を行うことができる。

以上、実施形態１によれば、検索対象である文書ファイルには統制された文言のメタデータが付与されており、検索する際も検索キーワードの文言も統制されるため、検索時には文字列一致が可能になる。これにより、表記ばらつきがあるファイル内容からメタデータを付与した場合においても検索性を低下させることなく、高速に検索することができる。

（変形例１）
実施形態１では、検索対象である文書ファイルに統制された文言のメタデータを付与する例を説明した。しかし、正規化され統制された文言でのみ検索を行う場合、文書内に記載された文言で検索したい場合、不要なファイルまで検索で見つかってしまう課題がある。そこで、変形例１では、統制された文言のメタデータに加え、文書内に記載された文言も合わせてメタデータとして付加する例について説明する。なお、以下では、実施形態１と差異がある箇所について説明する。

図１０は、変形例１の画像形成装置１００が実行する情報処理の一例を示すフローチャートである。図１０と、図３に示した実施形態１のフローチャートとの差異について説明する。
ステップＳ３０１からステップＳ３０８までについては実施形態１と同様である。変形例１のフローチャートでは、実施形態１のフローチャートに加えて、ステップＳ３０９の候補メタデータ付与の処理が追加されている。
ステップＳ３０９において、ＣＰＵ１１１は、ステップＳ３０４で決定したメタデータを付与する。この処理によって、文書内のＯＣＲ結果から取得され、文書内に記載された文言のメタデータが付与される。これにより、正規化前のメタデータがファイルに付与される。ステップＳ３０１からステップＳ３０９までの処理を行うことで、ファイルにはメタデータの各項目にそれぞれ正規化前のメタデータと正規化後のメタデータ２つずつメタデータが付与される。
検索時には、正規化前のメタデータか、正規化後のメタデータのどちらのメタデータを検索するかをユーザに指定させる。その指定に応じたメタデータの中から検索を行う。検索キーワードも同様に正規化前の検索キーワードか、正規化後のキーワードかを選択可能である。正規化されたメタデータで検索する場合、入力検索キーワードを正規化変換した文言で検索を行う。正規化されていない文書からのメタデータで検索する場合、入力検索キーワードを正規化しない文言で検索を行う。

以上、変形例１によれば、正規化され統制された文言でのみ検索を行うこともでき、かつ、文書内に記載された文言で検索も行うことが可能になる。

（変形例２）
実施形態１では、検索対象である文書ファイルに統制された文言のメタデータを付与する例を説明した。その中で、正規化を行う際に候補バリュー値を文字列正規化データベース内から検索をするフローを説明した。しかし、文字列正規化データベースの候補バリュー値内にメタデータとして取得した値の文字列が存在しない場合がある。そこで、変形例２では、文字列正規化データベース内の候補バリュー値の更新について説明する。なお、以下では、実施形態１と差異がある箇所について説明する。

図１１は、変形例２の画像形成装置１００が実行する情報処理の一例を示すフローチャートである。図１１と、図３に示した実施形態１のフローチャートとの差異について説明する。
ステップＳ３０１からステップＳ３０８までについては実施形態１と同様である。変形例２のフローチャートでは、実施形態１のフローチャートに加えて、ステップＳ３１０のデータベースの更新の処理が追加されている。
ステップＳ３０５で、ＣＰＵ１１１は、正規化処理を行うための文字列正規化データベースから検索を行う。その際、文字列正規化データベース内に候補メタデータの値がない場合には、ステップＳ３１０において、ＣＰＵ１１１は、文字列正規化データベース更新を行う。より具体的には、文字列正規化データベース内に記載がないことを検知した場合には、ＣＰＵ１１１は、表示操作部１２３に対して文字列正規化データベース内に値がない旨を表示する。その上で、更新を実施する場合には、ＣＰＵ１１１は、更新を行う。ＣＰＵ１１１は、更新内容としては、候補メタデータが何かをユーザに提示し、候補メタデータが文字列正規化データベース内のどの項目と同じ意味を指すかを指定されるのを受け、更新を行う。

以上、変形例２によれば、未知の文言がどの項目と一致しているかを確認した上で、追加で更新することができる。

（変形例３）
実施形態１では、検索対象である文書ファイルに統制された文言のメタデータを付与する例を説明した。しかし、取得したメタデータの値がＯＣＲ誤認識で間違ってしまっている場合がある。そこで、変形例３では、ＯＣＲ誤認識があった場合でも処理が可能な処理について説明する。なお、以下では、実施形態１と差異がある箇所について説明する。

図１２は、正規化処理を行うための文字列正規化データベースを説明するための図である。６３０に「言青求所」と記載されているのがわかる。「請求書」に対しＯＣＲを行うとしばしば「言青求書」と間違えてしまう。これは「請」の文字が、偏（へん）と旁（つくり）で分かれて別の文字とＯＣＲ認識処理で誤判定してしまい、「言」と「青」と認識してしまうためである。そこで、実質的には「請求書」と「言青求書」は同じ意味を指すため、文字列正規化データベース内に追加を行っている。６３１も同様に「請求明細書」と「言青求明細書」は同じ意味を指すため、文字列正規化データベース内に追加を行っている。その他にも、６３２に示すように「株」を「木」と「朱」と別れて誤認識されている。そこで、「＊＊株式会社」と「＊＊木朱式会社」は同じ意味を指すため、文字列正規化データベース内に追加を行っている。その他にも、「０（数字のゼロ）」と「Ｏ（英文字のオー）」等ＯＣＲが間違いやすい項目は様々あり、それらの組み合わせを文字列正規化データベースに収録を行う。

以上、変形例３によれば、ＯＣＲ誤認識があった場合でも正しく正規化処理を実施することができる。

＜その他の実施形態＞
本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給する。そして、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

以上、本発明の実施形態の一例について詳述したが、本発明は係る特定の実施形態に限定されるものではない。
上述した変形例は任意に組み合わせて実行することができる。

以上、上述した各実施形態によれば、文書ファイルにメタデータを付与する際、文書内の文言からメタデータを付与する場合において文書内の文言に表記ゆれがあったとしても、検索性を低下させることなく、高速に検索することができる。即ち、網羅的に検索可能とすることができる。

１００画像形成装置
１１０制御部
１１１ＣＰＵ
１１２記憶装置

Claims

画像に対して文字認識処理を行う文字認識手段と、
文字認識結果からメタデータを抽出する抽出手段と、
前記メタデータを正規化する正規化手段と、
を有することを特徴とする画像処理装置。
前記画像に基づきファイルを生成する生成手段と、
前記ファイルに前記正規化したメタデータを付与する第１の付与手段と、
前記第１の付与手段により前記正規化したメタデータが付与されたファイルを送信する送信手段と、
を更に有することを特徴とする請求項１に記載の画像処理装置。
正規化前のメタデータを前記ファイルに付与する第２の付与手段を更に有し、
前記送信手段は、前記第１の付与手段により前記正規化したメタデータが、前記第２の付与手段により前記正規化前のメタデータが、付与されたファイルを送信する請求項２に記載の画像処理装置。
前記正規化手段は、文字列正規化データを用いて前記メタデータを正規化する請求項１乃至３の何れか１項に記載の画像処理装置。
前記文字列正規化データを更新する更新手段を更に有する請求項４に記載の画像処理装置。
画像処理装置が実行する情報処理方法であって、
画像に対して文字認識処理を行う文字認識工程と、
文字認識結果からメタデータを抽出する抽出工程と、
前記メタデータを正規化する正規化工程と、
を含むことを特徴とする情報処理方法。
コンピュータを、請求項１乃至５の何れか１項に記載の画像処理装置の各手段として機能させるためのプログラム。