JP2007304864A

JP2007304864A - 文字認識処理システムおよび文字認識処理プログラム

Info

Publication number: JP2007304864A
Application number: JP2006132655A
Authority: JP
Inventors: Etsuko Ito; 悦子伊藤
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2006-05-11
Filing date: 2006-05-11
Publication date: 2007-11-22
Also published as: US8059896B2; US20070263930A1

Abstract

【課題】背景色のある文字領域（例えば、蛍光ペンによるマークを付けた文字領域部分）であっても、文字認識率を高めることができる文字認識処理システムおよび文字認識処理プログラムを提供する。
【解決手段】文字認識処理の確からしさを評価し、前記文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった領域に対して複数の領域に分類し、前記分類された領域に対して、文字認識の確からしさが高いと評価された領域に関する情報に応じて文字と文字以外とを分離し、前記分離された文字領域に対して文字認識処理を行う。
【選択図】図１

Description

本発明は、文字認識処理システムおよび文字認識処理プログラムに関する。

紙文書を電子保存する場合、紙文書をスキャンして画像データ化した状態で保持（電子ファイリング）しておくことが行われている。その際、何らかの属性・キーワードを付与して、画像データ化した文書の活用性を高めることが一般的に行われている。その文書の活用性を考慮すると、上記属性・キーワードとして紙文書内の文字列を利用することが望ましい。

このような技術に関連するものとして、例えば、特許文献１には、イメージファイルを行う文書の登録を行うときあらかじめ業務に精通している者によってその文書の中の重要な部分（ポイント）に蛍光ペンによって印（マーク）を付けておき、イメージ読取り装置を用いてその文書の登録処理を行うとき、イメージ読取りを行うとともに文書中に蛍光ペンのマークを付けた部分が存在するか否かを判別し、マークを付けた部分がある場合はその部分について文字読取りを行って単語に分解し、その単語をキーワードとしてインデックス部に登録することによって、キーワードの登録作業を自動化することができ、従ってキーワードの登録作業時間を短縮して人件費を節減できることが記載されている。

また、例えば、特許文献２には、マーカ文字／図形を含む原稿画像をマーカ編集する際、地肌判定、文字／図形判定、マーカ色判定を行い、マーカかつ文字／図形と判定された画素は文字／図形として処理することが記載されている。

また、例えば、特許文献３には、下地、マーカ、文字の濃度ヒストグラムを参照し、各々のピークとピーク間の濃度幅から２値化閾値を算出することが記載されている。

また、例えば、特許文献４には、マーカ文字／図形を含む原稿画像をマーカ編集する際、白画素、黒画素、色画素に分けるとき、垂直方向、水平方向の順に同色画素の連結数を算出し、連結数の少ない色画素ノイズを判定し、マーカ編集のデータ色から外すことが記載されている。
特開平０５−２３３７０５号公報特開平０６−２０５１７５号公報特開平０７−２６４３９０号公報特開平０８−１２５８７８号公報

背景色のある文字領域（例えば、蛍光ペンによるマークを付けた文字領域部分）であっても、文字認識率を高めることができる文字認識処理システムおよび文字認識処理プログラムを提供することを目的とする。

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
［１］文字認識処理の確からしさを評価する文字認識確からしさ評価手段と、
前記文字認識確からしさ評価手段によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった領域に対して複数の領域に分類する領域分類手段と、
前記領域分類手段によって分類された領域に対して、前記文字認識確からしさ評価手段によって文字認識の確からしさが高いと評価された領域に関する情報に応じて文字と文字以外とを分離する文字分離手段と、
前記文字分離手段によって分離された文字領域に対して文字認識処理を行う文字認識手段
を具備することを特徴とする文字認識処理システム。

［２］文字認識処理の確からしさを評価する文字認識確からしさ評価手段と、
前記文字認識確からしさ評価手段によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった領域に対して複数の領域に分類する領域分類手段と、
前記領域分類手段によって分類された領域に対して、文字認識処理を行う文字認識手段と、
前記文字認識手段によって行われた文字認識処理の確からしさが高いものを文字として判断する文字認識判断手段
を具備することを特徴とする文字認識処理システム。

［３］背景色のある文字画像を含む画像を取得する画像取得手段と、
前記画像取得手段によって取得された画像から背景色のある文字領域を取得する背景色文字領域取得手段と、
背景色文字領域取得手段によって取得された背景色のある文字領域から文字を切り出す文字切り出し手段と、
前記文字切り出し手段によって切り出された文字領域に対して文字認識を行う第１の文字認識手段と、
前記第１の文字認識手段によって行われた文字認識処理の確からしさを算出する文字認識確からしさ算出手段と、
前記文字認識確からしさ算出手段によって算出された文字認識処理の確からしさを評価する文字認識確からしさ評価手段と、
前記文字認識確からしさ評価手段によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった文字領域に対して複数の領域に分類する領域分類手段と、
前記領域分類手段によって分類された領域に対して、前記文字認識確からしさ評価手段によって文字認識の確からしさが高いと評価された領域に関する情報に応じて文字と文字以外とを分離する文字分離手段と、
前記文字分離手段によって分離された文字領域に対して文字認識処理を行う第２の文字認識手段
を具備することを特徴とする文字認識処理システム。

［４］背景色のある文字画像を含む画像を取得する画像取得手段と、
前記画像取得手段によって取得された画像から背景色のある文字領域を取得する背景色文字領域取得手段と、
背景色文字領域取得手段によって取得された背景色のある文字領域から文字を切り出す文字切り出し手段と、
前記文字切り出し手段によって切り出された文字領域に対して文字認識を行う第１の文字認識手段と、
前記第１の文字認識手段によって行われた文字認識処理の確からしさを算出する文字認識確からしさ算出手段と、
前記文字認識確からしさ算出手段によって算出された文字認識処理の確からしさを評価する文字認識確からしさ評価手段と、
前記文字認識確からしさ評価手段によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった文字領域に対して複数の領域に分類する領域分類手段と、
前記領域分類手段によって分類された領域に対して、文字認識処理を行う第２の文字認識手段と、
前記第２の文字認識手段によって行われた文字認識処理の確からしさが高いものを文字として判断する文字認識判断手段
を具備することを特徴とする文字認識処理システム。

［５］前記領域分類手段による分類は、色に応じて分類することを特徴とする［１］，［２］，［３］または［４］に記載の文字認識処理システム。

［６］前記領域分類手段による分類は、彩度に応じて分類することを特徴とする［１］，［２］，［３］または［４］に記載の文字認識処理システム。

［７］前記領域分類手段による分類は、彩度のエッジに応じて分類することを特徴とする［１］，［２］，［３］または［４］に記載の文字認識処理システム。

［８］前記文字分離手段によって用いられる前記文字認識確からしさ評価手段によって文字認識の確からしさが高いと評価された領域は、分離する対象となっている文字領域が含まれる前記背景色文字領域取得手段によって取得された背景色のある文字領域である
ことを特徴とする［３］，［５］，［６］または［７］に記載の文字認識処理システム。

［９］前記文字分離手段によって用いられる前記文字認識確からしさ評価手段によって文字認識の確からしさが高いと評価された領域に関する情報は、彩度情報である
ことを特徴とする［１］，［３］，［５］，［６］，［７］または［８］に記載の文字認識処理システム。

［１０］最終的な文字認識結果を、対象となっている画像のタイトルまたは属性として付加するタイトル属性付加手段
をさらに具備することを特徴とする［１］，［２］，［３］，［４］，［５］，［６］，［７］，［８］または［９］に記載の文字認識処理システム。

［１１］文字認識処理の対象となる領域に対して複数の領域に分類する領域分類手段と、
前記領域分類手段によって分類された領域を、文字と文字以外とに分離する文字分離手段と、
前記文字分離手段によって分離された文字領域に対して文字認識処理を行う文字認識手段
を具備することを特徴とする文字認識処理システム。

［１２］文字認識処理の対象となる領域に対して複数の領域に分類する領域分類手段と、
前記領域分類手段によって分類されたそれぞれの領域に対して、文字認識処理を行う文字認識手段と、
前記文字認識手段によって行われた文字認識処理の確からしさが高いものを文字として判断する文字認識判断手段
を具備することを特徴とする文字認識処理システム。

［１３］コンピュータに、
文字認識処理の確からしさを評価する文字認識確からしさ評価機能と、
前記文字認識確からしさ評価機能によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった領域に対して複数の領域に分類する領域分類機能と、
前記領域分類機能によって分類された領域に対して、前記文字認識確からしさ評価機能によって文字認識の確からしさが高いと評価された領域に関する情報に応じて文字と文字以外とを分離する文字分離機能と、
前記文字分離機能によって分離された文字領域に対して文字認識処理を行う文字認識機能
を実現させることを特徴とする文字認識処理プログラム。

［１４］コンピュータに、
文字認識処理の確からしさを評価する文字認識確からしさ評価機能と、
前記文字認識確からしさ評価機能によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった領域に対して複数の領域に分類する領域分類機能と、
前記領域分類機能によって分類された領域に対して、文字認識処理を行う文字認識機能と、
前記文字認識機能によって行われた文字認識処理の確からしさが高いものを文字として判断する文字認識判断機能
を実現させることを特徴とする文字認識処理プログラム。

本発明にかかる文字認識処理システムおよび文字認識処理プログラムによれば、背景色のある文字領域（例えば、蛍光ペンによるマークを付けた文字領域部分）であっても、本発明の構成を有していない場合に比較して、文字認識率を高めることができる。特に、最終的な文字認識結果を、対象となっている画像のタイトルまたは属性として付加する発明にあっては、操作者にとって、容易にタイトルまたは属性を付加することができるようになり、操作性が向上する。

以下、図面に基づき本発明の好適な各種の実施の形態を説明する。
図１から図７は本発明の第１の実施の形態を示している。図１は、第１の実施の形態の概念的なモジュール構成例を示している。図２は、図１で示したモジュール構成を含む文字認識処理システム全体（画像の入力から文字認識の結果を出力するまで）の概念的なモジュール構成例を示している。図１、図２を用いて、第１の実施の形態の概念的なモジュール構成例を説明する。

なお、モジュールとは、一般的に論理的に分離可能なソフトウェア、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはプログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、プログラム、システムおよび方法の説明をも兼ねている。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、１モジュールを１プログラムで構成してもよいし、複数モジュールを１プログラムで構成してもよく、逆に１モジュールを複数プログラムで構成してもよい。また、複数モジュールは１コンピュータによって実行されてもよいし、分散または並列環境におけるコンピュータによって１モジュールが複数コンピュータで実行されてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続を含む。
また、システムとは、複数のコンピュータ、ハードウェア、装置等がネットワーク等で接続されて構成されるほか、１つのコンピュータによって実現される場合も含まれる。

本実施の形態である文字認識処理システム全体は、図２に示すように、画像入力モジュール１０、マーカ領域取得モジュール２０、レイアウト解析＆文字矩形切出モジュール３０、文字認識モジュール４０、文字認識スコア算出モジュール５０、文字認識スコア評価モジュール６０、文字分離認識モジュール７０、文字認識結果出力モジュール８０により構成されている。また、特に、文字認識スコア評価モジュール６０、文字分離認識モジュール７０、文字認識結果出力モジュール８０は、図１に示すような関係になっている。文字分離認識モジュール７０内は、限定色化モジュール７１、文字分離モジュール７８、文字認識モジュール７９により構成されている。

画像入力モジュール１０は、文字認識処理対象となる画像データ、すなわち文字画像を含む文書等の画像データを入力する。例えばスキャナによって読み取られた画像データ、通信回線を介して送信されてきた画像データあるいはハードディスクなどに格納された画像データのデータベースから検索した画像データ等である。なお、入力するデータには、画像データのほかに、テキストデータ、さらにレイアウト情報などの属性データなど様々なデータが含まれていてもよい。入力した画像データの一部の文字画像部分には、蛍光ペンで印（マーカ）付けがされており、背景色があるとする。すなわち、蛍光ペンは黒・白以外の色のインクであり、文字の上に塗られるが、その下の文字は読めるという状態を作り出すことができる。また、操作者により蛍光ペンにより印付けされた部分は、その文書のタイトルまたは属性として文書データベースに格納したいものとする。

マーカ領域取得モジュール２０は、画像入力モジュール１０によって入力された画像データから蛍光ペンで印（マーカ）がつけられた部分（以下、マーカ領域ともいう）を取得する。つまり、画像データから背景色のある文字領域を取得する。ここでの処理は、淡い色の画像領域を抽出することによって行われる。また、その領域にある一定の大きさ以下の黒画素領域があることを背景色のある文字領域であることの追加の条件としてもよい。さらに、淡い色の画像領域の形状がほぼ長方形となっていることを追加の条件としてもよい。ここでの領域の取得とは、例えば領域の左上の座標、右下の座標を抽出することである。ここでのマーカ領域には、文字とマーカと下地が含まれている状態である。限定色化モジュール７１、文字分離モジュール７８の処理によってマーカ領域内の文字領域を分離する。

レイアウト解析＆文字矩形切出モジュール３０は、マーカ領域取得モジュール２０によって処理された画像データに対して、レイアウト解析および文字矩形の切り出しを行う。なお、画像入力モジュール１０により入力された画像データに属性情報としてレイアウト情報が含まれる場合は、その情報を適用してもよい。レイアウト情報が含まれない場合は、画像データに基づいてレイアウト解析を実行する。レイアウト解析は、画像データに含まれる文字画像領域、図形画像領域、写真画像領域等の区分に分ける処理を行う。また、文字画像領域に対して、１行毎に分ける行分け処理、さらにタイトル、本文、注釈等の属性付け、縦書き・横書きの判定等を行ってもよい。
また、文字矩形の切り出しは、次の文字認識モジュール４０による文字認識を行うために、文字画像領域に対して１文字毎の矩形に切り出す処理を行う。ここでの文字矩形切り出し処理は、例えば、縦方向に黒画素を数え、ヒストグラムを作成し、その黒画素塊毎に切り出す等の処理である。また、文字認識モジュール４０による文字認識を行うために、２値化処理も行う。画像データを、予め設定された閾値を適用して２値化処理を行う、すなわち、例えば濃淡レベルを指定するある閾値を適用して、画像データについて、白［０］、黒［１］の２値化処理を実行する。

文字認識モジュール４０は、レイアウト解析＆文字矩形切出モジュール３０によって切り出され、２値化された文字画像領域に対して、文字認識を行う。つまり、文字画像を認識し文字コード情報に変換する。
文字認識スコア算出モジュール５０は、文字認識モジュール４０によって実行された文字認識処理の確からしさを算出する。ここでの文字認識処理の確からしさとは、文字認識モジュール４０の文字認識処理の結果として得られた文字コード情報の信頼度を示す値として算出される値である。例えば特許第２９９１７７９号公報に記載の文字の信頼度値を適用することができる。

文字認識スコア評価モジュール６０は、文字認識スコア算出モジュール５０によって算出された文字認識処理の確からしさを評価する。ここでの評価とは、例えば文字認識スコア算出モジュール５０の算出した各文字コード情報の確からしさの値を予め定めた閾値と比較し、各文字毎の文字認識結果の確からしさについて、閾値以上の確からしさであるか閾値未満の確からしさであるかを判別する。
そして、その閾値以上の確からしさである場合は、その文字コード情報を文字認識結果出力モジュール８０へ渡す。その閾値未満の確からしさである場合は、文字分離認識モジュール７０の処理へと進む。
また、同一レイアウト内で確からしさが他と比較して低い場合、確からしさが低いと判断するようにしてもよい。同一レイアウト内か否かは、レイアウト解析＆文字矩形切出モジュール３０の結果を用いることによって判断する。

文字分離認識モジュール７０による処理は、文字認識スコア評価モジュール６０によって文字認識の確からしさが低いと評価された場合に行われる。ここでは、図１に示すように、限定色化モジュール７１、文字分離モジュール７８、文字認識モジュール７９による処理が行われる。
限定色化モジュール７１は、文字認識スコア評価モジュール６０によって文字認識の確からしさが低いと評価された文字情報コードの対象となった画像領域に対して、画像入力モジュール１０によって入力された画像データの色度（色相）情報を用いて、３つの領域（文字領域、マーカ領域、下地領域）に分ける。つまり、文字認識の確からしさが低いと評価された文字情報コードの対象となった画像領域は、蛍光ペンによる印付けの始端や終端のようにインクが濃くなり２値化処理した際に黒のノイズとして残ってしまったような場合である。そして、文字領域は黒やグレー、下地領域は白である場合が多く、マーカ領域は色付きであるので、色が明らかに３つで異なることとなる。そこで、元の画像入力モジュール１０によって入力された画像データの色度情報または色相情報を用いて、３つの領域（文字領域、マーカ領域、下地領域）に分ける。この処理は、限定色化処理、減色化処理、インデックスカラー化処理などと言われている。つまり、４種類以上ある色度または色相を持つ画像を、似ている色度または色相の領域を統合して、３つの代表的な色領域に限定（減色、インデックス化）することである。なお、ここでは、下地領域は白であることから、下地であることは判明できるが、残りの２つの領域のうちどちらが文字領域であるか、マーカ領域であるかは判別できていない。なお、下地領域は白でなくてもよく、面積が一番大きい色を下地とするように認識してもよい。

文字分離モジュール７８は、限定色化モジュール７１によって３つの領域に分類された画像領域のうち、文字領域を分離する。分離する対象となっている文字領域が含まれるマーカ領域取得モジュール２０によって取得された背景色のある文字領域、つまり同じマーカが付された領域内の文字の画像情報を用いる。そして、その文字領域内であって、文字認識スコア評価モジュール６０によって文字認識の確からしさが高いと評価された文字領域の彩度に近い彩度を持つ画像領域を文字領域とする。つまり、既に確からしさが高い文字は、文字領域とマーカ領域とは明確に区別できている。そして、その文字領域が対象としている画像領域の近辺のものであれば、対象としている文字領域と同じ性質を有しているといえるはずである。そこで、分離する対象となっている文字領域が含まれるマーカ領域取得モジュール２０によって取得された背景色のある文字領域内で、確からしさが高いと評価された文字領域の彩度を参照する。すなわち、参照される文字画像で２値化後に黒となった画素の元の画素の彩度に近い領域を文字領域、２値化で白となった画素の元の画素の彩度に近い領域をマーカ領域とする。

文字認識モジュール７９は、文字分離モジュール７８によって分離された文字領域に対して前述した文字認識モジュール４０と同様の文字認識処理を行う。
また、文字分離モジュール７８による処理を行わずに、限定色化モジュール７１によって３つに分類された領域（文字領域、マーカ領域、下地領域）のうち、文字領域、マーカ領域に対して、文字認識モジュール７９がそれぞれ文字認識を行ってもよい。そして、それぞれの文字認識処理の確からしさを算出し、確からしさの高い結果を文字認識結果として採用するようにしてもよい。
なお、限定色化モジュール７１、文字分離モジュール７８、文字認識モジュール７９の処理については、図６を用いて後に詳述する。

文字認識結果出力モジュール８０は、文字認識スコア評価モジュール６０または文字認識モジュール７９により文字認識結果である文字コード情報を受け取る。そして、文字コード情報を他のシステムに対して出力する。例えば、その文字認識結果を画像入力モジュール１０により入力された原画像のタイトルまたは属性として付加して、ファイリングシステム等の文書システムのデータベースに格納する。

図３を参照して、実施の形態の文字認識処理システムのハードウェア構成例について説明する。図３に示す構成は、例えばパーソナルコンピュータ（ＰＣ）などによって構成される文字認識処理システムであり、スキャナ等のデータ読み取り部５３１と、プリンタなどのデータ出力部５３２を備えたハード構成例を示している。

ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）５０１は、上述の実施の形態において説明した各種のモジュール、すなわち、文字認識スコア評価モジュール６０、限定色化モジュール７１、文字分離モジュール７８、文字認識モジュール７９、文字認識結果出力モジュール８０等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行する制御部である。

ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）５０２は、ＣＰＵ５０１が使用するプログラムや演算パラメータ等を格納する。ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）５０３は、ＣＰＵ５０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはＣＰＵバスなどから構成されるホストバス５０４により相互に接続されている。

ホストバス５０４は、ブリッジ５０５を介して、ＰＣＩ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バスなどの外部バス５０６に接続されている。

キーボード５０８、ポインティングデバイス５０９は、操作者により操作される入力デバイスである。ディスプレイ５１０は、液晶表示装置またはＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）などから成り、各種情報をテキストやイメージ情報として表示する。

ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）５１１は、ハードディスクを内蔵し、ハードディスクを駆動し、ＣＰＵ５０１によって実行するプログラムや情報を記録または再生させる。ハードディスクは、入力された原本ドキュメントやＯＣＲ結果データ、さらに複数の異なる二値化手法（アルゴリズム）、複数の異なるＯＣＲエンジンなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。

ドライブ５１２は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体５２１に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース５０７、外部バス５０６、ブリッジ５０５、およびホストバス５０４を介して接続されているＲＡＭ５０３に供給する。リムーバブル記録媒体５２１も、ハードディスクと同様のデータ記録領域として利用可能である。

接続ポート５１４は、外部接続機器５２２を接続するポートであり、ＵＳＢ、ＩＥＥＥ１３９４等の接続部を持つ。接続ポート５１４は、インタフェース５０７、および外部バス５０６、ブリッジ５０５、ホストバス５０４等を介してＣＰＵ５０１等に接続されている。通信部５１５は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部５３１は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部５３２は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。

なお、図３に示す文字認識処理システムのハードウェア構成は、１つの構成例を示すものであり、本実施の形態の文字認識処理システムは、図３に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェアで構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図３に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。

次に図４から図７を用いて、作用・働き（動作）を説明する。図４を用いて、蛍光ペンでマークされた文字列に対する文字認識結果の例について説明する。マーカ領域（原画像）４０１は、画像入力モジュール１０によって入力された原画像の一部分であり、蛍光ペンでマークされている部分である。文字画像として「富士アイウエス」（造語）とあり、その上を蛍光ペンでマークされており、マークの始端、終端部分であるマーカ始端部（原画像）４１０ａ、マーカ終端部（原画像）４１０ｂは、他のマーク部分よりも濃くなっている。なお、図４では、マーカ部の濃い部分（マーカ始端部（原画像）４１０ａ、マーカ終端部（原画像）４１０ｂ）は交差のハッチングで示し、一般的なマーカ部は斜線を用いたハッチングで示している。
これに対してレイアウト解析＆文字矩形切出モジュール３０による２値化処理と文字矩形切り出し処理を行うと、図４の下に示したマーカ領域（２値化後）４０２のようになる。つまり、マーカ領域（原画像）４０１は、２値化処理によって、各画素は白［０］、黒［１］のいずれかに変換されて、７つの文字矩形（第１文字目４０３から第７文字目４０９）に切り出される。つまり、第１文字目４０３の矩形には「富」の２値画像、第２文字目４０４の矩形には「士」の２値画像、第３文字目４０５の矩形には「ア」の２値画像、第４文字目４０６の矩形には「イ」の２値画像、第５文字目４０７の矩形には「ウ」の２値画像、第６文字目４０８の矩形には「エ」の２値画像、第７文字目４０９の矩形には「ス」の２値画像がそれぞれ切り出される。なお、第１文字目４０３、第７文字目４０９には、マーカのマーカ始端部（原画像）４１０ａ、マーカ終端部（原画像）４１０ｂの２値化処理の結果であるマーカ始端部（２値化後）４１１ａ、マーカ終端部（２値化後）４１１ｂが含まれている。
さらに、文字認識モジュール４０による文字認識処理が実行され、その文字認識の確からしさ（図４では「ＯＣＲスコア」）は文字認識スコア算出モジュール５０の処理によって、第１文字目４０３は４３点、第２文字目４０４は９８点、第３文字目４０５は９９点、第４文字目４０６は９３点、第５文字目４０７は９１点、第６文字目４０８は９４点、第７文字目４０９は３０点と算出される。第１文字目４０３、第７文字目４０９には、マーカ始端部（２値化後）４１１ａ、マーカ終端部（２値化後）４１１ｂが含まれているため、確からしさは低い点数となる。

ここで、文字認識の確からしさが低い文字矩形の画像領域に対して、再度２値化を施して、再度文字認識モジュール４０による文字認識処理を実行することもできる。ここでの再度の２値化は、最初の２値化処理とは異なるものであり、例えば浮動２値化処理と呼ばれるものである。浮動２値化処理は、局所領域ごとに２値化の閾値を変更する処理である。
ただし、再度の２値化を行っても文字認識の確からしさが向上しない場合もある。その場合について、図５を用いて説明する。図５は、第１文字目４０３の原画像の領域を浮動２値化処理した例である。マーカ始端部（原画像）４１０ａの部分をできるだけ白にして、文字部分だけを黒にしようとするとマーカ始端部（再２値化後）４１２のように市松模様状になったり、文字部分に対しても薄い部分は、かすれ部４１３〜かすれ部４１６のように白くなってしまう。このような場合は、再度２値化処理を施しても、文字認識の確からしさを向上できない。そこで、本実施の形態では、図６に示すような処理を行う。

図６を用いて、限定色化モジュール７１、文字分離モジュール７８、文字認識モジュール７９の処理について説明する。なお、図６では、マーカ部の濃い部分（例えば、マーカ始端部（原画像）４１０ａ）は交差のハッチングで示し、一般的なマーカ部は斜線を用いたハッチングで示している。
図６（ａ）は、文字認識スコア算出モジュール５０によって算出された文字認識の確からしさが低かった第１文字目４０３の文字矩形の原画像である。つまり、画像入力モジュール１０によって入力された画像の部分領域であり、２値化処理前の多値画像である。ここには、マーカ始端部（原画像）４１０ａがあるため、文字認識の確からしさが低くなっている。

図６（ａ）の画像に対して、限定色化モジュール７１は限定色化処理を行う。つまり、対象としている画像の色度を用いて、３色にグルーピングする。蛍光ペンによるマークが例えば緑色である場合、白色、黒色、緑色にグルーピングする。白色、黒色以外については、対象としている画像の色度から最も頻度の高い色度を採用する。そして、その色度に近い色度の画素を頻度の高い色度に変更する。３色に変更した後の画像は、図６（ｂ）のようになる。マーカ始端部（原画像）４１０ａも他のマーカ部（斜線のハッチング部）と同じ色に変換されている。つまり、図６（ｂ）内の画素は、３色のいずれかである。図６（ｂ）を色毎に分けると、図６（ｃ）、図６（ｄ）、図６（ｅ）のようになる。

ここでは、下地以外の画像は、文字領域であるか、マーカ領域であるかは判別できていない。そこで、文字分離モジュール７８が文字領域を分離する。つまり、図６（ｃ）を文字領域、図６（ｄ）をマーカ領域と判別する。その方法は、同じマーカ色が付されている文字であって、文字認識の確からしさが高い文字、例えば第３文字目４０５（確からしさ９９点）の文字領域の彩度情報と近い彩度情報を持つ領域（図６（ｃ））を文字領域と判別する。同じマーカ色が付されているか否かは、マーカ領域取得モジュール２０またはレイアウト解析＆文字矩形切出モジュール３０の結果を用いる。

次に、文字分離モジュール７８によって分離された文字領域に対して、文字認識モジュール７９が文字認識を行う。
また、文字分離モジュール７８による処理を行わずに、文字認識モジュール７９が図６（ｃ）、図６（ｄ）の両方の画像を認識するようにしてもよい。この場合は、文字認識の確からしさが高い方の文字を採用する。

次に、図７を用いて、第１の実施の形態である文字認識処理システムで行われる文字認識処理について説明する。
ステップＳ７０１では、画像入力モジュール１０が画像データを入力する。
ステップＳ７０２では、マーカ領域取得モジュール２０が画像データ内で蛍光ペンでマークされた領域を取得する。
ステップＳ７０３では、レイアウト解析＆文字矩形切出モジュール３０が画像データのレイアウト解析を行う。そして、文字画像に対して１文字毎に文字認識処理を行うために矩形切り出しを行う。
ステップＳ７０４では、文字認識モジュール４０がステップＳ７０３で切り出された画像の文字認識処理を行う。
ステップＳ７０５では、文字認識スコア算出モジュール５０がステップＳ７０４で認識された文字認識の確からしさを算出する。
ステップＳ７０６では、文字認識スコア評価モジュール６０が文字認識の確からしさから、既に信頼のおける結果であるか、ステップＳ７０７からステップＳ７０９の処理を行うべきかの判断を行う。
ステップＳ７０７は、ステップＳ７０６で「ｎｏ」と判断された場合であり、限定色化モジュール７１が文字認識の確からしさが低い文字画像に対して、限定色化処理を施して、３つの領域（文字領域、マーカ領域、下地領域）に分ける。
ステップＳ７０８では、３つの領域を文字領域、マーカ領域、下地領域に分類する。すなわち、もっとも面積が大きい領域、または白である領域を下地領域とし、文字分離モジュール７８がステップＳ７０３、ステップＳ７０５の結果を用いて、３つの領域から文字領域を抽出する。
ステップＳ７０９では、文字認識モジュール７９がステップＳ７０８で抽出された文字領域に対して文字認識処理を行う。
ステップＳ７１０では、文字認識結果出力モジュール８０がステップＳ７０６で「ｙｅｓ」と判断された場合のステップＳ７０４の処理結果である文字コード情報、およびステップＳ７０９の処理結果である文字コード情報を受け取り、ステップＳ７０１で入力された画像データのタイトルまたは属性情報として文字コード情報を付加して、外部のシステムに対して出力する。

図８から図１０は本発明の第２の実施の形態を示している。
本実施の形態では、第１の実施の形態の限定色化モジュール７１を彩度領域分割モジュール７２にしたものである。
なお、第１の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
第２の実施の形態の文字認識処理システムの全体のモジュール構成例、ハードウェア構成例は、それぞれ図２、図３を用いて説明したものと同様である。
図８は、第２の実施の形態の概念的なモジュール構成例を示している。
文字認識スコア評価モジュール６０、文字分離モジュール７８、文字認識モジュール７９、文字認識結果出力モジュール８０は、第１の実施の形態と同様の処理を行う。
彩度領域分割モジュール７２は、文字認識スコア評価モジュール６０によって文字認識の確からしさが低いと評価された文字情報コードの対象となった画像領域に対して、画像入力モジュール１０によって入力された画像データの彩度情報を用いて、３つの領域（文字領域、マーカ領域、下地領域）に分ける。つまり、例えばＬａｂ空間でのａ＊、ｂ＊を用いて、彩度のない文字領域、下地領域と彩度のあるマーカ領域に分ける。

さらに図９を用いて、彩度領域分割モジュール７２、文字分離モジュール７８、文字認識モジュール７９の処理について説明する。なお、図９では、マーカ部の濃い部分（例えば、マーカ始端部（原画像）４１０ａ）は交差のハッチングで示し、一般的なマーカ部は斜線を用いたハッチングで示している。
図９（ａ）は、文字認識スコア算出モジュール５０によって算出された文字認識の確からしさが低かった第１文字目４０３の文字矩形の原画像である。つまり、画像入力モジュール１０によって入力された画像の部分領域であり、２値化処理前の多値画像である。

図９（ａ）の画像に対して、彩度領域分割モジュール７２は彩度情報を用いた領域分割処理を行う。つまり、対象としている画像の彩度を用いて、彩度のない文字領域、下地領域と彩度のあるマーカ領域にグルーピングする。蛍光ペンによるマークが付された部分は彩度があるため、文字領域、下地領域とは区別することができる。彩度情報のみの画像は、図９（ｂ）のようになる。なお、図９（ｂ）では、彩度のある領域はハッチングで示している。マーカ領域は彩度が異なる領域があり、マーカ始端部（図９（ｂ）では格子縞のハッチング部分）と一般的なマーカ部（図９（ｂ）では縦線のハッチング部分）に分かれる。図９（ｂ）の彩度で原画像（図９（ａ））を分けると、図９（ｃ）、図９（ｄ）、図９（ｅ）のようになる。

ここでは、下地以外の画像は、文字領域であるか、マーカ領域であるかは判別できていない。そこで、文字分離モジュール７８が文字領域を分離する。つまり、図９（ｃ）を文字領域、図９（ｄ）をマーカ領域と判別する。その方法は、第１の実施の形態の文字分離モジュール７８と同じである。

次に、文字分離モジュール７８によって分離された文字領域に対して、文字認識モジュール７９が文字認識を行う。
また、文字分離モジュール７８による処理を行わずに、文字認識モジュール７９が図９（ｃ）、図９（ｄ）の両方の画像を認識するようにしてもよい。この場合は、文字認識の確からしさが高い方の文字を採用する。

次に、図１０を用いて、第２の実施の形態である文字認識処理システムで行われる文字認識処理について説明する。
ステップＳ１００１〜ステップＳ１００６は、第１の形態のステップＳ７０１〜ステップＳ７０６と同様である。
ステップＳ１００７では、ステップＳ１００６で「ｎｏ」と判断された場合であり、彩度領域分割モジュール７２が文字認識の確からしさが低い文字画像に対して、彩度情報を用いて、３つの領域（文字領域、マーカ領域、下地領域）に分ける。
ステップＳ１００８〜ステップＳ１０１０は、第１の形態のステップＳ７０８〜ステップＳ７１０と同様である。

図１１から図１３は本発明の第３の実施の形態を示している。
本実施の形態では、第１の実施の形態の限定色化モジュール７１を彩度エッジ領域分割モジュール７３にしたものである。
なお、第１の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
第３の実施の形態の文字認識処理システムの全体のモジュール構成例、ハードウェア構成例は、それぞれ図２、図３を用いて説明したものと同様である。
図１１は、第３の実施の形態の概念的なモジュール構成例を示している。
文字認識スコア評価モジュール６０、文字分離モジュール７８、文字認識モジュール７９、文字認識結果出力モジュール８０は、第１の実施の形態と同様の処理を行う。
彩度エッジ領域分割モジュール７３は、文字認識スコア評価モジュール６０によって文字認識の確からしさが低いと評価された文字情報コードの対象となった画像領域に対して、画像入力モジュール１０によって入力された画像データの彩度情報のエッジを用いて、３つの領域（文字領域、マーカ領域、下地領域）に分ける。つまり、例えばＬａｂ空間でのａ＊、ｂ＊を用いて彩度だけの画像にし、その彩度だけの画像に対してエッジのみを抽出する。そして、そのエッジによって分けられた領域を、文字領域、下地領域、マーカ領域に分ける。

さらに図１２を用いて、彩度エッジ領域分割モジュール７３、文字分離モジュール７８、文字認識モジュール７９の処理について説明する。なお、図１２では、マーカ部の濃い部分（例えば、マーカ始端部（原画像））は交差のハッチングで示し、一般的なマーカ部は斜線を用いたハッチングで示している。
図１２（ａ）は、文字認識スコア算出モジュール５０によって算出された文字認識の確からしさが低かった文字矩形の原画像である（例として「一」の文字を用いた）。つまり、画像入力モジュール１０によって入力された画像の部分領域であり、２値化処理前の多値画像である。

図１２（ａ）の画像に対して、彩度エッジ領域分割モジュール７３は彩度のエッジ情報を用いた領域分割処理を行う。つまり、対象としている画像の彩度のみの画像からエッジを取り出す。そのエッジ部分は、多値画像であるので、図１２（ｂ）のような画像である。なお、図１２（ｂ）では、エッジの中でその値が高くないものは横線のハッチングで示している。これを２値化すると、彩度のエッジの中で、はっきりとしているエッジのみが残ることになる。その状態が図１２（ｃ）のような画像である。つまり、マーカ始端部（原画像）の右側領域（図１２（ｂ）のハッチング部分）が消去される。これは、マーカ始端部右側は一般的なマーカ部と接しており、その一般的なマーカ部とは濃度差が顕著ではないためである。このエッジによって、原画像（図１２（ａ））は３つの領域に分かれる。つまり、図１２（ｄ）、図１２（ｅ）、図１２（ｆ）のようになる。

ここでは、下地以外の画像は、文字領域であるか、マーカ領域であるかは判別できていない。そこで、文字分離モジュール７８が文字領域を分離する。つまり、図１２（ｄ）を文字領域、図１２（ｅ）をマーカ領域と判別する。その方法は、第１の実施の形態の文字分離モジュール７８と同じである。

次に、文字分離モジュール７８によって分離された文字領域に対して、文字認識モジュール７９が文字認識を行う。
また、文字分離モジュール７８による処理を行わずに、文字認識モジュール７９が図１２（ｄ）、図１２（ｅ）の両方の画像を認識するようにしてもよい。この場合は、文字認識の確からしさが高い方の文字を採用する。

次に、図１３を用いて、第３の実施の形態である文字認識処理システムで行われる文字認識処理について説明する。
ステップＳ１３０１〜ステップＳ１３０６は、第１の形態のステップＳ７０１〜ステップＳ７０６と同様である。
ステップＳ１３０７では、ステップＳ１３０６で「ｎｏ」と判断された場合であり、彩度エッジ領域分割モジュール７３が文字認識の確からしさが低い文字画像に対して、彩度のエッジ情報を用いて、３つの領域（文字領域、マーカ領域、下地領域）に分ける。
ステップＳ１３０８〜ステップＳ１３１０は、第１の形態のステップＳ７０８〜ステップＳ７１０と同様である。

前記実施の形態においては、蛍光ペンにより印付け（マーカ）された文字を主に対象として示したが、蛍光ペンによる印付け以外に背景色のある文字領域であれば適用することができる。また、その背景色は特定色である必要はなく、濃淡が異なっていてもよい。

前記実施の形態において、文字分離モジュール７８は、文字認識の確からしさが高い画像の彩度情報を用いるようにしているが、３つに分けられた領域の面積に応じて文字領域を分離するようにしてもよい。マーカ領域が大きな面積を占め、次に文字領域の面積となることが多いからである。また、３つに分けられた領域の外形の形状に応じて文字領域を分離するようにしてもよい。マーカ領域はほぼ矩形であり、下地領域は矩形の辺に沿っている等の特徴を利用するものである。

また、前記実施の形態においては、文字認識モジュール４０、文字認識スコア算出モジュール５０、文字認識スコア評価モジュール６０による処理を行った後に、文字分離認識モジュール７０の処理（第１の実施の形態では限定色化モジュール７１、文字分離モジュール７８、文字認識モジュール７９の処理、第２の実施の形態では彩度領域分割モジュール７２、文字分離モジュール７８、文字認識モジュール７９の処理、第３の実施の形態では彩度エッジ領域分割モジュール７３、文字分離モジュール７８、文字認識モジュール７９の処理）を行っているが、文字認識モジュール４０、文字認識スコア算出モジュール５０、文字認識スコア評価モジュール６０による処理を行わずに、レイアウト解析＆文字矩形切出モジュール３０の処理の後に文字分離認識モジュール７０の処理を行うようにしてもよい。すなわち、限定色化モジュール７１、彩度領域分割モジュール７２、または彩度エッジ領域分割モジュール７３は、文字認識処理の対象となる領域に対して複数の領域に分類する。文字分離モジュール７８は、限定色化モジュール７１、彩度領域分割モジュール７２、または彩度エッジ領域分割モジュール７３によって分類された領域を、文字と文字以外とに分離する。文字認識モジュール７９は、文字分離モジュール７８によって分離された文字領域に対して文字認識処理を行う。その際、限定色化モジュール７１は色に応じて分類し、彩度領域分割モジュール７２は彩度に応じて分類し、彩度エッジ領域分割モジュール７３は彩度のエッジに応じて分類する。

さらに、次のようにすることもできる。限定色化モジュール７１、彩度領域分割モジュール７２、または彩度エッジ領域分割モジュール７３は、文字認識処理の対象となる領域に対して複数の領域に分類する。文字認識モジュール７９は、限定色化モジュール７１、彩度領域分割モジュール７２、または彩度エッジ領域分割モジュール７３によって分類されたそれぞれの領域に対して、文字認識処理を行い、その文字認識処理の確からしさが高いものを文字として判断する。そして、限定色化モジュール７１は色に応じて分類し、彩度領域分割モジュール７２は彩度に応じて分類し、彩度エッジ領域分割モジュール７３は彩度のエッジに応じて分類する。

なお、説明したプログラムについては、記録媒体に格納することも可能であり、その場合は、例えば以下の発明としても把握することができる。
コンピュータに、
文字認識処理の確からしさを評価する文字認識確からしさ評価機能と、
前記文字認識確からしさ評価機能によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった領域に対して複数の領域に分類する領域分類機能と、
前記領域分類機能によって分類された領域に対して、前記文字認識確からしさ評価機能によって文字認識の確からしさが高いと評価された領域に関する情報に応じて文字と文字以外とを分離する文字分離機能と、
前記文字分離機能によって分離された文字領域に対して文字認識処理を行う文字認識機能
を実現させることを特徴とする文字認識処理プログラムを記録したコンピュータ読み取り可能な記録媒体。

コンピュータに、
文字認識処理の確からしさを評価する文字認識確からしさ評価機能と、
前記文字認識確からしさ評価機能によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった領域に対して複数の領域に分類する領域分類機能と、
前記領域分類機能によって分類された領域に対して、文字認識処理を行う文字認識機能と、
前記文字認識機能によって行われた文字認識処理の確からしさが高いものを文字として判断する文字認識判断機能
を実現させることを特徴とする文字認識処理プログラムを記録したコンピュータ読み取り可能な記録媒体。

「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク（ＤＶＤ）であって、ＤＶＤフォーラムで策定された規格である「ＤＶＤ−Ｒ、ＤＶＤ−ＲＷ、ＤＶＤ−ＲＡＭ等」、ＤＶＤ＋ＲＷで策定された規格である「ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等」、コンパクトディスク（ＣＤ）であって、読出し専用メモリ（ＣＤ−ＲＯＭ）、ＣＤレコーダブル（ＣＤ−Ｒ）、ＣＤリライタブル（ＣＤ−ＲＷ）等、光磁気ディスク（ＭＯ）、フレキシブルディスク（ＦＤ）、磁気テープ、ハードディスク、読出し専用メモリ（ＲＯＭ）、電気的消去および書換可能な読出し専用メモリ（ＥＥＰＲＯＭ）、フラッシュ・メモリ、ランダム・アクセス・メモリ（ＲＡＭ）等が含まれる。
そして、上記のプログラムまたはその一部は、上記記録媒体に記録して保存や流通等させることが可能である。また、通信によって、例えば、ローカル・エリア・ネットワーク（ＬＡＮ）、メトロポリタン・エリア・ネットワーク（ＭＡＮ）、ワイド・エリア・ネットワーク（ＷＡＮ）、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにはこれらの組合せ等の伝送媒体を用いて伝送することが可能であり、また、搬送波に乗せて搬送することも可能である。
さらに、上記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。

文字認識処理システムの構成例を示すブロック図である。文字認識処理システムの全体の構成例を示すブロック図である。文字認識処理システムのハードウェア構成例について説明する図である。マークされた文字列に対する文字認識結果の例について説明する図である。閾値を変更して２値化した例について説明する図である。限定色化を用いた文字分離の例について説明する図である。文字認識処理システムで行われる文字認識処理について説明するフローチャートを示す図である。文字認識処理システムの全体の構成例を示すブロック図である。彩度情報を用いた文字分離の例について説明する図である。文字認識処理システムで行われる文字認識処理について説明するフローチャートを示す図である。文字認識処理システムの全体の構成例を示すブロック図である。彩度エッジを用いた文字分離の例について説明する図である。文字認識処理システムで行われる文字認識処理について説明するフローチャートを示す図である。

符号の説明

１０…画像入力モジュール
２０…マーカ領域取得モジュール
３０…レイアウト解析＆文字矩形切出モジュール
４０…文字認識モジュール
５０…文字認識スコア算出モジュール
６０…文字認識スコア評価モジュール
７０…文字分離認識モジュール
７１…限定色化モジュール
７２…彩度領域分割モジュール
７３…彩度エッジ領域分割モジュール
７８…文字分離モジュール
７９…文字認識モジュール
８０…文字認識結果出力モジュール

Claims

文字認識処理の確からしさを評価する文字認識確からしさ評価手段と、
前記文字認識確からしさ評価手段によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった領域に対して複数の領域に分類する領域分類手段と、
前記領域分類手段によって分類された領域に対して、前記文字認識確からしさ評価手段によって文字認識の確からしさが高いと評価された領域に関する情報に応じて文字と文字以外とを分離する文字分離手段と、
前記文字分離手段によって分離された文字領域に対して文字認識処理を行う文字認識手段
を具備することを特徴とする文字認識処理システム。
文字認識処理の確からしさを評価する文字認識確からしさ評価手段と、
前記文字認識確からしさ評価手段によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった領域に対して複数の領域に分類する領域分類手段と、
前記領域分類手段によって分類された領域に対して、文字認識処理を行う文字認識手段と、
前記文字認識手段によって行われた文字認識処理の確からしさが高いものを文字として判断する文字認識判断手段
を具備することを特徴とする文字認識処理システム。
背景色のある文字画像を含む画像を取得する画像取得手段と、
前記画像取得手段によって取得された画像から背景色のある文字領域を取得する背景色文字領域取得手段と、
背景色文字領域取得手段によって取得された背景色のある文字領域から文字を切り出す文字切り出し手段と、
前記文字切り出し手段によって切り出された文字領域に対して文字認識を行う第１の文字認識手段と、
前記第１の文字認識手段によって行われた文字認識処理の確からしさを算出する文字認識確からしさ算出手段と、
前記文字認識確からしさ算出手段によって算出された文字認識処理の確からしさを評価する文字認識確からしさ評価手段と、
前記文字認識確からしさ評価手段によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった文字領域に対して複数の領域に分類する領域分類手段と、
前記領域分類手段によって分類された領域に対して、前記文字認識確からしさ評価手段によって文字認識の確からしさが高いと評価された領域に関する情報に応じて文字と文字以外とを分離する文字分離手段と、
前記文字分離手段によって分離された文字領域に対して文字認識処理を行う第２の文字認識手段
を具備することを特徴とする文字認識処理システム。
背景色のある文字画像を含む画像を取得する画像取得手段と、
前記画像取得手段によって取得された画像から背景色のある文字領域を取得する背景色文字領域取得手段と、
背景色文字領域取得手段によって取得された背景色のある文字領域から文字を切り出す文字切り出し手段と、
前記文字切り出し手段によって切り出された文字領域に対して文字認識を行う第１の文字認識手段と、
前記第１の文字認識手段によって行われた文字認識処理の確からしさを算出する文字認識確からしさ算出手段と、
前記文字認識確からしさ算出手段によって算出された文字認識処理の確からしさを評価する文字認識確からしさ評価手段と、
前記文字認識確からしさ評価手段によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった文字領域に対して複数の領域に分類する領域分類手段と、
前記領域分類手段によって分類された領域に対して、文字認識処理を行う第２の文字認識手段と、
前記第２の文字認識手段によって行われた文字認識処理の確からしさが高いものを文字として判断する文字認識判断手段
を具備することを特徴とする文字認識処理システム。
前記領域分類手段による分類は、色に応じて分類することを特徴とする請求項１，２，３または４に記載の文字認識処理システム。
前記領域分類手段による分類は、彩度に応じて分類することを特徴とする請求項１，２，３または４に記載の文字認識処理システム。
前記領域分類手段による分類は、彩度のエッジに応じて分類することを特徴とする請求項１，２，３または４に記載の文字認識処理システム。
前記文字分離手段によって用いられる前記文字認識確からしさ評価手段によって文字認識の確からしさが高いと評価された領域は、分離する対象となっている文字領域が含まれる前記背景色文字領域取得手段によって取得された背景色のある文字領域である
ことを特徴とする請求項３，５，６または７に記載の文字認識処理システム。
前記文字分離手段によって用いられる前記文字認識確からしさ評価手段によって文字認識の確からしさが高いと評価された領域に関する情報は、彩度情報である
ことを特徴とする請求項１，３，５，６，７または８に記載の文字認識処理システム。
最終的な文字認識結果を、対象となっている画像のタイトルまたは属性として付加するタイトル属性付加手段
をさらに具備することを特徴とする請求項１，２，３，４，５，６，７，８または９に記載の文字認識処理システム。
文字認識処理の対象となる領域に対して複数の領域に分類する領域分類手段と、
前記領域分類手段によって分類された領域を、文字と文字以外とに分離する文字分離手段と、
前記文字分離手段によって分離された文字領域に対して文字認識処理を行う文字認識手段
を具備することを特徴とする文字認識処理システム。
文字認識処理の対象となる領域に対して複数の領域に分類する領域分類手段と、
前記領域分類手段によって分類されたそれぞれの領域に対して、文字認識処理を行う文字認識手段と、
前記文字認識手段によって行われた文字認識処理の確からしさが高いものを文字として判断する文字認識判断手段
を具備することを特徴とする文字認識処理システム。
コンピュータに、
文字認識処理の確からしさを評価する文字認識確からしさ評価機能と、
前記文字認識確からしさ評価機能によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった領域に対して複数の領域に分類する領域分類機能と、
前記領域分類機能によって分類された領域に対して、前記文字認識確からしさ評価機能によって文字認識の確からしさが高いと評価された領域に関する情報に応じて文字と文字以外とを分離する文字分離機能と、
前記文字分離機能によって分離された文字領域に対して文字認識処理を行う文字認識機能
を実現させることを特徴とする文字認識処理プログラム。
コンピュータに、
文字認識処理の確からしさを評価する文字認識確からしさ評価機能と、
前記文字認識確からしさ評価機能によって文字認識の確からしさが低いと評価された場合は、文字認識処理の対象となった領域に対して複数の領域に分類する領域分類機能と、
前記領域分類機能によって分類された領域に対して、文字認識処理を行う文字認識機能と、
前記文字認識機能によって行われた文字認識処理の確からしさが高いものを文字として判断する文字認識判断機能
を実現させることを特徴とする文字認識処理プログラム。