JP2010231440A - 情報処理装置およびプログラム - Google Patents

情報処理装置およびプログラム Download PDF

Info

Publication number
JP2010231440A
JP2010231440A JP2009077424A JP2009077424A JP2010231440A JP 2010231440 A JP2010231440 A JP 2010231440A JP 2009077424 A JP2009077424 A JP 2009077424A JP 2009077424 A JP2009077424 A JP 2009077424A JP 2010231440 A JP2010231440 A JP 2010231440A
Authority
JP
Japan
Prior art keywords
image information
character image
information
read
relevance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009077424A
Other languages
English (en)
Other versions
JP5381225B2 (ja
Inventor
Katsuya Mitsutake
克也 光武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2009077424A priority Critical patent/JP5381225B2/ja
Publication of JP2010231440A publication Critical patent/JP2010231440A/ja
Application granted granted Critical
Publication of JP5381225B2 publication Critical patent/JP5381225B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】文字認識処理後に得られる処理結果の正確性を容易に認識することができ、処理結果を確認する作業の効率向上を図ることができる技術を提供する。
【解決手段】原稿の画像を読み取る画像読み取り装置にて得られた読取画像情報を受け付ける受付手段と、受付手段が受け付けた読取画像情報から1つの文字あるいは記号の画像情報である読取文字画像情報C1を抽出するともに読取文字画像情報を文字あるいは記号を識別するコード情報に変換する文字認識部21と、文字認識部21が変換した識別情報に対応する画像情報である対応文字画像情報C2を生成する生成部22と、読取文字画像情報C1と対応文字画像情報C2とを比較し、これらの関連性を判断する比較照合部23と、比較照合部23による関連性に基づき文字認識部21が変換した識別情報と比較照合部23の判断結果とを関連付けて出力する出力部24とを備える。
【選択図】図3

Description

本発明は、情報処理装置およびプログラムに関する。
近年、各種伝票・帳票、申請書などの紙文書に記載された文字情報をコンピュータに入力する際に、紙文書に記載された文字情報をスキャンして画像情報とし、その画像情報の形状からコンピュータが処理可能なコード情報に変換する光学文字認識(OCR(Optical Character Reader))技術が用いられる。そして、文字認識処理後に得られる処理結果を確認する手法が提案されている。
例えば、特許文献1に記載の装置は、以下のように構成されている。すなわち、FAXデータ受信部がファクスデータを受信すると、OCR部が、そのファクスデータに対する文字読取処理を実行する。この文字読取処理により得られるテキストデータは、出力データ管理部によって元ファクスデータと関連付けられてテキストデータファイルに格納される。一方、ファクスデータの内容の読み上げが要求されると、出力データ管理部は、読み上げ対象となるテキストデータを音声合成部に通知するとともに音声合成処理の実行を指示し、音声合成部は、通知されたテキストデータに対応する音声データの合成を実行する。そして、音声出力部が、その合成された音声データを指定されたデバイスに出力する。
特開2000−10755号公報
光学文字認識技術を用いた文字認識率は、100%ではない可能性がある。それゆえ、光学文字認識処理後に得られる処理結果の正確性を容易に認識することができ、処理結果を確認する作業の効率向上が望まれる。
請求項1に記載の発明は、原稿の画像を読み取る画像読み取り装置にて得られた読取画像情報を受け付ける受付手段と、前記受付手段が受け付けた前記読取画像情報から1つの文字あるいは記号の画像情報である読取文字画像情報を抽出する抽出手段と、前記抽出手段が抽出した前記読取文字画像情報を文字あるいは記号を識別する識別情報に変換する変換手段と、前記変換手段が変換した前記識別情報に対応する画像情報である対応文字画像情報を生成する生成手段と、前記読取文字画像情報と前記対応文字画像情報とを比較し、これらの関連性を判断する判断手段と、前記判断手段による前記関連性に基づき前記変換手段が変換した識別情報と当該判断手段の判断結果とを関連付けて出力する出力手段と、を備える情報処理装置である。
請求項2に記載の発明は、前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度を把握し、当該一致度の度合いに応じて前記関連性を判断することを特徴とする請求項1に記載の情報処理装置である。
請求項3に記載の発明は、前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度と、前記識別情報に応じて定められた基準値とを比較することにより前記関連性を判断することを特徴とする請求項2に記載の情報処理装置である。
請求項4に記載の発明は、前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度と、前記原稿に含まれる字体に応じて定められた基準値とを比較することにより前記関連性を判断することを特徴とする請求項2に記載の情報処理装置である。
請求項5に記載の発明は、前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度と、予め設定され、その後当該判断手段の判断結果の正確性に応じて変更させられる基準値とを比較することにより前記関連性を判断することを特徴とする請求項2に記載の情報処理装置である。
請求項6に記載の発明は、前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度が前記基準値よりも大きい場合には、これらの関連性が高く、当該一致度が当該基準値以下である場合には、これらの関連性が低いと判断し、前記出力手段は、前記判断手段が前記関連性が低いと判断した判断結果を前記識別情報に関連付けて出力することを特徴とする請求項1から5のいずれか1項に記載の情報処理装置である。
請求項7に記載の発明は、前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との関連性が低いと判断する場合には、その程度を判断し、前記出力手段は、前記判断手段が判断した関連性が低い程度をも前記識別情報に関連付けることを特徴とする請求項1から6のいずれか1項に記載の情報処理装置である。
請求項8に記載の発明は、コンピュータに、原稿の画像を読み取る画像読み取り装置にて得られた読取画像情報を受け付ける機能と、前記受け付ける機能が受け付けた前記読取画像情報から1つの文字あるいは記号の画像情報である読取文字画像情報を抽出する機能と、前記抽出する機能が抽出した前記読取文字画像情報を文字あるいは記号を識別する識別情報に変換する機能と、前記変換する機能が変換した識別情報に対応する画像情報である対応文字画像情報を生成する機能と、前記読取文字画像情報と前記対応文字画像情報とを比較し、これらの関連性を判断する機能と、前記判断する機能による関連性に基づき前記変換する機能が変換した識別情報と当該判断する機能の判断結果とを関連付けて出力する機能と、を実現するためのプログラムである。
請求項9に記載の発明は、前記判断する機能は、前記読取文字画像情報と前記対応文字画像情報との一致度を把握し、当該一致度の度合いに応じて前記関連性を判断することを特徴とする請求項8に記載のプログラムである。
請求項1の発明によれば、本発明を採用しない場合に比べて、変換した識別情報と読み取った画像情報との関連性をより容易に認識させることができ、変換した識別情報が正しいか否かを確認する作業の効率を向上させることができる。
請求項2の発明によれば、関連性の判断レベルを画像情報によらず統一させることができる。
請求項3の発明によれば、本発明を採用しない場合に比べて、識別情報に依存する変換困難性にかかわらずより精度高く関連性を判断することができる。
請求項4の発明によれば、本発明を採用しない場合に比べて、字体に依存する変換困難性にかかわらずより精度高く関連性を判断することができる。
請求項5の発明によれば、識別情報への変換精度を加味して関連性を判断することができる。
請求項6の発明によれば、変換した識別情報の関連性をより精度高く出力することができ、変換した識別情報が正しいか否かを確認する作業の効率を向上させることができる。
請求項7の発明によれば、本発明を採用しない場合に比べて、変換した識別情報の読取画像情報との関連性が高くない度合いをも認識させることができ、変換した識別情報の正確性の確認作業の自由度を増加させることができる。
請求項8の発明によれば、本発明を採用しない場合に比べて、変換した識別情報と読み取った画像情報との関連性をより容易に認識させることができ、変換した識別情報が正しいか否かを確認する作業の効率を向上させることができる。
請求項9の発明によれば、関連性の判断レベルを画像情報によらず統一させることができる。
本発明の実施の形態に係る情報処理システムの概略構成を示した図である。 情報処理装置のハードウェア構成例を示す図である。 情報処理装置の機能ブロック図である。 比較照合部が行う比較照合処理の手順を示すフローチャートである。 印刷した原稿を示す図である。 スキャナ装置にてスキャンされた原稿を示す図である。 数字と文字コードとの関係を示す図である。 生成部が出力する文字画像情報を表示した図である。 読取文字画像情報と修正した文字画像情報とを重ね合わせて表示した図である。 比較照合部が行う他の比較照合処理の手順を示すフローチャートである。 複数のフォントが指定された場合の比較照合処理の手順を示すフローチャートである。 条件と閾値との関係を示す図である。 比較照合部が行う、閾値変更をも行う比較照合処理の手順を示すフローチャートである。 比較照合部が行う他の比較照合処理の手順を示すフローチャートである。
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
図1は本発明の実施の形態に係る情報処理システム1の概略構成を示した図である。
本実施形態に係る情報処理システム1は、原稿(紙文書)D1の画像を光学的に読み取り、その原稿を構成する画像情報(データ)D2を形成するスキャナ装置10と、画像情報D2をコード情報(識別情報)に変換し、これに基づいて文書情報(データ)D3を出力する情報処理装置20とを有している。
スキャナ装置10は、ハードウェアおよびソフトウェアプログラムにより実現され、原稿の画像を読み取る画像読み取り装置の一例として機能し、文字情報が記載された紙文書またはPDF文書などの走査(スキャン)を行うことにより得た画像情報D2を出力する。
情報処理装置20は、ハードウェアおよびソフトウェアプログラムにより実現される。
図2は、情報処理装置20のハードウェア構成例を示す図である。
情報処理装置20は、キーボードやマウスなどの操作により情報を入力する入力部201と、ディスプレイに文字、図形などの情報を表示する表示部202と、スキャナ装置10などの外部機器やネットワークとの接続を可能にするインタフェース203とを有している。
また、情報処理装置20は、ROMまたはRAMを含みアプリケーションプログラムその他の起動プログラムを記憶する主記憶部204と、ハードディスクなどの大容量記憶装置を含み、各種プログラムなどを保持する外部記憶部205と、主記憶部204に記憶されたプログラムに従い各部を制御する中央演算処理装置(CPU)206と、これらを接続するためのバス207とを有している。
外部記憶部205には、予め下記の機能を実現するための各種プログラムが記憶されており、これらは使用者の起動命令を受けて主記憶部204に読み出され、それらの機能が利用可能になる。
図3は、情報処理装置20の機能ブロック図である。
情報処理装置20は、画像情報D2に含まれる画像情報をコード情報に変換する文字認識部21と、文字認識部21が変換したコード情報を基に当該コード情報に対応する画像情報を生成する生成部22とを有している。また、情報処理装置20は、生成部22が生成した画像情報とスキャナ装置10が形成した画像情報とを比較照合する比較照合部23と、比較照合部23が比較照合した結果を文字認識部21が変換したコード情報に関連付けて出力する出力部24とを有している。
文字認識部21は、画像情報D2を1文字あるいは1つの記号ごとに分離し、1文字あるいは記号の画像情報である読取文字画像情報C1を複数形成し、形成した読取文字画像情報C1を出力する。また、形成した読取文字画像情報C1に1つコード情報を割り当てることにより、読取文字画像情報C1をコード情報に変換し、このコード情報を出力する。このように、文字認識部21は、画像情報D2から1つの文字あるいは記号の画像情報である読取文字画像情報C1を抽出する抽出手段の一例であるとともに抽出手段が抽出した読取文字画像情報C1を文字あるいは記号を識別する識別情報(コード情報)に変換する変換手段の一例である。
生成部22は、文字認識部21が出力したコード情報を取得し、このコード情報に対応する文字のフォント画像情報である対応文字画像情報C2を、予め指定されたフォントで生成し、生成した対応文字画像情報C2を出力する。
比較照合部23は、文字認識部21が出力した読取文字画像情報C1と生成部22が出力した対応文字画像情報C2とを取得し、この読取文字画像情報C1と対応文字画像情報C2とを比較照合する。そして、比較照合した結果、読取文字画像情報C1と対応文字画像情報C2とを同一視不可能と判断した場合には、不一致信号を出力する。言い換えれば、比較照合した結果、読取文字画像情報C1と対応文字画像情報C2との関連性が低いと判断した場合には、不一致信号を出力する。
出力部24は、文字認識部21が出力したコード情報と比較照合部23が出力した不一致信号とを取得し、この不一致信号が出力された読取文字画像情報C1に対応するコード情報にこの不一致信号を関連付け、不一致信号を関連付けたコード情報を出力する。不一致信号が出力されていないコード情報は、そのまま出力する。つまり、出力部24は、不一致信号が関連付けられたコード情報と不一致信号が関連付けていないコード情報とを含んだ文書情報D3を出力する。
関連付け態様としては、以下の態様であることを例示することができる。すなわち、不一致信号が関連付けられていないコード情報に対応するフォントを例えばディスプレイに表示する際の画素の色を黒とするのに対して、不一致信号が関連付けられたコード情報に対応するフォントの画素の色が赤となるように関連付けることが好適である。あるいは、不一致信号が関連付けられたコード情報に対応するフォントのみをハイライトするように関連付けることも好適である。
次に、読取文字画像情報C1と対応文字画像情報C2とを比較照合する手法について説明する。
先ず、読取文字画像情報C1の上下左右の長さを計測し、その上下左右の長さ、および解像度が一致するように対応文字画像情報C2を拡大または縮小して、修正した文字画像情報C2´を生成する。なお、解像度はスキャンする際に使用者により指定された値である。
次に、修正した文字画像情報C2´の画素数Nfiを計測する。
また、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する。より具体的には、色のついている画素を“1”、白い画素を“0”とすると、両画像情報の同じ座標の各画素同士の排他的論理和は、両方の画素とも色つきの場合は“0”、または両方の画素とも白の場合は“0”となる。また、どちらか一方の画素が色つきで、一方が白の場合は“1”となる。この画素ごとの排他的論理和を積算した値を、2つの画像情報間の差ΔNとする。ΔNは、同じ画素同士の重なりが多ければ小さく、異なる画素の重なりが多ければ大きな値となる。例えば、重ねた画像がまったく同じであれば、ΔNは零である。
そして、重なっていない画素数ΔNを修正した文字画像情報C2´の画素数Nfiで除した値(=ΔN/Nfi)を算出する。一致している画素が多いほど(両画像情報の一致度が高いほど)、ΔN/Nfiの値は小さい値になる。それゆえ、ΔN/Nfiが予め定めた閾値以上である場合には、読取文字画像情報C1と対応文字画像情報C2とは同一視不可能と判断し、ΔN/Nfiが予め定めた閾値より小さい場合には、読取文字画像情報C1と対応文字画像情報C2とは同一視可能と判断する。そして、ΔN/Nfiが予め定めた閾値以上である場合に、上述した不一致信号を出力する。
言い換えれば、読取文字画像情報C1と対応文字画像情報C2との一致度が予め定めた基準値よりも大きい場合には、これらの関連性が高く、一致度が基準値以下である場合には、これらの関連性が低いと判断する。そして、関連性が低いと判断した場合に、上述した不一致信号を出力する。
以下、フローチャートを用いて、比較照合部23が行う比較照合処理について説明する。
図4は、比較照合部23が行う比較照合処理の手順を示すフローチャートである。
比較照合部23は、使用者から文字認識処理の要求を受けたことなどをトリガーとしてこの比較照合処理を実行開始する。
比較照合部23は、先ず、読取文字画像情報C1の上下左右の長さを計測し、その上下左右の長さ、および解像度が一致するように対応文字画像情報C2を拡大または縮小することにより、修正した文字画像情報C2´を生成する(ステップ401)。
その後、ステップ401にて生成した文字画像情報C2´の画素数Nfiを計測する(ステップ402)。
また、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する(ステップ403)。
そして、ステップ403にて計測した画素数ΔNを画素数Nfiで除した値ΔN/Nfiが予め定めた閾値より小さいか否かを判別する(ステップ404)。そして、ステップ404にて否定判定された場合には、不一致信号を出力して(ステップ405)、本処理の実行を終了する。一方、ステップ404にて肯定判定された場合には、そのまま本処理の実行を終了する。
このように、比較照合部23がかかる比較照合処理を実行することで、読取文字画像情報C1と対応文字画像情報C2とを同一視可能か否かが判別可能となり、同一視不可能である場合には不一致信号を精度高く出力可能となる。
次に、以上のように構成された情報処理装置20の作用について説明する。
図5は、印刷した原稿を示す図である。図6は、スキャナ装置10にてスキャンされた原稿を示す図である。
図5に示した、数字の七を算用数字で「7」と印刷した原稿が、複写時あるいは人から人に交換されるうちに、画像の一部に欠落が生じたり汚れが付着したりすることにより図6のように変形し、この状態でスキャナ装置10にてスキャンされたとする。文字認識部21は、図6にある黒い部分を読取文字画像情報C1として出力する。
図7は、文字と文字コードとの関係を示す図である。図7には、ASCIIの関係を例示している。
文字認識部21は、図6の形から数字の「1」であると認識し、コード情報として、16進数の“31”に変換して出力する。つまり、正しくは、図7に示すように16進数の“37”とすべきところを“31”に変換して出力する。
図8は、生成部22が出力する文字画像情報を表示した図である。
生成部22は、文字認識部21が変換したコード情報“31”に対応する文字のフォント画像情報である対応文字画像情報C2を、予め指定されたフォントで生成し、生成した対応文字画像情報C2を出力する。この生成部22が出力する対応文字画像情報C2を表示すると図8の通りとなる。
比較照合部23は、読取文字画像情報C1の上下左右の長さを計測し、その上下左右の長さ、および解像度が一致するように対応文字画像情報C2を拡大または縮小することにより、修正した文字画像情報C2´を生成する。そして、修正した文字画像情報C2´の画素数Nfiを計測する。
図9は、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせて表示した図である。比較照合部23は、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する。
そして、ΔN/Nfiを算出し、ΔN/Nfiが予め定めた閾値以上である場合には、読取文字画像情報C1と対応文字画像情報C2とは同一視不可能と判断し、不一致信号を出力する。ΔN/Nfiが予め定めた閾値より小さい場合には、読取文字画像情報C1と対応文字画像情報C2とは同一視可能と判断し、不一致信号は出力しない。
出力部24は、文字認識部21が出力したコード情報と比較照合部23が出力した不一致信号とを取得し、この不一致信号が出力された読取文字画像情報C1に対応するコード情報にこの不一致信号を関連付け、不一致信号を関連付けたコード情報を出力する。不一致信号が出力されていないコード情報は、そのまま出力する。
そして、例えば、表示部202が、出力部24が出力した文書情報D3をディスプレイに表示することにより、使用者は、不一致信号が関連付けられた文字と不一致信号が関連付けられていない文字とを識別可能となる。これにより、使用者は文字認識エラーの箇所を特定可能となるので、その部分のみを確認すれば、大幅に作業効率を向上する。
なお、上述した実施の形態においては、比較照合部23は、読取文字画像情報C1と対応文字画像情報C2とを比較照合する際に、重なっていない画素数ΔNを修正した文字画像情報C2´の画素数Nfiで除した値(=ΔN/Nfi)が閾値より小さいか否かで判断しているが、特にかかる態様には限定されない。
すなわち、比較照合部23は、読取文字画像情報C1と修正した文字画像情報C2´との重なっていない画素数ΔNを計測し、この重なっていない画素数ΔNが閾値より小さいか否かで判断してもよい。
以下、フローチャートを用いて、比較照合部23が行う他の比較照合処理について説明する。図10は、比較照合部23が行う他の比較照合処理の手順を示すフローチャートである。
比較照合部23は、使用者から文字認識処理の要求を受けたことなどをトリガーとしてこの比較照合処理を実行開始する。
比較照合部23は、先ず、読取文字画像情報C1の上下左右の長さを計測し、その上下左右の長さ、および解像度が一致するように対応文字画像情報C2を拡大または縮小することにより修正した文字画像情報C2´を生成する(ステップ1001)。
その後、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する(ステップ1002)。
そして、ステップ1002にて計測した画素数ΔNが予め定めた閾値より小さいか否かを判別する(ステップ1003)。そして、ステップ1003にて否定判定された場合には、不一致信号を出力して(ステップ1004)、本処理の実行を終了する。一方、ステップ1003にて肯定判定された場合には、そのまま本処理の実行を終了する。
この比較照合処理を実行することでも、読取文字画像情報C1と対応文字画像情報C2とを同一視可能か否かが判別可能となり、同一視不可能である場合には不一致信号を精度高く出力可能となる。
また、上述した実施の形態においては、生成部22に予め1つのフォントが指定されている場合について述べたが、生成部22に予め複数のフォントが指定されていてもよい。かかる場合、以下のように比較照合処理を実行すればよい。
すなわち、生成部22は、コード情報に対応する対応文字画像情報C2を生成するに際し、予め複数のフォントが指定されている場合には、全てのフォントの対応文字画像情報C2を生成し、生成した全ての対応文字画像情報C2を出力する。そして、比較照合部23は、文字認識部21が出力した読取文字画像情報C1と全ての対応文字画像情報C2とが同一視不可能と判断した場合には、不一致信号を出力し、読取文字画像情報C1と複数の対応文字画像情報C2の内のいずれかが同一視可能と判断した場合には、不一致信号は出力しない。
図11は、複数のフォントが指定された場合の比較照合処理の手順を示すフローチャートである。
比較照合部23は、先ず、読取文字画像情報C1の上下左右の長さを計測し、その上下左右の長さ、および解像度が一致するように、複数の対応文字画像情報C2の内から選択した対応文字画像情報C2を拡大または縮小することにより修正した文字画像情報C2´を生成する(ステップ1101)。
その後、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する(ステップ1102)。
そして、ステップ1102にて計測した画素数ΔNが予め定めた閾値より小さいか否かを判別する(ステップ1103)。そして、ステップ1103にて肯定判定された場合には、そのまま本処理の実行を終了する。
一方、ステップ1103にて否定判定された場合には、未照合の対応文字画像情報C2が残っているか否かを判別する(ステップ1104)。そして、ステップ1104にて肯定判定された場合には、ステップ1101以降の処理を再度行う。一方、ステップ1104にて否定判定された場合には、不一致信号を出力して(ステップ1105)、本処理の実行を終了する。
この比較照合処理を実行することでも、読取文字画像情報C1と複数の対応文字画像情報C2のいずれかが同一視可能であるかが判別可能となり、いずれも同一視不可能である場合には不一致信号を精度高く出力可能となる。
ここで、FAXなどで受け取った文書の画像の縦横比が歪んだ場合や、解像度200dpiで紙が受け渡される経路を通過した場合、スキャナ装置10の解像度が高くても画像情報が劣化している場合がある。そこで、比較照合部23は、読取文字画像情報C1のエッジ部をスムージングして読取文字画像情報C1を補正し、この補正した読取文字画像情報C1´を対応文字画像情報C2と比較照合することが好適である。
また、読取文字画像情報C1と対応文字画像情報C2とを同一視可能か否かの判断に用いる閾値を、条件に応じて変更することで、より使用者の使い勝手に合致した判断が可能となる。
条件の例としては、以下の事項が考えられる。図12は、条件と閾値との関係を示す図である。
条件1:コード情報が「1」(いち)と「l」(アルファベット小文字のエル)、「0」(ゼロ)と「O」(アルファベットのオー)など、正確に文字認識することが困難なコード情報の場合、重なり画素がより多いことで同一視可能と判断するように閾値を厳しくする(小さくする)。例えば、図12に示すように、コード情報が「1」(いち)または「l」(アルファベット小文字のエル)である場合には閾値は50に、「0」(ゼロ)または「O」(アルファベットのオー)である場合には閾値は20とする。
条件2:使用の開始時点では閾値を厳しく設定し、使用者が使う過程で閾値を調整する。使用開始時点では多くの文字が同一視不可能と判断されるが、使用者が使う過程で、「不一致と判断したのに一致していた」回数が多い場合には調整することで、より適切な判断に近づく。例えば、図12に示すように、初期設定時は200、その後使用過程で「不一致と判断したのに一致していた」回数が多い場合には使用者(ユーザ)の設定により300とする。
条件3:数字のみ、アルファベットのみ、漢字のみや、特定の国の言語のみなどの限定条件の指定を受けた場合にそれに応じた閾値を設定する。限定条件の指定は、使用者から文字認識処理を受け付ける際に受け付ければよい。例えば、図12に示すように、数字のみの場合は500、アルファベットのみの場合は450、数字とアルファベットの場合は400、漢字と数字とアルファベットの場合は300、ハングル文字のみの場合は400、任意の文字の場合は300に設定する。
条件4:使用者からのフィードバック、つまり、「不一致と判断したのに一致していた」や「一致と判断したのに不一致だった」などの情報を受け付けて閾値を調整する。例えば、図12に示すように、初期設定時には200とし、「不一致と判断したのに一致していた」との情報を受ける毎に10を加算し、「一致と判断したのに不一致だった」との情報を受ける毎に10を減算する。なお、かかる場合には下限値を50とするなどすることが好適である。
なお、これらの条件は同時に複数設定してもよい。
上記した条件例で閾値を変更する場合には以下のように処理すればよい。
以下、フローチャートを用いて、比較照合部23が行う閾値変更をも行う比較照合処理について説明する。図13は、比較照合部23が行う、閾値変更をも行う比較照合処理の手順を示すフローチャートである。
比較照合部23は、使用者から文字認識処理の要求を受けたことなどをトリガーとしてこの比較照合処理を実行開始する。
比較照合部23は、先ず、予め記憶している図12に示した条件と閾値との関係に従い閾値を設定する(ステップ1301)。例えば、取得した対応文字画像情報C2の基となるコード情報が、「1」(いち)、「l」(アルファベット小文字のエル)、「0」(ゼロ)、「O」(アルファベットのオー)などである場合には図12に示した閾値に設定する。また、条件3の限定条件が予め設定されている場合には図12に示した閾値に設定する。また、条件2および4に従って閾値が定められている場合にはその閾値に設定する。なお、例えば、条件3中の「数字のみ」の限定条件があり、取得した対応文字画像情報C2の基となるコード情報が、「1」(いち)である場合など、適用される条件の複数に該当する場合には、その中で最も厳しい(小さな)数字に設定する。
次に、読取文字画像情報C1の上下左右の長さを計測し、その上下左右の長さ、および解像度が一致するように対応文字画像情報C2を拡大または縮小することにより修正した文字画像情報C2´を生成する(ステップ1302)。
その後、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する(ステップ1303)。
そして、ステップ1303にて計測した画素数ΔNがステップ1301にて設定した閾値より小さいか否かを判別する(ステップ1304)。そして、ステップ1304にて否定判定された場合には、不一致信号を出力して(ステップ1305)、本処理の実行を終了する。一方、ステップ1304にて肯定判定された場合には、そのまま本処理の実行を終了する。
この比較照合処理を実行することでも、読取文字画像情報C1と対応文字画像情報C2とをより精度高く同一視可能か否かが判別可能となり、同一視不可能である場合には不一致信号を精度高く出力可能となる。
また、上述した実施の形態においては、比較照合部23が行う判断は、同一視可能か不可能かの2者択一であるが、同一視不可能である可能性を、重なっていない画素数ΔNに応じて高い、中程度、低いなどのレベル分けをすることが好適である。
すなわち、重なっていない画素数ΔNが第1の閾値(例えば、100)以下である場合には同一視不可能である可能性が低いと判断し、不一致の可能性が低い信号を出力する。また、ΔNが第2の閾値(例えば、300)以上である場合には同一視不可能である可能性が高いと判断し、不一致の可能性が高い信号を出力する。そして、ΔNが第1の閾値より大きく第2の閾値より小さい場合には同一視不可能である可能性が中レベルと判断し、不一致の可能性が中程度の信号を出力する。
また、比較照合部23が段階に応じた信号を出力する機能を有する場合においては、出力部24は以下の機能を有することが好適である。
すなわち、文字認識部21が出力したコード情報と比較照合部23が出力した段階に応じた信号とを取得し、この段階に応じた信号が出力された読取文字画像情報C1に対応するコード情報にこの段階に応じた信号を関連付け、この段階に応じた信号を関連付けたコード情報を出力する。
例えば、不一致の可能性が低い信号が関連付けられているコード情報に対応するフォントを例えばディスプレイに表示する際の画素の色が黒、不一致の可能性が中程度の信号が関連付けられたコード情報に対応するフォントの画素の色が青、不一致の可能性が高い信号が関連付けられたコード情報に対応するフォントの画素の色が赤となるように関連付けることが好適である。
以下、フローチャートを用いて、比較照合部23が行う他の比較照合処理について説明する。図14は、比較照合部23が行う他の比較照合処理の手順を示すフローチャートである。
比較照合部23は、使用者から文字認識処理の要求を受けたことなどをトリガーとしてこの比較照合処理を実行開始する。
比較照合部23は、先ず、読取文字画像情報C1の上下左右の長さを計測し、その上下左右の長さ、および解像度が一致するように対応文字画像情報C2を拡大または縮小することにより修正した文字画像情報C2´を生成する(ステップ1401)。
その後、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する(ステップ1402)。
そして、ステップ1402にて計測した画素数ΔNと予め定めた閾値とを比較する(ステップ1403)。そして、ステップ1403にて、重なっていない画素数ΔNが第1の閾値以下であると判断した場合には同一視不可能である可能性が低いとして不一致の可能性が低い信号を出力し(ステップ1404)、本処理の実行を終了する。また、ΔNが第1の閾値より大きく第2の閾値より小さいと判断した場合には同一視不可能である可能性が中レベルとして不一致の可能性が中程度の信号を出力し(ステップ1405)、本処理の実行を終了する。また、ΔNが第2の閾値以上であると判断した場合には同一視不可能である可能性が高いとして不一致の可能性が高い信号を出力し(ステップ1406)、本処理の実行を終了する。
なお、図11、図13、図14を用いて説明した比較照合処理においては、比較照合部23は、読取文字画像情報C1と修正した文字画像情報C2´との重なっていない画素数ΔNを計測し、この重なっていない画素数ΔNが閾値より小さいか否かで判断しているが、図4を用いて説明した比較照合処理のように、重なっていない画素数ΔNを修正した文字画像情報C2´の画素数Nfiで除した値(=ΔN/Nfi)が閾値より小さいか否かで判断してもよいことは言うまでもない。
1…情報処理システム、10…スキャナ装置、20…情報処理装置、21…文字認識部、22…生成部、23…比較照合部、24…出力部

Claims (9)

  1. 原稿の画像を読み取る画像読み取り装置にて得られた読取画像情報を受け付ける受付手段と、
    前記受付手段が受け付けた前記読取画像情報から1つの文字あるいは記号の画像情報である読取文字画像情報を抽出する抽出手段と、
    前記抽出手段が抽出した前記読取文字画像情報を文字あるいは記号を識別する識別情報に変換する変換手段と、
    前記変換手段が変換した前記識別情報に対応する画像情報である対応文字画像情報を生成する生成手段と、
    前記読取文字画像情報と前記対応文字画像情報とを比較し、これらの関連性を判断する判断手段と、
    前記判断手段による前記関連性に基づき前記変換手段が変換した識別情報と当該判断手段の判断結果とを関連付けて出力する出力手段と、
    を備える情報処理装置。
  2. 前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度を把握し、当該一致度の度合いに応じて前記関連性を判断することを特徴とする請求項1に記載の情報処理装置。
  3. 前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度と、前記識別情報に応じて定められた基準値とを比較することにより前記関連性を判断することを特徴とする請求項2に記載の情報処理装置。
  4. 前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度と、前記原稿に含まれる字体に応じて定められた基準値とを比較することにより前記関連性を判断することを特徴とする請求項2に記載の情報処理装置。
  5. 前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度と、予め設定され、その後当該判断手段の判断結果の正確性に応じて変更させられる基準値とを比較することにより前記関連性を判断することを特徴とする請求項2に記載の情報処理装置。
  6. 前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度が前記基準値よりも大きい場合には、これらの関連性が高く、当該一致度が当該基準値以下である場合には、これらの関連性が低いと判断し、
    前記出力手段は、前記判断手段が前記関連性が低いと判断した判断結果を前記識別情報に関連付けて出力することを特徴とする請求項1から5のいずれか1項に記載の情報処理装置。
  7. 前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との関連性が低いと判断する場合には、その程度を判断し、
    前記出力手段は、前記判断手段が判断した関連性が低い程度をも前記識別情報に関連付けることを特徴とする請求項1から6のいずれか1項に記載の情報処理装置。
  8. コンピュータに、
    原稿の画像を読み取る画像読み取り装置にて得られた読取画像情報を受け付ける機能と、
    前記受け付ける機能が受け付けた前記読取画像情報から1つの文字あるいは記号の画像情報である読取文字画像情報を抽出する機能と、
    前記抽出する機能が抽出した前記読取文字画像情報を文字あるいは記号を識別する識別情報に変換する機能と、
    前記変換する機能が変換した識別情報に対応する画像情報である対応文字画像情報を生成する機能と、
    前記読取文字画像情報と前記対応文字画像情報とを比較し、これらの関連性を判断する機能と、
    前記判断する機能による関連性に基づき前記変換する機能が変換した識別情報と当該判断する機能の判断結果とを関連付けて出力する機能と、
    を実現するためのプログラム。
  9. 前記判断する機能は、前記読取文字画像情報と前記対応文字画像情報との一致度を把握し、当該一致度の度合いに応じて前記関連性を判断することを特徴とする請求項8に記載のプログラム。
JP2009077424A 2009-03-26 2009-03-26 情報処理装置およびプログラム Active JP5381225B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009077424A JP5381225B2 (ja) 2009-03-26 2009-03-26 情報処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009077424A JP5381225B2 (ja) 2009-03-26 2009-03-26 情報処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2010231440A true JP2010231440A (ja) 2010-10-14
JP5381225B2 JP5381225B2 (ja) 2014-01-08

Family

ID=43047198

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009077424A Active JP5381225B2 (ja) 2009-03-26 2009-03-26 情報処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5381225B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014061309A1 (ja) * 2012-10-15 2014-04-24 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2020009345A (ja) * 2018-07-12 2020-01-16 スキャネット株式会社 答案採点のシステム、プログラムおよび方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63204487A (ja) * 1987-02-20 1988-08-24 Nippon Telegr & Teleph Corp <Ntt> 文字読取方法
JPH03172982A (ja) * 1989-12-01 1991-07-26 Oki Electric Ind Co Ltd 文字認識装置
JPH06282680A (ja) * 1993-03-25 1994-10-07 Oki Electric Ind Co Ltd 文字認識処理装置
JP2000207486A (ja) * 1999-01-18 2000-07-28 Ricoh Co Ltd 文字認識装置、誤認文字等検出方法及び誤認文字等検出プログラムを記録した媒体
JP2010061471A (ja) * 2008-09-04 2010-03-18 Fuji Xerox Co Ltd 文字認識装置およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63204487A (ja) * 1987-02-20 1988-08-24 Nippon Telegr & Teleph Corp <Ntt> 文字読取方法
JPH03172982A (ja) * 1989-12-01 1991-07-26 Oki Electric Ind Co Ltd 文字認識装置
JPH06282680A (ja) * 1993-03-25 1994-10-07 Oki Electric Ind Co Ltd 文字認識処理装置
JP2000207486A (ja) * 1999-01-18 2000-07-28 Ricoh Co Ltd 文字認識装置、誤認文字等検出方法及び誤認文字等検出プログラムを記録した媒体
JP2010061471A (ja) * 2008-09-04 2010-03-18 Fuji Xerox Co Ltd 文字認識装置およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014061309A1 (ja) * 2012-10-15 2014-04-24 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2014081714A (ja) * 2012-10-15 2014-05-08 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2020009345A (ja) * 2018-07-12 2020-01-16 スキャネット株式会社 答案採点のシステム、プログラムおよび方法

Also Published As

Publication number Publication date
JP5381225B2 (ja) 2014-01-08

Similar Documents

Publication Publication Date Title
US8954845B2 (en) Image processing device, method and storage medium for two-way linking between related graphics and text in an electronic document
US8605336B2 (en) Image processing apparatus, image processing system, and image conducting character recognition with respect to image data
US7889929B2 (en) Image processing apparatus, image processing method, computer readable medium storing program and data signal embedded with the program
US8126270B2 (en) Image processing apparatus and image processing method for performing region segmentation processing
US8965125B2 (en) Image processing device, method and storage medium for storing and displaying an electronic document
US20100315681A1 (en) Image processing apparatus, image processing method, and computer-readable storage medium
JP2011008549A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP6000992B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
US11941903B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium
JP2019159633A (ja) 画像処理装置、画像処理方法および画像処理プログラム
US8339623B2 (en) Paper document processing apparatus, paper document processing method, and computer readable medium
JP2010061471A (ja) 文字認識装置およびプログラム
JP5381225B2 (ja) 情報処理装置およびプログラム
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
US9215344B2 (en) Image forming apparatus, image processing apparatus, image forming method, image processing method, and non-transitory computer readable medium
JP4924990B2 (ja) 文書処理装置および文書処理プログラム
US11528387B2 (en) Information processing apparatus, method and non-transitory recording medium storing program codes for replacing color of character pixel based on selection of first and second processing methods
WO2002003240A1 (en) Proofreading system of chinese characters by means of one-to-one comparison
JP6763173B2 (ja) 文書修正方法、文書修正装置、およびコンピュータプログラム
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2013090262A (ja) 文書文字差異検出装置
JP2012190357A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2016111482A (ja) 画像処理装置および画像処理装置の制御方法
JPH10171917A (ja) 文字認識装置、その文字認識方法およびその記録媒体
JP7234554B2 (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130815

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130916

R150 Certificate of patent or registration of utility model

Ref document number: 5381225

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350