JP2010231440A - 情報処理装置およびプログラム - Google Patents
情報処理装置およびプログラム Download PDFInfo
- Publication number
- JP2010231440A JP2010231440A JP2009077424A JP2009077424A JP2010231440A JP 2010231440 A JP2010231440 A JP 2010231440A JP 2009077424 A JP2009077424 A JP 2009077424A JP 2009077424 A JP2009077424 A JP 2009077424A JP 2010231440 A JP2010231440 A JP 2010231440A
- Authority
- JP
- Japan
- Prior art keywords
- image information
- character image
- information
- read
- relevance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【解決手段】原稿の画像を読み取る画像読み取り装置にて得られた読取画像情報を受け付ける受付手段と、受付手段が受け付けた読取画像情報から1つの文字あるいは記号の画像情報である読取文字画像情報C1を抽出するともに読取文字画像情報を文字あるいは記号を識別するコード情報に変換する文字認識部21と、文字認識部21が変換した識別情報に対応する画像情報である対応文字画像情報C2を生成する生成部22と、読取文字画像情報C1と対応文字画像情報C2とを比較し、これらの関連性を判断する比較照合部23と、比較照合部23による関連性に基づき文字認識部21が変換した識別情報と比較照合部23の判断結果とを関連付けて出力する出力部24とを備える。
【選択図】図3
Description
請求項3に記載の発明は、前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度と、前記識別情報に応じて定められた基準値とを比較することにより前記関連性を判断することを特徴とする請求項2に記載の情報処理装置である。
請求項5に記載の発明は、前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度と、予め設定され、その後当該判断手段の判断結果の正確性に応じて変更させられる基準値とを比較することにより前記関連性を判断することを特徴とする請求項2に記載の情報処理装置である。
請求項7に記載の発明は、前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との関連性が低いと判断する場合には、その程度を判断し、前記出力手段は、前記判断手段が判断した関連性が低い程度をも前記識別情報に関連付けることを特徴とする請求項1から6のいずれか1項に記載の情報処理装置である。
請求項9に記載の発明は、前記判断する機能は、前記読取文字画像情報と前記対応文字画像情報との一致度を把握し、当該一致度の度合いに応じて前記関連性を判断することを特徴とする請求項8に記載のプログラムである。
請求項2の発明によれば、関連性の判断レベルを画像情報によらず統一させることができる。
請求項3の発明によれば、本発明を採用しない場合に比べて、識別情報に依存する変換困難性にかかわらずより精度高く関連性を判断することができる。
請求項5の発明によれば、識別情報への変換精度を加味して関連性を判断することができる。
請求項6の発明によれば、変換した識別情報の関連性をより精度高く出力することができ、変換した識別情報が正しいか否かを確認する作業の効率を向上させることができる。
請求項7の発明によれば、本発明を採用しない場合に比べて、変換した識別情報の読取画像情報との関連性が高くない度合いをも認識させることができ、変換した識別情報の正確性の確認作業の自由度を増加させることができる。
請求項9の発明によれば、関連性の判断レベルを画像情報によらず統一させることができる。
本実施形態に係る情報処理システム1は、原稿(紙文書)D1の画像を光学的に読み取り、その原稿を構成する画像情報(データ)D2を形成するスキャナ装置10と、画像情報D2をコード情報(識別情報)に変換し、これに基づいて文書情報(データ)D3を出力する情報処理装置20とを有している。
図2は、情報処理装置20のハードウェア構成例を示す図である。
情報処理装置20は、キーボードやマウスなどの操作により情報を入力する入力部201と、ディスプレイに文字、図形などの情報を表示する表示部202と、スキャナ装置10などの外部機器やネットワークとの接続を可能にするインタフェース203とを有している。
外部記憶部205には、予め下記の機能を実現するための各種プログラムが記憶されており、これらは使用者の起動命令を受けて主記憶部204に読み出され、それらの機能が利用可能になる。
情報処理装置20は、画像情報D2に含まれる画像情報をコード情報に変換する文字認識部21と、文字認識部21が変換したコード情報を基に当該コード情報に対応する画像情報を生成する生成部22とを有している。また、情報処理装置20は、生成部22が生成した画像情報とスキャナ装置10が形成した画像情報とを比較照合する比較照合部23と、比較照合部23が比較照合した結果を文字認識部21が変換したコード情報に関連付けて出力する出力部24とを有している。
比較照合部23は、文字認識部21が出力した読取文字画像情報C1と生成部22が出力した対応文字画像情報C2とを取得し、この読取文字画像情報C1と対応文字画像情報C2とを比較照合する。そして、比較照合した結果、読取文字画像情報C1と対応文字画像情報C2とを同一視不可能と判断した場合には、不一致信号を出力する。言い換えれば、比較照合した結果、読取文字画像情報C1と対応文字画像情報C2との関連性が低いと判断した場合には、不一致信号を出力する。
先ず、読取文字画像情報C1の上下左右の長さを計測し、その上下左右の長さ、および解像度が一致するように対応文字画像情報C2を拡大または縮小して、修正した文字画像情報C2´を生成する。なお、解像度はスキャンする際に使用者により指定された値である。
次に、修正した文字画像情報C2´の画素数Nfiを計測する。
また、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する。より具体的には、色のついている画素を“1”、白い画素を“0”とすると、両画像情報の同じ座標の各画素同士の排他的論理和は、両方の画素とも色つきの場合は“0”、または両方の画素とも白の場合は“0”となる。また、どちらか一方の画素が色つきで、一方が白の場合は“1”となる。この画素ごとの排他的論理和を積算した値を、2つの画像情報間の差ΔNとする。ΔNは、同じ画素同士の重なりが多ければ小さく、異なる画素の重なりが多ければ大きな値となる。例えば、重ねた画像がまったく同じであれば、ΔNは零である。
図4は、比較照合部23が行う比較照合処理の手順を示すフローチャートである。
比較照合部23は、使用者から文字認識処理の要求を受けたことなどをトリガーとしてこの比較照合処理を実行開始する。
その後、ステップ401にて生成した文字画像情報C2´の画素数Nfiを計測する(ステップ402)。
また、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する(ステップ403)。
このように、比較照合部23がかかる比較照合処理を実行することで、読取文字画像情報C1と対応文字画像情報C2とを同一視可能か否かが判別可能となり、同一視不可能である場合には不一致信号を精度高く出力可能となる。
図5は、印刷した原稿を示す図である。図6は、スキャナ装置10にてスキャンされた原稿を示す図である。
図5に示した、数字の七を算用数字で「7」と印刷した原稿が、複写時あるいは人から人に交換されるうちに、画像の一部に欠落が生じたり汚れが付着したりすることにより図6のように変形し、この状態でスキャナ装置10にてスキャンされたとする。文字認識部21は、図6にある黒い部分を読取文字画像情報C1として出力する。
文字認識部21は、図6の形から数字の「1」であると認識し、コード情報として、16進数の“31”に変換して出力する。つまり、正しくは、図7に示すように16進数の“37”とすべきところを“31”に変換して出力する。
生成部22は、文字認識部21が変換したコード情報“31”に対応する文字のフォント画像情報である対応文字画像情報C2を、予め指定されたフォントで生成し、生成した対応文字画像情報C2を出力する。この生成部22が出力する対応文字画像情報C2を表示すると図8の通りとなる。
図9は、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせて表示した図である。比較照合部23は、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する。
そして、ΔN/Nfiを算出し、ΔN/Nfiが予め定めた閾値以上である場合には、読取文字画像情報C1と対応文字画像情報C2とは同一視不可能と判断し、不一致信号を出力する。ΔN/Nfiが予め定めた閾値より小さい場合には、読取文字画像情報C1と対応文字画像情報C2とは同一視可能と判断し、不一致信号は出力しない。
すなわち、比較照合部23は、読取文字画像情報C1と修正した文字画像情報C2´との重なっていない画素数ΔNを計測し、この重なっていない画素数ΔNが閾値より小さいか否かで判断してもよい。
比較照合部23は、使用者から文字認識処理の要求を受けたことなどをトリガーとしてこの比較照合処理を実行開始する。
その後、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する(ステップ1002)。
この比較照合処理を実行することでも、読取文字画像情報C1と対応文字画像情報C2とを同一視可能か否かが判別可能となり、同一視不可能である場合には不一致信号を精度高く出力可能となる。
すなわち、生成部22は、コード情報に対応する対応文字画像情報C2を生成するに際し、予め複数のフォントが指定されている場合には、全てのフォントの対応文字画像情報C2を生成し、生成した全ての対応文字画像情報C2を出力する。そして、比較照合部23は、文字認識部21が出力した読取文字画像情報C1と全ての対応文字画像情報C2とが同一視不可能と判断した場合には、不一致信号を出力し、読取文字画像情報C1と複数の対応文字画像情報C2の内のいずれかが同一視可能と判断した場合には、不一致信号は出力しない。
比較照合部23は、先ず、読取文字画像情報C1の上下左右の長さを計測し、その上下左右の長さ、および解像度が一致するように、複数の対応文字画像情報C2の内から選択した対応文字画像情報C2を拡大または縮小することにより修正した文字画像情報C2´を生成する(ステップ1101)。
その後、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する(ステップ1102)。
一方、ステップ1103にて否定判定された場合には、未照合の対応文字画像情報C2が残っているか否かを判別する(ステップ1104)。そして、ステップ1104にて肯定判定された場合には、ステップ1101以降の処理を再度行う。一方、ステップ1104にて否定判定された場合には、不一致信号を出力して(ステップ1105)、本処理の実行を終了する。
この比較照合処理を実行することでも、読取文字画像情報C1と複数の対応文字画像情報C2のいずれかが同一視可能であるかが判別可能となり、いずれも同一視不可能である場合には不一致信号を精度高く出力可能となる。
条件の例としては、以下の事項が考えられる。図12は、条件と閾値との関係を示す図である。
条件1:コード情報が「1」(いち)と「l」(アルファベット小文字のエル)、「0」(ゼロ)と「O」(アルファベットのオー)など、正確に文字認識することが困難なコード情報の場合、重なり画素がより多いことで同一視可能と判断するように閾値を厳しくする(小さくする)。例えば、図12に示すように、コード情報が「1」(いち)または「l」(アルファベット小文字のエル)である場合には閾値は50に、「0」(ゼロ)または「O」(アルファベットのオー)である場合には閾値は20とする。
なお、これらの条件は同時に複数設定してもよい。
以下、フローチャートを用いて、比較照合部23が行う閾値変更をも行う比較照合処理について説明する。図13は、比較照合部23が行う、閾値変更をも行う比較照合処理の手順を示すフローチャートである。
比較照合部23は、使用者から文字認識処理の要求を受けたことなどをトリガーとしてこの比較照合処理を実行開始する。
その後、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する(ステップ1303)。
この比較照合処理を実行することでも、読取文字画像情報C1と対応文字画像情報C2とをより精度高く同一視可能か否かが判別可能となり、同一視不可能である場合には不一致信号を精度高く出力可能となる。
すなわち、重なっていない画素数ΔNが第1の閾値(例えば、100)以下である場合には同一視不可能である可能性が低いと判断し、不一致の可能性が低い信号を出力する。また、ΔNが第2の閾値(例えば、300)以上である場合には同一視不可能である可能性が高いと判断し、不一致の可能性が高い信号を出力する。そして、ΔNが第1の閾値より大きく第2の閾値より小さい場合には同一視不可能である可能性が中レベルと判断し、不一致の可能性が中程度の信号を出力する。
すなわち、文字認識部21が出力したコード情報と比較照合部23が出力した段階に応じた信号とを取得し、この段階に応じた信号が出力された読取文字画像情報C1に対応するコード情報にこの段階に応じた信号を関連付け、この段階に応じた信号を関連付けたコード情報を出力する。
比較照合部23は、使用者から文字認識処理の要求を受けたことなどをトリガーとしてこの比較照合処理を実行開始する。
その後、読取文字画像情報C1と修正した文字画像情報C2´とを重ね合わせ、排他的論理和をとることで、重なっていない画素数ΔNを計測する(ステップ1402)。
Claims (9)
- 原稿の画像を読み取る画像読み取り装置にて得られた読取画像情報を受け付ける受付手段と、
前記受付手段が受け付けた前記読取画像情報から1つの文字あるいは記号の画像情報である読取文字画像情報を抽出する抽出手段と、
前記抽出手段が抽出した前記読取文字画像情報を文字あるいは記号を識別する識別情報に変換する変換手段と、
前記変換手段が変換した前記識別情報に対応する画像情報である対応文字画像情報を生成する生成手段と、
前記読取文字画像情報と前記対応文字画像情報とを比較し、これらの関連性を判断する判断手段と、
前記判断手段による前記関連性に基づき前記変換手段が変換した識別情報と当該判断手段の判断結果とを関連付けて出力する出力手段と、
を備える情報処理装置。 - 前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度を把握し、当該一致度の度合いに応じて前記関連性を判断することを特徴とする請求項1に記載の情報処理装置。
- 前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度と、前記識別情報に応じて定められた基準値とを比較することにより前記関連性を判断することを特徴とする請求項2に記載の情報処理装置。
- 前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度と、前記原稿に含まれる字体に応じて定められた基準値とを比較することにより前記関連性を判断することを特徴とする請求項2に記載の情報処理装置。
- 前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度と、予め設定され、その後当該判断手段の判断結果の正確性に応じて変更させられる基準値とを比較することにより前記関連性を判断することを特徴とする請求項2に記載の情報処理装置。
- 前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との一致度が前記基準値よりも大きい場合には、これらの関連性が高く、当該一致度が当該基準値以下である場合には、これらの関連性が低いと判断し、
前記出力手段は、前記判断手段が前記関連性が低いと判断した判断結果を前記識別情報に関連付けて出力することを特徴とする請求項1から5のいずれか1項に記載の情報処理装置。 - 前記判断手段は、前記読取文字画像情報と前記対応文字画像情報との関連性が低いと判断する場合には、その程度を判断し、
前記出力手段は、前記判断手段が判断した関連性が低い程度をも前記識別情報に関連付けることを特徴とする請求項1から6のいずれか1項に記載の情報処理装置。 - コンピュータに、
原稿の画像を読み取る画像読み取り装置にて得られた読取画像情報を受け付ける機能と、
前記受け付ける機能が受け付けた前記読取画像情報から1つの文字あるいは記号の画像情報である読取文字画像情報を抽出する機能と、
前記抽出する機能が抽出した前記読取文字画像情報を文字あるいは記号を識別する識別情報に変換する機能と、
前記変換する機能が変換した識別情報に対応する画像情報である対応文字画像情報を生成する機能と、
前記読取文字画像情報と前記対応文字画像情報とを比較し、これらの関連性を判断する機能と、
前記判断する機能による関連性に基づき前記変換する機能が変換した識別情報と当該判断する機能の判断結果とを関連付けて出力する機能と、
を実現するためのプログラム。 - 前記判断する機能は、前記読取文字画像情報と前記対応文字画像情報との一致度を把握し、当該一致度の度合いに応じて前記関連性を判断することを特徴とする請求項8に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009077424A JP5381225B2 (ja) | 2009-03-26 | 2009-03-26 | 情報処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009077424A JP5381225B2 (ja) | 2009-03-26 | 2009-03-26 | 情報処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010231440A true JP2010231440A (ja) | 2010-10-14 |
JP5381225B2 JP5381225B2 (ja) | 2014-01-08 |
Family
ID=43047198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009077424A Active JP5381225B2 (ja) | 2009-03-26 | 2009-03-26 | 情報処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5381225B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014061309A1 (ja) * | 2012-10-15 | 2014-04-24 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP2020009345A (ja) * | 2018-07-12 | 2020-01-16 | スキャネット株式会社 | 答案採点のシステム、プログラムおよび方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63204487A (ja) * | 1987-02-20 | 1988-08-24 | Nippon Telegr & Teleph Corp <Ntt> | 文字読取方法 |
JPH03172982A (ja) * | 1989-12-01 | 1991-07-26 | Oki Electric Ind Co Ltd | 文字認識装置 |
JPH06282680A (ja) * | 1993-03-25 | 1994-10-07 | Oki Electric Ind Co Ltd | 文字認識処理装置 |
JP2000207486A (ja) * | 1999-01-18 | 2000-07-28 | Ricoh Co Ltd | 文字認識装置、誤認文字等検出方法及び誤認文字等検出プログラムを記録した媒体 |
JP2010061471A (ja) * | 2008-09-04 | 2010-03-18 | Fuji Xerox Co Ltd | 文字認識装置およびプログラム |
-
2009
- 2009-03-26 JP JP2009077424A patent/JP5381225B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63204487A (ja) * | 1987-02-20 | 1988-08-24 | Nippon Telegr & Teleph Corp <Ntt> | 文字読取方法 |
JPH03172982A (ja) * | 1989-12-01 | 1991-07-26 | Oki Electric Ind Co Ltd | 文字認識装置 |
JPH06282680A (ja) * | 1993-03-25 | 1994-10-07 | Oki Electric Ind Co Ltd | 文字認識処理装置 |
JP2000207486A (ja) * | 1999-01-18 | 2000-07-28 | Ricoh Co Ltd | 文字認識装置、誤認文字等検出方法及び誤認文字等検出プログラムを記録した媒体 |
JP2010061471A (ja) * | 2008-09-04 | 2010-03-18 | Fuji Xerox Co Ltd | 文字認識装置およびプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014061309A1 (ja) * | 2012-10-15 | 2014-04-24 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP2014081714A (ja) * | 2012-10-15 | 2014-05-08 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP2020009345A (ja) * | 2018-07-12 | 2020-01-16 | スキャネット株式会社 | 答案採点のシステム、プログラムおよび方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5381225B2 (ja) | 2014-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8954845B2 (en) | Image processing device, method and storage medium for two-way linking between related graphics and text in an electronic document | |
US8605336B2 (en) | Image processing apparatus, image processing system, and image conducting character recognition with respect to image data | |
US7889929B2 (en) | Image processing apparatus, image processing method, computer readable medium storing program and data signal embedded with the program | |
US8126270B2 (en) | Image processing apparatus and image processing method for performing region segmentation processing | |
US8965125B2 (en) | Image processing device, method and storage medium for storing and displaying an electronic document | |
US20100315681A1 (en) | Image processing apparatus, image processing method, and computer-readable storage medium | |
JP2011008549A (ja) | 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体 | |
JP6000992B2 (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
US11941903B2 (en) | Image processing apparatus, image processing method, and non-transitory storage medium | |
JP2019159633A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
US8339623B2 (en) | Paper document processing apparatus, paper document processing method, and computer readable medium | |
JP2010061471A (ja) | 文字認識装置およびプログラム | |
JP5381225B2 (ja) | 情報処理装置およびプログラム | |
US10638001B2 (en) | Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data | |
US9215344B2 (en) | Image forming apparatus, image processing apparatus, image forming method, image processing method, and non-transitory computer readable medium | |
JP4924990B2 (ja) | 文書処理装置および文書処理プログラム | |
US11528387B2 (en) | Information processing apparatus, method and non-transitory recording medium storing program codes for replacing color of character pixel based on selection of first and second processing methods | |
WO2002003240A1 (en) | Proofreading system of chinese characters by means of one-to-one comparison | |
JP6763173B2 (ja) | 文書修正方法、文書修正装置、およびコンピュータプログラム | |
JP5159588B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP2013090262A (ja) | 文書文字差異検出装置 | |
JP2012190357A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP2016111482A (ja) | 画像処理装置および画像処理装置の制御方法 | |
JPH10171917A (ja) | 文字認識装置、その文字認識方法およびその記録媒体 | |
JP7234554B2 (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130618 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130815 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130916 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5381225 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |