JP6474161B2 - 画像処理装置、画像処理方法および画像処理プログラム - Google Patents

画像処理装置、画像処理方法および画像処理プログラム Download PDF

Info

Publication number
JP6474161B2
JP6474161B2 JP2016036176A JP2016036176A JP6474161B2 JP 6474161 B2 JP6474161 B2 JP 6474161B2 JP 2016036176 A JP2016036176 A JP 2016036176A JP 2016036176 A JP2016036176 A JP 2016036176A JP 6474161 B2 JP6474161 B2 JP 6474161B2
Authority
JP
Japan
Prior art keywords
image data
image
data
character recognition
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016036176A
Other languages
English (en)
Other versions
JP2017153040A (ja
Inventor
浩章 島
浩章 島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Skycom Corp
Original Assignee
Skycom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Skycom Corp filed Critical Skycom Corp
Priority to JP2016036176A priority Critical patent/JP6474161B2/ja
Publication of JP2017153040A publication Critical patent/JP2017153040A/ja
Application granted granted Critical
Publication of JP6474161B2 publication Critical patent/JP6474161B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像処理装置、画像処理方法および画像処理プログラムに関する。
従来、領収書や契約書、証明書面等の重要文書は、紙である原本をファイリングし保存することが原則であった。しかし、近年では管理の効率化や省力化を図るため、また電子データでの管理を認める法律の整備に伴い電子データで管理されることが多くなっている。重要文書の電子データでの管理は、紙での管理より容易ではあるが、年々増え続けていくデータを管理するシステムが必要であるとともに、通信ネットワークや記憶領域の負荷を軽減するためにデータ量を低減する必要がある。このような課題に対応する技術として、紙文書をスキャナで読み取り、読み取ったスキャン画像に対し、ユーザが設定したスキャン条件の解像度、色数、色合い等で画像処理を施し、設定された所定の画像フォーマット形式に変換する技術が開示される(特許文献1参照)。
特開2008−288686号公報
しかしながら、特許文献1に記載された技術は、ユーザが設定したスキャン条件によって画像処理される技術であるため、領収書やパスポートのように様々な形式や文字の大きさ、色使いである文書を大量に適切に読取ることは、ユーザに多大な作業負担を与えてしまうという問題があった。
本発明は、上記に鑑みてなされたものであって、ユーザに作業負担を掛けることなく、文字を含む画像データのデータ量を低減することができる画像処理装置、画像処理方法および画像処理プログラムを提供することを目的とする。
上述した課題を解決するために、本発明では、画像データに対し文字認識することによって認識された第1のテキストデータを抽出し、画像データの解像度を変更した変換画像データを生成し、変換画像データを文字認識することによって認識された第2のテキストデータを抽出し、第1のテキストデータと第2のテキストデータとを対比し、第1のテキストデータに対し第2のテキストデータが一致しない割合を示す不一致度が所定の範囲内であるか否かを判断し、不一致度が所定の範囲内であると判断した場合に、画像データを変換画像データに置き換えることを特徴とする。
上記のように構成した本発明によれば、ユーザに作業負担を掛けることなく、文字を含む画像データのデータ量を低減することができるという効果を奏する。
本実施例にかかるPDFファイル生成システム10の構成を示すブロック図である。 レイアウトテンプレート記憶部110のデータ構成の一例を示す説明図である。 サーバ100および情報端末装置200が実行するPDFファイル生成処理手順を示すフローチャートである。 画像データの変換と文字認識の一例を示す説明図である。
以下、添付図面を参照し、本発明にかかる画像処理装置、画像処理方法および画像処理プログラムの実施例を説明する。なお、以下の説明は、実施の形態の一例であり、本発明は、これらの実施例に限定されるものではない。
まず、実施例にかかるPDFファイル生成システム10の概要について説明する。図1は、本実施例にかかるPDFファイル生成システム10の構成を示すブロック図である。図1に示すように、PDFファイル生成システム10は、サーバ100と情報端末装置200とを備え、サーバ100と情報端末装置200は、ネットワーク1を介して相互に通信可能に接続する。ネットワーク1は、有線または無線を問わず、インターネット、イントラネット、LAN(Local Area Network)やVPN(Virtual Private Network)、移動体通信網等の任意の種類の通信ネットワークである。
サーバ100は、所定のレイアウトテンプレートに従い画像データを含むPDF(Portable Document Format)ファイルを生成する。サーバ100の機能、構成について説明する。サーバ100は、レイアウトテンプレート記憶部110、送受信部101、文字認識部102、画像変換部103、置換判断部104、画像置換部105、PDFファイル生成部106を備える。
図2は、レイアウトテンプレート記憶部110のデータ構成の一例を示す説明図である。 レイアウトテンプレート記憶部110は、情報端末装置200から送信されたデータからPDFファイルを生成する際に必要となるレイアウトに関する情報であるレイアウトテンプレートをフォーマット種別ごとに記憶する。例えば、レイアウトテンプレートは、フォーマット種別ごとに、画像データの配置位置である座標、解像度、標題等を記憶する。
送受信部101は、情報端末装置200との間で様々なデータを送受信する。具体的には、送受信部101は、情報端末装置200で入力したフォーマット種別と画像データを受信し、PDFファイルを情報端末装置200に送信する。
文字認識部102は、画像データに対しOCR(Optical Character Recognition)技術を用いて文字認識を行い、画像データからテキストデータを抽出する。
画像変換部103は、画像データの解像度を変更し解像度の異なる画像データを生成する。具体的には、画像変換部103は、画像データの画素数を間引くこと(ダウンサンプリング)によって解像度(すなわち単位長さあたりの画素数)を変更した画像データを生成する。ダウンサンプリングの方式には、バイリニア法、ニアレストネイバー法、バイキュービック法があるが、その他の既知の方法を用いてもよい。
置換判断部104は、画像変換部103によって変換した画像データ(以下、変換画像データという)を、情報端末装置200から送信された画像データ(以下、元画像データという)に置き換えるか否かを判断する。具体的には、置換判断部104は、元画像データを文字認識し生成したテキストデータと、変換画像データを文字認識し生成したテキストデータとを対比し、元画像データのテキストデータと変換画像データのテキストデータとが一致しない文字の全文字に対する割合を示す不一致度を算出し、不一致度が所定の範囲内か否かを判断する。
画像置換部105は、置換判断部104によって不一致度が所定の範囲内であると判断した場合に、元画像データと変換画像データを置き換える。
PDFファイル生成部106は、レイアウトテンプレート記憶部110に記憶したレイアウトテンプレートに従い、画像置換部105によって置換された画像データを含むPDFファイルを生成する。
情報端末装置200は、画像データとフォーマット種別をサーバ100に送信し、PDFファイルを受信する。情報端末装置200は、スマートフォン、タブレット型コンピュータ、パーソナルコンピュータ、ゲーム機等であり、ウェブブラウザを備える。
上述のように構成されたPDFファイル生成システム10で実行するPDFファイル生成処理について説明する。図3は、サーバ100および情報端末装置200が実行するPDFファイル生成処理手順を示すフローチャートである。
情報端末装置200は、画像データとフォーマット種別をサーバ100に送信する(ステップS301)。画像データは、カメラ機能で撮像した、領収書等の文字の画像を含むデータであり、情報端末装置200に内蔵するカメラ機能で撮像したデータでも、デジタルカメラ等で撮像し情報端末装置200に読込んだデータでもよい。
サーバ100の送受信部101は、画像データとフォーマット種別を受信する(ステップS302)。文字認識部102は、画像データに対しOCR技術を用いて文字を認識しテキストデータを抽出する。(ステップS303)。図4は、画像データの変換と文字認識の一例を示す説明図である。図4に示す例では、解像度600ppi(pixel per inch)の元画像データを文字認識することによって“あいうえおかきくけこさしすせそ・・・
”の文字が認識される。
画像変換部103は、元画像データの解像度を変更した変換画像データを生成する(ステップS304)。図4に示す例では、元画像データをダウンサンプリングすることにより、解像度480ppiの変換画像データ1に変換する。文字認識部102は、変換画像データに対しOCR技術を用いて文字を認識しテキストデータを抽出する。(ステップS305)。図4に示す例では、変換画像データ1を文字認識することによって“あいうえそかきくけこさしつせそ・・・
”の文字が認識され、元画像データの“お”が“そ”に、元画像データの“す”が“つ”に認識された。
置換判断部104は、画像データのテキストデータと変換画像データのテキストデータを対比し、不一致度を算出する(ステップS306)。図4に示す例では、変換画像データ1の不一致度は18%と算出される。なお、元画像データの文字を同一の文字と認識しない場合に限らず、文字として認識されない場合も一致していない文字と判断し、不一致度を算出する。
置換判断部104は、不一致度が所定の範囲内であるか否かを判断する(ステップS307)。
例えば、所定の範囲が“20%以上25%未満”の場合は、変換画像データ1の不一致度は“18%”であることから、所定の範囲内ではないと判断される。不一致度が所定の範囲内でないと判断した場合(ステップS307:No)、ステップS304に進み、元画像データに対し解像度をさらに変更した変換画像データを生成し、処理を実行する。図4に示す例では、元画像データを解像度384ppiに変換し変換画像データ2を生成する。
不一致度が所定の範囲内であると判断した場合(ステップS307:Yes)、画像置換部105は、元画像データを変換画像データに置き換える(ステップS308)。図4に示す例では、変換画像データ2は、不一致度が“23%”で所定の範囲内であると判断されるため、元画像データを変換画像データ2に置き換える。
PDFファイル生成部106は、画像データを含むPDFファイルを生成する(ステップS309)。具体的には、PDFファイル生成部106は、フォーマット種別に対応するレイアウトテンプレートをレイアウトテンプレート記憶部110から取得し、取得したレイアウトテンプレートに基づき画像データを含むPDFファイルを生成する。送受信部101は、PDFファイルを情報端末装置200に送信する(ステップS310)。情報端末装置200は、PDFファイルを受信する(ステップS311)。
このように、元画像データを、元画像データと対比し所定の範囲内の不一致度である、解像度を落とした変換画像データに置き換えることによって、人間の視覚での文字判別可能であり、かつ、データ量を抑えた画像データを得ることができる。これは、人間の視覚が解像度の低い画像の文字であっても脳内で補完することによって文字を判別できることを利用したものである。
また、画像データを含むPDFファイルを生成することによって画像データのデータ形式を問わず、広く普及しているPDFリーダによって画像の内容を確認することができ、管理を容易にすることができる。
上述した実施例では、情報端末装置200から送信された画像データに対し文字認識処理を実行したが、文字認識処理を実行する前に、画像データを整形する処理を実行してもよい。画像データを整形する処理とは、画像データがスマートフォンのカメラ機能等で撮像されたデータである場合、対象の形状通りに撮像されず、前後左右において多少歪んで撮像される場合が多いため、本来は長方形であるが台形等に歪んだ領収書やパスポート等の画像データを書面の端部を検出し長方形に整形する処理である。
また、PDFファイル生成部106でPDFファイルを生成した後、PDFファイルに電子署名やタイムスタンプを付与する処理を加えてもよい。これにより、撮像した画像データやPDFファイルに含まれるデータの改ざんを検知することが可能となり、PDFファイルの信頼性を向上させることができる。
また、文字認識部102によって画像データを文字認識する前に、画像データの文字領域を特定する処理を実行したうえで、その領域の画像を文字認識してもよい。これにより、パスポートのような文字のみではなく写真等を含む画像データの場合であっても、より適切な解像度で画像データを変換することができる。さらに、特定した画像データの文字領域のみの解像度を変更した画像データを生成し置き換えてもよい。
上述した実施例のサーバ100および情報端末装置200は、装置全体の制御を行うCPU(Central Processing Unit)等の制御装置と、各種データや各種プログラムを記憶するROM(Read Only Memory)やRAM(Random Access Memory)等の主記憶装置と、各種データや各種プログラムを記憶するHDD(Hard Disk Drive)やDVD(Digital Versatile Disc)ドライブ装置等の外部記憶装置と、外部のコンピュータと通信を行う通信制御装置と、これらを接続するバスとを備えており、通常のコンピュータを利用したハードウェア構成となっている。CPUがプログラムをHDDから読み出しRAMに展開し、動作させることによって、上述した機能や処理を実現する。各記憶部は、RAM上に構成するほか、HDD、光ディスク、メモリカードなどの一般的に利用されているあらゆる記憶媒体によって構成することができる。
また、サーバ100、情報端末装置200で動作する、上述した機能や処理を実現するプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、DVD等のコンピュータで読取り可能な記録媒体に記録して提供することもでき、ネットワーク経由でダウンロードさせることにより提供することもできる。
上述した機能や処理を実現するプログラムは、API(Application Programming Interface)、SaaS(Software as a Service)、クラウドコンピューティングという利用形態で提供してもよい。
また、図示したサーバ100、情報端末装置200の構成要素は、必ずしも物理的に図示のように構成されている必要はない。すなわち、これらの装置の具体的態様は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分割、統合、入替え、変形または削除して構成することができる。
1…ネットワーク、10…PDFファイル生成システム、100…サーバ、101…送受信部、102…文字認識部、103…画像変換部、104…置換判断部、105…画像置換部、106…PDFファイル生成部、110…レイアウトテンプレート記憶部、200…情報端末装置

Claims (6)

  1. 画像データに対し文字認識することによって認識された第1のテキストデータを抽出する文字認識手段と、
    前記画像データの解像度を変更した変換画像データを生成する画像変換手段と、を備え、
    前記文字認識手段は、前記変換画像データを文字認識することによって認識された第2のテキストデータを抽出し、
    前記第1のテキストデータと前記第2のテキストデータとを対比し、前記第1のテキストデータに対し前記第2のテキストデータが一致しない割合を示す不一致度が所定の範囲内であるか否かを判断する置換判断手段と、
    前記置換判断手段によって前記不一致度が所定の範囲内であると判断した場合に、前記画像データを前記変換画像データに置き換える画像置換手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記置換判断手段によって前記不一致度が所定の範囲内でないと判断された場合に、前記画像変換手段は、さらに前記画像データの解像度を変更した変換画像データを生成し、
    前記文字認識手段は、生成された前記変換画像データを文字認識することによって認識された第2のテキストデータを抽出し、
    前記置換判断手段は、前記第1のテキストデータと前記第2のテキストデータとを対比し、前記不一致度が所定の範囲内であるか否かを判断することを、前記不一致度が所定の範囲内であると判断されるまで繰り返すこと、を特徴とする請求項1に記載の画像処理装置。
  3. 前記文字認識手段によって文字認識を実行する前に、前記画像データを整形する画像整形手段、をさらに備えることを特徴とする請求項1または請求項2に記載の画像処理装置。
  4. 前記画像置換手段によって置き換えられた前記画像データを含むPDFファイルを生成するPDFファイル生成手段、をさらに備えることを特徴とする請求項1〜3のいずれか1つに記載の画像処理装置。
  5. 画像処理装置によって実行される画像処理方法であって、
    画像データに対し文字認識することによって認識された第1のテキストデータを抽出する文字認識ステップと、
    前記画像データの解像度を変更した変換画像データを生成する画像変換ステップと、を含み、
    前記文字認識ステップは、前記変換画像データを文字認識することによって認識された第2のテキストデータを抽出し、
    前記第1のテキストデータと前記第2のテキストデータとを対比し、前記第1のテキストデータに対し前記第2のテキストデータが一致しない割合を示す不一致度が所定の範囲内であるか否かを判断する置換判断ステップと、
    前記置換判断ステップによって前記不一致度が所定の範囲内であると判断した場合に、前記画像データを前記変換画像データに置き換える画像置換ステップと、
    を含むことを特徴とする画像処理方法。
  6. 画像処理装置に、
    画像データに対し文字認識することによって認識された第1のテキストデータを抽出する文字認識ステップと、
    前記画像データの解像度を変更した変換画像データを生成する画像変換ステップと、を含み、
    前記文字認識ステップは、前記変換画像データを文字認識することによって認識された第2のテキストデータを抽出し、
    前記第1のテキストデータと前記第2のテキストデータとを対比し、前記第1のテキストデータに対し前記第2のテキストデータが一致しない割合を示す不一致度が所定の範囲内であるか否かを判断する置換判断ステップと、
    前記置換判断ステップによって前記不一致度が所定の範囲内であると判断した場合に、前記画像データを前記変換画像データに置き換える画像置換ステップと、
    を実行させることを特徴とする画像処理プログラム。
JP2016036176A 2016-02-26 2016-02-26 画像処理装置、画像処理方法および画像処理プログラム Active JP6474161B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016036176A JP6474161B2 (ja) 2016-02-26 2016-02-26 画像処理装置、画像処理方法および画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016036176A JP6474161B2 (ja) 2016-02-26 2016-02-26 画像処理装置、画像処理方法および画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2017153040A JP2017153040A (ja) 2017-08-31
JP6474161B2 true JP6474161B2 (ja) 2019-02-27

Family

ID=59739865

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016036176A Active JP6474161B2 (ja) 2016-02-26 2016-02-26 画像処理装置、画像処理方法および画像処理プログラム

Country Status (1)

Country Link
JP (1) JP6474161B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007324996A (ja) * 2006-06-01 2007-12-13 Fuji Xerox Co Ltd 画像情報出力装置、画像情報出力システムおよびプログラム
JP5066977B2 (ja) * 2007-03-29 2012-11-07 富士ゼロックス株式会社 画像処理装置、画像形成装置、及びプログラム
JP5464474B2 (ja) * 2008-08-20 2014-04-09 株式会社 ハンモック Ocrシステム

Also Published As

Publication number Publication date
JP2017153040A (ja) 2017-08-31

Similar Documents

Publication Publication Date Title
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
US10432820B2 (en) Image processing apparatus, image processing system, control method for image processing apparatus, and non-transitory computer readable medium
JP2019149788A (ja) 画像処理装置、および画像処理装置の制御方法とプログラム
EP2264995B1 (en) Image processing apparatus, image processing method, and computer program
JP5387193B2 (ja) 画像処理システム、画像処理装置およびプログラム
JP5137759B2 (ja) 画像処理装置
US20170099403A1 (en) Document distribution system, document distribution apparatus, information processing method, and storage medium
JP2019159633A (ja) 画像処理装置、画像処理方法および画像処理プログラム
US9858513B2 (en) Document file output apparatus, document file output method, and computer readable medium
JP6354253B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム
US9413841B2 (en) Image processing system, image processing method, and medium
US11436733B2 (en) Image processing apparatus, image processing method and storage medium
JP2009296150A (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
JP6474161B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP6019661B2 (ja) 画像読取装置、画像処理方法および画像処理プログラム
JP6540597B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2019153919A (ja) 画像処理装置、その制御方法、及びプログラム
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2016100780A (ja) 画像処理装置
JP6639257B2 (ja) 情報処理装置及びその制御方法
US20220301326A1 (en) Ocr target area position acquisition system, computer-readable non-transitory recording medium storing ocr target area position acquisition program, hard copy, hard copy generation system, and computer-readable non-transitory recording medium storing hard copy generation program
JP6413450B2 (ja) 画像処理装置、画像形成装置およびプログラム
JP2019212950A (ja) 情報処理装置及びプログラム
US20240046057A1 (en) Information processing system
JP6812858B2 (ja) 画像処理装置およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181206

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20181206

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20181212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190125

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190128

R150 Certificate of patent or registration of utility model

Ref document number: 6474161

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250