JPWO2017109998A1

JPWO2017109998A1 - モバイル端末、画像処理方法、および、プログラム

Info

Publication number: JPWO2017109998A1
Application number: JP2017557667A
Authority: JP
Inventors: 正義林; 清人小坂
Original assignee: PFU Ltd
Current assignee: PFU Ltd
Priority date: 2015-12-25
Filing date: 2015-12-25
Publication date: 2018-05-24
Anticipated expiration: 2035-12-25
Also published as: JP6596512B2; US20180276509A1; WO2017109998A1; US10628713B2

Abstract

撮影部の撮影によるフレームを取得し、フレームから原稿の原稿位置データを検出し、原稿の原稿種を判定し、原稿位置データと原稿種とに基づいて、原稿の原稿画像データの画質を算出し、画質が、文字認識可能なレベルか否かを判定し、画質が文字認識可能なレベルではないと判定された場合、撮影部の再度の撮影によるフレームを取得する。

Description

本発明は、モバイル端末、画像処理方法、および、プログラムに関する。

従来から、画像の撮影後に画像処理を適用し、その結果を画面上に表示してユーザへその後の操作を促す技術が開示されている。

ここで、高解像度補正を行う画像群から、傾きとズレ量とから画像判定を行い、歪みが少ない最適な画像を選択し、補正後の画像品質を上げる高解像度補正に関する技術が開示されている（特許文献１を参照）。

また、撮影後に、ぼやけ、原稿種別、および、傾きに関する画像判定を行う技術が開示されている（特許文献２を参照）。

また、指定の目標解像度と、予め入力された対象物を示すサイズデータとから、撮影画像の解像度の画質を判定して、合成画像を合成する技術が開示されている（特許文献３を参照）。

特開２０１０−２７３２１８号公報特開２０１５−１０６７４２号公報ＷＯ２０１３／０９９０２５Ａ１号公報

しかしながら、従来の装置（特許文献１等）においては、文字認識の可否判定および自動撮影を行っていないだけでなく、画像処理の成否の判定がユーザに委ねられているため、失敗したと判断した場合、画像撮影からやり直さなければならず、操作性を著しく損なうという問題点を有していた。

本発明は、上記問題点に鑑みてなされたもので、画像処理が失敗した場合であっても、画像撮影からのやり直の手間を省くことができるモバイル端末、画像処理方法、および、プログラムを提供することを目的とする。

このような目的を達成するため、本発明に係るモバイル端末は、撮影部の撮影によるフレームを取得するフレーム取得手段と、前記フレームから原稿の原稿位置データを検出する原稿位置検出手段と、前記原稿の原稿種を判定する原稿種判定手段と、前記原稿位置データと前記原稿種とに基づいて、前記原稿の原稿画像データの画質を算出する画質算出手段と、前記画質が、文字認識可能なレベルか否かを判定する画質判定手段と、前記画質判定手段により前記画質が前記文字認識可能なレベルではないと判定された場合、前記撮影部の再度の撮影によるフレームを取得する再取得手段と、を備えたことを特徴とする。

また、本発明に係る画像処理方法は、撮影部の撮影によるフレームを取得するフレーム取得ステップと、前記フレームから原稿の原稿位置データを検出する原稿位置検出ステップと、前記原稿の原稿種を判定する原稿種判定ステップと、前記原稿位置データと前記原稿種とに基づいて、前記原稿の原稿画像データの画質を算出する画質算出ステップと、前記画質が、文字認識可能なレベルか否かを判定する画質判定ステップと、前記画質判定ステップにて前記画質が前記文字認識可能なレベルではないと判定された場合、前記撮影部の再度の撮影によるフレームを取得する再取得ステップと、を含むことを特徴とする。

また、本発明に係るプログラムは、撮影部の撮影によるフレームを取得するフレーム取得ステップと、前記フレームから原稿の原稿位置データを検出する原稿位置検出ステップと、前記原稿の原稿種を判定する原稿種判定ステップと、前記原稿位置データと前記原稿種とに基づいて、前記原稿の原稿画像データの画質を算出する画質算出ステップと、前記画質が、文字認識可能なレベルか否かを判定する画質判定ステップと、前記画質判定ステップにて前記画質が前記文字認識可能なレベルではないと判定された場合、前記撮影部の再度の撮影によるフレームを取得する再取得ステップと、をコンピュータに実行させることを特徴とする。

この発明によれば、期待する画像データが撮影できるまで自動的にリトライを繰り返すことでユーザの作業効率を改善できるとともに、使用者に依存することなく一定の画像品質で撮像することが可能となる。

図１は、本実施形態に係るモバイル端末の構成の一例を示すブロック図である。図２は、本実施形態のモバイル端末における処理の一例を示すフローチャートである。図３は、本実施形態のモバイル端末における処理の一例を示すフローチャートである。

以下に、本発明に係るモバイル端末、画像処理方法、および、プログラムの実施形態を図面に基づいて詳細に説明する。なお、この実施形態により本発明が限定されるものではない。

［本実施形態の構成］
以下、本発明の実施形態に係るモバイル端末１００の構成の一例について図１を参照して説明し、その後、本実施形態の処理等について詳細に説明する。図１は、本実施形態に係るモバイル端末１００の構成の一例を示すブロック図である。

但し、以下に示す実施形態は、本発明の技術思想を具体化するためのモバイル端末１００を例示するものであって、本発明をこのモバイル端末１００に特定することを意図するものではなく、請求の範囲に含まれるその他の実施形態のモバイル端末１００にも等しく適用し得るものである。

また、本実施形態で例示するモバイル端末１００における機能分散の形態は以下に限られず、同様の効果や機能を奏し得る範囲において、任意の単位で機能的または物理的に分散・統合して構成することができる。

ここで、モバイル端末１００は、例えば、タブレット端末、携帯電話、スマートフォン、ＰＨＳ、ＰＤＡ、または、ノート型のパーソナルコンピュータ等の可搬性を有する携帯型の情報処理装置であってもよい。

まず、図１に示すように、モバイル端末１００は、概略的に、制御部１０２と記憶部１０６と撮影部１１０と入出力部１１２とセンサ部１１４と通信部１１６とを備えて構成される。

ここで、図１では省略しているが、本実施形態において、更に、入出力部１１２と制御部１０２とを接続する入出力インターフェース部（図示せず）を備えていてもよい。これらモバイル端末１００の各部は任意の通信路を介して通信可能に接続されている。

ここで、通信部１１６は、有線通信および／または無線通信（ＷｉＦｉ等）によりＩＰデータを送受信するためのネットワークインターフェース（ＮＩＣ（ＮｅｔｗｏｒｋＩｎｔｅｒｆａｃｅＣｏｎｔｒｏｌｌｅｒ）等）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、または、赤外線通信等によって無線通信を行うインターフェースであってもよい。

ここで、モバイル端末１００は、通信部１１６を用いて、ネットワークを介して外部装置と通信可能に接続されていてもよい。

また、センサ部１１４は、物理量を検出して別媒体の信号（デジタル信号）に変換する。ここで、センサ部１１４は、近接センサ、方角センサ、磁場センサ、直線加速センサ、輝度センサ、ジャイロセンサ、圧力センサ、重力センサ、加速度センサ、気圧センサ、および／または、温度センサ等を含んでいてもよい。

また、入出力部１１２は、データの入出力（Ｉ／Ｏ）を行う。ここで、入出力部１１２は、例えば、キー入力部、タッチパネル、コントロールパッド（例えば、タッチパッド、および、ゲームパッド等）、マウス、キーボード、および／または、マイク等であってもよい。

また、入出力部１１２は、アプリケーション等の表示画面を表示する表示部（例えば、液晶または有機ＥＬ等から構成されるディスプレイ、モニタ、または、タッチパネル等）であってもよい。

また、入出力部１１２は、音声情報を音声として出力する音声出力部（例えば、スピーカ等）であってもよい。また、入出力部（タッチパネル）１１２は、物理的接触を検出し、信号（デジタル信号）に変換するセンサ部１１４を含んでいてもよい。

また、撮影部１１０は、被写体（例えば、原稿等）を連続画像撮影（動画撮影）することで、連続（動画）の画像データ（フレーム）を取得する。例えば、撮影部１１０は、映像データを取得してもよい。また、撮影部１１０は、アンシラリデータを取得してもよい。

ここで、撮影部１１０は、ＣＣＤ（ＣｈａｒｇｅＣｏｕｐｌｅｄＤｅｖｉｃｅ）、および／または、ＣＭＯＳ（ＣｏｍｐｌｅｍｅｎｔａｒｙＭｅｔａｌＯｘｉｄｅＳｅｍｉｃｏｎｄｕｃｔｏｒ）等の撮像素子を備えたカメラ等であってもよい。

また、撮影部１１０は、被写体を静止画撮影することで、静止画の画像データを取得してもよい。ここで、フレームは、非圧縮の画像データであってもよい。また、フレームは、高解像度の画像データであってもよい。

ここで、高解像度とは、フルハイビジョン、４Ｋ解像度、または、スーパーハイビジョン（８Ｋ解像度）等であってもよい。また、撮影部１１０は、２４ｆｐｓまたは３０ｆｐｓ等で動画撮影してもよい。

記憶部１０６は、ストレージ手段であり、例えばＲＡＭ・ＲＯＭ等のメモリ、ハードディスクのような固定ディスク装置、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、および／または、光ディスク等を用いることができる。

また、記憶部１０６は、各種のデータベース、テーブル、バッファ、および／または、ファイル（画像データファイル１０６ａ等）を格納する。ここで、記憶部１０６には、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）に命令を与え各種処理を行うためのコンピュータプログラム等が記録されていてもよい。

また、記憶部１０６は、原稿種に応じた、実用品位数（ＪＩＳＢ７１８７：２００７、ＩＳＯ３２７２−１：２００３、または、ＩＳＯ６１９９：２００５等）、および、原稿の辺の長さ等を含む規格データ、ならびに、ＯＣＲ（ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅｃｏｇｎｉｔｉｏｎ）エンジンの文字認識可能な文字サイズ等を記憶してもよい。

これら記憶部１０６の各構成要素のうち、画像データファイル１０６ａは、画像データ（フレーム等）を記憶する。ここで、画像データファイル１０６ａは、原稿位置データを記憶してもよい。また、画像データファイル１０６ａは、原稿画像データを記憶してもよい。

また、画像データファイル１０６ａは、原稿画像データの原稿解像度を記憶してもよい。また、画像データファイル１０６ａは、画像データに対応する文字データを記憶してもよい。また、画像データファイル１０６ａは、映像データを記憶してもよい。また、画像データファイル１０６ａは、アンシラリデータを記憶してもよい。

また、制御部１０２は、モバイル端末１００を統括的に制御するＣＰＵ等からなる。制御部１０２は、制御プログラムと各種の処理手順等を規定したプログラムと所要データとを格納するための内部メモリを有し、これらプログラムに基づいて種々の処理を実行するための情報処理を行う。

ここで、制御部１０２は、機能概念的に、フレーム取得部１０２ａ、原稿位置検出部１０２ｂ、原稿種判定部１０２ｃ、画質算出部１０２ｄ、必須解像度算出部１０２ｅ、画質判定部１０２ｆ、再取得部１０２ｇ、理由表示部１０２ｈ、画像表示部１０２ｉ、および、ＯＣＲ部１０２ｊを備える。

フレーム取得部１０２ａは、画像データ（フレーム）を取得する。ここで、フレーム取得部１０２ａは、撮影部１１０の撮影による画像データを取得してもよい。また、フレーム取得部１０２ａは、非圧縮且つ高解像度の画像データを取得してもよい。

また、フレーム取得部１０２ａは、撮影部１１０による連続画像撮影または動画撮影を制御して、１コマに相当する画像データ（フレーム）を取得してもよい。また、フレーム取得部１０２ａは、撮影部１１０による静止画撮影を制御して、画像データを取得してもよい。また、フレーム取得部１０２ａは、アンシラリデータを取得してもよい。

原稿位置検出部１０２ｂは、フレームから原稿の原稿位置データを検出する。ここで、原稿位置検出部１０２ｂは、フレームから原稿のコーナー座標を検出してもよい。また、原稿位置検出部１０２ｂは、フレームから原稿のレイアウトを検出してもよい。

また、原稿位置検出部１０２ｂは、エッジ検出法、および／または、特徴点マッチング法を用いて、フレームから原稿の原稿位置データを検出してもよい。ここで、原稿は、矩形原稿であってもよい。また、原稿位置検出部１０２ｂは、更に、原稿位置データに基づいて、原稿の原稿画像データを取得してもよい。

原稿種判定部１０２ｃは、原稿の原稿種を判定する。ここで、原稿種判定部１０２ｃは、レイアウト認識法、および／または、サイズ検出法を用いて、原稿の原稿種を判定してもよい。

画質算出部１０２ｄは、原稿の原稿画像データの画質を算出する。ここで、画質算出部１０２ｄは、原稿位置データと原稿種とに基づいて、原稿の原稿画像データの画質を算出してもよい。また、画質算出部１０２ｄは、コーナー座標と原稿種とに基づいて、原稿画像データの原稿解像度を算出してもよい。

また、画質算出部１０２ｄは、コーナー座標間の画素数と、原稿種に基づく原稿の辺の長さと、に基づいて、原稿画像データの解像度を算出し、最小となる当該解像度を原稿解像度として取得してもよい。

ここで、画質算出部１０２ｄは、コーナー座標間の画素数を算出してもよい。また、画質算出部１０２ｄは、レイアウトと原稿種とに基づいて、原稿画像データの原稿解像度を算出してもよい。

必須解像度算出部１０２ｅは、文字認識に必要な必須解像度を算出する。ここで、必須解像度算出部１０２ｅは、実用品位数と原稿種とに基づいて、文字認識に必要な必須解像度を算出してもよい。また、必須解像度算出部１０２ｅは、ＯＣＲの文字認識が可能となる文字サイズと原稿種とに基づいて、必須解像度を算出してもよい。

画質判定部１０２ｆは、画質が、文字認識可能なレベルか否かを判定する。ここで、画質判定部１０２ｆは、原稿解像度が、文字認識可能なレベルか否かを判定してもよい。また、画質判定部１０２ｆは、原稿解像度と必須解像度との比較に基づいて、原稿解像度が文字認識可能なレベルか否かを判定してもよい。

再取得部１０２ｇは、撮影部１１０の再度の撮影による画像データを取得する。ここで、再取得部１０２ｇは、画質判定部１０２ｆにより画質が文字認識可能なレベルではないと判定された場合、撮影部１１０の再度の撮影によるフレームを取得してもよい。

また、再取得部１０２ｇは、撮影部１１０による撮影（連続画像撮影、動画撮影、または、静止画撮影等）を制御して、新たなフレームを取得してもよい。また、再取得部１０２ｇは、更に、取得したフレームを画像データファイル１０６ａに格納してもよい。

理由表示部１０２ｈは、判定理由データを表示させる。ここで、理由表示部１０２ｈは、画質判定部１０２ｆにより画質が文字認識可能なレベルではないと判定された場合、判定理由データを表示させてもよい。また、理由表示部１０２ｈは、判定理由データを入出力部１１２に表示させてもよい。

画像表示部１０２ｉは、画像データを表示させる。ここで、画像表示部１０２ｉは、フレーム、および／または、原稿画像データを表示させてもよい。また、画像表示部１０２ｉは、画像データを入出力部１１２に表示させてもよい。

ＯＣＲ部１０２ｊは、画像データに対してＯＣＲ処理を行い、文字データを取得する。ここで、ＯＣＲ部１０２ｊは、原稿画像データ、または、フレームに対してＯＣＲ処理を行い、文字データを取得してもよい。また、ＯＣＲ部１０２ｊは、更に、取得した文字データを画像データファイル１０６ａに格納してもよい。

［本実施形態の処理］
上述した構成のモバイル端末１００で実行される処理の一例について、図２を参照して説明する。図２および図３は、本実施形態のモバイル端末１００における処理の一例を示すフローチャートである。

［自動撮影処理（その１）］
図２に示すように、まず、制御部１０２は、撮像部（カメラ）１１０を起動させる（ステップＳＡ−１）。すなわち、本実施形態においては、原稿撮影用の携帯カメラ１１０を起動させてもよい。

そして、画像表示部１０２ｉは、カメラ１１０により撮影されたプレビュー画面（プレビュー画像）の画像データを入出力部１１２に表示させる（ステップＳＡ−２）。

そして、制御部１０２は、入出力部１１２のキャリブレーションを行う（ステップＳＡ−３）。ここで、制御部１０２は、更に、カメラ１１０のキャリブレーションを行ってもよい。

そして、フレーム取得部１０２ａは、カメラ１１０により撮影されたプレビュー画像の、非圧縮且つ高解像度のフレームを取得する（ステップＳＡ−４）。

そして、制御部１０２は、前回処理が完了しているか否かを判定する（ステップＳＡ−５）。ここで、前回処理とは、フレーム取得部１０２ａにより前回取得されたフレームに対する、ステップＳＡ−６からステップＳＡ−１６におけるいずれか一つの処理であってもよい。

そして、制御部１０２は、前回処理が完了していないと判定した場合（ステップＳＡ−５：Ｎｏ）、処理をステップＳＡ−３に移行させる。

一方、制御部１０２は、前回処理が完了していると判定した場合（ステップＳＡ−５：Ｙｅｓ）、処理をステップＳＡ−６に移行させる。

そして、原稿位置検出部１０２ｂは、エッジ検出法、および／または、特徴点マッチング法を用いて、プレビュー画像のフレームから原稿（矩形原稿）のコーナー座標を検出する（ステップＳＡ−６）。すなわち、本実施形態においては、矩形原稿のコーナー４点を検出してもよい。

そして、原稿位置検出部１０２ｂは、４点のコーナー座標を検出できたか否かを判定する（ステップＳＡ−７）。

そして、原稿位置検出部１０２ｂは、４点のコーナー座標を検出できなかったと判定した場合（ステップＳＡ−７：Ｎｏ）、処理をステップＳＡ−３に移行させる。

一方、原稿位置検出部１０２ｂは、４点のコーナー座標を検出できたと判定した場合（ステップＳＡ−７：Ｙｅｓ）、処理をステップＳＡ−８に移行させる。

そして、原稿位置検出部１０２ｂは、検出した４点のコーナー座標に基づいて、プレビュー画像のフレームから矩形原稿（原稿領域）の原稿画像データを取得する（ステップＳＡ−８）。

そして、画像表示部１０２ｉは、原稿領域の原稿画像データを入出力部１１２に表示させる（ステップＳＡ−９）。

そして、原稿種判定部１０２ｃは、レイアウト認識法、および／または、サイズ検出法を用いて、矩形原稿の原稿種を判定する（ステップＳＡ−１０）。すなわち、本実施形態においては、原稿種を判別してもよい。

そして、画質算出部１０２ｄは、４つのコーナー座標間の画素数と、原稿種に基づく矩形原稿の辺の長さと、に基づいて、原稿画像データの解像度を算出し、最小となる当該解像度を原稿解像度として取得する（ステップＳＡ−１１）。

ここで、画質算出部１０２ｄは、４点座標と原稿種判定の結果とから、原稿画像データ（カメラ画像データ）の解像度を、「解像度（ｄｐｉ）＝画素数（ｄｏｔ）／長さ（ｉｎｃｈ）」の式により算出してもよい。

例えば、画質算出部１０２ｄは、原稿種判定部１０２ｃにより原稿が名刺と判定された際に、上辺：６００ｄｏｔ、および、下辺：８００ｄｏｔと算出した場合、縦解像度を６００ｄｏｔ／（５５ｍｍ／２５．４ｍｍ）＝２７７ｄｐｉと算出する（すなわち、１ｉｎｃｈ＝２５．４ｍｍ）。

そして、画質算出部１０２ｄは、原稿位置検出部１０２ｂにより右辺：１２００ｄｏｔ、および、左辺：１３２４ｄｏｔと算出した場合、横解像度を１２００ｄｏｔ／（９１ｍｍ／２５．４ｍｍ）＝３３５ｄｐｉと算出する。

そして、画質算出部１０２ｄは、最小解像度となる縦解像度（２７７ｄｐｉ）を原稿解像度として取得する。このように、本実施形態においては、２点座標と原稿種とから撮像した画像データの解像度を算出している。

なお、原稿種が、免許証または保険証の場合、短辺：５４ｍｍおよび長辺：８６ｍｍ、名刺の場合、短辺：５５ｍｍおよび長辺：９１ｍｍ、ならびに、Ａ４用紙の場合、短辺：２１０ｍｍおよび長辺：２９７ｍｍの規格を用いて、原稿解像度を算出してもよい。

そして、必須解像度算出部１０２ｅは、実用品位数と原稿種とに基づいて、文字認識に必要な必須解像度を算出する（ステップＳＡ−１２）。すなわち、必須解像度算出部１０２ｅは、原稿の情報（ポイント数）から必須解像度を算出してもよい。

ここで、必須解像度算出部１０２ｅは、目視における品質の基準（例えば、ＪＩＳＢ７１８７：２００７、および、ＴＮＦ−２００５４０８ＳＴ等）に関する、実用品位数Ｐを用いる場合、必須解像度を、「ＤＰＩ＝｛Ｐ／（ｐｔ＊０．３５１４）｝＊２＊２５．４」の式により算出してもよい。

ここで、目視における品質の基準は、すべての文字の微細部分まで明確に描画されている場合、「優秀」、多少不鮮明であっても、難なく読むことが可能な場合、「可読」、および、文字が部分的に多少つぶれていても判読可能な場合、「判読」と規定されている。

ここで、実用品位数Ｐは、「優秀」の場合、漢字が１８、および、英字が８となり、「可読」の場合、漢字が１１、および、英字が５となり、「判読」の場合、漢字が７、および、英字が３と規定されている。

なお、本実施形態においては、各原稿の情報に基づいて、免許証、保険証および名刺における文字のポイント数として６ｐｔ、ならびに、Ａ４用紙における文字のポイント数として１０．５ｐｔを必須解像度の計算に用いる文字サイズとしてもよい。

例えば、必須解像度算出部１０２ｅは、原稿種が免許証の場合、文字のポイント数を６ｐｔとし、必須解像度をＤＰＩ＝｛１１／（６＊０．３５１４）｝＊２＊２５．４＝２６５ｄｐｉと算出してもよい。このように、本実施形態においては、原稿種のサイズとポイント数とに応じた文字認識に必要な解像度を算出している。

そして、画質判定部１０２ｆは、原稿解像度と必須解像度との比較に基づいて、原稿解像度が文字認識可能なレベルか否かを判定する（ステップＳＡ−１３）。なお、本実施形態においては、段階的に文字認識可能か否かを判定してもよい。

そして、画質判定部１０２ｆは、原稿解像度が文字認識可能なレベルではないと判定した場合（ステップＳＡ−１３：Ｎｏ）、処理をステップＳＡ−１４に移行させる。

そして、理由表示部１０２ｈは、原稿解像度が文字認識可能なレベルではないと判定した理由の判定理由データを入出力部１１２に表示させ（ステップＳＡ−１４）、処理をＳＡ−３に移行させる。

このように、本実施形態においては、画質条件を満たすまでリトライを繰り返してもよい。すなわち、本実施形態においては、所定の画像品質を満足するまで処理を繰り返してもよい。

一方、画質判定部１０２ｆは、原稿解像度が文字認識可能なレベルであると判定した場合（ステップＳＡ−１３：Ｙｅｓ）、処理をステップＳＡ−１５に移行させる。

そして、再取得部１０２ｇは、画質判定部１０２ｆによる画質判定に用いたフレームを取得する、または、カメラ１１０による撮影を制御して、高解像度且つ非圧縮の新たなフレームを取得し、画像データファイル１０６ａに格納する（ステップＳＡ−１５）。

そして、画像表示部１０２ｉは、画質判定に用いたフレーム（画像データ）、再取得部１０２ｇにより取得された新たなフレーム（画像データ）、または、フレームに含まれる原稿領域の原稿画像データを入出力部１１２に出力（表示）させ（ステップＳＡ−１６）、処理を終了する。

なお、ＯＣＲ部１０２ｊは、更に、入出力部１１２に表示された原稿画像データ、または、フレームに対してＯＣＲ処理を行い、文字データを取得し、当該文字データを画像データファイル１０６ａに格納してもよい。

このように、本実施形態においては、カメラ１１０のエリアセンサに撮像された高解像度且つ非圧縮のフレーム（画像データ）において、矩形原稿のコーナー４点座標を検出し、原稿種を判定する。

そして、本実施形態においては、この判定結果からカメラ画像データの解像度を算出し、当該カメラ画像データの解像度と予め定めている必須解像度と比較し、文字認識可能な画像か否かを判定する。

そして、本実施形態においては、この判定処理を所定の画像品質を満たすまで繰り返すことで、所定の画像品質を満たす画像データを得ることができる。

また、本実施形態においては、例えば、窓口業務における個人認証手続において、顧客から借用する身分証明証をモバイル端末（携帯型撮像装置）１００でその場で撮影することで、顧客へ安心感を与えることができる。

ここで、目視確認（可読）に必要な解像度（必須解像度）は、対象原稿を免許証（５４ｍｍ＊８６ｍｍ、６ポイント）とすると、２６５ｄｐｉ（画像サイズ：５６４ｄｏｔ＊８９８ｄｏｔ）としてもよい。

そして、本実施形態においては、この必須解像度とカメラ画像データの解像度とを比較することで、文字認識を行うに最適な画像を撮影することができる。

また、本実施形態においては、更に、撮像対象が決まっている場合に、原稿種判定の段階でリトライ処理を行うことで応答性を向上している。

また、本実施形態においては、自動撮影されない要因を、文章データまたは描画データとして入出力部１１２に表示させることで、リアルタイムにユーザに通知し、改善をユーザに促すことで使用感を向上することができる。

［自動撮影処理（その２）］
まず、図３に示すステップＳＢ−１からステップＳＢ−５の処理は、図２に示すステップＳＡ−１からステップＳＡ−５の処理と同様であるため説明を省略する。

そして、原稿位置検出部１０２ｂは、エッジ検出法、および／または、特徴点マッチング法を用いて、プレビュー画像のフレームから原稿（矩形原稿）のレイアウトを検出する（ステップＳＢ−６）。

そして、原稿位置検出部１０２ｂは、レイアウトを検出できたか否かを判定する（ステップＳＢ−７）。

そして、原稿位置検出部１０２ｂは、レイアウトを検出できなかったと判定した場合（ステップＳＢ−７：Ｎｏ）、処理をステップＳＢ−３に移行させる。

一方、原稿位置検出部１０２ｂは、レイアウトを検出できたと判定した場合（ステップＳＢ−７：Ｙｅｓ）、処理をステップＳＢ−８に移行させる。

そして、原稿位置検出部１０２ｂは、検出したレイアウトに基づいて、プレビュー画像のフレームから矩形原稿（原稿領域）の原稿画像データを取得する（ステップＳＢ−８）。

そして、画像表示部１０２ｉは、原稿領域の原稿画像データを入出力部１１２に表示させる（ステップＳＢ−９）。

そして、原稿種判定部１０２ｃは、レイアウト認識法、および／または、サイズ検出法を用いて、矩形原稿の原稿種を判定する（ステップＳＢ−１０）。

そして、画質算出部１０２ｄは、矩形原稿のレイアウトと原稿種とに基づいて、原稿画像データの原稿解像度を算出する（ステップＳＢ−１１）。

そして、必須解像度算出部１０２ｅは、ＯＣＲの文字認識が可能となる文字サイズと原稿種とに基づいて、文字認識に必要な必須解像度を算出する（ステップＳＢ−１２）。

ここで、必須解像度算出部１０２ｅは、ＯＣＲエンジン（ＯＣＲ部１０２ｊ）の文字認識可能な文字サイズＦを用いる場合、必須解像度を、「ＤＰＩ＝｛Ｆ／（ｐｔ＊０．３５１４）｝＊２５．４」の式により算出してもよい。

例えば、必須解像度算出部１０２ｅは、原稿種が免許証の場合、文字のポイント数を６ｐｔ、および、ＯＣＲエンジンの文字認識可能な文字サイズを２４とし、必須解像度をＤＰＩ＝｛２４／（６＊０．３５１４）｝＊２５．４＝３２２ｄｐｉと算出してもよい。

そして、図３に示すステップＳＢ−１３からステップＳＢ−１６の処理は、図２に示すステップＳＡ−１３からステップＳＡ−１６の処理と同様であるため説明を省略する。

このように、本実施形態においては、通常業務において、リマインダー代わりに画像を撮影し、ＯＣＲ認識を使うことで資料作成の効率化を図ることができる。

ここで、ＯＣＲ認識（文字認識可能な文字サイズ：３６＊３６）に必要な解像度（必須解像度）は、対象原稿をＡ４ドキュメント（２１０ｍｍ＊２９７ｍｍ、１０．５ポイント）とすると、２４８ｄｐｉ（画像サイズ：２０５０ｄｏｔ＊２９００ｄｏｔ）となる。

近年、モバイル端末（スマートフォンまたはタブレット等）１００の普及に伴い、従来はスキャナが利用されてきた業務において、カメラを備えたモバイル端末１００の利用に利用形態が変化している。

これは、モバイル端末１００に搭載されたカメラによるスキャニングは、場所を問わないこと、および、撮像媒体の制限が無いことにより、自由度が高いという利点があるからである。

一方、モバイル端末１００により撮影されたカメラ画像は、周辺の光量、撮影方向、および／または、撮影時の運動等の環境が安定しないことが多いため、スキャナと同等の画質の画像データを得ることが難しいという問題があった。

そこで、本実施形態においてモバイル端末１００に実装されるモバイルスキャナアプリでは、良質な画像をセンシングして取得できるようにしている。

［他の実施形態］
さて、これまで本発明の実施形態について説明したが、本発明は、上述した実施形態以外にも、請求の範囲に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。

例えば、モバイル端末１００は、スタンドアローンの形態で処理を行ってもよく、クライアント端末（モバイル端末１００とは別筐体である）からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するようにしてもよい。

また、実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。

このほか、明細書中および図面中で示した処理手順、制御手順、具体的名称、各処理の登録データもしくは検索条件等のパラメータを含む情報、画面例、または、データベース構成については、特記する場合を除いて任意に変更することができる。

また、モバイル端末１００に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。

例えば、モバイル端末１００の各装置が備える処理機能、特に制御部１０２にて行われる各処理機能については、その全部または任意の一部を、ＣＰＵおよび当該ＣＰＵにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。

尚、プログラムは、後述する、コンピュータに本発明に係る方法を実行させるためのプログラム化された命令を含む、一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じてモバイル端末１００に機械的に読み取られる。すなわち、ＲＯＭまたはＨＤＤなどの記憶部１０６などには、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）と協働してＣＰＵに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、ＲＡＭにロードされることによって実行され、ＣＰＵと協働して制御部を構成する。

また、このコンピュータプログラムは、モバイル端末１００に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。

また、本発明に係るプログラムを、コンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、ＵＳＢメモリ、ＳＤカード、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭ、ＭＯ、ＤＶＤ、および、Ｂｌｕ−ｒａｙ（登録商標）Ｄｉｓｃ等の任意の「可搬用の物理媒体」を含むものとする。

また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、ＯＳに代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。

記憶部１０６に格納される各種のデータベース等は、ＲＡＭもしくはＲＯＭ等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および／または、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および／または、ウェブページ用ファイル等を格納してもよい。

また、モバイル端末１００は、既知のパーソナルコンピュータ等の情報処理装置として構成してもよく、また、該情報処理装置に任意の周辺装置を接続して構成してもよい。また、モバイル端末１００は、該情報処理装置に本発明の方法を実現させるソフトウェア（プログラム、データ等を含む）を実装することにより実現してもよい。

更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じて、または、機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。

以上のように、モバイル端末、画像処理方法、および、プログラムは、産業上の多くの分野、特にカメラで読み込んだ画像を扱う画像処理分野で実施することができ、極めて有用である。

１００モバイル端末
１０２制御部
１０２ａフレーム取得部
１０２ｂ原稿位置検出部
１０２ｃ原稿種判定部
１０２ｄ画質算出部
１０２ｅ必須解像度算出部
１０２ｆ画質判定部
１０２ｇ再取得部
１０２ｈ理由表示部
１０２ｉ画像表示部
１０２ｊＯＣＲ部
１０６記憶部
１０６ａ画像データファイル
１１０撮影部
１１２入出力部
１１４センサ部
１１６通信部

Claims

撮影部の撮影によるフレームを取得するフレーム取得手段と、
前記フレームから原稿の原稿位置データを検出する原稿位置検出手段と、
前記原稿の原稿種を判定する原稿種判定手段と、
前記原稿位置データと前記原稿種とに基づいて、前記原稿の原稿画像データの画質を算出する画質算出手段と、
前記画質が、文字認識可能なレベルか否かを判定する画質判定手段と、
前記画質判定手段により前記画質が前記文字認識可能なレベルではないと判定された場合、前記撮影部の再度の撮影によるフレームを取得する再取得手段と、
を備えたことを特徴とする、モバイル端末。
前記原稿位置検出手段は、
前記フレームから前記原稿のコーナー座標を検出し、
前記画質算出手段は、
前記コーナー座標と前記原稿種とに基づいて、前記原稿画像データの原稿解像度を算出し、
前記画質判定手段は、
前記原稿解像度が、前記文字認識可能なレベルか否かを判定する、請求項１に記載のモバイル端末。
前記画質算出手段は、
前記コーナー座標間の画素数と、前記原稿種に基づく前記原稿の辺の長さと、に基づいて、前記原稿画像データの解像度を算出し、最小となる当該解像度を前記原稿解像度として取得する、請求項２に記載のモバイル端末。
前記原稿位置検出手段は、
前記フレームから前記原稿のレイアウトを検出し、
前記画質算出手段は、
前記レイアウトと前記原稿種とに基づいて、前記原稿画像データの原稿解像度を算出し、
前記画質判定手段は、
前記原稿解像度が、前記文字認識可能なレベルか否かを判定する、請求項１に記載のモバイル端末。
実用品位数と前記原稿種とに基づいて、文字認識に必要な必須解像度を算出する必須解像度算出手段、
を更に備え、
前記画質判定手段は、
前記原稿解像度と前記必須解像度との比較に基づいて、前記原稿解像度が前記文字認識可能なレベルか否かを判定する、請求項２から４のいずれか一つに記載のモバイル端末。
ＯＣＲの文字認識が可能となる文字サイズと前記原稿種とに基づいて、必須解像度を算出する必須解像度算出手段、
を更に備え、
前記画質判定手段は、
前記原稿解像度と前記必須解像度との比較に基づいて、前記原稿解像度が前記文字認識可能なレベルか否かを判定する、請求項２から４のいずれか一つに記載のモバイル端末。
前記画質判定手段により前記画質が前記文字認識可能なレベルではないと判定された場合、判定理由データを表示させる理由表示手段、
を更に備えた、請求項１から６のいずれか一つに記載のモバイル端末。
前記原稿画像データに対してＯＣＲ処理を行い、文字データを取得するＯＣＲ手段、
を更に備えた、請求項１から７のいずれか一つに記載のモバイル端末。
前記フレーム、および／または、前記原稿画像データを表示させる画像表示手段、
を更に備えた、請求項１から８のいずれか一つに記載のモバイル端末。
前記フレームは、
非圧縮の画像データである、請求項１から９のいずれか一つに記載のモバイル端末。
前記原稿位置検出手段は、
エッジ検出法、および／または、特徴点マッチング法を用いて、前記フレームから前記原稿の前記原稿位置データを検出する、請求項１から１０のいずれか一つに記載のモバイル端末。
前記原稿種判定手段は、
レイアウト認識法、および／または、サイズ検出法を用いて、前記原稿の前記原稿種を判定する、請求項１から１１のいずれか一つに記載のモバイル端末。
撮影部の撮影によるフレームを取得するフレーム取得ステップと、
前記フレームから原稿の原稿位置データを検出する原稿位置検出ステップと、
前記原稿の原稿種を判定する原稿種判定ステップと、
前記原稿位置データと前記原稿種とに基づいて、前記原稿の原稿画像データの画質を算出する画質算出ステップと、
前記画質が、文字認識可能なレベルか否かを判定する画質判定ステップと、
前記画質判定ステップにて前記画質が前記文字認識可能なレベルではないと判定された場合、前記撮影部の再度の撮影によるフレームを取得する再取得ステップと、
を含むことを特徴とする、画像処理方法。
撮影部の撮影によるフレームを取得するフレーム取得ステップと、
前記フレームから原稿の原稿位置データを検出する原稿位置検出ステップと、
前記原稿の原稿種を判定する原稿種判定ステップと、
前記原稿位置データと前記原稿種とに基づいて、前記原稿の原稿画像データの画質を算出する画質算出ステップと、
前記画質が、文字認識可能なレベルか否かを判定する画質判定ステップと、
前記画質判定ステップにて前記画質が前記文字認識可能なレベルではないと判定された場合、前記撮影部の再度の撮影によるフレームを取得する再取得ステップと、
をコンピュータに実行させるためのプログラム。