JP6697829B2

JP6697829B2 - モバイル端末、画像処理方法、および、プログラム

Info

Publication number: JP6697829B2
Application number: JP2018535994A
Authority: JP
Inventors: 朋也穴澤; 清人小坂
Original assignee: PFU Ltd
Current assignee: PFU Ltd
Priority date: 2016-08-24
Filing date: 2016-08-24
Publication date: 2020-05-27
Anticipated expiration: 2036-08-24
Also published as: JPWO2018037520A1; WO2018037520A1

Description

本発明は、モバイル端末、画像処理方法、および、プログラムに関する。

従来から、画像を正立補正させる技術が開示されている。

ここで、ビデオコーディング端末で表示される郵便物画像に含まれる宛名等の文字記載方向を、自動的に正立表示させる技術が開示されている（特許文献１を参照）。

特開平８−９９０６７号公報

しかしながら、従来のビデオコーディングシステム（特許文献１）においては、郵便物という規定帳票に特化したレイアウト判定を行うため、郵便物のみしか正立補正の対象としていないという問題点を有していた。

本発明は、上記問題点に鑑みてなされたもので、原稿種に捕らわれることなく、モバイル端末にて撮影した原稿画像中の所定の領域を向き補正して、モバイル端末の小さな画面でも即座にユーザが確認できるように表示させることができるモバイル端末、画像処理方法、および、プログラムを提供することを目的とする。

このような目的を達成するため、本発明に係るモバイル端末は、撮影部の撮影による撮影画像の撮影画像データを取得する撮影画像取得手段と、前記撮影画像に含まれる原稿画像の原稿画像データを取得する原稿取得手段と、前記原稿画像における特定領域の特定領域画像データを取得する特定領域取得手段と、前記原稿画像におけるコンテンツの向きを特定し、当該コンテンツの向きに基づいて、前記原稿画像の向きを特定する原稿向き特定手段と、前記原稿画像の向きに基づいて、正立補正した前記特定領域の補正後特定領域画像データを取得する特定領域向き補正手段と、前記補正後特定領域画像データを表示させる補正後画像表示手段と、を備えたことを特徴とする。

また、本発明に係る画像処理方法は、撮影部の撮影による撮影画像の撮影画像データを取得する撮影画像取得ステップと、前記撮影画像に含まれる原稿画像の原稿画像データを取得する原稿取得ステップと、前記原稿画像における特定領域の特定領域画像データを取得する特定領域取得ステップと、前記原稿画像におけるコンテンツの向きを特定し、当該コンテンツの向きに基づいて、前記原稿画像の向きを特定する原稿向き特定ステップと、前記原稿画像の向きに基づいて、正立補正した前記特定領域の補正後特定領域画像データを取得する特定領域向き補正ステップと、前記補正後特定領域画像データを表示させる補正後画像表示ステップと、を含むことを特徴とする。

また、本発明に係るプログラムは、撮影部の撮影による撮影画像の撮影画像データを取得する撮影画像取得ステップと、前記撮影画像に含まれる原稿画像の原稿画像データを取得する原稿取得ステップと、前記原稿画像における特定領域の特定領域画像データを取得する特定領域取得ステップと、前記原稿画像におけるコンテンツの向きを特定し、当該コンテンツの向きに基づいて、前記原稿画像の向きを特定する原稿向き特定ステップと、前記原稿画像の向きに基づいて、正立補正した前記特定領域の補正後特定領域画像データを取得する特定領域向き補正ステップと、前記補正後特定領域画像データを表示させる補正後画像表示ステップと、をコンピュータに実行させることを特徴とする。

この発明によれば、ユーザがモバイルカメラで撮影した原稿画像を直後に撮影した向きのまま確認することができ、且つ、適切に向き補正が適用された画像を保存することが可能となる。

図１は、本実施形態に係るモバイル端末の構成の一例を示すブロック図である。図２は、本実施形態のモバイル端末における処理の一例を示すフローチャートである。図３は、本実施形態における画像表示の一例を示す図である。図４は、本実施形態における画像表示の一例を示す図である。図５は、本実施形態における画像表示の一例を示す図である。図６は、本実施形態における画像表示の一例を示す図である。図７は、本実施形態における画像表示の一例を示す図である。図８は、本実施形態における画像表示の一例を示す図である。図９は、本実施形態における画像表示の一例を示す図である。図１０は、本実施形態における画像表示の一例を示す図である。図１１は、本実施形態における画像表示の一例を示す図である。図１２は、本実施形態における画像表示の一例を示す図である。図１３は、本実施形態における画像表示の一例を示す図である。図１４は、本実施形態における画像表示の一例を示す図である。図１５は、本実施形態における画像表示の一例を示す図である。図１６は、本実施形態における画像表示の一例を示す図である。図１７は、本実施形態における撮影リトライ制御の一例を示す図である。図１８は、本実施形態における撮影リトライ制御の一例を示す図である。図１９は、本実施形態における特定領域表示処理の一例を示す概要図である。

以下に、本発明に係るモバイル端末、画像処理方法、および、プログラムの実施形態を図面に基づいて詳細に説明する。なお、この実施形態により本発明が限定されるものではない。

［本実施形態の構成］
以下、本発明の実施形態に係るモバイル端末１００の構成の一例について図１を参照して説明し、その後、本実施形態の処理等について詳細に説明する。図１は、本実施形態に係るモバイル端末１００の構成の一例を示すブロック図である。

但し、以下に示す実施形態は、本発明の技術思想を具体化するためのモバイル端末１００を例示するものであって、本発明をこのモバイル端末１００に特定することを意図するものではなく、請求の範囲に含まれるその他の実施形態のモバイル端末１００にも等しく適用し得るものである。

また、本実施形態で例示するモバイル端末１００における機能分散の形態は以下に限られず、同様の効果や機能を奏し得る範囲において、任意の単位で機能的または物理的に分散・統合して構成することができる。

ここで、モバイル端末１００は、例えば、タブレット端末、携帯電話、スマートフォン、ＰＨＳ、ＰＤＡ、ノート型のパーソナルコンピュータ、または、メガネ型もしくは時計型などのウェアラブルコンピュータ等の可搬性を有する携帯型の情報処理装置であってもよい。

まず、図１に示すように、モバイル端末１００は、概略的に、制御部１０２と記憶部１０６と撮影部１１０と入出力部１１２とセンサ部１１４と通信部１１６とを備えて構成される。

ここで、図１では省略しているが、本実施形態において、更に、入出力部１１２と制御部１０２とを接続する入出力インターフェース部（図示せず）を備えていてもよい。これらモバイル端末１００の各部は任意の通信路を介して通信可能に接続されている。

ここで、通信部１１６は、有線通信および／または無線通信（ＷｉＦｉ（登録商標）等）によりＩＰデータを送受信するためのネットワークインターフェース（ＮＩＣ（ＮｅｔｗｏｒｋＩｎｔｅｒｆａｃｅＣｏｎｔｒｏｌｌｅｒ）等）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、または、赤外線通信等によって無線通信を行うインターフェースであってもよい。

ここで、モバイル端末１００は、通信部１１６を用いて、ネットワークを介して外部装置と通信可能に接続されていてもよい。

また、センサ部１１４は、物理量を検出して別媒体の信号（デジタル信号）に変換する。ここで、センサ部１１４は、近接センサ、方角センサ、磁場センサ、直線加速センサ、輝度センサ、ジャイロセンサ、圧力センサ、重力センサ、加速度センサ、気圧センサ、および／または、温度センサ等を含んでいてもよい。

また、入出力部１１２は、データの入出力（Ｉ／Ｏ）を行う。ここで、入出力部１１２は、例えば、キー入力部、タッチパネル、コントロールパッド（例えば、タッチパッド、および、ゲームパッド等）、マウス、キーボード、および／または、マイク等であってもよい。

また、入出力部１１２は、アプリケーション等の表示画面を表示する表示部（例えば、液晶または有機ＥＬ等から構成されるディスプレイ、モニタ、または、タッチパネル等）であってもよい。

また、入出力部１１２は、音声情報を音声として出力する音声出力部（例えば、スピーカ等）であってもよい。また、入出力部（タッチパネル）１１２は、物理的接触を検出し、信号（デジタル信号）に変換するセンサ部１１４を含んでいてもよい。

また、撮影部１１０は、被写体（例えば、原稿等）を連続画像撮影（動画撮影）することで、連続（動画）の画像データ（フレーム）を取得する。例えば、撮影部１１０は、映像データを取得してもよい。また、撮影部１１０は、アンシラリデータを取得してもよい。

ここで、撮影部１１０は、ＣＣＤ（ＣｈａｒｇｅＣｏｕｐｌｅｄＤｅｖｉｃｅ）、および／または、ＣＭＯＳ（ＣｏｍｐｌｅｍｅｎｔａｒｙＭｅｔａｌＯｘｉｄｅＳｅｍｉｃｏｎｄｕｃｔｏｒ）等の撮像素子を備えたカメラ等であってもよい。

また、撮影部１１０は、被写体を静止画撮影することで、静止画である撮影画像の撮影画像データを取得してもよい。ここで、撮影画像データは、非圧縮の画像データであってもよい。また、撮影画像データは、高解像度の画像データであってもよい。

ここで、高解像度とは、フルハイビジョン、４Ｋ解像度、または、スーパーハイビジョン（８Ｋ解像度）等であってもよい。また、撮影部１１０は、２４ｆｐｓまたは３０ｆｐｓ等で動画撮影してもよい。

記憶部１０６は、各種のデータベース、テーブル、および／または、ファイルなどを格納する。また、記憶部１０６は、各種アプリケーションプログラム（例えば、ユーザアプリケーション等）を記憶していてもよい。

また、記憶部１０６は、ストレージ手段であり、例えばＲＡＭ・ＲＯＭ等のメモリ、ハードディスクのような固定ディスク装置、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、フレキシブルディスク、および／または、光ディスク等の有形の記憶装置、または、記憶回路を用いることができる。

また、記憶部１０６には、コントローラ等に命令を与え各種処理を行うためのコンピュータプログラム等が記録されている。

これら記憶部１０６の各構成要素のうち、辞書データファイル１０６ａは、辞書データを記憶する。ここで、辞書データは、各言語の文字、数字、および、記号等に関するデータであってもよい。

画像データファイル１０６ｂは、画像データ（フレーム等）を記憶する。

ここで、画像データファイル１０６ｂは、撮影画像データ、原稿画像データ、補正後原稿画像データ、特定領域画像データ、および／または、補正後特定領域画像データを記憶していてもよい。

また、画像データファイル１０６ｂは、原稿画像、および／または、特定領域等の位置データを記憶していてもよい。また、画像データファイル１０６ｂは、画像データに対応する文字データを記憶していてもよい。

また、画像データファイル１０６ｂは、映像データを記憶していてもよい。また、画像データファイル１０６ｂは、アンシラリデータを記憶していてもよい。

また、制御部１０２は、モバイル端末１００を統括的に制御するＣＰＵ、メニーコアＣＰＵ、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）、ＬＳＩ（ＬａｒｇｅＳｃａｌｅＩｎｔｅｇｒａｔｉｏｎ）、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）、および／または、ＦＰＧＡ（Ｆｉｅｌｄ−ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）等を含む有形のコントローラ、または、制御回路から構成されてもよい。

制御部１０２は、制御プログラムと各種の処理手順等を規定したプログラムと所要データとを格納するための内部メモリを有し、これらプログラムに基づいて種々の処理を実行するための情報処理を行う。

ここで、制御部１０２は、機能概念的に、撮影画像取得部１０２ａ、原稿取得部１０２ｂ、ボケ検出部１０２ｃ、特定領域取得部１０２ｄ、原稿向き特定部１０２ｅ、特定領域向き補正部１０２ｆ、原稿向き補正部１０２ｇ、および、画像表示部１０２ｈを備える。

撮影画像取得部１０２ａは、画像データを取得する。ここで、撮影画像取得部１０２ａは、撮影部１１０の撮影による撮影画像の撮影画像データを取得してもよい。また、撮影画像取得部１０２ａは、非圧縮且つ高解像度の画像データを取得してもよい。

また、撮影画像取得部１０２ａは、撮影部１１０による連続画像撮影または動画撮影を制御して、１コマに相当する画像データ（フレーム）を取得してもよい。

また、撮影画像取得部１０２ａは、撮影部１１０による静止画撮影を制御して、画像データを取得してもよい。また、撮影画像取得部１０２ａは、アンシラリデータを取得してもよい。

原稿取得部１０２ｂは、撮影画像に含まれる原稿画像の原稿画像データを取得する。ここで、原稿取得部１０２ｂは、撮影画像に含まれる原稿画像を特定し、原稿画像データを取得してもよい。

また、原稿取得部１０２ｂは、撮影画像データから原稿画像の位置データを検出してもよい。ここで、原稿取得部１０２ｂは、撮影画像データから原稿画像のコーナー座標（４点）を検出してもよい。

また、原稿取得部１０２ｂは、撮影画像データから原稿画像のレイアウトを検出してもよい。ここで、原稿は、矩形原稿であってもよい。

また、原稿取得部１０２ｂは、エッジ検出法、および／または、特徴点マッチング法を用いて、撮影画像データから原稿画像の位置データを検出し、原稿画像の位置データに基づいて、原稿画像を特定し、原稿画像データを取得してもよい。

ボケ検出部１０２ｃは、画像のボケを検出する。ここで、ボケ検出部１０２ｃは、ボケが所定の基準値以上となる原稿画像の一部をボケ領域として検出してもよい。

特定領域取得部１０２ｄは、原稿画像における特定領域の特定領域画像データを取得する。ここで、特定領域は、原稿画像の上部領域であってもよい。

また、特定領域取得部１０２ｄは、ボケ領域を特定領域として、特定領域画像データを取得してもよい。また、特定領域取得部１０２ｄは、原稿画像に含まれる重要箇所を推定し、重要箇所を特定領域として、特定領域画像データを取得してもよい。

ここで、重要箇所は、原稿画像に含まれる正立補正後に原稿画像上部に位置する、サイズの大きい、太字の、および／または、色の異なる文字から構成される領域であってもよい。

また、重要箇所は、原稿画像に含まれる金額を示す文字、数字、および／または、記号から構成される領域であってもよい。

また、特定領域取得部１０２ｄは、ユーザに選択された原稿画像の一部を特定領域として、特定領域画像データを取得してもよい。

また、特定領域取得部１０２ｄは、ボケ検出部１０２ｃによりボケ領域が検出されなかった場合、原稿画像全体を特定領域として、特定領域画像データを取得してもよい。

原稿向き特定部１０２ｅは、原稿画像の向きを特定する。ここで、原稿向き特定部１０２ｅは、原稿画像におけるコンテンツの向きを特定し、当該コンテンツの向きに基づいて、原稿画像の向きを特定してもよい。

また、原稿向き特定部１０２ｅは、特定領域におけるコンテンツの向きを特定し、当該コンテンツの向きに基づいて、原稿画像の向きを特定してもよい。

また、原稿向き特定部１０２ｅは、原稿画像における文字の向きを特定し、当該文字の向きに基づいて、原稿画像の向きを特定してもよい。

ここで、原稿向き特定部１０２ｅは、原稿画像データに対するラベリング処理により、原稿画像における文字を示す文字領域を特定し、文字領域の文字領域データと辞書データとの比較に基づいて、文字領域における文字の向きを特定し、文字の向きに基づいて、原稿画像の向きを特定してもよい。

また、原稿向き特定部１０２ｅは、特定領域の特定領域データと辞書データとの比較に基づいて、特定領域における文字の向きを特定し、文字の向きに基づいて、原稿画像の向きを特定してもよい。

特定領域向き補正部１０２ｆは、正立補正した特定領域の補正後特定領域画像データを取得する。ここで、特定領域向き補正部１０２ｆは、原稿画像の向きに基づいて、正立補正した特定領域の補正後特定領域画像データを取得してもよい。

原稿向き補正部１０２ｇは、正立補正した原稿画像の補正後原稿画像データを取得する。ここで、原稿向き補正部１０２ｇは、原稿画像の向きに基づいて、正立補正した原稿画像の補正後原稿画像データを取得してもよい。

画像表示部１０２ｈは、画像データを表示させる。ここで、画像表示部１０２ｈは、撮影画像データ、原稿画像データ、特定領域画像データ、補正後特定領域画像データ、および／または、補正後原稿画像データを表示させてもよい。

ここで、画像表示部１０２ｈは、原稿画像データを表示させ、且つ、補正後特定領域画像データを拡大表示させてもよい。また、画像表示部１０２ｈは、原稿画像データ上に、補正後特定領域画像データを拡大して重畳表示させてもよい。

また、画像表示部１０２ｈは、原稿画像データを表示させ、原稿画像の一部をユーザに選択させてもよい。また、画像表示部１０２ｈは、画像データを入出力部１１２に表示させてもよい。また、画像表示部１０２ｈは、文字データを表示させてもよい。

［本実施形態の処理］
上述した構成のモバイル端末１００で実行される処理の一例について、図２から図１９を参照して説明する。図２は、本実施形態のモバイル端末１００における処理の一例を示すフローチャートである。

図２に示すように、まず、撮影画像取得部１０２ａは、矩形原稿を被写体とした撮影部（カメラ）１１０による撮影を制御して、撮影部１１０の撮影による撮影画像の撮影画像データを取得する（ステップＳＡ−１）。

そして、原稿取得部１０２ｂは、エッジ検出法、および／または、特徴点マッチング法を用いて、撮影画像データから原稿画像の位置データを検出し、原稿画像の位置データに基づいて、撮影画像に含まれる原稿画像を特定し、原稿画像データを取得する（ステップＳＡ−２）。

そして、特定領域取得部１０２ｄは、原稿画像における特定領域の特定領域画像データを取得する（ステップＳＡ−３）。

そして、原稿向き特定部１０２ｅは、原稿画像データに対するラベリング処理により、原稿画像における文字を示す文字領域を特定し、文字領域の文字領域データと辞書データファイル１０６ａに記憶された辞書データとの比較に基づいて、文字領域における文字の向きを特定し、文字の向きに基づいて、原稿画像の向きを特定する（ステップＳＡ−４）。

そして、特定領域向き補正部１０２ｆは、原稿画像の向きに基づいて、正立補正した特定領域の補正後特定領域画像データを取得する（ステップＳＡ−５）。

そして、画像表示部１０２ｈは、補正後特定領域画像データを入出力部１１２に表示させ、ユーザに特定領域のボケを確認させる（ステップＳＡ−６）。

ここで、図３から図１６を参照して、本実施形態における画像表示の一例について説明する。図３から図１６は、本実施形態における画像表示の一例を示す図である。

図３に示すように、画像表示部１０２ｈは、原稿画像Ａの原稿画像データを背景として、正立補正した特定の文字領域Ｂの画像データを入出力部１１２に重畳表示させてもよい。

このように、本実施形態においては、撮影後、ユーザが原稿の撮影完了を確認するために、ユーザが可読可能な特定の文字領域を表示している。

また、画像表示部１０２ｈは、図４に示すように、原稿画像Ｃの原稿画像データを表示させ、ユーザにより入出力部１１２を介してタップされた場合、図５に示すように、正立補正したタップ位置に相当する領域Ｄの画像データを入出力部１１２に重畳表示させてもよい。

このように、画像表示部１０２ｈは、入出力部１１２上でユーザが見たい領域をタップした場合、タップされた領域が正立補正された状態の画像データをポップアップ表示してもよい。

また、図６に示すように、画像表示部１０２ｈは、原稿画像においてボケている領域Ｅ、および、原稿画像において重要そうな箇所Ｆ等の複数の補正後特定領域画像データを同時に入出力部１１２に表示させてもよい。

また、図７に示すように、画像表示部１０２ｈは、正立状態の原稿が撮影された場合であっても、原稿画像Ｇの原稿画像データ上に特定領域Ｈの特定領域画像データを入出力部１１２に重畳表示させてもよい。

また、図８に示すように、画像表示部１０２ｈは、原稿画像Ｉの原稿画像データ上に、原稿画像の上部領域Ｊの画像データを入出力部１１２に重畳表示させてもよい。

また、図９に示すように、画像表示部１０２ｈは、背景に原稿画像データを表示させずに、回転させた原稿画像の一部領域の画像データのみを入出力部１１２に表示させてもよい。

また、図１０に示すように、画像表示部１０２ｈは、原稿画像にボケ領域が無く、可読可能な場合、一部領域の画像データを表示させずに、正立補正した原稿画像の原稿画像データを入出力部１１２に表示させてもよい。

ここで、一般的な原稿は、タイトル等の重要箇所が正立時の原稿画像上部に位置することが多く、他の文字に比べ文字サイズが大きいことが多い。

また、図１１の枠で囲まれた部分のように、正立時に原稿画像上部、且つ、文字ポイントが大きい箇所Ｋがある場合、図１２に示すように、画像表示部１０２ｈは、原稿画像Ｌの原稿画像データ上に、箇所Ｋの画像データを入出力部１１２に重畳表示させてもよい。

このように、一般的な原稿の場合、タイトル等の重要な箇所が正立時の原稿画像上部に位置することが多く、他の文字に比べ文字サイズが大きいことが多いため、画像表示部１０２ｈは、正立補正した当該箇所の画像データを拡大表示させてもよい。

また、図１３の枠で囲まれた部分のように、領収書画像中に金額を示す文字から構成される領域Ｍがある場合、図１４に示すように、画像表示部１０２ｈは、領収書画像Ｎの領収書画像データ上に、正立補正した領域Ｍの画像データを入出力部１１２に重畳表示させてもよい。

このように、請求書、領収書およびレシート等の帳票の場合、金額（数値）が重要であるため、画像表示部１０２ｈは、正立補正した金額を示す領域の画像データを拡大表示させてもよい。

また、図１５の枠で囲まれた部分のように、名刺画像における名前を示す文字から構成される領域Ｐがある場合、図１６に示すように、画像表示部１０２ｈは、名刺画像Ｑの名刺画像データ上に、正立補正した領域Ｐの画像データを入出力部１１２に重畳表示させてもよい。

このように、名刺の場合、名前または会社名等が重要であるため、画像表示部１０２ｈは、正立補正した名前または会社名等を示す領域の画像データを拡大表示させてもよい。

そして、制御部１０２は、ユーザの確認により、入出力部１１２を介して再撮影が必要であるとの指示が入力されたか否かを判定する（ステップＳＡ−７）。

そして、制御部１０２は、再撮影が必要であるとの指示が入力されたと判定した場合（ステップＳＡ−７：Ｙｅｓ）、処理をステップＳＡ−１に移行させる。

ここで、図１７を参照して、本実施形態における撮影リトライ制御の一例について説明する。図１７は、本実施形態における撮影リトライ制御の一例を示す図である。

図１７に示すように、本実施形態においては、ユーザに原稿画像の一番ボケている特定領域（文字領域）Ｒを確認させることによって、ユーザに撮影をし直すかどうかの判断をさせる。

そして、本実施形態においては、ユーザが一番ボケている特定領域が可読不可と判断した場合、ユーザに再度同じ原稿の撮影を指示させてもよい。

このように、本実施形態において、ユーザは、再度同じ原稿の撮影が必要であるか否かを判断できる。

一方、制御部１０２は、再撮影が不必要であるとのユーザ確認が入力されたと判定した場合（ステップＳＡ−７：Ｎｏ）、処理をステップＳＡ−８に移行させる。

そして、原稿向き補正部１０２ｇは、原稿画像の向きに基づいて、正立補正した原稿画像の補正後原稿画像データを取得する（ステップＳＡ−８）。

そして、原稿向き補正部１０２ｇは、補正後原稿画像データを画像データファイル１０６ｂに保存（格納）し（ステップＳＡ−９）、処理を終了する。

図１８を参照して、本実施形態における撮影リトライ制御の一例について説明する。図１８は、本実施形態における撮影リトライ制御の一例を示す図である。

図１８に示すように、本実施形態においては、ユーザが一番ボケている特定領域Ｓが可読可能と判断した場合、再度の撮影が必要無いため、正立補正した原稿画像の補正後原稿画像データの保存を行った後、次の原稿の撮影に移ることができる。

ここで、図１９を参照して、本実施形態における特定領域表示処理の概要の一例について説明する。図１９は、本実施形態における特定領域表示処理の一例を示す概要図である。

図１９に示すように、本実施形態においては、モバイル端末にて原稿を撮影し（ステップＳＢ−１）、撮影画像から原稿画像の取得を行う（ステップＳＢ−２）。

そして、本実施形態においては、原稿画像の向き判定を実施し（ステップＳＢ−３）、原稿画像において、向き判定に使用された箇所、ボケが大きい箇所または重要な箇所である特定領域を向き補正した画像データを取得する（ステップＳＢ−４）。

そして、本実施形態においては、確認を容易にするため、向き補正なしの原稿画像を全体表示すると同時に、向き補正ありの特定領域を拡大表示し、ユーザにその結果を確認させる（ステップＳＢ−５）。

そして、本実施形態においては、再撮影が不必要であるとのユーザ確認が入力された場合（ステップＳＢ−６）、原稿画像全体の向き補正を実施してサムネイル表示すると同時に、モバイル端末またはクラウド上にデータ保存し（ステップＳＢ−７）、処理を終了する。

このように、本実施形態においては、ユーザが対象原稿を撮影した後に切り出しを行い、原稿画像の一部領域のみ向き補正処理を行い、向き補正が適用された領域を前面に表示することで、ユーザがその結果を確認することができる。

近年、スマートフォンまたはタブレット等のモバイル端末の普及に伴い、従来ではスキャナが利用されてきた業務が、カメラを有するモバイル端末を利用する業務に変化している。

これは、カメラによるスキャニングは場所を問わないこと、または、媒体の制限が無いことによる自由度が高いという利点があるからである。

一方、従来のモバイル端末においては、ユーザがモバイルカメラで原稿を撮影し、直後に原稿画像の文字が読めるのか等を確認したい際に、自動で向き補正処理が施されて原稿画像が回転してしまう、または、文字サイズが小さくなってしまうことで、確認が困難となるという問題があった。

また、従来のモバイル端末においては、複数の原稿の撮影と確認とを繰り返す場合、文字が読めている状態なのかをデバイスを縦にして確認した直後に、デバイスを横にして次の原稿を撮影する必要もあった。

このように、従来のモバイル端末においては、モバイルカメラで原稿を撮影する場合、ユーザは文字が読めるかどうかすぐに確認したいが、自動的に正立補正が行われると、原稿が回転してしまい、画像も縮小されてしまう場合もあるため読みづらくなってしまうという問題があった。

そこで、本実施形態においては、モバイルカメラで撮影し原稿画像を切り出し、切り出した原稿画像から文字領域を抽出し、抽出した文字領域の向きを判定して向き補正し、原稿画像全体と向き補正した文字領域とをモバイル端末上で表示する方法を提供している。

［他の実施形態］
さて、これまで本発明の実施形態について説明したが、本発明は、上述した実施形態以外にも、請求の範囲に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。

例えば、モバイル端末１００は、スタンドアローンの形態で処理を行ってもよく、クライアント端末（モバイル端末１００とは別筐体である）からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するようにしてもよい。

また、実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。

このほか、明細書中および図面中で示した処理手順、制御手順、具体的名称、各処理の登録データもしくは検索条件等のパラメータを含む情報、画面例、または、データベース構成については、特記する場合を除いて任意に変更することができる。

また、モバイル端末１００に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。

例えば、モバイル端末１００の各装置が備える処理機能、特に制御部１０２にて行われる各処理機能については、その全部または任意の一部を、ＣＰＵおよび当該ＣＰＵにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。

なお、プログラムは、後述する、コンピュータに本発明に係る方法を実行させるためのプログラム化された命令を含む、一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じてモバイル端末１００に機械的に読み取られる。すなわち、ＲＯＭまたはＨＤＤなどの記憶部１０６などには、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）と協働してＣＰＵに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、ＲＡＭにロードされることによって実行され、ＣＰＵと協働して制御部を構成する。

また、このコンピュータプログラムは、モバイル端末１００に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。

また、本発明に係るプログラムを、コンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、ＵＳＢメモリ、ＳＤカード、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭ、ＤＶＤ、および、Ｂｌｕ−ｒａｙ（登録商標）Ｄｉｓｃ等の任意の「可搬用の物理媒体」を含むものとする。

また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、ＯＳに代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。

記憶部１０６に格納される各種のデータベース等は、ＲＡＭもしくはＲＯＭ等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および／または、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および／または、ウェブページ用ファイル等を格納してもよい。

また、モバイル端末１００は、既知のパーソナルコンピュータ等の情報処理装置として構成してもよく、また、該情報処理装置に任意の周辺装置を接続して構成してもよい。また、モバイル端末１００は、該情報処理装置に本発明の方法を実現させるソフトウェア（プログラム、データ等を含む）を実装することにより実現してもよい。

更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じて、または、機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。

以上のように、モバイル端末、画像処理方法、および、プログラムは、産業上の多くの分野、特にカメラで読み込んだ画像を扱う画像処理分野で実施することができ、極めて有用である。

１００モバイル端末
１０２制御部
１０２ａ撮影画像取得部
１０２ｂ原稿取得部
１０２ｃボケ検出部
１０２ｄ特定領域取得部
１０２ｅ原稿向き特定部
１０２ｆ特定領域向き補正部
１０２ｇ原稿向き補正部
１０２ｈ画像表示部
１０６記憶部
１０６ａ辞書データファイル
１０６ｂ画像データファイル
１１０撮影部
１１２入出力部
１１４センサ部
１１６通信部

Claims

原稿画像における特定領域の特定領域画像を取得する特定領域取得手段と、
前記原稿画像の向きを特定する原稿向き特定手段と、
前記原稿画像の向きに基づいて正立補正した前記特定領域の補正後特定領域画像を取得する特定領域向き補正手段と、
正立していない前記原稿画像の向きを維持したまま前記原稿画像を表示させる一方で、前記補正後特定領域画像を前記特定領域に対応付けて前記原稿画像上に拡大表示させる補正後画像表示手段と、
を備えたモバイル端末。
ボケが所定の基準値以上となる前記原稿画像の一部をボケ領域として検出するボケ検出手段、を更に備え、
前記特定領域取得手段は、前記ボケ領域を前記特定領域として、前記特定領域画像を取得する、
請求項１に記載のモバイル端末。
前記特定領域取得手段は、前記原稿画像に含まれる重要箇所を推定し、前記重要箇所を前記特定領域として、前記特定領域画像を取得する、
請求項１に記載のモバイル端末。
前記原稿画像を表示させ、前記原稿画像の一部をユーザに選択させる原稿画像表示手段、を更に備え、
前記特定領域取得手段は、前記ユーザに選択された前記原稿画像の一部を前記特定領域として、前記特定領域画像を取得する、
請求項１に記載のモバイル端末。
前記重要箇所は、前記原稿画像に含まれる正立補正後に原稿画像上部に位置する、サイズの大きい、太字の、および／または、色の異なる文字から構成される領域である、
請求項３に記載のモバイル端末。
前記重要箇所は、前記原稿画像に含まれる金額を示す文字、数字、および／または、記号から構成される領域である、
請求項３に記載のモバイル端末。
前記原稿画像の向きに基づいて正立補正した前記原稿画像の補正後原稿画像を取得する原稿向き補正手段、を更に備えた、
請求項１に記載のモバイル端末。
前記補正後原稿画像を表示させる補正後原稿画像表示手段、を更に備えた、
請求項７に記載のモバイル端末。
前記特定領域は、前記原稿画像の上部領域である、
請求項１に記載のモバイル端末。
ボケが所定の基準値以上となる前記原稿画像の一部をボケ領域として検出するボケ検出手段、を更に備え、
前記特定領域取得手段は、前記ボケ検出手段により前記ボケ領域が検出されなかった場合、前記原稿画像全体を前記特定領域として、前記特定領域画像を取得する、
請求項１に記載のモバイル端末。
前記原稿向き特定手段は、前記特定領域におけるコンテンツの向きを特定し、当該コンテンツの向きに基づいて、前記原稿画像の向きを特定する、
請求項１に記載のモバイル端末。
前記原稿向き特定手段は、前記原稿画像における文字の向きを特定し、当該文字の向きに基づいて、前記原稿画像の向きを特定する、
請求項１に記載のモバイル端末。
原稿画像における特定領域の特定領域画像を取得する特定領域取得ステップと、
前記原稿画像の向きを特定する原稿向き特定ステップと、
前記原稿画像の向きに基づいて正立補正した前記特定領域の補正後特定領域画像を取得する特定領域向き補正ステップと、
正立していない前記原稿画像の向きを維持したまま前記原稿画像を表示させる一方で、前記補正後特定領域画像を前記特定領域に対応付けて前記原稿画像上に拡大表示させる補正後画像表示ステップと、
を含む画像処理方法。
原稿画像における特定領域の特定領域画像を取得する特定領域取得ステップと、
前記原稿画像の向きを特定する原稿向き特定ステップと、
前記原稿画像の向きに基づいて正立補正した前記特定領域の補正後特定領域画像を取得する特定領域向き補正ステップと、
正立していない前記原稿画像の向きを維持したまま前記原稿画像を表示させる一方で、前記補正後特定領域画像を前記特定領域に対応付けて前記原稿画像上に拡大表示させる補正後画像表示ステップと、
をコンピュータに実行させるためのプログラム。