JP6208383B2 - プレビューモードにおける画像キャプチャリングパラメータ調整 - Google Patents

プレビューモードにおける画像キャプチャリングパラメータ調整 Download PDF

Info

Publication number
JP6208383B2
JP6208383B2 JP2016571692A JP2016571692A JP6208383B2 JP 6208383 B2 JP6208383 B2 JP 6208383B2 JP 2016571692 A JP2016571692 A JP 2016571692A JP 2016571692 A JP2016571692 A JP 2016571692A JP 6208383 B2 JP6208383 B2 JP 6208383B2
Authority
JP
Japan
Prior art keywords
text
image
parameter
candidate
target focus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016571692A
Other languages
English (en)
Other versions
JP2017517980A (ja
Inventor
チョ、ヒュン−モク
キム、ドゥク−ホン
リ、テ−ウォン
カンダーダイ、アナンサパドマナバーン
ファン、ペンジュン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2017517980A publication Critical patent/JP2017517980A/ja
Application granted granted Critical
Publication of JP6208383B2 publication Critical patent/JP6208383B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/667Camera operation mode switching, e.g. between still and video, sport and normal or high- and low-resolution modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/71Circuitry for evaluating the brightness variation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/73Circuitry for compensating brightness variation in the scene by influencing the exposure time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Studio Devices (AREA)

Description

優先権の主張
[0001]本出願は、その内容全体が参照により組み込まれる、「IMAGE CAPTURING PARAMETER ADJUSTMENT IN PREVIEW MODE」と題する、2014年6月9日に出願された米国特許出願第14/300,023号の優先権を主張する。
[0002]本開示は、一般に電子デバイスにおいて画像をキャプチャすることに関し、より詳細には、電子デバイスのプレビューモードにおいて画像キャプチャリングパラメータを調整することに関する。
[0003]カメラ、スマートフォン、タブレットコンピュータなど、現代の電子デバイスは、一般に画像センサー(たとえば、カメラモジュール)を装備する。画像センサーは、電子デバイスにおける記憶および/または表示のために様々なシーンの写真をキャプチャするために使用される。写真がキャプチャされ記憶された後に、そのような電子デバイスにおける画像処理機能は、ユーザが彼または彼女の選好に従って写真を向上させるかまたは改善することを可能にし得る。たとえば、いくつかの電子デバイスは、ユーザが写真を閲覧し、自動向上、クロップ、回転、赤目低減などの様々な機能の間で所望の編集機能を選択することを可能にし得る。
[0004]画像センサーを装備した従来の電子デバイスは、一般に、様々なタイプのシーンとオブジェクトとの写真をキャプチャするために使用される。たとえば、そのような電子デバイスは、花、壁、ドア、光源などのテキストおよび非テキストオブジェクトとともにドキュメントまたは標識などのテキストオブジェクトを含むシーンを撮影するために使用され得る。しかしながら、シーンが非テキストオブジェクトを含むので、そのような電子デバイスの画像センサーは、シーン中のテキストオブジェクトのために最適化された写真をキャプチャすることが不可能であり得る。
[0005]さらに、従来の電子デバイスは、所望のテキストオブジェクトを含む部分ではなく、シーンの中心部分など、シーンの所定の部分において合焦するように構成され得る。したがって、キャプチャされたシーンの写真中のテキストオブジェクトは画像品質が不十分であり得る。いくつかの電子デバイスはまた、ユーザが、ディスプレイスクリーン上で合焦されるべきシーンの所望の部分を手動で指定することを可能にし得る。しかしながら、電子デバイスを保持しながらシーンの所望の部分を手動で選択することは、ユーザにとってあまり好都合でないことがある。
[0006]本開示は、少なくとも1つのテキストオブジェクトを含む画像をキャプチャするために、少なくとも1つのテキストオブジェクトを含むシーンのプレビュー画像に基づいて画像センサーのための少なくとも1つの画像キャプチャリングパラメータを調整するための方法と装置とを提供する。
[0007]本開示の一態様によれば、プレビューモードにおいて少なくとも1つの画像キャプチャリングパラメータを調整するための、電子デバイスによって実施される方法が開示される。本方法は、画像キャプチャリングパラメータのセットに基づいて少なくとも1つのテキストオブジェクトを含むシーンのプレビュー画像をキャプチャすることを含み得る。本方法はまた、プレビュー画像中に複数のテキスト領域を識別し得る。複数のテキスト領域から、ターゲットフォーカス領域が選択され得る。ターゲットフォーカス領域に基づいて、少なくとも1つの画像キャプチャリングパラメータが調整され得る。本開示はまた、本方法に関係する装置と、デバイスと、システムと、手段の組合せと、コンピュータ可読媒体とについて説明する。
[0008]本開示の別の態様によれば、プレビューモードにおいて少なくとも1つの画像キャプチャリングパラメータを調整するための電子デバイスが開示される。電子デバイスは、画像キャプチャリングパラメータのセットに基づいて少なくとも1つのテキストオブジェクトを含むシーンのプレビュー画像をキャプチャするように構成された画像センサーと、プレビュー画像中に複数のテキスト領域を識別するように構成されたテキスト領域検出ユニットとを含み得る。電子デバイスはまた、複数のテキスト領域からターゲットフォーカス領域を選択するように構成されたターゲットフォーカス領域検出ユニットを含み得る。電子デバイス中の画像センサー制御ユニットは、ターゲットフォーカス領域に基づいて少なくとも1つの画像キャプチャリングパラメータを調整するように構成される。
[0009]本開示の発明的態様の実施形態は、以下の詳細な説明を参照しながら、添付の図面とともに読むことで理解されよう。
[0010]本開示の一実施形態による、少なくとも1つの画像キャプチャリングパラメータを調整するために複数のテキストオブジェクトを含むシーンのプレビュー画像を表示するためにプレビューモードで動作するように構成された電子デバイスの図。 [0011]本開示の一実施形態による、複数のテキスト領域を含むシーンのプレビュー画像に基づいて少なくとも1つの画像キャプチャリングパラメータを調整するように構成された電子デバイスのブロック図。 [0012]本開示の一実施形態による、モード選択入力に応答して画像センサーをカメラモードのうちの1つに設定するために複数のカメラモードを記憶するように構成された記憶ユニットのブロック図。 [0013]本開示の一実施形態による、プレビュー画像中に複数のテキスト領域を識別するように構成されたテキスト領域検出ユニットのブロック図。 [0014]本開示の一実施形態による、プレビューモードにおいて画像センサーのための少なくとも1つの画像キャプチャリングパラメータを調整することによってシーンの画像をキャプチャするための方法のフローチャート。 [0015]本開示の一実施形態による、シーンのプレビュー画像よりも高い解像度におけるシーンの別のプレビュー画像中の複数の候補テキスト領域に基づいて、シーンのプレビュー画像中に複数のテキスト領域を識別するための方法のフローチャート。 [0016]本開示の一実施形態による、電子デバイスのディスプレイスクリーン上に表示される複数のテキストオブジェクトを含むシーンのプレビュー画像。 [0017]本開示の一実施形態による、プレビューモードにおいてシーンの複数のプレビュー画像に基づいて画像センサーのためのフォーカスパラメータを調整するための方法のフローチャート。 [0018]本開示の一実施形態による、電子デバイスのディスプレイスクリーン上に表示される複数の車両を含むシーンのプレビュー画像。 [0019]本開示の一実施形態による、電子デバイスのディスプレイスクリーン上に表示される光源とドキュメントの一部分とを含む屋内シーンのプレビュー画像。 [0020]本開示の一実施形態による、プレビュー画像中のターゲットフォーカス領域の輝度値に基づいて画像センサーのための露出パラメータを調整するための方法のフローチャート。 [0021]本開示の一実施形態による、プレビューモードにおいて少なくとも1つの画像キャプチャリングパラメータを調整するための方法および装置が実装され得る例示的な電子デバイスのブロック図。
[0022]次に、添付の図面にその例が示されている、様々な実施形態を詳細に参照する。以下の詳細な説明では、本主題の完全な理解を与えるために多数の具体的な詳細が記載される。ただし、本主題はこれらの具体的な詳細なしに実施され得ることが当業者には明らかであろう。他の事例では、様々な実施形態の態様を不必要に不明瞭にしないように、よく知られている方法、手順、システム、および構成要素については詳細に説明されていない。
[0023]図1は、本開示の一実施形態による、少なくとも1つの画像キャプチャリングパラメータを調整するために複数のテキストオブジェクト140、150、および160を含むシーン100のプレビュー画像180を表示するためにプレビューモードで動作するように構成された電子デバイス120を示す。図示のように、ユーザ110は、複数のテキストオブジェクト140、150、および160を含むシーン100の画像をキャプチャするために画像センサー130を装備した電子デバイス120を動作させ得る。本明細書で使用する、「キャプチャ」または「キャプチャリング」という用語は、シーンの光学的画像をデータまたは信号に変換し、データまたは信号を記憶ユニットに記憶することを指し得、プレビューモード(たとえば、リアルタイムプレビューモード)においてデータまたは信号を一時的に記憶することを含み得る。テキストオブジェクト140は、街路名「FIRST AVENUE」を含む街路標識であり得るが、テキストオブジェクト150および160は、それぞれ「駐車禁止」および「止まれ」という標識であり得る。テキストオブジェクト140、150、および160は標識として示されているが、それらは、テキスト(たとえば、1つまたは複数の文字)を含むか、表示するか、または示すどんなオブジェクトでもあり得る。さらに、テキストオブジェクト140、150、および160はまた、1つまたは複数のテキスト領域を含み得、それらの各々は、同様のサイズ、色、パターンなどのテキストまたは文字を含み得る。本明細書に示されているように、電子デバイス120は、デジタルカメラ(たとえば、DSLRカメラ)、スマートフォン、ウェアラブルコンピュータ(たとえば、スマートガラス、スマートウォッチなど)、パーソナルコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、ゲームデバイスなど、画像キャプチャおよび処理能力を装備した任意の好適なデバイスであり得る。
[0024]画像センサー130を装備した電子デバイス120は、ユーザ110のための1つまたは複数のプレビュー画像をキャプチャし表示するためにプレビューモードで動作し得る。たとえば、ユーザ110は、街路中をナビゲートするのを支援するためにまたはテキスト認識のために街路名「FIRST AVENUE」をもつテキストオブジェクト140を含むシーン100のピクチャを撮り得る。一実施形態によれば、電子デバイス120は、画像中のテキストをキャプチャするためにプレビューモードの前または間にテキストモードに設定されるように構成され得る。テキストモードでは、複数の画像キャプチャリングパラメータは、画像中のテキストをキャプチャするのに好適な所定の初期値のセットに設定され得る。たとえば、画像センサー130のための画像キャプチャリングパラメータのセットは、フォーカスパラメータ、露出パラメータ、ホワイトバランスパラメータ、コントラスト強調パラメータ、ズームパラメータ、光に対する感度パラメータなどを含み得る。
[0025]ピクチャを撮る前に、ユーザ110は、シーン100のプレビュー画像180を閲覧するためにプレビューモードで電子デバイス120を動作させ得る。プレビュー画像180から、電子デバイス120は、テキストオブジェクト140、150、および160中にそれぞれ複数のテキスト領域142、152、および162を識別し、ターゲットフォーカス領域としてテキスト領域142、152、および162のうちの1つを選択し得る。一実施形態では、電子デバイス120は、テキスト領域142、152、および162の各々のサイズを決定し、ターゲットフォーカス領域として最も大きいテキストサイズを有するテキスト領域を選択し得る。たとえば、図1のプレビュー画像180では、テキストオブジェクト140中のテキスト「FIRST AVENUE」に対応するテキスト領域142は、テキスト領域152および162よりも大きい。したがって、電子デバイス120は、テキスト領域142をターゲットフォーカス領域として識別し得る。
[0026]テキスト「FIRST AVENUE」を含むターゲットフォーカス領域142を識別すると、電子デバイス120は、シャープネス値、輝度値、コントラスト値、彩度値など、ターゲットフォーカス領域142の画像品質を示す1つまたは複数の値を決定し得る。ターゲットフォーカス領域142の画像品質の値に基づいて、電子デバイス120は、テキスト「FIRST AVENU」をもつターゲットフォーカス領域142をキャプチャするために最適化されたかまたはそれに適した少なくとも1つの画像キャプチャリングパラメータ値を決定し、少なくとも1つの画像キャプチャリングパラメータを関連するパラメータ値に調整し得る。一実施形態では、少なくとも1つの画像キャプチャリングパラメータ中のフォーカスパラメータは、ターゲットフォーカス領域142のシャープネスの所定のレベルを生成するように適応されたかまたはそれに適した値に調整され得る。追加または代替として、少なくとも1つの画像キャプチャリングパラメータ中の露出パラメータは、ターゲットフォーカス領域142のための所定のレベルの輝度を生成するために露出値(たとえば、アパーチャ、時間など)に調整され得る。
[0027]図2は、本開示の一実施形態による、少なくとも1つのテキストオブジェクトを含むシーンのプレビュー画像に基づいて、画像センサー130のための少なくとも1つの画像キャプチャリングパラメータを調整するように構成された電子デバイス120のより詳細なブロック図である。電子デバイス120は、I/Oユニット210と、画像センサー130と、記憶ユニット220と、通信ユニット230と、プロセッサ240とを含み得る。プロセッサ240は、テキスト領域検出ユニット242と、ターゲットフォーカス領域検出ユニット244と、画像センサー制御ユニット246と、テキスト認識ユニット248とを含み得る。
[0028]I/Oユニット210は、ユーザ110からのコマンドおよび/またはユーザ110のための出力情報を受信するように構成され得る。たとえば、I/Oユニット210は、カメラモード(たとえば、オートフォーカスモード、テキストモード、夜間モード、ポートレートモードなど)のうちの1つを選択するためにユーザ110からコマンドまたは入力を受信し得る。選択されたカメラモードに基づいて、画像センサー130は、シーンの1つまたは複数のプレビュー画像をキャプチャするためにプレビューモードで動作し得る。プレビューモードでは、キャプチャされたプレビュー画像は、記憶ユニット220に一時的に記憶され、I/Oユニット210上に表示され得る。画像センサー130は、カメラまたはカメラモジュールなど、シーンまたはオブジェクトの画像をキャプチャまたは感知することが可能な任意のデバイスであり得る。
[0029]選択されたカメラモードで動作している間、I/Oユニット210は、ユーザ110からシーンの画像をキャプチャするためのコマンドまたは入力を受信し得る。コマンドまたは入力に応答して、シーンの画像は画像センサー130によってキャプチャされ、記憶ユニット220に記憶されおよび/またはI/Oユニット210上に表示され得る。本明細書に示されているように、I/Oユニット210は、コマンドを受信することおよび/または情報を出力することが可能な任意の好適なデバイスであり、タッチスクリーン、ダイヤル、ボタン、キーパッド、タッチパッド、ディスプレイスクリーンなどを含み得る。
[0030]記憶ユニット220は、プレビューモード中にキャプチャされたプレビュー画像を一時的に記憶するように構成され得る。たとえば、記憶ユニット220は、画像データを含むプレビュー画像の各々と画像のサイズ(たとえば、幅および高さ)とについてのデータを記憶し得る。この場合、画像データは、ピクセルの数およびピクセルのカラー値などのピクセル情報を含み得る。プレビュー画像は、画像センサー130のための少なくとも1つの画像キャプチャリングパラメータ値を調整するためにプロセッサ240によってアクセスされ得る。
[0031]記憶ユニット220は、プレビュー画像中に1つまたは複数のテキスト領域を識別するために使用され得る分類器データベースを記憶し得る。一実施形態では、分類器データベースは、所与のテキストが言語(たとえば、英語、フランス語など)に関連付けられる確率を決定するために使用され得る所定数の言語の各々のための確率モデルを含み得る。記憶ユニット220はまた、言語に関連付けられた複数の文字を認識するために使用され得る文字情報データベースを記憶することができる。言語の各々について、文字情報データベースは、言語において使用される複数の文字のパターンもしくは形状データ、言語における複数の文字を表すグリフの画像(images of glyphs)、および/または言語における各個々のグリフに関連する少なくとも1つの特徴を含み得る。さらに、記憶ユニット220は、テキスト領域中の1つまたは複数の単語を認識する際に使用するための言語の辞書データベースを記憶し得る。たとえば、辞書データベースは、言語にマッピングされた複数の単語を含み得る。
[0032]いくつかの実施形態では、記憶ユニット220は、所定のサイズの1つまたは複数のテキスト領域を含み得る、ライセンスプレート、値札など、複数の参照オブジェクトについてのサイズ情報を記憶し得る。たとえば、参照オブジェクトの各々についてのサイズ情報は、テキスト領域またはテキスト領域中の1つもしくは複数の文字の各々についてのサイズを含み得る。記憶ユニット220は、RAM(ランダムアクセスメモリ)、ROM(読取り専用メモリ)、EEPROM(登録商標)(電気的消去可能プログラマブル読取り専用メモリ)、フラッシュメモリ、またはSSD(ソリッドステートドライブ)など、任意の好適なストレージまたはメモリデバイスを使用して実装され得る。
[0033]プロセッサ240は、画像センサー130のための1つまたは複数の画像キャプチャリングパラメータ値を決定するために、記憶ユニット220中の1つまたは複数のテキストオブジェクトを含むシーンの1つまたは複数のプレビュー画像にアクセスし得る。プロセッサ240は、次いで、画像センサー130のための1つまたは複数の画像キャプチャリングパラメータを、決定された1つまたは複数の画像キャプチャリングパラメータ値に調整し得る。1つまたは複数の調整された画像キャプチャリングパラメータで構成されて、画像センサー130は、次いで、自動的にまたはユーザ110からの入力に応答して、シーンの画像をキャプチャし得る。たとえば、画像は、画像キャプチャリングパラメータを調整するともしくはその後に自動的にキャプチャされるか、またはユーザ110がシャッターボタンを押すかもしくは画像センサー130の画像キャプチャ機能をアクティブにすることによってシーンのピクチャを撮るためのコマンドを入力したときに手動でキャプチャされ得る。
[0034]プロセッサ240中のテキスト領域検出ユニット242は、記憶ユニット220からシーンの1つまたは複数のプレビュー画像を受信し、プレビュー画像の各々中に1つまたは複数のテキスト領域を検出するように構成され得る。このプロセスでは、ブロブクラスタリング方法(blob clustering method)、エッジベースの方法、連結成分ベースの方法、テクスチャベースの方法などを使用する任意の好適なテキスト候補抽出方式に基づいて、プレビュー画像中に1つまたは複数の候補テキスト領域が検出され得る。候補テキスト領域を検出すると、テキスト領域検出ユニット242は、プレビュー画像中の候補テキスト領域の各々から特徴のセットを抽出し得る。次いで、記憶ユニット220からの分類器データベースに基づいて、特徴のセットのための分類スコアが生成され得る。候補テキスト領域に関連する分類スコアに基づいて、テキスト領域検出ユニット242は、プレビュー画像中に1つまたは複数のテキスト領域を識別し得る。識別されたテキスト領域および関連する分類スコアは、テキスト領域からターゲットフォーカス領域を選択するためにターゲットフォーカス領域検出ユニット244に提供され得る。
[0035]一実施形態によれば、プレビュー画像中に候補テキスト領域を検出すると、テキスト領域検出ユニット242は、より高い解像度でキャプチャされたシーンの別のプレビュー画像にアクセスし、検出された候補テキスト領域に対応するより高い解像度画像から候補テキスト領域を取得し得る。この場合、画像センサー130は、複数の画像解像度に基づいてシーンの複数のプレビュー画像をキャプチャするように構成され得る。たとえば、第1のプレビュー画像は、所定の解像度(たとえば、320×240)でキャプチャされ、記憶ユニット220に一時的に記憶され得る。さらに、シーンの第2のプレビュー画像も、プレビュー画像よりも高い解像度(たとえば、1280×720)でキャプチャされ、記憶ユニット220に一時的に記憶され得る。いくつかの実施形態では、両方の解像度のプレビュー画像は、プロセッサ240によるアクセスのために、記憶ユニット220中の領域または専用画像バッファであり得るバッファメモリに記憶され得る。
[0036]テキスト領域検出ユニット242は、次いで、第1のプレビュー画像にアクセスして第1のプレビュー画像中に1つまたは複数の候補テキスト領域を識別し、候補テキスト領域の各々のためのロケーション(たとえば、ピクセル座標)を検出し得る。テキスト領域検出ユニット242はまた、第2のプレビュー画像にアクセスし、第1のプレビュー画像中の検出された候補テキスト領域のロケーションにマッピングする第2のプレビュー画像中の対応する候補テキスト領域を決定し得る。テキスト領域検出ユニット242は、次いで、第2のプレビュー画像中の候補テキスト領域の各々から特徴のセットを抽出し、第1のプレビュー画像中に複数のテキスト領域を識別する際に使用するための特徴のセットの分類スコアを生成し得る。より高い解像度画像からの候補テキスト領域を使用することによって、より低い解像度を有する第1のプレビュー画像中のテキスト領域はより正確に検出され得る。
[0037]代替実施形態では、テキスト領域検出ユニット242は、テキスト認識結果に基づいて候補テキスト領域からテキスト領域を識別し得る。たとえば、テキスト領域検出ユニット242は、プレビュー画像中の1つまたは複数の候補テキスト領域をテキスト認識ユニット248に提供し得、テキスト認識ユニット248は候補テキスト領域上でテキスト認識を実施し得る。テキスト認識ユニット248は、次いで、候補テキスト領域のテキスト認識の結果をテキスト領域検出ユニット242に提供し得る。テキスト認識結果に基づいて、テキスト領域検出ユニット242は、1つまたは複数のテキスト領域として1つまたは複数の候補テキスト領域を識別し得る。たとえば、結果が、候補テキスト領域中のテキストが認識されたことを示す場合、候補テキスト領域はテキスト領域として識別され得る。
[0038]プロセッサ240中のターゲットフォーカス領域検出ユニット244は、テキスト領域検出ユニット242からプレビュー画像の識別されたテキスト領域および関連する分類スコアを受信し、テキスト領域からターゲットフォーカス領域を選択するように構成され得る。一実施形態では、所定の言語のテキストであるという最も大きい尤度を示し得る、最も大きい分類スコアを有するテキスト領域が、ターゲットフォーカス領域として選択され得る。別の実施形態では、ターゲットフォーカス領域検出ユニット244は、テキスト領域の各々についてのサイズを決定することによってターゲットフォーカス領域を選択し得る。この場合、最も大きいサイズを有するテキスト領域がターゲットフォーカス領域として選択され得る。
[0039]いくつかの実施形態では、シーンのプレビュー画像中のターゲットフォーカス領域を選択すると、ターゲットフォーカス領域検出ユニット244は、プレビュー画像のターゲットフォーカス領域に関する情報を記憶ユニット220に一時的に記憶し得る。ターゲットフォーカス領域情報は、プレビュー画像中のターゲットフォーカス領域のロケーションおよびサイズ、ターゲットフォーカス領域中のピクセルのカラー値などを含み得る。ターゲットフォーカス領域検出ユニット244は、テキスト領域検出ユニット242から、シーンの1つまたは複数の後続のプレビュー画像中で識別された複数のテキスト領域を受信し得る。記憶ユニット220中のターゲットフォーカス領域情報にアクセスすることによって、ターゲットフォーカス領域検出ユニット244は、次いで、最尤推定器方法、拡張カルマンフィルタ方法、正規化粒子フィルタ方法など、任意の好適なターゲット動き分析方式に基づいて、後続のプレビュー画像の各々中のテキスト領域からターゲットフォーカス領域を選択し得る。このようにして、画像センサー130が、ユーザ110によって選択され得るテキストモードで動作している間、シーンのプレビュー画像の各々中のターゲットフォーカス領域が追跡され得る。ターゲットフォーカス領域検出ユニット244は、次いで、シーンのプレビュー画像の各々中のターゲットフォーカス領域を画像センサー制御ユニット246に提供し得る。
[0040]プロセッサ240中の画像センサー制御ユニット246は、プレビュー画像のための選択されたターゲットフォーカス領域を受信し、ターゲットフォーカス領域に基づいて画像センサー130のための少なくとも1つの画像キャプチャリングパラメータを調整するように構成され得る。一実施形態では、画像センサー制御ユニット246は、ターゲットフォーカス領域の輝度値に基づいて画像センサー130の露出パラメータを調整し得る。たとえば、ターゲットフォーカス領域の輝度値と所定の輝度値との間の差分が決定され得る。この場合、所定の輝度値は、参照テキスト領域(たとえば、サンプルテキスト領域)中のテキスト(たとえば、文字)をキャプチャするために最適化されたかまたはそれに適した値であり得る。画像センサー130の露出パラメータは、次いで、ターゲットフォーカス領域の輝度値と所定の輝度値との間の差分を低減するかまたはなくす露出値に調整され得る。
[0041]いくつかの実施形態では、画像センサー制御ユニット246は、連続的にキャプチャするように画像センサー130を構成し、複数の候補フォーカスパラメータ値に基づいてプレビューモードにおいてシーンの複数のプレビュー画像を記憶し得る。このプレビューモードでは、キャプチャされたプレビュー画像の各々は1つまたは複数のテキスト領域を含み得、それらのテキスト領域のうちの1つが、テキスト領域検出ユニット242とターゲットフォーカス領域検出ユニット244とによって処理時にターゲットフォーカス領域として選択され得る。画像センサー制御ユニット246は、プレビュー画像中のターゲットフォーカス領域を受信し、ターゲットフォーカス領域の各々のためのシャープネス値を決定し得る。ターゲットフォーカス領域の間で、画像センサー制御ユニット246は、最も高いシャープネス値をもつターゲットフォーカス領域を識別し、識別されたターゲットフォーカス領域に関連する候補フォーカスパラメータ値を選択し得る。画像センサー制御ユニット246は、次いで、テキストモード中のシーンの画像をキャプチャする際に使用するために、画像センサー130のフォーカスパラメータを、選択された候補フォーカスパラメータ値に調整し得る。
[0042]別の実施形態によれば、画像センサー制御ユニット246は、ターゲットフォーカス領域が、知られているサイズ情報をもつ参照オブジェクトに関連付けられるかどうかを決定することによって、フォーカスパラメータを調整し得る。この場合、ターゲットフォーカス領域が、記憶ユニット220に記憶された参照オブジェクトのうちの1つに関連付けられると決定された場合、画像センサー制御ユニット246は、プレビュー画像中のターゲットフォーカス領域のサイズまたはターゲットフォーカス領域中の1つまたは複数の文字のサイズを決定し得る。プレビュー画像の焦点距離を仮定すれば、フォーカスパラメータの値は、参照オブジェクトのサイズ情報およびターゲットフォーカス領域のサイズまたはターゲットフォーカス領域中の文字のサイズに基づいて計算され得る。画像センサー制御ユニット246は、次いで、画像センサー130のフォーカスパラメータをフォーカスパラメータ値に調整し得る。追加または代替として、画像センサー制御ユニット246は、ホワイトバランスパラメータ、コントラスト強調パラメータ、ズームパラメータ、または光に対する感度パラメータを、プレビューモードにおいてターゲットフォーカス領域をキャプチャするために最適化されたかまたは適したパラメータ値に調整し得る。
[0043]1つまたは複数の画像キャプチャリングパラメータを調整すると、画像センサー130は、自動的にまたはユーザ110からの入力に応答して、少なくともターゲットフォーカス領域を含むシーンの画像をキャプチャし、画像を記憶ユニット220に記憶し得る。テキスト認識ユニット248は、キャプチャされた画像を受信し、記憶ユニット220からの文字情報データベースまたは辞書データベースに基づいて、キャプチャされた画像中のターゲットフォーカス領域上でテキスト認識を実施し得る。一実施形態では、キャプチャされた画像は、画像中のターゲットフォーカス領域のための認識されたテキストを重ね合わせることによってI/Oユニット210上に表示され得る。追加または代替として、認識されたテキストは、I/Oユニット210上での表示のために1つまたは複数の他の言語に翻訳され得る。認識または翻訳されたテキストは、記憶ユニット220に記憶されるか、または通信ユニット230を介して別の電子デバイスに送信され得る。
[0044]上記では、画像センサー130のための少なくとも1つの画像パラメータを調整するために1つのターゲットフォーカス領域が利用されることについて説明されたが、画像センサー制御ユニット246は、複数のターゲットフォーカス領域に基づいてその少なくとも1つの画像キャプチャリングパラメータを調整し得ることを諒解されよう。一実施形態によれば、ターゲットフォーカス領域検出ユニット244は、受信されテキスト領域検出ユニット242を形成し得るテキスト領域から複数のターゲットフォーカス領域を選択し得る。一例では、それぞれ、第1の最も大きい分類スコアと、第2の最も大きい分類スコアとを有する2つのテキスト領域が、受信されたテキスト領域からターゲットフォーカス領域として選択され得る。別の例では、ターゲットフォーカス領域検出ユニット244は、受信されたテキスト領域からターゲットフォーカス領域として、それぞれ、第1の最も大きいサイズと第2の最も大きいサイズとを有するテキスト領域を選択し得る。選択されたテキスト領域は、画像センサー制御ユニット246に提供され、少なくとも1つの画像キャプチャリングパラメータを調整するために使用され得る。たとえば、画像センサー制御ユニット246は、ターゲットフォーカス領域の複数の輝度値の算術平均を決定することによって画像センサー130の露出パラメータを調整し得る。追加または代替として、画像センサー130のフォーカスパラメータは、ターゲットフォーカス領域の複数のシャープネス値の算術平均が増加されるように調整され得る。
[0045]図3は、本開示の一実施形態による、モード選択入力において画像センサー130をカメラモードのうちの1つに設定するために複数のカメラモードを記憶するように構成された記憶ユニット220のより詳細なブロック図である。一実施形態では、I/Oユニット210は、記憶ユニット220に記憶された、オートフォーカスモード310、テキストモード320、夜間モード330、ポートレートモード340など、カメラモードのうちの1つを選択するためにユーザ110からコマンドまたは入力を受信し得る。カメラモードの各々は、カメラモードに従って画像をキャプチャするために最適化されたかまたはそれに適した画像キャプチャリングパラメータ値のセットによって特徴づけられ得る。ユーザ110によってテキストモードが選択されたとき、I/Oユニット210は、選択されたテキストモードをプロセッサ240中の画像センサー制御ユニット246に提供し得る。
[0046]プロセッサ240中の画像センサー制御ユニット246は、次いで、記憶ユニット220からのテキストモードに関連する画像キャプチャリングパラメータ値のセットにアクセスし、それらの画像キャプチャリングパラメータ値で画像センサー130を構成し得る。テキストモードのための画像キャプチャリングパラメータ値に基づいて、画像センサー130は、標識またはドキュメントなどの少なくとも1つのテキストオブジェクトを含み得る、シーンの1つまたは複数のプレビュー画像をキャプチャするためにプレビューモードで動作し得る。プレビューモードでは、シーンの1つまたは複数のプレビュー画像がキャプチャされ、ユーザ110のためにI/Oユニット210上に表示され得る。プレビュー画像の各々は、シーン中に少なくとも1つのテキストオブジェクトのための1つまたは複数のテキスト領域を含み、さらに、画像センサー130のための少なくとも1つの画像キャプチャリングパラメータを調整するために処理され得る。
[0047]図4は、本開示の一実施形態による、プレビュー画像中に複数のテキスト領域を識別するように構成されたテキスト領域検出ユニット242のより詳細なブロック図である。テキスト領域検出ユニット242は、候補テキスト領域検出ユニット410と、特徴抽出ユニット420と、分類スコア決定ユニット430と、テキスト領域識別ユニット440とを含み得る。テキスト領域の複数を識別するために、テキスト領域検出ユニット242は、それぞれ、記憶ユニット220およびテキスト認識ユニット248と通信し得る。
[0048]テキスト領域検出ユニット242中で、候補テキスト領域検出ユニット410は、1つまたは複数のプレビュー画像を受信し、プレビュー画像中に1つまたは複数の候補テキスト領域を検出するように構成され得る。一実施形態では、プレビュー画像中の候補テキスト領域は、候補テキスト領域中のサイズ、色、パターンなど、1つまたは複数の同様のプロパティをもつ1つまたは複数のブロブを決定することによって検出され得る。プレビュー画像中のブロブを決定すると、候補テキスト領域検出ユニット410は、ブロブクラスタリング動作においてブロブをクラスタリングし得る。たとえば、同じ色を有し、近接して位置する複数のブロブがブロブクラスタにクラスタリングされ得る。ブロブクラスタの各々はまた、スキュー(skew)について補正され、アーティファクト(artifacts)を除去するためにフィルタ処理され得る。さらに、カラーでのブロブクラスタは、グレースケールでのブロブクラスタに変換され得る。別の実施形態では、エッジベースの方法、連結成分ベースの方法、テクスチャベースの方法など、任意の他の好適なテキスト候補抽出方式に基づいて、プレビュー画像中に1つまたは複数の候補テキスト領域が検出され得る。プレビュー画像中に検出される候補テキスト領域は、次いで、テキスト領域検出ユニット242中の特徴抽出ユニット420および/またはプロセッサ240中のテキスト認識ユニット248に提供され得る。
[0049]特徴抽出ユニット420は、候補テキスト領域検出ユニット410から候補テキスト領域を受信し、候補テキスト領域の各々から1つまたは複数の特徴を抽出するように構成され得る。特徴は、エッジ検出技法、スケール不変特徴変換技法、テンプレートマッチング技法、ハフ変換技法など、任意の好適な特徴抽出技法を使用することによって候補テキスト領域から抽出され得る。一実施形態では、候補テキスト領域から抽出された1つまたは複数の特徴は特徴ベクトルとして表され得る。候補テキスト領域から抽出された特徴は、次いで、テキスト領域検出ユニット242中の分類スコア決定ユニット430に提供され得る。
[0050]分類スコア決定ユニット430は、特徴抽出ユニット420から候補テキスト領域の各々についての1つまたは複数の特徴を受信し、所定の言語のための分類スコアを生成するように構成され得る。記憶ユニット220から、複数の言語(たとえば、英語、フランス語、ドイツ語など)に関連する分類器モデルデータベース460が、所定の言語に関連するテキスト(たとえば、文字)を候補テキスト領域が含むかどうかを識別するためにアクセスされ得る。分類器モデルデータベース460は、複数の言語に関連する複数の確率モデルを含み得る。確率モデルは、SVM(サポートベクターマシン)、ニューラルネットワーク、MQDF(修正2次判別関数)など、任意の好適な分類方法を使用して生成され得る。たとえば、言語のための確率モデルは、言語に対応する特徴のための確率分布関数(たとえば、多変量ガウス分布)によって表され得る。
[0051]一実施形態では、分類スコア決定ユニット430は、関連する候補テキスト領域についての抽出された特徴と、所定の言語のための確率モデルとに基づいて、候補テキスト領域の各々のための分類スコアを生成し得る。たとえば、テキスト領域を識別するための言語がユーザ110の入力またはコマンドによって英語としてあらかじめ決定されている場合、候補テキスト領域のための分類スコアは英語の確率モデルに基づいて生成され得る。候補テキスト領域のための分類スコアは、候補テキスト領域についての1つまたは複数の特徴が英語の確率モデルに関連付けられる確率を示し得る。別の実施形態では、分類スコア決定ユニット430は、候補テキスト領域が確率モデルについて言語の各々に関連するテキストを含むかどうかを識別するために、候補テキスト領域の各々についての1つまたは複数の特徴に基づいて複数の確率モデルのための複数の分類スコアを決定し得る。候補テキスト領域のための分類スコアは、次いで、テキスト領域検出ユニット242中のテキスト領域識別ユニット440に提供され得る。
[0052]いくつかの実施形態によれば、テキスト領域識別ユニット440は、分類スコア決定ユニット430から受信された分類スコアに基づいて候補テキスト領域から1つまたは複数のテキスト領域を識別するように構成され得る。たとえば、候補テキスト領域は、候補テキスト領域のための分類スコアが所定のしきい値スコアを超えると決定することによってテキスト領域として識別され得る。代替的に、候補テキスト領域の各々について複数の言語に関連する分類スコアが受信された場合、テキスト領域識別ユニット440は、分類スコアから最も大きい分類スコアを選択し、最も大きい分類スコアが所定のしきい値スコアよりも高いと決定し得る。
[0053]いくつかの他の実施形態では、テキスト領域識別ユニット440はまた、テキスト認識ユニット248から受信されたテキスト認識結果に基づいて候補テキスト領域から1つまたは複数のテキスト領域を識別し得る。テキスト認識ユニット248は、候補テキスト領域検出ユニット410から複数の候補テキスト領域を受信し、記憶ユニット220中の文字情報データベース450または辞書データベース470にアクセスすることによって候補テキスト領域の各々上でテキスト認識を実施し得る。テキスト認識ユニット248は、次いで、テキスト領域を識別するために、候補テキスト領域についてのテキスト認識の結果をテキスト領域識別ユニット440に提供し得る。
[0054]候補テキスト領域の各々中の1つまたは複数の文字は、マトリックスマッチング、特徴整合など、任意の好適な文字認識方式を使用して所定数の言語のための文字情報データベース450に基づいて認識され得る。いくつかの実施形態では、テキスト認識ユニット248は、候補テキスト領域のテキスト中の文字情報を決定するために、候補テキスト領域の各々中のテキストを通してパースし得る。文字情報は、言語における1つもしくは複数の文字のパターンもしくは形状データ、言語における1つもしくは複数の文字を表すグリフの画像、および/または言語における個々のグリフに関連する1つもしくは複数の文字についての少なくとも1つの特徴を含み得る。
[0055]候補テキスト領域の各々において、テキスト認識ユニット248は、候補テキスト領域中のテキストから識別された文字情報と、言語に関連する文字情報データベース450とを比較することによって1つまたは複数の文字を認識し得る。たとえば、テキスト認識ユニット248は、候補テキスト領域中のパターンまたはシンボルを識別し、そのパターンまたはシンボルを、文字情報データベース450からの複数の文字のパターンまたは形状データと比較し得る。この場合、1つまたは複数の識別されたパターンまたはシンボルと、言語における指定された文字のためのパターンまたは形状データとの間の類似度が所定のしきい値を超えると決定された場合、パターンまたはシンボルは指定された文字として認識され得る。候補テキスト領域中の文字が認識された場合、候補テキスト領域についてのテキスト認識結果は、テキスト領域を識別するためにテキスト領域識別ユニット440に提供され得る。
[0056]候補テキスト領域の各々上でテキスト認識を実施するとき、テキスト認識ユニット248はまた、記憶ユニット220に記憶された辞書データベース470にアクセスし得る。テキスト認識ユニット248は、候補テキスト領域中の1つまたは複数の認識された文字から検出された単語について辞書データベース470を探索し得る。その単語が辞書データベース470中に見つかった場合、テキスト認識ユニット248は、候補テキスト領域が、言語に関連するテキストを含むと決定し得る。この場合、テキスト認識ユニット248は、テキスト領域を識別するために、候補テキスト領域中でテキストが認識されたという結果をテキスト領域識別ユニット440に提供し得る。識別されたテキスト領域は、次いで、ターゲットフォーカス領域検出ユニット244に提供され得る。
[0057]図5は、本開示の一実施形態による、プレビューモードにおいて画像センサー130のための少なくとも1つの画像キャプチャリングパラメータを調整することによってシーンの画像をキャプチャするための方法のフローチャート500である。最初に、画像センサー130は、510において、画像キャプチャリングパラメータのセットに基づいて少なくとも1つのテキストオブジェクトを含むシーンのプレビュー画像をキャプチャし、プレビュー画像をプロセッサ240に提供し得る。プロセッサ240中のテキスト領域検出ユニット242は、520において、プレビュー画像を受信し、プレビュー画像中に複数の候補テキスト領域を検出し得る。
[0058]530において、テキスト領域検出ユニット242は、複数の候補テキスト領域から複数のテキスト領域を識別し得る。このプロセスでは、関連するテキスト領域についての特徴のセットを抽出することによって、テキスト領域の各々のための分類スコアが生成され得る。プロセッサ240中のターゲットフォーカス領域検出ユニット244は、540において、複数のテキスト領域からターゲットフォーカス領域を選択し得る。ターゲットフォーカス領域に基づいて、プロセッサ240中の画像センサー制御ユニット246は、550において、画像センサー130のための少なくとも1つの画像キャプチャリングパラメータを調整し得る。調整された少なくとも1つの画像キャプチャリングパラメータに従って、画像センサー130は、560において、少なくとも1つのテキストオブジェクトを含む画像をキャプチャし得る。
[0059]図6は、本開示の一実施形態による、シーンのプレビュー画像よりも高い解像度においてキャプチャされたシーンの別のプレビュー画像中の複数の候補テキスト領域に基づいて、シーンのプレビュー画像中に複数のテキスト領域を識別するための詳細な方法530のフローチャートである。テキスト領域検出ユニット242は、610において、プレビュー画像中に複数の候補テキスト領域を識別する際に複数の候補テキスト領域のロケーションを決定し得る。たとえば、候補テキスト領域の各々のロケーションは、プレビュー画像におけるピクセル座標を示し得る。
[0060]620において、テキスト領域検出ユニット242は、別のプレビュー画像にアクセスし、プレビュー画像中の候補テキスト領域のロケーションにマッピングする別のプレビュー画像中の対応する候補テキスト領域を取得し得る。別のプレビュー画像中の候補テキスト領域の各々から、テキスト領域検出ユニット242は、630において、1つまたは複数の特徴を抽出し、特徴のための分類スコアを生成し得る。候補テキスト領域に関連する分類スコアに基づいて、640において、プレビュー画像中に複数のテキスト領域が識別され得る。
[0061]図7は、本開示の一実施形態による、電子デバイス120のディスプレイスクリーン125上に表示される、テーブル710上に置かれた書籍720、消しゴム730、および複数の鉛筆740など、複数のテキストオブジェクトを含む屋内シーンのプレビュー画像700である。プレビュー画像700において、書籍720は、「著者名」のテキストを含むテキスト領域722と、「書籍名」のテキストを含むテキスト領域724と、「随意のタグラインまたは他のテキスト」のテキストを含むテキスト領域726とを含む。プレビュー画像700はまた、消しゴム730において、「消しゴム」のテキストを含むテキスト領域732を示している。
[0062]いくつかの実施形態によれば、I/Oユニット210は、複数のカメラモードからテキストモードを選択するためにプレビューモード中にユーザ110から入力を受信し得る。電子デバイス120中のテキスト領域検出ユニット242は、次いで、図2および図4を参照しながら上記で詳細に説明したように、テキスト領域722、724、726、および732の各々のための分類スコアを生成することによって、テキストモードにおいてテキスト領域722、724、726、および732を識別し得る。識別されたテキスト領域722、724、726、および732ならびに生成された分類スコアは、プレビュー画像700中のターゲットフォーカス領域を選択するために電子デバイス120中のターゲットフォーカス領域検出ユニット244に提供され得る。
[0063]ターゲットフォーカス領域検出ユニット244は、関連する分類スコアに基づいて、識別されたテキスト領域722、724、726、および732からターゲットフォーカス領域を選択し得る。一実施形態では、ターゲットフォーカス領域検出ユニット244は、テキスト領域722、724、726、および732からターゲットフォーカス領域として最も大きい分類スコアを有するテキスト領域を選択し得る。たとえば、図7のプレビュー画像700では、テキスト領域722、724、726、および732の間でテキスト「消しゴム」のテキスト領域732が最も大きい分類スコアを有する場合、消しゴム730中のテキスト領域732は、画像センサー130のための少なくとも1つの画像キャプチャリングパラメータを調整する際に使用するためのターゲットオブジェクトとして選択され得る。いくつかの実施形態では、最も大きい分類スコアを有するテキスト領域は、テキスト領域のための最も大きい分類スコアがしきい値分類スコアよりも大きい場合のみ、ターゲットフォーカス領域として選択され得る。
[0064]ターゲットフォーカス領域検出ユニット244は、テキスト領域722、724、726、および732の各々についてのサイズを決定することによってターゲットフォーカス領域を選択し得る。一実施形態では、最も大きいサイズを有するテキスト領域は、テキスト領域722、724、726、および732からターゲットフォーカス領域として選択され得る。図7に示されているように、書籍720中にテキスト「書籍名」のテキスト領域724は、テキスト領域722、724、および726の間で最も大きいサイズを有し、プレビュー画像700においてターゲットフォーカス領域として選択されたい。選択されたターゲットフォーカス領域724は、次いで、プロセッサ240中の画像センサー制御ユニット246に提供され得る。
[0065]図8は、本開示の一実施形態による、プレビューモードにおいてシーンの複数のプレビュー画像に基づいて画像センサー130のためのフォーカスパラメータを調整するための詳細な方法550のフローチャートである。最初に、画像センサー130は、810において、複数の候補フォーカスパラメータに基づいて、ターゲットフォーカス領域を含む複数のプレビュー画像をキャプチャし得る。プレビュー画像がキャプチャされた後に、図2および図7を参照しながら上記で詳細に説明したように、プロセッサ240中のテキスト領域検出ユニット242によって、キャプチャされたプレビュー画像の各々から複数のテキスト領域が識別され得、プロセッサ240中のターゲットフォーカス領域検出ユニット244によって、識別されたテキスト領域の間でターゲットフォーカス領域が選択され得る。一実施形態では、ターゲットフォーカス領域検出ユニット244は、シーンのプレビュー画像中のターゲットフォーカス領域を受信し、最尤推定器方法、拡張カルマンフィルタ方法、正規化粒子フィルタ方法など、任意の好適なターゲット動き分析方式を使用して、シーンの後続のプレビュー画像においてターゲットフォーカス領域を追跡し得る。
[0066]820において、画像センサー制御ユニット246は、プレビュー画像中のターゲットフォーカス領域の複数のシャープネス値を決定し得る。候補フォーカスパラメータの間で、830において、最も高いシャープネス値に関連する候補フォーカスパラメータが選択され得る。840において、画像センサー制御ユニット246は、次いで、画像センサー130のためのフォーカスパラメータを、選択された候補フォーカスパラメータに調整し得る。
[0067]図9は、本開示の一実施形態による、電子デバイス120のディスプレイスクリーン125上に表示される複数の車両910および920を含むシーンのプレビュー画像900を示す。プレビュー画像900は、プレビューモード中に画像センサー130の所定の焦点距離に基づいてキャプチャされ得、このプレビューモードでは、画像センサー130は、ユーザ110によって選択されたテキストモードで動作するように構成され得る。プレビュー画像900には、それぞれ、テキスト「XYZ ABCD」を有するライセンスプレート930、およびテキスト「UVW EFGH」を有するライセンスプレート940をもつ、車両910および920が示されている。この場合、電子デバイス120中のテキスト領域検出ユニット242は、ライセンスプレート930および940中にそれぞれ複数のテキスト領域950および960を検出し得る。テキスト領域950はサイズがテキスト領域960よりも大きいので、電子デバイス120中のターゲットフォーカス領域検出ユニット244は、プレビュー画像900中のターゲットフォーカス領域としてテキスト領域950を識別し得る。ターゲットフォーカス領域検出ユニット244はまた、テキスト領域950のテキストサイズがテキスト領域960のテキストサイズよりも大きいと決定することによって、テキスト領域950をターゲットフォーカス領域として識別し得る。
[0068]電子デバイス120中の画像センサー制御ユニット246は、ターゲットフォーカス領域950を受信し、ターゲットフォーカス領域950が参照オブジェクトに関連するかどうかを決定し得る。たとえば、画像センサー制御ユニット246は、ターゲットフォーカス領域950を、電子デバイス120の記憶ユニット220に記憶された複数の参照オブジェクト(たとえば、ライセンスプレート、値札など)と比較し得る。次いで、ターゲットフォーカス領域950はライセンスプレートであると決定され得、ライセンスプレートのサイズ情報が記憶ユニット220から取り出され得る。一実施形態では、ライセンスプレートのサイズ情報は、ライセンスプレートサイズと、ライセンスプレート中の複数の文字についての1つまたは複数のサイズとのうちの少なくとも1つを含み得る。
[0069]ターゲットフォーカス領域950がライセンスプレートであると決定された場合、画像センサー制御ユニット246は、ターゲットフォーカス領域950のサイズまたはターゲットフォーカス領域950中の文字「XYZ ABCD」の各々のサイズを検出し得る。画像センサー制御ユニット246は、次いで、プレビュー画像900に関連する所定の焦点距離、参照ライセンスプレートのサイズ情報、およびターゲットフォーカス領域950のサイズまたはターゲットフォーカス領域950中の文字のサイズに基づいてフォーカスパラメータの値を計算し得る。画像センサー130のフォーカスパラメータは、次いで、フォーカスパラメータ値に調整され得る。フォーカスパラメータ値はターゲットフォーカス領域950のテキストの実際のサイズに基づいて決定されるので、そのようなパラメータ値を使用することは、画像をキャプチャする際のターゲットフォーカス領域950のために最適化されるかまたはそれに適し得る。
[0070]一実施形態では、フォーカスパラメータ値は、参照ライセンスプレートの実際のテキストサイズの幾何学的関係と、ターゲットフォーカス領域950中の文字の検出されたサイズと、プレビュー画像900の焦点距離とに基づいて決定され得る。たとえば、そのような関係は次のような行列方程式によって定義され得る。
Figure 0006208383
ここで、xおよびyは、ターゲットフォーカス領域のためのxおよびy座標空間における文字の検出されたサイズであり、fはプレビュー画像の焦点距離であり、XおよびYは、参照オブジェクトのxおよびy座標空間における実際のテキストサイズであり、Zはフォーカスパラメータである。
[0071]図10は、本開示の一実施形態による、電子デバイス120のディスプレイスクリーン125上に表示される光源1010とドキュメント1020の一部分とを含む屋内シーンのプレビュー画像1000を示す。複数のカメラモードの間でテキストモードが選択されたとき、電子デバイス120は、プレビュー画像1000をキャプチャし、ユーザ110のためにディスプレイスクリーン125上に表示し得る。プレビュー画像1000において、光源1010は天井1005に位置し、光を放出する。プレビュー画像1000はまた、複数のテキスト領域1030および1040を含むドキュメント1020の一部分を示している。テキスト領域1030は「論文名」のテキストを含み、テキスト領域1040は「著者」のテキストを含む。
[0072]プレビュー画像1000がキャプチャされたとき、電子デバイス120のテキスト領域検出ユニット242は、プレビュー画像1000中にテキスト領域1030および1040を検出し得る。ターゲットフォーカス領域検出ユニット244は、テキスト領域1030および1040中の文字のサイズを比較し、ターゲットフォーカス領域としてより大きい文字サイズをもつテキスト領域1030を選択し得る。ターゲットフォーカス領域1030は、次いで、電子デバイス120中の画像センサー制御ユニット246に提供され得る。
[0073]ターゲットフォーカス領域1030を受信すると、画像センサー制御ユニット246はターゲットフォーカス領域1030の輝度値を決定し得る。一実施形態では、輝度値は、ターゲットフォーカス領域1030中の複数のピクセルのカラー値に基づいて計算され得る。たとえば、画像センサー制御ユニット246は、ターゲットフォーカス領域1030中の複数のピクセルのための複数の輝度値を平均化することによってターゲットフォーカス領域1030の輝度値を決定し得る。この場合、輝度値は、各ピクセルのカラー値(たとえば、赤値、緑値、および青値)の算術平均として計算され得る。
[0074]ターゲットフォーカス領域1030の輝度値が決定されたとき、画像センサー制御ユニット246は、ターゲットフォーカス領域1030の輝度値と所定の輝度値との間の差分を計算し得る。記憶ユニット220中からアクセスされ得る所定の輝度値は、ドキュメント中のテキストをキャプチャするために最適化されたかまたはそれに適した輝度値である。画像センサー制御ユニット246は、次いで、画像センサー130の露出パラメータを、ターゲットフォーカス領域1030の輝度値と所定の輝度値との間の差分を低減するかまたはなくす露出パラメータ値に調整し得る。
[0075]図示されたプレビュー画像1000では、ドキュメント1020は電子デバイス120の近くに位置し、したがって、光源1010は、ドキュメント1020の後ろおよびそれの上の位置から光を放出する。したがって、ターゲットフォーカス領域1030の輝度値は、プレビュー画像1000中の他の領域よりも低くなり、したがってより暗く見え得る。この場合、画像センサー制御ユニット246は、ターゲットフォーカス領域1030の輝度値と所定の輝度値との間の差分だけターゲットフォーカス領域1030の輝度値を増加させるように適応された露出パラメータ値(たとえば、露光時間、アパーチャなど)を決定し得る。画像センサー130の露出パラメータは、次いで、決定された露出パラメータ値に調整され、ドキュメント1020の画像をキャプチャする際に使用するために画像センサー130に提供され得る。
[0076]図11は、本開示の一実施形態による、プレビュー画像中のターゲットフォーカス領域の輝度値に基づいて画像センサー130のための露出パラメータを調整するための詳細な方法550のフローチャートである。画像センサー制御ユニット246は、1110において、プレビュー画像中の複数のテキスト領域から選択され得るターゲットフォーカス領域の輝度値を決定し得る。ターゲットフォーカス領域を含むプレビュー画像は、露出パラメータを含む画像キャプチャリングパラメータのセットに基づいてテキストモードでキャプチャされ得る。
[0077]記憶ユニット220から、画像センサー制御ユニット246は、1120において、テキストオブジェクト中のテキストをキャプチャするために最適化されたかまたはそれに適した輝度値を示し得る、参照テキスト領域のための所定の輝度値を取得し得る。1130において、ターゲットフォーカス領域の輝度値と所定の輝度値との間の差分が決定され得る。画像センサー制御ユニット246は、次いで1140において、ターゲットフォーカス領域の輝度値と所定の輝度値との間の差分に基づいて画像センサー130の露出パラメータを調整し得る。
[0078]図12は、本開示の一実施形態を与える、プレビュー状態において少なくとも1つの画像キャプチャリングパラメータを調整するための方法および装置が実装され得る例示的な電子デバイス1200のブロック図である。電子デバイス1200の構成は、図1〜図11を参照しながら説明した上記の実施形態に従って電子デバイスにおいて実装され得る。電子デバイス1200は、セルラーフォン、スマートフォン、タブレットコンピュータ、ラップトップコンピュータ、端末、ハンドセット、携帯情報端末(PDA)、ワイヤレスモデム、コードレスフォンなどであり得る。ワイヤレス通信システムは、符号分割多元接続(CDMA)システム、モバイル通信用ブロードキャストシステム(GSM(登録商標))システム、広帯域CDMA(WCDMA(登録商標))システム、ロングターンエボリューション(LTE(登録商標))システム、LTEアドバンストシステムなどであり得る。さらに、電子デバイス1200は、たとえば、Wi−Fi(登録商標)ダイレクトまたはBluetooth(登録商標)を使用して、別のモバイルデバイスと直接通信し得る。
[0079]電子デバイス1200は、受信経路および送信経路を介して双方向通信を行うことが可能である。受信経路上で、基地局によって送信された信号は、アンテナ1212によって受信され、受信機(RCVR)1214に提供される。受信機1214は、受信信号を調整し、デジタル化し、調整およびデジタル化されたデジタル信号などのサンプルをさらなる処理のためにデジタルセクションに提供する。送信経路上では、送信機(TMTR)1216は、デジタルセクション1210から送信されるべきデータを受信し、データを処理し、調整し、被変調信号を生成し、被変調信号はアンテナ1212を介して基地局に送信される。受信機1214および送信機1216は、CDMA、GSM、LTE、LTEアドバンストなどをサポートし得るトランシーバの一部であり得る。
[0080]デジタルセクション1210は、たとえば、モデムプロセッサ1222、縮小命令セットコンピュータ/デジタル信号プロセッサ(RISC/DSP)1224、コントローラ/プロセッサ1226、内部メモリ1228、一般化オーディオ/ビデオエンコーダ1232、一般化オーディオデコーダ1234、グラフィックス/ディスプレイプロセッサ1236、および外部バスインターフェース(EBI)1238など、様々な処理、インターフェース、およびメモリユニットを含む。モデムプロセッサ1222は、データ送信および受信のための処理、たとえば、符号化、変調、復調、および復号を実施し得る。RISC/DSP1224は、電子デバイス1200のための一般的および専用処理を実施し得る。コントローラ/プロセッサ1226は、デジタルセクション1210内の様々な処理ユニットおよびインターフェースユニットの動作を実施し得る。内部メモリ1228は、デジタルセクション1210内の様々なユニットのためのデータおよび/または命令を記憶し得る。
[0081]一般化オーディオ/ビデオエンコーダ1232は、オーディオ/ビデオソース1242、マイクロフォン1244、画像センサー1246などからの入力信号に対して符号化を実施し得る。一般化オーディオデコーダ1234は、コード化オーディオデータに対して復号を実施し得、出力信号をスピーカー/ヘッドセット1248に提供し得る。グラフィックス/ディスプレイプロセッサ1236は、ディスプレイユニット1250に提示され得る、グラフィックス、ビデオ、画像、およびテキストのための処理を実施し得る。EBI1238は、デジタルセクション1210とメインメモリ1252との間のデータの転送を可能にし得る。
[0082]デジタルセクション1210は、1つまたは複数のプロセッサ、DSP、マイクロプロセッサ、RISCなどを用いて実装され得る。デジタルセクション1210はまた、1つもしくは複数の特定用途向け集積回路(ASIC)、および/または何らかの他のタイプの集積回路(IC)上に作製され得る。
[0083]概して、本明細書で説明したいかなるデバイスも、ワイヤレスフォン、セルラーフォン、ラップトップコンピュータ、ワイヤレスマルチメディアデバイス、ワイヤレス通信パーソナルコンピュータ(PC)カード、PDA、外部または内部モデム、ワイヤレスチャネルを介して通信するデバイスなど、様々なタイプのデバイスを表し得る。デバイスは、アクセス端末(AT)、アクセスユニット、加入者ユニット、移動局、モバイルデバイス、モバイルユニット、モバイルフォン、モバイル、リモート局、リモート端末、リモートユニット、ユーザデバイス、ユーザ機器、ハンドヘルドデバイスなど、様々な名前を有し得る。本明細書で説明したいかなるデバイスも、命令およびデータ、ならびにハードウェア、ソフトウェア、ファームウェア、またはそれらの組合せを記憶するためのメモリを有し得る。
[0084]本明細書で説明した技法は、様々な手段によって実装され得る。たとえば、これらの技法は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの組合せで実装され得る。さらに、本明細書の開示に関して説明した様々な例示的な論理ブロック、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、または両方の組合せとして実装され得ることを、当業者は諒解されよう。ハードウェアとソフトウェアのこの互換性を明確に示すために、様々な例示的な構成要素、ブロック、モジュール、回路、およびステップについて、上記では概してそれらの機能に関して説明された。そのような機能がハードウェアとして実装されるか、ソフトウェアとして実装されるかは、特定の適用例および全体的なシステムに課された設計制約に依存する。当業者は、説明した機能を特定の適用例ごとに様々な方法で実装し得るが、そのような実装の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。
[0085]ハードウェア実装の場合、本技法を実施するために使用される処理ユニットは、1つまたは複数のASIC、DSP、デジタル信号処理デバイス(DSPD)、プログラマブル論理デバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子デバイス、本明細書で説明した機能を実施するように設計された他の電子ユニット、コンピュータ、またはそれらの組合せ内で実装され得る。
[0086]したがって、本明細書の開示に関して説明した様々な例示的な論理ブロック、モジュール、および回路は、汎用プロセッサ、DSP、ASIC、FPGAもしくは他のプログラマブル論理デバイス、個別ゲートもしくはトランジスタ論理、個別ハードウェア構成要素、または本明細書で説明した機能を実施するように設計されたそれらの任意の組合せで実装または実施される。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であり得る。プロセッサはまた、コンピューティングデバイスの組合せ、たとえば、DSPとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、DSPコアと連携する1つもしくは複数のマイクロプロセッサ、または任意の他のそのような構成として実装され得る。
[0087]ソフトウェアで実装される場合、機能は、1つもしくは複数の命令もしくはコードとしてコンピュータ可読媒体上に記憶されるか、またはコンピュータ可読媒体を介して送信され得る。コンピュータ可読媒体は、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、コンピュータ記憶媒体とコンピュータ通信媒体の両方を含む。記憶媒体は、コンピュータによってアクセスされ得る任意の利用可能な媒体であり得る。限定ではなく例として、そのようなコンピュータ可読媒体は、RAM、ROM、EEPROM、CD−ROMもしくは他の光ディスクストレージ、磁気ディスクストレージもしくは他の磁気ストレージデバイス、または、命令もしくはデータ構造の形態の所望のプログラムコードを搬送もしくは記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。さらに、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、ソフトウェアが、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は媒体の定義に含まれる。本明細書で使用するディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびblu−ray(登録商標)ディスク(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。
[0088]本開示の前述の説明は、いかなる当業者でも本開示を作成または使用することができるように提供される。本開示への様々な修正は当業者には容易に明らかとなり、本明細書で定義された一般原理は、本開示の趣旨または範囲から逸脱することなく他の変形形態に適用される。したがって、本開示は、本明細書で説明した例に限定されるものではなく、本明細書で開示する原理および新規の特徴に合致する最も広い範囲を与えられるべきである。
[0089]例示的な実装形態は、1つまたは複数のスタンドアロンコンピュータシステムの文脈で、本開示の主題の態様を利用することに言及するが、主題は、そのように限定されるのではなく、ネットワークまたは分散コンピューティング環境など、任意のコンピューティング環境に関連して実装され得る。またさらに、本開示の主題の態様は、複数の処理チップまたはデバイスにおいてまたはそれらにわたって実装され得、同様に、複数のデバイスにわたって記憶が影響を受けることがある。そのようなデバイスは、PC、ネットワークサーバ、およびハンドヘルドデバイスを含み得る。
[0090]主題について構造的機能および/または方法論的行為に特有の言語で説明したが、添付の特許請求の範囲において定義される主題は、必ずしも上記で説明した特定の特徴または行為に限定されるとは限らないことを理解されたい。むしろ、上記で説明した特定の特徴および行為は、特許請求の範囲を実施することの例示的な形態として開示される。
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
[C1]
プレビューモードにおいて少なくとも1つの画像キャプチャリングパラメータを調整するための、電子デバイスによって実施される方法であって、
画像キャプチャリングパラメータのセットに基づいて少なくとも1つのテキストオブジェクトを含むシーンのプレビュー画像をキャプチャすることと、
前記プレビュー画像中に複数のテキスト領域を識別することと、
前記複数のテキスト領域からターゲットフォーカス領域を選択することと、
前記ターゲットフォーカス領域に基づいて前記少なくとも1つの画像キャプチャリングパラメータを調整することとを備える、方法。
[C2]
前記複数のテキスト領域を識別することが、
前記プレビュー画像中に複数の候補テキスト領域を検出することと、
前記複数の候補テキスト領域から前記複数のテキスト領域を識別することとを備える、C1に記載の方法。
[C3]
前記少なくとも1つの調整された画像キャプチャリングパラメータに基づいて前記少なくとも1つのテキストオブジェクトを含む画像をキャプチャすることをさらに備える、C1に記載の方法。
[C4]
前記少なくとも1つの画像キャプチャリングパラメータが、フォーカスパラメータと、露出パラメータと、ホワイトバランスパラメータと、コントラスト強調パラメータと、ズームパラメータと、光に対する感度パラメータとのうちの少なくとも1つを備える、C1に記載の方法。
[C5]
前記少なくとも1つの画像キャプチャリングパラメータを調整することが、
少なくとも1つの候補フォーカスパラメータに基づいて前記ターゲットフォーカス領域を含む少なくとも1つのプレビュー画像をキャプチャすることと、
前記少なくとも1つのプレビュー画像中の前記ターゲットフォーカス領域の少なくとも1つのシャープネス値を決定することと、
前記少なくとも1つの候補フォーカスパラメータから最も高いシャープネス値を有する候補フォーカスパラメータを選択することと、
前記少なくとも1つの画像キャプチャリングパラメータ中の前記フォーカスパラメータを前記選択された候補フォーカスパラメータに調整することとを備える、C4に記載の方法。
[C6]
前記少なくとも1つの画像キャプチャリングパラメータを調整することが、
前記プレビュー画像中の前記ターゲットフォーカス領域の輝度値を決定することと、
前記ターゲットフォーカス領域の前記輝度値と所定の輝度値との間の差分を計算することと、
前記差分に基づいて前記少なくとも1つの画像キャプチャリングパラメータ中の前記露出パラメータを調整することとを備える、C4に記載の方法。
[C7]
前記少なくとも1つの画像キャプチャリングパラメータを調整することが、
前記ターゲットフォーカス領域に基づいて参照オブジェクトを識別することと、
前記ターゲットフォーカス領域と前記参照オブジェクトとの間の幾何学的関係を決定することと、
前記幾何学的関係に基づいて前記少なくとも1つの画像キャプチャリングパラメータ中の前記フォーカスパラメータを調整することとを備える、C4に記載の方法。
[C8]
前記複数のテキスト領域から前記ターゲットフォーカス領域を選択することが、
前記複数のテキスト領域の複数のサイズを決定することと、
前記複数のサイズに基づいて前記複数のテキスト領域から前記ターゲットフォーカス領域を選択することとを備える、C1に記載の方法。
[C9]
前記複数の候補テキスト領域から前記複数のテキスト領域を識別することが、
前記複数の候補テキスト領域から複数の特徴を抽出することと、
前記複数の特徴に基づいて複数の分類スコアを決定することと、
前記複数の分類スコアに基づいて前記複数の候補テキスト領域から前記複数のテキスト領域を識別することとを備える、C2に記載の方法。
[C10]
前記複数のテキスト領域から前記ターゲットフォーカス領域を選択することが、
最も大きい分類スコアを有する前記複数のテキスト領域のうちの1つを識別することと、
前記ターゲットフォーカス領域として前記識別されたテキスト領域を選択することとを備える、C9に記載の方法。
[C11]
前記複数の候補テキスト領域から前記複数のテキスト領域を識別することは、
前記プレビュー画像中の前記候補テキスト領域のロケーションを決定することと、
前記プレビュー画像中の前記候補テキスト領域の前記ロケーションに基づいて前記シーンの別のプレビュー画像から複数の候補テキスト領域を取得することと、ここにおいて、前記シーンの前記別のプレビュー画像が前記プレビュー画像よりも高い解像度を有する、
前記別のプレビュー画像から取得された前記複数の候補テキスト領域に基づいて前記複数のテキスト領域を識別することとを備える、C2に記載の方法。
[C12]
プレビューモードにおいて少なくとも1つの画像キャプチャリングパラメータを調整するための電子デバイスであって、
画像キャプチャリングパラメータのセットに基づいて少なくとも1つのテキストオブジェクトを含むシーンのプレビュー画像をキャプチャするように構成された画像センサーと、
前記プレビュー画像中に複数のテキスト領域を識別するように構成されたテキスト領域検出ユニットと、
前記複数のテキスト領域からターゲットフォーカス領域を選択するように構成されたターゲットフォーカス領域検出ユニットと、
前記ターゲットフォーカス領域に基づいて前記少なくとも1つの画像キャプチャリングパラメータを調整するように構成された画像センサー制御ユニットとを備える電子デバイス。
[C13]
前記テキスト領域検出ユニットが、
前記プレビュー画像中に複数の候補テキスト領域を検出することと、
前記複数の候補テキスト領域から前記複数のテキスト領域を識別することとを行うように構成された、C12に記載の電子デバイス。
[C14]
前記画像センサーが、前記少なくとも1つの調整された画像キャプチャリングパラメータに基づいて前記少なくとも1つのテキストオブジェクトを含む画像をキャプチャするようにさらに構成された、C12に記載の電子デバイス。
[C15]
前記少なくとも1つの画像キャプチャリングパラメータが、フォーカスパラメータと、露出パラメータと、ホワイトバランスパラメータと、コントラスト強調パラメータと、ズームパラメータと、光に対する感度パラメータとのうちの少なくとも1つを備える、C12に記載の電子デバイス。
[C16]
前記画像センサーが、少なくとも1つの候補フォーカスパラメータに基づいて前記ターゲットフォーカス領域を含む少なくとも1つのプレビュー画像をキャプチャするようにさらに構成された、C15に記載の電子デバイス。
[C17]
前記画像センサー制御ユニットが、
前記少なくとも1つのプレビュー画像中の前記ターゲットフォーカス領域の少なくとも1つのシャープネス値を決定することと、
前記少なくとも1つの候補フォーカスパラメータから最も高いシャープネス値を有する候補フォーカスパラメータを選択することと、
前記少なくとも1つの画像キャプチャリングパラメータ中の前記フォーカスパラメータを前記選択された候補フォーカスパラメータに調整することとを行うように構成された、C15に記載の電子デバイス。
[C18]
前記画像センサー制御ユニットが、
前記プレビュー画像中の前記ターゲットフォーカス領域の輝度値を決定することと、
前記ターゲットフォーカス領域の前記輝度値と所定の輝度値との間の差分を計算することと、
前記差分に基づいて前記少なくとも1つの画像キャプチャリングパラメータ中の前記露出パラメータを調整することとを行うように構成された、C15に記載の電子デバイス。
[C19]
前記画像センサー制御ユニットが、
前記ターゲットフォーカス領域に基づいて参照オブジェクトを識別することと、
前記ターゲットフォーカス領域と前記参照オブジェクトとの間の幾何学的関係を決定することと、
前記幾何学的関係に基づいて前記少なくとも1つの画像キャプチャリングパラメータ中の前記フォーカスパラメータを調整することとを行うように構成された、C15に記載の電子デバイス。
[C20]
前記ターゲットフォーカス領域検出ユニットが、
前記複数のテキスト領域の複数のサイズを決定することと、
前記複数のサイズに基づいて前記複数のテキスト領域から前記ターゲットフォーカス領域を選択することとを行うように構成された、C12に記載の電子デバイス。
[C21]
前記テキスト領域検出ユニットが、
前記複数の候補テキスト領域から複数の特徴を抽出することと、
前記複数の特徴に基づいて複数の分類スコアを決定することと、
前記複数の分類スコアに基づいて前記複数の候補テキスト領域から前記複数のテキスト領域を識別することとを行うように構成された、C13に記載の電子デバイス。
[C22]
前記ターゲットフォーカス領域検出ユニットが、
最も大きい分類スコアを有する前記複数のテキスト領域のうちの1つを識別することと、
前記ターゲットフォーカス領域として前記識別されたテキスト領域を選択することとを行うように構成された、C21に記載の電子デバイス。
[C23]
前記テキスト領域検出ユニットは、
前記プレビュー画像中の前記候補テキスト領域のロケーションを決定することと、
前記プレビュー画像中の前記候補テキスト領域の前記ロケーションに基づいて前記シーンの別のプレビュー画像から複数の候補テキスト領域を取得することと、前記シーンの前記別のプレビュー画像が前記プレビュー画像よりも高い解像度を有する、
前記別のプレビュー画像から取得された前記複数の候補テキスト領域に基づいて前記複数のテキスト領域を識別することとを行うように構成された、C13に記載の電子デバイス。
[C24]
プレビューモードにおいて少なくとも1つの画像キャプチャリングパラメータを調整するための命令を備える非一時的コンピュータ可読記憶媒体であって、前記命令が、
画像キャプチャリングパラメータのセットに基づいて少なくとも1つのテキストオブジェクトを含むシーンのプレビュー画像をキャプチャすることと、
前記プレビュー画像中に複数のテキスト領域を識別することと、
前記複数のテキスト領域からターゲットフォーカス領域を選択することと、
前記ターゲットフォーカス領域に基づいて前記少なくとも1つの画像キャプチャリングパラメータを調整することとの動作を電子デバイスのプロセッサに実施させる、非一時的コンピュータ可読記憶媒体。
[C25]
前記少なくとも1つの画像キャプチャリングパラメータが、フォーカスパラメータと、露出パラメータと、ホワイトバランスパラメータと、コントラスト強調パラメータと、ズームパラメータと、光に対する感度パラメータとのうちの少なくとも1つを備える、C24に記載の媒体。
[C26]
前記少なくとも1つの画像キャプチャリングパラメータを調整することが、
少なくとも1つの候補フォーカスパラメータに基づいて前記ターゲットフォーカス領域を含む少なくとも1つのプレビュー画像をキャプチャすることと、
前記少なくとも1つのプレビュー画像中の前記ターゲットフォーカス領域の少なくとも1つのシャープネス値を決定することと、
前記少なくとも1つの候補フォーカスパラメータから最も高いシャープネス値を有する候補フォーカスパラメータを選択することと、
前記少なくとも1つの画像キャプチャリングパラメータ中の前記フォーカスパラメータを前記選択された候補フォーカスパラメータに調整することとを備える、C25に記載の媒体。
[C27]
前記少なくとも1つの画像キャプチャリングパラメータを調整することが、
前記プレビュー画像中の前記ターゲットフォーカス領域の輝度値を決定することと、
前記ターゲットフォーカス領域の前記輝度値と所定の輝度値との間の差分を計算することと、
前記差分に基づいて前記少なくとも1つの画像キャプチャリングパラメータ中の前記露出パラメータを調整することとを備える、C25に記載の媒体。
[C28]
プレビューモードにおいて少なくとも1つの画像キャプチャリングパラメータを調整するための電子デバイスであって、
画像キャプチャリングパラメータのセットに基づいて少なくとも1つのテキストオブジェクトを含むシーンのプレビュー画像をキャプチャするための手段と、
前記プレビュー画像中に複数のテキスト領域を識別するための手段と、
前記複数のテキスト領域からターゲットフォーカス領域を選択するための手段と、
前記ターゲットフォーカス領域に基づいて前記少なくとも1つの画像キャプチャリングパラメータを調整するための手段とを備える電子デバイス。
[C29]
前記少なくとも1つの画像キャプチャリングパラメータが、フォーカスパラメータと、露出パラメータと、ホワイトバランスパラメータと、コントラスト強調パラメータと、ズームパラメータと、光に対する感度パラメータとのうちの少なくとも1つを備える、C28に記載の電子デバイス。
[C30]
前記少なくとも1つの画像キャプチャリングパラメータを調整するための前記手段が、
少なくとも1つの候補フォーカスパラメータに基づいて前記ターゲットフォーカス領域を含む少なくとも1つのプレビュー画像をキャプチャすることと、
前記少なくとも1つのプレビュー画像中の前記ターゲットフォーカス領域の少なくとも1つのシャープネス値を決定することと、
前記少なくとも1つの候補フォーカスパラメータから最も高いシャープネス値を有する候補フォーカスパラメータを選択することと、
前記少なくとも1つの画像キャプチャリングパラメータ中の前記フォーカスパラメータを前記選択された候補フォーカスパラメータに調整することとを行うように構成された、C29に記載の電子デバイス。

Claims (26)

  1. なくとも1つの画像をキャプチャするための、画像センサーを備えた電子デバイスによって実施される方法であって、
    なくとも1つのテキストオブジェクトを含むシーンのプレビュー画像をキャプチャすることと、
    前記プレビュー画像中に複数のテキスト領域を識別することと、
    前記複数のテキスト領域からターゲットフォーカス領域を選択することと、
    前記ターゲットフォーカス領域に関連付けられた少なくとも1つの輝度値を決定することと、
    前記少なくとも1つの輝度値をしきい値と比較することと、
    前記比較に基づいて前記画像センサーのための少なくとも1つの画像キャプチャリングパラメータを調整することと
    を備える、方法。
  2. 前記複数のテキスト領域を識別することが、
    前記プレビュー画像中に複数の候補テキスト領域を検出することと、
    前記複数の候補テキスト領域から前記複数のテキスト領域を識別することと
    を備える、請求項1に記載の方法。
  3. 前記少なくとも1つの画像キャプチャリングパラメータに基づいて前記少なくとも1つのテキストオブジェクトを含む画像をキャプチャすることをさらに備える、請求項1に記載の方法。
  4. 前記少なくとも1つの画像キャプチャリングパラメータが、フォーカスパラメータ露出パラメータ、ホワイトバランスパラメータ、コントラスト強調パラメータ、ズームパラメータ、または光に対する感度パラメータのうちの少なくとも1つを備える、請求項1に記載の方法。
  5. 前記少なくとも1つの画像キャプチャリングパラメータを調整することが、
    少なくとも1つの候補フォーカスパラメータに基づいて前記ターゲットフォーカス領域を含む少なくとも1つのプレビュー画像をキャプチャすることと、
    も高いシャープネス値を有する前記ターゲットフォーカス領域に関連付けられた候補フォーカスパラメータを選択することと、
    前記少なくとも1つの画像キャプチャリングパラメータ中の前記フォーカスパラメータを前記選択された候補フォーカスパラメータに調整することと
    を備える、請求項4に記載の方法。
  6. 前記少なくとも1つの画像キャプチャリングパラメータを調整することが、前記少なくとも1つの画像キャプチャリングパラメータ中の前記露出パラメータを調整することを備える、請求項4に記載の方法。
  7. 少なくとも1つの画像をキャプチャするための、画像センサーを備えた電子デバイスによって実施される方法であって、
    複数の画像キャプチャリングパラメータの少なくともフォーカスパラメータに基づいて少なくとも1つのテキストオブジェクトを含むシーンの少なくとも1つのプレビュー画像をキャプチャすることと、
    前記少なくとも1つのプレビュー画像中に複数のテキスト領域を識別することと、
    前記複数のテキスト領域からターゲットフォーカス領域を選択することと、
    前記ターゲットフォーカス領域に基づいて参照オブジェクトを識別することと、
    前記ターゲットフォーカス領域と前記参照オブジェクトとの間の幾何学的関係を決定することと、
    前記幾何学的関係に基づいて前記フォーカスパラメータを調整することと
    を備える、方法。
  8. 前記複数のテキスト領域から前記ターゲットフォーカス領域を選択することが、
    前記複数のテキスト領域の複数のサイズを決定することと、
    前記複数のサイズに基づいて前記複数のテキスト領域から前記ターゲットフォーカス領域を選択することと
    を備える、請求項1に記載の方法。
  9. 前記複数の候補テキスト領域から前記複数のテキスト領域を識別することが、
    前記複数の候補テキスト領域から複数の特徴を抽出することと、
    前記複数の特徴に基づいて複数の分類スコアを決定することと、
    前記複数の分類スコアに基づいて前記複数の候補テキスト領域から前記複数のテキスト領域を識別することと
    を備える、請求項2に記載の方法。
  10. 前記複数のテキスト領域から前記ターゲットフォーカス領域を選択することが、
    最も大きい分類スコアを有する前記複数のテキスト領域のうちの1つを識別することと、
    前記ターゲットフォーカス領域として前記識別されたテキスト領域を選択することと
    を備える、請求項9に記載の方法。
  11. 前記複数の候補テキスト領域から前記複数のテキスト領域を識別することは、
    前記プレビュー画像中の候補テキスト領域のロケーションを決定することと、
    前記プレビュー画像中の前記候補テキスト領域の前記ロケーションに基づいて前記シーンの別のプレビュー画像から複数の候補テキスト領域を取得することと、ここにおいて、前記シーンの前記別のプレビュー画像が前記プレビュー画像よりも高い解像度を有する、
    前記別のプレビュー画像から取得された前記複数の候補テキスト領域に基づいて前記複数のテキスト領域を識別することと
    を備える、請求項2に記載の方法。
  12. なくとも1つの画像をキャプチャするための画像センサーを備えた電子デバイスであって、
    なくとも1つのテキストオブジェクトを含むシーンのプレビュー画像をキャプチャするように構成された画像センサーと、
    前記プレビュー画像中に複数のテキスト領域を識別するように構成されたテキスト領域検出ユニットと、
    前記複数のテキスト領域からターゲットフォーカス領域を選択するように構成されたターゲットフォーカス領域検出ユニットと、
    前記ターゲットフォーカス領域に関連付けられた少なくとも1つの輝度値を決定することと、
    前記少なくとも1つの輝度値をしきい値と比較することと、
    前記比較に基づいて前記画像センサーのための少なくとも1つの画像キャプチャリングパラメータを調整することと
    を行うように構成された画像センサー制御ユニットと
    を備える電子デバイス。
  13. 前記テキスト領域検出ユニットが、
    前記プレビュー画像中に複数の候補テキスト領域を検出することと、
    前記複数の候補テキスト領域から前記複数のテキスト領域を識別することと
    を行うように構成された、請求項12に記載の電子デバイス。
  14. 前記画像センサーが、前記少なくとも1つの画像キャプチャリングパラメータに基づいて前記少なくとも1つのテキストオブジェクトを含む画像をキャプチャするようにさらに構成された、請求項12に記載の電子デバイス。
  15. 前記少なくとも1つの画像キャプチャリングパラメータが、フォーカスパラメータ、露出パラメータ、ホワイトバランスパラメータ、コントラスト強調パラメータ、ズームパラメータ、または光に対する感度パラメータのうちの少なくとも1つを備える、請求項12に記載の電子デバイス。
  16. 前記画像センサーが、少なくとも1つの候補フォーカスパラメータに基づいて前記ターゲットフォーカス領域を含む少なくとも1つのプレビュー画像をキャプチャするようにさらに構成された、請求項15に記載の電子デバイス。
  17. 前記画像センサー制御ユニットが、
    も高いシャープネス値を有する前記ターゲットフォーカス領域に関連付けられた候補フォーカスパラメータを選択することと、
    前記少なくとも1つの画像キャプチャリングパラメータ中の前記フォーカスパラメータを前記選択された候補フォーカスパラメータに調整することと
    を行うように構成された、請求項15に記載の電子デバイス。
  18. 前記画像センサー制御ユニットが、前記少なくとも1つの画像キャプチャリングパラメータ中の前記露出パラメータを調整するように構成された、請求項15に記載の電子デバイス。
  19. 少なくとも1つの画像をキャプチャするための画像センサーを備えた電子デバイスであって、
    複数の画像キャプチャリングパラメータのフォーカスパラメータに基づいて少なくとも1つのテキストオブジェクトを含むシーンの少なくとも1つのプレビュー画像をキャプチャするように構成された画像センサーと、
    前記少なくとも1つのプレビュー画像中に複数のテキスト領域を識別するように構成されたテキスト領域検出ユニットと、
    前記複数のテキスト領域からターゲットフォーカス領域を選択するように構成されたターゲットフォーカス領域検出ユニットと、
    前記ターゲットフォーカス領域に基づいて参照オブジェクトを識別することと、前記ターゲットフォーカス領域と前記参照オブジェクトとの間の幾何学的関係を決定することとを行うように構成された画像センサー制御ユニットと、ここにおいて、前記画像センサー制御ユニットは、前記幾何学的関係に基づいて前記少なくとも1つの画像キャプチャリングパラメータ中の前記フォーカスパラメータを調整するように構成される、
    備える、電子デバイス。
  20. 前記ターゲットフォーカス領域検出ユニットが、
    前記複数のテキスト領域の複数のサイズを決定することと、
    前記複数のサイズに基づいて前記複数のテキスト領域から前記ターゲットフォーカス領域を選択することと
    を行うように構成された、請求項12に記載の電子デバイス。
  21. 前記テキスト領域検出ユニットが、
    前記複数の候補テキスト領域から複数の特徴を抽出することと、
    前記複数の特徴に基づいて複数の分類スコアを決定することと、
    前記複数の分類スコアに基づいて前記複数の候補テキスト領域から前記複数のテキスト領域を識別することと
    を行うように構成された、請求項13に記載の電子デバイス。
  22. 前記ターゲットフォーカス領域検出ユニットが、
    最も大きい分類スコアを有する前記複数のテキスト領域のうちの1つを識別することと、
    前記ターゲットフォーカス領域として前記識別されたテキスト領域を選択することと
    を行うように構成された、請求項21に記載の電子デバイス。
  23. 前記テキスト領域検出ユニットは、
    前記プレビュー画像中の候補テキスト領域のロケーションを決定することと、
    前記プレビュー画像中の前記候補テキスト領域の前記ロケーションに基づいて前記シーンの別のプレビュー画像から複数の候補テキスト領域を取得することと、前記シーンの前記別のプレビュー画像が前記プレビュー画像よりも高い解像度を有する、
    前記別のプレビュー画像から取得された前記複数の候補テキスト領域に基づいて前記複数のテキスト領域を識別することと
    を行うように構成された、請求項13に記載の電子デバイス。
  24. なくとも1つの画像をキャプチャするための画像センサーを備えた電子デバイスであって、
    少なくとも1つのテキストオブジェクトを含むシーンのプレビュー画像をキャプチャするための手段と、
    前記プレビュー画像中に複数のテキスト領域を識別するための手段と、
    前記複数のテキスト領域からターゲットフォーカス領域を選択するための手段と、
    前記ターゲットフォーカス領域に関連付けられた少なくとも1つの輝度値を決定するための手段と、
    前記少なくとも1つの輝度値をしきい値と比較するための手段と、
    前記比較に基づいて前記画像センサーのための少なくとも1つの画像キャプチャリングパラメータを調整するための手段と
    を備える電子デバイス。
  25. 前記少なくとも1つの画像キャプチャリングパラメータが、フォーカスパラメータ露出パラメータ、ホワイトバランスパラメータ、コントラスト強調パラメータ、ズームパラメータ、または光に対する感度パラメータのうちの少なくとも1つを備える、請求項24に記載の電子デバイス。
  26. 前記少なくとも1つの画像キャプチャリングパラメータを調整するための前記手段が、
    少なくとも1つの候補フォーカスパラメータに基づいて前記ターゲットフォーカス領域を含む少なくとも1つのプレビュー画像をキャプチャすることと、
    前記少なくとも1つのプレビュー画像中の前記ターゲットフォーカス領域の少なくとも1つのシャープネス値を決定することと、
    前記少なくとも1つの候補フォーカスパラメータから最も高いシャープネス値を有する候補フォーカスパラメータを選択することと、
    前記少なくとも1つの画像キャプチャリングパラメータ中の前記フォーカスパラメータを前記選択された候補フォーカスパラメータに調整することと
    を行うように構成された、請求項25に記載の電子デバイス。
JP2016571692A 2014-06-09 2015-06-05 プレビューモードにおける画像キャプチャリングパラメータ調整 Active JP6208383B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/300,023 US9602728B2 (en) 2014-06-09 2014-06-09 Image capturing parameter adjustment in preview mode
US14/300,023 2014-06-09
PCT/US2015/034497 WO2015191397A1 (en) 2014-06-09 2015-06-05 Image capturing parameter adjustment in preview mode

Publications (2)

Publication Number Publication Date
JP2017517980A JP2017517980A (ja) 2017-06-29
JP6208383B2 true JP6208383B2 (ja) 2017-10-04

Family

ID=53404959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016571692A Active JP6208383B2 (ja) 2014-06-09 2015-06-05 プレビューモードにおける画像キャプチャリングパラメータ調整

Country Status (5)

Country Link
US (1) US9602728B2 (ja)
EP (1) EP3152706B1 (ja)
JP (1) JP6208383B2 (ja)
CN (1) CN106462766B (ja)
WO (1) WO2015191397A1 (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8520069B2 (en) 2005-09-16 2013-08-27 Digital Ally, Inc. Vehicle-mounted video system with distributed processing
US8503972B2 (en) 2008-10-30 2013-08-06 Digital Ally, Inc. Multi-functional remote monitoring system
US10272848B2 (en) 2012-09-28 2019-04-30 Digital Ally, Inc. Mobile video and imaging system
US9019431B2 (en) 2012-09-28 2015-04-28 Digital Ally, Inc. Portable video and imaging system
US10075681B2 (en) 2013-08-14 2018-09-11 Digital Ally, Inc. Dual lens camera unit
US9159371B2 (en) 2013-08-14 2015-10-13 Digital Ally, Inc. Forensic video recording with presence detection
US10390732B2 (en) 2013-08-14 2019-08-27 Digital Ally, Inc. Breath analyzer, system, and computer program for authenticating, preserving, and presenting breath analysis data
US9253452B2 (en) 2013-08-14 2016-02-02 Digital Ally, Inc. Computer program, method, and system for managing multiple data recording devices
US9667880B2 (en) 2014-08-22 2017-05-30 Qualcomm Incorporated Activating flash for capturing images with text
US11567626B2 (en) * 2014-12-17 2023-01-31 Datalogic Usa, Inc. Gesture configurable floating soft trigger for touch displays on data-capture electronic devices
KR102328098B1 (ko) * 2015-02-13 2021-11-17 삼성전자주식회사 전자장치의 초점 검출 장치 및 방법
US9841259B2 (en) 2015-05-26 2017-12-12 Digital Ally, Inc. Wirelessly conducted electronic weapon
US10013883B2 (en) 2015-06-22 2018-07-03 Digital Ally, Inc. Tracking and analysis of drivers within a fleet of vehicles
CN106998423A (zh) * 2016-01-26 2017-08-01 宇龙计算机通信科技(深圳)有限公司 图像处理方法及装置
WO2017136646A1 (en) 2016-02-05 2017-08-10 Digital Ally, Inc. Comprehensive video collection and storage
KR102462644B1 (ko) 2016-04-01 2022-11-03 삼성전자주식회사 전자 장치 및 그의 동작 방법
US10432849B2 (en) * 2016-04-22 2019-10-01 Ebay Inc. Image modification based on objects of interest
US10395356B2 (en) * 2016-05-25 2019-08-27 Kla-Tencor Corp. Generating simulated images from input images for semiconductor applications
US10521675B2 (en) * 2016-09-19 2019-12-31 Digital Ally, Inc. Systems and methods of legibly capturing vehicle markings
AU2017363337B2 (en) 2016-11-23 2021-07-01 Translational Drug Development, Llc Benzamide and active compound compositions and methods of use
CN108171231A (zh) * 2016-12-07 2018-06-15 中兴通讯股份有限公司 一种基于图像识别的通信方法和装置
US10911725B2 (en) 2017-03-09 2021-02-02 Digital Ally, Inc. System for automatically triggering a recording
US10430649B2 (en) * 2017-07-14 2019-10-01 Adobe Inc. Text region detection in digital images using image tag filtering
KR101909022B1 (ko) * 2017-09-12 2018-10-17 만도헬라일렉트로닉스(주) 카메라 자동 초점 조절장치 및 방법
CN107979728A (zh) * 2017-11-30 2018-05-01 珠海格力电器股份有限公司 一种确定拍摄焦点的方法及终端设备
GB2570792B (en) 2017-12-26 2020-09-30 Canon Kk Image capturing apparatus, method of controlling the same, and storage medium
CN108235816B (zh) * 2018-01-10 2020-10-16 深圳前海达闼云端智能科技有限公司 图像识别方法、系统、电子设备和计算机程序产品
JP7197981B2 (ja) * 2018-01-24 2022-12-28 キヤノン株式会社 カメラ、端末装置、カメラの制御方法、端末装置の制御方法、およびプログラム
US11024137B2 (en) 2018-08-08 2021-06-01 Digital Ally, Inc. Remote video triggering and tagging
CN110163810B (zh) * 2019-04-08 2023-04-25 腾讯科技(深圳)有限公司 一种图像处理方法、装置以及终端
CN110059678A (zh) * 2019-04-17 2019-07-26 上海肇观电子科技有限公司 一种检测方法、装置及计算机可读存储介质
CN113826445B (zh) * 2019-04-30 2024-05-14 昕诺飞控股有限公司 基于相机的照明控制
JP7279533B2 (ja) * 2019-06-14 2023-05-23 ソニーグループ株式会社 センサ装置、信号処理方法
US11386473B2 (en) 2019-10-24 2022-07-12 Shopify Inc. Systems and methods for providing product image recommendations
CN110971820B (zh) * 2019-11-25 2021-03-26 Oppo广东移动通信有限公司 拍照方法、拍照装置、移动终端及计算机可读存储介质
CN111832568B (zh) * 2020-06-12 2024-01-12 北京百度网讯科技有限公司 车牌识别方法、车牌识别模型的训练方法和装置
CN115442512B (zh) * 2021-06-04 2024-09-06 北京小米移动软件有限公司 对焦控制方法、装置、终端及存储介质
CN114286004A (zh) * 2021-12-28 2022-04-05 维沃移动通信有限公司 对焦方法、拍摄装置、电子设备及介质
US11950017B2 (en) 2022-05-17 2024-04-02 Digital Ally, Inc. Redundant mobile video recording
US20230377338A1 (en) * 2022-05-17 2023-11-23 Honeywell International Inc. Methods and systems for improving video analytic results

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3634334B2 (ja) * 2002-12-02 2005-03-30 沖電気工業株式会社 拡張用fifo回路及び送受信装置
JP2007121654A (ja) 2005-10-27 2007-05-17 Eastman Kodak Co 撮像装置
US8098934B2 (en) * 2006-06-29 2012-01-17 Google Inc. Using extracted image text
JP5148989B2 (ja) * 2007-12-27 2013-02-20 イーストマン コダック カンパニー 撮像装置
JP5169641B2 (ja) * 2008-09-02 2013-03-27 富士通株式会社 画像解析装置および画像解析プログラム
KR20100064533A (ko) * 2008-12-05 2010-06-15 삼성전자주식회사 카메라를 이용한 문자 크기 자동 조절 장치 및 방법
CN101442617B (zh) * 2008-12-23 2014-01-08 北京中星微电子有限公司 一种分块曝光的方法及其装置
JP4875117B2 (ja) 2009-03-13 2012-02-15 株式会社東芝 画像処理装置
US8537236B2 (en) 2010-10-07 2013-09-17 Hewlett-Packard Development Company, L.P. Automatic adjustment of capture parameters based on reference data
JP5910252B2 (ja) * 2012-03-31 2016-04-27 富士通株式会社 撮像設定制御システムおよび撮像設定制御方法
US20140111542A1 (en) * 2012-10-20 2014-04-24 James Yoong-Siang Wan Platform for recognising text using mobile devices with a built-in device video camera and automatically retrieving associated content based on the recognised text

Also Published As

Publication number Publication date
CN106462766A (zh) 2017-02-22
CN106462766B (zh) 2018-06-01
EP3152706B1 (en) 2024-05-01
EP3152706A1 (en) 2017-04-12
WO2015191397A1 (en) 2015-12-17
US20150358549A1 (en) 2015-12-10
JP2017517980A (ja) 2017-06-29
US9602728B2 (en) 2017-03-21

Similar Documents

Publication Publication Date Title
JP6208383B2 (ja) プレビューモードにおける画像キャプチャリングパラメータ調整
US9418304B2 (en) System and method for recognizing text information in object
CN106446873B (zh) 人脸检测方法及装置
US8831381B2 (en) Detecting and correcting skew in regions of text in natural images
US9667880B2 (en) Activating flash for capturing images with text
CN106127751B (zh) 图像检测方法、装置以及系统
WO2020062804A1 (zh) 自然场景中行驶证拍照影像的识别方法、装置及电子设备
WO2019061658A1 (zh) 眼镜定位方法、装置及存储介质
CN105678242B (zh) 手持证件模式下的对焦方法和装置
CN110569835B (zh) 一种图像识别方法、装置和电子设备
US10452943B2 (en) Information processing apparatus, control method of information processing apparatus, and storage medium
US20190191078A1 (en) Information processing apparatus, a non-transitory computer readable storage medium and information processing method
CN110431563B (zh) 图像校正的方法和装置
JP5832656B2 (ja) 画像中のテキストの検出を容易にする方法及び装置
US20160104052A1 (en) Text-based thumbnail generation
CN110717060B (zh) 图像mask的过滤方法、装置及存储介质
US9684828B2 (en) Electronic device and eye region detection method in electronic device
CN114943976B (zh) 模型生成的方法、装置、电子设备和存储介质
CN109741243B (zh) 彩色素描图像生成方法及相关产品
CN106126234B (zh) 一种锁屏方法和装置
CN117953508A (zh) 文本图像的ocr识别方法、电子设备及介质
CN113744172A (zh) 文档图像的处理方法及装置、训练样本的生成方法及装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170424

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170424

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20170424

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170906

R150 Certificate of patent or registration of utility model

Ref document number: 6208383

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250