JP2006094082A - 画像撮影装置およびプログラム - Google Patents
画像撮影装置およびプログラム Download PDFInfo
- Publication number
- JP2006094082A JP2006094082A JP2004276395A JP2004276395A JP2006094082A JP 2006094082 A JP2006094082 A JP 2006094082A JP 2004276395 A JP2004276395 A JP 2004276395A JP 2004276395 A JP2004276395 A JP 2004276395A JP 2006094082 A JP2006094082 A JP 2006094082A
- Authority
- JP
- Japan
- Prior art keywords
- size
- image
- character
- recognized
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】文字認識あるいはコード認識などを行わせるためにその認識対象となる文字、コードなどを被写体として撮影する際に、画像内における認識対象の大きさとそれを正常に認識可能なサイズとを考慮してズーム倍率を自動調整できるようにする。
【解決手段】CPU1は、文字を正常に認識することが可能な枠サイズ(最少サイズ)を枠サイズテーブル10から読み出すと共に、画像内に含まれている文字の大きさを検出し、この文字の大きさと枠サイズとを比較し、この比較結果に基づいて撮像部3を制御してズーム倍率を変更する。この場合、文字の大きさが枠サイズに達していない場合には、枠サイズとなるまでズーム倍率をアップし、逆に、文字の大きさが枠サイズに比べて大き過ぎる場合には、文字の大きさが適正なサイズとなるまでズーム倍率をダウンする。
【選択図】 図1
【解決手段】CPU1は、文字を正常に認識することが可能な枠サイズ(最少サイズ)を枠サイズテーブル10から読み出すと共に、画像内に含まれている文字の大きさを検出し、この文字の大きさと枠サイズとを比較し、この比較結果に基づいて撮像部3を制御してズーム倍率を変更する。この場合、文字の大きさが枠サイズに達していない場合には、枠サイズとなるまでズーム倍率をアップし、逆に、文字の大きさが枠サイズに比べて大き過ぎる場合には、文字の大きさが適正なサイズとなるまでズーム倍率をダウンする。
【選択図】 図1
Description
この発明は、文字認識あるいはコード認識などを行わせるためにその認識対象となる文字、コードなどを被写体として撮影する画像撮影装置およびプログラムに関する。
近年、会議などで黒板、ホワイトボードに手書きされた文字情報をデジタルカメラで撮影した後、この撮影画像を文字認識装置に転送して文字認識させるケースが増えてきている。この場合、文字情報を撮影する際に、文字をどの程度の大きさで撮影するかは撮影者の経験によらなければならず、文字認識時に文字が小さ過ぎると、正常に文字認識することができなくなり、逆に、文字が大き過ぎると、一回の撮影で取得できる情報量が少なくなる。そこで、従来では、撮影画像を表示する画面上において、文字認識が可能な最小文字サイズを表示することによって撮影者は、この最小サイズを参照して文字認識できる程度にズームアップ操作を行うようにした画像情報処理装置が知られている(特許文献1参照)。
特開2004−062400号公報
しかしながら、上述した特許文献の技術にあっては、撮影者がズームアップ操作を行う必要であり、さらには、ズームするごとに撮影画像内の文字と参照最小文字サイズ表示とを見比べてなければならず、撮影者に大きな負担をかけるという問題があった。
このことは、文字を撮影して認識する場合に限らず、図形を撮影認識する場合、バーコード、2次元コードなどのコードを撮影して認識する場合、電話番号、電子メールアドレス、URL(インターネットのサイトアドレス)などの文字列を撮影して認識する場合でも同様の問題が起きる。
このことは、文字を撮影して認識する場合に限らず、図形を撮影認識する場合、バーコード、2次元コードなどのコードを撮影して認識する場合、電話番号、電子メールアドレス、URL(インターネットのサイトアドレス)などの文字列を撮影して認識する場合でも同様の問題が起きる。
第1の発明の課題は、文字認識あるいはコード認識などを行わせるためにその認識対象となる文字、コードなどを被写体として撮影する際に、画像内における認識対象の大きさとそれを正常に認識可能なサイズとを考慮してズーム倍率を自動調整できるようにすることである。
第2の発明の課題は、文字認識あるいはコード認識などを行わせるためにその認識対象となる文字、コードなどを被写体として撮影する際に、画像内における認識対象の大きさとそれを正常に認識可能なサイズとを考慮して、撮影画像を記録保存する際の記録画素数を自動変更できるようにすることである。
請求項1記載の発明(第1の発明)は、文字認識あるいはコード認識などを行わせるためにその認識対象となる文字、コードなどを被写体として撮影する画像撮影装置であって、文字、コードなどを正常に認識することが可能なサイズ情報を取得する取得手段と、画像内に含まれている文字、コードなどの被認識データの大きさを検出する検出手段と、この検出手段によって検出された被認識データの大きさと前記取得手段によって得られたサイズ情報とを比較し、この比較結果に基づいてズーム倍率を変更するズーム変更手段とを具備したことを特徴とする。
さらに、コンピュータに対して、上述した請求項1記載の発明に示した主要機能を実現させるためのプログラムを提供する(請求項10記載の発明)。
さらに、コンピュータに対して、上述した請求項1記載の発明に示した主要機能を実現させるためのプログラムを提供する(請求項10記載の発明)。
なお、請求項1記載の発明は次のようなものであってもよい。
前記文字、コードなどを正常認識可能なサイズ情報は、文字認識処理時の性能特性および撮影画像を記録保存する際の記録画素数を考慮して定められた最小サイズであり、前記取得手段は、予め用意されている複数の記録画素数の中から任意の画素数が選択設定されている状態において、現在設定されている記録画素数との相関関係に応じた大きさのサイズ情報を取得する(請求項2記載の発明)。
前記文字、コードなどを正常認識可能なサイズ情報は、文字認識処理時の性能特性および撮影画像を記録保存する際の記録画素数を考慮して定められた最小サイズであり、前記取得手段は、予め用意されている複数の記録画素数の中から任意の画素数が選択設定されている状態において、現在設定されている記録画素数との相関関係に応じた大きさのサイズ情報を取得する(請求項2記載の発明)。
前記ズーム変更手段は、文字、コードなどの被認識データの大きさがそれを正常に認識することが可能なサイズに達していない場合には、当該被認識データの大きさが認識可能なサイズとなるまでズーム倍率をアップする(請求項3記載の発明)。
前記ズーム変更手段は、文字、コードなどの被認識データの大きさがそれを正常に認識することが可能なサイズに比べて大き過ぎる場合には、当該被認識データの大きさが認識可能なサイズに近づくようになるまでズーム倍率をダウンする(請求項4記載の発明)。
前記ズーム変更手段によって最大ズーム倍率に変更しても、文字、コードなどの被認識データの大きさがそれを正常に認識することが可能なサイズに達していない場合には、現在設定されている記録画素数を高める方向に段階的に変更する画素数変更手段を設けた(請求項5記載の発明)。
前記ズーム変更手段によって最小ズーム倍率に変更しても、文字、コードなどの被認識データの大きさがそれを正常に認識することが可能なサイズに比べて大き過ぎる場合には、現在設定されている記録画素数を低める方向に段階的に変更する画素数変更手段を設けた(請求項6記載の発明)。
画像内に含まれている複数の文字、コードなどの被認識データの中から任意の被認識データを選択指定する選択手段を設け、前記検出手段は、前記選択手段によって選択指定された被認識データの大きさを検出する(請求項8記載の発明)。
前記検出手段によって検出された被認識データの位置に前記取得手段によって得られたサイズ情報を重ね合わせて案内表示する表示制御手段を設けた(請求項9記載の発明)。
請求項7記載の発明(第2の発明)は、文字認識あるいはコード認識などを行わせるためにその認識対象となる文字、コードなどを被写体として撮影する画像撮影装置であって、文字、コードなどを正常に認識することが可能なサイズ情報を取得する取得手段と、画像内に含まれている文字、コードなどの被認識データの大きさを検出する検出手段と、この検出手段によって検出された被認識データの大きさと前記取得手段によって得られたサイズ情報とを比較し、撮影画像を記録保存する際の記録画素数を当該比較結果に基づいて変更する記録画素数変更手段とを具備したことを特徴とする。
さらに、コンピュータに対して、上述した請求項7記載の発明に示した主要機能を実現させるためのプログラムを提供する(請求項11記載の発明)。
また、請求項7記載の発明(第2の発明)は、上述した請求項8、9記載の発明であってもよい。
さらに、コンピュータに対して、上述した請求項7記載の発明に示した主要機能を実現させるためのプログラムを提供する(請求項11記載の発明)。
また、請求項7記載の発明(第2の発明)は、上述した請求項8、9記載の発明であってもよい。
請求項1記載の発明(第1の発明)によれば、文字、コードなどの被写体を正常に認識することが可能なサイズ情報を取得すると共に、画像内に含まれている文字、コードなどの被認識データの大きさを検出し、この被認識データの大きさと正常認識可能なサイズ情報とを比較し、この比較結果に基づいてズーム倍率を変更するようにしたから、撮影者に負担をかけることなく、文字、コードなどを適切な大きさで撮影することが可能となる。
なお、「サイズ情報」は、文字、コードなどを正常に認識することが可能な最小サイズであってもよいが、この最小サイズよりも若干余裕を持った大き目なサイズであってもよい(以下、同様)。
なお、「サイズ情報」は、文字、コードなどを正常に認識することが可能な最小サイズであってもよいが、この最小サイズよりも若干余裕を持った大き目なサイズであってもよい(以下、同様)。
請求項2記載の発明によれば、上述した請求項1記載の発明と同様の効果を有する他、文字、コードなどを正常認識可能なサイズ情報は、文字認識処理時の性能特性および撮影画像を記録保存する際の記録画素数を考慮して定められた最小サイズであり、予め用意されている複数の記録画素数の中から任意の画素数が選択設定されている状態において、現在設定されている記録画素数との相関関係に応じた大きさのサイズ情報を取得するようにしたから、文字認識処理時の性能特性および記録画素数に合ったサイズ情報を基準として精度の良いズーム調整が可能となる。なお、文字認識処理時の性能特性(認識精度など)が良く、記録画素数が大きくなればなる程、正常に認識可能なサイズは小さくなる。
請求項3記載の発明によれば、上述した請求項1記載の発明と同様の効果を有する他、文字、コードなどの被認識データの大きさがそれを正常に認識することが可能なサイズに達していない場合には、当該被認識データの大きさが認識可能なサイズとなるまでズーム倍率をアップするようにしたから、文字、コードなどを認識可能なサイズで撮影することができ、その後の認識処理時における認識不能、誤認識を事前に防止することが可能となる。
請求項4記載の発明によれば、上述した請求項1記載の発明と同様の効果を有する他、文字、コードなどの被認識データの大きさがそれを正常に認識することが可能なサイズに比べて大き過ぎる場合には、当該被認識データの大きさが認識可能なサイズに近づくようになるまでズーム倍率をダウンするようにしたから、文字、コードなどを適切な大きさ(たとえば、認識可能サイズ以上でその1.5倍あるいは2倍以下)で撮影することができ、一回の撮影で多くの情報を得ることが可能となる。
請求項5記載の発明によれば、上述した請求項1記載の発明と同様の効果を有する他、最大ズーム倍率に変更しても、文字、コードなどの被認識データの大きさがそれを正常に認識することが可能なサイズに達していない場合には、現在設定されている記録画素数を高める方向に段階的に変更するようにしたから、ズーム調整が限界に達したとしても記録画素数の自動変更によって文字、コードなどを認識可能なサイズで撮影することができる。
請求項6記載の発明によれば、上述した請求項1記載の発明と同様の効果を有する他、最小ズーム倍率に変更しても、文字、コードなどの被認識データの大きさがそれを正常に認識することが可能なサイズに比べて大き過ぎる場合には、現在設定されている記録画素数を低める方向に段階的に変更することができる。つまり、ズーム調整が限界に達したとしても、たとえば、文字に比べて枠サイズが小さ過ぎる場合には、画像記録時にメモリ容量が無駄に消費されるため、記録画素数を減らす方向に変更することができる。
なお、たとえば、静止画の記録画素数が「2560×1920」の場合と「640×480」の場合とでは、カードメモリなどへの保存可能枚数が極端に相違するため、大きな文字を大きく撮影する際には、文字を正常に認識することができる範囲内において記録画素数を減らすことにより保存可能枚数を大幅に増やすことが可能となる。
なお、たとえば、静止画の記録画素数が「2560×1920」の場合と「640×480」の場合とでは、カードメモリなどへの保存可能枚数が極端に相違するため、大きな文字を大きく撮影する際には、文字を正常に認識することができる範囲内において記録画素数を減らすことにより保存可能枚数を大幅に増やすことが可能となる。
請求項8記載の発明によれば、上述した請求項1記載の発明と同様の効果を有する他、画像内に含まれている複数の文字、コードなどの被認識データの中から任意の被認識データを選択指定可能としたから、画像内に大きさが異なる複数の文字などが含まれている場合に、所望する大きさの文字などを任意に選択することで、その選択文字などを基準としたズーム調整が可能となる。
請求項9記載の発明によれば、上述した請求項1記載の発明と同様の効果を有する他、検出された被認識データの位置に正常認識可能なサイズ情報を重ね合わせて案内表示するようにしたから、撮影者にあっては画像内の文字などが適正な大きさであるか否かを即座に判断することができる。
請求項7記載の発明(第2の発明)によれば、文字、コードなどの被写体を正常に認識することが可能なサイズ情報を取得すると共に、画像内に含まれている文字、コードなどの被認識データの大きさを検出し、この被認識データの大きさと正常認識可能なサイズ情報とを比較し、この比較結果に基づいて撮影画像の記録画素数を変更するようにしたから、撮影者に負担をかけることなく、記録画素数を変更することができる。すなわち、たとえば、文字に比べて枠サイズが大きい場合には、それを正常に認識することが不可能となるため、記録画素数を増やす方向に変更し、逆に、文字に比べて枠サイズが小さ過ぎる場合には、画像記録時にメモリ容量が無駄に消費されるため、記録画素数を減らす方向に変更することができる。言い換えれば、文字を正常に認識することが可能か、正常に認識可能でもメモリ容量を無駄に消費しないかに応じて記録画素数を自動変更することができる。なお、請求項7記載の発明(第2の発明)においても、上述した請求項8、9記載の発明と同様の効果を有する。
以下、図1〜図4を参照して本発明の実施例を説明する。
図1は、この実施例における画像撮影装置の基本的な構成要素を示したブロック図である。
この画像撮影装置は、たとえば、持ち運び自由な携帯型のデジタルカメラであり、各種の資料、名刺、葉書き、カタログ、ホワイトボードなどを対象として撮影された撮影画像は、記録メディア(たとえば、カードメモリ)を介して外部機器である文字認識装置(図示せず)に供給するようにしている。そして、この実施例における画像撮影装置は、文字認識の対象となる文字情報を撮影する際に、画像内の文字の大きさを検出すると共に、この文字の大きさとそれを正常に認識可能なサイズとを考慮して、当該文字が適正な大きさで撮影されるようにズーム倍率を自動調整したり、撮影画像を記録保存する際の記録画素数を自動変更するようにしている。
図1は、この実施例における画像撮影装置の基本的な構成要素を示したブロック図である。
この画像撮影装置は、たとえば、持ち運び自由な携帯型のデジタルカメラであり、各種の資料、名刺、葉書き、カタログ、ホワイトボードなどを対象として撮影された撮影画像は、記録メディア(たとえば、カードメモリ)を介して外部機器である文字認識装置(図示せず)に供給するようにしている。そして、この実施例における画像撮影装置は、文字認識の対象となる文字情報を撮影する際に、画像内の文字の大きさを検出すると共に、この文字の大きさとそれを正常に認識可能なサイズとを考慮して、当該文字が適正な大きさで撮影されるようにズーム倍率を自動調整したり、撮影画像を記録保存する際の記録画素数を自動変更するようにしている。
CPU1は、記憶部2内の各種のプログラムに応じてこの画像撮影装置の全体動作を制御する中央演算処理装置である。記憶部2は、プログラム記憶領域、データ記憶領域、ワーク領域とを有する構成となっている。この記憶部2内のプログラム記憶領域には、後述する図3に示す動作手順で本実施例の動作を実現するためのプログラムなどが格納されている。このCPU1には、撮像部3、画像処理用メモリ4、表示部5、ファインダ部6、入力部7、メモリカードI/F(インターフェイス)8、外部I/F9、枠サイズテーブル10がバスラインを介して接続されている。
撮像部3は、撮影レンズ系およびミラー等のレンズ・ミラーブロック、CCDイメージセンサ等の撮像素子、その駆動系のほか、測距センサ、光量センサ、アナログ処理回路、信号処理回路などを備えたもので、光学ズームを調整制御したり、オートフォーカス時の駆動制御、シャッター駆動制御、露出、ホワイトバランスなどを制御する。この撮影レンズ系には、ズームレンズ系が含まれており、その中の移動レンズの位置をズームイン/ズームアウト操作に応じて可変することでズーム倍率がマニュアル調整されるが、上述したように文字情報を撮影する際には、文字が適正な大きさで撮影されるようにズーム倍率の自動調整が行われる。その際、CPU1は、現在のズーム倍率が最大倍率に達したか、最小倍率に達したかを監視するようにしている。
この撮像部3によって撮影されて信号処理された画像データは、画像処理用メモリ4に送られて一時記憶される。画像処理用メモリ4内の画像データは、表示部5およびファインダ部6に送られて表示される。この場合、入力部7に設けられているシャッターボタン(図示せず)の操作に応答して画像処理用メモリ4内の画像データは、圧縮符号化された後にメモリカードI/F8に送られてメモリカード11にファイル形式で記録保存される。なお、メモリカード11に記録された画像内の文字を認識させるためには、メモリカード11を抜き出して、外部機器である文字認識装置に差し込んで接続すればよい。
表示部5は、たとえば、液晶表示装置などによって構成され、画像再生画面、入力操作画面、メッセージ画面として使用されるもので、その解像度を撮像部3内の撮像素子の解像度と略同様とした高精細ディスプレイである。入力部7は、各種のデータおよびコマンドを入力するもので、電源ボタン、シャッターボタンのほか、通常の撮影モード、再生モードなどを切り替えるモード切替ボタン、撮影画像を記録保存する際の記録画素数として予め用意されている複数の記録画素数の中から任意の記録画素数を選択設定するための選択ボタンなどが設けられている。
メモリカードI/F8は、メモリカード11が着脱自在に装着されるインターフェイスであり、画像データなどをメモリカード11に転送する。メモリカード11は、着脱自在な記録メディアであり、たとえば、スマートメディア、ICカードなどによって構成されている。外部I/F9は、外部機器としてのデータ処理装置(パーソナルコンピュータなど)が接続されるもので、有線あるいは無線通信によって画像データなどの送受信を制御する。なお、枠サイズテーブル10については、図3を参照して後述する。
図2は、撮像部3の構成を詳細に示した図である。
撮影レンズ系21からの被写体像は、絞り機構22を通して撮像素子23に結像される。光学系駆動部24は、撮影レンズ系21内の移動レンズの位置を制御して焦点合わせを行ったり、絞り機構22の絞り量を可変して露出調整を行うもので、測距センサ、光量センサなどを含むセンサ部25からの出力に基づいてCPU1は、光学系駆動部24の動作を制御する。駆動回路26は、撮像素子23によって光電変換された各画素対応の電荷を画像信号として順次取り出してアナログ処理回路27に与える。
撮影レンズ系21からの被写体像は、絞り機構22を通して撮像素子23に結像される。光学系駆動部24は、撮影レンズ系21内の移動レンズの位置を制御して焦点合わせを行ったり、絞り機構22の絞り量を可変して露出調整を行うもので、測距センサ、光量センサなどを含むセンサ部25からの出力に基づいてCPU1は、光学系駆動部24の動作を制御する。駆動回路26は、撮像素子23によって光電変換された各画素対応の電荷を画像信号として順次取り出してアナログ処理回路27に与える。
アナログ処理回路27は、入力された画像信号に色分離、ゲイン調整、ホワイトバランスなどを施すもので、A/D変換回路28によってデジタル変換された画像データは、バッファレジスタ29に一時記憶される。信号処理回路30は、画像データを輝度信号、色差信号に変換して表示部5およびファインダ部6から表示させる。圧縮伸張回路31は、シャッター操作に応答して画像データをメモリカード11などに記録保存する際に画像データの圧縮処理を行う。
図3は、枠サイズテーブル10の構成を示した図である。
この枠サイズテーブル10は、予め用意されている複数の記録画素数に対応して、文字を正常認識することが可能な最小サイズを示す枠サイズを記憶管理するテーブルである。この枠サイズテーブル10は、複数の記録画素数「n1×m1」、「n2×m2」、‥‥に対応する枠サイズとして「a1×b1」、「a2×b2」、‥‥が記憶されている。ここで、上述の「n」は、“横”の画素数、「a」は、“横”のサイズ、「m」は、“縦”の画素数、「b」は、“縦”のサイズを示している。
この枠サイズテーブル10は、予め用意されている複数の記録画素数に対応して、文字を正常認識することが可能な最小サイズを示す枠サイズを記憶管理するテーブルである。この枠サイズテーブル10は、複数の記録画素数「n1×m1」、「n2×m2」、‥‥に対応する枠サイズとして「a1×b1」、「a2×b2」、‥‥が記憶されている。ここで、上述の「n」は、“横”の画素数、「a」は、“横”のサイズ、「m」は、“縦”の画素数、「b」は、“縦”のサイズを示している。
この枠サイズは、外部機器としての文字認識装置Aの性能特性(認識精度など)と、撮影画像を記録保存する際の記録画素数などを考慮し、画像データ内に含まれている文字を正常認識することが可能な最小サイズはどの程度が限界かを示すサイズ情報(数値情報)であり、文字認識装置Aの性能特性が良く、記録画素数が大きくなればなる程、正常に認識可能な枠サイズは小さくなる。なお、枠サイズは、文字認識装置の性能特性と記録画素数との相関関係に基づいて算出設定した値でもよいが、実験的に求めた値を設定したものであってもよい。この際、実際に文字情報を撮影した多数のサンプル画像を、その記録画素数を変化させながら文字認識装置で実際に認識させた際の認識率に応じて記録画素数毎の枠サイズを求めるようにすればよい。
上述した複数の記録画素数は、記憶部2に選択候補として記憶されており、入力部7からの選択操作に応じて当該選択候補の中から任意に選択指定された記録画素数は記憶部2に設定されている。ここで、たとえば、動画の記録画素数は、「320×240」であるのに対し、静止画の記録画素数は、「2560×1920」、「2560×1712」、「2048×1536」、「1600×1200」、「1280×960」、「640×480」であり、静止画撮影時には、プリント時の品質、メモリ容量などに応じて任意の記録画素数を予め選択設定するようにしている。
また、記録画素数に対応付けられている各枠サイズは、文字認識装置が異なれば、その性能特性に応じて異なり、また、機種が異なる複数の文字認識装置(たとえば、A、B)を任意に選択して使用可能な環境においては、文字認識装置Aに対応する枠サイズテーブル10のほかに、文字認識装置Bに対応する枠サイズテーブル10を用意しておけばよい。また、枠サイズテーブル10の内容は、予めメーカサイドで固定的に設定されたものであってもよいが、必要に応じて任意に書き換え可能としてもよい。なお、撮像素子23の解像度(物理的な画素数)は、最大記録画素数「2560×1920」に対応している。
次ぎに、この実施例における画像撮影装置の動作概念を図4に示すフローチャートを参照して説明する。ここで、このフローチャートに記述されている各機能は、読み取り可能なプログラムコードの形態で格納されており、このプログラムコードにしたがった動作が逐次実行される。また、伝送媒体を介して伝送されてきた上述のプログラムコードに従った動作を逐次実行することもできる。すなわち、記録媒体の他に、伝送媒体を介して外部供給されたプログラム/データを利用してこの実施例特有の動作を実行することもできる。
図4は、シャッターボタンが半押しされた際に実行開始される画像撮影装置の動作の一部を示したフローチャートである。
先ず、CPU1は、現在の動作モードが「文字認識モード」にセットされているか否かをチェックする(ステップS1)。この場合、入力部7内のモード切替ボタン(図示せず)は、「通常の撮影モード」、「文字認識モード」、「再生モード」などを任意に切り替えるもので、「文字認識モード」は、文字情報を撮影した後、この撮影画像をメモリカード11を介して外部機器の文字認識装置に供給して文字認識処理を行わせるために、その認識対象となる文字を被写体として撮影する場合の特殊な撮影モードである。いま、「通常の撮影モード」にセットされている状態では(ステップS1でNO)、撮像部3内のバッファレジスタ29から取り込まれた画像データが画像処理用メモリ4にセットされて表示部5およびファインダ部6に表示されると共に、シャッターボタンの完全押しに応答して、そのときの撮影画像がメモリカード11などに記録保存される通常の撮影処理が実行される(ステップS2)。
先ず、CPU1は、現在の動作モードが「文字認識モード」にセットされているか否かをチェックする(ステップS1)。この場合、入力部7内のモード切替ボタン(図示せず)は、「通常の撮影モード」、「文字認識モード」、「再生モード」などを任意に切り替えるもので、「文字認識モード」は、文字情報を撮影した後、この撮影画像をメモリカード11を介して外部機器の文字認識装置に供給して文字認識処理を行わせるために、その認識対象となる文字を被写体として撮影する場合の特殊な撮影モードである。いま、「通常の撮影モード」にセットされている状態では(ステップS1でNO)、撮像部3内のバッファレジスタ29から取り込まれた画像データが画像処理用メモリ4にセットされて表示部5およびファインダ部6に表示されると共に、シャッターボタンの完全押しに応答して、そのときの撮影画像がメモリカード11などに記録保存される通常の撮影処理が実行される(ステップS2)。
また、「文字認識モード」にセットされている場合には(ステップS1でYES)、撮像部3内のバッファレジスタ29から取り込まれた画像データは、画像処理用メモリ4にセットされた後、表示部5およびファインダ部6に表示される(ステップS3)。この場合、上述した複数の記録画素数が選択候補として記憶部2に記憶されていると共に、入力部7からの選択操作に応じて当該選択候補の中から任意に選択指定された記録画素数が記憶部2に設定されている状態において、CPU1は、記憶部2から現在設定されている記録画素数を読み出し取得した後に(ステップS5)、この記録画素数に基づいて枠サイズテーブル10を検索して該当する枠サイズを読み出す(ステップS6)。
この状態において、CPU1は、画像処理用メモリ4内の画像全体を解析することによって画像内に含まれている文字を検出する(ステップS7)。この際、文字の輪郭、構成要素、それらの組み合わせなどを総合的に判断することによって文字か否かを認識しながら文字部分の特定を行うようにしている。
なお、画像内に複数の文字が含まれている場合には、たとえば、最初に出現した文字を検出特定するようにしてもよく、また、画像内の複数の文字を検出特定しながら各文字の大きさを検出し、それらの大きさを比較検討することによって最小サイズの文字を検出するようにしてもよい。
なお、画像内に複数の文字が含まれている場合には、たとえば、最初に出現した文字を検出特定するようにしてもよく、また、画像内の複数の文字を検出特定しながら各文字の大きさを検出し、それらの大きさを比較検討することによって最小サイズの文字を検出するようにしてもよい。
このようにして検出された文字を表示部5およびファインダ部6内で識別表示させる(ステップS8)。なお、文字を識別表示する際には、画像内で検出文字のみを点滅表示させるなど任意である。また、表示部5およびファインダ部6内で識別表示させたが、表示部5若しくはファインダ部6内の少なくとも一方で識別表示させるようにしてもよい。この状態において、識別表示以外の別の文字を任意に選択するために入力部7で文字選択操作が所定時間(たとえば、数秒間)以内に行われると(ステップS9でYES)、この画像内から当該選択文字を検出して識別表示させる(ステップS7、S8)。たとえば、異なる大きさの文字が複数混在している場合に、自動検出された文字に比べて小さい文字(たとえば、画像内の最小文字)を認識対象とさせるために、その文字位置が選択指定されると、識別表示は自動検出された文字から任意に選択された別の文字に移る。なお、この場合、文字選択操作は、タッチパネル付き画面(表示部5の画面)上においてタッチ操作によって行うようにしてもよく、上下左右へのカーソル移動キーのキー操作によっても行うようにしてもよい。
そして、上述の識別表示後に所定時間(たとえば、数秒間)が経過すると、ステップS10に移り、画像解析によって当該文字の大きさを特定すると共に、この文字の大きさと上述のステップS6で得られた枠サイズとを比較し、文字の大きさは、枠サイズ以上か否かを判別する(ステップS11)。ここで、文字の大きさが枠サイズ以上であってそれを正常に認識可能であることが判別された際には(ステップS11でYES)、この枠サイズに基づいてその大きさを持った矩形図形(サイズ案内枠)を生成し、このサイズ案内枠を画像処理用メモリ4内の当該文字位置に書き込んだ後(ステップS17)、この画像処理用メモリ4の内容を表示部5およびファインダ部6に表示させる(ステップS18)。これによって画像内の文字とサイズ案内枠とが重ね合って表示される。なお、表示部5およびファインダ部6内に表示させたが、表示部5若しくはファインダ部6内の少なくとも一方に表示させるようにしてもよい。
なお、撮像素子23の画素数と表示部5、ファインダ部6の画素数とが物理的な制約、コスト面などによって一致していないような場合には、撮像素子23の画素数と表示部5、ファインダ部6の画素数との比率などを考慮してサイズ案内枠の大きさを加工変更した後に、表示部5およびファインダ部6に夫々案内表示させるようにすればよい。また、この場合においても、表示部5、ファインダ部6内でサイズ案内枠を識別表示するようにしてもよい。
ここで、半押し状態のシャッターボタンが完全押しされたかをチェックし(ステップS19)、半押し状態のままであれば、最初のステップS1に戻り、「文字認識モード」から「通常撮影モード」に切り替えられたかをチェックするが、完全押しされた際には(ステップS19でYES)、それに応答して画像処理用メモリ4内の画像データ(サイズ案内枠を除く)は、画像圧縮された後にメモリカード11にファイル形式のデータとして記録保存される(ステップS20)。この際、記憶部2から現在設定されている記録画素数となるように画像処理用メモリ4内の画像データを処理した後に、メモリカード11に保存するようにしているが、記録画素数に応じた処理をどの時点で行うかは任意である。
一方、文字の大きさが枠サイズ未満であって、文字を正常に認識することが不可能な場合には(ステップS11でNO)、現在設定されているズーム倍率がその最大ズーム倍率に達したか否かを判別し(ステップS12)、最大倍率未満であれば(ステップS12でYES)、光学系駆動部24を制御して現在のズーム倍率を1段階だけアップさせる (ステップS13)。これによって撮影レンズ系(ズームレンズ系)21内の移動レンズの位置が可変制御される結果、ズーム倍率を1段階アップされた状態での撮影が可能となる。そして、ステップS3に戻り、ズーム調整後の画像データを取り込んで画像処理用メモリ4にセットした後、表示部5およびファインダ部6に表示させる(ステップS4)。
この場合、現在の記録画素数が変更されなければ、前回と同様の枠サイズが読み出され(ステップS5、S6)、また、別の文字選択が行われなければ、前回と同様の文字が識別表示された後(ステップS7〜S9)、ステップS10に移り、ズーム倍率の1段階アップによって拡大された文字の大きさを検出して枠サイズとの比較が行われる。
なお、図4においては、上述のステップS13でズーム倍率を1段階アップさせた後にステップS3に戻るようにしたが、ステップS3、S4、S7、S8に相当する処理を行った後に、ステップS10に移り、拡大された文字の大きさを検出して枠サイズとの比較を行うようにしてもよい。
なお、図4においては、上述のステップS13でズーム倍率を1段階アップさせた後にステップS3に戻るようにしたが、ステップS3、S4、S7、S8に相当する処理を行った後に、ステップS10に移り、拡大された文字の大きさを検出して枠サイズとの比較を行うようにしてもよい。
ズーム調整後の文字の大きさと枠サイズとを比較した結果(ステップS10)、ズームアップ後においても文字の大きさが枠サイズ未満であってそれを正常に認識することが不可能な場合には(ステップS11でNO)、最大ズーム倍率に達していないことを条件に(ステップS12)、さらにズームを1段階アップさせる(ステップS13)。以下、文字の大きさが認識可能なサイズとなるまで(ステップS11)あるいは最大ズーム倍率に達するまで(ステップS12)、ズーム倍率を1段階毎にアップさせながら上述の動作が繰り返される。この過程において、文字の大きさが認識可能なサイズとなった際には(ステップS11でYES)、上述の場合と同様、サイズ案内枠を画像処理用メモリ4内の当該文字位置に書き込んで重ね合わせ表示させる(ステップS17、S18)。そして、この画像処理用メモリ4内の画像データ(サイズ案内枠を除く)は、シャッターボタンの完全押しに応答してメモリカード11に記録保存される(ステップS19、S20)。
ズーム倍率が最大倍率に達しても文字の大きさが認識不可能なサイズであれば(ステップS12でYES)、現在設定されている記録画素数と最大画素数とを比較し、最大画素数であるか否かをチェックし(ステップS14)、最大画素数でなければ、現在設定されている記録画素数よりも多い次ぎの記録画素数を選択することによって記録画素数を1段階上げる処理を行う(ステップS15)。そして、ステップS3に戻り、最大ズーム倍率に固定した状態で撮影された画像データを取り込んで画像処理用メモリ4にセットした後、表示部5およびファインダ部6に表示させる(ステップS4)。次ぎに、上述のようにして選択された新たな記録画素数を取得し(ステップS5)、この記録画素数に基づいて枠サイズテーブル10を再検索することによって新たな枠サイズを読み出す(ステップS6)。
ここで、別の文字選択が行われなければ、ステップS9からステップS10に移り、最大ズーム倍率で撮影された文字の大きさと新たな枠サイズとの比較が行われる。この結果、記録画素数を1段階上げても正常認識が不可能な場合には(ステップS11でNO)、さらに、最大ズーム倍率に固定したままの状態において、記録画素数が最大画素数に達していないことを条件に(ステップS14)、現在の記録画素数を1段階上げる(ステップS15)。以下、文字の大きさが認識可能なサイズとなるまで(ステップS11)あるいは最大画素数に達するまで(ステップS14)、記録画素数を1段階上げながら上述の動作が繰り返される。
この過程において、文字の大きさが認識可能なサイズとなった際には(ステップS11でYES)、上述の場合と同様に、サイズ案内枠を画像処理用メモリ4内の当該文字位置に書き込んで重ね合わせ表示させる(ステップS17、S18)。そして、この画像処理用メモリ4内の画像データ(サイズ案内枠を除く)は、シャッターボタンの完全押しに応答してメモリカード11に記録保存される(ステップS19、S20)。また、記録画素数を最多の画素数まで上げても文字を正常認識することができない場合には(ステップS14でYES)、表示部5にメッセージ表示、つまり、被写体(文字)に近づいて撮影すべきことを示すメッセージが案内表示される(ステップS16)。
なお、図4に示したフローチャートにおいては、図面の簡素化を図るために、ズーム倍率をアップする場合のみを示し、ズーム倍率をダウンする場合を図示省略するようにしたが、文字の大きさと枠サイズに応じてズーム倍率を1段階毎にダウンする場合でも基本的には、ズーム倍率をアップする場合と同様である。ここで、上述のステップS12〜S16の内容を次ぎの内容に置き換えれば、ズーム倍率をダウンする場合でも同様に実現可能となる。
このように文字の大きさと枠サイズに応じてズーム倍率をダウンするようにしたのは、文字の大きさが枠サイズに比べて大き過ぎる場合、つまり、文字の大きさが正常認識可能な枠サイズを超えていても、枠サイズに比べて大き過ぎる場合である。このような場合には、文字の大きさが適正なサイズ、たとえば、枠サイズ以上であってその1.5倍あるいは2倍以下となるようにズーム倍率を1段階毎にダウンするようにしている。ここで、最小のズーム倍率までダウンしても文字が大き過ぎる場合には、最小ズーム倍率に固定したままの状態で記録画素数を1段階毎に下げるようにしている。
先ず、上述のステップS12では、「最大ズームに達したか否かを判別する」ようにしたが、この判断ステップを「最小ズームに達したか否かを判別する」という内容に置き換える。
また、上述のステップS13では、最大倍率未満であることを条件に「ズーム倍率を1段階アップさせる」ようにしたが、この処理ステップを最小倍率未満であることを条件に「ズーム倍率を1段階ダウンさせる」という内容に置き換える。
さらに、上述のステップS14では、「最大画素数に達したかを判別する」ようにしたが、この判断ステップを「最少の記録画素数に達したかを判別する」という内容に置き換える。
また、上述のステップS13では、最大倍率未満であることを条件に「ズーム倍率を1段階アップさせる」ようにしたが、この処理ステップを最小倍率未満であることを条件に「ズーム倍率を1段階ダウンさせる」という内容に置き換える。
さらに、上述のステップS14では、「最大画素数に達したかを判別する」ようにしたが、この判断ステップを「最少の記録画素数に達したかを判別する」という内容に置き換える。
上述のステップS15では、最大画素数未満であることを条件に「記録画素数を1段階上げる」ようにしたが、この処理ステップを「最大画素数未満であることを条件に「記録画素数を1段階下げる」という内容に置き換える。
また、上述のステップS16では、「被写体に近づべき旨のメッセージを表示する」ようにしたが、この処理ステップを「被写体から遠ざかる旨のメッセージを表示する」という内容に置き換える。なお、その他の各ステップは、図4と同様である。
また、上述のステップS16では、「被写体に近づべき旨のメッセージを表示する」ようにしたが、この処理ステップを「被写体から遠ざかる旨のメッセージを表示する」という内容に置き換える。なお、その他の各ステップは、図4と同様である。
このように上述のステップS12〜S16での判断/処理内容を上述のような判断/処理内容に置き換えることによって、文字の大きさが枠サイズに比べて大き過ぎる場合には、文字の大きさが適正サイズとなるようにズーム倍率は、1段階毎にダウンされる。さらに、最小のズーム倍率までダウンしても、文字が大き過ぎる場合には、最小ズーム倍率に固定したままの状態で記録画素数は、1段階毎に下げられる。そして、最少の記録画素数に達した際には、被写体から遠ざかる旨のメッセージ表示が行われる。
以上のように、この実施例においてCPU1は、文字を正常に認識することが可能な枠サイズを枠サイズテーブル10から読み出すと共に、画像内に含まれている文字の大きさを検出し、この文字の大きさと枠サイズとを比較し、この比較結果に基づいて撮像部3を制御してズーム倍率を変更するようにしたから、文字を撮影する際に、画像内における文字の大きさとそれを正常に認識可能なサイズとを考慮してズーム倍率を自動調整することができ、撮影者に負担をかけることなく、文字を適切な大きさで撮影することが可能となる。この場合、枠サイズテーブル10の内容は、文字認識装置Aの性能特性および撮影画像を記録保存する際の記録画素数を考慮して定められた最小サイズであるから、文字認識処理時の性能特性および記録画素数に合った枠サイズを基準として精度の良いズーム調整が可能となる。
また、文字の大きさが枠サイズに達していない場合には、枠サイズとなるまでズーム倍率をアップするようにしたから、文字を認識可能なサイズで撮影することができ、その後の認識処理時における認識不能、誤認識を事前に防止することが可能となる。逆に、文字の大きさが枠サイズに比べて大き過ぎる場合には、文字の大きさが適正なサイズとなるまでズーム倍率をダウンするようにしたから、文字を適切な大きさで撮影することができ、一回の撮影で多くの情報を得る可能となる。
ここで、最大ズーム倍率に変更しても、文字の大きさが枠サイズに達していない場合には、現在設定されている記録画素数を1段階毎に上げるように変更するようにしたから、ズーム調整が限界に達したとしても記録画素数の自動変更によって文字を認識可能なサイズで撮影することができる。逆に、最小ズーム倍率に変更しても、文字に比べて枠サイズが小さ過ぎる場合には、画像記録時にメモリ容量が無駄に消費されるため、記録画素数を減らす方向に変更することができる。この場合、静止画の記録画素数が「2560×1920」の場合と「640×480」の場合とでは、カードメモリ11への保存可能枚数が極端に相違するため、大きな文字を大きく撮影する際には、文字を正常に認識することができる範囲内において記録画素数を減らすことにより保存可能枚数を大幅に増やすことが可能となる。
一方、CPU1は、文字を正常に認識することが可能な枠サイズを枠サイズテーブル10から読み出すと共に、画像内に含まれている文字の大きさを検出し、この文字の大きさと枠サイズとを比較し、この比較結果に基づいて記録画素数を変更するようにしたから、撮影者に負担をかけることなく、記録画素数を変更することができる。すなわち、文字に比べて枠サイズが大きい場合には、それを正常に認識することが不可能となるため、記録画素数を増やす方向に変更し、逆に、文字に比べて枠サイズが小さ過ぎる場合には、画像記録時にメモリ容量が無駄に消費されるため、記録画素数を減らす方向に変更することができる。言い換えれば、文字を正常に認識することが可能か、正常に認識可能でもメモリ容量を無駄に消費しないかに応じて記録画素数を自動変更することができる。
また、画像内に含まれている複数の文字の中から任意の文字を選択指定可能としたから、画像内に大きさが異なる複数の文字などが含まれている場合に、所望する大きさの文字を任意に選択することで、その選択文字を基準としたズーム調整が可能となる。
また、画像内の文字の位置に枠サイズを重ね合わせて案内表示するようにしたから、撮影者にあっては画像内の文字が適正な大きさであるか否かを即座に判断することができる。
また、画像内の文字の位置に枠サイズを重ね合わせて案内表示するようにしたから、撮影者にあっては画像内の文字が適正な大きさであるか否かを即座に判断することができる。
なお、ズーム倍率は、1段階毎にアップ若しくはダウンされる例で説明したが、ズームの拡大率若しくは縮小率を予め多段階に任意に定めておき、これに基づいて各段階に応じたズーム倍率がアップ若しくはダウンされるようにしてもよい。
さらに、上述した実施例の説明では言及しなかったが、ズーム倍率を自動変更したり、記録画素数を自動変更した後に「文字認識モード」が解除された場合、変更後のズーム倍率、記録画素数を変更前の元のズーム倍率、記録画素数に復帰させるようにしてもよい。また、上述した実施例においては、「文字認識モード」に切り替えられた際に、ズーム倍率を自動変更したり、記録画素数を自動変更する処理を行うようにしたが、「文字認識モード」を設けなくても、画像解析によって画像内に文字が含まれているか否かを判別し、文字が含まれていることを条件に、ズーム倍率を自動変更したり、記録画素数を自動変更する処理を行うようにしてもよい。
さらに、上述した実施例の説明では言及しなかったが、ズーム倍率を自動変更したり、記録画素数を自動変更した後に「文字認識モード」が解除された場合、変更後のズーム倍率、記録画素数を変更前の元のズーム倍率、記録画素数に復帰させるようにしてもよい。また、上述した実施例においては、「文字認識モード」に切り替えられた際に、ズーム倍率を自動変更したり、記録画素数を自動変更する処理を行うようにしたが、「文字認識モード」を設けなくても、画像解析によって画像内に文字が含まれているか否かを判別し、文字が含まれていることを条件に、ズーム倍率を自動変更したり、記録画素数を自動変更する処理を行うようにしてもよい。
また、上述した実施例においては、ズーム倍率を自動変更したり、記録画素数を自動変更することによって文字の大きさが枠サイズに達した際に、画像内の文字位置にサイズ案内枠を重ね合わせて案内表示するようにしたが、ズーム倍率を自動変更する前の段階、あるいは記録画素数を自動変更する前の段階でも、サイズ案内枠を案内表示するようにしてもよい。すなわち、画像内から文字を自動検出した際あるいは任意の文字が選択指定された際に、当該文字位置にサイズ案内枠を案内表示するようにしてもよい。一方、画像内に含まれている文字(自動検出された文字あるいは任意に選択された文字)を識別表示する際には、矩形、円形、これらの半透明塗り潰しなどによって識別表示するようにしてもよい。
また、上述した実施例においては、サイズ案内枠を文字位置に重ね合わせて表示するようにしたが、これに限らず、サイズ案内枠を画像内の中央位置に表示したり、文字が含まれていない部分を検出してその部分に表示するようにしてもよく、また、画面全体を埋め尽くすように桝目状のサイズ案内を表示するようにしてもよい。さらには、サイズ案内枠は、矩形図形に限らず、円形、これらの半透明塗り潰し、縦横のグリッド線などであってもよい。
上述した実施例においては、記録画素数に基づいて枠サイズテーブル10を検索して枠サイズを読み出し取得するようにしたが、記録画素数を変数とする計算式で枠サイズを算出取得するようにしてもよい。
また、上述した実施例においては、メモリカード11に記録された画像内の文字を認識させるためには、メモリカード11を抜き出して、外部機器である文字認識装置に差し込んで接続するようにしたが、ケーブルあるいは無線通信を介して文字認識装置に転送するようにしてもよく、さらには、インターネットなどを介して遠隔転送するようにしてもよい。
また、上述した実施例においては、メモリカード11に記録された画像内の文字を認識させるためには、メモリカード11を抜き出して、外部機器である文字認識装置に差し込んで接続するようにしたが、ケーブルあるいは無線通信を介して文字認識装置に転送するようにしてもよく、さらには、インターネットなどを介して遠隔転送するようにしてもよい。
また、画像撮影装置に文字認識機能を内蔵するようにしてもよい。この場合、撮影動作に連動させて文字認識処理を実行するようにしたり、必要に応じて文字認識機能を作動させるようにしてもよい。さらに、画像撮影装置は、携帯型に限らず、据え置き型のカメラであってもよく、カメラ付きの携帯電話などの携帯端末装置であってもよい。
その他、上述した実施例においては、文字情報を撮影するようにしたが、撮影対象(認識対象)は、文字情報に限らず、図形、コードであってもよい。すなわち、会議などで黒板、ホワイトボードに手書きされた文字情報、印刷された文字情報、表示画面内の文字情報を撮影して認識する場合に限らず、各種の図形を撮影して認識する場合、バーコード、2次元コードなどのコード情報を撮影して認識する場合、電話番号、メールアドレス、URLなどを撮影して認識する場合であってもよい。
一方、コンピュータに対して、上述した各手段を実行させるためのプログラムコードをそれぞれ記録した記録媒体(たとえば、CD−ROM、フレキシブルディスク、RAMカード等)を提供するようにしてもよい。すなわち、コンピュータが読み取り可能なプログラムコードを有する記録媒体であって、文字、コードなどを正常に認識することが可能なサイズ情報を取得する機能と、画像内に含まれている文字、コードなどの被認識データの大きさを検出する機能と、検出された被認識データの大きさと前記正常認識可能なサイズ情報とを比較し、この比較結果に基づいてズーム倍率を変更する機能とを実現させるためのプログラムを記録したコンピュータが読み取り可能な記録媒体を提供するようにしてもよい。
また、コンピュータが読み取り可能なプログラムコードを有する記録媒体であって、文字、コードなどを正常に認識することが可能なサイズ情報を取得する機能と、画像内に含まれている文字、コードなどの被認識データの大きさを検出する機能と、検出された被認識データの大きさと前記取得したサイズ情報とを比較し、撮影画像を記録保存する際の記録画素数を当該比較結果に基づいて変更する機能とを実現させるためのプログラムを記録したコンピュータが読み取り可能な記録媒体を提供するようにしてもよい。
1 CPU
2 記憶部
3 撮像部
4 画像処理用メモリ
5 表示部
6 ファインダ部
7 入力部
8 メモリカードI/F
10 枠サイズテーブル
11 メモリカード
21 撮影レンズ系
23 撮像素子
24 光学系駆動部
25 センサ部
2 記憶部
3 撮像部
4 画像処理用メモリ
5 表示部
6 ファインダ部
7 入力部
8 メモリカードI/F
10 枠サイズテーブル
11 メモリカード
21 撮影レンズ系
23 撮像素子
24 光学系駆動部
25 センサ部
Claims (11)
- 文字認識あるいはコード認識などを行わせるためにその認識対象となる文字、コードなどを被写体として撮影する画像撮影装置であって、
文字、コードなどを正常に認識することが可能なサイズ情報を取得する取得手段と、
画像内に含まれている文字、コードなどの被認識データの大きさを検出する検出手段と、
この検出手段によって検出された被認識データの大きさと前記取得手段によって得られたサイズ情報とを比較し、この比較結果に基づいてズーム倍率を変更するズーム変更手段と、
を具備したことを特徴とする画像撮影装置。 - 前記文字、コードなどを正常認識可能なサイズ情報は、文字認識処理時の性能特性および撮影画像を記録保存する際の記録画素数を考慮して定められた最小サイズであり、
前記取得手段は、予め用意されている複数の記録画素数の中から任意の画素数が選択設定されている状態において、現在設定されている記録画素数との相関関係に応じた大きさのサイズ情報を取得する、
ようにしたことを特徴とする請求項1記載の画像撮影装置。 - 前記ズーム変更手段は、文字、コードなどの被認識データの大きさがそれを正常に認識することが可能なサイズに達していない場合には、当該被認識データの大きさが認識可能なサイズとなるまでズーム倍率をアップする、
ようにしたことを特徴とする請求項1記載の画像撮影装置。 - 前記ズーム変更手段は、文字、コードなどの被認識データの大きさがそれを正常に認識することが可能なサイズに比べて大き過ぎる場合には、当該被認識データの大きさが認識可能なサイズに近づくようになるまでズーム倍率をダウンする、
ようにしたことを特徴とする請求項1記載の画像撮影装置。 - 前記ズーム変更手段によって最大ズーム倍率に変更しても、文字、コードなどの被認識データの大きさがそれを正常に認識することが可能なサイズに達していない場合には、現在設定されている記録画素数を高める方向に段階的に変更する画素数変更手段を設けたことを特徴とする請求項1記載の画像撮影装置。
- 前記ズーム変更手段によって最小ズーム倍率に変更しても、文字、コードなどの被認識データの大きさがそれを正常に認識することが可能なサイズに比べて大き過ぎる場合には、現在設定されている記録画素数を低める方向に段階的に変更する画素数変更手段を設けたことを特徴とする請求項1記載の画像撮影装置。
- 文字認識あるいはコード認識などを行わせるためにその認識対象となる文字、コードなどを被写体として撮影する画像撮影装置であって、
文字、コードなどを正常に認識することが可能なサイズ情報を取得する取得手段と、
画像内に含まれている文字、コードなどの被認識データの大きさを検出する検出手段と、
この検出手段によって検出された被認識データの大きさと前記取得手段によって得られたサイズ情報とを比較し、撮影画像を記録保存する際の記録画素数を当該比較結果に基づいて変更する記録画素数変更手段と、
を具備したことを特徴とする画像撮影装置。 - 画像内に含まれている複数の文字、コードなどの被認識データの中から任意の被認識データを選択指定する選択手段を設け、
前記検出手段は、前記選択手段によって選択指定された被認識データの大きさを検出する、
ようにしたことを特徴とする請求項1あるいは請求項7記載の画像撮影装置。 - 前記検出手段によって検出された被認識データの位置に前記取得手段によって得られたサイズ情報を重ね合わせて案内表示する表示制御手段を設けたことを特徴とする請求項1あるいは請求項7記載の画像撮影装置。
- コンピュータに対して、
文字、コードなどを正常に認識することが可能なサイズ情報を取得する機能と、
画像内に含まれている文字、コードなどの被認識データの大きさを検出する機能と、
検出された被認識データの大きさと前記正常認識可能なサイズ情報とを比較し、この比較結果に基づいてズーム倍率を変更する機能と、
を実現させるためのプログラム。 - コンピュータに対して、
文字、コードなどを正常に認識することが可能なサイズ情報を取得する機能と、
画像内に含まれている文字、コードなどの被認識データの大きさを検出する機能と、
検出された被認識データの大きさと前記取得したサイズ情報とを比較し、撮影画像を記録保存する際の記録画素数を当該比較結果に基づいて変更する機能と、
を実現させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004276395A JP2006094082A (ja) | 2004-09-24 | 2004-09-24 | 画像撮影装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004276395A JP2006094082A (ja) | 2004-09-24 | 2004-09-24 | 画像撮影装置およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006094082A true JP2006094082A (ja) | 2006-04-06 |
Family
ID=36234628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004276395A Pending JP2006094082A (ja) | 2004-09-24 | 2004-09-24 | 画像撮影装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006094082A (ja) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008227990A (ja) * | 2007-03-14 | 2008-09-25 | Casio Comput Co Ltd | 撮像装置及び撮像装置制御プログラム |
JP2010147723A (ja) * | 2008-12-17 | 2010-07-01 | Canon Inc | 画像処理装置及びその制御方法 |
JP2010278916A (ja) * | 2009-05-29 | 2010-12-09 | Canon Inc | 情報処理装置、撮像装置及び制御方法 |
WO2010143662A1 (ja) * | 2009-06-12 | 2010-12-16 | 株式会社オプトエレクトロニクス | 光学的情報読取装置 |
JP2011524584A (ja) * | 2008-06-16 | 2011-09-01 | オプテレック ディベロップメント ベー.フェー. | 物体のテキストベースの画像を自動的に拡大する方法および装置 |
JP2011197758A (ja) * | 2010-03-17 | 2011-10-06 | Seiko Epson Corp | 情報認識システム及びその制御方法 |
CN102592178A (zh) * | 2010-12-07 | 2012-07-18 | 卡西欧计算机株式会社 | 信息显示系统、信息显示装置、信息提供装置以及存储介质 |
WO2013147303A1 (ja) * | 2012-03-30 | 2013-10-03 | Necカシオモバイルコミュニケーションズ株式会社 | 撮像装置、撮像方法、およびプログラムを記録した記録媒体 |
US8553083B2 (en) | 2008-12-05 | 2013-10-08 | Samsung Electronics Co., Ltd | Apparatus and method for automatically adjusting camera |
US8836959B2 (en) | 2009-02-18 | 2014-09-16 | Samsung Electronics Co., Ltd | Method and apparatus for recognizing characters |
JP2015090500A (ja) * | 2013-11-05 | 2015-05-11 | 株式会社リコー | 画像認識装置、画像認識プログラム、画像認識方法、撮像装置 |
US9201498B2 (en) | 2010-12-07 | 2015-12-01 | Casio Computer Co., Ltd. | Information display system, information display apparatus and non-transitory storage medium |
CN111028558A (zh) * | 2019-05-10 | 2020-04-17 | 广东小天才科技有限公司 | 一种听写检测方法及电子设备 |
CN111970437A (zh) * | 2020-08-03 | 2020-11-20 | 广东小天才科技有限公司 | 文本拍摄方法、可穿戴设备和存储介质 |
CN113255390A (zh) * | 2021-04-16 | 2021-08-13 | 摩拜(北京)信息技术有限公司 | 扫码方法、电子设备和存储介质 |
CN113630546A (zh) * | 2020-05-09 | 2021-11-09 | 阿里巴巴集团控股有限公司 | 图像处理方法、设备和系统 |
-
2004
- 2004-09-24 JP JP2004276395A patent/JP2006094082A/ja active Pending
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008227990A (ja) * | 2007-03-14 | 2008-09-25 | Casio Comput Co Ltd | 撮像装置及び撮像装置制御プログラム |
JP2011524584A (ja) * | 2008-06-16 | 2011-09-01 | オプテレック ディベロップメント ベー.フェー. | 物体のテキストベースの画像を自動的に拡大する方法および装置 |
US8553083B2 (en) | 2008-12-05 | 2013-10-08 | Samsung Electronics Co., Ltd | Apparatus and method for automatically adjusting camera |
US10079978B2 (en) | 2008-12-05 | 2018-09-18 | Samsung Electronics Co., Ltd | Apparatus and method for automatically adjusting size of characters using camera |
JP2010147723A (ja) * | 2008-12-17 | 2010-07-01 | Canon Inc | 画像処理装置及びその制御方法 |
US8836959B2 (en) | 2009-02-18 | 2014-09-16 | Samsung Electronics Co., Ltd | Method and apparatus for recognizing characters |
JP2010278916A (ja) * | 2009-05-29 | 2010-12-09 | Canon Inc | 情報処理装置、撮像装置及び制御方法 |
WO2010143662A1 (ja) * | 2009-06-12 | 2010-12-16 | 株式会社オプトエレクトロニクス | 光学的情報読取装置 |
JP2010286740A (ja) * | 2009-06-12 | 2010-12-24 | Optoelectronics Co Ltd | 光学的情報読取装置 |
JP2011197758A (ja) * | 2010-03-17 | 2011-10-06 | Seiko Epson Corp | 情報認識システム及びその制御方法 |
US9201498B2 (en) | 2010-12-07 | 2015-12-01 | Casio Computer Co., Ltd. | Information display system, information display apparatus and non-transitory storage medium |
CN102592178A (zh) * | 2010-12-07 | 2012-07-18 | 卡西欧计算机株式会社 | 信息显示系统、信息显示装置、信息提供装置以及存储介质 |
KR101313922B1 (ko) | 2010-12-07 | 2013-10-01 | 가시오게산키 가부시키가이샤 | 정보 표시 시스템, 정보 표시 장치, 정보 제공 장치 및, 기억 매체 |
US9058686B2 (en) | 2010-12-07 | 2015-06-16 | Casio Computer Co., Ltd. | Information display system, information display apparatus, information provision apparatus and non-transitory storage medium |
WO2013147303A1 (ja) * | 2012-03-30 | 2013-10-03 | Necカシオモバイルコミュニケーションズ株式会社 | 撮像装置、撮像方法、およびプログラムを記録した記録媒体 |
JP2015090500A (ja) * | 2013-11-05 | 2015-05-11 | 株式会社リコー | 画像認識装置、画像認識プログラム、画像認識方法、撮像装置 |
CN111028558A (zh) * | 2019-05-10 | 2020-04-17 | 广东小天才科技有限公司 | 一种听写检测方法及电子设备 |
CN113630546A (zh) * | 2020-05-09 | 2021-11-09 | 阿里巴巴集团控股有限公司 | 图像处理方法、设备和系统 |
CN111970437A (zh) * | 2020-08-03 | 2020-11-20 | 广东小天才科技有限公司 | 文本拍摄方法、可穿戴设备和存储介质 |
CN111970437B (zh) * | 2020-08-03 | 2022-08-09 | 广东小天才科技有限公司 | 文本拍摄方法、可穿戴设备和存储介质 |
CN113255390A (zh) * | 2021-04-16 | 2021-08-13 | 摩拜(北京)信息技术有限公司 | 扫码方法、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8823864B2 (en) | Image capturing apparatus and associated methodology for auto-focus and facial detection | |
JP4450783B2 (ja) | 撮影装置 | |
US8582891B2 (en) | Method and apparatus for guiding user with suitable composition, and digital photographing apparatus | |
JP2006094082A (ja) | 画像撮影装置およびプログラム | |
US8237802B2 (en) | Method and apparatus for determining shaken image by using auto focusing | |
JP2007049484A (ja) | デジタルカメラ | |
JP2013183306A (ja) | 撮像装置、撮像方法、及びプログラム | |
EP2200275B1 (en) | Method and apparatus of displaying portrait on a display | |
JP2005323015A (ja) | デジタルカメラ | |
US9691362B2 (en) | Display control apparatus, display control method, and recording medium displaying frames indicating portions of an image | |
JP2007265149A (ja) | 画像処理装置、画像処理方法および撮像装置 | |
KR100816949B1 (ko) | 최적상태 촬상 전자카메라 | |
US20130167089A1 (en) | Electronic device | |
JP4371219B2 (ja) | デジタルカメラ | |
JP4941747B2 (ja) | 携帯端末装置及びプログラム | |
JP2008028890A (ja) | 撮像装置、撮像方法及び撮像プログラム | |
JP4404200B2 (ja) | 撮像装置、および、画像ファイル生成プログラム | |
JP4098889B2 (ja) | 電子カメラおよびその動作制御方法 | |
JP6252632B2 (ja) | 撮像装置及びプログラム | |
JP5380833B2 (ja) | 撮像装置、被写体検出方法及びプログラム | |
JP2007228233A (ja) | 撮影装置 | |
JP2005055973A (ja) | 携帯情報端末 | |
JP2006237963A (ja) | 画像表示装置、撮影装置及び画像表示方法 | |
JP2006270488A (ja) | 撮像装置、及び、画像処理方法 | |
JP2011107856A (ja) | 表示装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060210 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060314 |