JP2009077325A - カメラ装置及びカメラ制御プログラム - Google Patents

カメラ装置及びカメラ制御プログラム Download PDF

Info

Publication number
JP2009077325A
JP2009077325A JP2007246503A JP2007246503A JP2009077325A JP 2009077325 A JP2009077325 A JP 2009077325A JP 2007246503 A JP2007246503 A JP 2007246503A JP 2007246503 A JP2007246503 A JP 2007246503A JP 2009077325 A JP2009077325 A JP 2009077325A
Authority
JP
Japan
Prior art keywords
voice
control
physical
information
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007246503A
Other languages
English (en)
Inventor
Takayuki Fukushima
孝幸 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2007246503A priority Critical patent/JP2009077325A/ja
Publication of JP2009077325A publication Critical patent/JP2009077325A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Details Of Cameras Including Film Mechanisms (AREA)
  • Indication In Cameras, And Counting Of Exposures (AREA)
  • Studio Devices (AREA)
  • Exposure Control For Cameras (AREA)

Abstract

【課題】音声が有する情報を有効に利用して制御を行うことのできるカメラ装置及びカメラ制御プログラムを提供する。
【解決手段】認識した音声の音量を測定し(ステップS9)、この測定した音量がパラメータ設定テーブルに記憶されている上限音量(80)以上であるか否か(ステップS10)、下限音量(20)未満であるか否か(ステップS12)を判断する。この判断結果に応じて、音量のレベル1〜3に対応する制御値でズーム倍率や連写速度を制御する(ステップS11、S13、S14)。
【選択図】図5

Description

本発明は、音声に応答する機能を備えたカメラ装置、及びこのカメラ装置に用いられる制御プログラムに関する。
従来、音声に応答する機能を備えたカメラ装置が下記特許文献1等に記載されている。このカメラ装置は、予め登録されたキーワードと音声入力された音声による言語とを比較し、両者が一致した場合は所定の機能を動作させるものである。
特開2000−235216号公報
ところで、音声にはキーワード以外にも、感情の変化、あるいは会話の流れ(話の内容)等、多くの情報が含まれている。しかるに、従来においては、音声に含まれている一つの情報にすぎない言語(キーワード)のみを利用するものであって、音声に含まれている他の情報を活用することが課題となっていた。
本発明は、かかる従来の課題に鑑みてなされたものであり、音声が有する情報を有効に利用して制御を行うことのできるカメラ装置及びカメラ制御プログラムを提供することを目的とする。
前記課題を解決するため請求項1記載の発明に係るカメラ装置にあっては、音声を取得する取得手段と、音声に含まれている情報であって、物理量として検出可能な情報である物理的音声情報を前記取得手段により取得された音声から検出する検出手段と、この検出手段により検出された前記物理的音声情報に基づき、当該カメラ装置が有する所定の機能を制御する制御手段とを備えることを特徴とする。
また、請求項2記載の発明に係るカメラ装置にあっては、前記検出手段は、前記物理的音声情報として、音量を前記音声から検出することを特徴とする。
また、請求項3記載の発明に係るカメラ装置にあっては、前記検出手段は、前記物理的音声情報として、話速を、前記音声から検出することを特徴とする。
また、請求項4記載の発明に係るカメラ装置にあっては、前記話速とは、音声における隣接する単音間の時間的短さに対応する速さであることを特徴とする。
また、請求項5記載の発明に係るカメラ装置にあっては、前記所定の機能とは、前記物理量の変化に応じて段階的に制御される機能であることを特徴とする。
また、請求項6記載の発明に係るカメラ装置にあっては、前記所定の機能は、当該カメラ装置が有する撮影手段を連続的に動作させる連写撮影における連写速度であることを特徴とする。
また、請求項7記載の発明に係るカメラ装置にあっては、前記連写撮影とは、動画の撮影であることを特徴とする。
また、請求項8記載の発明に係るカメラ装置にあっては、前記所定の機能は、当該カメラ装置が有するズームレンズを駆動するズーム機能であることを特徴とする。
また、請求項9記載の発明に係るカメラ装置にあっては、前記検出手段により検出される前記物理的音声情報が示す物理量に対応して、前記所定機能の制御に用いられる制御値を記憶した制御情報記憶手段を備え、前記制御手段は、前記制御情報記憶手段から前記検出手段により検出された物理的音声情報が示す物理量に対応する制御値を読み出して、前記所定の機能を制御することを特徴とする。
また、請求項10記載の発明に係るカメラ装置にあっては、前記制御情報記憶手段は、前記物理的音声情報が示す同一の物理量に対応して複数の異なる制御値を記憶し、前記制御手段は、前記制御情報記憶手段から前記検出手段により検出された物理的音声情報が示す物理量に対応する複数の制御値のいずれかを選択的に読み出すことを特徴とする。
また、請求項11記載の発明に係るカメラ装置にあっては、キーワードを記憶する認識情報記憶手段と、この認識情報記憶手段に記憶されたキーワードと前記音声検出手段により検出された音声との一致性を認識する認識手段とを備え、前記検出手段は、前記認識手段により前記キーワードと前記音声との一致性が認識された場合に、前記物理的音声情報を検出することを特徴とする。
また、請求項12記載の発明に係るカメラ装置にあっては、前記認識情報記憶手段は、人物を示す人物情報と前記キーワードとを対応して記憶し、前記認識手段は、前記認識情報記憶手段に記憶された人物情報及びキーワードと前記音声検出手段により検出された音声との一致性を認識し、前記検出手段は、前記認識手段により前記人物情報及びキーワードと前記音声との一致性が認識された場合に、前記物理的音声情報を検出することを特徴とする。
また、請求項13記載の発明に係るカメラ装置にあっては、前記認識情報記憶手段は、一つの音節からなる単音を前記キーワードとして記憶することを特徴とする。
また、請求項14記載の発明に係るカメラ装置にあっては、前記認識情報記憶手段は、前記キーワードと前記検出手段により検出される前記物理的音声情報が示す物理量とに対応して、前記所定機能の制御に用いられる制御値を記憶し、前記制御手段は、前記認識手段により前記キーワードと前記音声との一致性が認識された場合に、前記制御情報記憶手段から前記キーワードと前記検出手段により検出された物理的音声情報が示す物理量とに対応する制御値を読み出して、前記所定の機能を制御することを特徴とする。
また、請求項15記載の発明に係るカメラ装置にあっては、前記認識情報記憶手段は、前記人物情報及びキーワードと前記検出手段により検出される前記物理的音声情報が示す物理量とに対応して、前記所定機能の制御に用いられる制御値を記憶し、前記制御手段は、前記認識手段により前記人物情報及びキーワードと前記音声との一致性が認識された場合に、前記認識情報記憶手段から前記前記人物情報及びキーワードと前記検出手段により検出された物理的音声情報が示す物理量とに対応する制御値を読み出して、前記所定の機能を制御することを特徴とする。
また、請求項16記載の発明に係るカメラ装置にあっては、前記認識情報記憶手段は、前記物理的音声情報が示す同一の物理量に対応して複数の異なる制御値を記憶し、前記制御手段は、前記認識情報記憶手段から前記検出手段により検出された物理的音声情報が示す物理量に対応する複数の制御値のいずれかを選択的に読み出すことを特徴とする。
また、請求項17記載の発明に係るカメラ装置にあっては、前記認識情報記憶手段は、複数のキーワードを記憶するとともに、前記複数の異なる制御値を異なるキーワード毎に記憶し、前記制御手段は、前記認識手段により認識されたキーワードに対応し、かつ前記検出手段により検出された物理的音声情報が示す物理量に対応する制御値を読み出すことを特徴とする。
また、請求項18記載の発明に係るカメラ装置にあっては、被写体を撮像するさ撮像手段と、前記撮影手段により連続的に撮影された複数の画像を記録するとともに、前記検出手段により検出された音声を連続的に記録する第1の記録手段と、第2の記録手段とを備え、前記検出手段は、前記物理的音声情報として音量を前記第1の記録手段に記録されている音声から検出し、前記制御手段は、前記検出手段により検出された音量に応じて、前記第1の記録手段に記録されている複数の画像を間引き処理し、この間引き処理した後の複数の画像を前記第2の記録手段に記録することを特徴とする。
また、請求項19記載の発明に係るカメラ装置にあっては、前記取得手段、検出手段、制御手段のいずれか少なくとも一つの手段の動作をオン・オフする操作手段を備えることを特徴とする。
また、請求項20記載の発明に係るカメラ装置にあっては、前記検出手段は、更に前記物理的音声情報として、前記音量に加えて話速を、前記音声から検出することを特徴とする。
また、請求項21記載の発明に係るカメラ装置にあっては、前記所定の機能とは、物理量である音量と話速それぞれの変化に応じて段階的に制御される機能であり、この所定の機能は、前記音量の変化に応じて制御される第1の機能と、前記話速の変化に応じて制御される第2の機能と、を有することを特徴とする。
また、請求項22記載の発明に係るカメラ装置制御プログラムにあっては、音声を取得する取得手段を備えるカメラ装置が有するコンピュータを、音声に含まれている情報であって、物理量として検出可能な情報である物理的音声情報を前記取得手段により取得された音声から検出する検出手段と、この検出手段により検出された前記物理的音声情報に基づき、当該カメラ装置が有する所定の機能を制御する制御手段として機能させることを特徴とする。
本発明によれば、音声が有する情報を有効に利用してカメラ装置が備える諸機能を制御することができる。
以下、本発明の一実施の形態を図にしたがって説明する。図1は本発明に係るデジタルカメラの電気的な概略構成を示すブロック図である。
このデジタルカメラは、キー入力部1、合焦・ズーム部2、露光部3、画像入力部4、画像圧縮部5、画像記憶部6、画像表示部7、マイク8、音声入力部9、A/D変換部(A/D)10、ワークメモリ11、音声認識部12、プログラムメモリ13を備えている。そして、制御部14が、プログラムメモリ13に記憶されたプログラムに基づき動作することにより、各部の駆動されあるいは制御される構成である。
前記キー入力部1は、電源キーやシャッタキー、撮影/再生モードのモード切替キーや、各種機能の設定に使用される操作キー、ユーザがデジタルカメラの操作に使用する各種のキー、及び音声機能をオン・オフさせるための音声機能キー、文字入力キー等で構成され、各キーの操作は制御部14により検出される。前記合焦・ズーム部2には、撮影モードにおいて、図示しない光学系におけるフォーカスレンズを被写体距離に応じた位置に駆動するフォーカス・モータやその駆動回路、及びズームレンズを駆動するズーム・モータやその駆動回路が含まれる。
前記露光部3には、前記光学系により結像された被写体像を撮像するCCD等の撮像素子と、その駆動回路、撮像素子から出力されるアナログの撮像信号をデジタル信号に変換するA/D変換器等を含みデジタルの撮像信号を出力する。前記画像入力部4は、デジタルに変換された撮像信号に種々の信号処理を施すための各種の信号処理回路により構成される。前記画像圧縮部5は、画像入力部4で処理された後の画像データを圧縮し、また圧縮状態の画像データを伸張する回路により構成される。前記画像記憶部6は圧縮された画像データを記憶する各種メモリカード等により構成される。前記画像表示部7は、液晶表示器や、その駆動回路等から構成され、画像入力部4で信号処理された被写体画像や、画像記憶部6から読み出された記録画像を液晶表示器に表示させる。
前記音声入力部9は、マイク8から入力した音声を増幅するアンプや他の音声処理回路から構成され、処理後の音声信号を出力する。A/D変換部10は音声入力部9から出力されるアナログの音声信号をデジタル信号に変換する。ワークメモリ11は、変換後の音声信号(音声データ)を逐次記憶したり、制御部14が各部の制御に際して生成したり使用する各種のデータ等を随時記憶するRAMである。
前記音声認識部12は、前記音声機能キーがオンとなっている場合において、ワークメモリ11に逐次記憶される入力音声に対し、後述するパラメータ設定テーブルに記憶されているデータに基づき、人物を特定するとともに、音量及び話速を検出する。ここで、話速とは例えば、単音声(音節)から次の単音声(音節)までの時間間隔であり、この時間間隔が少ない程、話速が高い(速い)と判定することが出来る。また、話速の検出は、特開平05-289691や特開2005-331589に記載されたような方法で、またはそれらのいくつかを組み合わせた方法で、検出するようにしても構わない。
ちなみに、物理量とは、質量、長さ、体積、圧力、時間などのような、物体や物質(場やエネルギーも含む)などの測定対象に固有な、客観的に測定できる量、およびその量を用いて算出できる量のことであるが、上記した音量や話速や時間間隔は物理量の内の1つであるといえる。
制御部14は、主としてCPUや入出力インターフェイスを含む周辺回路から構成されている。前記プログラムメモリ13はフラッシュメモリ等の不揮発性のメモリであり、音声認識部12が音声認識に際して使用する前述したパラメータ設定テーブルやその他のテーブル、上記各部を制御するための各種のプログラム、例えばAE(自動露出)、AF(自動焦点調整)等の制御プログラム等が格納されている。
図2は、前記プログラムメモリ13に記憶されている初期設定テーブル131の構成を示す概念図である。この初期設定テーブル131には、モード「1」〜「4」に対応して「設定A」の種別と、「設定B」の種別とが記憶されている。「1」〜「4」は、キー入力部1での操作によりユーザによって予め選択されるモードである。また、「設定A」、「設定B」は、各モードに制御対象となる当該デジタルカメラの設定であり、本実施の形態においては、「ズーム」又は「連写」である。
図3は、前記プログラムメモリ13に記憶されているパラメータ設定テーブル132のの構成を示す概念図である。このパラメータ設定テーブル132には、「おとうさん」、「おかあさん」等の「人物」を示すデータに対応して「キーワード」が記憶されているとともに、各「キーワード」に対応して「変化レベル」、「検出値」、及び「制御値」が記憶されている。
「人物」は、登録モードにおいてキー入力部1に設けられている文字入力キーを操作することにより、ユーザが入力した文字であり、「キーワード」は、文字入力直後にマイク8を介して入力した当該人物の音声データである。したがって、図3の状態は、人物「おとうさん」及び「おかあさん」が当該文字を入力した後、異なるキーワードである「え」、「あ」を音声入力した場合を示している。
なお、本明細書において「キーワード」における「ワード」とは、その本来の意味である言葉、単語のみならず、「え」、「あ」等の一音節からなる単音をも含むものとする。
また、前記各「キーワード」に対応する「変化レベル」は、「3」「2」「1」のレベル値であり、これら「変化レベル3」、「変化レベル2」、「変化レベル1」に対応して、各々「検出値(音量又は話速)」と「制御値」とが記憶されている。「検出値(音量又は話速)」は、「80以上」、「中間」、「20未満」のいずれかであって、「0〜100」の相対値で示される値であり、変化レベル値が高い程、高い値である。
「制御値」は、本実施の形態においては、変化レベル3〜1に対応する「+2、+1、−2」からなる第1の組合せ133と、「+1、+0.5、−1」からなる第2の組合せ134の二つのパターンを用いている。この両組合せ133「+2、+1、−2」、第2の組合せ134「+1、+0.5、−1」において、第1の組合せ133の方が各値が大きいことから、同一の変化レベル3〜1であっても、第1の組合せ133の場合の方が、大きな「制御値」となる。
「制御値」である「+2、+1、−2」、「+1、+0.5、−1」における各数値は相対値又は絶対値であり、現在の設定値を変化させる値である。そして、連写に関しては、「+」の値により連写速度を高める(連写間隔を小さくする)ことを意味し、「−」の値により連写速度を低める(連写間隔を大きくする)ことを意味する。また、ズームに関しては「+」の値によりズームアップ(ズームイン:ズーム倍率を上げる)ことを意味し、「−」の値によりズームダウン(ズームアウト:ズーム倍率を下げる)ことを意味する。
次に、以上の構成からなるデジタルカメラの本発明に係る動作を説明する。図4及び図5は、音声機能がオン設定されている状態における撮影モード時の処理手順を示す一連のフローチャートである。したがって、音声機能がオフ設定されている場合には、一般的なデジタルカメラと同様に、操作に応じて単写(静止画撮影)、あるいは連写(動画撮影)を行うことができる。
音声機能がオン設定されている状態において、シャッタキーが全押しされると、制御部14はは前記プログラムに基づき、このフローチャートに示す処理を実行する。すなわち、各種パラメータ初期設定、及びモード1〜4設定を実行する(ステップS1)。このステップS1における各種パラメータ初期設定では、事前に設定された絞り値、シャッタスピード、ズーム値や連写間隔を設定するとともに、この設定に応じた各部の制御を実行する。また、モード1〜4設定では、ユーザにより選択されたモード1〜4に応じた設定Aの種別と設定Bの種別とをワークメモリ11に記憶する。
したがって、図2の初期設定テーブル131に示すように、モード「2」が選択されたとすると、設定Aとして「ズーム」が、設定Bとして「連写」がワークメモリ11に記憶されることとなる。
引き続き、連写間隔を計時するタイマTをリセットして初期値「0」を設定する(ステップS2)。また、録音を開始してマイク8から入力された音声をワークメモリ11に記憶する(ステップS3)。さらに、音声認識部12を制御して、人物の音声、つまり周囲騒音等を除く人の音声を認識し(ステップS4)、この認識した音声がパラメータ設定テーブル132に記憶されている所定の人物であるか否かを判断する(ステップS5)。
そして、所定の人物でない場合には、ステップS5から図5のステップS21に進み、タイマTの値が前記ステップS1で初期設定した連写間隔Xを超えたか否かを判断する(ステップS21)。タイマTの値が連写間隔Xを超えていない場合には、T>Xとなるまで、タイマTの値をインクリメントして(ステップS22)、ステップS21→S22→S21のループを繰り返す。これにより、T>Xとなって連写間隔Xとなったならば、撮影処理を実行し、露光部3から撮り込んだ1枚分の画像データをワークメモリ11に記録する(ステップS23)。引き続き、シャッタキーの全押しが解除されたか否かを判断し(ステップS24)、全押しが解除されていない場合には、図4のステップS2に戻る。
したがって、シャッタキーが全押しされた後、所定人物の音声が認識されるまでは、全押しが解除されない限り、ステップS2〜S5→S21〜S24→S2のループ(以下、「ループ1」という)が繰り返される。したがって、このループ1が繰り返されている状態においては、後述するような連写速度の可変制御やズームの可変制御はない。よって、ステップS1で初期設定された一定の連写間隔Xであって、現在のズーム状態で撮影された画像データが順次ワークメモリ11に記憶されることとなる。
しかし、ステップS5の判断がYESであって、認識した音声がパラメータ設定テーブル132に記憶されている所定の人物である場合には、ステップS5からステップS6に進み、キーワード音声認識を実行する(ステップS6)。そして、この認識したキーワードがパラメータ設定テーブル132に記憶されている前記ステップS5で判断した所定の人物に対応する所定のキーワードであるか否かを判断する(ステップS7)。
所定の人物における所定のキーワードでない場合には、このステップS7から前述した図5のステップS21に進み、前述したステップS21以降の処理を実行する。したがって、シャッタキーが全押しされた後、所定人物の音声が認識されても、それが予め登録されたキーワードでなければ、全押しが解除されない限り、ステップS2〜S7→S21〜S24→S2のループ(以下、「ループ2」という)が繰り返される。したがって、このループ2が繰り返されている状態においては、前記ループ1の場合と同様に、後述するような連写速度の可変制御やズームの可変制御はない。
よって、登録者以外の他人の音声で誤作動することもなく、ステップS1で初期設定された一定の連写間隔Xであって、現在のズーム状態で撮影された画像データが順次ワークメモリ11に記憶することができる。
しかし、ステップS7の判断がYESであって、認識したキーワードが所定の人物に対応する所定のキーワードである場合には、ステップS7からステップS8に進み、選択モードに応じたパラメータを読み出す。つまり、前述のように、モード「2」が選択されているとすると、設定Aとして「ズーム」が、設定Bとして「連写」がワークメモリ11に記憶されていることから、設定Aの「ズーム」に対応する現在のズーム値と、設定Bの「連写」に対応する現在の連写間隔(連写間隔X)とを読み出す。
引き続き、音量測定を実行して、前記ステップS4及びステップS6で認識に用いた音声の音量を測定する(ステップS9)。そして、この測定した音量がパラメータ設定テーブル132に記憶されている上限音量(80)以上であるか否かを判断する(ステップS10)。上限音量(80)以上である場合には、設定Aを変化レベル3に対応する制御値で制御する(ステップS11)。
したがって、前記ステップS5で人物が「おとうさん」と判断され、ステップS7でキーワードが「え」と判断されたとすると、レベル3に対応する制御値は「+2」であることから、先ず制御値「+2」が決定される。また、モード「2」が選択されていたとすると、設定Aは「ズーム」であることから、ズームが「+2」に相当するズーム量でズームアップされる。
しかし、前記ステップS5で人物が「おとうさん」と判断されても、ステップS7でキーワードが「あ」と判断された場合は、レベル3に対応する制御値は「+1」であることから、先ず制御値「+1」が決定される。また、モード「2」が選択されていたとすると、設定Aは「ズーム」であることから、ズームが「+1」に相当するズーム量でズームアップされる。
したがって、同一人物が同一の音量で発声した場合であっても、それが「え」である場合には「あ」である場合よりも、ズーム変化量を大きくすることができ、逆に「あ」である場合には「え」である場合よりも、ズーム変化量を小さくすることができる。
よって、同一人物が同一の音量で発声した場合であっても、キーワードに応じて異なる変化量でズームアップ制御することができる。
また、ステップS10の判断がNOであって、測定音量が上限音量(80)未満である場合には、ステップS10からステップS12に進み、測定音量が下限音量(20)未満であるか否かを判断する。このステップS12の判断がNOである場合には、測定音量は上限音量(80)未満かつ下限音量(20)以上の「中間」である。よって、この場合には、設定Aを変化レベル2に対応する制御値で制御する(ステップS13)。
したがって、前記ステップS5で人物が「おとうさん」と判断され、ステップS7でキーワードが「え」と判断されたとすると、レベル2に対応する制御値は「+1」であることから、先ず制御値「+1」が決定される。また、モード「2」が選択されていたとすると、設定Aは「ズーム」であることから、ズームが「+1」に相当するズーム量でズームアップされる。
しかし、前記ステップS5で人物が「おとうさん」と判断されても、ステップS7でキーワードが「あ」と判断された場合は、レベル2に対応する制御値は「+0.5」であることから、先ず制御値「+0.5」が決定される。また、モード「2」が選択されていたとすると、設定Aは「ズーム」であることから、ズームが「+0.5」に相当するズーム量でズームアップされる。
したがって、前述のように、同一人物が同一の音量で発声した場合であっても、キーワードに応じて異なる変化量でズームアップ制御することができる。
また、ステップS12の判断がYESであって、測定音量が下限音量(20)未満である場合には、ステップS12からステップS14に進み、設定Aを変化レベル1に対応する制御値で制御する(ステップS14)。
したがって、前記ステップS5で人物が「おとうさん」と判断され、ステップS7でキーワードが「え」と判断されたとすると、レベル1に対応する制御値は「−2」であることから、先ず制御値「−2」が決定される。また、モード「2」が選択されていたとすると、設定Aは「ズーム」であることから、ズームが「−2」に相当するズーム量でズームダウンされる。
しかし、前記ステップS5で人物が「おとうさん」と判断されても、ステップS7でキーワードが「あ」と判断された場合は、レベル1に対応する制御値は「−1」であることから、先ず制御値「−1」が決定される。また、モード「2」が選択されていたとすると、設定Aは「ズーム」であることから、ズームが「−1」に相当するズーム量でズームダウンされる。
したがって、同一人物が同一の音量で発声した場合であっても、キーワードに応じて異なる変化量でズームダウン制御することができる。
また、前記ステップS11、S13、S14のいずれかに続くステップS15においては、話速測定を実行して、前記ステップS4及びステップS6で認識に用いた音声の話速を測定する(ステップS15)。そして、この測定した話速がパラメータ設定テーブル132に記憶されている上限話速(80)以上であるか否かを判断する(ステップS16)。上限話速(80)以上である場合には、設定Bを変化レベル3に対応する制御値で制御する(ステップS11)。
したがって、前記ステップS5で人物が「おとうさん」と判断され、ステップS7でキーワードが「え」と判断されたとすると、レベル3に対応する制御値は「+2」であることから、先ず制御値「+2」が決定される。また、モード「2」が選択されていたとすると、設定Bは「連写」であることから、連写速度が「+2」に相当する速度で速度アップされる。つまり連写間隔Xが、「+2」に相当する間隔αで短縮化され、X−α=Xとされて、短縮化された新たな連写間隔Xが設定される。
しかし、前記ステップS5で人物が「おとうさん」と判断されても、ステップS7でキーワードが「あ」と判断された場合は、レベル3に対応する制御値は「+1」であることから、先ず制御値「+1」が決定される。また、モード「2」が選択されていたとすると、設定Bは「連写」であることから、連写速度が「+1」に相当する速度で速度アップされる。つまり連写間隔Xが、「+1」に相当する間隔βで短縮化され、X−β=Xとされて、短縮化された新たな連写間隔Xが設定される。
したがって、同一人物が同一の音量で発声した場合であっても、それが「え」である場合には「あ」である場合よりも、連写間隔を短く(連写速度を速く)することができ、逆に「あ」である場合には「え」である場合よりも、連写間隔を長く(連写速度を遅く)することができる。
よって、同一人物が同一の話速で発声した場合であっても、キーワードに応じて異なる変化量で連写速度制御することができる。
また、ステップS16の判断がNOであって、測定話速が上限話速(80)未満である場合には、ステップS16からステップS18に進み、測定話速が下限話速(20)未満であるか否かを判断する。このステップS18の判断がNOである場合には、測定話速は上限話速(80)未満かつ下限話速(20)以上の「中間」である。よって、この場合には、設定Bを変化レベル2に対応する制御値で制御する(ステップS13)。
したがって、前記ステップS5で人物が「おとうさん」と判断され、ステップS7でキーワードが「え」と判断されたとすると、レベル2に対応する制御値は「+1」であることから、先ず制御値「+1」が決定される。また、モード「2」が選択されていたとすると、設定Bは「連写」であることから、連写速度が「+1」に相当する速度で速度アップされる。つまり連写間隔Xが、「+1」に相当する間隔αで短縮化され、X−α=Xとされて、短縮化された新たな連写間隔Xが設定される。
しかし、前記ステップS5で人物が「おとうさん」と判断されても、ステップS7でキーワードが「あ」と判断された場合は、レベル2に対応する制御値は「+0.5」であることから、先ず制御値「+0.5」が決定される。また、モード「2」が選択されていたとすると、設定Bは「連写」であることから、連写速度が「+0.5」に相当する速度で速度アップされる。つまり連写間隔Xが、「+0.5」に相当する間隔βで短縮化され、X−β=Xとされて、短縮化された新たな連写間隔Xが設定される。
したがって、前述のように、同一人物が同一の話速で発声した場合であっても、キーワードに応じて異なる変化量で連写速度制御することができる。
また、ステップS18の判断がYESであって、測定話速が下限話速(20)未満である場合には、ステップS18からステップS20に進み、設定Bを変化レベル1に対応する制御値で制御する(ステップS20)。
したがって、前記ステップS5で人物が「おとうさん」と判断され、ステップS7でキーワードが「え」と判断されたとすると、レベル1に対応する制御値は「−2」であることから、先ず制御値「−2」が決定される。また、モード「2」が選択されていたとすると、設定Bは「連写」であることから、連写速度が「−2」に相当する速度で速度ダウンされる。つまり連写間隔Xが、「−2」に相当する間隔γで長大化され、X−γ=Xとされて、長大化された新たな連写間隔Xが設定される。
しかし、前記ステップS5で人物が「おとうさん」と判断されても、ステップS7でキーワードが「あ」と判断された場合は、レベル1に対応する制御値は「−1」であることから、先ず制御値「−1」が決定される。また、モード「2」が選択されていたとすると、設定Bは「連写」であることから、連写速度が「−1」に相当する速度で速度ダウンされる。つまり連写間隔Xが、「−1」に相当する間隔γで長大化され、X−γ=Xとされて、長大化された新たな連写間隔Xが設定される。
したがって、同一人物が同一の話速で発声した場合であっても、キーワードに応じて異なる変化量で速度ダウン制御することができる。
そして、前記ステップS17、S19、S20のいずれかに続くステップS21においては、前述のように、タイマTの値が前記ステップS1で連写間隔Xを超えたか否かを判断する(ステップS21)。このとき、
(1)前記ステップS17の処理が実行された場合には、連写間隔Xが間隔αで短縮化され、X−α=Xとされており、
(2)前記ステップS19の処理が実行された場合には、連写間隔Xが間隔βで短縮化され、X−β=Xとされており、
(3)前記ステップS20の処理が実行された場合には、連写間隔Xが、間隔γで長大化され、X−γ=Xとされている。
したがって、(1)(2)の場合は、ステップS21でT>Xとなる連写間隔は、前回よりも短くなりこれにより連写速度を高めることができる。
しかし、(3)の場合は、ステップS21でT>Xとなる連写間隔は、前回よりも長くなりこれにより連写速度を低めることができる。
また、前述のように、ステップS24の判断がNOであって、シャッタの全押しが解除Sれない限り、ステップS2からの処理が繰り返される。したがって、「おとうさん」又は「おかあさん」が「え、え、え・・・」あるいは「あ、あ、あ・・・」と連続的に発声することにより、前述したステップS8〜S24の処理が繰り返し実行させることができる。
したがって、音声が有する情報(音量情報、話速情報)を有効に利用して、カメラ装置が備える連写機能及びズーム機能を制御することができる。
しかも、音声が有する情報(音量情報、話速情報)を有効に利用して、これらの機能を連続的に制御することができる。
そして、ユーザがシャッタキーの全押しを解除することにより、ステップS24の判断がYESになると、ステップS24からステップS25に進み記録処理を実行する。この記録処理においては、音量に応じて変化したズーム倍率であって、話速に応じて異なる連写間隔Xでワークメモリ11に記憶された画像データを一つの動画ファイルにして、ファイル名とともに画像記憶部6に記憶する。
これにより、画像記憶部6に、ユーザ音声の音量及び話速に応じて異なるズーム倍率や連写間隔が混在する複数のフレーム画像からなる動画ファイルを記録することができる。
なお、前記説明においては、ユーザによりモード「2」が選択されて、設定Aが「ズーム」であり、設定Bが「連写」である場合を示した。しかし、ユーザによりモード「1」が選択された場合には、設定Aは「ズーム」であり、設定Bも「ズーム」である。この場合には、ステップS9〜S14で音量に応じてズーム制御が実行され、さらに、ステップS15〜S20で話速に応じてズーム制御が実行されることとなる。
よって、この場合には、特定の機能(ズーム機能)を音量と話速の双方に基づき制御することができる。
また、ユーザによりモード「3」が選択された場合には、設定Aは「連写」であり、設定Bは「ズーム」である。この場合には、前述の説明とは逆に、ステップS9〜S14で音量に応じて連写速度制御が実行され、ステップS15〜S20で話速に応じてズーム制御が実行されることとなる。
よって、この場合には、音量と話速の各々に基づき異なる機能を制御することができる。
また、ユーザによりモード「4」が選択された場合には、設定Aは「連写」であり、設定Bも「連写」である。この場合には、ステップS9〜S14で音量に応じて連写速度制御が実行され、さらに、ステップS15〜S20で話速に応じて連写速度制御が実行されることとなる。
よって、この場合には、特定の機能(連写速度)を音量と話速の双方に基づき制御することができる。しかも、予め検出値に対応して制御値が記憶されているパラメータ設定テーブル132から制御値を読み出す簡単な処理により、特定の機能を制御することができる。
なお、実施の形態においては、ズーム倍率と連写速度とを制御するようにしたが、制御対象はこれらに限ることなく、ISO感度、絞り等の他の機能であってもよい。
また、実施の形態においては、キーワードとして、一音節からなる単音を登録した場合を示したが、単語を登録するようにしてもよい。
また、実施の形態においては、人物とこれに対応するキーワードを登録しておき、認識結果に応じて制御を行うようにしたが、人物は登録することなくキーワードのみを登録しておき、当該キーワードでの音量、話速に応じて制御を行うようにしてもよい。このようにキーワードのみの登録とすれば、特定の者に限ることなく音声で当該デジタルカメラを制御することができ、汎用性を高めることができる。
さらに、人物及びキーワードとも登録することなく、単に入力された音声の音量や話速に基づき制御を実行するようにしてよい。これにより、歓声の大きさや頻度に応じて、連写速度やズーム倍率を制御することが可能となる。
また、このように歓声の大きさに応じて連写速度を制御する場合には、常時高速で連写してワークメモリ11に記録するとともに、歓声も連続的に録音してワークメモリ11に記憶し、画像記憶部6に記憶する際には、歓声の小さい間のフレーム画像を間引いて動画ファイルを生成し、しかる後に画像記憶部6に記憶するようにしてもよい。これにより、歓声の大きいシーンでは連写速度を高めた動画ファイルが生成され、実質的に時間を遡って歓声に応じて連写速度を上げることができる。
また、連写撮影は、動画に限らず、静止画の連写撮影であっても良い。
また、モード1〜4は、何れも設定Aと設定Bの両方を設定するものとしたが、
・ 設定Aのみ「ズーム」にして設定Bは行わないとするモード5、
・ 設定Bのみ「ズーム」にして設定Aは行わないとするモード6、
・ 設定Aのみ「連写」にして設定Bは行わないとするモード7、
・ 設定Bのみ「連写」にして設定Aは行わないとするモード8、
を更に設定可能であっても構わない。
また、話速は、前述のように、例えば、単音声(音節)から次の単音声(音節)までの時間間隔であり、この時間間隔が少ない程、話速が高い(速い)と判定することが出来ると共に、話速の検出は、特開平05-289691や特開2005-331589に記載されたような方法で、またはそれらのいくつかを組み合わせた方法で、検出するようにしても構わない。
また、実施の形態においては本発明を専用機としてのデジタルカメラに採用した場合について説明したが、これに限らず本発明は、カメラ付き携帯電話、カメラ付きPDA、カメラ付きPC、さらには銀塩カメラ等の他のカメラ装置にも採用することができる。
本発明の一実施の形態に係るデジタルカメラの概略構成を示すブロック図である。 初期設定テーブルの構成を示す概念図である。 パラメータ設定テーブルの構成を示す概念図である。 本実施の形態における処理手順を示すフローチャートである。 図4のフローチャートに続くフローチャートである。
符号の説明
1 キー入力部
2 合焦・ズーム部
3 露光部
4 画像入力部
5 画像圧縮部
6 画像記憶部
7 画像表示部
8 マイク
9 音声入力部
10 A/D変換部
11 ワークメモリ
12 音声認識部
13 プログラムメモリ
14 制御部
131 初期設定テーブル
132 パラメータ設定テーブル

Claims (22)

  1. 音声を取得する取得手段と、
    音声に含まれている情報であって、物理量として検出可能な情報である物理的音声情報を前記取得手段により取得された音声から検出する検出手段と、
    この検出手段により検出された前記物理的音声情報に基づき、当該カメラ装置が有する所定の機能を制御する制御手段と
    を備えることを特徴とするカメラ装置。
  2. 前記検出手段は、前記物理的音声情報として、音量を前記音声から検出することを特徴とする請求項1記載のカメラ装置。
  3. 前記検出手段は、前記物理的音声情報として、話速を、前記音声から検出することを特徴とする請求項1記載のカメラ装置。
  4. 前記話速とは、音声における隣接する単音間の時間的短さに対応する速さであることを特徴とする請求項3記載のカメラ装置。
  5. 前記所定の機能とは、前記物理量の変化に応じて段階的に制御される機能であることを特徴とする請求項1〜4のいずれか1項に記載のカメラ装置。
  6. 前記所定の機能は、当該カメラ装置が有する撮影手段を連続的に動作させる連写撮影における連写速度であることを特徴とする請求項1から5のいずれか1項に記載のカメラ装置。
  7. 前記連写撮影とは、動画の撮影であることを特徴とする請求項6に記載のカメラ装置。
  8. 前記所定の機能は、当該カメラ装置が有するズームレンズを駆動するズーム機能であることを特徴とする請求項1から5のいずれか1項に記載のカメラ装置。
  9. 前記検出手段により検出される前記物理的音声情報が示す物理量に対応して、前記所定機能の制御に用いられる制御値を記憶した制御情報記憶手段を備え、
    前記制御手段は、前記制御情報記憶手段から前記検出手段により検出された物理的音声情報が示す物理量に対応する制御値を読み出して、前記所定の機能を制御することを特徴とする請求項1から8のいずれか1項に記載のカメラ装置。
  10. 前記制御情報記憶手段は、前記物理的音声情報が示す同一の物理量に対応して複数の異なる制御値を記憶し、
    前記制御手段は、前記制御情報記憶手段から前記検出手段により検出された物理的音声情報が示す物理量に対応する複数の制御値のいずれかを選択的に読み出すことを特徴とする請求項9記載のカメラ装置。
  11. キーワードを記憶する認識情報記憶手段と、
    この認識情報記憶手段に記憶されたキーワードと前記音声検出手段により検出された音声との一致性を認識する認識手段とを備え、
    前記検出手段は、前記認識手段により前記キーワードと前記音声との一致性が認識された場合に、前記物理的音声情報を検出することを特徴とする請求項1から8のいずれか1項に記載のカメラ装置。
  12. 前記認識情報記憶手段は、人物を示す人物情報と前記キーワードとを対応して記憶し、
    前記認識手段は、前記認識情報記憶手段に記憶された人物情報及びキーワードと前記音声検出手段により検出された音声との一致性を認識し、
    前記検出手段は、前記認識手段により前記人物情報及びキーワードと前記音声との一致性が認識された場合に、前記物理的音声情報を検出することを特徴とする請求項11記載のカメラ装置。
  13. 前記認識情報記憶手段は、一つの音節からなる単音を前記キーワードとして記憶することを特徴とする請求項11又は12記載のカメラ装置。
  14. 前記認識情報記憶手段は、前記キーワードと前記検出手段により検出される前記物理的音声情報が示す物理量とに対応して、前記所定機能の制御に用いられる制御値を記憶し、
    前記制御手段は、前記認識手段により前記キーワードと前記音声との一致性が認識された場合に、前記制御情報記憶手段から前記キーワードと前記検出手段により検出された物理的音声情報が示す物理量とに対応する制御値を読み出して、前記所定の機能を制御することを特徴とする請求項11〜13の何れか1項に記載のカメラ装置。
  15. 前記認識情報記憶手段は、前記人物情報及びキーワードと前記検出手段により検出される前記物理的音声情報が示す物理量とに対応して、前記所定機能の制御に用いられる制御値を記憶し、
    前記制御手段は、前記認識手段により前記人物情報及びキーワードと前記音声との一致性が認識された場合に、前記認識情報記憶手段から前記前記人物情報及びキーワードと前記検出手段により検出された物理的音声情報が示す物理量とに対応する制御値を読み出して、前記所定の機能を制御することを特徴とする請求項12記載のカメラ装置。
  16. 前記認識情報記憶手段は、前記物理的音声情報が示す同一の物理量に対応して複数の異なる制御値を記憶し、
    前記制御手段は、前記認識情報記憶手段から前記検出手段により検出された物理的音声情報が示す物理量に対応する複数の制御値のいずれかを選択的に読み出すことを特徴とする請求項14又は15記載のカメラ装置。
  17. 前記認識情報記憶手段は、複数のキーワードを記憶するとともに、前記複数の異なる制御値を異なるキーワード毎に記憶し、
    前記制御手段は、前記認識手段により認識されたキーワードに対応し、かつ前記検出手段により検出された物理的音声情報が示す物理量に対応する制御値を読み出すことを特徴とする請求項16記載のカメラ装置。
  18. 被写体を撮像するさ撮像手段と、
    前記撮影手段により連続的に撮影された複数の画像を記録するとともに、前記検出手段により検出された音声を連続的に記録する第1の記録手段と、
    第2の記録手段とを備え、
    前記検出手段は、前記物理的音声情報として音量を前記第1の記録手段に記録されている音声から検出し、
    前記制御手段は、前記検出手段により検出された音量に応じて、前記第1の記録手段に記録されている複数の画像を間引き処理し、この間引き処理した後の複数の画像を前記第2の記録手段に記録することを特徴とする請求項1記載のカメラ装置。
  19. 前記取得手段、検出手段、制御手段のいずれか少なくとも一つの手段の動作をオン・オフする操作手段を備えることを特徴とする請求項1から18のいずれか1項に記載のカメラ装置。
  20. 前記検出手段は、更に前記物理的音声情報として、前記音量に加えて話速を、前記音声から検出することを特徴とする請求項2記載のカメラ装置。
  21. 前記所定の機能とは、物理量である音量と話速それぞれの変化に応じて段階的に制御される機能であり、この所定の機能は、
    前記音量の変化に応じて制御される第1の機能と、
    前記話速の変化に応じて制御される第2の機能と、
    を有することを特徴とする請求項20記載のカメラ装置。
  22. 音声を取得する取得手段を備えるカメラ装置が有するコンピュータを、
    音声に含まれている情報であって、物理量として検出可能な情報である物理的音声情報を前記取得手段により取得された音声から検出する検出手段と、
    この検出手段により検出された前記物理的音声情報に基づき、当該カメラ装置が有する所定の機能を制御する制御手段と
    して機能させることを特徴とするカメラ装置制御プログラム。
JP2007246503A 2007-09-25 2007-09-25 カメラ装置及びカメラ制御プログラム Pending JP2009077325A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007246503A JP2009077325A (ja) 2007-09-25 2007-09-25 カメラ装置及びカメラ制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007246503A JP2009077325A (ja) 2007-09-25 2007-09-25 カメラ装置及びカメラ制御プログラム

Publications (1)

Publication Number Publication Date
JP2009077325A true JP2009077325A (ja) 2009-04-09

Family

ID=40611841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007246503A Pending JP2009077325A (ja) 2007-09-25 2007-09-25 カメラ装置及びカメラ制御プログラム

Country Status (1)

Country Link
JP (1) JP2009077325A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110073268A (ko) * 2009-12-22 2011-06-29 삼성전자주식회사 촬상 장치 및 촬상 장치의 제어 방법
US8736702B2 (en) 2009-12-22 2014-05-27 Samsung Electronics Co., Ltd. Apparatus and method of calculating a shooting frequency based on the obtained sound information
WO2022197029A1 (ko) * 2021-03-17 2022-09-22 삼성전자 주식회사 전자 장치 및 전자 장치의 동작 방법

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110073268A (ko) * 2009-12-22 2011-06-29 삼성전자주식회사 촬상 장치 및 촬상 장치의 제어 방법
JP2011135172A (ja) * 2009-12-22 2011-07-07 Samsung Electronics Co Ltd 撮像装置及び撮像装置の制御方法
US8736702B2 (en) 2009-12-22 2014-05-27 Samsung Electronics Co., Ltd. Apparatus and method of calculating a shooting frequency based on the obtained sound information
KR101710628B1 (ko) 2009-12-22 2017-02-27 삼성전자주식회사 촬상 장치 및 촬상 장치의 제어 방법
WO2022197029A1 (ko) * 2021-03-17 2022-09-22 삼성전자 주식회사 전자 장치 및 전자 장치의 동작 방법

Similar Documents

Publication Publication Date Title
KR100821801B1 (ko) 촬상장치 및 오토포커스 제어방법
US8363121B2 (en) Digital photographing device, method of controlling the same, and computer-readable storage medium to select between a still and a moving image capturing mode
CN101848338B (zh) 具有变焦功能的摄影装置
JP5713055B2 (ja) 撮像装置、撮像方法及びプログラム
JP2008009263A (ja) 撮像装置及びそのプログラム
JP2005348181A (ja) 撮影装置及びその制御方法並びに制御用プログラム
JP2007215091A (ja) 撮像装置及びそのプログラム
JP6137965B2 (ja) 電子機器、電子機器の制御方法、及び電子機器の制御プログラム
JP5267609B2 (ja) 撮像装置及びそのプログラム
JP4635739B2 (ja) 撮像装置
JP4957263B2 (ja) 撮像装置、撮像方法及びそのプログラム
JP4895205B2 (ja) 画像処理装置及びそのプログラム
JP4501927B2 (ja) 撮像装置及びそのプログラム
US8571404B2 (en) Digital photographing apparatus, method of controlling the same, and a computer-readable medium storing program to execute the method
JP2009081530A (ja) 撮像装置、及び撮影方法
JP2009077325A (ja) カメラ装置及びカメラ制御プログラム
JP5141392B2 (ja) 撮像装置、周音範囲表示方法及びプログラム
JP2009010472A (ja) 撮像装置及びそのプログラム
JP4553134B2 (ja) 画像生成装置及びそのプログラム
JP5023932B2 (ja) 撮像装置、シナリオによる画像撮影方法、およびプログラム
JP2006330211A (ja) カメラ、カメラ制御プログラム及びカメラ制御方法
JP6427859B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5157528B2 (ja) 撮影装置
JP4771524B2 (ja) 撮像装置及びそのプログラム
JP2008091978A (ja) 撮像装置及び画像記憶方法