JP2011229159A - 撮像制御装置及び撮像装置の制御方法 - Google Patents
撮像制御装置及び撮像装置の制御方法 Download PDFInfo
- Publication number
- JP2011229159A JP2011229159A JP2011118357A JP2011118357A JP2011229159A JP 2011229159 A JP2011229159 A JP 2011229159A JP 2011118357 A JP2011118357 A JP 2011118357A JP 2011118357 A JP2011118357 A JP 2011118357A JP 2011229159 A JP2011229159 A JP 2011229159A
- Authority
- JP
- Japan
- Prior art keywords
- image capturing
- user
- image
- keyword
- capturing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B17/00—Details of cameras or camera bodies; Accessories therefor
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B17/00—Details of cameras or camera bodies; Accessories therefor
- G03B17/38—Releasing-devices separate from shutter
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B17/00—Details of cameras or camera bodies; Accessories therefor
- G03B17/38—Releasing-devices separate from shutter
- G03B17/40—Releasing-devices separate from shutter with delayed or timed action
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/66—Remote control of cameras or camera parts, e.g. by remote control devices
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Studio Devices (AREA)
- Details Of Cameras Including Film Mechanisms (AREA)
- Indication In Cameras, And Counting Of Exposures (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
【課題】撮像制御装置と物理的に接触することなく画像を取込むことができる遠隔写真モードを有する撮像制御装置を提供する。
【解決手段】装置は、ユーザがキーワードを発話することにより起動される。撮像制御装置は、遠隔取込み動作モードで初期設定された後、ある期間にわたり、発話に応答しない待機状態に入り、ある期間の後に、発話されるキーワードの検出に応答して画像を取込むことができる聴取状態に設定されるように構成される。
【選択図】なし
【解決手段】装置は、ユーザがキーワードを発話することにより起動される。撮像制御装置は、遠隔取込み動作モードで初期設定された後、ある期間にわたり、発話に応答しない待機状態に入り、ある期間の後に、発話されるキーワードの検出に応答して画像を取込むことができる聴取状態に設定されるように構成される。
【選択図】なし
Description
本発明は、音声により遠隔装置を制御する装置及び方法に関する。本発明は、例えば、カメラ、カムコーダ又は他の画像取込み装置による写真又は動画像の遠隔撮影を制御するために使用されることが可能である。
カメラで写真を撮影するときには、通常、ユーザはカメラを手で持ち、撮影場面をフレーム内に入れるためにカメラの背面に位置するファインダをのぞき、その後、ボタンを押して、カメラのシャッタを切り、それにより、写真フィルム又は光取込み電子素子の上に光を当てる。しかし、例えば、グループ写真、ポートレート写真などのように、ユーザが写真の中に加わりたいと望む状況では、ユーザは、通常、カメラから幾分かの距離をおいて離れた位置にいて、通常の方法では写真を撮影できない。ここでは、ユーザがカメラと物理的に接触することなしに写真を撮影することを望む状況を説明するために、「遠隔写真(remote photograph)」という用語を使用する。この状況においては、ユーザは、手動操作によりカメラのボタンを押す必要なくシャッタを起動する方法を講じなければならない。
遠隔写真を撮影するためにカメラにタイマを設けることは、この技術分野では周知である。このカメラの場合、ユーザは、カメラの特定のスイッチを起動することにより遠隔写真を撮影すべきであることを指示し、所定の時間の後に写真は撮影される。しかし、その時間が短すぎると、ユーザが準備を整えないうちに写真が撮影されてしまい、時間が長すぎれば、カメラが写真を撮影するまでにユーザは待たされることになるため、多くの場面について、この方法は融通性を欠き、不満足なものである。更に、2枚以上の遠隔写真を撮影すべきである場合には、タイマの周期をリセットするために、その都度、ユーザはカメラの場所に戻り、その後、次の写真が撮影される前に所望の場所まで戻らなければならない。
また、カメラにリモートコントロールを設けることもこの技術分野では周知である。この場合、タイマに頼らずに遠隔写真を撮影できる。しかし、リモートコントロールを追加することで、カメラ全体の価格が高くなる。更に、遠隔写真を撮影するために、ユーザはカメラに加えてリモートコントロールを携帯しなければならないという点で不便である。
更に、音声起動式の遠隔写真撮影機能をカメラに設けることも周知であり、その場合、カメラは自動音声認識装置を使用して、発話される特定のキーワードを検出するようにプログラムされている。そのようなカメラは、ユーザの準備が整ったときに写真を撮影できる一方で、リモートコントロールを必要としないという利点を有する。しかし、背景雑音のためにユーザの音声信号が聞き取りにくくなり、減衰されることによりキーワードを検出できない(又は誤って検出される)ような、かなり騒々しい状況においては、これらのカメラは不適切であろう。
本発明の目的は、画像取込み装置において、ユーザが遠隔写真機能を音声により起動することを可能にする従来に代わる技法を提供することである。
本発明の一側面によれば、画像取込み装置を起動するためにユーザ入力を受信する手段と、ユーザ入力を受信した後、所定時間経過後に起動信号を発生し、発話されるキーワードを画像取込み装置が聴取していることを示す表示をユーザに対して出力する手段と、ユーザにより入力される音声信号を受信する手段と、発話されたキーワードを検出するべく音声信号を処理する手段と、前記音声信号を処理する手段により実行される検出に応じて画像を取込む手段とを備える画像取込み装置が提供される。
本発明の別の側面によれば、画像取込み装置を制御する方法であって、画像取込み装置を起動するためにユーザ入力を受信するステップと、ユーザ入力を受信した後、所定時間経過後に起動信号を発生し、発話されるキーワードを画像取込み装置が聴取していることを示す表示をユーザに対して出力するステップと、ユーザにより入力される音声信号を受信するステップと、発話されたキーワードを検出するべく音声信号を処理するステップと、前記音声信号を処理するステップにより実行される検出に応じて画像を取込むステップとを有する方法が提供される。
(概要)
図1は、写真撮影のためにポーズをとっている5人の人1−1〜1−5から成るグループを示している。グループの中の1人1−1は、特定のボタンを押すか又はユーザメニュー(図示せず)のオプションを設定することにより、遠隔写真を撮影するようにカメラ3を設定している。そこで、カメラ3は、ユーザ1−1が発話するキーワードを聴取する前にユーザ1−1がグループに加わることができるように所定の期間だけ待機する。グループが遠隔写真の撮影の準備を整えると、グループの中の1人1−1がキーワード(この実施例では「チーズ」)を発話する。そのキーワードはカメラ3により検出されて、カメラ3はそれに応答してグループの写真を撮影する。
図1は、写真撮影のためにポーズをとっている5人の人1−1〜1−5から成るグループを示している。グループの中の1人1−1は、特定のボタンを押すか又はユーザメニュー(図示せず)のオプションを設定することにより、遠隔写真を撮影するようにカメラ3を設定している。そこで、カメラ3は、ユーザ1−1が発話するキーワードを聴取する前にユーザ1−1がグループに加わることができるように所定の期間だけ待機する。グループが遠隔写真の撮影の準備を整えると、グループの中の1人1−1がキーワード(この実施例では「チーズ」)を発話する。そのキーワードはカメラ3により検出されて、カメラ3はそれに応答してグループの写真を撮影する。
図2は、カメラ3の主要な構成要素を示す概略ブロック図である。通常の使用中、ユーザはユーザ入力装置31(ボタン又はダイアルなど)を介してカメラ3を制御する。このユーザ入力は、例えば、写真フィルム、あるいはCCDセンサ又はCMOSセンサ(図示せず)などの感光電子素子の上に光を通過させるシャッター35を制御するためにカメラ3を制御するカメラ制御部33に供給される。カメラ制御部33は、カメラ及び写真の状態情報(カメラ電力、光の強さ、フラッシュモードなど)をユーザに示すために、ユーザ出力装置37(LCDディスプレイ又はLEDランプなど)を更に制御する。図2に示すように、カメラ3は、ユーザの音声を対応する電気音声信号に変換するためのマイクロホン39と、ユーザの音声の中のキーワードの有無を検出するために電気音声信号を処理し、それに従ってカメラ制御部33に報知する音声処理部41と、音声処理部41により使用されるべきキーワードモデルを格納するキーワードモデル記憶部43とを更に含む。
(ユーザインタフェース)
次に、図2に示したカメラの動作、及びユーザとカメラとの対話について、図3a及び図3bを参照して説明する。まず、カメラ制御部33がユーザ入力装置31を介して、遠隔写真を撮影すべきであることを示すユーザ入力を受信すると、カメラ制御部33は内部タイマ(図示せず)を初期設定し、ステップS1で、カメラ3がキーワードの聴取を開始しようとしていることを示す表示をユーザ出力装置37において出力する。ステップS3で、カメラ制御部33のタイマは、ユーザが遠隔写真撮影のための所望の位置に到達することを可能にする期間(DELAY1)だけカメラ3を待機させる(待機状態)。この実施例では、DELAY1は5秒に設定されている。この遅延の後、処理はステップS5へ進み、カメラ制御部33に格納され、撮影された遠隔写真の枚数を示すために使用される変数COUNTが0に設定される。ステップS7では、カメラ制御部33はマイクロホン39をスイッチオンするための起動信号を発生し、カメラ3が聴取状態にあって、ユーザにより発話されるキーワードを聴取していることを示す表示をユーザ出力装置37において出力する。
次に、図2に示したカメラの動作、及びユーザとカメラとの対話について、図3a及び図3bを参照して説明する。まず、カメラ制御部33がユーザ入力装置31を介して、遠隔写真を撮影すべきであることを示すユーザ入力を受信すると、カメラ制御部33は内部タイマ(図示せず)を初期設定し、ステップS1で、カメラ3がキーワードの聴取を開始しようとしていることを示す表示をユーザ出力装置37において出力する。ステップS3で、カメラ制御部33のタイマは、ユーザが遠隔写真撮影のための所望の位置に到達することを可能にする期間(DELAY1)だけカメラ3を待機させる(待機状態)。この実施例では、DELAY1は5秒に設定されている。この遅延の後、処理はステップS5へ進み、カメラ制御部33に格納され、撮影された遠隔写真の枚数を示すために使用される変数COUNTが0に設定される。ステップS7では、カメラ制御部33はマイクロホン39をスイッチオンするための起動信号を発生し、カメラ3が聴取状態にあって、ユーザにより発話されるキーワードを聴取していることを示す表示をユーザ出力装置37において出力する。
次に、処理はステップS9へ進み、カメラ制御部33はユーザが遠隔写真撮影動作を取り消したか否かを検査する。ユーザが取り消していれば、処理はステップS27(図3bに示す)へ進み、カメラ制御部33はマイクロホン39をスイッチオフするための動作停止信号を発生し、キーワードを聴取しなくなっていることを示す表示をユーザ出力装置37において出力する。ユーザが遠隔写真撮影動作を取り消していない場合には、処理はステップS11へ進み、カメラ制御部33は(変数COUNTの値を0と比較することにより)写真が既に撮影されたか否かを判定する。写真が撮影されていなければ、処理はステップS13へ進み、カメラ制御部33は、カメラ3が遠隔写真を撮影するために無期限に待機しないことを保証するために、タイマを第2の遅延(DELAY2)に対して検査する。この実施例では、DELAY2は30秒に設定されている。DELAY2に達していないとすれば、カメラ制御部33は、音声処理部41がマイクロホン39からの入力音声信号の中のキーワードを検出したか否かを(入力音声をキーワードモデル記憶部43に格納されているキーワードモデルと比較することにより)検査する。キーワードが検出されていなければ、ステップS9〜S15が繰り返される。
ステップS15でキーワードが検出されたならば、処理はステップS17へ進み、カメラ制御部33は変数COUNTを増分し、次に、ステップS19で、写真が撮影されようとしていることを示す表示をユーザに対してユーザ出力装置37において出力する。この実施例では、カメラ制御部33は、この後、ステップS21でユーザ規定期間(DELAY3)だけ待機するように構成されている。このユーザ規定期間はユーザ入力装置31を介してカメラにプログラムすることができ、直ちに写真が撮影されるように0に設定されることが可能である。この遅延の後、ステップS23で、カメラ制御部33は写真を撮影させるためにシャッタ35へ制御信号を送信する。
ステップS13で、カメラ制御部33がキーワードの検出前にDELAY2が経過し終わったことを判定した場合、ユーザがキーワードを発話するのをカメラ3が無期限に待たないように(又はカメラ3が発話されたキーワードを検出するのに失敗した場合)、処理はステップS19へ進む。従って、最終的に、キーワードが検出されない場合には、カメラ3は自動的に写真を撮影する。
この実施例では、1回の遠隔写真撮影セッションの中で10枚までの写真を撮影できる。この試験はステップS25でカメラ制御部33により制御される。現在のセッションにおいて更に多くの写真を撮影できる場合には、処理はステップS7に戻る。既に10枚の写真が撮影されている場合には、ステップS27で、カメラ制御部33はマイクロホン39をスイッチオフするための動作停止信号を発生し、カメラ3が聴取しなくなっていることを示す表示をユーザに対してユーザ出力装置37において出力する。そこで、遠隔写真撮影動作は終了する。
(第2の実施例)
以上説明した第1の実施例では、カメラ3は延長された期間(DELAY2)にわたりキーワードを聴取するように構成されている。したがって、キーワードの誤った検出により、カメラ3が希望するより多くの写真を撮影してしまう可能性がある。そこで、誤って撮影される写真の枚数を減らすことを試みるために、カメラ3が写真を撮影する前に2つのキーワードが検出されなければならない2パス技法を採用する第2の実施例を説明する。特に、この第2の実施例においては、第1のキーワードの検出によって、カメラ3は第1の実施例の場合より短い時間フレームの中で第2のキーワードを聴取する。カメラ3は、第2のキーワードが検出されて初めて写真を撮影する。図4a及び図4bを参照して、この第2の実施例におけるカメラ3の動作を説明する。
以上説明した第1の実施例では、カメラ3は延長された期間(DELAY2)にわたりキーワードを聴取するように構成されている。したがって、キーワードの誤った検出により、カメラ3が希望するより多くの写真を撮影してしまう可能性がある。そこで、誤って撮影される写真の枚数を減らすことを試みるために、カメラ3が写真を撮影する前に2つのキーワードが検出されなければならない2パス技法を採用する第2の実施例を説明する。特に、この第2の実施例においては、第1のキーワードの検出によって、カメラ3は第1の実施例の場合より短い時間フレームの中で第2のキーワードを聴取する。カメラ3は、第2のキーワードが検出されて初めて写真を撮影する。図4a及び図4bを参照して、この第2の実施例におけるカメラ3の動作を説明する。
カメラ制御部33が写真を撮影すべきであることを示すユーザ入力を受信すると、カメラ制御部33は内部タイマをリセットし、ステップS101で、システムがキーワードの聴取を開始しようとしていることを示す表示をユーザ出力装置37において出力する。次に、ステップS103で、カメラ制御部33はユーザが遠隔写真撮影のための所望の位置に到達することを可能にするための期間(DELAY1)にわたり装置を待機させる(待機状態)。この実施例でも、DELAY1は5秒に設定されている。DELAY1が経過した後、処理はステップS105へ進み、撮影される遠隔写真の枚数を示す変数COUNTが0に設定される。ステップS107で、カメラ制御部33はマイクロホン39をスイッチオンするための起動信号を発生し、次に、カメラ3が聴取モードにあって、ユーザにより発話される第1のキーワードを聴取していることを示す表示をユーザ出力装置37において出力する。
ステップS109で、カメラ制御部33はユーザが遠隔写真撮影動作を取り消したか否かを検査する。取り消していれば、処理はステップS135へ進み、カメラ制御部はマイクロホン39をスイッチオフするための動作停止信号を発生し、カメラ3が聴取するのを停止していることを示す表示をユーザ出力装置37において出力する。しかし、ステップS109で、遠隔写真撮影動作が取り消されていないことをカメラ制御部33が判定した場合には、処理はステップS111へ進み、カメラ制御部33は現在の遠隔写真撮影セッションにおいて写真が撮影されたか否かを判定する。写真が撮影されていなければ、処理はステップS113へ進み、第1の実施例と同様に、タイマが遅延値DELAY2(この実施例においても30秒に設定されている)と比較される。処理ステップS111及びS113の目的は、カメラが所定の時間の後にキーワードを検出しない場合には、自動的に写真が撮影されるように保証することである。従って、ステップS113で、タイマ値がDELAY2より大きいことが判定された場合、処理はステップS127へ進み、カメラ3は写真を撮影しようとしていることを示す。
変数COUNTが0より大きいか、又はタイマがDELAY2に満たない場合、処理はステップS115へ進み、カメラ制御部33は音声処理部41が第1のキーワードを検出したか否かを知るための検査を実行する。検出していなければ、処理はステップS109に戻る。音声処理部41が第1のキーワードを検出していた場合、処理はステップS117へ進み、カメラ制御部33はCOUNTを増分し、次に、ステップS119で、カメラ3がユーザからの第2のキーワードを聴取していることを示す表示をユーザ出力装置37において出力する。その後、処理はステップS121へ進み、カメラ制御部33はユーザが遠隔写真撮影動作を取り消したか否かを知るための検査を再び実行する。取り消していなければ、処理はステップS123へ進み、別の遅延値(DELAY4)に対してタイマが検査される。この第4の遅延は、システムが時間切れになり、ステップS107に戻って、第1のキーワードの聴取を再開する前にユーザが第2のキーワードを発話していなければならない時間の長さを定義するために使用される。DELAY4の値は、ユーザに第2のキーワードを発話するのに十分な時間を与えるように設定され、この実施例では2秒の値に設定されている。
DELAY4を超えていない場合、処理はステップS125へ進み、カメラ制御部33は音声処理部41が第2のキーワードを検出したか否かを検査する。検出していなければ、処理はステップS121に戻る。第2のキーワードが検出されたならば、処理はステップS127へ進み、カメラ制御部33は、写真が撮影されようとしていることを示す表示をユーザ出力装置37において出力する。第1の実施例の場合と同様に、カメラ制御部33は、この後、ステップS129でユーザ選択可能な遅延(DELAY3)だけ待機する。この遅延の後、処理はステップS131へ進み、カメラ制御部33は写真を撮影させるためにシャッタ35へ信号を送信する。
第1の実施例の場合と同様に、この第2の実施例でも、カメラ制御部33は現在の遠隔写真撮影セッションの中で最大で10枚の写真を撮影できるように構成されている。これは、カメラ制御部33がCOUNTの値は0から10の間にあるか否かを知るための検査を実行するステップS133において制御される。0から10の間にあれば、処理はステップS127に戻り、カメラは再び第1のキーワードを聴取していることを示す。これに対し、COUNTが0から10の間にない場合には、処理はステップS135へ進み、カメラ制御部33はマイクロホン39をスイッチオフするための動作停止信号を発生し、カメラ3が聴取しなくなっていることを示す表示をユーザ出力装置37において出力する。
(代替実施例、変形例)
ユーザが1つ以上のキーワードを発話することにより遠隔写真を撮影することを可能にする音声起動カメラの2つの実施例を説明した。カメラの2つの異なるユーザインタフェース動作を説明した。当業者には理解されるであろうが、上記の実施例に対して様々な変形を実施できる。以下に、変形例をいくつか説明する。
ユーザが1つ以上のキーワードを発話することにより遠隔写真を撮影することを可能にする音声起動カメラの2つの実施例を説明した。カメラの2つの異なるユーザインタフェース動作を説明した。当業者には理解されるであろうが、上記の実施例に対して様々な変形を実施できる。以下に、変形例をいくつか説明する。
上記の実施例では、カメラは発話されたキーワードを検出した後に写真を撮影するように構成されていた。グループの写真を撮影する場合、グループの数人のメンバーがわずかに異なる時点でキーワードをそれぞれ発話することが一般的である。したがって、上記の実施例においては、カメラは発話されるキーワードの出現をそれぞれ検出し、出現のたびに写真の撮影を開始することができる。この問題を回避するために、別の実施例では、カメラは、現在の遠隔写真撮影セッションで次の写真を撮影できるようになる前に所定の期間(例えば、数秒)だけ待機するように構成しても良い。
上記の実施例では、ユーザが現在の遠隔写真撮影セッションを起動すると、カメラは、
i)キーワードが検出されず、DELAY2の後にカメラが時間切れになるか、
ii)ユーザがユーザ入力装置を介して動作を取り消すか、又は
iii)ユーザが現在の遠隔写真撮影セッションで10枚の写真を撮影し終わるか、
のいずれかの状況でのみ現在のセッションを終了する。
i)キーワードが検出されず、DELAY2の後にカメラが時間切れになるか、
ii)ユーザがユーザ入力装置を介して動作を取り消すか、又は
iii)ユーザが現在の遠隔写真撮影セッションで10枚の写真を撮影し終わるか、
のいずれかの状況でのみ現在のセッションを終了する。
別の実施例においては、カメラは、1回の遠隔写真撮影セッションの中で写真を撮影できる所定の期間を設けるように構成されても良い。このようにすると、撮影された写真の枚数に関わらず、所定の期間が終了した時点で処理は終了するであろう。
第1の実施例では、カメラで遠隔写真撮影機能が起動されると、カメラはマイクロホンをスイッチオンし、キーワードを聴取していた。別の実施例においては、カメラは、誤ったキーワード検出が起こりうる時間を短縮するために、現在の遠隔写真撮影セッションの中の短い時間の間に限ってマイクロホンをスイッチオンするように構成されても良い。これは、例えば、現在の遠隔写真撮影セッション中、カメラがある期間(例えば、5秒)にわたり待機状態にあり、その後、それより短い期間(例えば、2秒)にわたり聴取状態になり、その間にマイクロホンがスイッチオンされ、カメラが聴取していることを示す表示がユーザに対して出力されるように動作するようにカメラを構成することにより、実現されることが可能である。カメラがこの聴取状態にあるときにキーワードが検出されない場合、カメラは、再び聴取状態に入る前に更にある期間だけ待機状態に戻る。聴取状態にある間にカメラがキーワードを検出したならば、第1の実施例の場合と同様に、カメラは写真を撮影することができ、その後、待機状態に戻る。このようにすると、カメラが実際にキーワードを聴取している時間はカメラが遠隔写真撮影動作モードにある時間全体と比較して短縮される。従って、これは偽キーワード検出の回数を減少させ、誤って撮影される写真の枚数を減らすのに有用である。
上記の実施例では、カメラ制御部はマイクロホンをスイッチオンするための起動信号と、マイクロホンをスイッチオフするための動作停止信号を発生していた。別の実施例においては、マイクロホンは常時スイッチオンされていても良い。この場合、カメラ制御部は、音声処理部が実際にどの時点でマイクロホンからの信号を処理するかを制御するために、起動信号及び動作停止信号を直接に音声処理部へ出力する。あるいは、マイクロホンと音声処理部の双方が絶えず動作しているように構成しても良い。この場合、制御装置は、キーワードを聴取しているべき適切な時点の間に限って音声処理部に選択的に応答するように構成されれば良い。
Claims (37)
- 画像取込み装置であって、
画像取込み装置の画像取込みの遠隔操作を行うためのユーザ入力を受信するユーザ入力受信手段と、
ユーザの発話を表す音声信号を受信する音声信号受信手段と、
受信した前記音声信号を処理して前記ユーザの発話の中のキーワードを検出する音声処理手段と、
画像を取込む画像取込み手段と、
前記ユーザ入力受信手段と前記音声処理手段とに応答して、前記画像取込み手段を制御するコントローラと、
を有し、
前記コントローラは、前記ユーザ入力に応答して、所定時間が経過するまでは、前記画像取込み装置を、ユーザの発話に応答しない待機状態に設定し、前記所定時間が経過すると、前記画像取込み装置を、前記音声処理手段が前記キーワードを検出したときに前記画像取込み手段に画像を取込ませる聴取状態に設定することを特徴とする画像取込み装置。 - 前記コントローラは、前記音声処理手段が前記キーワードを検出した後、ユーザ指定時間の経過を待って、前記画像取込み手段に画像を取込ませることを特徴とする請求項1に記載の画像取込み装置。
- 前記ユーザ入力受信手段は、前記ユーザ指定時間を指定するユーザ入力を受信することを特徴とする請求項2に記載の画像取込み装置。
- 前記コントローラは、前記音声処理手段が前記キーワードを検出した後、前記画像取込み装置を前記聴取状態に戻す前に、所定時間にわたり前記画像取込み装置を前記待機状態に設定することを特徴とする請求項1から3までのいずれかに記載の画像取込み装置。
- 前記コントローラは、当該画像取込み動作中、前記画像取込み装置が前記待機状態と前記聴取状態を繰り返すよう制御することを特徴とする請求項4に記載の画像取込み装置。
- 前記コントローラは、前記音声処理手段がユーザにより発話された連続する複数のキーワードを検出したことに応答して、前記画像取込み手段に画像を取込ませることを特徴とする請求項1から5までのいずれかに記載の画像取込み装置。
- 前記コントローラは、前記音声処理手段がユーザにより連続的に発話された複数の相異なるキーワードを検出したことに応答して、前記画像取込み装置に画像を取込ませることを特徴とする請求項6に記載の画像取込み装置。
- 前記コントローラは、前記画像取込み装置が前記聴取状態にあり、発話されるキーワードを聴取しているときに、ユーザに対して表示を出力することを特徴とする請求項1から7までのいずれかに記載の画像取込み装置。
- 前記コントローラは、前記画像取込み装置が前記聴取状態にあるときに、前記ユーザに対して可視表示を出力することを特徴とする請求項8に記載の画像取込み装置。
- 前記コントローラは、当該画像取込み動作中に前記画像取込み手段により取込まれた画像の枚数をカウントするカウンタを含むことを特徴とする請求項1から9までのいずれかに記載の画像取込み装置。
- 前記コントローラは、前記カウンタを用いて当該画像取込み動作中に取込み可能な画像の枚数を制限することを特徴とする請求項10に記載の画像取込み装置。
- 前記コントローラは、ユーザが前記遠隔操作を実行した後所定時間内に前記音声処理手段によりキーワードが検出されなかった場合、前記画像取込み手段に画像を取込ませ、当該画像取込み動作を終了させることを特徴とする請求項1から11までのいずれかに記載の画像取込み装置。
- 前記コントローラは、前記ユーザが前記ユーザ入力受信手段を介して前記遠隔操作を実行した後、所定時間の経過を待って、当該画像取込み動作を終了させることを特徴とする請求項1から12までのいずれかに記載の画像取込み装置。
- 前記音声信号受信手段は、マイクロホンを含むことを特徴とする請求項1から13までのいずれかに記載の画像取込み装置。
- 前記音声処理手段は、キーワードのワードモデルを格納するワードモデル記憶手段を有し、
前記音声処理手段は、受信した音声信号と前記ワードモデルとを比較することにより、ユーザにより発話されたキーワードを検出する
ことを特徴とする請求項1から14までのいずれかに記載の画像取込み装置。 - 前記コントローラは、前記音声信号受信手段をスイッチオンすることにより、前記画像取込み装置を前記聴取状態に設定することを特徴とする請求項1から15までのいずれかに記載の画像取込み装置。
- 前記コントローラは、前記音声処理手段をスイッチオンすることにより、前記画像取込み装置を前記聴取状態に設定することを特徴とする請求項1から16までのいずれかに記載の画像取込み装置。
- 画像取込み装置において実行される画像取込み方法であって、
前記画像取込み装置の画像取込みの遠隔操作を行うためのユーザ入力を受信するユーザ入力受信ステップと、
ユーザの発話を表す音声信号を受信する音声信号受信ステップと、
受信した前記音声信号を処理して前記ユーザの発話の中のキーワードを検出する音声処理ステップと、
受信した前記ユーザ入力と検出した前記キーワードとに応答して画像を取込むために前記画像取込み装置を制御する制御ステップと、
を有し、
前記制御ステップは、前記ユーザ入力に応答して、所定時間が経過するまでは、前記画像取込み装置を、ユーザの発話に応答しない待機状態に設定し、前記所定時間が経過すると、前記画像取込み装置を、前記音声処理ステップで前記キーワードが検出されたときに前記画像取込み装置に画像を取込ませる聴取状態に設定することを特徴とする画像取込み方法。 - 前記制御ステップは、前記音声処理ステップで前記キーワードが検出された後、ユーザ指定時間の経過を待って、前記画像取込みステップにおいて画像を取込ませることを特徴とする請求項18に記載の画像取込み方法。
- 前記ユーザ入力受信ステップは、前記ユーザ指定時間を指定するユーザ入力を受信することを特徴とする請求項19に記載の画像取込み方法。
- 前記制御ステップは、前記音声処理ステップで前記キーワードが検出された後、前記画像取込み装置を前記聴取状態に戻す前に、所定時間にわたり前記画像取込み装置を前記待機状態に設定することを特徴とする請求項18から20までのいずれかに記載の画像取込み方法。
- 前記制御ステップは、当該画像取込み動作中、前記画像取込み装置が前記待機状態と前記聴取状態を繰り返すよう制御することを特徴とする請求項21に記載の画像取込み方法。
- 前記制御ステップは、前記音声処理ステップでユーザにより発話された連続する複数のキーワードを検出したことにに応答して、前記画像取込みステップにおいて画像を取込ませることを特徴とする請求項18から22までのいずれかに記載の画像取込み方法。
- 前記制御ステップは、前記音声処理ステップでユーザにより連続的に発話された複数の相異なるキーワードが検出されたことに応答して、前記画像取込みステップにおいて画像を取込ませることを特徴とする請求項23に記載の画像取込み方法。
- 前記制御ステップは、前記画像取込み装置が前記聴取状態にあり、発話されるキーワードを聴取しているときに、ユーザに対して表示を出力することを特徴とする請求項18から24までのいずれかに記載の画像取込み方法。
- 前記制御ステップは、前記画像取込み装置が前記聴取状態にあるときに、前記ユーザに対して可視表示を出力することを特徴とする請求項25に記載の画像取込方法。
- 当該画像取込み動作中に前記画像取込みステップで取込まれた画像の枚数をカウントするカウントステップを更に有することを特徴とする請求項18から26までのいずれかに記載の画像取込み方法。
- 前記制御ステップは、前記カウントステップにおけるカウント結果を用いて、当該画像取込み動作中に取込み可能な画像の枚数を制限することを特徴とする請求項27に記載の画像取込み方法。
- 前記制御ステップは、ユーザが前記遠隔操作を実行した後所定時間内に前記音声処理ステップでキーワードが検出されなかった場合、前記画像取込むステップにおいて画像を取込ませ、当該画像取込み動作を終了させることを特徴とする請求項18から28までのいずれかに記載の画像取込み方法。
- 前記制御ステップは、前記ユーザ入力受信ステップで前記ユーザが前記遠隔操作を実行した後、所定時間の経過を待って、当該画像取込み動作を終了させることを特徴とする請求項18から29までのいずれかに記載の画像取込み方法。
- 前記音声信号はマイクロホンより受信されることを特徴とする請求項18から30までのいずれかに記載の画像取込み方法。
- 前記音声処理ステップは、受信した音声信号と、キーワードを表す格納されたワードモデルとを比較することにより、ユーザにより発話されたキーワードを検出することを特徴とする請求項18から31までのいずれかに記載の画像取込み方法。
- 前記制御ステップは、前記音声信号受信ステップを起動することにより、前記画像取込み装置を前記聴取状態に設定することを特徴とする請求項18から32までのいずれかに記載の画像取込み方法。
- 前記制御ステップは、前記音声処理ステップを起動することにより、前記画像取込み装置を前記聴取状態に設定することを特徴とする請求項18から33までのいずれかに記載の画像取込み方法。
- プログラム可能なコンピュータ装置に請求項18から34までのいずれかに記載の画像取込み方法を実行させるためのコンピュータ実行可能な命令を格納したコンピュータ読み取り可能な記憶媒体。
- プログラム可能なコンピュータ装置に請求項18から34までのいずれかに記載の画像取込み方法を実行させるためのコンピュータ実行可能な命令を含むコンピュータプログラム製品。
- 画像取込み装置の画像取込みの遠隔操作を行うためのユーザ入力を受信するユーザ入力受信手段と、
ユーザの発話を表す音声信号を受信する音声信号受信手段と、
受信した前記音声信号を処理して前記ユーザの発話の中のキーワードを検出する音声処理手段と、
画像を取込む画像取込み手段と、
前記ユーザ入力受信手段と前記音声処理手段とに応答して、前記画像取込み手段を制御するコントローラと、
を有し、
前記コントローラは、前記ユーザ入力に応答して、所定時間が経過するまでは、前記画像取込み装置を、ユーザの発話に応答しない待機状態に設定し、前記所定時間が経過すると、前記画像取込み装置を、アクティブ状態に設定することを特徴とする画像取込み装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB0321446.7 | 2003-09-12 | ||
GB0321446A GB2405948B (en) | 2003-09-12 | 2003-09-12 | Voice activated device |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004265856A Division JP4805558B2 (ja) | 2003-09-12 | 2004-09-13 | 画像撮影装置及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011229159A true JP2011229159A (ja) | 2011-11-10 |
Family
ID=29227011
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004265856A Active JP4805558B2 (ja) | 2003-09-12 | 2004-09-13 | 画像撮影装置及び方法 |
JP2011118357A Pending JP2011229159A (ja) | 2003-09-12 | 2011-05-26 | 撮像制御装置及び撮像装置の制御方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004265856A Active JP4805558B2 (ja) | 2003-09-12 | 2004-09-13 | 画像撮影装置及び方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7525575B2 (ja) |
JP (2) | JP4805558B2 (ja) |
GB (1) | GB2405948B (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7697827B2 (en) | 2005-10-17 | 2010-04-13 | Konicek Jeffrey C | User-friendlier interfaces for a camera |
US8467672B2 (en) * | 2005-10-17 | 2013-06-18 | Jeffrey C. Konicek | Voice recognition and gaze-tracking for a camera |
US7995106B2 (en) * | 2007-03-05 | 2011-08-09 | Fujifilm Corporation | Imaging apparatus with human extraction and voice analysis and control method thereof |
US20090262205A1 (en) * | 2008-04-21 | 2009-10-22 | Dana Stephen Smith | Voice activated headset imaging system |
JP5053950B2 (ja) * | 2008-07-29 | 2012-10-24 | キヤノン株式会社 | 情報処理方法、情報処理装置、プログラムおよび記憶媒体 |
CN103383594B (zh) * | 2012-05-04 | 2018-01-05 | 富泰华工业(深圳)有限公司 | 电子设备及其控制方法 |
US9794527B1 (en) | 2012-09-28 | 2017-10-17 | Google Inc. | Content capture |
US9747900B2 (en) | 2013-05-24 | 2017-08-29 | Google Technology Holdings LLC | Method and apparatus for using image data to aid voice recognition |
CN108718378B (zh) * | 2013-09-12 | 2020-07-17 | 麦克赛尔株式会社 | 影像记录装置和方法 |
CN103491304B (zh) * | 2013-09-25 | 2017-04-05 | 深圳市金立通信设备有限公司 | 一种拍照方法及移动终端 |
US20150334258A1 (en) * | 2014-04-03 | 2015-11-19 | Olloclip, Llc | Auxiliary photography systems for mobile devices |
KR20170070864A (ko) * | 2014-10-13 | 2017-06-23 | 루크 시스템 인크 | 음성 신호를 이용하여 단말을 제어하는 촬영 시스템 |
JP6504808B2 (ja) * | 2014-12-22 | 2019-04-24 | キヤノン株式会社 | 撮像装置、音声コマンド機能の設定方法、コンピュータプログラム、及び記憶媒体 |
US9866741B2 (en) | 2015-04-20 | 2018-01-09 | Jesse L. Wobrock | Speaker-dependent voice-activated camera system |
JP6634755B2 (ja) * | 2015-09-18 | 2020-01-22 | カシオ計算機株式会社 | 電子機器、システム、保存制御方法及びプログラム |
US10360910B2 (en) | 2016-08-29 | 2019-07-23 | Garmin Switzerland Gmbh | Automatic speech recognition (ASR) utilizing GPS and sensor data |
KR102329888B1 (ko) * | 2017-01-09 | 2021-11-23 | 현대자동차주식회사 | 음성 인식 장치, 이를 포함하는 차량, 및 음성 인식 장치의 제어방법 |
CN110033502B (zh) * | 2018-01-10 | 2020-11-13 | Oppo广东移动通信有限公司 | 视频制作方法、装置、存储介质及电子设备 |
JP7307565B2 (ja) * | 2019-03-19 | 2023-07-12 | キヤノン株式会社 | 撮像装置、制御方法、およびプログラム |
US11902656B2 (en) * | 2022-06-29 | 2024-02-13 | Western Digital Technologies, Inc. | Audio sensors for controlling surveillance video data capture |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02256040A (ja) * | 1988-12-28 | 1990-10-16 | Konica Corp | カメラ |
JP2001305642A (ja) * | 2000-04-25 | 2001-11-02 | Fuji Photo Film Co Ltd | 撮像装置 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60205433A (ja) * | 1984-03-29 | 1985-10-17 | Canon Inc | 音声入力カメラ |
JPS60205432A (ja) | 1984-03-29 | 1985-10-17 | Canon Inc | 音声入力カメラ |
US4951079A (en) * | 1988-01-28 | 1990-08-21 | Konica Corp. | Voice-recognition camera |
JPH02256039A (ja) * | 1988-12-28 | 1990-10-16 | Konica Corp | カメラ |
JPH03158839A (ja) * | 1989-11-17 | 1991-07-08 | Canon Inc | カメラ |
JPH0455841A (ja) * | 1990-06-25 | 1992-02-24 | Minolta Camera Co Ltd | 遠隔操作装置付きカメラ |
JP3106795B2 (ja) * | 1993-09-21 | 2000-11-06 | 松下電器産業株式会社 | パルス幅変調増幅器 |
JPH09138433A (ja) * | 1995-11-16 | 1997-05-27 | Olympus Optical Co Ltd | カメラのブレ軽減装置 |
US5959667A (en) * | 1996-05-09 | 1999-09-28 | Vtel Corporation | Voice activated camera preset selection system and method of operation |
US6049766A (en) | 1996-11-07 | 2000-04-11 | Creative Technology Ltd. | Time-domain time/pitch scaling of speech or audio signals with transient handling |
JPH10282570A (ja) * | 1997-04-10 | 1998-10-23 | Asahi Optical Co Ltd | カメラのリモートコントロール装置 |
US6711536B2 (en) | 1998-10-20 | 2004-03-23 | Canon Kabushiki Kaisha | Speech processing apparatus and method |
JP2000227633A (ja) * | 1999-02-04 | 2000-08-15 | Olympus Optical Co Ltd | 音声制御可能なカメラ |
JP2002091466A (ja) | 2000-09-12 | 2002-03-27 | Pioneer Electronic Corp | 音声認識装置 |
JP4359743B2 (ja) * | 2001-05-25 | 2009-11-04 | 富士フイルム株式会社 | カメラの制御方法及びカメラ |
GB2385697B (en) | 2002-02-14 | 2005-06-15 | Canon Kk | Speech processing apparatus and method |
GB0204474D0 (en) | 2002-02-26 | 2002-04-10 | Canon Kk | Speech recognition system |
JP2004343232A (ja) * | 2003-05-13 | 2004-12-02 | Nec Corp | 通信装置及び通信方法 |
GB2405949A (en) * | 2003-09-12 | 2005-03-16 | Canon Kk | Voice activated device with periodicity determination |
-
2003
- 2003-09-12 GB GB0321446A patent/GB2405948B/en not_active Expired - Lifetime
-
2004
- 2004-09-10 US US10/937,343 patent/US7525575B2/en active Active
- 2004-09-13 JP JP2004265856A patent/JP4805558B2/ja active Active
-
2011
- 2011-05-26 JP JP2011118357A patent/JP2011229159A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02256040A (ja) * | 1988-12-28 | 1990-10-16 | Konica Corp | カメラ |
JP2001305642A (ja) * | 2000-04-25 | 2001-11-02 | Fuji Photo Film Co Ltd | 撮像装置 |
Also Published As
Publication number | Publication date |
---|---|
GB2405948B (en) | 2006-06-28 |
GB0321446D0 (en) | 2003-10-15 |
JP2005122139A (ja) | 2005-05-12 |
JP4805558B2 (ja) | 2011-11-02 |
US20050128311A1 (en) | 2005-06-16 |
US7525575B2 (en) | 2009-04-28 |
GB2405948A (en) | 2005-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011229159A (ja) | 撮像制御装置及び撮像装置の制御方法 | |
CN101675659B (zh) | 使用理想特征识别的拍摄系统和方法 | |
JP4989767B2 (ja) | カメラシステム及びカメラシステムを動作させる方法 | |
JP4975813B2 (ja) | 音声による遠隔制御 | |
KR102131733B1 (ko) | 모바일 단말기 및 모바일 단말기 상에서 촬영을 시작하는 방법 | |
US20140247368A1 (en) | Ready click camera control | |
WO2005045807A1 (ja) | 電子機器 | |
WO2014183529A1 (zh) | 切换移动终端通话模式的方法、装置及存储介质 | |
US20130235245A1 (en) | Managing two or more displays on device with camera | |
CN105100624A (zh) | 一种拍摄方法及终端 | |
JP2005122139A5 (ja) | ||
TWI658315B (zh) | 拍照系統及方法 | |
JP2016058982A (ja) | 撮像装置 | |
CN103024268A (zh) | 一种基于声音信息引导提示拍照的方法 | |
JP2007096834A (ja) | ドアホン装置およびその撮影方法 | |
JP2018191023A (ja) | 撮像システム | |
CN111667822B (zh) | 语音处理装置、会议系统以及语音处理方法 | |
JP2006019978A5 (ja) | ||
JP2016010085A (ja) | 撮像装置 | |
JPH01191840A (ja) | 音声認識カメラ | |
JPS5880631A (ja) | 音声操作カメラ | |
JP4473083B2 (ja) | 撮影装置及びその着信音出力方法 | |
JP2022167186A (ja) | 撮像装置 | |
JP2023025464A (ja) | 遠隔会議システム、方法及びプログラム | |
JPS6235074Y2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120704 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120709 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121003 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130401 |