JP2023035599A - 撮像装置、制御方法、およびプログラム - Google Patents
撮像装置、制御方法、およびプログラム Download PDFInfo
- Publication number
- JP2023035599A JP2023035599A JP2021142588A JP2021142588A JP2023035599A JP 2023035599 A JP2023035599 A JP 2023035599A JP 2021142588 A JP2021142588 A JP 2021142588A JP 2021142588 A JP2021142588 A JP 2021142588A JP 2023035599 A JP2023035599 A JP 2023035599A
- Authority
- JP
- Japan
- Prior art keywords
- subject
- audio signal
- gain
- external microphone
- imaging
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Studio Devices (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【課題】被写体の状態が変化した場合にも、被写体からの音声の音量変化を抑制して録音できる技術を提供する。【解決手段】本発明の撮像装置は、被写体を撮像する撮像手段と、外部マイクと接続する接続手段と、前記撮像手段によって撮像された画角内における前記被写体の所定のパーツの向きに基づいて、前記外部マイクから入力された第1の音声信号のゲインを調整する調整手段とを有することを特徴とする。【選択図】図2
Description
本発明は、外部マイクと接続可能な撮像装置に関するものである。
映像コンテンツの作成において、撮影時に、複数のマイク(マイクロフォン)を用いて主被写体の音声と、その周囲の環境音とを録音し、撮影後に、撮影画像に合うよう(例えば撮影現場の臨場感が表現されるよう)各種音声を調整することがある。しかし、音声を調整する作業は複雑で時間がかかってしまう。
特許文献1には、複数のマイクを内蔵するカメラが、無線マイクの音声信号と合成するマイクを決定し、無線マイクがある音源までの距離および方向に基づいて音声信号の合成音量を調整する技術が開示されている。
被写体からの音声は、被写体の状態(顔の向き、体の向きなど)が変わることで、カメラの内蔵マイクおよび無線マイクに入る音量が変化してしまう場合がある。そして、被写体までの距離および方向に基づいて合成音量を調整しても、被写体の状態の変化による音量の変化は調整されない。しかし、被写体からの音声は、被写体の顔の向きなどによらずに、一定音量で録音されることが望ましい。
本発明は、被写体の状態が変化した場合にも、被写体からの音声の音量変化を抑制して録音できるようにすることを目的とする。
本発明の撮像装置は、被写体を撮像する撮像手段と、外部マイクと接続する接続手段と、前記撮像手段によって撮像された画角内における前記被写体の所定のパーツの向きに基づいて、前記外部マイクから入力された第1の音声信号のゲインを調整する調整手段とを有することを特徴とする。
本発明によれば、被写体の状態が変化した場合にも、被写体からの音声の音量変化を抑制して録音することができる。
[第一の実施形態]
以下に、本発明の第一の実施形態を説明する。図1は、本実施形態に係る撮像装置の一例であるカメラ100の構成例を示すブロック図である。
以下に、本発明の第一の実施形態を説明する。図1は、本実施形態に係る撮像装置の一例であるカメラ100の構成例を示すブロック図である。
レンズ102は、ズームユニットや、絞り・シャッタユニット、フォーカスユニットなどを含むレンズユニットであり、撮影光学系を含む。撮像部104は、CMOSセンサやCCDセンサなどの撮像素子を含む。撮像部104は、撮影光学系(各レンズ群)によって結像された光学像の光電変換を行い、光電変換によって得られた電気信号(アナログ信号)を撮像処理部105に出力する。レンズアクチュエータ制御部103は、モータドライバICを含み、レンズ102のズームユニットや、絞り・シャッタユニット、フォーカスユニットなどに含まれた各種アクチュエータを駆動する。レンズアクチュエータ制御部103は、CPU101からの指示に従って各種アクチュエータを駆動する。
CPU101は、カメラ100の全体を制御する中央制御部である。撮像処理部105は、撮像部104から入力されたアナログ信号のA/D変換などを行い、A/D変換によって得られた電気信号(デジタル信号)を画像処理部106に出力する。以後、撮像処理部105から出力される電気信号を「画像信号」と記載する。画像信号は「画像データ」と呼んでもよい。
画像処理部106は、撮像処理部105から入力された画像信号を用いた処理を適宜行う。例えば、画像処理部106は、入力された画像信号にトリミング処理や回転処理などの画像処理を施し、画像処理後の画像信号をCPU101に出力してもよい。トリミング処理や回転処理などは、例えば撮像された画角の揺れを低減するために行われる。画像処理部106は、入力された画像信号をCPU101に出力してもよい。画像処理部106は、入力された画像信号に基づいて、撮像部104によって撮像された画角内における被写体(例えば主被写体)の所定のパーツを検出してもよい。例えば、画像処理部106は、入力された画像信号に基づく画像から所定のパーツの領域を検出する。被写体と所定のパーツは特に限定されないが、例えば、被写体は人物であり、所定のパーツは顔および体である。また、画像処理部106は、被写体が装着している外部マイク200の位置を検出する。画像処理部106は、撮像された画角内における所定のパーツのサイズ(画角に対する相対的なサイズ)を計算してもよい。例えば、画像処理部106は、入力された画像信号に基づく画像の全画素数に対する所定のパーツの画素数の割合を計算してもよい。そして、画像処理部106は、所定のパーツの検出結果や、所定のパーツのサイズの計算結果などを、CPU101に出力してもよい。
操作部111は、ユーザーがカメラ100を操作するためのボタンやスイッチなどを含む。記憶部112は、画像信号(画像データ)や音声信号(音声データ)などを記憶可能な記録媒体である。例えば、CPU101は、画像処理部106から入力された画像信号や、当該画像信号と同等のタイミングで得られた音声信号(音声処理部107から入力された音声信号)などを、互いに関連付けて記憶部112に記録する。図1では記憶部112がカメラ100に内蔵されているが、記憶部112はカメラ100とは別体の外部装置であってもよい。
表示部113は、LCD(液晶ディスプレイ)などのディスプレイを備え、CPU101からの指示に応じて画像を表示する。例えば、CPU101は、画像処理部106から入力された画像信号に基づく画像を表示部113に表示したり、記憶部112に格納された画像信号に基づく画像を表示部113に表示(再生)したりする。外部端子114は、
カメラ100を外部装置に接続するための端子である。電源部115は、カメラ100の各部に供給する電力を蓄えたバッテリーである。電源部115は、カメラ100の各部に供給する電力をAC電源から得るためのACアダプターなどであってもよい。電源制御部116は、カメラ100の各部に必要な電力が供給されるように電源部115を制御する。
カメラ100を外部装置に接続するための端子である。電源部115は、カメラ100の各部に供給する電力を蓄えたバッテリーである。電源部115は、カメラ100の各部に供給する電力をAC電源から得るためのACアダプターなどであってもよい。電源制御部116は、カメラ100の各部に必要な電力が供給されるように電源部115を制御する。
内蔵マイク108は、カメラ100に内蔵されたマイク(マイクロフォン)である。内蔵マイク108は、内蔵マイク108に入力された音声を電気信号(デジタル信号)に変換し、音声処理部107に出力する。以後、内蔵マイク108から出力される電気信号を「音声信号」と記載する。音声信号は「音声データ」と呼んでもよい。カメラ100は、1つまたは複数の内蔵マイク108を内蔵する。カメラ100に1つの内蔵マイク108が内蔵されている場合にはモノラル録音が可能となり、カメラ100に複数の内蔵マイク108が内蔵されている場合にはモノラル録音とステレオ録音が可能となる。
無線部109は、外部装置との間で、WifiやBLEなどの無線規格に準拠した無線通信を行うことができる。本実施形態では、無線部109は、外部マイク200と無線で接続される。
外部マイク200は、例えばワイヤレスマイクである。外部マイク200は、外部マイク200に入力された音声を電気信号(デジタル信号)に変換し、無線で出力(送信)する。以後、外部マイク200から出力される電気信号も「音声信号」と記載する。外部マイク200から送信された音声信号は、無線部109で受信される。無線部109は、受信した音声信号を音声処理部107で処理可能な音声信号に変換し、音声処理部107に出力する。なお、音声処理部107で処理可能な音声信号への変換はCPU101で行われてもよい。
なお、カメラ100がマイクジャックを有する場合には、外部マイク200は、フォーンプラグでマイクジャックに接続可能な有線ケーブルマイクであってもよい。そのような外部マイク200は、外部マイク200に入力された音声を電気信号(アナログ信号)に変換し、音声処理部107に出力する。その場合には、音声処理部107は、外部マイク200から入力された音声信号(アナログ信号)をデジタル信号に変換する。
音声処理部107は、内蔵マイク108から入力された音声信号と、外部マイク200から(無線部109を介して)入力された音声信号とに対して音声処理を行い、音声処理後の音声信号をCPU101と音声出力部110に出力する。CPU101は、音声信号を記憶部112から読み出して音声処理部107に出力してもよく、音声処理部107は、CPU101から入力された音声信号に対して音声処理を行い、音声処理後の音声信号を音声出力部110に出力してもよい。そうすることで、記憶部112に格納された音声信号に基づく音声を音声出力部110から出力(再生)することができる。音声出力部110はスピーカーを備え、音声処理部107から入力された音声信号に基づいて音声を出力する。
図2は、カメラ100の動作例を示すフローチャートである。図2に示す処理は、例えば、ユーザーからの動画記録開始の指示により開始される。ユーザーは、例えば、操作部111に含まれた動画記録開始ボタンを押下することによって、動画記録開始を指示する。各ステップの処理は、CPU101が図1で説明した各機能ブロックを制御することにより実行される。
ステップS201では、CPU101は、ユーザーから動画記録開始の指示を受け付けて動画記録を開始する。CPU101は、動画記録を開始すると、レンズ102から入光
した被写体像を、撮像部104において光電変換により電気信号に変換する。CPU101は、光電変換された電気信号を、撮像処理部105で画像信号に変換する。撮像処理部105から出力された画像信号は、画像処理部106に入力され、用途に応じて加工される。
した被写体像を、撮像部104において光電変換により電気信号に変換する。CPU101は、光電変換された電気信号を、撮像処理部105で画像信号に変換する。撮像処理部105から出力された画像信号は、画像処理部106に入力され、用途に応じて加工される。
ステップS202では、CPU101は、画像信号の中から主な撮像対象の人物である主被写体を検出するように、画像処理部106を制御する。画像処理部106は、入力された画像信号に基づく撮像画像の中から画像認識処理によって被写体(例えば、人物)を抽出する。画像処理部106は、複数の被写体が抽出された場合、主被写体となる人物を選択するためのパラメータである被写体パラメータに基づいて主被写体を検出する。
被写体パラメータは、例えば、被写体とカメラ100との距離、カメラ100に対する被写体の向き、撮影画角の中心に対する被写体の顔の位置といった項目を含む。
CPU101は、例えば、被写体の顔のサイズ(画角に対する相対的なサイズ)によって、被写体とカメラ100との距離を判断することができる。具体的には、画像処理部106は、入力された画像信号に基づく画像の全画素数に対して顔が占める領域の画素数の割合を、顔のサイズとして計算してもよい。CPU101は、被写体の顔のサイズが他の被写体の顔のサイズよりも大きければ、カメラ100からの距離が他の被写体よりも近いと判断することができる。CPU101は、被写体とカメラ100との距離が近いほど、距離についての被写体パラメータの値を大きい値に設定する。
また、CPU101は、例えば、被写体の目の数、位置、向きから、被写体のカメラ100に対する向きを判断することができる。なお、被写体の向きは、体の向き、足先の向きなどに基づいて判断してもよい。CPU101は、被写体の向きと、カメラ100の光軸方向との角度の差が小さいほど、向きについての被写体パラメータの値を大きい値に設定する。
また、CPU101は、例えば、撮影画角の中心を基準とする被写体の顔の中心の座標から、被写体の顔の位置を判断することができる。CPU101は、被写体の顔の位置が、撮影画角の中心に近いほど、位置についての被写体パラメータの値を大きい値に設定する。
CPU101は、各被写体パラメータの重みづけをしてもよく、あらかじめパラメータごとの重みづけの情報を保持しておく。各被写体パラメータの重みづけは、例えば、カメラ100と撮影対象との距離、撮影対象範囲、撮影対象の人数などに応じてあらかじめ設定される。CPU101は、撮像画像に複数の被写体がいる場合にも、上述した複数種類の被写体パラメータの値の合計が最も大きい被写体を主被写体として抽出することができる。
なお、主被写体は、複数種類の被写体パラメータのうちの少なくともいずれか1つの値に基づいて決定されてもよい。また、上記の被写体パラメータによって決定される場合に限られず、主被写体は、外部マイク200を装着している被写体、あらかじめ認証用の画像が登録されている被写体など、各種方法により決定されてもよい。
ステップS203では、CPU101は、カメラ100から主被写体(人物)までの距離に関する距離情報を取得する。例えば、CPU101は、レンズアクチュエータ制御部103を制御して、主被写体に合焦するよう、レンズ102の有する複数の光学レンズを光軸方向にそれぞれ前後させる。そして、CPU101は、主被写体に合焦した状態での焦点距離に基づいて、カメラ100から主被写体までの距離を判断する。なお、距離情報
の取得方法は特に限定されず、例えば、CPU101は、各種測距センサを用いて距離情報を取得してもよい。
の取得方法は特に限定されず、例えば、CPU101は、各種測距センサを用いて距離情報を取得してもよい。
ステップS204では、CPU101は、画像処理部106により主被写体の顔を抽出し、主被写体の顔の向きを判別する。具体的には画像処理部106は、抽出した主被写体の顔から、目、鼻、耳、口などの特徴部分を抽出し、それぞれの数量を取得する。また、画像処理部106は、主被写体の顔のサイズに対する目、鼻、耳、口などのサイズの比率を取得する。画像処理部106は、目、鼻、耳、口の数量およびサイズの比率などに基づいて、主被写体の顔の向きを判別する。
画像処理部106は、主被写体の顔の向きがカメラ100に対して正面向きか、右向きか、左向きかを判別する場合、抽出した目または耳の数が2つであれば、主被写体の顔の向きは、カメラ100に対して正面向きであると判別する。なお、画像処理部106は、目の数が2つであっても、主被写体の顔のサイズに対する片方の目のサイズの比率が、他方の目のサイズの比率よりも小さい場合、主被写体の顔の向きは、比率が小さい目がある向きに向いていると判別してもよい。画像処理部106は、目または耳の数が1つの場合、主被写体の顔は、鼻または口がある側に向いていると判別することができる。
ステップS205では、CPU101は、画像処理部106により主被写体の体を抽出し、主被写体の体の向きを判別する。具体的には画像処理部106は、抽出した主被写体から、手(腕)、足などの特徴部分を抽出して、それぞれの数量を取得する。また、画像処理部106は、主被写体の顔のサイズに対する体のサイズの比率を取得する。画像処理部106は、手、足の数量および顔のサイズに対する体のサイズの比率などに基づいて、主被写体の体の向きを判別する。
画像処理部106は、主被写体の体の向きがカメラ100に対して正面向きか、右向きか、左向きかを判別する場合、抽出した手または足の数が2本であれば、主被写体の体の向きは、カメラ100に対して正面向きであると判別する。また、画像処理部106は、顔のサイズに対する体のサイズの比率が所定の閾値よりも小さい場合には、右向きまたは左向きであると判別してもよい。この場合、画像処理部106は、足先の向きに基づいて、右向きか左向きかを判別することができる。
ステップS206では、CPU101は、画像処理部106により、主被写体が装着する外部マイク200の位置を判別する。画像処理部106は、ステップS202で検出した主被写体の周辺に存在する外部マイク200を撮像画像から抽出する。画像処理部106は、判別した外部マイク200の位置から、外部マイク200が頭部に装着されているか、胸部など頭部以外に装着されているかを判別する。
カメラ100に接続される外部マイク200があらかじめ決まっている場合には、外部マイク200の形状が、例えば外部マイク200を撮像した画像によって、あらかじめ記憶部112に記憶されるようにしてもよい。画像処理部106は、記憶部112に記憶されている外部マイク200の形状に合致または類似するマイクを撮像画像から抽出し、抽出したマイクの位置を主被写体が装着する外部マイク200の位置と判別することができる。
また、外部マイク200が発光部を有する場合には、発光部の発光色および発光タイミングの情報があらかじめ記憶部112に記憶されるようにしてもよい。画像処理部106は、記憶部112に記憶されている外部マイク200の発光色および発光タイミングに合致または類似するマイクを撮像画像から抽出し、抽出したマイクの位置を主被写体が装着する外部マイク200の位置と判別することができる。
カメラ100に接続される外部マイク200が決まっていない場合には、複数のマイクの形状、発光色、および発光タイミングがあらかじめ記憶部112に記憶されるようにしてもよい。画像処理部106は、記憶部112に記憶されているいずれかのマイクの形状、発光色、発光タイミングに合致または類似し、主被写体の近傍に存在するマイクを撮像画像から抽出し、抽出したマイクの位置を外部マイク200の位置と判別することができる。
ここで、図3から図6参照して、内蔵マイク108および外部マイク200に入力される主被写体の声の音量の変化について説明する。内蔵マイク108および外部マイク200に入力される主被写体の声の音量は、カメラ100までの距離、顔の向き、体の向き、外部マイク200の装着位置といった被写体の状態により変化する。
図3(A)および図3(B)は、主被写体の顔の向きの変化による音量の変化を説明する図である。主被写体に装着された外部マイク200に入力される音量は、主被写体の顔の向きによって変化する。
図3(A)は、主被写体である人物301がカメラ100の正面におり、人物301の顔および体がカメラ100に対して正面向きの状態を示す。図3(B)は、主被写体である人物301がカメラ100の正面におり、人物301の顔がカメラ100に対して横向きで、体がカメラ100に対して正面向きの状態を示す。
図3(A)および図3(B)に示すカメラ100は、内蔵マイク108および無線部109を備える。内蔵マイク108は、主にカメラ100の周囲の環境音を収音するために使用される。人物301は、外部マイク200を胸部に装着している。
外部マイク200は、ピンマイクであり、人物301が着用している服などにピン止めされている。外部マイク200は、主に装着している人物301の声を収音する。外部マイク200からカメラ100に送信される音声信号は、無線通信によってカメラ100内部の無線部109にデジタル信号として送信される。
図3(A)の状態と、図3(B)の状態とで、内蔵マイク108および外部マイク200に入力される主被写体の声の音量は、主被写体である人物301の顔の向きに応じて変化する。図3(A)の状態では、人物301は、カメラ100に対して顔を正面に向けて話している。この場合、例えば、人物301の声は、内蔵マイク108には-70dBの音量で入力され、外部マイク200には-50dBの音量で入力されたものとする。
図3(A)から図3(B)の状態に変化した場合、主被写体である人物301の顔の向きがカメラ100対して正面向きから横向きに変化し、人物301の顔の向きは、体の向きと異なる。人物301の顔が横向きになることで、内蔵マイク108および外部マイク200に入力される声の音量はそれぞれ減少する。例えば、内蔵マイク108に入力される音量が5dB減少し、外部マイク200に入力される音量が10dB減少した場合、人物301の声は、内蔵マイク108では-75dB、外部マイク200では-60dBの音量で入力される。このように、主被写体の顔の向きの変化によって、内蔵マイク108および外部マイク200に入力される主被写体の声の音量は変化する。
図4(A)および図4(B)は、主被写体の顔および体の向きの変化による音量の変化を説明する図である。図4(A)は、主被写体である人物401がカメラ100の正面におり、人物401の顔および体がカメラ100に対して正面向きの状態を示す。図4(B)は、主被写体である人物401がカメラ100の正面におり、人物401の顔および体
がカメラ100に対して横向きの状態を示す。
がカメラ100に対して横向きの状態を示す。
図4(A)から図4(B)の状態に変化した場合、主被写体である人物401の顔および体の向きは、カメラ100対して正面向きから横向きに変化している。人物401の顔が横向きになることで、内蔵マイク108に入力される声の音量は減少する。一方で、人物401の顔の向きが体の向きと同じであるため、外部マイク200に入力される声の音量は変化しない。
図4(A)の状態では、人物401は、カメラ100に対して顔および体を正面に向けて話している。例えば、人物401の声は、内蔵マイク108には-70dBの音量で入力され、外部マイク200には-50dBの音量で入力されたものとする。
図4(A)から図4(B)の状態に変化した場合、主被写体である人物401の顔および体の向きは、カメラ100に対して正面向きから横向きに変化している。人物401の顔が横向きになることで、内蔵マイク108に入力される声の音量は減少する。一方、人物401の顔の向きが体の向きと同じであるため、外部マイク200に入力される声の音量は変化しない。例えば内蔵マイク108に記録される音量が5dB減少し、外部マイク200に入力される音量が変化しない場合には、人物401の声は、内蔵マイク108では-75dB、外部マイク200では-50dBの音量で入力される。
このように、主被写体の顔および体の向きの変化によって、内蔵マイク108および外部マイク200に入力される主被写体の声の音量は、変化する場合と、変化しない場合とがある。内蔵マイク108および外部マイク200に入力される音量は、カメラ100に対する主被写体の顔の向き、体の向き、および顔の向きと体の向きとの関係などによって変化する。
図5(A)および図5(B)は、胸部の外部マイク200に入力される音量の変化を説明する図である。外部マイク200は、主被写体である人物501の胸部に取り付けられている。図5(A)は、主被写体である人物501が胸部に外部マイク200を装着し、カメラ100に対して顔および体を正面に向けている状態を示す。図5(B)は、主被写体である人物501が胸部に外部マイク200を装着し、カメラ100に対して体を正面に向け、顔を横に向けている状態を示す。
図5(A)から図5(B)の状態に変化した場合、主被写体である人物501の顔の向きは、カメラ100対して正面向きから横向きに変化している。一方で、人物501の体の向きは、カメラ100対して正面向きのまま変化していない。人物501の顔が横向きになることで、外部マイク200に入力される声の音量は減少する。
図5(A)の状態では、人物501は、胸部に外部マイク200を装着し、カメラ100に対して正面を向いて話している。例えば、人物501の声は、外部マイク200には-50dBの音量で入力されたものとする。
図5(A)から図5(B)の状態に変化した場合、主被写体である人物501の顔の向きがカメラに対して正面向きから横向きに変化し、人物501の顔の向きは、体の向きと異なる。人物501の顔が横向きになることで、外部マイク200に入力される声の音量は減少する。例えば、外部マイク200に入力される声の音量が10dB減少した場合には、人物501の声は、外部マイク200には-60dBの音量で入力される。このように、主被写体が胸部に外部マイク200を装着している場合、主被写体の顔の向きの変化によって、外部マイク200に入力される声の音量は変化する。
図6(A)および図6(B)は、頭部の外部マイク200に入力される音量の変化を説明する図である。外部マイク200は、主被写体である人物601の頭部に取り付けられている。図6(A)は、主被写体である人物601が頭部に外部マイク200を装着し、カメラ100に対して顔および体を正面に向けている状態を示す。図6(B)は、主被写体である人物601が頭部に外部マイク200を装着し、カメラ100に対して体を正面に向け、顔を横に向けている状態を示す。
図6(A)から図6(B)の状態に変化した場合、主被写体である人物601の顔の向きは、カメラ100対して正面向きから横向きに変化している。一方で、人物501の体の向きは、カメラ100対して正面向きのまま変化していない。人物601の顔が横向きになっても、頭部に装着された外部マイク200は、顔の向きに合わせて向きを変えるため、人物601の口と外部マイク200との位置関係は変化しない。外部マイク200が頭部に装着されている場合には、人物601の顔の向きが変化しても、外部マイク200に入力される声の音量は変化しない。
図6(A)の状態では、人物601は、頭部に外部マイク200を装着し、カメラ100に対して正面を向いて話している。例えば、人物601の声は、外部マイク200には-50dBの音量で入力されたものとする。
図6(A)から図6(B)の状態に変化した場合、主被写体である人物601の顔の向きは、正面向きから横向きに変化している。人物601の顔が横向きになっても、外部マイク200に入力される声の音量は変化せず、人物601の声は-50dBの音量で入力される。このように、主被写体が頭部に外部マイク200を装着している場合、主被写体の顔の向きが変化しても、外部マイク200に入力される声の音量は変化しない。
図3から図6で説明したように、主被写体の顔の向き、主被写体の体の向き、外部マイク200の主被写体への装着位置などの条件によって内蔵マイク108および外部マイク200に入力される音量は変化する。
図2に戻り、ステップS207では、CPU101は、内蔵マイク108および外部マイク200で収音した主被写体の声を記憶部112に記録する録音音量を調整する。具体的には、CPU101は、ステップS204からステップS206で判別した顔の向き、体の向き、外部マイク200の位置などの被写体の状態に基づいて、内蔵マイク108および外部マイク200に入力される主被写体の声の音量変化量を予測する。
音量変化量は、被写体の状態がどのように変化したかに応じて、あらかじめ記憶部112に記憶される。CPU101は、記憶部112を参照して、被写体の状態の変化に対応する音量変化量を予測することができる。例えば、主被写体の体の向きが正面向きの状態で、顔の向きが正面向きから横向きに変化した場合(図3(A)から図3(B)の状態に変化した場合)、外部マイク200の音量変化量は-10dBとして、記憶部112に記憶される。また、内蔵マイク108の音量変化量は-5dBとして、記憶部112に記憶される。
CPU101は、予測した主被写体の声の音量変化量に基づいて、内蔵マイク108および外部マイク200で収音された音声信号を、記憶部112に記録する際の録音音量のゲインを調整する。CPU101は、内蔵マイク108および外部マイク200の調整後の音声信号を合成し、画像処理部106から入力された画像信号と関連付けて記憶部112に記録する。
ここで、図7を参照して、被写体の状態が変化した場合の録音音量の調整について説明
する。被写体の状態は、例えば、カメラ100までの距離、顔の向き、体の向き、外部マイク200の装着位置である。CPU101は、被写体の状態に基づいて、音量変化量を予測し、内蔵マイク108および外部マイク200の録音音量(ゲイン)を調整する。CPU101は、図7に示す表に従って、録音音量を調整するか否かを判断することができる。
する。被写体の状態は、例えば、カメラ100までの距離、顔の向き、体の向き、外部マイク200の装着位置である。CPU101は、被写体の状態に基づいて、音量変化量を予測し、内蔵マイク108および外部マイク200の録音音量(ゲイン)を調整する。CPU101は、図7に示す表に従って、録音音量を調整するか否かを判断することができる。
図7の例では、CPU101は、主被写体からカメラ100までの距離が、所定距離未満か所定距離以上かを判別する。所定距離は、あらかじめ設定された距離であり、記憶部112に記憶されている。
またCPU101は、カメラ100に対する主被写体の顔の向きが、正面向きか横向きかを判別する。なお、CPU101は、正面向きと横向きの2分類に限られず、顔の向きを正面向き、斜向き、横向きの3つに分類し、各分類に合わせて内蔵マイク108および外部マイク200のゲインを調整してもよい。また、CPU101は、主被写体の両目の位置などに基づいてカメラ100の光軸に対する顔の角度を取得し、取得した角度に応じてゲインを調整してもよい。
またCPU101は、カメラ100に対する主被写体の体の向きが、正面向きか横向きかを判別する。なお、CPU101は、正面向きか横向きかの2分類に限られず、体の向きを正面向き、斜向き、横向きの3つに分類し、各分類に合わせて内蔵マイク108および外部マイク200のゲインを調整してもよい。また、CPU101は、主被写体の足先の向きなどに基づいてカメラ100の光軸に対する体の角度を取得し、取得した角度に応じてゲインを調整してもよい。
またCPU101は、外部マイク200が装着されている位置が、頭部か胸部かを判別する。なお、CPU101は、頭部か胸部かの2分類に限られず、外部マイク200の位置が、頭部、右胸部、左胸部、右腕部、左腕部のように分類し、各分類に合わせて内蔵マイク108および外部マイク200のゲインを調整してもよい。
図7では、例えば、カメラ100までの距離が所定距離よりも短く、顔が正面向き、体が横向きで、外部マイク200を胸部に装着している場合、外部マイク200のゲインを大きくする。一方、顔の向きがカメラ100に対して正面向きであるため、内蔵マイク108のゲインは、調整されず標準のままである。このように、内蔵マイク108および外部マイク200のゲインは、被写体の状態に応じて、あらかじめ定義されたテーブルに従って調整される。
また、内蔵マイク108または外部マイク200のゲインを大きくする場合の増加量は、例えば、被写体の状態を変えた場合の音量の変化量を実測したデータに基づいて、あらかじめ記憶部112に記憶させてもよい。この場合、図7に示すように、ゲインを標準とするか大きくするかを定義するのではなく、ゲインの調整量を定義するテーブルが記憶部112に格納されればよい。
CPU101は、主被写体の顔の向き、および体の向きなどが変わった場合、主被写体の状態に基づいて、内蔵マイク108および外部マイク200に入力される声の音量変化量を予測し、予測した音量変化量に基づいて音声信号のゲインを調整する。したがって、CPU101は、主被写体の状態が変化しても、主被写体の声の音量変化を抑制して記憶部112に記録することができる。
なお、カメラ100から主被写体までの距離が所定距離よりも短くない場合には、カメラ100内部の内蔵マイク108に入力される主被写体の声は、収音されないか、わずか
な音量でしか収音されない。この場合に、内蔵マイク108から入力された音声信号のゲインを大きくすると、カメラ100の周囲の環境音が大きくなり、録音品質は低下するおそれがある。したがって、カメラ100から主被写体までの距離が所定距離よりも短くない場合、CPU101は、内蔵マイク108の録音音量を調整しないように制御する。ここでの所定距離は、メーカーやユーザーなどがあらかじめ設定した距離とすることができる。
な音量でしか収音されない。この場合に、内蔵マイク108から入力された音声信号のゲインを大きくすると、カメラ100の周囲の環境音が大きくなり、録音品質は低下するおそれがある。したがって、カメラ100から主被写体までの距離が所定距離よりも短くない場合、CPU101は、内蔵マイク108の録音音量を調整しないように制御する。ここでの所定距離は、メーカーやユーザーなどがあらかじめ設定した距離とすることができる。
図2に戻り、ステップS208では、CPU101は、ユーザーから動画記録停止が指示されたか否かを判断する。ユーザーは、例えば、操作部111に含まれた動画記録停止ボタンを押下することによって、動画記録停止を指示する。CPU101が、ユーザーから動画記録停止が指示されたと判断した場合、動画記録処理は終了する。CPU101が、ユーザーから動画記録停止が指示されていないと判断した場合、ステップS209の処理が実行される。
ステップS209では、CPU101は、主被写体の状態(カメラ100までの距離、顔の向き、体の向き、外部マイク200の装着位置)のいずれかが変化したか否かを判断する。CPU101が、主被写体の状態のいずれかが変化したと判断した場合、ステップS202の処理に戻る。CPU101が、主被写体の状態のいずれも変化していないと判断した場合、ステップS208の処理に戻る。
以上説明したように、本実施形態によれば、撮像部104によって撮像された画角内における被写体の所定のパーツの向きに基づいて、外部マイク200から入力された音声信号のゲインが調整される。これにより、所定のパーツの向きが変化した場合にも、被写体からの音声の音量変化を抑制して記憶部112に録音することができる。また、本実施形態によれば、カメラ100から被写体までの距離、外部マイク200の装着位置が変わった場合にも、被写体からの音声の音量変化を抑制して記憶部112に録音することができる。
[第二の実施形態]
以下に、本発明の第二の実施形態を説明する。なお、以下では、第一の実施形態と同じ点(処理や構成など)についての説明は省略し、第一の実施形態と異なる点について説明する。第一の実施形態では、音声信号を記憶部112に録音する際に、主被写体の状態に基づいてゲインを調整する例を説明した。第二の実施形態では、ゲインは調整せずに、音声信号、および主被写体の状態を記憶部112に記録し、記録した音声信号に基づく音声を再生する際に、記録した主被写体の状態に基づいてゲインを調整する。音声の再生は、編集のための再生であってもよい。
以下に、本発明の第二の実施形態を説明する。なお、以下では、第一の実施形態と同じ点(処理や構成など)についての説明は省略し、第一の実施形態と異なる点について説明する。第一の実施形態では、音声信号を記憶部112に録音する際に、主被写体の状態に基づいてゲインを調整する例を説明した。第二の実施形態では、ゲインは調整せずに、音声信号、および主被写体の状態を記憶部112に記録し、記録した音声信号に基づく音声を再生する際に、記録した主被写体の状態に基づいてゲインを調整する。音声の再生は、編集のための再生であってもよい。
図8は、カメラの記録動作例を示すフローチャートである。図8に示す処理は、例えば、ユーザーからの動画記録開始の指示により開始される。ステップS801~S806、S808、S809の処理は、図2(第一の実施形態)のステップS201~S206、S208、S209の処理と同じである。
本実施形態では、図2(第一の実施形態)のステップS207の処理の代わりに、ステップS807の処理が行われる。ステップ807では、CPU101は、主被写体の状態をタイムコードに関連付けて記憶部112に記録する。また、動画記録中、CPU101は、画像処理部106から入力された画像信号、内蔵マイク108から入力された音声信号、外部マイク200から入力された音声信号などを、タイムコードに関連付けて記憶部112に記録する。記録するタイムコードはCPU101によって順次更新される。これにより、被写体の状態と、画像信号および音声信号とは、互いに関連付けられて記憶部112に記録される。
図3から図6で説明したように、主被写体の顔の向き、主被写体の体の向き、外部マイク200の主被写体への装着位置などの被写体の状態によって内蔵マイク108および外部マイク200に入力される主被写体の声の音量は変化する。本実施形態では、被写体の状態をタイムコードに関連付けて記憶部112に記録しておくことで、CPU101は、記録した動画を再生する場合に、タイムコードに関連付けて記録された被写体の状態に基づいて、再生音量を調整することができる。
図9は、カメラの再生動作例を示すフローチャートである。図9に示す処理は、例えば、ユーザーからの動画再生開始の指示により開始される。ユーザーは、例えば、操作部111に含まれた動画再生開始ボタンを押下することによって、動画記録再生開始を指示する。各ステップの処理は、CPU101が図1で説明した各機能ブロックを制御することにより実行される。
ステップS901では、CPU101は、図8のステップS807の処理で記録した、主被写体の顔の向き、主被写体の体の向き、外部マイク200の主被写体への装着位置などの被写体の状態と、被写体の状態に関連付けられたタイムコードとを読み出す。また、CPU101は、再生する画像信号および音声信号も記憶部112から読み出す。
ステップS902では、CPU101は、ステップS901で読み出した被写体の状態に基づいて、記憶部112から読み出された内蔵マイク108および外部マイク200の音声信号の再生音量(ゲイン)を調整する。
ステップS903では、CPU101は、調整した内蔵マイク108の音声信号と外部マイク200の音声信号とを合成して画像信号とともに再生する。なお、CPU101は、内蔵マイク108および外部マイク200に入力された音声信号を、それぞれ被写体の状態に基づいてゲインを調整してから個別に記憶部112に記録し、再生時に合成して再生してもよい。
ステップS904では、CPU101は、ユーザーから動画再生停止が指示されたか否かを判断する。ユーザーは、例えば、操作部111に含まれた動画再生停止ボタンを押下することによって、動画再生停止を指示する。CPU101が、ユーザーから動画再生停止が指示されたと判断した場合、動画再生処理は終了する。CPU101が、ユーザーから動画再生停止が指示されていないと判断した場合、ステップS901の処理に戻る。
以上説明したように、本実施形態によれば、被写体の状態と、画像信号および音声信号とは、互いに関連付けられて記憶部112に記録される。そして、記録された画像信号に基づく画像と、記録された音声信号に基づく音声との再生時に、被写体の状態に基づいてゲインが調整される。これにより、再生時において第一の実施形態と同様の効果を得ることができる。具体的には、被写体の状態が変化した場合にも、被写体からの音声の音量変化を抑制して再生することができる。
以上、本発明の好ましい実施形態について説明したが、本発明はこれらの実施形態に限定されず、その要旨の範囲内で種々の変形および変更が可能である。また、第一の実施形態で説明した処理と、第二の実施形態で説明した処理とを適宜組み合せることも可能である。本発明を適用した撮像装置としてカメラを例に挙げたが、本発明は、被写体を撮像することのできる様々な装置に適用可能である。また、被写体(主被写体)として人物を例に挙げたが、鳴き声を発する動物や、音を発する物体など、様々な被写体を撮像する場合に本発明は適用可能である。また、動画撮影を行う場合の例を説明したが、静止画とともに音声を記録する静止画撮影を行う場合にも、本発明は適用可能である。また、主被写体
の顔や体の向きが変わった場合に、録音音量を調整する例を説明したが、環境音の変化を抑制するため、音声帯域(300Hz~3.4KHz程度)の録音音量のみを変更する場合にも、本発明は適用可能である。また、マイクに届きにくくなる低周波数帯域の録音音量のみを制御する場合にも、本発明は適用可能である。
の顔や体の向きが変わった場合に、録音音量を調整する例を説明したが、環境音の変化を抑制するため、音声帯域(300Hz~3.4KHz程度)の録音音量のみを変更する場合にも、本発明は適用可能である。また、マイクに届きにくくなる低周波数帯域の録音音量のみを制御する場合にも、本発明は適用可能である。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100:カメラ、101:CPU、104:撮像部、106:画像処理部、109:無線部、200:外部マイク
Claims (19)
- 被写体を撮像する撮像手段と、
外部マイクと接続する接続手段と、
前記撮像手段によって撮像された画角内における前記被写体の所定のパーツの向きに基づいて、前記外部マイクから入力された第1の音声信号のゲインを調整する調整手段と
を有することを特徴とする撮像装置。 - 前記調整手段は、前記所定のパーツの向きと、前記外部マイクが前記被写体に装着されている位置とに基づいて、前記第1の音声信号のゲインを調整する
ことを特徴とする請求項1に記載の撮像装置。 - 内蔵マイクをさらに有し、
前記調整手段は、前記所定のパーツの向きおよび前記撮像装置から前記被写体までの距離のうち少なくともいずれかに基づいて、前記内蔵マイクから入力された第2の音声信号のゲインも、さらに調整する
ことを特徴とする請求項1または2に記載の撮像装置。 - 前記調整手段は、前記外部マイクが前記被写体の頭部に装着されている場合、前記第1の音声信号のゲインを調整しない
ことを特徴とする請求項3に記載の撮像装置。 - 前記所定のパーツは、前記被写体の顔であり、
前記調整手段は、前記外部マイクが前記被写体の頭部に装着され、前記撮像装置から前記被写体までの距離が所定距離よりも短い場合に、
前記撮像装置から見た前記被写体の顔の向きが正面向きであれば、前記第2の音声信号のゲインを調整せず、
前記撮像装置から見た前記被写体の顔の向きが横向きであれば、前記第2の音声信号のゲインを大きくする
ことを特徴とする請求項4に記載の撮像装置。 - 前記調整手段は、前記外部マイクが前記被写体の頭部に装着され、前記撮像装置から前記被写体までの距離が所定距離よりも短くない場合、前記第2の音声信号のゲインを調整しない
ことを特徴とする請求項4または5に記載の撮像装置。 - 前記所定のパーツは、前記被写体の顔および体であり、
前記調整手段は、前記外部マイクが前記被写体の胸部に装着され、前記撮像装置から前記被写体までの距離が所定距離よりも短い場合に、
前記撮像装置から見た前記被写体の顔の向きが正面向きであれば、前記第2の音声信号のゲインを調整せず、
前記撮像装置から見た前記被写体の顔の向きが横向きであれば、前記第2の音声信号のゲインを大きくする
ことを特徴とする請求項3に記載の撮像装置。 - 前記調整手段は、前記外部マイクが前記被写体の胸部に装着され、前記撮像装置から前記被写体までの距離が所定距離よりも短くない場合、前記第2の音声信号のゲインを調整しない
ことを特徴とする請求項3に記載の撮像装置。 - 前記調整手段は、前記外部マイクが前記被写体の胸部に装着されている場合に、
前記被写体の顔の向きが体の向きと同じ場合は、前記第1の音声信号のゲインを調整せず、
前記被写体の顔の向きが体の向きと異なる場合は、前記第1の音声信号のゲインを大きくする
ことを特徴とする請求項7または8に記載の撮像装置。 - 前記撮像手段から入力された画像信号と、前記調整手段によって調整された前記第1の音声信号および前記第2の音声信号を合成した音声信号と、を記録媒体に記録する記録手段を、さらに有する
ことを特徴とする請求項3~9のいずれか1項に記載の撮像装置。 - 前記撮像手段によって撮像された画角内における複数の人物のうち、前記撮像装置との距離、前記撮像装置に対する向き、撮影画角の中心に対する顔の位置のうち少なくともいずれかに基づいて抽出した人物を、前記被写体として検出する画像処理手段を、さらに有する
ことを特徴とする請求項1~10のいずれか1項に記載の撮像装置。 - 被写体を撮像する撮像手段と、
外部マイクと接続する接続手段と、
前記撮像手段から入力された画像信号、前記外部マイクから入力された第1の音声信号、および、前記撮像手段によって撮像された画角内における前記被写体の所定のパーツの向きに関する情報を、互いに関連付けて記録媒体に記録する記録手段と
を有することを特徴とする撮像装置。 - 前記記録媒体に記録された前記画像信号に基づき画像を再生するとともに、前記記録媒体に記録された前記第1の音声信号に基づき音声を再生する再生手段と、
前記再生手段が前記音声を再生する際に、前記記録媒体に記録された前記所定のパーツの向きに関する情報に基づいて、前記第1の音声信号のゲインを調整する調整手段と
をさらに有する
ことを特徴とする請求項12に記載の撮像装置。 - 前記調整手段は、前記所定のパーツの向きと、前記外部マイクが前記被写体に装着されている位置とに基づいて、前記第1の音声信号のゲインを調整する
ことを特徴とする請求項13に記載の撮像装置。 - 内蔵マイクをさらに有し、
前記記録手段は、前記画像信号、前記第1の音声信号、前記所定のパーツの向きに関する情報、前記撮像装置から前記被写体までの距離、および、前記内蔵マイクから入力された第2の音声信号を、互いに関連付けて前記記録媒体に記録し、
前記再生手段は、前記画像を再生するとともに、前記記録媒体に記録された前記第1の音声信号と前記第2の音声信号とに基づき前記音声を再生し、
前記調整手段は、前記所定のパーツの向きおよび前記撮像装置から前記被写体までの距離のうち少なくともいずれかに基づいて、前記内蔵マイクから入力された第2の音声信号のゲインも、さらに調整する
ことを特徴とする請求項13または14に記載の撮像装置。 - 前記調整手段は、前記第1の音声信号の低周波数帯域のゲインまたは音声帯域のゲインを調整する
ことを特徴とする請求項1~11、13~15のいずれか1項に記載の撮像装置。 - 前記調整手段は、前記第2の音声信号の低周波数帯域のゲインまたは音声帯域のゲインを調整する
ことを特徴とする請求項3~10、15のいずれか1項に記載の撮像装置。 - 被写体を撮像するステップと、
外部マイクと接続するステップと、
撮像された画角内における前記被写体の所定のパーツの向きに基づいて、前記外部マイクから入力された音声信号のゲインを調整するステップと
を有することを特徴とする撮像装置の制御方法。 - コンピュータを、請求項1~17のいずれか1項に記載の撮像装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021142588A JP2023035599A (ja) | 2021-09-01 | 2021-09-01 | 撮像装置、制御方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021142588A JP2023035599A (ja) | 2021-09-01 | 2021-09-01 | 撮像装置、制御方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023035599A true JP2023035599A (ja) | 2023-03-13 |
Family
ID=85503842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021142588A Pending JP2023035599A (ja) | 2021-09-01 | 2021-09-01 | 撮像装置、制御方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023035599A (ja) |
-
2021
- 2021-09-01 JP JP2021142588A patent/JP2023035599A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4054177B1 (en) | Audio processing method and device | |
JP6094190B2 (ja) | 情報処理装置および記録媒体 | |
US10142618B2 (en) | Imaging apparatus and imaging method | |
US20120002075A1 (en) | Imaging control apparatus, imaging control method, and program | |
JP2009118420A (ja) | 情報処理装置、情報処理方法、プログラム、記録媒体及び情報処理システム | |
US10254842B2 (en) | Controlling a device based on facial expressions of a user | |
CN114697812A (zh) | 声音采集方法、电子设备及系统 | |
JP2022184863A (ja) | 情報取得システム及び情報取得システムの制御方法 | |
CN108632695A (zh) | 一种耳机 | |
JP5299034B2 (ja) | 撮影装置 | |
JP5214394B2 (ja) | カメラ | |
JP2003264900A (ja) | 音響提示システムと音響取得装置と音響再生装置及びその方法並びにコンピュータ読み取り可能な記録媒体と音響提示プログラム | |
JP2023035599A (ja) | 撮像装置、制御方法、およびプログラム | |
JP2020067955A (ja) | 表示システム、デバイス、プログラム、及びデバイスの制御方法 | |
JP2023037377A (ja) | 撮像装置、制御方法、およびプログラム | |
JP2011188374A (ja) | 撮影機器 | |
US20130271647A1 (en) | Sound pickup device and imaging device | |
JP5750668B2 (ja) | カメラ、再生装置、および再生方法 | |
JP2023034722A (ja) | 撮像装置、制御方法、およびプログラム | |
WO2010061791A1 (ja) | 映像制御装置およびそれを備えた撮像装置、表示装置 | |
JP2011130134A (ja) | 撮像装置、撮像システム | |
JP4515005B2 (ja) | 電子カメラ | |
JP2021141505A (ja) | 撮像装置、制御方法、およびプログラム | |
WO2022218271A1 (zh) | 一种视频录制方法和电子设备 | |
JP2014072642A (ja) | 動画像データ処理システム、動画像データ送信装置、及び動画像データ受信装置 |