JP2018074219A - 音声処理装置 - Google Patents

音声処理装置 Download PDF

Info

Publication number
JP2018074219A
JP2018074219A JP2016208232A JP2016208232A JP2018074219A JP 2018074219 A JP2018074219 A JP 2018074219A JP 2016208232 A JP2016208232 A JP 2016208232A JP 2016208232 A JP2016208232 A JP 2016208232A JP 2018074219 A JP2018074219 A JP 2018074219A
Authority
JP
Japan
Prior art keywords
directivity
audio
correlation
signal
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016208232A
Other languages
English (en)
Inventor
友仁 井上
Tomohito Inoue
友仁 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2016208232A priority Critical patent/JP2018074219A/ja
Publication of JP2018074219A publication Critical patent/JP2018074219A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】
被写体の持つ音響的な特性や被写体の配置等によって、どのような撮影環境でどのような指向性に設定すればいいのかわかりにくい。
【解決手段】
複数の音声信号を入力する音声入力手段と、指向性生成手段と、複数の音声信号の相関を検出する相関検出手段と、音声信号のレベルを検出するレベル検出手段と、入力される複数の音声信号の相関とレベルに応じて、前記指向性生成手段で設定する指向性の推奨度を算出する算出手段とを有する。
【選択図】 図2

Description

本発明は音声処理装置に関する。
従来、音声信号を処理する装置として、画像信号を記録すると共に音声信号を記録する撮像装置が知られている。これら撮像装置では、小さな筐体に配置されたマイクでも、記録する音声信号のステレオ感を向上させるために、ステレオ感強調する機能を備えるものがある。また被写体である音源や、ユーザの好みに応じて、ステレオ感強調(指向性)の設定を切り替えられるものも存在する(特許文献1)。
特開2014−72661号公報
しかしながら、全てのユーザが音について詳しい知識を持っているわけではないため、被写体の持つ音響的な特性や被写体の配置等によって、どのような撮影環境でどのような指向性に設定すればいいのかわかりにくいという課題があった。
そこで、本発明は各種の指向性設定に対してガイドを表示することで、ユーザがどのような指向性設定にすればいいかわかりやすくすることができる音声信号処理装置を提供することを目的とする。
複数の音声信号を入力する音声入力手段と、指向性生成手段と、複数の音声信号の相関を検出する相関検出手段と、音声信号のレベルを検出するレベル検出手段と、入力される複数の音声信号の相関とレベルに応じて、前記指向性生成手段で設定する指向性の推奨度を算出する算出手段とを有する。
本発明によれば、撮影環境に適した指向性切り替えの設定を知ることができる。
撮像装置のブロック図である。 音声処理部のブロック図である。 音声処理部の周波数特性を示す図である。 音声処理部における指向性の推奨値について説明する図である。 音声処理部における指向性の推奨値について説明する図である。
音声信号を処理、録音することができる撮像装置について説明する。図1は、実施例1の撮像装置100の構成を示すブロック図である。
図1において、撮像部101は、撮影レンズにより取り込まれた被写体の光学像を撮像素子により画像信号に変換し、アナログデジタル変換、画像調整処理などを行い、画像データを生成する。音声入力部102は、内蔵または音声端子を介して接続された複数のマイクにより、撮像装置100の周辺の音声を集音し、アナログデジタル変換、音声処理などを行い音声データを生成する。音声処理部103は、音声入力部102により得られた音声データに対し、音声信号処理を行う。
メモリ104は、撮像部101により得られた画像データや、音声処理部104で処理された音声データを一時的に記憶する。表示制御部105は、撮像部101により得られた画像データに係る映像や、撮像装置100の操作画面、メニュー画面等を表示部106や、不図示の映像端子を介して外部のディスプレイに表示させる。符号化処理部107は、メモリ104に一時的に記憶された画像データや音声データを読み出して所定の符号化を行い、圧縮画像データ、圧縮音声データ等を生成する。
記録再生部108は、記録媒体109に対して、符号化処理部107で生成された圧縮画像データ、圧縮音声データ等を記録したり、記録媒体109に記録された圧縮画像データ、圧縮音声データ、各種データ、プログラムを読み出す。ここで、記録媒体109は、圧縮画像データ、圧縮音声データ、等を記録することができれば、磁気ディスク、光学式ディスク、半導体メモリなどのあらゆる方式の記録媒体を含む。
制御部110は、撮像装置100の各ブロックに制御信号を送信することで撮像装置100の各ブロックを制御することができ、各種制御を実行するためのCPUやメモリなどからなる。操作部111は、ボタンやダイヤルなどからなり、ユーザの操作に応じて、指示信号を制御部110に送信する。音声出力部112は、記録再生部108により再生された圧縮音声データや、制御部110により出力される音声データをスピーカ113や音声端子などに出力する。
外部出力部114は、記録再生部108により再生された圧縮映像データや圧縮音声データなどを外部機器に出力する。データバス115は、音声データや画像データ等の各種データ、各種制御信号を撮像装置100の各ブロックに供給する。ここで、本実施例の撮像装置100の通常の動作について説明する。本実施例の撮像装置100は、ユーザが操作部111を操作して電源を投入する指示が出されたことに応じて、付図示の電源供給部から、撮像装置の各ブロックに電源を供給する。
電源が供給されると、制御部110は、例えば、操作部111のモード切り換えスイッチが、例えば、撮影モード、再生モード等のどのモードであるかを操作部111からの指示信号により確認する。動画記録モードでは、撮像部101により得られた画像データと音声入力部102により得られた音声データとを1つのファイルとして保存することができる。再生モードでは、記録媒体109に記録された圧縮画像データを記録再生部108により再生して表示部106に表示させることができる。
動画記録モードでは、まず、制御部110は、撮影待機状態に移行させるように制御信号を撮像装置100の各ブロックに送信し、以下のような動作をさせる。撮像部101は、撮影レンズにより取り込まれた被写体の光学像を撮像素子により画像信号に変換し、アナログデジタル変換、画像調整処理などを行い、画像データを生成する。そして、得られた画像データを表示処理部105に送信し、表示部106に表示させる。ユーザはこの様にして表示された画面を見ながら撮影の準備を行う。
音声入力部102は、複数のマイクにより得られたアナログ音声信号をデジタル変換し、複数のデジタル音声信号を生成する。音声処理部103は得られたデジタル音声信号に対して、任意の信号処理を施し、マルチチャンネルの音声データを生成する。そして、得られた音声データを音声出力部112に送信し、接続されたスピーカ113や不図示のイヤホンから音声として出力させる。ユーザは、この様にして出力された音声を聞きながら記録音量を決定するためのマニュアルボリュームの調整をすることもできる。
次に、ユーザが操作部111の記録ボタンを操作することにより撮影開始の指示信号が制御部110に送信されると、制御部110は、撮像装置100の各ブロックに撮影開始の指示信号を送信し、以下のような動作をさせる。撮像部101は、撮影レンズにより取り込まれた被写体の光学像を撮像素子により画像信号に変換し、アナログデジタル変換、画像調整処理などを行い、画像データを生成する。そして、得られた画像データを表示処理部105に送信し、表示部106に表示させる。また、得られた画像データをメモリ104送信する。
音声入力部102は、複数のマイクにより得られたアナログ音声信号をデジタル変換し、複数のデジタル音声信号を得る。音声処理部103は得られたデジタル音声信号に対して、任意の信号処理を施し、マルチチャンネルの音声データを生成する。そして、得られた音声データをメモリ104に送信する。
符号化処理部107は、メモリ104に一時的に記憶された画像データや音声データを読み出して所定の符号化を行い、圧縮画像データ、圧縮音声データ等を生成する。そして、制御部110は、これらの圧縮画像データ、圧縮音声データを合成し、データストリームを形成し、記録再生部108に出力する。記録再生部108は、UDF、FAT等のファイルシステム管理のもとに、データストリームを一つの動画ファイルとして記録媒体109に書き込んでいく。
以上の動作を撮影中は継続する。そして、ユーザが操作部111の記録ボタンを操作することにより撮影終了の指示信号が制御部110に送信されると、制御部110は、撮像装置100の各ブロックに撮影終了の指示信号を送信し、以下のような動作をさせる。撮像部101、音声入力部102は、それぞれ画像データ、音声データの生成を停止する。符号化処理部107は、メモリに記憶されている残りの画像データと音声データとを読出して所定の符号化を行い、圧縮画像データ、圧縮音声データ等を生成し終えたら動作を停止する。
そして、制御部110は、これらの最後の圧縮画像データ、圧縮音声データを合成し、データストリームを形成し、記録再生部108に出力する。記録再生部108は、UDF、FAT等のファイルシステム管理のもとに、データストリームを一つの動画ファイルとして記録媒体108に書き込んでいく。そして、データストリームの供給が停止したら、動画ファイルを完成させて、記録動作を停止させる。制御部110は、記録動作が停止すると、撮影待機状態に移行させるように制御信号を撮像装置100の各ブロックに送信して、撮影待機状態に戻る。
次に、再生モードでは、制御部110は、再生状態に移行させるように制御信号を撮像装置100の各ブロックに送信し、以下のような動作をさせる。記録媒体109に記録された圧縮画像データと圧縮音声データとからなる動画ファイルを記録再生部108が読出して、読出された圧縮画像データ、圧縮音声データは、符号化処理部107に送る。
符号化処理部107は、圧縮画像データ、圧縮音声データを復号してそれぞれ、表示制御部105、音声処理部103に送信する。音声処理部103は得られたデジタル音声信号に対して、任意の信号処理を施し、得られた音声データを音声出力部112に送信する。表示制御部105は、復号された画像データを表示部106に表示させる。音声出力部112は、復号された音声データを内蔵または、取付けられた外部スピーカから出力させる。
本実施例の撮像装置は以上のように、画像、音声の記録再生を行うことができる。
ところで、本実施例の音声処理部103は、マイクにより得られた複数のアナログ音声信号に対応する複数のデジタル音声信号に対して、指向性を切り替える処理を実行している。以下に、図2を用いて本実施例における指向性切り替えの処理について説明する。
図2は、図1の音声処理部103の詳細な機能を示すブロック図である。まず、入力された音声信号から、ステレオ信号生成部201でステレオ感が強調されたステレオ信号と、モノラル信号生成部202でステレオ感のないモノラル信号を生成する。ステレオ信号生成部201は、入力された音声信号をLPFに通すことで位相を変化させ、反対のチャンネルの信号から減算し、さらにそれによる周波数特性の変化をEQで補正することで、ステレオ感が増幅された音声信号を生成する。
例えば1kHz近傍ののステレオ感を強調するために、LPFを1000Hzに設定した場合(図3-301)、反対のチャンネルから減算すると、1000Hz以下が減衰した周波数特性となる(図3-302)。それを補正するために図3-303のような高域がブーストされたLPFをかける。EQは低域のカットオフが100Hz、高域のカットオフを1200Hzに設定することで、出力の周波数特性が400Hz以上の帯域がフラットになるように補正される(図3-304)。モノラル信号生成部202は、LR2チャンネルの信号を加算し、デジタルフィルタで周波数特性を補正することで、モノラル信号を生成する。
ステレオ信号生成部201で生成されたステレオ信号と、モノラル信号生成部202で生成されたモノラル信号は、指向性切り替え部203に入力される。指向性切り替え部203では、設定される指向性に応じてミックスゲイン204〜206が変化する。設定される指向性が、最もステレオ感が強い「ワイド」、LRが同じモノラル信号の「モノラル」、両者の中間である「ノーマル」と設定が変更される場合、「ワイド」が設定されると、ミックスゲイン204/205が最大、ミックスゲイン206が最小に設定され、「モノラル」が設定されると、ミックスゲイン204/205が最小、ミックスゲイン206が最大に設定され、「ノーマル」が設定されると、ミックスゲイン204/205とミックスゲイン206が1:1に設定される。
これらの処理により、指向性の切り替えが実現される。次に、入力される複数の音声信号の相関とレベルに応じて、指向性生成手段で設定する指向性の推奨度を算出する方法について説明する。ステレオ信号生成部201で生成されたステレオ音声信号は、LRの相関を検出するため、相関検出部207に入力され、LPFで高周波成分をカットし、和成分と差成分を生成される。LPFのカットオフは、マイク間隔やマイク個体差のばらつきから、ステレオ信号生成部201で設定しているのと同じ1200Hzとする。
相関検出部207で検出されるLR相関は、和成分と差成分の比から算出され、差成分が大きくなるとLR相関が小さくなり、ステレオ感は大きくなる。逆に差成分が小さくなるとLR相関が大きくなり、ステレオ感は小さくなる(モノラルに聴こえる)。LRのステレオ信号であるレベル差が付くような和成分と差成分の比を1で、レベル差が付かなくなるような比を0で正規化したものをLR相関とし、1よりも差成分の比率が大きくなった場合には1で、0よりも差成分の比率が小さくなった場合には0でリミットする。
LR相関が大きいほど信号はモノラルに近くなるため、指向性の設定をワイドにしても効果がないため、推奨度はモノラル>ノーマル>ワイドの順に大きくなり、LR相関が小さいほど信号はステレオ感を感じられ、指向性をワイドに設定することで臨場感を得ることができるため、推奨度はワイド>ノーマル>モノラルの順に大きくなることが望ましい。それぞれの指向性の推奨度を1で正規化した値は、以下の式で算出される。グラフを図4に示す。
モノラル推奨度 = LR相関
ワイド推奨度 = −LR相関 + 1
ノーマル推奨度(LR相関<0.5) = LR相関 + 0.5
ノーマル推奨度(LR相関>0.5) = −2 × LR相関 + 2
ここで算出された推奨度は、撮像装置の指向性切り替え設定画面で、表示部106に表示される。図5に本実施例での各指向性の推奨度の表示を示す。メータ形式のインジケータとなっており、推奨度が高いほどメータが大きく振れる。ここで、表示部106の更新周期は映像の垂直同期信号周波数の周期であり、16.6ms/20msといった周期で更新が行われるが、その頻度で推奨度の更新が行われてもユーザが指向性の設定をしにくい可能性があるため、LR相関を映像の垂直同期信号周波数の周期よりも十分に長い期間積分し、その情報を元に各指向性の推奨度を算出するようにしてもよい。
また、指向性をワイドに設定すると、低域の減衰をEQで補正するため、低域のSNが低下し、具体的には低域のノイズが増加する。指向性をワイドに設定するメリットは、音声信号のステレオ感を増加させ、臨場感を向上させることであるが、信号のレベルが低い場合には、その効果は減少する。
つまり、信号レベルが低い場合には、ノイズが増加し臨場感の向上も減少してしまうため、LR相関が小さくても指向性はモノラル寄りに設定した方が音質の向上に寄与する。これらの特性を踏まえ、レベル検出部208で検出される、信号レベルがある閾値を下回った場合には、モノラルの推奨度を大きくし、ノーマルとワイドの推奨度を小さくする。それぞれの指向性の推奨度を1で正規化した値は、以下の式で算出される。グラフを図5に示す。
モノラル推奨度 = 1
ワイド推奨度 = 0
ノーマル推奨度(LR相関<0.5) = 0.5 × LR相関
ノーマル推奨度(LR相関>0.5) = −0.5 × LR相関 + 0.5
これらの制御を追加することにより、ユーザはより撮影環境に適した指向性設定を選択することが可能となる。
100 撮像装置
101 撮像部
102 音声入力部
103 音声処理部
104 メモリ
105 表示制御部

Claims (5)

  1. 複数の音声信号を入力する音声入力手段と、
    指向性生成手段と、
    複数の音声信号の相関を検出する相関検出手段と、
    音声信号のレベルを検出するレベル検出手段と、
    入力される複数の音声信号の相関とレベルに応じて、前記指向性生成手段で設定する指向性の推奨度を算出する算出手段とを有することを特徴とする音声処理装置。
  2. 前記算出手段は、前記相関検出手段における信号の相関が大きいときには、前記指向性生成手段で設定する指向性の広い設定の推奨度を小さくし、前記指向性生成手段で設定する指向性の狭い設定の推奨度を大きくすることを特徴とする請求項1に記載の音声処理装置。
  3. 前記算出手段は、前記相関検出手段における信号の相関が小さいときには、前記指向性生成手段で設定する指向性の広い設定の推奨度を大きくし、前記指向性生成手段で設定する指向性の狭い設定の推奨度を小さくすることを特徴とする請求項1に記載の音声処理装置。
  4. 前記レベル検出手段における音声信号のレベルが小さいときには、前記指向性生成手段で設定する指向性の広い設定の推奨度を小さくし、前記指向性生成手段で設定する指向性の狭い設定の推奨度を大きくすることを特徴とする請求項1乃至3のいずれか1項に記載の音声処理装置。
  5. 画像を表示する表示装置を備え、
    前記指向性生成手段で設定する指向性の推奨度を表示する表示の更新周期を、前記表示装置自体の画像の更新周期よりも十分に長くすることを特徴とする請求項1乃至4のいずれか1項に記載の音声処理装置。
JP2016208232A 2016-10-25 2016-10-25 音声処理装置 Pending JP2018074219A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016208232A JP2018074219A (ja) 2016-10-25 2016-10-25 音声処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016208232A JP2018074219A (ja) 2016-10-25 2016-10-25 音声処理装置

Publications (1)

Publication Number Publication Date
JP2018074219A true JP2018074219A (ja) 2018-05-10

Family

ID=62115932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016208232A Pending JP2018074219A (ja) 2016-10-25 2016-10-25 音声処理装置

Country Status (1)

Country Link
JP (1) JP2018074219A (ja)

Similar Documents

Publication Publication Date Title
US10142759B2 (en) Method and apparatus for processing audio with determined trajectory
KR100636213B1 (ko) 실시간 주파수 특성 보정 방법 및 그를 적용한 사운드재생 장치
JP2010513972A (ja) 音声データを処理する装置及び方法
JP2018050222A (ja) フィルタ生成装置、フィルタ生成方法、及びプログラム
JP2013009199A (ja) 音響制御装置、音響補正装置、及び音響補正方法
US10535363B2 (en) Audio processing apparatus and control method thereof
TWM519370U (zh) 具有可依據聽力生理狀況調整等化器設定之電子裝置及聲音播放裝置
CN110072181B (zh) 低音增感方法及装置
JP2012003021A (ja) 音声処理装置及び音声処理方法、撮像装置
JP2007158873A (ja) 音声補正装置
JP2011119783A (ja) 音声信号処理装置
JP2018074220A (ja) 音声処理装置
US10425731B2 (en) Audio processing apparatus, audio processing method, and program
JP2018074219A (ja) 音声処理装置
JP6985821B2 (ja) 音声処理装置及びその制御方法
JP2019161334A (ja) 音声処理装置
JP6929137B2 (ja) 音声処理装置及びその制御方法
JP2019179944A (ja) 音声切替装置
JP2002095095A (ja) 音量制御装置
JP5317936B2 (ja) 音声信号処理装置
JP2019091988A (ja) 音声処理装置および音声処理方法
JP5340127B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法
JP2019161333A (ja) 音声処理装置
KR100703923B1 (ko) 멀티미디어기기를 위한 입체음향 최적화 장치 및 방법
JPWO2019016905A1 (ja) 音響処理装置及び音響出力装置