JP2016009952A - 音声信号処理装置 - Google Patents

音声信号処理装置 Download PDF

Info

Publication number
JP2016009952A
JP2016009952A JP2014128699A JP2014128699A JP2016009952A JP 2016009952 A JP2016009952 A JP 2016009952A JP 2014128699 A JP2014128699 A JP 2014128699A JP 2014128699 A JP2014128699 A JP 2014128699A JP 2016009952 A JP2016009952 A JP 2016009952A
Authority
JP
Japan
Prior art keywords
filter
unit
data
audio
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014128699A
Other languages
English (en)
Inventor
博幸 森
Hiroyuki Mori
博幸 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014128699A priority Critical patent/JP2016009952A/ja
Publication of JP2016009952A publication Critical patent/JP2016009952A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

【課題】違和感のないゲイン制御を行う。【解決手段】音声信号をデジタル信号に変換する変換部のゲインを切り替えるアンプ部と、変換部の出力の倍音成分が聞こえない帯域以下を通過させる第1のフィルタと、第1のフィルタの通過帯域以下の周波数を通過させる第2のフィルタと、第1のフィルタの出力と変換部の出力の一方を選択するスイッチと、スイッチの出力からアンプ部のゲインを制御するゲイン制御部と、ゲイン制御部の出力の高調波の折り返しノイズを低減する第3のフィルタと、第2のフィルタの出力が閾値を超えている場合に第1のフィルタの出力を選択させる制御手段とを備える。【選択図】図1

Description

本発明は、音声信号処理装置に関し、特にレベル制御に関する。
従来、音声信号処理装置として、撮像装置が知られている。これらの撮像装置においては、音声のレベルを制御するAGC回路が搭載されているものがほとんどであり、その中で特許文献1、2のように、AGC制御対象の周波数は所定の周波数帯のみしている。
特開平05−198089号公報 特開平08−297923号公報
しかし、周波数の高い10KHz以上で大きな音が入力され音声が歪んだ場合、歪み成分も耳につきにくい20KHz以上の高い箇所で発生する。そのためこのような高い音声に対して歪まないような制御を行った場合、元音源に対して歪み成分が付着されるより、全体の感度変化が発生する方が、聴感上違和感が大きくなってしまうという課題があった。
そこで、本発明は、歪んでも聴感上違和感のない周波数帯域以上で音声が歪む場合はゲイン制御を行わず歪ませる処理のままとして、全体の感度を変えないように制御することで、このような解決することができる音声信号処理装置を提供することを目的とする。
本発明の音声信号処理装置は、かかる目的を達成するために、音声信号をデジタル化するデジタル変換部と、デジタル変換部のデータのゲインを切り替えるデジタルアンプ部と、デジタル変換部のデータの倍音成分が聞こえない帯域以下を通過させるLPF1と、LPF1以下の周波数を通過させるLPF2と、LPF1の出力データもしくはデジタル変換部のデータ出力のいずれかを判定部のデータにより切り替えるSWと、LPF2のデータがある閾値を超えているか否かを判定する判定部と、SWのデータからデジタルアンプ部のゲインを制御するゲイン制御部を有し、判定部がLPF2のデータが閾値を越えている場合はLPF1出力データによりゲイン制御部を動作させる音声処理装置を有する構成とした。
本発明によれば、音声データが歪んでも聴感上違和感のない周波数帯域以上で音声が歪む場合はゲイン制御を行わず歪ませる処理のままとし全体の感度を変えないように制御することで、違和感のないゲイン制御を行うことを可能とする。
音声信号処理装置のブロック図である。 音声処理部のブロック図である。 音声処理部のブロック図である。 音声信号の処理を示すフローチャートである。 音声信号の処理を示す制御フローチャートである。 音声信号の周波数特性を示す図である。 サンプリング周波数の切替選択画面を示す図である。 音質効果の切替選択画面を示す図である。
以下、図面を参照して本発明の実施例を詳細に説明するが、この発明は以下の実施の形態に限定されない。
図1、図2、図4、図6を用いて、音声信号をデジタル化するデジタル変換部と、デジタル変換部のデータのゲインを切り替えるデジタルアンプ部と、デジタル変換部のデータの倍音成分が聞こえない帯域以下を通過させるLPF1と、LPF1以下の周波数を通過させるLPF2と、LPF1の出力データもしくはデジタル変換部のデータ出力のいずれかを判定部のデータにより切り替えるSWと、LPF2のデータがある閾値を超えているか否かを判定する判定部と、SWのデータからデジタルアンプ部のゲインを制御するゲイン制御部を有し、判定部がLPF2のデータが閾値を越えている場合はLPF1出力データによりゲイン制御部を動作させる音声処理装置を有する音声信号処理装置について説明する。
図1は、実施例1の撮像装置100の全体構成を示すブロック図である。図1において、101は、撮影レンズにより取り込まれた被写体の光学像をCCDセンサやCMOSセンサ等の撮像素子により画像信号に変換し、アナログデジタル変換をして、画像処理部102に送信する撮像部。102は、入力されたデジタル画像信号に、設定値に基づいてホワイトバランスや色、明るさなどを調整する画質調整処理を行いメモリ105や後述の表示制御部111、制御部114に送信する画像処理部。
103は、内蔵されたマイクまたは音声入力端子を介して接続された外部マイク等により、撮像装置100の周辺の音声を集音し、アナログデジタル変換をして音声処理部104に送信する音声入力部。104は、入力されたデジタル音声信号のレベルの適正化処理、特定周波数の低減処理等の音声に関する処理を行いメモリ105に送信する音声処理部。105は、画像処理部102、音声処理部104により得られた画像信号及び音声信号を一時的に記憶するメモリ。106は、メモリ105に一時的に記憶された画像信号や音声信号を読み出して画像信号の符号化、音声信号の符号化などを行い、圧縮画像データ、圧縮音声データ等を生成し、記録再生部107に送信する符号化処理部。
107は、符号化処理部106で生成された圧縮画像データ、圧縮音声データ、その他撮影に関する制御データ等を記録媒体108記録媒体に転送し記録制御を行ったり、記録媒体108に記録された圧縮画像データ、圧縮音声データ、各種データ、プログラムを読み出しする記録再生部。108は、記録再生部107からのデータを記録保存する記録媒体である。圧縮画像データ、圧縮音声データ、等を記録することができれば、磁気ディスク、光学式ディスク、半導体メモリなどのあらゆる方式の記録媒体であってよく、また複数の記録媒体であってもよい。
111は、符号化処理部106から送信された画像信号や画像処理部102から送信された画像信号にかかる映像や、撮像装置100の操作をするための操作画面(メニュー画面)等を表示部112に表示させる表示制御部。112は、表示制御部からのデータを表示する表示部である。例えば、液晶ディスプレイ、有機ELディスプレイ、電子ペーパー等の表示デバイスなどである。113は、ボタンやダイヤルなどからなり、ユーザの操作に応じて、指示信号を制御部114に送信する操作部。例えば、電源ボタン、記録開始ボタン、メニュー表示ボタン、決定ボタン、カーソルキー、表示部112の任意の点を指定するためのポインティングデバイス、タッチパネル等からなる。
114は、操作部から送信された指示信号に基づいて、撮像装置100の各ブロックに制御信号を送信することで、各ブロックを制御する制御部。各種処理(プログラム)を実行するための例えば、CPU(MPU)、メモリ(DRAM、SRAM)などからなる。117は、各種データ、制御信号などを撮像装置100の各ブロックに送るバスである。
ここで、本実施例の音声信号処理装置の通常の動作について説明する。本実施例の撮像装置100は、ユーザが操作部113の電源ボタンを操作すると、操作部113から制御部114に起動の指示が出される。この指示を受けて、制御部114は、不図示の電源供給部を制御して、撮像装置100の各ブロックに対して電源を供給させる。
電源が供給されると、制御部114は、例えば、操作部113のモード切り換えスイッチが、例えば、撮影モード、再生モード等のどのモードであるかを操作部113からの指示信号により確認する。撮影モードでは、撮像装置100は撮影待機状態でユーザが操作部113の記録開始ボタンを操作することで、撮影を開始し、その間、圧縮画像データと圧縮音声データが、記録媒体108に記録される。そしてユーザが操作部113の撮影終了ボタンを操作することで、撮影を終了し、再び撮影待機状態になる。再生モードでは、ユーザが選択したファイルに関する圧縮画像データと圧縮音声データを記録媒体108から再生して表示部112に映像を表示させる。
まず、撮影モードについて説明する。撮影モードが設定されると前述のようにまず、撮影待機状態に設定される。撮影待機状態で、ユーザが操作部113の記録開始ボタンを操作することにより撮影開始の指示信号が送信されると、制御部114は、撮影開始の制御信号を撮像装置100の各ブロックに送信し、以下のような動作をさせるように制御する。
撮像部101は、撮影レンズにより取り込まれた被写体の光学像を撮像素子により画像信号に変換し、アナログデジタル変換し、画像処理部102に送信する。画像処理部102は、入力されたデジタル画像信号の画質調整処理(ホワイトバランスや色、明るさなど)を設定値に基づいて処理し、表示制御部111に送信する。表示制御部111は、受信した画像信号に関する映像を表示部112に表示させる。また、画像信号はメモリ105にも出力され、メモリ105に一時的に記憶される。
音声入力部103は、マイクにより得られたアナログ音声信号をデジタル変換し、得られたデジタル音声信号音声処理部104に送信する。音声処理部104は、入力されたデジタル音声信号のレベルの適正化処理、特定周波数の低減処理等をして音声信号を生成して、メモリ105に一時的に記憶される。
そして、符号化処理部106は、メモリ105に一時的に記憶された画像信号や音声信号を読み出して所定の符号化を行い、圧縮画像データ、圧縮音声データ等を生成する。そして、制御部114は、これらの圧縮画像データ、圧縮音声データを合成し、データストリームを形成し、記録再生部107に出力する。記録再生部107は、UDF、FAT等のファイルシステム管理のもとに、データストリームを一つの動画ファイルとして記録媒体108に書き込んでいく。
以上の動作を撮影中は継続する。そして、ユーザが操作部113の記録ボタンを操作することにより撮影終了の指示信号が制御部114に送信されると、制御部114は、撮影終了の制御信号を撮像装置100の各ブロックに送信し、以下のような動作をさせるように制御する。
画像処理部102、音声処理部104は、それぞれ画像信号、音声信号をメモリ105に送信するのを停止する。そして、符号化処理部106は、メモリ105に記憶されている残りの画像信号と音声信号とを読出して所定の符号化を行い、圧縮画像データ、圧縮音声データ等を生成し、それが終わると動作を停止する。
制御部114は、これらの最後の圧縮画像データ、圧縮音声データを合成し、データストリームを形成し、記録再生部107に出力する。
記録再生部107は、UDF、FAT等のファイルシステム管理のもとに、データストリームを一つの動画ファイルとして記録媒体108に書き込んでいく。そして、データストリームの供給が停止したら、動画ファイルを完成させて、記録動作を停止させる。
制御部114は、記録動作が停止すると、撮影待機状態に移行させるように制御信号を撮像装置100の各ブロックに送信して、撮影待機状態に戻る。
また、撮影待機状態では、制御部114は、撮像装置100の各ブロックを以下のような動作をさせるように制御する。画像処理部102は、画像信号を表示制御部111に送信し表示部112に画像信号に関する映像を表示させる。ユーザはこの様にして表示された画面を見ながら撮影の準備を行う。
次に、再生モードでは、制御部114は、再生状態に移行させるように制御信号を撮像装置100の各ブロックに送信し、以下のような動作をさせる。記録媒体108に記録された圧縮画像データと圧縮音声データとからなる動画ファイルを記録再生部107が読出して、読出された圧縮画像データ、圧縮音声データは、符号化処理部106に送る。符号化処理部106は、圧縮画像データ、圧縮音声データを一時的にメモリ105に記憶させ、所定の手順で復号し、復号化した画像信号を表示制御部111に送信する。表示制御部111は、入力された画像信号にかかる映像を表示部112に表示させる。
ここで、本実施例の音声信号処理装置の特徴的な動作について説明する。前述したように、本実施例の音声信号処理装置は、音声データが歪んでも聴感上違和感のない周波数帯域以上で音声が歪む場合はゲイン制御を行わず歪ませる処理のままとして、全体の感度を変えないように制御することができる。この動作について、図2のブロック図及び図4のフローチャート、図6の音声スペクトラム図を用いて、詳細に説明する。なお、図4のフローチャートは、本実施例の音声信号処理装置の制御部114で実行されるものである。
図2は、図1の音声処理部104のうち、本装置の特徴的な制御ブロックの図であり、図2の201は、音声入力部103の音声信号をデジタル化するデジタル変換部、202は、デジタル変換部201の信号のゲインを切り替えるデジタルアンプ部、203は、デジタル変換部201の信号のうち、倍音成分が聞こえない帯域以下を通過させるLPF1、204は、LPF1以下の周波数を通過させるLPF2、205は、LPF2のデータがある閾値を超えているか否かを判定する判定部、206は、LPF1の出力データもしくはデジタル変換部のデータ出力のいずれかを判定部のデータにより切り替えるSW、207は、SWのデータからデジタルアンプ部のゲインを制御するゲイン制御部、208はデジタルアンプ部の出力に位置し、折り返し雑音を低減するLPF3である。
図6の301は、LPF2低域が閾値以下となる音声データスペクトラムを表した図、302は、301の信号を後述する303のデジタルクリップレベルを超えないようにデジタルアンプ部202を制御した場合の出力波形を表した図、303は、デジタルアンプ部202の出力がデジタルクリップするレベル、304は、判定部205の結果が、低域多い音源と判断する閾値、305は、デジタルアンプ部202がある一定のゲインとなっている場合の出力波形であり、306は、305の波形がデジタルクリップしないように減衰させた波形である。
401は、LPF2低域が閾値以上となる音声データスペクトラムを表した図、402は、401の信号を303デジタルクリップレベルを超えないようにデジタルアンプ部202を制御した場合の出力波形を表した図、403は、デジタルアンプ部202がある一定のゲインとなっている場合の出力波形であり、404は、403の波形がデジタルクリップしないように減衰させた波形である。501は、401の波形をデジタルクリップさせた波形を表した図であり、502は、403の波形をデジタルアンプ部202のゲイン制御を行わずにデジタルクリップさせた波形、503は、デジタルクリップし発生した高調波成分である。
以下図4を中心に説明を行う。図4のS101にて本信号処理をスタートさせる。S102にて204LPF2の出力が図6の405のような閾値以上のレベルである場合、低域が多い音源と判断する。低域が多い音源の場合S103に進みSW206をLPF1側に倒す。S104にて207ゲイン制御部の制御元信号がLPF1出力データとなるため、S105にて高域成分のゲイン制御が行われず、図6の502の波形のように低域のレベル変化を抑えた信号処理となる。S102にて204LPF2の出力が図6の307のようにある閾値以下のレベルである場合、低域成分が小さいと判断しS106へ進む。S106では206SWをデジタル変換部直後のデータを使用する側に倒す。S107にて、207ゲイン制御部の制御元信号がすべての音声データとなるため、S108にて高域の音声が入力された場合でもゲイン制御を行い図6の306のような出力波形となる。これにより、低域成分が少ない場合は高域音声のリニアリティーを重要視するモードに自動で切り替わる。
以上説明したように、本実施例の音声信号処理装置は、音声データが歪んでも聴感上違和感のない周波数帯域以上で音声が歪む場合はゲイン制御を行わず歪ませる処理のままとして、全体の感度を変えないように制御することができる。このような動作により、本実施例の音声信号処理装置は、違和感の少ないゲイン切替を行える効果を得ることができる。
なお、本実施例の説明では、S102で閾値を固定としているが、操作部を用いてユーザーに任意に切替を行えてもよい。このような構成にすることで、ユーザーの異なる聴覚特性に合わせることができ、より効果が高まる。
また、本実施例では、撮像装置を例にとって説明したが、本発明は、撮像装置に限られるものではない。本実施例のように音声を集音するものであれば、どのような装置であってもよい。たとえば、ボイスレコーダーや携帯電話、スマートフォン、パソコンであってもよい。
図3、図5、図7、図8を用いて、ユーザーが記録させる音声のサンプリング周波数を決定する操作部と、ユーザーが低域を優先するか否かを選択する操作部と、ユーザーが記録させる音声の操作部の情報と低域を優先するか否かの情報から各フィルタのカットオフ周波数を決定する制御部とを有し、記録されるサンプリング周波数の帯域内でデジタルアンプのゲイン制御おこなわれるようにLPF1とLPF2とLPF3のカットオフ周波数をサンプリング周波数に応じて切り替えまた、その制御自体をユーザーが選択できることを特徴とする音声記録装置について説明する。
図3は実施例2の装置の特徴となるブロック図、図5は実施例2の制御フローチャート、図7は実施例2のサンプリング周波数切替選択画面表示例はであり、601は3つの選択肢がある選択画面例で、602は選択肢である。図8は低域を優先するモードの選択画面例であり、701は選択画面表示例であり、702はONするはOFFするかの選択肢である。
以下図5を中心に説明を行う。図7の表示を元にユーザーがサンプリング周波数を切り替える操作をおこなった場合、もしくは図8の低域を優先するモードの選択を切り替えた場合に、図5のS201にて切替制御を開始する。S202にてユーザーにより選択されたサンプリング周波数情報を取得する。S203にてLPF3のカットオフ周波数をサンプリング周波数の1/2に設定する。S204にて、LPF1のカットオフ周波数をサンプリング周波数の1/4に設定し、デジタルアンプ部202にて歪んだ2次高調波が記録されないようにする。S205にてユーザーが低域優先モードを選択している場合は、LPF2のカットオフ周波数をLPF1のカットオフ周波数以下に設定し、図4のS101の制御に移行する。
S205で低域優先モードでない時、S206へ移行しLPF2のカットオフ周波数を0Hz(OFF)にして、図4のS101の制御に移行する。
これにより、入力される音声ではなく音声データが歪んでも記録されない周波数帯域以上でレベル制御を行うため、従来の制御に対して全体の感度を変えないように制御することができる。このような動作により、本実施例の音声信号処理装置は、違和感の少ないゲイン切替を行える効果を得ることができる。
100 撮像装置、101 撮像部、102 画像処理部、103 音声入力部、
104 音声処理部、105 メモリ、106 符号化処理部、107 記録再生部、
108 記録媒体

Claims (3)

  1. アナログ音声信号をデジタル化するデジタル変換部と、
    前記デジタル変換部のデータのゲインを切り替えるデジタルアンプ部と、
    前記デジタル変換部のデータの倍音成分が聞こえない帯域以下を通過させる第1のフィルタと、
    前記第1のフィルタの通過帯域以下の周波数を通過させる第2のフィルタと、
    前記第2のフィルタのデータが閾値を超えているか否かを判定する判定部と、
    前記第1のフィルタの出力もしくは前記デジタル変換部の出力のいずれかを前記判定部の判定結果により切り替えるスイッチと、
    前記スイッチからのデータから前記デジタルアンプ部のゲインを制御するゲイン制御部と、
    ゲイン制御部の出力データの高調波歪みの折り返しノイズを低減する第3のフィルタと、
    前記判定部が、前記第2のフィルタのデータが閾値を越えていると判定した場合は前記第1のフィルタの出力データにより前記ゲイン制御部を動作させる制御手段とを備えることを特徴とする音声信号処理装置。
  2. 音声のサンプリング周波数を決定する操作部と、操作部の情報から各フィルタのカットオフ周波数を決定する制御部を有し、前記第1のフィルタ、前記第2のフィルタ及び前記第3のフィルタのカットオフ周波数をサンプリング周波数に応じて切り替えることを特徴とする請求項1に記載の音声信号処理装置。
  3. 前記サンプリング周波数の1/4を前記第1のフィルタのカットオフ周波数とすることを特徴とする請求項2に記載の音声信号処理装置。
JP2014128699A 2014-06-24 2014-06-24 音声信号処理装置 Pending JP2016009952A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014128699A JP2016009952A (ja) 2014-06-24 2014-06-24 音声信号処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014128699A JP2016009952A (ja) 2014-06-24 2014-06-24 音声信号処理装置

Publications (1)

Publication Number Publication Date
JP2016009952A true JP2016009952A (ja) 2016-01-18

Family

ID=55227255

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014128699A Pending JP2016009952A (ja) 2014-06-24 2014-06-24 音声信号処理装置

Country Status (1)

Country Link
JP (1) JP2016009952A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108174007A (zh) * 2017-12-28 2018-06-15 上海传英信息技术有限公司 一种音频系统、音频控制方法及具有该系统的移动终端

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108174007A (zh) * 2017-12-28 2018-06-15 上海传英信息技术有限公司 一种音频系统、音频控制方法及具有该系统的移动终端

Similar Documents

Publication Publication Date Title
KR101739942B1 (ko) 오디오 노이즈 제거 방법 및 이를 적용한 영상 촬영 장치
JP2018074220A (ja) 音声処理装置
JP2016009952A (ja) 音声信号処理装置
JP2011130134A (ja) 撮像装置、撮像システム
KR101322081B1 (ko) 비디오 주밍에 연동한 오디오 출력장치 및 방법
JP2019179944A (ja) 音声切替装置
US10425731B2 (en) Audio processing apparatus, audio processing method, and program
JP7167920B2 (ja) 表示制御装置、表示制御方法及びプログラム
JP2019091988A (ja) 音声処理装置および音声処理方法
JP2019161334A (ja) 音声処理装置
JP5495753B2 (ja) 撮像装置
JP2018060057A (ja) 音声処理装置
JP6570577B2 (ja) 音声処理装置、音声処理方法、およびプログラム
JP2019179945A (ja) 音声切替装置
JP5340127B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法
JP5317936B2 (ja) 音声信号処理装置
KR101314565B1 (ko) 위치 관련 정보를 제공하는 촬영장치 및 그 제어방법
JP2018078459A (ja) 撮像装置
JP2006217111A (ja) 動画撮影装置、及び動画撮影方法
JP2019205084A (ja) 音声処理装置およびその制御方法
JP2017076895A (ja) 音声信号処理装置及び方法
JP2016177070A (ja) 音声処理装置
JP2019161333A (ja) 音声処理装置
JP5506471B2 (ja) 撮像装置
JP2023026918A (ja) 音声処理装置、音声処理装置の制御方法、及びプログラム