JP2019057795A - 音声信号処理装置、その制御方法およびプログラム - Google Patents

音声信号処理装置、その制御方法およびプログラム Download PDF

Info

Publication number
JP2019057795A
JP2019057795A JP2017180396A JP2017180396A JP2019057795A JP 2019057795 A JP2019057795 A JP 2019057795A JP 2017180396 A JP2017180396 A JP 2017180396A JP 2017180396 A JP2017180396 A JP 2017180396A JP 2019057795 A JP2019057795 A JP 2019057795A
Authority
JP
Japan
Prior art keywords
audio signal
sub
sampling
processing
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017180396A
Other languages
English (en)
Inventor
和広 並木
Kazuhiro Namiki
和広 並木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017180396A priority Critical patent/JP2019057795A/ja
Publication of JP2019057795A publication Critical patent/JP2019057795A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】超音波を搬送波とする音声が入力される場合に、記録の際に生じる歪みを抑制した音声を出力することが可能な音声信号処理装置を提供する。
【解決手段】本発明に係る音声信号処理装置は、入力された音声信号を第一の増幅率で増幅する処理を含む第一の処理を行う第一の処理手段と、入力された音声信号を、第一の増幅率よりも大きな第二の増幅率で増幅する処理を含む第二の処理を行う第二の処理手段と、入力された音声信号に含まれる超音波の搬送波を検出する検出手段と、第一の処理手段からの音声信号と、第二の処理手段からの音声信号の何れかを、記録のための音声信号として出力する出力手段とを有し、出力手段は、検出手段により超音波の搬送波が検出された場合に、第一の処理手段からの音声信号を記録のための音声信号として出力する。
【選択図】図1

Description

本発明は、音声信号処理装置、その制御方法およびプログラムに関する。
近年、可聴音を直進性の高い超音波(人の耳には聞こえない高い振動数の音)に変調して狙った方向に照射し、ビーム状の音場を形成することにより、可聴音を再現する超指向性音響システムスピーカー(パラメトリックスピーカーともいう)が知られている。パラメトリックスピーカーは、例えば、博物館などの展示会場において、複数の展示物の説明をそれぞれ音声出力する場合に有効である。複数の展示物の説明を従来のスピーカーでそれぞれ音声出力する場合、互いの音声が混合して聞こえてしまう。パラメトリックスピーカーでは、その指向性により音声が混合されず、一方の音声説明のみをユーザに届ける(音分化)ことができる。また、発せられる音を特定領域に対して届けることにより、駅に隣接した住宅に対する静音化を実現することができる。
特開平06―164278号公報
パラメトリックスピーカーでは、超音波を搬送波として、可聴音により超音波を変調して空気中に送出することで、空気の非線形性により可聴音が復調される。このとき、その搬送波レベルがビデオカメラ等の記録装置にある音声入力のAD変換部の入力可能な範囲を超える場合、(信号がクリップされて)変調した音がつぶれた状態で処理され、可聴音が歪む又は可聴音と関係のないノイズが記録される場合がある。
マイクから入力した音声のレベルを改善する技術として、演奏者の演奏をマイクから収音してその場のスピーカーで再生するシステムにおいて、ゲインの増加によって発生するハウリングを抑制する技術が知られている(特許文献1)。特許文献1の技術では、可聴音のピーク周波数のレベルと平均的なレベルとからハウリングを検出し、ハウリングに係るピーク周波数のゲインを低下させる。しかしながら、搬送波を超音波とする音声を扱うことは考慮されておらず、搬送波を超音波とする可聴音の歪みを改善するためには、超音波を含む高周波領域のレベルも考慮しなければならない。
本発明は、上記課題に鑑みてなされ、その目的は、超音波を搬送波とする音声が入力される場合に、記録の際に生じる歪みを抑制した音声を出力することが可能な技術を実現することである。
この課題を解決するため、例えば本発明の音声信号処理装置は以下の構成を備える。すなわち、入力された音声信号を第一の増幅率で増幅する処理を含む第一の処理を行う第一の処理手段と、入力された音声信号を、前記第一の増幅率よりも大きな第二の増幅率で増幅する処理を含む第二の処理を行う第二の処理手段と、前記入力された音声信号に含まれる超音波の搬送波を検出する検出手段と、前記第一の処理手段からの音声信号と、前記第二の処理手段からの音声信号の何れかを、記録のための音声信号として出力する出力手段とを有し、前記出力手段は、前記検出手段により前記超音波の搬送波が検出された場合に、前記第一の処理手段からの音声信号を前記記録のための音声信号として出力することを特徴とする。
本発明によれば、超音波を搬送波とする音声が入力される場合に、記録の際に生じる歪みを抑制した音声を出力することが可能になる。
本実施形態に係る音声信号処理装置とデジタルカメラの機能構成例を示す図 本実施形態に係る第一フィルタ部及び第一サブサンプリング部の動作を説明する図 本実施形態に係る第二フィルタ部及び第二サブサンプリング部の動作を説明する図 本実施形態に係る第一サブサンプリング部の出力信号の周波数帯域と第二サブサンプリング部の出力信号の周波数帯域の例を示す図 本実施形態に係るダイナミックレンジ拡張部の動作を説明する図
(実施形態1)
(音声信号処理装置の構成)
図1(a)は、本実施形態に係る音声信号処理装置100の機能構成例を示すブロック図である。なお、以下の説明では、音声信号処理装置が信号処理用のIC(集積回路)によって実現される例について説明する。しかし、図1(a)に示す機能ブロックの1つ以上が、CPUやMPU等のプログラマブルプロセッサがソフトウェアを実行することによって実現されてもよく、ソフトウェアとハードウェアの組み合わせによって実現されてもよい。従って、以下の説明において、異なる機能ブロックが動作主体として記載されている場合であっても、同じハードウェアが主体として実現されうる。
また、図1(b)は、音声信号処理装置100を内蔵するデジタルカメラ180の機能構成例を示している。撮像部151は撮像素子を含み、被写体光学像を画像データに変換して画像データをバス158経由で出力する。音声信号処理装置100は、入力した音声信号に後述の処理を施して処理後の音声信号をバス158経由で出力する。制御部156は、例えばCPU及びROMを含み、ROMに記録されたプログラムをメモリ152に展開、実行することにより、デジタルカメラ180の各種機能を実現するように各部を制御する。制御部156は、更に、音声信号処理装置100からの音声信号に対して所定の音声処理や圧縮処理を施したり、撮像部151からの画像データに対して所定の画像処理や圧縮処理を施したりして記録部154に出力する。記録部154は、制御部156からの信号を、例えば半導体メモリ等の記録媒体155に記録する記録装置である。操作部157はユーザがデジタルカメラ180を操作するためのボタンやタッチパネルを含む。表示部153は、撮像された画像や記録媒体に記録された画像や映像を表示するほか、操作のためのメニュー表示を表示する。なお、本実施形態に係る音声信号処理装置100は、デジタルカメラに限らず、スマートフォン等の携帯型電話機やタブレットPC、パーソナルコンピュータ、ゲーム機、医療機器、PCMレコーダ等の録音可能な装置に内蔵され得る。
再び図1(a)を参照すると、マイクロホン101は、例えばステレオマイクを構成し、周囲の音を収音し、電気信号に変換する。なお、図1(a)は、音声信号処理装置100が備えるマイクロホンが2つのチャンネルを有する場合の、一方のチャンネルに対する構成を示している。マイクロホン101は、変換したアナログデータを、複数の経路を構成するMain_ch1000とSub_ch1001にそれぞれ入力する。
アナログ増幅器102とアナログ増幅器103は、アナログ信号を増幅する増幅器であるが、それぞれ異なるゲイン係数を有する。本実施形態では、Main_ch1000のアナログ増幅器103の増幅率Gmは、Sub_ch1001のアナログ増幅器102の増幅率Gsよりも大きい。アナログ増幅器102はアナログ・デジタルコンバータ(ADC)104に、また、アナログ増幅器103はADC105に、それぞれの増幅率で増幅した信号を供給する。
ADC104及びADC105は、デルタシグマ変調器によるアナログ・デジタルコンバータである。本実施形態におけるデルタシグマ変調器は、記録するサンプリング周波数fs(例えば、fs=48kHz)よりも高い周波数でオーバーサンプリングを行い、例えば、サンプリング周波数fsにオーバーサンプリング率Kを乗じた周波数で動作する。オーバーサンプリング率Kは、サンプリング周波数fsの値に対して、例えば、2桁から3桁ほど大きな周波数となるように定められる。すなわち、ADC104及びADC105は、デジタル音声信号を、オーバーサンプリングでかつ多ビット化された状態で出力する。
Main_ch1000とSub_ch1001は、それぞれ、ADCの出力から記録用の音声信号を取得するための、2つのフィルタと2つのサブサンプリングを適用する一連の処理を行う。まず、Sub_ch1001側のフィルタ及びサブサンプリング部の構成について説明する。Sub_ch1001では、ADC104からの信号に対して、所望のサンプリング周波数で記録するためのサブサンプリングを行う。図1(a)の例では、第一フィルタ部106と第一サブサンプリング部108とが第1段階のサブサンプリングを行う構成に含まれ、第二フィルタ部110と第二サブサンプリング部112とが第二段階のサブサンプリングを行う構成に含まれる。
第一フィルタ部106は、第一サブサンプリング部108が、ADC104からの出力信号を間引いてサンプリング周波数を落とした場合に生じ得る、可聴帯域に折り返る雑音成分の発生を予め除去する。第一フィルタ部106は、ADC104からの出力信号に対し、例えば、可聴帯域に折り返る雑音成分が存在する周波数帯域に極を持つ移動平均フィルタを適用する。これにより、第一サブサンプリング部108が音声信号のサンプリング周波数を落とす際に、可聴帯域に折り返る雑音成分の発生を防止することができる。なお、第一フィルタ部106の特性については、図2を参照して後述する。
次に、第二フィルタ部110は、第一サブサンプリング部108の出力信号に対し、例えば、サンプリング周波数fsの半分の周波数で十分に値を落とすことができるローパスフィルタを適用する。続いて、第二サブサンプリング部112は、記録部154において記録するための所望のサンプリング周波数まで第二フィルタ部110の出力信号を間引く。このとき、可聴帯域に折り返る雑音成分は、第二フィルタ部110によって予め除去されている。なお、第二フィルタ部110の特性については、図3を参照して後述する。
同様に、Main_ch1000側では、第三フィルタ部107が、可聴帯域に折り返る雑音成分が存在する周波数帯域に極を持つ移動平均フィルタを用いて、折り返り雑音を予め除去する。また、第四フィルタ部111は、第三サブサンプリング部109の出力信号に対し、例えば、サンプリング周波数fsの半分の周波数以上の音声信号を除去するような特性を持ったローパスフィルタを適用し、可聴帯域に折り返る雑音成分を予め除去する。第四サブサンプリング部113は、記録部154において記録するためのサンプリング周波数まで第四フィルタ部111の出力信号を間引く。
次に、Sub_ch1001側では、2つの検出部が各サブサンプリング部からの出力信号の振幅レベルのピーク値を検出する。本実施形態では、第一検出部114は第一サブサンプリング部108の出力信号の振幅レベルを測定して、ピーク値を検出する。また、第二検出部115は第二サブサンプリング部112の出力信号の振幅レベルを測定し、ピーク値を検出する。
レベル比較部116は、第一検出部114で検出した音声信号のピーク値と第二検出部115で検出したピーク値とを比較する。レベル比較部116は、ピーク値の比較結果をリカバリ回路120に入力する。
次に、ダイナミックレンジ拡張部1002について説明する。ダイナミックレンジ拡張部1002は、Sub_ch1001側の出力信号とMain_ch1000側の出力信号を入力して、いずれかの側の信号に出力を切り替える。具体的には、Dレンジレベル検出部122はMain_ch1000側の振幅レベルを計測し、その振幅レベルが閾値レベルよりも大きい場合、切り替え制御部121がSub_ch1001側に出力を切り替える。
可変増幅器117は、第二サブサンプリング部112の出力信号のレベルが第四サブサンプリング部113の出力のレベルと同等になるように、第二サブサンプル部の出力信号を増幅する。増幅する際の増幅率は、例えば、アナログ増幅器102の増幅率Gmとアナログ増幅器103の増幅率Gsの比率によって予め定められてよい。加算器118は、可変増幅器117の出力信号にDC成分を付加する。
リカバリ回路120は、レベル比較部116で求められる、第一検出部で検出されたピーク値と第二検出部で検出されたピーク値の大小関係に応じて、音声信号から超音波の搬送波を検出する(超音波検出手段)。リカバリ回路120は、音声信号から超音波の搬送波が検出されたかに応じて、スイッチ119の切り替えを切り替え制御部121に指示する(切替手段)。このとき、リカバリ回路120は、所定の時定数Trをもつようにスイッチ119を切り替えるタイミングを制御する。
Dレンジレベル検出部122は、第四サブサンプリング部113の出力信号の振幅レベルを検出し、閾値レベルとの比較の結果によってスイッチ119を制御するように切り替え制御部121に指示を出す。
切り替え制御部121は、リカバリ回路120からの指示に基づいて、スイッチ119を制御する。ただし、後述するように、第一検出部114で検出されたピーク値が第二検出部で検出されたピーク値よりも小さい場合(すなわち超音波の搬送波が検出されない場合)は、Dレンジレベル検出部122の指示を優先させる。
(音声信号処理装置100における信号処理の詳細)
次に、上述した音声信号処理装置100の各部による信号処理について、より詳細に説明する。
ADC104及びADC105(すなわちデルタシグマ変調回路)は、それぞれオーバーサンプリング率を適用したサンプリング周波数(Kfs)で音声信号を出力する。そして、それぞれの出力信号に対し、第一フィルタ部106と第三フィルタ部107とがそれぞれフィルタ処理を適用する。その後、第一サブサンプリング部108及び第三サブサンプリング部109は、周波数K´fs(例えば、K´<K、K´=K/n、nは整数)までサブサンプリング処理を行う。これらのフィルタ及びサブサンプリング処理について、図2及び図3を参照して説明する。図2は、第一フィルタ部106及び第三フィルタ部107の特性を示している。ADCの出力信号を(フィルタを適用せずに)単にK´fsまでサブサンプリングすると、可聴帯域内の標本化周波数の整数倍の周波数付近に、図2に示すような折り返し作用による通過帯域が現れる。そこで、本実施形態の第一フィルタ部106及び第三フィルタ部107では、図2に示すような折り返し雑音を通過させない特性(標本化周波数の整数倍に極を持つ特性)を有する櫛形フィルタ(移動平均フィルタ)を用いて、折り返し雑音を抑制する。そして、第一サブサンプリング部108及び第三サブサンプリング部109が、第一フィルタ部106及び第三フィルタ部107から出力されたデータをサンプリング周波数K´fsの周波数までデータを間引く(1段目のサブサンプル)。これにより、折り返し雑音を抑制したサブサンプルを行うことができる。例えば、サンプリング周波数K´fsは、サンプリング周波数fsの2倍以上である。
次に、第二サブサンプリング部112及び第四サブサンプリング部113は、サンプリング周波数K´fsまでサブサンプルされたデータを、記録部154で記録するためのサンプリング周波数fsまでサブサンプルする処理(2段目のサブサンプル)を行う。図3は、第二サブサンプリング部112及び第四サブサンプリング部113が当該サブサンプルを行う前に適用する第二フィルタ部110及び第四フィルタ部111のフィルタ特性を示している。第二フィルタ部110及び第四フィルタ部111は、第二サブサンプリング部112及び第四サブサンプリング部113が、サンプリング周波数K´fsまでサブサンプルされたデータをサブサンプルした場合に現れる折り返し雑音を抑制する。図3に示すように、サンプリング周波数の整数倍の帯域で折り返し雑音が含まれるが、サンプリング周波数はfs(例えば、48kHz)であるため、サンプリング定理により24kHzまでの音声成分があればよい。このため、本実施形態では、カットオフ周波数fcを例えば20kHzとしたローパスフィルタを適用する。これにより、第二サブサンプリング部112及び第四サブサンプリング部113は、折り返し雑音が抑制されたサブサンプル後の音声信号を出力することができる。
このようにフィルタ処理とサブサンプリング処置とを組み合わせることで、ADCから出力されたデジタル音声信号から低周波成分を取り出すことができる。また、音声信号処理装置100より後段では(すなわちスイッチ119からの出力信号に対して)、記録部154が記録するためのサンプリング周波数fsを用いて音声信号処理を行うことができるようになる。
次に、サブサンプリングされた音声信号を用いて、マイクロホン101から入力した音声信号にパラメトリックスピーカーによる超音波の搬送波が含まれるかを判定する処理について説明する。第一検出部114は、第一サブサンプリング部108の出力信号の振幅レベルを測定し、ピーク値を保持する。このとき、測定する振幅レベルは、例えば第一サブサンプリング部108の出力信号の絶対値である。また、第一検出部114は、振幅レベルのピーク値を、時定数Tを用いて更新する。時定数Tは可変値であってよく、時定数Tを変更することにより、検出した振幅レベルのピーク値の更新間隔を変更することができる。すなわち、時定数が短い時間であれば、ピーク値が短時間で更新され、また時定数が長くなれば、ピーク値が更新される時間間隔が長くなる。第一検出部114によって検出されたデジタル音声信号のピーク値は、サンプリング定理により、周波数K´fs/2までの信号が含まれる音声信号である。つまり、第一検出部114で検出された振幅レベルのピーク値は、パラメトリックスピーカーによって出力された搬送波が含まれる音声信号のピーク値を示す。この第一検出部114で検出される振幅レベルのピーク値を具体的に表すと、図4(a)のようになる。なお、図4(a)は、第一サブサンプリング部108による出力信号の周波数帯域の例(a)を示している。
図4(a)では、第一検出部114によって検出可能な音声信号の周波数帯域を示しており、401はパラメトリックスピーカーによって出力された搬送波を示す。第一検出部114によって検出可能な音声信号の周波数帯域は、K´fs/2であるため、パラメトリックスピーカーによって出力された搬送波401の周波数もこの帯域に含まれている。
一方、第二検出部115は、第二サブサンプリング部112の出力信号の振幅レベルを測定する。ここで、測定する振幅レベルを例えば第二サブサンプリング部112の出力信号の絶対値とする。このとき、第二サブサンプリング部112が出力する出力信号の周波数帯域の例は、図4(b)に示すようになる。第二サブサンプリング部112の出力信号の出力fs/2以降では、fs/2の周波数帯域のみが出力される。なお、第二検出部115は、振幅レベルのピーク値の更新を、第一検出部114と同様に時定数Tを用いて更新する。
このように、2段階のサブサンプリングでは、先行するサブサンプリングにおいてパラメトリックスピーカーの搬送波の周波数が含まれるようにサブサンプリングし、後段のサブサンプリングでは、当該搬送波の周波数が含まれないようにサブサンプリングする。
レベル比較部116は、第一検出部114で検出した音声信号(先行するサブサンプリング後の音声信号)のピーク値と第二検出部115で検出した音声信号(後段でサブサンプリングした音声信号)のピーク値を比較する。例えば比較方法として、第一検出部114で検出した音声信号のピーク値をP1、第二検出部115で検出した音声信号のピーク値をP2とした場合、式(1)を算出する。そして、算出した値を閾値(例えば1)と比較する。
Figure 2019057795
すなわち、レベル比較部116は、以下の式(2)に示すように、第一検出部114で検出した音声信号のピーク値が、第二検出部115で検出した音声信号のピーク値よりも大きいかを判定する。第一検出部114で検出した音声信号のピーク値が、第二検出部115で検出した音声信号のピーク値よりも大きい場合、音声信号にはパラメトリックスピーカーによる大きなレベルの搬送波(例えば40kHz付近の超音波)が含まれていると判定する。
Figure 2019057795
レベル比較部116は、判定結果をリカバリ回路120に入力する。リカバリ回路120は、レベル比較部116の結果に基づき、スイッチ119を切り替えるタイミングを所定の時定数Trを用いて切り替え制御部121に指示する。具体的には、リカバリ回路120は、パラメトリックスピーカーによる大きなレベルの搬送波が含まれている(式(2)を満たす)と判定した場合、低ゲインであるSub_ch1001側の信号に切り替えるように切り替え制御部121を制御する。なお、可変である所定の時定数Trの値が短い時間に設定された場合、リカバリ回路120から切り替え制御部121への指示が短い時間で更新される。すなわち、時定数に応じて、スイッチ119による音声信号の一方から他方への切り替えを短い時間で行うことになる。一方、時定数の値が長い時間に設定された場合、リカバリ回路120から切り替え制御部121への指示が長い時間で更新される。
Sub_ch1001側の音声信号には相対的に低いゲインが適用されるため、大きな振幅レベルの音声信号が入力された場合であっても、音声信号が歪みにくい。このため、パラメトリックスピーカーからの音声信号が、デジタルカメラ180の記録部154に入力された場合であっても、Main_ch1000側の音声信号と比較して歪みにくい。
また、式(3)に示すように、第二検出部115で検出した音声信号のピーク値P2が第一検出部114で検出した音声信号のピーク値P1と同等或いは大きい場合、レベル比較部116は、入力された音声信号に超音波の搬送波は含まれていないと判定する。すなわち、入力された音声信号には、可聴帯域の音声信号のみが含まれていると判定する。換言すれば、図4(a)に示したパラメトリックスピーカーの搬送波401は検出されていない。
リカバリ回路120は、レベル比較部116によって式(3)を満たすと判定された場合、Main_ch1000側の信号に切り替えるように切り替え制御部121を制御する。なお、後述するようにDレンジレベル検出部122がMain_ch1000の音声信号の振幅レベルが所定の閾値レベルより大きいと判定した場合には、切り替え制御部121は、Dレンジレベル検出部122の指示を優先する。
Figure 2019057795
更に、ダイナミックレンジ拡張部1002におけるダイナミックレンジに関する処理について説明する。上述したように、本実施形態では、Main_ch1000のアナログ増幅器103の増幅率Gmは、Sub_ch1001のアナログ増幅器103の増幅率Gsより大きくしている。このため、入力した音声信号が超音波の搬送波を含む場合、Main_ch1000側の音声信号はSub_ch1001側よりもS/N比は良好になる。しかし、搬送波の振幅レベルが大きく、ADCでの入力レベルの最大値を超える場合、音声信号はADCにおいて(音声信号の可聴成分が)クリップされて歪んでしまう。一方、Sub_ch1001側の音声信号は、Main_ch1000側と比較してS/N比は劣化するが大きな振幅レベルの音声信号が入力されても歪みにくい。
このため、ダイナミックレンジ拡張部1002では、Dレンジレベル検出部122がMain_ch1000側の振幅レベルを計測し、当該振幅レベルが閾値レベルよりも大きい場合、切り替え制御部121でSub_ch1001側に切り替えるようにする。
更に、図5を参照して、Main_ch1000とSub_ch1001の音声信号を切り替える際の信号の様子を説明する。図5の501は、マイクロホン101から入力されたアナログ音声信号を示している。502は、Main_ch1000側において音声信号が増幅率Gmで増幅された後にデジタル信号に変換され、その後、記録するためのサンプリング周波数までサブサンプリングされたデジタル音声信号を表す。一方、503は、Sub_ch1001側において音声信号が増幅率Gsで増幅された後にデジタル信号に変換され、記録するためのサンプリング周波数までサブサンプリングされた音声信号を表す。更に、504は、ダイナミックレンジ拡張部1002における処理によって音声信号が切り替えられ、そのダイナミックレンジを拡張した様子を表す。
502において、ADC105は、最大レンジを超えた振幅レベルの音声信号をデジタル変換することができないため、音声信号は、ADC105のレンジの最大値で歪んだ音声信号となる。一方、503に示すように、Sub_ch1001のADC104では、音声信号はADC104の最大レンジを超えないため、クリップされること無く正常にデジタル変換される。
Dレンジレベル検出部122は、Main_ch1000側の音声信号の振幅レベルが所定の閾値レベル(ADC105の最大レンジを超えない範囲の任意レベル値)に達した場合、Sub_ch1001側の音声信号に切り替える。Sub_ch1001側の音声信号は、可変増幅器117でGv倍(Gv>0)に増幅され、更に加算器118でDC成分が加算されて、スイッチ119を介して音声信号処理装置から出力される。504に示す音声信号の破線部分は、このようにして出力されたSub_ch側の音声信号である。可変増幅器117は、アナログ増幅器102、103の増幅率の差を用いて増幅率を調整し、Sub_chのデジタル音声信号をMain_chのデジタル音声信号の振幅レベルに合うように補正する。
なお、上述の本実施形態では、音声信号処理装置100の動作を、パラメトリックスピーカーから出力された音声信号を入力した場合を例に説明した。しかし、この場合に限らず、大きな振幅レベルの超音波成分を含む音声信号が入力される場合に適用可能である。
以上説明したように、本実施形態では、異なる増幅率で増幅したMain_ch1000側の音声信号とSub_ch1001側の音声信号とを、音声信号に超音波の搬送波が含まれるかに応じて切り替えて出力するようにした。更に、音声信号に超音波の搬送波が含まれる場合、又は高い増幅率で増幅したMain_ch1000側の音声信号の振幅の大きさが所定より大きい場合に、Sub_ch1001側の音声信号を出力する。また、超音波の周波数帯域を含むようにしたサブサンプリングの音声信号の振幅レベルと、当該周波数帯域を含まないようにしたサブサンプリングの音声信号の振幅レベルとの比較に基づいて音声信号中の超音波の搬送波を検出するようにした。このようにすることで、超音波を搬送波とする音声が入力される場合であっても音声信号のダイナミックレンジを拡張しつつ、音声信号が歪む可能性を低減することができる。また、ADC部の最大レンジを超える音声信号が入力される場合にも音声信号が歪む可能性を低減することができる。すなわち、記録の際の生じる歪みを抑制した音声信号を、後段の制御部156や記録部154に出力することができる。
(実施形態2)
次に実施形態2について説明する。実施形態1では、第二検出部115で検出された音声信号のピーク値を第一検出部114で検出された音声信号のピーク値で除算するようにした。これに対し、本実施形態では、第一検出部114で検出された音声信号のピーク値と第二検出部115で検出された音声信号のピーク値の差分値を用いてレベル比較を行う例を説明する。なお、本実施形態は、レベル比較部116による処理が異なるが、音声信号処理装置の構成は実施形態1と同一である。このため、同一の構成については同一の符号を付して重複する説明は省略し、相違点について重点的に説明する。
以下、本実施形態に係る、パラメトリックスピーカーによる超音波の搬送波が入力した音声信号に含まれるかを判定する処理について説明する。
第一検出部114で検出した音声信号のピーク値をP1´、第二検出部115で検出したピーク値をP2´とした場合、レベル比較部116は、式(4)に従うピーク値の差分を求め、算出結果の正負を用いてピーク値のレベル比較を行う。
Figure 2019057795
レベル比較部116は、式(5)に示すように、式(4)の算出結果が正である場合、パラメトリックスピーカーの大きなレベルの搬送波(例えば40kHz付近の超音波)が入力された音声信号に含まれていると判定する。
Figure 2019057795
一方、レベル比較部116は、式(6)に示すように、式(4)の算出結果が0以下である場合、パラメトリックスピーカーの搬送波が入力された音声信号に含まれず、可聴帯域の音声信号のみが含まれる音声信号である判定する。つまり、この条件では図4(a)に示したパラメトリックスピーカーの搬送波401は検出されないため、P1≦P2となる。
Figure 2019057795
このように、本実施形態では、Sub_ch1001の第一サブサンプリング後の音声信号の振幅レベルと第二サブサンプリング後の音声信号の振幅レベルとの差分を算出することで、パラメトリックスピーカーの搬送波を検出するようにした。これにより、パラメトリックスピーカーの搬送波の有無に応じて、実施形態1と同様に、ダイナミックレンジ拡張部1002のスイッチ119を切り替えることができる。すなわち、パラメトリックスピーカーの搬送波のレベルがADCの最大レンジを超える場合であっても、音声信号が歪む可能性を低減することができる。すなわち、記録の際の生じる歪みを抑制した音声信号を、後段の制御部156や記録部154に出力することができる。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
102…アナログ増幅器、103…アナログ増幅器、108…第一サブサンプリング部、109…第三サブサンプリング部、110…第二サブサンプリング部、111…第四サブサンプリング部、116…レベル比較部、121…切り替え制御部、119…スイッチ

Claims (13)

  1. 入力された音声信号を第一の増幅率で増幅する処理を含む第一の処理を行う第一の処理手段と、
    入力された音声信号を、前記第一の増幅率よりも大きな第二の増幅率で増幅する処理を含む第二の処理を行う第二の処理手段と、
    前記入力された音声信号に含まれる超音波の搬送波を検出する検出手段と、
    前記第一の処理手段からの音声信号と、前記第二の処理手段からの音声信号の何れかを、記録のための音声信号として出力する出力手段とを有し、
    前記出力手段は、前記検出手段により前記超音波の搬送波が検出された場合に、前記第一の処理手段からの音声信号を前記記録のための音声信号として出力することを特徴とする音声信号処理装置。
  2. 前記第一の処理手段は、前記第一の増幅率で増幅された音声信号をサブサンプルする第一のサブサンプリング手段と、前記第一のサブサンプリング手段からの音声信号をサブサンプルする第二のサブサンプリング手段とを含み、
    前記第一のサブサンプリング手段は、前記第一のサブサンプリング手段からの音声信号に前記超音波の周波数帯域が含まれるようにサブサンプリングを行い、
    前記第二のサブサンプリング手段は前記第二のサブサンプリング手段からの音声信号に前記超音波の周波数帯域が含まれないようにサブサンプリングを行い、
    前記検出手段は、前記第一のサブサンプリング手段からの音声信号の振幅レベルと前記第二のサブサンプリング手段からの音声信号の振幅レベルとに基づいて、前記超音波の搬送波を検出する、ことを特徴とする請求項1に記載の音声信号処理装置。
  3. 前記検出手段は、前記第一のサブサンプリング手段によって得られる音声信号の振幅レベルのピーク値が前記第二のサブサンプリング手段によって得られる音声信号の振幅レベルのピーク値より大きい場合に、前記超音波の搬送波を検出したものとする、ことを特徴とする請求項2に記載の音声信号処理装置。
  4. 前記第一の処理手段は、前記第一のサブサンプリング手段のサブサンプリングによって可聴帯域に折り返る音声信号を除去するためのフィルタを含み、前記フィルタからの音声信号を前記第一のサブサンプリング手段に出力することを特徴とする請求項2または3に記載の音声信号処理装置。
  5. 前記第一の処理手段は、前記第一のサブサンプリング手段から出力された音声信号における、前記記録のための音声信号のサンプリング周波数の半分より大きい周波数の音声信号を除去するローパスフィルタを有し、前記ローパスフィルタからの音声信号を前記第二のサブサンプリング手段に出力することを特徴とする請求項4に記載の音声信号処理装置。
  6. 前記入力された音声信号はアナログ音声信号であり、前記第一の処理手段は、前記記録のための音声信号のサンプリング周波数よりも高い周波数でサンプリングすることにより、前記第一の増幅率で増幅した音声信号をデジタル信号に変換する変換手段を含み、前記第一のサブサンプリング手段は、前記変換手段からの音声信号をサブサンプルすることを特徴とする請求項2から5の何れか1項に記載の音声信号処理装置。
  7. 前記出力手段は、出力する音声信号を、前記第一の処理手段からの音声信号と前記第二の処理手段からの音声信号の一方から他方に切り替える場合、予め定められた時定数に従って、前記第一の処理手段からの音声信号と前記第二の処理手段からの音声信号とを切り替える、ことを特徴とする請求項1から6の何れか1項に記載の音声信号処理装置。
  8. 前記出力手段は、前記第一の処理手段からの音声信号を出力する場合、前記第一の処理手段からの音声信号と前記第二の処理手段からの音声信号とのレベルの差を補正する補正手段を更に含む、ことを特徴とする請求項1から7の何れか1項に記載の音声信号処理装置。
  9. 前記第二の処理手段は、前記第二の増幅率で増幅した音声信号の振幅レベルを計測する計測手段を有し、
    前記出力手段は、前記検出手段により前記超音波の搬送波が検出されない場合で、前記計測手段により計測された振幅レベルが所定の閾値を超えた場合、前記第一の処理手段からの音声信号を前記記録のための音声信号として出力する、ことを特徴とする請求項1から8の何れか1項に記載の音声信号処理装置。
  10. 前記超音波の搬送波を含む音声信号は、パラメトリックスピーカーから出力された音声信号である、ことを特徴とする請求項1から8の何れか1項に記載の音声信号処理装置。
  11. 撮像手段と、
    前記出力手段から出力された音声信号を記録する記録手段とを有することを特徴とする請求項1から10の何れか1項に記載の音声信号処理装置。
  12. 第一の処理手段が、入力された音声信号を第一の増幅率で増幅する処理を含む第一の処理を行う第一の処理工程と、
    第二の処理手段が、入力された音声信号を、前記第一の増幅率よりも大きな第二の増幅率で増幅する処理を含む第二の処理を行う第二の処理工程と、
    検出手段が、前記入力された音声信号に含まれる超音波の搬送波を検出する検出工程と、
    出力手段が、前記第一の処理工程による音声信号と、前記第二の処理工程による音声信号の何れかを、記録のための音声信号として出力する出力工程とを有し、
    前記出力工程では、前記検出工程において前記超音波の搬送波が検出された場合に、前記第一の処理工程による音声信号を前記記録のための音声信号として出力する、ことを特徴とする音声信号処理装置の制御方法。
  13. コンピュータを、請求項1から11の何れか1項に記載の音声信号処理装置の各手段として機能させるためのプログラム。
JP2017180396A 2017-09-20 2017-09-20 音声信号処理装置、その制御方法およびプログラム Pending JP2019057795A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017180396A JP2019057795A (ja) 2017-09-20 2017-09-20 音声信号処理装置、その制御方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017180396A JP2019057795A (ja) 2017-09-20 2017-09-20 音声信号処理装置、その制御方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2019057795A true JP2019057795A (ja) 2019-04-11

Family

ID=66106285

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017180396A Pending JP2019057795A (ja) 2017-09-20 2017-09-20 音声信号処理装置、その制御方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2019057795A (ja)

Similar Documents

Publication Publication Date Title
US8068620B2 (en) Audio processing apparatus
JP6637926B2 (ja) 音声処理装置及びその制御方法
JP2002218583A (ja) 音場合成演算方法及び装置
JP6821126B2 (ja) ノイズ除去装置、ノイズ除去方法およびノイズ除去プログラム
US7499087B2 (en) Noise reducing device and noise reducing method
JP2019057795A (ja) 音声信号処理装置、その制御方法およびプログラム
JP2019192963A (ja) ノイズ軽減装置、ノイズ軽減方法およびプログラム
JP2006237816A (ja) 演算装置、収音装置、及び、信号処理プログラム
CN111083250A (zh) 移动终端及其降噪方法
JP7030470B2 (ja) 信号処理装置、信号処理方法、及びプログラム
JP2011182177A (ja) オーディオ再生装置
JP5645373B2 (ja) 音声処理装置、音声処理方法
JP2019091988A (ja) 音声処理装置および音声処理方法
US10425731B2 (en) Audio processing apparatus, audio processing method, and program
JP6985821B2 (ja) 音声処理装置及びその制御方法
JP2019161334A (ja) 音声処理装置
JP6604728B2 (ja) 音声処理装置及び音声処理方法
US20240339101A1 (en) Ear-worn device and reproduction method
JP2019205084A (ja) 音声処理装置およびその制御方法
JP5317936B2 (ja) 音声信号処理装置
EP4456561A1 (en) Ear-mounted device and reproduction method
CN108154887B (zh) 一种信息处理方法、装置及终端
JP2019179944A (ja) 音声切替装置
WO2018198751A1 (ja) ノイズ低減装置、ノイズ低減方法およびプログラム
JP6877246B2 (ja) 音声処理装置及びその制御方法