JP2019091988A - 音声処理装置および音声処理方法 - Google Patents

音声処理装置および音声処理方法 Download PDF

Info

Publication number
JP2019091988A
JP2019091988A JP2017218212A JP2017218212A JP2019091988A JP 2019091988 A JP2019091988 A JP 2019091988A JP 2017218212 A JP2017218212 A JP 2017218212A JP 2017218212 A JP2017218212 A JP 2017218212A JP 2019091988 A JP2019091988 A JP 2019091988A
Authority
JP
Japan
Prior art keywords
unit
audio signal
signal output
correction
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017218212A
Other languages
English (en)
Inventor
友仁 井上
Tomohito Inoue
友仁 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017218212A priority Critical patent/JP2019091988A/ja
Publication of JP2019091988A publication Critical patent/JP2019091988A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Control Of Amplification And Gain Control (AREA)

Abstract

【課題】リニアリティを維持しつつ、広いダイナミックレンジの音声信号を取得することである。【解決手段】音声処理装置は、異なる増幅率で音声信号を増幅する第1及び第2の増幅部(201,202)と、第1及び第2の増幅部が出力する音声信号をアナログからデジタルに変換する第1及び第2のADC部(203,204)と、第1のADC部が出力する音声信号を減衰させる減衰部(205)と、第2のADC部が出力する音声信号のゲインおよびDCオフセットを補正する第1の補正部(208,209)と、減衰部が出力する音声信号の振幅を補正する第2の補正部(212)と、第1の補正部が出力する音声信号の振幅を補正する第3の補正部(213)と、第2又は第3の補正部が出力する音声信号を出力する出力部(214)とを有し、第2の補正部および第3の補正部は、第1の音声信号の主周波数が第2の閾値より高い場合には補正を行わないようにする。【選択図】図2

Description

本発明は、音声処理装置および音声処理方法に関する。
音声信号を処理する装置として、画像信号を記録すると共に音声信号を記録する撮像装置が知られている。これらの撮像装置では、音声信号のダイナミックレンジを拡張する機能を持つものがある。(例えば、特許文献1参照)。
特開2011−44908号公報
しかしながら、アナログゲインを変更することによるダイナミックレンジの拡張は、音声信号のリニアリティが失われてしまうという課題がある。
そこで、本発明は、リニアリティを維持しつつ、広いダイナミックレンジの音声信号を取得することを目的とする。
本発明の音声処理装置は、第1の増幅率で第1の音声信号を増幅する第1の増幅部と、前記第1の増幅率より低い第2の増幅率で前記第1の音声信号を増幅する第2の増幅部と、前記第1の増幅部が出力する音声信号をアナログからデジタルに変換する第1のADC部と、前記第2の増幅部が出力する音声信号をアナログからデジタルに変換する第2のADC部と、前記第1の増幅率と前記第2の増幅率の差分に応じて、前記第1のADC部が出力する音声信号を減衰させる減衰部と、前記減衰部が出力する音声信号のゲインおよびDCオフセットに応じて、前記第2のADC部が出力する音声信号のゲインおよびDCオフセットを補正する第1の補正部と、前記減衰部が出力する音声信号の振幅と前記第1の補正部が出力する音声信号の振幅との差に応じて、前記減衰部が出力する音声信号の振幅を補正する第2の補正部と、前記減衰部が出力する音声信号の振幅と前記第1の補正部が出力する音声信号の振幅との差に応じて、前記第1の補正部が出力する音声信号の振幅を補正する第3の補正部と、前記第1の音声信号の振幅の絶対値が前記第1の閾値以下である場合には、前記第2の補正部が出力する音声信号を出力し、前記第1の音声信号の振幅の絶対値が前記第1の閾値より大きい場合には、前記第3の補正部が出力する音声信号を出力する出力部とを有し、前記第2の補正部および前記第3の補正部はそれぞれ、前記第1の音声信号の主周波数が第2の閾値より高い場合には補正を行わないようにする。
本発明によれば、リニアリティを維持しつつ、広いダイナミックレンジの音声信号を取得することができる。
本実施形態の撮像装置のブロック図である。 本実施形態の音声処理部のブロック図である。 本実施形態の音声処理部の出力波形を示す図である。
図1は、本発明の実施形態による撮像装置100の構成例を示すブロック図である。撮像装置100は、音声信号を処理し、処理した音声信号を録音することができる。例えば、撮像装置100は、デジタルカメラ、ビデオカメラの他、スマートフォン、タブレット等に適用可能である。以下、撮像装置100の構成を説明する。
撮像部101は、撮影レンズにより取り込まれた被写体の光学像を撮像素子により画像信号に変換し、アナログデジタル変換、画像調整処理などを行い、画像データを生成する。音声入力部102は、内蔵または音声端子を介して接続された複数のマイクにより、撮像装置100の周辺の音声を集音し、アナログデジタル変換、音声処理などを行い、音声データを生成する。音声処理部103は、音声入力部102により得られた音声データに対し、音声信号処理を行う。
メモリ104は、撮像部101により得られた画像データや、音声処理部103で処理された音声データを一時的に記憶する。表示制御部105は、撮像部101により得られた画像データに係る映像や、撮像装置100の操作画面、メニュー画面等を表示部106や、不図示の映像端子を介して外部のディスプレイに表示させる。符号化処理部107は、メモリ104に一時的に記憶された画像データや音声データを読み出して所定の符号化を行い、圧縮画像データ、圧縮音声データ等を生成する。
記録再生部108は、記録媒体109に対して、符号化処理部107で生成された圧縮画像データ、圧縮音声データ等を記録したり、記録媒体109に記録された圧縮画像データ、圧縮音声データ、各種データ、プログラムを読み出す。ここで、記録媒体109は、圧縮画像データ、圧縮音声データ、等を記録することができれば、磁気ディスク、光学式ディスク、半導体メモリなどのあらゆる方式の記録媒体を含む。
制御部110は、撮像装置100の各ブロックに制御信号を送信することで撮像装置100の各ブロックを制御することができ、各種制御を実行するためのCPUやメモリなどを有する。操作部111は、ボタンやダイヤルなどを有し、ユーザの操作に応じて、指示信号を制御部110に送信する。音声出力部112は、記録再生部108により再生された圧縮音声データや、制御部110により出力される音声データをスピーカ113や音声端子などに出力する。外部出力部114は、記録再生部108により再生された圧縮映像データや圧縮音声データなどを外部機器に出力する。データバス115は、音声データや画像データ等の各種データ、各種制御信号を撮像装置100の各ブロックに供給する。
次に、本実施形態の撮像装置100の通常の動作について説明する。撮像装置100は、ユーザが操作部111を操作して電源を投入する指示が出されたことに応じて、不図示の電源供給部から、撮像装置100の各ブロックに電源を供給する。電源が供給されると、制御部110は、例えば、操作部111のモード切り換えスイッチが、例えば、撮影モード(動画記録モード)および再生モード等のどのモードであるかを操作部111からの指示信号により確認する。動画記録モードでは、撮像部101により得られた画像データと音声入力部102により得られた音声データとを1つのファイルとして保存することができる。再生モードでは、記録媒体109に記録された圧縮画像データを記録再生部108により再生して表示部106に表示させることができる。
動画記録モードでは、まず、制御部110は、撮影待機状態に移行させるように制御信号を撮像装置100の各ブロックに送信し、以下のような動作をさせる。撮像部101は、撮影レンズにより取り込まれた被写体の光学像を撮像素子により画像信号に変換し、アナログデジタル変換、画像調整処理などを行い、画像データを生成する。そして、撮像部101は、得られた画像データを表示処理部105に送信し、画像データを表示部106に表示させる。ユーザは、この様にして表示された画面を見ながら撮影の準備を行う。
音声入力部102は、複数のマイクにより得られたアナログ音声信号をデジタル音声信号に変換し、デジタル音声信号を生成する。音声処理部103は、得られたデジタル音声信号に対して、任意の信号処理を施し、マルチチャンネルの音声データを生成する。そして、音声処理部103は、得られた音声データを音声出力部112に送信し、接続されたスピーカ113や不図示のイヤホンから音声として出力させる。ユーザは、この様にして出力された音声を聞きながら記録音量を決定するためのマニュアルボリュームの調整をすることもできる。
次に、ユーザが操作部111の記録ボタンを操作することにより撮影開始の指示信号が制御部110に送信されると、制御部110は、撮像装置100の各ブロックに撮影開始の指示信号を送信し、以下のような動作をさせる。撮像部101は、撮影レンズにより取り込まれた被写体の光学像を撮像素子により画像信号に変換し、アナログデジタル変換、画像調整処理などを行い、画像データを生成する。そして、撮像部101は、得られた画像データを表示処理部105に送信し、画像データを表示部106に表示させる。また、撮像部101は、得られた画像データをメモリ104に送信する。
音声入力部102は、複数のマイクにより得られたアナログ音声信号をデジタル音声信号に変換し、複数のデジタル音声信号を得る。音声処理部103は、得られたデジタル音声信号に対して、任意の信号処理を施し、マルチチャンネルの音声データを生成する。そして、音声処理部103は、得られた音声データをメモリ104に送信する。
符号化処理部107は、メモリ104に一時的に記憶された画像データや音声データを読み出して所定の符号化を行い、圧縮画像データや圧縮音声データ等を生成する。そして、制御部110は、これらの圧縮画像データおよび圧縮音声データを合成し、データストリームを形成し、データストリームを記録再生部108に出力する。記録再生部108は、UDF、FAT等のファイルシステム管理のもとに、データストリームを一つの動画ファイルとして記録媒体109に書き込んでいく。
以上の動作を撮影中は継続する。そして、ユーザが操作部111の記録ボタンを操作することにより撮影終了の指示信号が制御部110に送信されると、制御部110は、撮像装置100の各ブロックに撮影終了の指示信号を送信し、以下のような動作をさせる。撮像部101および音声入力部102は、それぞれ画像データおよび音声データの生成を停止する。
符号化処理部107は、メモリに記憶されている残りの画像データと音声データとを読み出して所定の符号化を行い、圧縮画像データおよび圧縮音声データ等を生成し終えたら動作を停止する。そして、制御部110は、これらの最後の圧縮画像データおよび圧縮音声データを合成し、データストリームを形成し、データストリームを記録再生部108に出力する。記録再生部108は、UDF、FAT等のファイルシステム管理のもとに、データストリームを一つの動画ファイルとして記録媒体108に書き込んでいく。そして、記録再生部108は、データストリームの供給が停止したら、動画ファイルを完成させて、記録動作を停止させる。制御部110は、記録動作が停止すると、撮影待機状態に移行させるように制御信号を撮像装置100の各ブロックに送信して、撮影待機状態に戻る。
次に、再生モードでは、制御部110は、再生状態に移行させるように制御信号を撮像装置100の各ブロックに送信し、以下のような動作をさせる。記録再生部108は、記録媒体109に記録された圧縮画像データと圧縮音声データとからなる動画ファイルを読み出して、読み出された圧縮画像データと圧縮音声データを符号化処理部107に送信する。符号化処理部107は、圧縮画像データと圧縮音声データを復号して、それぞれ、表示制御部105と音声処理部103に送信する。音声処理部103は、得られたデジタル音声信号に対して、任意の信号処理を施し、得られた音声データを音声出力部112に送信する。表示制御部105は、復号された画像データを表示部106に表示させる。音声出力部112は、復号された音声データを内蔵または、取付けられた外部スピーカから出力させる。本実施形態の撮像装置100は、以上のように、画像および音声の記録再生を行うことができる。
図2は、本実施形態の音声処理部103の構成例を示す図である。図3は、音声処理部103の出力波形を示す図である。音声処理部103は、音声処理装置である。以下、音声処理部103が行う音声処理方法について説明する。増幅部201は、第1の増幅率で、入力された音声信号を増幅する。増幅部202は、増幅部201の第1の増幅率よりも低い第2の増幅率で、入力された音声信号を増幅する。ADC部203は、増幅部201で増幅された音声信号をアナログからデジタルに変換する。ADC部204は、増幅部202で増幅された音声信号をアナログからデジタルに変換する。増幅部205は、減衰部であり、増幅部201における第1の増幅率と増幅部202における第2の増幅率の差分だけ、ADC部203でアナログデジタル変換された音声信号を減衰させる。レベル検出部206は、増幅部205で減衰させられた音声信号のレベルを検出する。音声信号のレベルは、音声信号の振幅である。ゼロクロス検出部207は、増幅部205で減衰させられた音声信号のゼロクロス(時刻305)を検出する。ゼロクロスは、増幅部205が出力する音声信号の振幅がゼロになる時刻305の点である。ゲイン差補正部208は、増幅部205が出力する音声信号とADC部204が出力する音声信号とのゲイン差を補正する。そのゲイン差は、増幅部201,202や、ADC部203,204を構成するハードウェアの特性の違いなどに基づいて発生する。例えば、ゲイン差補正部208は、増幅部205で減衰させられた音声信号の微分値と、ADC部204でアナログデジタル変換された音声信号の微分値の差分を積分し、その積分結果がゼロに近づくように、ADC部204でAD変換された音声信号を補正する。DCオフセット補正部209は、増幅部205が出力する音声信号とゲイン差補正部208が出力する音声信号とのDCオフセットの差を補正する。DCオフセットは、ADC部203および204を構成するハードウェアの特性の違いなどに基づいて発生する。例えば、DCオフセット補正部209は、増幅部205で減衰させられた音声信号と、ゲイン差補正部208で補正された音声信号の差分を積分し、その積分結果がゼロに近づくように、ゲイン差補正部208で補正された音声信号を補正する。周波数検出部210は、ADC部204でアナログデジタル変換された音声信号の周波数を検出する。レベル差検出部211は、増幅部205で減衰させられた音声信号と、DCオフセット補正部209で補正された音声信号のレベル差を検出する。レベル差補正部212は、レベル差検出部211で検出されたレベル差に応じて、増幅部205で減衰させられた音声信号のレベルを補正する。レベル差補正部213は、レベル差検出部211で検出されたレベル差に応じて、DCオフセット補正部209で補正された音声信号のレベルを補正する。信号選択部214は、出力部であり、レベル検出部206の検出結果によって、レベル差補正部212でレベルを補正された信号と、レベル差補正部213でレベルを補正された信号のどちらかを選択して出力する。
音声処理部103は、入力された音声信号に対して、高い第1の増幅率で増幅した高S/Nの信号(以下、ハイゲインの信号)と、低い第2の増幅率で増幅した最大入力レベルが高い信号(以下、ローゲインの信号)を生成する。そして、音声処理部103は、入力された音声信号の振幅が小さいときにはハイゲインの信号を出力し、入力された音声信号の振幅が大きくなったときにはローゲインの信号を出力する。音声処理部103は、入力音声信号の振幅の絶対値が閾値よりも小さい場合に高い第1の増幅率で増幅してADC部203によりデジタル信号に変換した音声を選択する。これにより、ADC部203のダイナミックレンジを一杯に使用した、S/Nのよい音声を取得することができる。また、音声処理部103は、入力された音声信号の振幅の絶対値が閾値よりも大きくなった場合には低い第2の増幅率で増幅し、ADC部204でデジタル信号に変換した音声を選択することで、出力される音声が歪んでしまうことを防ぐことができる。ここで、ハイゲインの音声とローゲインの音声の出力を切り替えるための音声レベルの閾値は、ハイゲインの信号が0dBFSに近づき、歪みが発生するレベルより低いレベルに設定する。
信号選択部214は、レベル検出部206により検出されるレベルの絶対値が閾値より小さい場合には、レベル差補正部212が出力する音声信号を選択し、その選択した音声信号を出力する。また、信号選択部214は、レベル検出部206により検出されるレベルの絶対値が閾値より大きい場合には、レベル差補正部213が出力する音声信号を選択し、その選択した音声信号を出力する。なお、信号選択部214は、音声処理部103の入力音声信号のレベルに応じて選択するものであればよい。
入力された音声信号は、増幅部201で増幅された後、ADC部203でアナログデジタル変換される。また、入力信号は、増幅部201よりも低い増幅率で、増幅部202で増幅された後、ADC部204でアナログデジタル変換される。ADC部203でアナログデジタル変換されたハイゲインの信号は、増幅部205で、増幅部201および202の増幅率の差分だけ減衰されることで、ADC部204でアナログデジタル変換されたローゲインの信号とデジタル領域で同じレベルになる。増幅部205で減衰されたハイゲインの信号は、レベル検出部206でレベルを検出される。レベル検出部206は、ハイゲインの信号の振幅の絶対値が閾値を超えたかどうかを判定する。閾値は、ハイゲインの信号が歪みはじめるよりも低いレベルであり、かといって低すぎると、ローゲインの信号にとって、S/Nが悪い領域で使用されることになる。そのため、ハイゲインの信号とローゲインの信号に印加するゲイン差を+12dB〜+20dB程度とし、閾値は高S/Nの信号の−6dBFS程度が好適である。
ADC部204でアナログデジタル変換されたローゲインの信号は、増幅部205で減衰されたハイゲインの信号と、デジタル領域で同じレベルになることが想定される。しかし、実際は、増幅部201および202での増幅率のバラツキやADC部203および204での感度バラツキ等が必ず発生するため、厳密には同じレベルにはならない。ゲイン差補正部208は、上記のレベル差を補正する。具体的には、ゲイン差補正部208は、増幅部205で減衰させられたハイゲインの音声信号の微分値と、ADC部204でアナログデジタル変換されたローゲインの音声信号の微分値の差分を積分する。そして、ゲイン差補正部208は、その積分結果がゼロに近づくように、ADC部204でアナログデジタル変換された音声信号を補正することでゲイン差を補正可能である。
また、ADC部203および204は、アナログデジタル変換結果に固有のDCオフセットを持つ可能性があるため、DCオフセット補正部209は、各ADC203および204でのDCオフセットの差分を補正する。具体的には、DCオフセット補正部209は、増幅部205で減衰させられたハイゲインの音声信号と、ゲイン差補正部208で補正されたローゲインの音声信号との差分を積分する。そして、DCオフセット補正部209は、その積分結果がゼロに近づくように、ゲイン差補正部208で補正された音声信号を補正することで、DCオフセットの差分を補正可能である。このように、ADC部204でアナログデジタル変換されたローゲインの音声信号は、ゲイン差とDCオフセット差を補正される。信号選択部214は、レベル検出部206により検出されたレベルの絶対値が閾値以下の場合、レベル差補正部212が出力するハイゲインの音声信号を選択して出力する。また、レベル検出部206により検出されたレベルの絶対値が閾値よりも大きい場合、増幅部205で減衰させられたハイゲインの音声信号には、増幅部201やADC部203で発生した歪みが発生する。そのため、信号選択部214は、レベル検出部206により検出されたレベルの絶対値が閾値より大きい場合、レベル差補正部213が出力するローゲインの音声信号を選択して出力する。
ここで、低周波のバースト状の音声信号が入力された際に、ハイゲインの音声信号とローゲインの音声信号を切り替える際のつなぎ目が音として認識されることがある。ここでいう低周波とは、特に100Hz以下の周波数を示し、信号選択部214の後段で、低周波をカットする信号処理と、信号を増幅させる信号処理が行われる場合に発生する。低周波のバースト状の音声信号が入力された場合、基本波のバースト状の音声信号の信号選択部214における切り替えのつなぎ目は、人間の耳で認識できないレベルまで小さくすることができる。しかし、風雑音除去のような低周波をカットする信号処理が行われる場合、基本波のみがカットされ、つなぎ目のレベルは変わらない。さらにその後、レベル制御回路のような信号を増幅させる信号処理が行われる場合には、カットされた基本波とつなぎ目がともに増幅されるため、つなぎ目が音として認識されることがある。このような現象に対して、微小なつなぎ目もなくした音声信号を出力する構成を、図3をあわせて用いて説明する。
上記の微小なつなぎ目もなくした音声信号を出力するため、レベル差検出部211は、ハイゲインの信号とローゲインの信号とのレベル差を検出する。そして、ハイゲインの信号とローゲインの信号の一方から他方への切り替え後に選択される信号に対して、検出されたレベル差を補正する。低周波のバースト状の音声信号が入力された場合においても、信号選択部214は、レベル検出部206により検出されたレベルの絶対値が閾値以下である場合には、レベル差補正部212が出力するハイゲインの信号を出力する。
時刻301では、レベル差検出部211は、レベル検出部206により検出されたレベルの絶対値が閾値より大きくなると、増幅部205が出力するハイゲインの信号とDCオフセット補正部209が出力するローゲインの信号とのレベル差を検出する。そして、レベル差検出部211は、レベル差に応じたゲインをレベル差補正部213に出力する。レベル差補正部213は、レベル差検出部211により検出されたレベル差が小さくなる(ここではレベル差をゼロに補正する)ように、補正のためのゲインを決定し、DCオフセット補正部209が出力するローゲインの信号に対して印加する。信号選択部214は、レベル検出部206により検出されたレベルの絶対値が閾値より大きい場合には、レベル差補正部213が出力するローゲインの信号を選択して出力する。
期間302は、レベル検出部206により検出されるレベルの絶対値が閾値より大きい期間である。期間302では、レベル差補正部213は、レベル差検出部211が検出したレベル差をゼロに補正するようなゲインを、DCオフセット補正部209が出力するローゲインの信号に印加し続ける。期間302では、信号選択部214は、レベル差補正部213が出力するローゲインの信号を選択して出力する。
また、時刻303では、レベル差検出部211は、レベル検出部206により検出されたレベルの絶対値が閾値以下になると、レベル差補正部213で補正されるゲインを考慮し、ハイレベルの信号とローレベルの信号とのレベル差を検出する。すなわち、レベル差検出部211は、増幅部205が出力するハイゲインの信号と、レベル差補正部213が出力するローゲインの信号とのレベル差を検出する。そして、レベル差検出部211は、レベル差に応じたゲインをレベル差補正部212に出力する。レベル差補正部212は、レベル差検出部211により検出されたレベル差をゼロに補正するようなゲインを、増幅部205が出力するハイゲインの信号に対して印加する。すなわち、レベル差補正部212は、レベル差補正部213の補正値に応じて、増幅部205が出力するハイゲインの信号のレベルを補正する。信号選択部214は、レベル検出部206により検出されたレベルの絶対値が閾値以下である場合には、レベル差補正部212が出力するハイゲインの信号を選択して出力する。
期間304は、レベル検出部206により検出されるレベルの絶対値が閾値以下の期間である。期間304では、レベル差補正部212は、レベル差検出部211が検出したレベル差をゼロに補正するようなゲインを、増幅部205が出力するハイゲインの信号に印加し続ける。期間304では、信号選択部214は、レベル差補正部212が出力するハイゲインの信号を選択して出力する。
時刻305では、ゼロクロス検出部207は、増幅部205が出力する信号の振幅がゼロになるゼロクロスを検出した際に、レベル差補正部212におけるゲインをリセットする。ここで、周波数検出部210は、ADC部204が出力するローゲインの信号の周波数成分を検出する。周波数検出部210は、検出した周波数成分のうちの周波数閾値以下の成分が支配的である場合にはレベル差検出部211を動作させ、検出した周波数成分のうちの周波数閾値より高い成分が支配的である場合にはレベル差検出部211を動作させない。
すなわち、周波数検出部210は、ADC部204が出力する音声信号の主周波数成分を検出する。周波数検出部210は、検出した主周波数が周波数閾値以下である場合にはレベル差検出部211を動作させ、検出した主周波数が周波数閾値より高い場合にはレベル差検出部211を動作させない。レベル差補正部212及び213は、ADC部204が出力する音声信号の主周波数が周波数閾値以下である場合には補正し、ADC部204が出力する音声信号の主周波数が周波数閾値より高い場合には補正しない。
本実施形態によれば、リニアリティを維持しつつ、広いダイナミックレンジの音声信号を取得することができる。
なお、レベル検出部206は、音声処理部103の入力音声信号またはADC部204の出力音声信号のレベルの絶対値を検出してもよい。また、ゼロクロス検出部207は、音声処理部103の入力音声信号またはADC部204の出力音声信号のゼロクロスを検出してもよい。また、周波数検出部210は、音声処理部103の入力音声信号または増幅部205の出力音声信号の主周波数を検出してもよい。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
なお、上記実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
201,202 増幅部、203,204 ADC部、205 増幅部、206 レベル検出部、207 ゼロクロス検出部、208 ゲイン差補正部、209 DCオフセット補正部、210 周波数検出部、211 レベル差検出部、212,213 レベル差補正部、214 信号選択部

Claims (8)

  1. 第1の増幅率で第1の音声信号を増幅する第1の増幅部と、
    前記第1の増幅率より低い第2の増幅率で前記第1の音声信号を増幅する第2の増幅部と、
    前記第1の増幅部が出力する音声信号をアナログからデジタルに変換する第1のADC部と、
    前記第2の増幅部が出力する音声信号をアナログからデジタルに変換する第2のADC部と、
    前記第1の増幅率と前記第2の増幅率の差分に応じて、前記第1のADC部が出力する音声信号を減衰させる減衰部と、
    前記減衰部が出力する音声信号のゲインおよびDCオフセットに応じて、前記第2のADC部が出力する音声信号のゲインおよびDCオフセットを補正する第1の補正部と、
    前記減衰部が出力する音声信号の振幅と前記第1の補正部が出力する音声信号の振幅との差に応じて、前記減衰部が出力する音声信号の振幅を補正する第2の補正部と、
    前記減衰部が出力する音声信号の振幅と前記第1の補正部が出力する音声信号の振幅との差に応じて、前記第1の補正部が出力する音声信号の振幅を補正する第3の補正部と、
    前記第1の音声信号の振幅の絶対値が前記第1の閾値以下である場合には、前記第2の補正部が出力する音声信号を出力し、前記第1の音声信号の振幅の絶対値が前記第1の閾値より大きい場合には、前記第3の補正部が出力する音声信号を出力する出力部とを有し、
    前記第2の補正部および前記第3の補正部はそれぞれ、前記第1の音声信号の主周波数が第2の閾値より高い場合には補正を行わないようにすることを特徴とする音声処理装置。
  2. 前記第2の補正部は、前記第3の補正部の補正値に応じて、前記減衰部が出力する音声信号の振幅を補正することを特徴とする請求項1に記載の音声処理装置。
  3. 前記第2の補正部は、前記第1の音声信号の振幅がゼロである場合には補正しないことを特徴とする請求項1または2に記載の音声処理装置。
  4. 前記第2の補正部および前記第3の補正部は、前記第2のADC部が出力する音声信号の主周波数が第3の閾値以下である場合には補正し、前記第2のADC部が出力する音声信号の主周波数が前記第3の閾値より高い場合には補正しないことを特徴とする請求項1〜3のいずれか1項に記載の音声処理装置。
  5. 前記出力部は、前記減衰部が出力する音声信号の振幅の絶対値が第4の閾値以下である場合には、前記第2の補正部が出力する音声信号を出力し、前記減衰部が出力する音声信号の振幅の絶対値が前記第4の閾値より大きい場合には、前記第3の補正部が出力する音声信号を出力することを特徴とする請求項1〜4のいずれか1項に記載の音声処理装置。
  6. 前記第2の補正部は、前記減衰部が出力する音声信号の振幅がゼロである場合には補正しないことを特徴とする請求項1〜5のいずれか1項に記載の音声処理装置。
  7. 前記第1の補正部は、前記減衰部が出力する音声信号のゲインおよびDCオフセットと、前記第2のADC部が出力する音声信号のゲインおよびDCオフセットとの差を補正することを特徴とする請求項1〜6のいずれか1項に記載の音声処理装置。
  8. 第1の増幅部が、第1の増幅率で第1の音声信号を増幅する第1の増幅ステップと、
    第2の増幅部が、前記第1の増幅率より低い第2の増幅率で前記第1の音声信号を増幅する第2の増幅ステップと、
    第1のADC部が、前記第1の増幅部が出力する音声信号をアナログからデジタルに変換する第1の変換ステップと、
    第2のADC部が、前記第2の増幅部が出力する音声信号をアナログからデジタルに変換する第2の変換ステップと、
    減衰部が、前記第1の増幅率と前記第2の増幅率の差分に応じて、前記第1のADC部が出力する音声信号を減衰させる減衰ステップと、
    第1の補正部が、前記減衰部が出力する音声信号のゲインおよびDCオフセットに応じて、前記第2のADC部が出力する音声信号のゲインおよびDCオフセットを補正する第1の補正ステップと、
    第2の補正部が、前記減衰部が出力する音声信号の振幅と前記第1の補正部が出力する音声信号の振幅との差に応じて、前記減衰部が出力する音声信号の振幅を補正する第2の補正ステップと、
    第3の補正部が、前記減衰部が出力する音声信号の振幅と前記第1の補正部が出力する音声信号の振幅との差に応じて、前記第1の補正部が出力する音声信号の振幅を補正する第3の補正ステップと、
    出力部が、前記第1の音声信号の振幅の絶対値が前記第1の閾値以下である場合には、前記第2の補正部が出力する音声信号を出力し、前記第1の音声信号の振幅の絶対値が前記第1の閾値より大きい場合には、前記第3の補正部が出力する音声信号を出力する出力ステップとを有し、
    前記第2の補正ステップおよび前記第3の補正ステップではそれぞれ、前記第1の音声信号の主周波数が第2の閾値より高い場合には補正を行わないようにすることを特徴とする音声処理方法。
JP2017218212A 2017-11-13 2017-11-13 音声処理装置および音声処理方法 Pending JP2019091988A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017218212A JP2019091988A (ja) 2017-11-13 2017-11-13 音声処理装置および音声処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017218212A JP2019091988A (ja) 2017-11-13 2017-11-13 音声処理装置および音声処理方法

Publications (1)

Publication Number Publication Date
JP2019091988A true JP2019091988A (ja) 2019-06-13

Family

ID=66837508

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017218212A Pending JP2019091988A (ja) 2017-11-13 2017-11-13 音声処理装置および音声処理方法

Country Status (1)

Country Link
JP (1) JP2019091988A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020230832A1 (ja) 2019-05-15 2020-11-19 味の素株式会社 神経堤細胞または角膜上皮細胞の純化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020230832A1 (ja) 2019-05-15 2020-11-19 味の素株式会社 神経堤細胞または角膜上皮細胞の純化方法

Similar Documents

Publication Publication Date Title
US8422691B2 (en) Audio outputting device, audio outputting method, noise reducing device, noise reducing method, program for noise reduction processing, noise reducing audio outputting device, and noise reducing audio outputting method
US20100142719A1 (en) Acoustic apparatus and method of controlling an acoustic apparatus
US8600078B2 (en) Audio signal amplitude adjusting device and method
JP2019091988A (ja) 音声処理装置および音声処理方法
JP5645393B2 (ja) 音声信号処理装置
JP2019161334A (ja) 音声処理装置
JP2018074220A (ja) 音声処理装置
JP7450196B2 (ja) 制御装置、制御方法及びプログラム
JP5645373B2 (ja) 音声処理装置、音声処理方法
JP6887315B2 (ja) 音声処理装置およびその制御方法、プログラム並びに記憶媒体
US10425731B2 (en) Audio processing apparatus, audio processing method, and program
JP2019179944A (ja) 音声切替装置
JP5762797B2 (ja) 信号処理装置及び信号処理方法
JP5340127B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法
JP5317936B2 (ja) 音声信号処理装置
JP6604728B2 (ja) 音声処理装置及び音声処理方法
JP5495753B2 (ja) 撮像装置
JP2006173918A (ja) 音声処理装置及び撮像装置
JP2016009952A (ja) 音声信号処理装置
JP2019161333A (ja) 音声処理装置
JP2019071511A (ja) 信号処理装置、信号処理方法、及びプログラム
JP2019205084A (ja) 音声処理装置およびその制御方法
JP5513907B2 (ja) 自動レベル制御回路およびそれを用いたオーディオ用デジタル信号プロセッサ、電子機器ならびに可変利得増幅器の利得制御方法
JP2012195772A (ja) 音声信号処理装置及びその制御方法、コンピュータプログラム
JP2009200777A (ja) オーディオ信号の利得制御装置および利得制御方法