JP2016111478A - Voice processing device - Google Patents
Voice processing device Download PDFInfo
- Publication number
- JP2016111478A JP2016111478A JP2014246195A JP2014246195A JP2016111478A JP 2016111478 A JP2016111478 A JP 2016111478A JP 2014246195 A JP2014246195 A JP 2014246195A JP 2014246195 A JP2014246195 A JP 2014246195A JP 2016111478 A JP2016111478 A JP 2016111478A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- unit
- audio
- correction
- noise profile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Studio Devices (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明は、マイクロフォンなどの音声入力手段で取り込んだ音声に含まれる騒音を低減する音声処理装置に関し、より具体的には、スペクトルサブトラクト法(SS法)により騒音を低減する音声処理装置に関する。 The present invention relates to a speech processing apparatus that reduces noise contained in speech captured by a speech input means such as a microphone, and more specifically to a speech processing apparatus that reduces noise by a spectral subtract method (SS method).
従来、マイクロフォンで取り込んだ音声信号に含まれる雑音を低減する方法として、雑音の周波数成分を選択的に低減するスペクトラム拡散(SS)を用いる方法が知られている。これは、騒音の周波数成分を推定し、その周波数成分を入力音声信号から減算することで騒音を低減するものである。 2. Description of the Related Art Conventionally, as a method for reducing noise contained in an audio signal captured by a microphone, a method using spread spectrum (SS) that selectively reduces noise frequency components is known. This is to reduce the noise by estimating the frequency component of the noise and subtracting the frequency component from the input voice signal.
特許文献1には、入力音声信号に含まれうる騒音スペクトルをノイズプロファイルとして予め記憶しておく騒音低減システムが記載されている。 Patent Document 1 describes a noise reduction system in which a noise spectrum that can be included in an input audio signal is stored in advance as a noise profile.
騒音は、ある程度固定された周波数成分を持つとしても、そのスペクトルは、様々な外乱によって容易に変動し得る。特許文献1に記載の技術は、温度変化や経年変化等による騒音成分の周波数変動を考慮しないノイズプロファイルを用いて騒音低減を行うので、実際の状況で適切に騒音を低減した結果を得るのが難しい。却って耳障りな音声成分を発生させてしまうこともある。 Even though noise has a frequency component that is fixed to some extent, its spectrum can easily fluctuate due to various disturbances. Since the technique described in Patent Document 1 performs noise reduction using a noise profile that does not take into account frequency fluctuations of noise components due to temperature change, secular change, etc., the result of appropriately reducing noise in an actual situation is obtained. difficult. On the other hand, an unpleasant voice component may be generated.
本発明は、ノイズプロファイルを利用しつつ、温度変化又は経年変化等による騒音の変動に対応しうる音声処理装置を提示することを目的とする。 An object of the present invention is to provide a speech processing apparatus that can cope with noise fluctuations due to temperature change or secular change while using a noise profile.
このような目的を達成するために、本発明にかかる音声処理装置は、騒音発生手段と、前記騒音発生手段が発生する騒音を他の音と共に取り込む音声入力手段とを具備する主装置に組み込まれる音声処理装置であって、前記騒音の音声信号を周波数領域に変換して得られる騒音スペクトルから作成されるノイズプロファイルを記憶するメモリと、前記騒音発生手段が発生する前記騒音の外乱による変動を示す補助データを用いて前記ノイズプロファイルを補正する補正手段と、前記補正手段によって補正されたノイズプロファイルを用いて前記音声入力手段により入力される音声信号に含まれる前記騒音を低減する音声処理手段とを具備することを特徴とする。 In order to achieve such an object, an audio processing apparatus according to the present invention is incorporated in a main apparatus including noise generating means and audio input means for taking in noise generated by the noise generating means together with other sounds. A speech processing apparatus, wherein a memory that stores a noise profile created from a noise spectrum obtained by converting the noise speech signal into a frequency domain, and fluctuation due to noise disturbance generated by the noise generating means Correction means for correcting the noise profile using auxiliary data; and voice processing means for reducing the noise contained in the voice signal input by the voice input means using the noise profile corrected by the correction means. It is characterized by comprising.
本発明によれば、外乱による騒音の周波数成分変動を考慮し、ノイズプロファイルを補正することにより、騒音成分の消し残しを大幅に削減した騒音低減を行うことができる。 According to the present invention, by correcting the noise profile in consideration of the fluctuation of the frequency component of noise due to disturbance, it is possible to perform noise reduction that greatly reduces the remaining noise component.
以下、図面を参照して、本発明の実施例を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本発明に係る音声処理装置の一実施例を組み込んだ主装置としての撮像装置の概略構成ブロック図を示す。 FIG. 1 shows a schematic block diagram of an imaging apparatus as a main apparatus incorporating an embodiment of a sound processing apparatus according to the present invention.
図1に示す撮像装置100において、撮像部101は、撮影レンズにより取り込まれた被写体の光学像をCCDセンサ又はCMOSセンサ等の撮像素子により画像信号に変換し、アナログデジタル変換して、画像処理部102に供給する。撮像部101は、撮像レンズを駆動するモーター・ギア等を有し、制御部114からの制御信号に従いモーター・ギア等を回転させることで、撮像レンズのズームイン/ズームアウト動作を行う。このモーター・ギア等は、撮像レンズを駆動するための駆動手段である。
In the
画像処理部102は、撮像部101から入力するデジタル画像信号に、設定値に基づいてホワイトバランス、色及び明るさなどを調整する画質調整処理を行う。画像処理部102は、処理結果の画像データを状況に応じてメモリ105、映像出力部110、表示制御部111及び制御部114に送信する。
The
音声入力部103は、少なくとも1つ以上の内蔵または外付けされたマイクを介して撮像装置100の周辺の音声を取り込み、デジタル信号に変換して音声処理部104に供給する。
The
音声処理部104は、音声入力部103から入力される音声データに音声レベルの適正化処理と特定周波数の低減処理等の音声処理を施し、その処理結果をメモリ105及び音声出力部109に供給する。音声処理部104は、騒音低減手段を内蔵する。音声処理部104は、また、音声入力部103からの音声データを用いて、SS(スペクトラム拡散)法により騒音を低減するために用いるノイズプロファイル等のデータを生成し、メモリ105に供給する。音声処理部104は、音声データを高速フーリエ変換する高速フーリエ変換(FFT)回路と、逆高速フーリエ変換する逆高速フーリエ変換(IFFT)回路を具備する。
The
メモリ105は、画像処理部102からの画像信号、並びに、音声処理部104からの音声信号及びノイズプロファイル等のデータを記憶する。
The
符号化処理部106は、画像データ及び音声データをそれぞれ所定の画像符号化方式及び音声符号化方式で符号化及び復号化することができる。符号化処理部106は、メモリ105に一時的に記憶された画像データ及び音声データを読み出して、それぞれ画像符号化及び音声符号化などを行って圧縮画像データ及び圧縮音声データを生成し、記録制御部107に供給する。
The
記録制御部107は、符号化処理部106で生成された圧縮画像データ及び圧縮音声データ、及び撮影に関する制御データを記録媒体108に記録する。また、記録制御部107は、記録媒体108に記録された圧縮画像データ、圧縮音声データ、各種データ及びプログラムを読み出す(再生する)こともできる。記録制御部107は、読み出した圧縮画像データ及び圧縮音声データを符号化処理部106に供給する。記録媒体108は、種々のデータを記録できる汎用的な記録媒体、例えば、磁気ディスク、光学式ディスクまたは半導体メモリなどからなり、異種または同種の複数の媒体の組み合わせであっても良い。
The
符号化処理部106は、記録制御部107からの圧縮画像データ及び圧縮音声データをメモリ105に一時記憶し、所定の手順で復号化する。符号化処理部106は、復号化された音声データを音声出力部109に供給し、復号化された画像データを映像出力部110及び表示制御部111に供給する。
The
音声出力部109は、例えば、音声出力端子からなり、イヤホンまたはスピーカなどの音声出力装置に音声信号を出力する。音声出力部109は、撮像装置100に内蔵されるスピーカであっても良い。映像出力部110は、例えば映像出力端子からなり、外部ディスプレイ等に画像信号を出力する。音声出力部109と映像出力部110は、統合された1つの端子、例えばHDMI(High-Definition Multimedia Interface)(登録商標)端子として構成されていてもよい。
The
表示制御部111は、符号化処理部106からの画像信号及び画像処理部102からの画像信号の画像を表示部112に表示し、撮像装置100を操作するための操作画面(メニュー画面)等を表示部112に表示する。表示部112は、例えば、液晶ディスプレイ、有機ELディスプレイまたは電子ペーパ等の表示デバイスであれば何でも良い。
The
操作部113は、ユーザの操作に応じた内容の指示信号を制御部114に送信する。制御部114は、操作部113から送信された指示信号に基づいて、撮像装置100の各ブロックに制御信号を送信することで、各ブロックを制御する。操作部113は、例えば、電源ボタン、記録開始ボタン、メニュー表示ボタン、決定ボタン、カーソルキー、表示部112の任意の点を指定するためのポインティングデバイス及びタッチパネル等からなる。
The
制御部114は、各種処理(プログラム)を実行するための例えば、CPU(MPU)及びメモリ(DRAM、SRAM)などからなり、撮像装置100の撮影等に関する動作を制御する。例えば、操作部113からのズーム撮影の指示信号を受けて、制御部114はズーム動作を示す制御信号を撮像部101に送信する。
The
通信部115は、無線又は有線で外部装置と通信し、音声データ及び画像データなどのデータを外部装置との間で送受信する。通信部115はまた、撮影開始・終了コマンド等の、撮影にかかる制御信号、その他の情報を送受信する。通信部115は例えば、赤外線通信モジュール、Bluetooth(登録商標)通信モジュール、無線LAN通信モジュール、有線LAN通信モジュール、USB通信モジュール及びThunderbolt(登録商標)通信モジュール等の1以上からなる。通信部115は、遠隔操作装置(リモートコントローラ)またはパーソナルコンピュータ(PC)等のデバイスと接続するためのインターフェースともなる。
The
バス116は、各種データ及び制御信号などを撮像装置100の各ブロック間で伝送する媒体である。
The
本実施例の動画・音声の記録動作を説明する。ユーザが操作部113で動画撮影モードを選択し、RECボタンを押すと、制御部114は、操作部113からのこの操作信号に応じて、関係するブロックに動作記録開始の制御信号を送信する。撮像部101は、制御部114からの動画撮影開始の制御信号を受けて、動画撮影を開始する。音声入力部103は、制御部114からの動画撮影開始の制御信号を受けて、周囲の音声の取り込みを開始する。撮像部101により撮影された動画は、画像処理部102で色温度、ホワイトバランス調整等の画像信号処理を行われ、動画データとしてメモリ105に一時記憶される。
The moving image / sound recording operation of this embodiment will be described. When the user selects the moving image shooting mode with the
動画記録中に、ユーザが操作部113でズーム動作を行った場合、制御部114は、ズーム動作開始の制御信号を撮像部101に供給する。撮像部101では、制御部114からズーム開始の制御信号を受けて、撮像レンズを動かすためにモーター・ギア等が回転し、撮像レンズを動かすためのモーター・ギア等による騒音が発生する。撮像レンズを動かすためのモーター・ギア等によって発生する騒音を「ズーム騒音」と呼ぶ。ズーム騒音が発生すると、音声入力部103が取り込む音声信号には、撮影した動画に付随する動画音声とズーム騒音が含まれる。音声入力部103は、動画音声とズーム騒音が混在する音声信号を音声処理部104に入力する。
When the user performs a zoom operation with the
音声処理部104は、音声入力部103により入力される音声信号に対しレベル調整等の音声信号処理を行い、処理済みの音声データをメモリ105に一時記憶する。制御部114からのズーム動作の制御信号を受けると、音声処理部104は、動画撮影時の音声信号処理に加え、ズーム騒音を低減するための騒音低減処理を開始する。すなわち、制御部114は、音声処理部104の騒音低減手段を、ズーム騒音が発生する間、有効化する。音声処理部104は、制御部114から動画撮影中におけるズーム動作の制御信号を受けている間、補正ノイズプロファイルを用いたSS法による騒音低減処理を実行する。
The
符号化処理部106は、メモリ105に一時記憶された動画データと音声データを圧縮符号化する。記録制御部107は、符号化処理部106からの圧縮動画データと圧縮音声データをAV(Audio Visual)ファイルとして記録媒体108に記録する。
The
音声処理部104における騒音低減処理を詳細に説明する。音声処理部104は、音声入力部103により入力される音声データ(動画音声とズーム騒音が混在している音声信号)を高速フーリエ変換(FFT)し、入力音声スペクトルを得る。制御部114からのズーム動作の制御信号に従い、音声処理部104は、メモリ105に記憶されている補正ノイズプロファイルの中で最適なものを選択して読み出す。音声処理部104は、メモリ105より読み出した補正ノイズプロファイルを入力音声スペクトルから減算し、減算結果を逆高速フーリエ変換する。この処理により、入力音声信号に含まれる騒音成分を低減できる。このように、騒音成分が低減された音声信号が、上述のように、符号化処理部106及び記録制御部107により処理されて記録媒体108に記録される。
The noise reduction processing in the
音声処理部104は、図2に示すように、騒音スペクトルからフロアノイズスペクトルを減算して、補正前ノイズプロファイルを生成する。そして、音声処理部104は、補正前ノイズプロファイルを補助データを用いて補正して補正ノイズプロファイルを生成する。フロアノイズスペクトルは、撮像装置100自体が発生する背景ノイズのスペクトルであり、騒音ノイズは、この背景ノイズに低減対象の騒音(ここでは、撮像部101で発生するズーム雑音)が加わった状態での騒音のスペクトルを示す。騒音スペクトルからフロアノイズスペクトルを減算することで、低減対象となる騒音のみのスペクトルが得られ、これが補正前ノイズプロファイルとなる。補助データは、低減対象の騒音の外乱などによる周波数特性の変動を反映するデータである。この補助データにより補正前ノイズプロファイルを補正して得られた補正ノイズプロファイルは、現時点で騒音低減に適したノイズプロファイルとなっている。
As shown in FIG. 2, the
図3を参照して、補正前ノイズプロファイルの作成手順を説明する。撮像装置100を無響防音箱内に設置する。無響防音箱とは、密閉状態では内部の音声が反響せず、かつ、外部音が内部に入らないようになっている密閉可能な箱または室である。撮像装置100は、無線又は有線接続により無響防音箱の外部にあるリモートコントローラと接続されており、無響防音箱の外部から操作可能な状態で設置される。無響防音箱内に設置された撮像装置100の操作は、全て通信部115に接続されたリモートコントローラによって行なわれる。
With reference to FIG. 3, a procedure for creating a noise profile before correction will be described. The
リモートコントローラから撮像装置100の通信部115を介して制御部114に、指示信号(例えば、録画開始の指示信号)を入力する。この指示信号に応じて、制御部114は、音声入力部103に音声取込みを開始させる。音声入力部103は、撮像部101がズーム動作をしていない状態で、ある程度の間、例えば、1秒間の音声を取り込む。音声処理部104は、入力された1秒間の音声信号を高速フーリエ変換する。これにより、撮像装置100の装置自体の発生ノイズ(背景ノイズ)のスペクトルが得られる。このようにして得られた1秒間のスペクトルの各周波数における平均値をフロアノイズスペクトル(図4)とする。音声処理部104は、得られたフロアノイズスペクトルをメモリ105に書き込み、保存する。
An instruction signal (for example, a recording start instruction signal) is input from the remote controller to the
次に、密閉状態の無響防音箱内において、制御部114は、音声入力部103での音声入力中に、撮像部101のモーター・ギア等を回転させズーム動作を行わせる。ズーム動作は、広角端から望遠端までと、望遠端から広角端までの2つの動作が行われる。例えば、広角端から望遠端まで及び望遠端から広角端までのズーム動作にそれぞれちょうど4秒間かかるとする。音声処理部104は、広角端から望遠端までのズーム動作中に音声入力部103により得られる4秒間の音声信号(ただし、ズーム動作開始時のみに現れる起動音は除く)を高速フーリエ変換する。これにより、広角端から望遠端までのズーム動作で発生する騒音のスペクトルが得られる。なお、音声処理部104は、図5に示すように、このスペクトルの各周波数におけるピーク値を騒音スペクトルとし、メモリ105にこの騒音スペクトルを一時記憶する。同様に、音声処理部104は、望遠端から広角端までのズーム動作で発生する騒音の騒音スペクトルをメモリ105に一時記憶する。
Next, in the sealed anechoic soundproof box, the
補助データは、周波数領域において、各周波数における外乱によるズーム騒音の周波数軸方向の変動範囲と変動幅(変動レベル)から作成したものであり、補正前ノイズプロファイルの補正に使用される。外乱は例えば、温度または湿度の変化及び撮像装置の経年劣化等によるものである。騒音スペクトルの中には、これらの外乱によって周波数軸方向に変動するスペクトルと変動しないスペクトルが存在する。周波数軸方向に変動する騒音スペクトルは、SS方式による騒音低減において、騒音成分の消し残りの原因となる。 The auxiliary data is created from the variation range and variation range (variation level) of the zoom noise due to disturbance at each frequency in the frequency domain, and is used for correcting the noise profile before correction. The disturbance is, for example, due to a change in temperature or humidity, an aging deterioration of the imaging device, or the like. The noise spectrum includes a spectrum that varies in the frequency axis direction due to these disturbances and a spectrum that does not vary. The noise spectrum that fluctuates in the frequency axis direction causes unerased noise components in the noise reduction by the SS method.
音声処理部104(または制御部114)は、以下に説明するように補助データを算出し、メモリ105に記憶する。撮像装置100に上記で述べたような外乱を与えて、上述のように音声処理部104に補正前ノイズプロファイルを算出させる。図6は、図4に示すフロアレベルスペクトルと図5に示す騒音スペクトルに対する補正前ノイズプロファイルの周波数特性例を示す。
The audio processing unit 104 (or the control unit 114) calculates auxiliary data and stores it in the
例えば、温度及び湿度を変更できる無響防音箱内において、温度毎及び湿度毎の補正前ノイズプロファイルを得る。制御部114は、得られた複数の補正前ノイズプロファイルを比較し、温度及び湿度の変化によって周波数軸方向に変動している閾値γ以上のスペクトルを検出する。ここでは、一例として、閾値γを補正前ノイズプロファイルの周波数軸方向の総和の平均値とするが、これは実験的に定められたものであり、閾値γはこれに限定されない。
For example, a pre-correction noise profile for each temperature and humidity is obtained in an anechoic soundproof box that can change temperature and humidity. The
制御部114は、閾値γ以上のスペクトルが周波数軸方向に変動している変動範囲と変動レベルから補助データを作成し、作成した補助データを音声処理部104がアクセスできるようにメモリ105に格納する。例えば、補正前ノイズプロファイルにおいて、図7に示すように周波数軸上で3000Hz周辺に立っている閾値γ以上のスペクトルがあるとする。このスペクトルが、温度又は湿度を変化させた場合に2900Hz〜3100Hzの間で変動したとする。このときの変動範囲は、図9に示すように、最小値(min_freq)が2900(Hz)、最大値(max_freq)が3100(Hz)となる。変動レベル(lev_freq=max_freq−min_freq)は、200(Hz)となる。これらの値を以下の式に代入することにより、
温度や湿度以外の外乱についても、制御部114は、実際の外乱条件、又は実際の外乱条件と同等の結果が得られる条件において得られる補正前ノイズプロファイルの比較を行い、スペクトルの変動範囲と変動レベルを得て、補助データを作成する。
For disturbances other than temperature and humidity, the
補正パラメータαは、別の式により求めても良い。騒音低減の条件によっては、補正パラメータαを図11に示すような周波数分布としても良い。本実施例は、変動範囲と変動レベルから補助データを作成し、その補助データを用いて補正前ノイズプロファイルを補正することを特徴とするものであって、図10及び図11に例示した補正パラメータαに限定されない。 The correction parameter α may be obtained by another formula. Depending on the noise reduction conditions, the correction parameter α may be a frequency distribution as shown in FIG. The present embodiment is characterized in that auxiliary data is created from a fluctuation range and a fluctuation level, and the pre-correction noise profile is corrected using the auxiliary data. The correction parameters illustrated in FIGS. 10 and 11 are used. It is not limited to α.
図12に示すように、音声処理部104は、動作状態に対応する補正前ノイズフィルタを現時点の外乱に対応する補助データで補正して補正ノイズプロファイルを生成する。補正ノイズプロファイルの作成に必要となる補正前ノイズプロファイルは、補助データの作成時に用いた補正前ノイズプロファイルと同一であるとは限らない。
As shown in FIG. 12, the
補助データの補正パラメータαがα=0(Hz)の周波数帯では、補正前ノイズプロファイルは補正されない。また、補正前ノイズプロファイルの値が閾値γ以下であった場合にも、補正前ノイズプロファイルは補正されない。いずれも、補正前ノイズプロファイルの値がそのまま補正ノイズプロファイルの値となる。つまり、補正パラメータαがα≠0の周波数帯であり、且つ、補正前ノイズプロファイルが閾値γ以上の値を取る場合に限り、補助データを用いて補正前ノイズプロファイルを補正した値が、補正ノイズプロファイルの値となる。 In the frequency band where the correction parameter α of the auxiliary data is α = 0 (Hz), the pre-correction noise profile is not corrected. Even when the value of the noise profile before correction is equal to or less than the threshold value γ, the noise profile before correction is not corrected. In either case, the value of the pre-correction noise profile becomes the value of the correction noise profile as it is. That is, only when the correction parameter α is a frequency band where α ≠ 0 and the pre-correction noise profile takes a value greater than or equal to the threshold γ, the value obtained by correcting the pre-correction noise profile using auxiliary data is the correction noise. The profile value.
例えば、図8に示すように、min_freq〜max_freqの範囲内で2965Hzをピークとしてスペクトルが立っている補正前ノイズプロファイルを考える。このときのmin_freq〜max_freqの範囲に存在する全てのスペクトルをスペクトル群Aとし、このスペクトル群Aのピーク値をβ(dB)とする。この場合の補正パラメータαは、上述したα算出式により、
α=200-(2965-(3100+2900)/2)2×2/200=187.75
と算出される。
For example, as shown in FIG. 8, consider a pre-correction noise profile in which a spectrum stands with a peak at 2965 Hz within a range of min_freq to max_freq. At this time, all spectra existing in the range of min_freq to max_freq are defined as a spectrum group A, and the peak value of the spectrum group A is defined as β (dB). In this case, the correction parameter α is determined by the above-described α calculation formula.
α = 200- (2965- (3100 + 2900) / 2) 2 × 2/200 = 187.75
Is calculated.
スペクトル群Aをピーク周波数である2965Hzを中心として幅α=187.75(Hz)の範囲(2871.125(Hz)〜3058.875(Hz))で周波数軸方向に移動させる。スペクトル群Aの移動時のピークをとったものが、補正ノイズプロファイルとなる。このようにして得られた補正ノイズプロファイルの周波数特性を図13に示す。移動したスペクトル群Aの一部は、min_freq〜max_freqの範囲外に出る。このとき、min_freq〜max_freqの範囲外では、スペクトル群Aが移動したときのピークを取った値と補正前ノイズプロファイルの値とを比べ、大きい値の方を補正ノイズプロファイル値とする。 The spectrum group A is moved in the frequency axis direction within a range of width α = 187.75 (Hz) (2871.125 (Hz) to 3058.875 (Hz)) centering on 2965 Hz which is a peak frequency. A peak obtained when the spectrum group A moves is a corrected noise profile. FIG. 13 shows the frequency characteristics of the correction noise profile obtained in this way. A part of the moved spectrum group A goes out of the range of min_freq to max_freq. At this time, outside the range of min_freq to max_freq, the value obtained by taking the peak when the spectrum group A moves is compared with the value of the noise profile before correction, and the larger value is set as the correction noise profile value.
このようにして求められた補正ノイズプロファイルを用いてSS方式による騒音低減を行うことで、騒音低減において、例えば温度及び湿度の変化並びに経年変化等による騒音成分の消し残りを大幅に削減できる。 By performing noise reduction by the SS method using the correction noise profile obtained in this way, in the noise reduction, for example, it is possible to greatly reduce the remaining noise components due to changes in temperature and humidity, aging, and the like.
図14は、撮像装置100のノイズプロファイルを補正するノイズプロファイル補正装置の概略構成ブロック図を示す。図14に示すノイズプロファイル補正装置1400は、演算装置1410、演算装置1410に接続する音響機器1417、映像表示機器1418及び操作機器1419から構成される。
FIG. 14 is a block diagram illustrating a schematic configuration of a noise profile correction apparatus that corrects the noise profile of the
演算装置1410は、例えば、パーソナルコンピュータまたはノートパソコン等からなる。中央演算制御部1411は、例えば、パーソナルコンピュータ内部のCPUであって、メモリ1412上に展開された所定のプログラムを実行し、操作機器1419からの指示信号に従い演算装置1410の各ブロックを制御する。メモリ1412は、演算装置1410で用いるデータ及びプログラム等を一時的に記憶する。
The
通信部1413は、無線又は有線で外部装置と通信し、音声データ及び画像データなどのデータを外部装置との間で送受信する。通信部1413はまた、外部装置との間で、演算装置1410への指示信号及びその他の情報を送受信する。通信部1413は例えば、赤外線通信モジュール、Bluetooth(登録商標)通信モジュール、無線LAN通信モジュール、有線LAN通信モジュール、USB通信モジュール及びThunderbolt(登録商標)通信モジュール等の1以上からなる。通信部115は、例えば、デジタルカメラ等の外部デジタル機器や、マウス、キーボード等のデバイスと接続するためのインターフェースである。
A
記録媒体1414は、種々のデータを記録できる汎用的な記録媒体、例えば、磁気ディスク、光学式ディスクまたは半導体メモリなどからなり、異種または同種の複数の媒体の組み合わせであっても良い。
The
音声出力部1415は例えば音声出力端子からなり、イヤホンまたはスピーカなどの音声出力装置に音声信号を出力する。音声出力部1415は、演算装置1410に内蔵されるスピーカであっても良い。映像出力部1416は、例えば映像出力端子からなり、外部ディスプレイ等に画像信号を出力する。音声出力部1415と映像出力部1416は、統合された1つの端子、例えばHDMI(High−Definition Multimedia Interface)(登録商標)端子として構成されていてもよい。
The
音響機器1417は、演算装置1410と有線又は無線で接続された音響デバイスであって、例えば、イヤホンまたはスピーカ等である。また、音響機器1417は、USBオーディオデバイスと、それに付随するヘッドフォンアンプ及びヘッドフォン等の複数のオーディオ機器等でもよい。
The
映像表示機器1418は、演算装置1410と有線又は無線で接続された映像表示機器であって、例えば、液晶ディスプレイ、有機ELディスプレイまたは電子ペーパ等の表示デバイスであれば何でも良い。
The
操作機器1419は、演算装置1410と有線又は無線で接続された操作機器であって、例えば、マウス、キーボードまたはタッチパネル等の操作デバイスであれば何でもよい。また、操作機器1419は、複数の機器であってもよい。
The
ノイズプロファイル補正装置1400による補正ノイズプロファイルの作成動作を説明する。図15に示すようにノイズプロファイル補正装置1400の通信部1413と撮像装置100の通信部115を接続することで、ノイズプロファイル補正装置1400を撮像装置100に接続する。ノイズプロファイル補正装置1400は、先に説明した補助データをメモリ1412に記憶している。
The operation of creating a corrected noise profile by the noise
撮像装置100を先に説明したように無響防音箱内に設置し、無響防音箱を密閉した状態で、補正前ノイズプロファイルを作成しメモリ105に格納する。演算装置1410は、メモリ105に記憶された補正前ノイズプロファイルを通信部115及び通信部1413を介してメモリ1412に転送する。
As described above, the
中央演算制御部1411は、メモリ1412から補助データと補正前ノイズプロファイルを読み出し、先に説明したのと同様の図16に示す演算手順で補正ノイズプロファイルを作成する。中央演算制御部1411は、得られた補正ノイズプロファイルをいったんメモリ202に記憶し、通信部1413及び通信部115を介して撮像装置100のメモリ105に転送する。
The central
このようにして、ノイズプロファイル補正装置1400は、撮像装置100のメモリ105に記憶されている補正前ノイズプロファイルを補助データで補正し、撮像装置100のメモリ105に書き戻すことができる。撮像装置100の音声処理部104は、ノイズプロファイル補正装置1400から送信された、補正ノイズプロファイルを用いてSS方式による騒音低減を行う。これにより、例えば温度、湿度の変化や経年変化等による騒音成分の消し残りを、大幅に削減した騒音低減が可能となる。
In this way, the noise
(他の実施例)
本発明に係る音声処理装置は、実施例1で説明した撮像装置100に限定されるものではない。例えば、本発明に係る音声処理装置は、複数の装置から構成されるシステムにより実現することも可能である。
(Other examples)
The sound processing apparatus according to the present invention is not limited to the
また、実施例1で説明した様々な処理及び機能は、コンピュータプログラムにより実現することも可能である。この場合、本発明に係るコンピュータプログラムは、コンピュータ(CPU等を含む)で実行可能であり、本実施例で説明した様々な機能を実現することになる。 The various processes and functions described in the first embodiment can also be realized by a computer program. In this case, the computer program according to the present invention can be executed by a computer (including a CPU and the like), and implements various functions described in this embodiment.
本発明に係るコンピュータプログラムは、コンピュータ上で稼動しているOS(Operating System)などを利用して、本実施例で説明した様々な処理及び機能を実現してもよいことは言うまでもない。 It goes without saying that the computer program according to the present invention may realize various processes and functions described in this embodiment by using an OS (Operating System) running on the computer.
本発明に係るコンピュータプログラムは、コンピュータ読取可能な記録媒体から読み出され、コンピュータで実行されることになる。コンピュータ読取可能な記録媒体には、ハードディスク装置、光ディスク、CD−ROM、CD−R、メモリカード、ROM等を用いることができる。また、本発明に係るコンピュータプログラムは、通信インターフェースを介して外部装置からコンピュータに提供され、当該コンピュータで実行されるようにしてもよい。 The computer program according to the present invention is read from a computer-readable recording medium and executed by the computer. As the computer-readable recording medium, a hard disk device, an optical disk, a CD-ROM, a CD-R, a memory card, a ROM, or the like can be used. The computer program according to the present invention may be provided from an external device to a computer via a communication interface and executed by the computer.
Claims (4)
駆動手段と、
前記駆動手段に関する騒音の音声信号を周波数領域に変換して得られる騒音スペクトルから作成されるノイズプロファイルを記憶するメモリと、
前記駆動手段に関する騒音の外乱による変動を示す補助データを用いて前記ノイズプロファイルを補正する補正手段と、
前記補正手段によって補正されたノイズプロファイルを用いて前記音声入力手段により入力される音声信号から前記駆動手段に関する騒音を低減する音声処理手段と
を有することを特徴とする音声処理装置。 Voice input means;
Driving means;
A memory for storing a noise profile created from a noise spectrum obtained by converting an audio signal of noise related to the driving means into a frequency domain;
Correction means for correcting the noise profile using auxiliary data indicating fluctuation due to noise disturbance related to the driving means;
An audio processing apparatus comprising: an audio processing unit that reduces noise related to the driving unit from an audio signal input by the audio input unit using the noise profile corrected by the correction unit.
前記駆動手段がズームを駆動する手段である
ことを特徴とする請求項1に記載の音声処理装置。 The sound processing device is an imaging device;
The audio processing apparatus according to claim 1, wherein the driving unit is a unit that drives a zoom.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014246195A JP2016111478A (en) | 2014-12-04 | 2014-12-04 | Voice processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014246195A JP2016111478A (en) | 2014-12-04 | 2014-12-04 | Voice processing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016111478A true JP2016111478A (en) | 2016-06-20 |
Family
ID=56124916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014246195A Pending JP2016111478A (en) | 2014-12-04 | 2014-12-04 | Voice processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016111478A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11562763B2 (en) | 2020-02-10 | 2023-01-24 | Samsung Electronics Co., Ltd. | Method for improving sound quality and electronic device using same |
-
2014
- 2014-12-04 JP JP2014246195A patent/JP2016111478A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11562763B2 (en) | 2020-02-10 | 2023-01-24 | Samsung Electronics Co., Ltd. | Method for improving sound quality and electronic device using same |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4639907B2 (en) | Imaging apparatus, audio recording method, and program | |
JP5034605B2 (en) | Imaging apparatus, noise removal method, and program | |
US9224381B2 (en) | Audio signal processing apparatus and audio signal processing system | |
US10535363B2 (en) | Audio processing apparatus and control method thereof | |
JP2014011486A (en) | Electronic apparatus, method and program | |
JP2008058343A (en) | Mechanism driving sound reduction apparatus and mechanism driving sound reduction method | |
US20150271439A1 (en) | Signal processing device, imaging device, and program | |
US9462174B2 (en) | Electronic device and control method | |
JP2016111478A (en) | Voice processing device | |
JP2014086847A (en) | Acoustic processing device, electronic apparatus, and acoustic processing method | |
KR20110085682A (en) | Audio system and method of operating the same | |
JP2016119648A (en) | Parameter recording control device and method for controlling the same | |
JP2018074220A (en) | Voice processing device | |
WO2021192991A1 (en) | Information processing device, information processing method, and program | |
US20180158447A1 (en) | Acoustic environment understanding in machine-human speech communication | |
JP6483391B2 (en) | Electronic device, method and program | |
US11682377B2 (en) | Sound processing apparatus, control method, and recording medium | |
JP2016009039A (en) | Image-capturing device | |
US11943534B2 (en) | Imaging device | |
JP2019179944A (en) | Voice changeover device | |
US11601751B2 (en) | Display control device and display control method | |
JP2019016851A (en) | Voice processing apparatus, voice processing method and program | |
JP2019091988A (en) | Voice processing unit and voice processing method | |
JP2016009952A (en) | Audio signal processing apparatus | |
JP2023026918A (en) | Voice processing unit, control method of voice processing unit, and program |