JP2011002704A - Sound signal transmitting device, sound signal receiving device, sound signal transmitting method and program therefor - Google Patents
Sound signal transmitting device, sound signal receiving device, sound signal transmitting method and program therefor Download PDFInfo
- Publication number
- JP2011002704A JP2011002704A JP2009146503A JP2009146503A JP2011002704A JP 2011002704 A JP2011002704 A JP 2011002704A JP 2009146503 A JP2009146503 A JP 2009146503A JP 2009146503 A JP2009146503 A JP 2009146503A JP 2011002704 A JP2011002704 A JP 2011002704A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- acoustic signal
- signal
- sound
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、通信を利用して高齢者等を遠隔地で見守る際に利用する音響信号送信装置、音響信号受信装置、音響信号送信方法及びそのプログラムに関する。 The present invention relates to an acoustic signal transmission device, an acoustic signal reception device, an acoustic signal transmission method, and a program thereof that are used when an elderly person or the like is monitored remotely using communication.
高齢者等を見守るような常時接続型の通信システムにおいて、見守られ側宅等でマイクロホンによって収音された音響信号を見守る側宅等に伝送する場合には、プライバシーへの配慮が欠かせない。プライバシーに配慮しつつ、見守られる側の状態を把握するためには、音響信号を加工して、不明瞭にしてから(音声の了解性をなくして)から伝送する必要がある。特許文献1が従来技術として知られている。特許文献1には、ローパスフィルタを通して、発話音声の了解性を低下させる方法が記載されている。
In an always-connected communication system that watches over the elderly and the like, privacy considerations are indispensable when transmitting to a side home or the like that watches over an acoustic signal collected by a microphone at the side home or the like. In order to grasp the state of the side to be watched while taking privacy into consideration, it is necessary to process the acoustic signal and make it unclear (without the comprehension of the voice) before transmitting it.
しかしながら、音声の了解性をなくすためには、カットオフ周波数を音声のフォルマント構造が伝達されなくなる程度まで低くして、高い周波数帯域の音が伝わらないようにする必要がある。しかし、そうすると、音声以外の高い周波数にある音源の情報(ガラスが割れた音など)が伝わらないという課題が残る。 However, in order to eliminate the intelligibility of the voice, it is necessary to lower the cut-off frequency to such an extent that the voice formant structure is not transmitted so that the sound in the high frequency band is not transmitted. However, if it does so, the subject that the information (sound etc. which the glass broke) of the sound source in high frequencies other than a voice will not be transmitted remains.
上記の課題を解決するために、本発明に係る音響信号送信技術は、マイクロホンから収音された音響信号を所定時間ごとのフレームに分割し、各フレームごとの音響信号を複数の周波数帯域音響信号に分割し、各フレームごとに分割された音響信号を不明瞭化処理する。不明瞭化処理を行う際には、入力された信号の周波数的に平滑化したパワーを求め、入力された信号のパワーの変動を圧縮し、入力された信号をフレーム長より長い時間に時間的に平滑化する。 In order to solve the above problems, an acoustic signal transmission technique according to the present invention divides an acoustic signal collected from a microphone into frames for each predetermined time, and the acoustic signal for each frame is divided into a plurality of frequency band acoustic signals. The sound signal divided for each frame is obscured. When performing the obscuring process, the frequency-smoothed power of the input signal is obtained, the fluctuations in the power of the input signal are compressed, and the input signal is timed longer than the frame length. To smooth.
本発明は、不明瞭化部によって、音声の了解性は消して、非音声信号のパワー及び音色の時間変動を送信できるという効果を奏する。 The present invention has an effect that the obscuring unit can remove the intelligibility of the voice and transmit the power of the non-voice signal and the time variation of the timbre.
以下、本発明の実施の形態について、詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail.
[音響信号送信装置100]
図1及び図2を用いて実施例1に係る音響信号送信装置100を説明する。図1は音響信号送信装置100の構成例を、図2は音響装置送信装置100の処理フロー例を示す。
音響信号送信装置100は、記憶部103、制御部105、ADC107、フレーム分割部109、分割部111、不明瞭化部120及び送信部130を有する。さらに、不明瞭化部120は、周波数方向平滑化部121、ダイナミックレンジ圧縮部123及び時間方向平滑化部125を備える。各部について説明する。
[Acoustic signal transmitting apparatus 100]
The acoustic signal transmission device 100 according to the first embodiment will be described with reference to FIGS. 1 and 2. FIG. 1 shows a configuration example of the acoustic signal transmission device 100, and FIG. 2 shows a processing flow example of the acoustic device transmission device 100.
The acoustic signal transmission device 100 includes a
<記憶部103及び制御部105>
記憶部103は、入出力される各データや演算過程の各データを、逐一、格納・読み出しする。それにより各演算処理が進められる。但し、必ずしも記憶部103に記憶しなければならないわけではなく、各部間で直接データを受け渡してもよい。
制御部105は、各処理を制御する。
<
The
The
<ADC107>
ADC(アナログ-デジタル変換回路:Analog to Digital Converter)107は、マイクロホン3で収音されたアナログ音響信号x(t)をデジタル音響信号x(u)に変換する(s107)。但し、tは連続時間を、uは離散時間を表す。また、ADCが内蔵されるマイクロホンを用いる場合には、音響信号送信装置100はADCを有さなくともよい。なお、音響信号とは、音声情報及び非音声情報を含む信号である。
<ADC 107>
The ADC (Analog to Digital Converter) 107 converts the analog sound signal x (t) collected by the
<フレーム分割部109>
フレーム分割部109は、マイクロホン3から収音されたデジタル音響信号x(u)を所定時間ごとのフレームnに分割し(s109)、音響信号X(n)を出力する。但し、nはフレーム番号を表す。所定時間は例えば100msec以下とする。所定時間をある程度短くすることにより、後述する分割部111で行われる離散フーリエ変換の周波数分解能を荒くし、音響信号の不明瞭化するための処理量を少なくする。
<
The
<分割部111>
分割部111は、各フレームnごとの音響信号X(n)を複数の周波数帯域音響信号X(ω,n)に分割する(s111)。但し、ωは周波数を表す。例えば、離散フーリエ変換等により実現する。
<
The dividing
<不明瞭化部120>
不明瞭化部120は、各フレームnごとに分割された音響信号を不明瞭化処理する(s120)。不明瞭化部120は、周波数方向平滑化部121、ダイナミックレンジ圧縮部123及び時間方向平滑化部125を備え、各部は縦続して接続されている。本実施例では、周波数方向平滑化部121、ダイナミックレンジ圧縮部123、時間方向平滑化部125の順に接続されているものとする。
<Obscuring
The
『周波数方向平滑化部121』
周波数方向平滑化部121は、入力された信号Xの周波数的に平滑化したパワー|F(m,n)|2を求める(s121)。周波数方向平滑化部121は、例えばフィルタバンクである。なお、mはフィルタバンク番号でフィルタの分割数をMとしたとき、m=1〜Mとする。|F(m,n)|2は、例えば、周波数帯域音響信号X(ω,n)のパワー|X(ω,n)|2を求め、それらに各フィルタバンクの周波数ωにおける重みを乗算して加算することで求める。図3及び図4はフィルタバンク設計の例である。縦軸の値が重みになる。横軸の周波数は対数変換する。このように高い周波数ほどフィルタ帯域を広くすると、聴覚的感覚に近くなるので良い。これにより、まず周波数方向に平滑化をする。
“Frequency
The frequency
『ダイナミックレンジ圧縮部123』
ダイナミックレンジ圧縮部123は、入力された信号のパワーの変動を圧縮する(s123)。図5は、圧縮特性の例を示す。
|F(m,n)|2のデシベル変換値をLv(m,n)とすると、圧縮後の値Lv’(m,n)(真数で|F’(m,n)|2とする)は以下のようになる。
Lv’(m,n)=−∞ (Lv(m,n)<Np1)
Lv’(m,n)=r×Lv(m,n)+Gmin (Np1≦Lv(m,n)≦Np2)
Lv’(m,n)=r×Np2+Gmin(=Gmax) (Lv(m,n)>Np2)
但し、rは圧縮率(0<r≦1)を表す。例えば半分に圧縮する場合は0.5にする。Np1はそれ以下のレベルで出力を0にするポイントを表す。例えば暗騒音(背景雑音)のレベルを少し超える値に設定することで、なにか物音がしたなど、音が変動したときだけに、その情報を送信することが出来る。暗騒音レベルは、例えばLv(m,n)を長時間平均することで自動的に求めることが出来るので、Np1は、その値より例えば3dB大きくしておく等すれば良い。Np2は主に過大な音がそのまま再生されないようにするため出力を所定値(Gmax)にするポイントを表す。Gminは圧縮値の下限値(但し、Np1より小さい場合は、圧縮値は−∞)、Gmaxは圧縮値の上限値である。r、Gmin、Gmax、Np1及びNp2の値をm、即ち周波数帯域ごとに変えても良い。例えば、より音韻の特徴を表す帯域(500Hzから3000Hz)を強く圧縮すれば、音声はより不明瞭になる。
"
The
If the decibel transform value of | F (m, n) | 2 is Lv (m, n), the compressed value Lv ′ (m, n) (true value | F ′ (m, n) | 2 ) Is as follows.
Lv ′ (m, n) = − ∞ (Lv (m, n) <Np1)
Lv ′ (m, n) = r × Lv (m, n) + Gmin (Np1 ≦ Lv (m, n) ≦ Np2)
Lv ′ (m, n) = r × Np2 + Gmin (= Gmax) (Lv (m, n)> Np2)
However, r represents a compression rate (0 <r ≦ 1). For example, when compressing to half, it is set to 0.5. Np1 represents a point at which the output is reduced to 0 at a lower level. For example, by setting a value slightly higher than the level of background noise (background noise), it is possible to transmit the information only when the sound fluctuates, such as when something sounds. The background noise level can be automatically obtained by, for example, averaging Lv (m, n) for a long time, and therefore Np1 may be set to be, for example, 3 dB larger than the value. Np2 mainly represents a point at which the output is set to a predetermined value (Gmax) so that an excessive sound is not reproduced as it is. Gmin is the lower limit value of the compression value (however, if it is smaller than Np1, the compression value is -∞), and Gmax is the upper limit value of the compression value. The values of r, Gmin, Gmax, Np1 and Np2 may be changed for each m, that is, for each frequency band. For example, if the band (500 Hz to 3000 Hz) representing the characteristics of phonemes is strongly compressed, the voice becomes more unclear.
『時間方向平滑化部125』
時間方向平滑化部125は、入力された信号を前記フレーム長より長い時間に時間的に平滑化する(s125)。例えば、|F’(m,n)|2に時間方向に平滑化処理をかけて|F”(m,n)|2を得る。時間方向に平滑化するには、例えば、忘却係数を乗じたり、過去の時系列を記憶しておき移動平均したりする方法がある。
“Time
The time
周波数方向平滑化部121、ダイナミックレンジ圧縮部123及び時間方向平滑化部125の各処理はいずれも収音された音響信号を不明瞭にするための処理である。例えば、周波数方向の平滑化だけで不明瞭にしようとすると、フィルタバンク数を少なくする必要があり、原信号の持つ周波数特性を伝達しにくくなる。同様に、時間方向の平滑化だけで、不明瞭にしようとすると、より大きな時定数でゆっくりとした変動に変換する必要があり、原信号の持つ時間変動特性を伝達しにくくなる。また、パワー変動の圧縮を大きくしすぎると、大きな音と小さな音の区別がしにくくなる。すなわち、三つの平滑化を併用することで、各々の平滑化の強さを大きくしすぎずに不明瞭化することができる。また、これらの順番は入れ替えても効果は同じである。たとえば、周波数方向平滑化をする前に、ダイナミックレンジ圧縮、時間方向平滑化をすることも可能である。
Each process of the frequency
<送信部130>
送信部130は、不明瞭化部120で不明瞭化した信号|F”(m,n)|2を音響信号受信装置に送信する(s130)。送信部130は、例えばLANアダプタ等である。
[音響信号受信装置200]
図6は音響信号受信装置200の構成例を、図7は音響信号受信装置200の処理フロー例を示す。音響信号受信装置200は、例えば、受信部201、記憶部203、制御部205、利得算出部207、キャリア信号発生部208、フレーム分割部209、分割部211、乗算部213、時間領域変換部215、DAC217及びアンプ219を有する。
<
The transmitting
[Acoustic signal receiving apparatus 200]
6 shows a configuration example of the acoustic signal receiving apparatus 200, and FIG. 7 shows a processing flow example of the acoustic signal receiving apparatus 200. The acoustic signal receiving apparatus 200 includes, for example, a
<受信部201>
受信部201は、音響信号送信装置100の不明瞭化部120で不明瞭化した信号|F”(m,n)|2を受信する(s201)。受信部201は、例えばLANアダプタ等である。
<記憶部203及び制御部205>
記憶部203及び制御部205は、それぞれ音響信号送信装置100の記憶部103及び制御部105と同様の構成である。
<Receiving
The receiving
<
The
<利得算出部207>
利得算出部207は、不明瞭化された音響信号|F”(m,n)|2を用いて各周波数ωごとの利得g(ω,n)を算出する(s207)。
例えば、利得算出部207では、図4のような一様なフィルタバンクの場合は、m番目のバンク内に含まれる周波数ωのパワーを全て等しく|F”(m,n)|2とすれば良い。また例えば、図3のような重なりがあるフィルタバンクの場合、ある周波数ωがm1とm2のフィルタバンクに含まれる場合、m1とm2の重みを各々W(m1)、W(m2)とすると、
|F"(ω,n)|2=W(m1)×|F"(m1,n)|2+W(m2)×|F"(m2,n)|2
とすれば良い。そして、適当な小さな値、例えば、全ての周波数成分のパワー値の最大値の逆数を乗じて正規化利得g(ω,n)を求める。
<Gain
The
For example, the
| F "(ω, n) | 2 = W (m1) × | F" (m1, n) | 2 + W (m2) × | F "(m2, n) | 2
What should I do? Then, a normalization gain g (ω, n) is obtained by multiplying an appropriate small value, for example, the reciprocal of the maximum value of the power values of all frequency components.
<キャリア信号発生部208>
キャリア信号発生部は、定常的なキャリア信号z(u)を生成する(s208)。なお、キャリア信号z(u)は、不明瞭化した信号F”(ω,n)よりも広い周波数成分を持ち定常的な音であればどのような音でも良い。例えば、常に見守り側に再生されていても耳障りでないような水のせせらぎのような音が良い。なお、キャリア信号z(u)は記憶部203等に記憶しておいたものを利用してもよく、その場合、音響信号受信装置200にキャリア信号発生部208を設けなくともよい。
<
The carrier signal generator generates a stationary carrier signal z (u) (s208). The carrier signal z (u) may be any sound as long as it has a wider frequency component than the obfuscated signal F ″ (ω, n) and is a stationary sound. Even if it is applied, a sound like water murmur that is not harsh is good.The carrier signal z (u) may be stored in the
<フレーム分割部209及び分割部211>
フレーム分割部209は、所定の定常的なキャリア信号z(u)を所定時間ごとのフレームに分割し(s209)、Z(n)を出力する。分割部211は、各フレームnごとのキャリア信号を複数の周波数帯域の信号Z(ω,n)に分割する(s211)。フレーム分割部209及び分割部211は、それぞれ音響信号送信装置100のフレーム分割部109及び分割部111と同様の構成であり、フレーム分割部109と同じ時間間隔でフレームを分割する。
<
The
<乗算部213>
乗算部213は、利得G(ω,n)と周波数帯域の信号Z(ω,n)を乗じ(s213)、Y(ω,n)を求める。
<時間領域変換部215>
時間領域変換部215は、乗算部213で求めた値Y(ω,n)を時間領域の信号y(n)に変換する(s215)。さらに、フレームを合成し、連続するデジタル信号y(u)に変換する。例えば、逆離散フーリエ変換等により時間領域の信号に変換する。
<
The
<Time
The time
<DAC217及びアンプ219>
DAC(デジタル-アナログ変換回路:Digital to Analog Converter)217は、時間領域変換部215から入力されるデジタル信号y(u)をアナログ信号y(t)に変換する(s217)。アンプ219は、アナログ信号y(t)を増幅し、スピーカ221に出力する(s219)。なお、DACやアンプが内蔵されるスピーカに信号を出力する場合には、音響信号受信装置200はDAC217やアンプ219を有さなくともよい。
<
The DAC (Digital-to-Analog Converter) 217 converts the digital signal y (u) input from the time
<効果>
音響信号送信装置100及び音響信号受信装置200をこのような構成とすることによって、音声の了解性は消して、非音声信号のパワー及び音色の時間変動を送信できるという効果を奏する。
つまり、このような構成とすることによって、音響信号送信装置100側、すなわち見守られ側の音響信号のピッチ情報は消される。もし平滑化処理を施さないで送信すると、周波数特性の外形(音声ではフォルマント構造に対応する)の時間変化が残っているため、了解性が残ってしまう(なんと話しているかが分かる)が、不明瞭化処理を施すことによって、了解性を排除できる。これにより、音声の了解性をなくしつつ、音のパワーと音色の変化がキャリア信号に施されることで、音響信号受信装置200側、つまり見守り側は見守られる側の状況の把握がしやすくなる。なお、適宜、不明瞭化処理の強さを調整することによって、よりプライバシー配慮か、より多くの情報を伝えるかを選ぶことも出来る。
<Effect>
By configuring the acoustic signal transmitting apparatus 100 and the acoustic signal receiving apparatus 200 as described above, it is possible to eliminate the intelligibility of the voice and transmit the power of the non-voice signal and the time variation of the timbre.
That is, with such a configuration, the pitch information of the acoustic signal on the acoustic signal transmitting device 100 side, that is, the watched side is erased. If transmission is performed without smoothing processing, the time change of the external shape of the frequency characteristic (corresponding to the formant structure in speech) remains, so that intelligibility remains (you can tell what you are talking about) By performing the clarification process, intelligibility can be eliminated. As a result, sound power and timbre changes are applied to the carrier signal while eliminating the intelligibility of the sound, so that it is easy to grasp the situation on the side where the sound signal receiving apparatus 200, that is, the watching side is watched over. . It should be noted that by appropriately adjusting the strength of the obscuring process, it is possible to select whether to consider more privacy or to convey more information.
<その他>
なお、|F”(m,n)|2を用いて利得g(ω,n)を求める処理は、送信前の音響信号送信装置100において行ってもよい。但し、平滑化処理、即ち、不明瞭化処理は送信装置100側(見守り側)で行わないと、プライバシー保護にならない。
また、音響信号受信装置200の利得算出部207、キャリア信号発生部208、フレーム分割部209、分割部211、乗算部213、時間領域変換部215で行われる処理を音響信号送信装置100内で行い、デジタル信号y(u)を音響信号受信装置200に送信しても良い。しかし、送信すべきデータ量は|F”(m,n)|2を送信する場合に比べ多くなる。
<Others>
Note that the process of obtaining the gain g (ω, n) using | F ″ (m, n) | 2 may be performed in the acoustic signal transmitting apparatus 100 before transmission, provided that the smoothing process, that is, non-transmission is performed. If the clarification processing is not performed on the transmission apparatus 100 side (watching side), privacy protection cannot be achieved.
In addition, processing performed by the
[変形例1]
[音響信号送信装置300]
図8を用いて実施例1の変形例1に係る音響信号送信装置300を説明する。図8は音響信号送信装置300の構成例を示す。
音響信号送信装置300は、記憶部103、制御部105、ADC107、フレーム分割部109、不明瞭化部320、利得算出部327及び送信部130を有する。実施例1と異なる部分について説明する。本変形例では、離散フーリエ変換を用いる分割部111の代わりにM個の帯域制限フィルタ(フィルタバンク321)を用いる。
[Modification 1]
[Acoustic signal transmitting apparatus 300]
An acoustic signal transmission device 300 according to the first modification of the first embodiment will be described with reference to FIG. FIG. 8 shows a configuration example of the acoustic signal transmission device 300.
The acoustic signal transmission device 300 includes a
<不明瞭化部320>
不明瞭化部320は、フィルタバンク321、ダイナミックレンジ圧縮部123及び時間方向平滑化部125を備える。
『フィルタバンク321』
フレームnごとの音響信号X(n)がファイルバンク321に入力される。フィルタバンク321は、実施例1の分割部111と周波数方向平滑化部121を兼用し、周波数帯域音響信号ごとに、周波数方向に平滑化された信号|F(m,n)|2を得る。例えば、音響信号X(n)をフィルタバンク321に通し、周波数帯域ごとの信号を得、振幅を自乗し足し合わせることで周波数方向に平滑化された信号|F(m,n)|2を得ることができる。この信号|F(m,n)|2をダイナミックレンジ圧縮部123または時間方向平滑化部125に出力する。本変形例では、ダイナミックレンジ圧縮部123に出力するものとする。ダイナミックレンジ圧縮部123及び時間方向平滑化部325の処理内容は実施例1と同様である。
<利得算出部327>
利得算出部327は、実施例1の音響信号受信装置200の利得算出部207と同様の構成である。
<
The obscuring
“
An acoustic signal X (n) for each frame n is input to the
<Gain
The
[音響信号受信装置400]
図9は音響信号受信装置400の構成例を示す。音響信号受信装置400は、例えば、受信部201、記憶部203、制御部205、キャリア信号発生部208、フレーム分割部209、フィルタバンク421、乗算部413、フレーム合成部415、DAC217及びアンプ219を有する。
<フィルタバンク421>
フレームnごとのキャリア信号Z(n)がファイルバンク421に入力される。フィルタバンク421は、例えば、キャリア信号Z(n)を通し、周波数帯域ごとの信号Z(ω,n)を得る。これを乗算部413に出力する。
[Acoustic signal receiving apparatus 400]
FIG. 9 shows a configuration example of the acoustic signal receiving device 400. The acoustic signal receiving device 400 includes, for example, a
<
A carrier signal Z (n) for each frame n is input to the
<乗算部413>
乗算部413は、受信部201が受信した利得g(ω,n)と周波数ごとのキャリア信号Z(ω,n)を入力され、これらの値を掛け合わせ、Y(ω,n)を得、フレーム合成部415へ出力する。
<フレーム合成部415>
フレーム合成部415は、フレーム及び周波数ごとの信号を合成し、デジタル信号y(u)を得、DAC217へ出力する。DAC217、アンプ219の処理は実施例1と同様である。
音響信号送信装置300及び音響信号受信装置400をこのような構成とすることによって、実施例1と同様の効果を得ることができる。
<Multiplier 413>
The multiplier 413 receives the gain g (ω, n) received by the
<
The
By configuring the acoustic signal transmitting device 300 and the acoustic signal receiving device 400 as described above, the same effects as in the first embodiment can be obtained.
常に不明瞭化された音響情報が伝わるだけではなく、見守られる側が所望したときには、音声による通話も出来る方が、緊急時に有効なだけでなく、利便性も高まる。特許文献1には、例えば見守られる側の高齢者等が通話スイッチを入れると、不明瞭化の処理が解除されるといった方法が記載されている。しかしながら、その操作がわずらわしかったり、通話後にスイッチを切り替え忘れて、不明瞭にならない音声が相手に伝わり、プライバシーが侵害されたりする心配もある。また、そのような仕様が常時マイクロホンで収音されることに対して利用者に心理的な不安を与えることも考えられる。そこで、音声の不明瞭化処理を自動的に解除し、明瞭な音声を伝達できるようにすることを可能にする装置を提供する。特定の場所で発声した音声は明瞭に送信され、それ以外の音は不明瞭化されるようにする実施例を説明する。こうすることで、利用者(見守られる側)は、特別な操作は不要で、その特定の場所さえ覚えておけば良く、意図しない音声を相手に伝えるリスクも減る。このためには、特定の場所における音源の有無の判定が必要となる。その方法として、特開2009−25490(以下、「参考文献1」という)を応用した実施例を説明する。
Not only is the obscured acoustic information always transmitted, but when the watched side desires, it is not only effective in an emergency, but also more convenient if a voice call is possible.
[音響信号送信装置500]
図10及び図11を用いて実施例2に係る音響信号送信装置500を説明する。図10は音響信号送信装置500の構成例を、図11は音響信号送信装置500の処理フロー例を示す。実施例1と異なる部分についてのみ説明する。二つのマイクロホンアレー3R,3Lは図12のように配置する。
音響信号送信装置500は、特定の位置から音声が発生しているか否かを判定する判定部550を有する。そして、特定の位置から音声が発生していない場合には、不明瞭化部120において、不明瞭化した音響信号を生成する。
[Acoustic signal transmission device 500]
An acoustic
The acoustic
音響信号送信装置500は、収音部4とフレーム分割部109と分割部111と処理対象信号生成部540とパワースペクトル推定部507と利得係数算出部530と不明瞭化部120と乗算部509と判定部550と送信部540を有する。なお、収音部4、処理対象信号生成部540、パワースペクトル推定部507、利得係数算出部530及び乗算部509の処理内容は参考文献1に詳しく記載されている。本実施例では概要を説明する。
The acoustic
<収音部4>
6つの収音部4−1,4−2,4−3,4−4,4−5,4−6は、複数のマイクロホンを搭載して構成されるマイクロホンアレー3R,3Lの出力信号を利用して、それぞれ異なる領域の音を収音する(s4)。それぞれデジタル音響信号xSL(u)、xSR(u)、xNL(u)、xNR(u)、xSC(u)、xNC(u)を出力する。なお、収音部は6以上であってもよい。
<Sound collecting
The six sound collection units 4-1, 4-2, 4-3, 4-4, 4-5 and 4-6 use the output signals of the
<フレーム分割部109及び分割部111>
フレーム分割部109及び分割部111は、実施例1と同様の構成である。フレーム分割部109は、デジタル音響信号xSL(u)、xSR(u)、xNL(u)、xNR(u)、xSC(u)、xNC(u)を所定時間ごとのフレームnに分割し(s109)、音響信号XSL(n)、XSR(n)、XNL(n)、XNR(n)、XSC(n)、XNC(n)を出力する。分割部111は、各フレームnごとの音響信号を複数の周波数帯域音響信号XSL(ω,n)、XSR(ω,n)、XNL(ω,n)、XNR(ω,n)、XSC(ω,n)、XNC(ω,n)に分割し(s111)、出力する。なお、参考文献1記載の周波数領域変換部5は、フレーム分割部109及び分割部111の機能を備える。
<
The
<処理対象信号生成部540>
処理対象信号生成部540は、あらかじめ定めた1つ以上のマイクロホンまたは収音部からの信号から、処理対象信号Ys(ω,n)を生成する(s540)。
<パワースペクトル推定部507>
パワースペクトル推定部507は、各収音部4−1,4−2,4−3,4−4,4−5,4−6で得られた各収音響信号の信号量から、所望音源の信号量と、その他の音源の信号量とを周波数ごとに推定し(s507)、推定信号パワーベクトルXopt(ω,n)を出力する。
<Processing Target
The processing target
<
The power
<利得係数算出部530>
図13は利得係数算出部530の構成例を示す。利得係数算出部530は、所望音源の信号量|S(ω,n)|2、所望音源の信号量を含む全ての音源の信号量|S(ω,n)|2+|NLL(ω,n)|2+|NL(ω,n)|2+|NC(ω,n)|2+|NR(ω,n)|2+|NRR(ω,n)|2、および処理対象信号Ys(ω,n)から周波数ごとに利得係数を求める(s530)。利得係数算出部530は、ベクトル要素抽出部81と第1ゲイン算出部531と第2ゲイン算出部532とゲイン乗算部533を有する。
<Gain
FIG. 13 shows a configuration example of the gain
『ベクトル要素抽出部81』
ベクトル要素抽出部81は、入力された推定信号パワーベクトルXopt(ω,n)を、推定信号パワー|S(ω,n)|2、推定左側方雑音パワー|NLL(ω,n)|2、推定左方向雑音パワー|NL(ω,n)|2、推定正面方向雑音パワー|NC(ω,n)|2、推定右方向雑音パワー|NR(ω,n)|2、推定右側方雑音パワー|NRR(ω,n)|2としてそれぞれ出力する(s81)。
『第1ゲイン算出部531』
第1ゲイン算出部531は、推定信号パワー|S(ω,n)|2と処理対象信号YS(ω,n)から、第1ゲイン係数GS(ω,n)を次式のように計算し、出力する(s531)。
“Vector
The vector
“First
The first
『第2ゲイン算出部532』
第2ゲイン算出部532は、所望音源の信号量を含む全ての音源の信号量に対する所望音源の信号量の割合(以下、「第2ゲイン係数」という)を求める(s532)。例えば、第2ゲイン算出部532は、推定信号パワー|S(ω,n)|2、推定左側方雑音パワー|NLL(ω,n)|2、推定左方向雑音パワー|NL(ω,n)|2、推定正面方向雑音パワー|NC(ω,n)|2、推定右方向雑音パワー|NR(ω,n)|2、推定右側方雑音パワー|NRR(ω,n)|2から、第2ゲイン係数GSNR(ω,n)を次式のように計算し、出力する。
“Second
The second
なお、|NLL(ω,n)|2+|NL(ω,n)|2+|NC(ω,n)|2+|NR(ω,n)|2+|NRR(ω,n)|2を所望音源以外の音源からの信号量のパワー|N(ω,n)|2とすれば、次式のようにも表現できる。 | N LL (ω, n) | 2 + | N L (ω, n) | 2 + | N C (ω, n) | 2 + | N R (ω, n) | 2 + | N RR ( If ω, n) | 2 is the power | N (ω, n) | 2 of the signal amount from a sound source other than the desired sound source, it can be expressed as the following equation.
第2ゲイン算出部532は、第2ゲイン係数をゲイン乗算部533に出力するとともに、判定部550に出力する。
The second
『ゲイン乗算部533』
ゲイン乗算部533は、次式のように第1ゲイン係数GS(ω,n)と第2ゲイン係数GSNR(ω,n)との積を利得係数R(ω,n)として出力する(s533)。
R(ω,n)=GS(ω,n)・GSNR(ω,n)
“
The
R (ω, n) = G S (ω, n) · G SNR (ω, n)
<判定部550>
第2ゲイン係数GSNR(ω,n)を用いて、所定の領域から音が発生しているか否か判定する(s550)。そして、特定の位置から音声が発生していない場合には、不明瞭化部120において、不明瞭化した音響信号を生成する。図12のターゲットエリアSに音がなければ、式(1)のGSNR(ω,n)の値は全周波数成分で0に近い値になる。一方、ターゲットエリアSに音があれば、そこにある音源の周波数成分のGSNR(ω,n)のみが1に近い値になる。
そこで、例えば、以下の方法により、判定部550は、所定の領域(ターゲットエリアS)から音が発生しているか否か判定する。
<Determining
It is determined using the second gain coefficient G SNR (ω, n) whether or not sound is generated from a predetermined region (s550). Then, when no sound is generated from a specific position, the obscuring
Therefore, for example, the
ターゲットエリアS内にある音源が音声であると限定し、音声帯域の周波数(例えば100Hzから3kHz程度)でGSNR(ω,n)を周波数方向に加算し、その値があらかじめ決めておいたしきい値を超えたときに、ターゲットエリアSに音声があると判定する。また加算するのではなく、GSNR(ω,n)が、あらかじめ決めておいたしきい値を超えた成分の数を合計し、それが、あらかじめ決めておいた別のしきい値を超えたときに、ターゲットエリアSに音声があると判定してもよい。なお、しきい値は、マイクロホンアレイの特性等や部屋の音響状態で変動するため、実験的に求める。さらに、上記の値(GSNR(ω,n)の加算値、または成分数の加算値)は、フレーム分割時間単位で刻一刻と変化するため、判定誤差等により明瞭化不明瞭化が高速に切り替わることもある。それを防ぐために、得られた値を、時間方向に移動平均するか、忘却係数により、平滑化すると良い。 The sound source in the target area S is limited to voice, and G SNR (ω, n) is added in the frequency direction at the frequency of the voice band (for example, about 100 Hz to 3 kHz), and the value is determined in advance. When the value is exceeded, it is determined that there is sound in the target area S. In addition, when G SNR (ω, n) sums the number of components exceeding a predetermined threshold value and it exceeds another predetermined threshold value instead of adding. Alternatively, it may be determined that there is sound in the target area S. The threshold value is experimentally determined because it varies depending on the characteristics of the microphone array and the acoustic state of the room. Furthermore, since the above value (added value of G SNR (ω, n) or the added value of the number of components) changes every moment in units of frame division time, clarification and obscuration is accelerated due to determination errors and the like. Sometimes it changes. In order to prevent this, the obtained values may be smoothed by moving average in the time direction or by a forgetting factor.
上記方法により判定部550は、特定の位置から音声が発生している場合には、処理対象信号生成部540の生成した処理対象信号YS(ω,n)を乗算部509へ出力するように制御し、特定の位置から音声が発生していない場合には、処理対象信号YS(ω,n)を不明瞭化部120へ出力するように制御する。また、送信部540へ付加信号または制御信号を送信する。
By the above method, the
<不明瞭化部120>
不明瞭化部120は、実施例1と同様の構成である。よって、不明瞭化部120において、処理対象信号YS(ω,n)を用いて、不明瞭化した音響信号|F”(m,n)|を生成する(s120)。
<
The obscuring
<乗算部509>
乗算部509は、処理対象信号生成部540から与えられる所望音源の信号を主成分とする信号Ys(ω,n)に各周波数領域毎に利得係数R(ω,n)乗算することにより(s509)、所望音源1の信号を主成分とする信号に含まれる背景雑音成分を抑制することができる。乗算部509は信号Ys(ω,n)と利得係数R(ω,n)を入力され、背景雑音成分を抑圧した信号Y(ω,n)を出力する。
<
The
<送信部540>
送信部540は、判定部550から付加信号または制御信号を、不明瞭化部120から不明瞭化した音響信号|F”(m,n)|または乗算部509から背景雑音成分を抑圧した信号Y(ω,n)を入力され、|F”(m,n)|またはY(ω,n)を音響信号受信装置600へ送信する(s540)。例えば、付加信号は、送信する信号が|F”(m,n)|またはY(ω,n)を識別する信号であり、送信部540は、各信号に受け取った付加信号を付加して送信する。また例えば、制御信号は、|F”(m,n)|及びY(ω,n)がそれぞれ送信用のチャネルを有する場合に、何れのチャネルにより送信するかを制御する信号である。
<
The transmitting
[音響信号受信装置600]
図14は、音響信号受信装置600の構成例を示す。音響信号受信装置600の受信部601は、付加信号または受信チャネルにより受信した信号が|F”(m,n)|またはY(ω,n)であるかを判別する。受信した信号が|F”(m,n)|の場合には利得算出部207に送信する。一方、受信した信号がY(ω,n)の場合には時間領域変換部215に送信する。
[Acoustic signal receiving apparatus 600]
FIG. 14 shows a configuration example of the acoustic signal receiving device 600. The receiving
<効果>
音響信号送信装置500及び音響信号受信装置600をこのように構成することによって、実施例1と同様の効果を得ることができる。さらに、音声の不明瞭化処理と、その処理の解除を、音源の位置の判定により自動で行うことで、切り替え忘れの防止や、スイッチ操作等の煩雑さをなくし、プライバシーに配慮しつつ、より自然なテレコミュニケーションを実現できるという効果を奏する。
なお、上記、判定部550による自動判定に加えて、不明瞭化処理を解除するスイッチも具備すれば、利用者の手間は増えるが確実性は増すこともできる。
<Effect>
By configuring the acoustic
In addition to the automatic determination by the
また、処理対象信号Ys(ω,n)に対し、強調処理を行っているが、強調処理を行わずに、そのまま送信してもよい。この場合、乗算部509を設けなくとも良く、利得算出部530内の第1ゲイン算出部531及びゲイン乗算部533を設けなくとも良い。なお、本実施例の場合には、エリアの外の音を完全に消す(不明瞭にする)ことは出来ていないが、話者は、自身が通話をしている状態であれば、従来の電話と同じであり、多少の周囲の音が相手に伝わったとしても不自然な通話とはならない。
Further, although the enhancement processing is performed on the processing target signal Ys (ω, n), the processing target signal Ys (ω, n) may be transmitted as it is without performing the enhancement processing. In this case, the
<その他>
さらに、この方法では、ターゲットエリアSにある音声と同様な周波数帯域を持つ音源でも反応するため、これに、音声の特徴量を用いた判定方法を加えても良い。それには、例えば音源の周期性の有無を用いる方法がある。この場合、マイクロホンアレー3R,3Lの出力信号を判定部550の入力信号とする。例えば、伊藤憲三、"音声と非音声の識別処理に基づく定常雑音抑圧方式"、日本音響学会誌、Von.61,No8,P431-440,2005(以下「参考文献2」という)のように、判定部550は、入力信号を線形予測分析した残差信号に対して自己相関値を算出、音声の基本周波数(例えば50Hzから300Hz程度)の範囲内で、その最大値を探索し、その値があらかじめ決めておいたしきい値(概ね0.3以上)を超えた場合に、周期性があると判定する。それに加えて、判定部550は、残差信号のパワーがあらかじめ決めておいたしきい値を超えることで音声と判定する。なお、このしきい値は、例えば残差パワーの長時間平均を計測し続け、そこから例えば6dB程度大きい値に自動的に設定してもよい。
<Others>
Furthermore, in this method, a sound source having the same frequency band as the sound in the target area S reacts, so that a determination method using the sound feature amount may be added thereto. For example, there is a method using the presence or absence of periodicity of the sound source. In this case, output signals from the
不明瞭化または明瞭化を行う際の自動判定の方法として、特許第3670562号公報(以下、「参考文献3」という)に基づく二つのマイクロホンを使った実施例を説明する。
[音響信号送信装置700]
図15は音響信号送信装置700の構成例を、図16は音響信号送信装置700の処理フロー例を示す。音響信号送信装置700は、ステレオ信号入力部701、フレーム分割部109、分割部111、類似度計算部704、減衰係数計算部705、乗算部716、加算部717、760、不明瞭化部120、判定部750及び送信部540を有する。
An embodiment using two microphones based on Japanese Patent No. 3670562 (hereinafter referred to as “
[Acoustic signal transmitter 700]
FIG. 15 shows a configuration example of the acoustic signal transmission device 700, and FIG. 16 shows a processing flow example of the acoustic signal transmission device 700. The acoustic signal transmission apparatus 700 includes a stereo
図17は音響信号送信装置に信号を入力するマイクロホン3の配置例を示す。2つのマイクロホン3を明瞭化したい音源(話者)位置と対称になる位置に配置する。
なお、ステレオ信号入力部701、類似度計算部704、減衰係数計算部705、乗算部716、加算部717の処理内容は参考文献3に詳しく記載されている。またフレーム分割部109、分割部111及び不明瞭化部120は実施例1と、送信部540及び音響信号受信装置600は実施例2と同様の構成である。これらについて本実施例では概要を説明する。
FIG. 17 shows an arrangement example of the
The processing contents of the stereo
<ステレオ信号入力部701>
音響信号送信装置700は、ステレオ信号入力部701を介して、ステレオ信号を入力される(s701)。このステレオ信号は、左右のチャネルごとに処理される。
<フレーム分割部109及び分割部111>
フレーム分割部109及び分割部111は、実施例1と同様の構成である。フレーム分割部109は、デジタル音響信号xR(u)、xL(u)を所定時間ごとのフレームnに分割し(s109)、音響信号XR(n)、XL(n)を出力する。分割部111は、各フレームnごとの音響信号を複数の周波数帯域音響信号XR(ω,n)、XL(ω,n)に分割し(s111)、出力する。なお、参考文献3記載の左チャネル周波数帯域分割部103及び右ちぇネル周波数帯域分割部104は、フレーム分割部109及び分割部111の機能を備える。
<Stereo
The acoustic signal transmitting apparatus 700 receives a stereo signal via the stereo signal input unit 701 (s701). This stereo signal is processed for each of the left and right channels.
<
The
<類似度計算部704>
類似度計算部704において、XR(ω,n)、XL(ω,n)は、同じ周波数帯域ごとに類似度a(ω,n)が計算される(s704)。例えば、a(ω,n)は、ai(ω,n)とap(ω,n)からなり、ai(ω,n)及びap(ω,n)は、以下の式により求める。
<
In the
<減衰係数計算部705>
減衰係数計算部705は、各周波数帯域ごとに計算された類似度a(ω,n)に基づき各周波数帯域ごとに減衰係数g(ω,n)を算出する(s705)。
<乗算部716>
乗算部116は、減衰係数g(ω,n)を各チャネル各周波数帯域のXR(ω,n)、XL(ω,n)に乗じ(s716)、ターゲットエリアS以外から発生する響信号を抑圧した信号X’R(ω,n)、X’L(ω,n)を出力する。
<Attenuation
The attenuation
<
The multiplier 116 multiplies the attenuation coefficient g (ω, n) by X R (ω, n) and X L (ω, n) of each frequency band (s716), and generates an echo signal other than the target area S. Are output as signals X ′ R (ω, n) and X ′ L (ω, n).
<加算部717及び760>
加算部717は、左右のチャネル信号X’R(ω,n)、X’L(ω,n)を加算し(s717)、モノラル化し、Y(ω,n)を算出する。
一方、加算部760は、左右のチャネル信号XR(ω,n)、XL(ω,n)を加算し(s760)、モノラル化し、X(ω,n)を算出する。
<不明瞭化部120>
不明瞭化部120は、実施例1と同様の構成である。よって、不明瞭化部120において、X(ω,n)を用いて、不明瞭化した音響信号|F”(m,n)|を生成する(s120)。
<Adding
The
On the other hand, the adding
<
The obscuring
<判定部750>
判定部750は、類似度a(ω,n)を用いて、特定の領域から音が発生しているか否か判定する(s750)。図18に判定部750の処理フロー例を示す。
左右2つのマイクロホンと対称の位置、即ちターゲットエリアSにある音響信号は、2つのマイクロホン3に同位相かつ同パワーで入力される。まず初期設定を行い(s751)、式(2)によって求めるai(ω,n)の値が1に近いあらかじめ1に近いあらかじめ決めておいたしきい値の範囲内(例えば、1−k1≦ai(ω,n)≦1+k1、例えば、k1=0.05とする)であり(s752)、かつ、式(3)によって求めるap(ω,n)の値が1に近いあらかじめ決めておいたしきい値の範囲内(例えば、1−k2≦ap(ω,n)≦1+k2、例えば、k2=0.05とする)であった周波数成分の信号を(s753)、中央付近にある音源の周波数成分と判定する。全ての周波数について上記判定を行う(s755、s756)。
<Determining
The
An acoustic signal in a position symmetrical to the two left and right microphones, that is, in the target area S, is input to the two
そして、その判定を受けた周波数成分の数をカウントし(s754)、その数cntがあらかじめ決めておいたしきい値k3(例えば全周波数成分の30%)以上であった場合に、特定の領域から音が発生していると判定する(s757、s758)。k3未満であった場合には、特定の領域から音が発生していないと判定する(s759)。判定後の処理は判定部550と同様である。
<送信部540>
送信部540は、判定部550から付加信号または制御信号を、不明瞭化部120から出力された不明瞭化した音響信号|F”(m,n)|または乗算部717から出力された信号Y(ω,n)を音響信号受信装置600へ送信する(s761、s762)。
Then, the number of frequency components subjected to the determination is counted (s754), and when the number cnt is equal to or greater than a predetermined threshold value k3 (for example, 30% of all frequency components), a specific region is used. It is determined that sound is generated (s757, s758). If it is less than k3, it is determined that no sound is generated from the specific area (s759). The processing after the determination is the same as that of the
<
The
<効果>
このような構成とすることによって、実施例1及び実施例2と同様の効果を得ることができる。この実施例3の場合は、マイクロホンの数が2個で済み、演算量が少ないという利点はある。しかし、原理的に、実施例2のように、ピンポイントで音源の位置を判定することは出来ない。つまり、2つのマイクロホンから対称の位置にある音源は、マイクロホンからの距離に関わらず明瞭に伝送される音として判定される。ただし、マイクロホンから離れた位置にある音源信号には、壁等からの反射音がより加わり、左右の位相差の乱れが大きくなることと、距離減衰により音のパワーが徐々に小さくなるため、実用上は、図17にあるような楕円の位置が明瞭化される範囲となる。
<Effect>
By adopting such a configuration, the same effects as those of the first and second embodiments can be obtained. In the case of the third embodiment, only two microphones are required, and there is an advantage that the amount of calculation is small. However, in principle, the position of the sound source cannot be determined pinpointed as in the second embodiment. That is, the sound source located at a symmetrical position from the two microphones is determined as a sound that is clearly transmitted regardless of the distance from the microphone. However, the sound source signal at a position far from the microphone is added with the reflected sound from the wall, etc., and the disturbance of the left and right phase difference increases, and the sound power gradually decreases due to distance attenuation. The above is a range in which the position of the ellipse as shown in FIG. 17 is clarified.
<その他>
なお、参考文献2記載の音声の特徴量を判定に加えてもよいことは、同様である。また、特定の領域以外から発生する音を抑圧せずに音響信号受信装置600に送信してもよい。その場合、乗算部716及び減衰係数計算部705を設けなくともよい。また、判定部750が、分割部111から出力される信号XR(ω,n)、XL(ω,n)を乗算部716及び加算部760の何れか一方に出力するように制御してもよい。
<Others>
It is the same that the audio feature amount described in
2つのマイクロホン対、つまり4つのマイクロホンと、実施例3で説明した類似度計算部を2つ用いて、実施例3に比べより狭い特定領域において音が発生するか否かを判定する実施例について説明する。 Example in which two microphone pairs, that is, four microphones, and two similarity calculation units described in Example 3 are used to determine whether sound is generated in a specific area narrower than Example 3. explain.
[音響信号送信装置800]
図19は音響信号送信装置800の構成例を示す。音響信号送信装置800は、第1類似度計算手段810、第2類似度計算手段811、加算部817、860、判定部850、不明瞭化部120、送信部540を有する。なお、不明瞭化部120は実施例1と、送信部540及び音響信号受信装置600は実施例2と同様の構成である。
図20は音響信号送信装置に信号を入力するマイクロホン3R1、3L1、3R2、3L2の配置例を示す。各マイクロホン対3R1、3L1と3R2、3L2の中央の重なり合う部分をターゲットエリアSとする。
[Acoustic signal transmission device 800]
FIG. 19 shows a configuration example of the acoustic signal transmission device 800. The acoustic signal transmission apparatus 800 includes a first similarity calculation unit 810, a second similarity calculation unit 811,
FIG. 20 shows an arrangement example of the
<第1類似度計算手段810及び第2類似度計算手段811>
第1類似度計算手段810は、ステレオ信号入力部701、フレーム分割部109、分割部111及び第1類似度計算部804を備える。第2類似度計算手段811は、第1類似度計算手段810と同様の構成を有し、第1類似度計算部804に代えて、図示しない第2類似度計算部を備える。なお、フレーム分割部109及び分割部111は実施例1と、送信部540及び音響信号受信装置600は実施例2と同様の構成である。第1類似度計算部804及び第2類似度計算部は実施例3の類似度計算部704と同様の構成である。
<First Similarity Calculation Unit 810 and Second Similarity Calculation Unit 811>
The first similarity calculation unit 810 includes a stereo
『第1類似度計算部804』
第1類似度計算部804は、マイクロホン3R1及び3L1の出力信号を用いて得られる周波数帯域音響信号XR1(ω,n)、XL1(ω,n)を入力され、第1類似度a1(ω,n)を求める。同様に第2類似度計算部は、マイクロホン3R2及び3L2の出力信号を用いて得られる周波数帯域音響信号XR2(ω,n)、XL2(ω,n)を入力され、第2類似度a2(ω,n)を求める。
“First
The first
<判定部850>
判定部は、第1類似度a1(ω,n)及び第2類似度a2(ω,n)を用いて、特定の領域から音が発生しているか否か判定する。具体的には、各類似度a1,a2を用いて、図18に記載される判定処理を行い、何れの類似度に対しても所定の領域から音が発生していると判定された場合のみ(s757)、図20のターゲットエリアSから音が発生していると判定する。判定後の処理は判定部550と同様である。
<Determining
The determination unit determines whether sound is generated from a specific region using the first similarity a1 (ω, n) and the second similarity a2 (ω, n). Specifically, the determination process illustrated in FIG. 18 is performed using the similarities a1 and a2, and only when it is determined that sound is generated from a predetermined region for any similarity. (S757), it is determined that sound is generated from the target area S of FIG. The processing after the determination is the same as that of the
<効果>
このような構成とすることによって、実施例1、実施例2、実施例3と同様の効果を得ることができる。なお、実施例2と比べると演算処理が軽く、マイクロホンが4本ですむという利点がある。一方、実施例3と比べると特定の領域を狭くできるという利点がある。
<加算部817及び加算部860>
加算部817及び加算部860は、それぞれ周波数帯域音響信号XR1(ω,n)、XL1(ω,n)、XR2(ω,n)、XL2(ω,n)を入力され、これらの値を足し合わせた値Y(ω,n)、X(ω,n)を出力する。なお、この場合、Y(ω,n)とX(ω,n)は同一となる。
<Effect>
By adopting such a configuration, it is possible to obtain the same effects as those of the first embodiment, the second embodiment, and the third embodiment. Compared with the second embodiment, the calculation processing is lighter and four microphones are required. On the other hand, compared with the third embodiment, there is an advantage that a specific area can be narrowed.
<Adding
The
<その他>
なお、実施例3と同様に、減衰係数計算部を設けても良い。その場合、各類似度計算手段810,811からそれぞれ減衰係数を求めるため、二つの減衰係数計算部を設け、各類似度計算手段の出力信号に対して、対応する減衰係数を乗算する。
上述した音響信号送信装置及び音響信号受信装置は、コンピュータにより機能させることもできる。この場合はコンピュータに、目的とする装置(各種実施例で図に示した機能構成をもつ装置)として機能させるためのプログラム、又はその処理手順(各実施例で示したもの)の各過程をコンピュータに実行させるためのプログラムを、CD−ROM、磁気ディスク、半導体記憶装置などの記録媒体から、あるいは通信回線を介してそのコンピュータ内にダウンロードし、そのプログラムを実行させればよい。
<Others>
Note that an attenuation coefficient calculation unit may be provided as in the third embodiment. In this case, in order to obtain the attenuation coefficient from the similarity calculation means 810 and 811, two attenuation coefficient calculation sections are provided, and the output signal of each similarity calculation means is multiplied by the corresponding attenuation coefficient.
The above-described acoustic signal transmitting apparatus and acoustic signal receiving apparatus can be functioned by a computer. In this case, the program for causing the computer to function as a target device (the device having the functional configuration shown in the drawings in various embodiments) or each process of the processing procedure (shown in each embodiment) is processed by the computer. A program to be executed by the computer may be downloaded from a recording medium such as a CD-ROM, a magnetic disk, or a semiconductor storage device or via a communication line into the computer, and the program may be executed.
100,300,500,700,800 音響信号送信装置
200,400,600 音響信号受信装置
103,203 記憶部 105,205 制御部
107 ADC 109,209 フレーム分割部
111,211 分割部 120,320 不明瞭化部
321,421 フィルタバンク 121 周波数方向平滑化部
123 ダイナミックレンジ圧縮部 125 時間方向平滑部
130,540 送信部
201,601 受信部 207,327 利得算出部
213 乗算部 215 時間領域変換部
217 DAC 219 アンプ
415 フレーム合成部 4−1 第1収音部
4−2 第2収音部 4−3 第3収音部
4−4 第4収音部 4−5 第5収音部
4−6 第6収音部
540 処理対象信号生成部 507 パワースペクトル推定部
530 利得係数算出部 509 乗算部
550,750,850 判定部 704 類似度計算部
804 第1類似度計算部 810 第1類似度計算手段
811 第2類似度計算手段
100, 300, 500, 700, 800 Acoustic signal transmitting device 200, 400, 600 Acoustic
Claims (10)
各フレームごとの音響信号を複数の周波数帯域音響信号に分割する分割部と、
各フレームごとに分割された音響信号を不明瞭化処理する不明瞭化部を備え、
前記不明瞭化部は、
入力された信号の周波数的に平滑化したパワーを求める周波数方向平滑化部と、
入力された信号のパワーの変動を圧縮するダイナミックレンジ圧縮部と、
入力された信号を前記フレーム長より長い時間に時間的に平滑化する時間方向平滑化部とが縦続して接続されている、
ことを特徴とする音響信号送信装置。 A frame dividing unit that divides the acoustic signal collected from the microphone into frames at predetermined intervals;
A dividing unit for dividing the acoustic signal for each frame into a plurality of frequency band acoustic signals;
An obscuring unit for obscuring an acoustic signal divided for each frame;
The obscuring part is
A frequency direction smoothing unit for obtaining a frequency-smoothed power of an input signal;
A dynamic range compression unit that compresses fluctuations in the power of the input signal;
A time direction smoothing unit that temporally smoothes the input signal in a time longer than the frame length is connected in cascade.
An acoustic signal transmitter characterized by the above.
各フレームごとに分割された音響信号を不明瞭化処理する不明瞭化部を備え、
前記不明瞭化部は、
各フレームごとに分割された音響信号を複数の周波数帯域音響信号に分割し、周波数的に平滑化したパワーを求めるフィルタバンクと、
入力された信号のパワーの変動を圧縮するダイナミックレンジ圧縮部と、
入力された信号を前記フレーム長より長い時間に時間的に平滑化する時間方向平滑化部とを備える、
ことを特徴とする音響信号送信装置。 A frame dividing unit that divides the acoustic signal collected from the microphone into frames at predetermined intervals;
An obscuring unit for obscuring an acoustic signal divided for each frame;
The obscuring part is
A filter bank that divides an acoustic signal divided for each frame into a plurality of frequency band acoustic signals and obtains a frequency-smoothed power,
A dynamic range compression unit that compresses fluctuations in the power of the input signal;
A time direction smoothing unit that temporally smoothes the input signal in a time longer than the frame length;
An acoustic signal transmitter characterized by the above.
特定の位置から音声が発生しているか否かを判定する判定部を有し、
特定の位置から音声が発生していない場合には、前記不明瞭化部において、不明瞭化した音響信号を生成する、
ことを特徴とする音響信号送信装置。 The acoustic signal transmission device according to claim 1 or 2,
A determination unit that determines whether sound is generated from a specific position;
When no sound is generated from a specific position, the obscuring unit generates an obscured acoustic signal.
An acoustic signal transmitter characterized by the above.
複数のマイクロホンを搭載して構成されるマイクロホンアレーの出力信号を利用して、それぞれ異なる領域の音を収音する6つ以上の収音部と、
あらかじめ定めた1つ以上の前記マイクロホンまたは前記収音部からの信号から、処理対象信号を生成する処理対象信号生成部と、
前記各収音部で得られた各収音響信号の信号量から、所望音源の信号量と、その他の音源の信号量とを周波数ごとに推定するパワースペクトル推定部と、
所望音源の信号量を含む全ての音源の信号量に対する前記所望音源の信号量の割合(以下、「第2ゲイン係数」という)を求める第2ゲイン算出部と、を有し、
前記判定部は、
前記第2ゲイン係数を用いて、所定の領域から音が発生しているか否か判定する、
ことを特徴とする音響信号送信装置。 The acoustic signal transmission device according to claim 3,
6 or more sound collection units for collecting sounds in different areas using output signals of a microphone array configured with a plurality of microphones;
A processing target signal generation unit that generates a processing target signal from one or more predetermined microphones or signals from the sound collection unit;
From the signal amount of each collected sound signal obtained by each sound collecting unit, the signal amount of the desired sound source and the signal amount of the other sound source are estimated for each frequency, and the power spectrum estimation unit,
A second gain calculation unit for obtaining a ratio of the signal amount of the desired sound source to the signal amount of all sound sources including the signal amount of the desired sound source (hereinafter referred to as “second gain coefficient”);
The determination unit
Using the second gain coefficient to determine whether sound is generated from a predetermined area;
An acoustic signal transmitter characterized by the above.
2チャネルのマイクロホンから収音された音響信号を用いて、各周波数帯域毎にチャネル間の類似度を計算する類似度計算部を有し、
前記判定部は、前記類似度を用いて、特定の領域から音が発生しているか否か判定する、
ことを特徴とする音響信号送信装置。 The acoustic signal transmission device according to claim 3,
Using an acoustic signal collected from a two-channel microphone, and having a similarity calculator for calculating the similarity between channels for each frequency band;
The determination unit determines whether or not sound is generated from a specific region using the similarity;
An acoustic signal transmitter characterized by the above.
2チャネルのマイクロホンから収音された音響信号を用いて、各周波数帯域毎にチャネル間の類似度を計算する第1類似度計算部と、
前記第1類似度計算部の2チャネルのマイクロホンとは異なる2チャネルのマイクロホンから収音された音響信号を用いて、各周波数帯域毎にチャネル間の類似度を計算する第2類似度計算部とを有し、
前記判定部は、前記第1類似度計算部及び前記第2類似度計算部から得られる前記類似度を用いて、特定の領域から音が発生しているか否か判定する、
ことを特徴とする音響信号送信装置。 The acoustic signal transmission device according to claim 3,
A first similarity calculator that calculates the similarity between channels for each frequency band using an acoustic signal collected from a two-channel microphone;
A second similarity calculation unit that calculates a similarity between channels for each frequency band using an acoustic signal collected from a two-channel microphone different from the two-channel microphone of the first similarity calculation unit; Have
The determination unit determines whether sound is generated from a specific region using the similarity obtained from the first similarity calculation unit and the second similarity calculation unit.
An acoustic signal transmitter characterized by the above.
前記不明瞭化された音響信号を用いて、各周波数ごとの利得を算出する利得算出部と、
所定の定常的なキャリア信号を所定時間ごとのフレームに分割するフレーム分割部と、
各フレームごとのキャリア信号を複数の周波数帯域の信号に分割する分割部と、
前記利得と前記周波数帯域の信号を乗じる乗算部と、
乗算部で求めた値を時間領域の信号に変換する時間領域変換部と、を有する、
ことを特徴とする音響信号受信装置。 An acoustic signal receiving device for receiving an obscured acoustic signal,
Using the obscured acoustic signal, a gain calculation unit that calculates a gain for each frequency;
A frame dividing unit for dividing a predetermined stationary carrier signal into frames every predetermined time;
A dividing unit for dividing the carrier signal for each frame into signals of a plurality of frequency bands;
A multiplier that multiplies the gain and the signal of the frequency band;
A time domain conversion unit that converts a value obtained by the multiplication unit into a time domain signal;
An acoustic signal receiving device.
各フレームごとの音響信号を複数の周波数帯域音響信号に分割する分割ステップと、
各フレームごとに分割された音響信号を不明瞭化処理する不明瞭化ステップを備え、
前記不明瞭化ステップは、
入力された信号の周波数的に平滑化したパワーを求める周波数方向平滑化ステップと、
入力された信号のパワーの変動を圧縮するダイナミックレンジ圧縮ステップと、
入力された信号を前記フレーム長より長い時間に時間的に平滑化する時間方向平滑化ステップとが縦続している、
ことを特徴とする音響信号送信方法。 A frame dividing step for dividing the acoustic signal collected from the microphone into frames at predetermined intervals;
A dividing step of dividing the acoustic signal for each frame into a plurality of frequency band acoustic signals;
Comprising an obscuring step for obscuring the acoustic signal divided for each frame;
The obscuring step includes
A frequency direction smoothing step for obtaining a frequency-smoothed power of the input signal;
A dynamic range compression step for compressing fluctuations in the power of the input signal;
A time direction smoothing step for smoothing the input signal in time longer than the frame length is cascaded;
An acoustic signal transmission method characterized by the above.
特定の位置から音声が発生しているか否かを判定する判定ステップを有し、
特定の位置から音声が発生していない場合には、前記不明瞭化ステップにおいて、不明瞭化した音響信号を生成する、
ことを特徴とする音響信号送信方法。 An acoustic signal transmission method according to claim 8,
A determination step for determining whether or not sound is generated from a specific position;
If no sound is generated from a specific position, the obscuring step generates an obscured acoustic signal.
An acoustic signal transmission method characterized by the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009146503A JP5149872B2 (en) | 2009-06-19 | 2009-06-19 | Acoustic signal transmitting apparatus, acoustic signal receiving apparatus, acoustic signal transmitting method, acoustic signal receiving method, and program thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009146503A JP5149872B2 (en) | 2009-06-19 | 2009-06-19 | Acoustic signal transmitting apparatus, acoustic signal receiving apparatus, acoustic signal transmitting method, acoustic signal receiving method, and program thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011002704A true JP2011002704A (en) | 2011-01-06 |
JP5149872B2 JP5149872B2 (en) | 2013-02-20 |
Family
ID=43560696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009146503A Expired - Fee Related JP5149872B2 (en) | 2009-06-19 | 2009-06-19 | Acoustic signal transmitting apparatus, acoustic signal receiving apparatus, acoustic signal transmitting method, acoustic signal receiving method, and program thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5149872B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012160602A1 (en) * | 2011-05-24 | 2012-11-29 | 三菱電機株式会社 | Target sound enhancement device and car navigation system |
WO2017150103A1 (en) * | 2016-02-29 | 2017-09-08 | パナソニックIpマネジメント株式会社 | Audio processing device, image processing device, microphone array system, and audio processing method |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10254499A (en) * | 1997-03-14 | 1998-09-25 | Nippon Telegr & Teleph Corp <Ntt> | Band division type noise reducing method and device |
JP2006020231A (en) * | 2004-07-05 | 2006-01-19 | Yamaha Corp | Audio reproducing apparatus |
JP2006145818A (en) * | 2004-11-19 | 2006-06-08 | Teac Corp | Audio signal adjusting device |
JP2009075160A (en) * | 2007-09-18 | 2009-04-09 | Nippon Telegr & Teleph Corp <Ntt> | Communication speech processing method and its device, and its program |
-
2009
- 2009-06-19 JP JP2009146503A patent/JP5149872B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10254499A (en) * | 1997-03-14 | 1998-09-25 | Nippon Telegr & Teleph Corp <Ntt> | Band division type noise reducing method and device |
JP2006020231A (en) * | 2004-07-05 | 2006-01-19 | Yamaha Corp | Audio reproducing apparatus |
JP2006145818A (en) * | 2004-11-19 | 2006-06-08 | Teac Corp | Audio signal adjusting device |
JP2009075160A (en) * | 2007-09-18 | 2009-04-09 | Nippon Telegr & Teleph Corp <Ntt> | Communication speech processing method and its device, and its program |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012160602A1 (en) * | 2011-05-24 | 2012-11-29 | 三菱電機株式会社 | Target sound enhancement device and car navigation system |
CN103329200A (en) * | 2011-05-24 | 2013-09-25 | 三菱电机株式会社 | Target sound enhancement device and car navigation system |
JP5543023B2 (en) * | 2011-05-24 | 2014-07-09 | 三菱電機株式会社 | Object sound enhancement device and car navigation system |
WO2017150103A1 (en) * | 2016-02-29 | 2017-09-08 | パナソニックIpマネジメント株式会社 | Audio processing device, image processing device, microphone array system, and audio processing method |
JPWO2017150103A1 (en) * | 2016-02-29 | 2019-01-31 | パナソニックIpマネジメント株式会社 | Audio processing apparatus, image processing apparatus, microphone array system, and audio processing method |
US10943596B2 (en) | 2016-02-29 | 2021-03-09 | Panasonic Intellectual Property Management Co., Ltd. | Audio processing device, image processing device, microphone array system, and audio processing method |
Also Published As
Publication number | Publication date |
---|---|
JP5149872B2 (en) | 2013-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2283484B1 (en) | System and method for dynamic sound delivery | |
US9591410B2 (en) | Hearing assistance apparatus | |
EP2265039B1 (en) | Hearing aid | |
KR100860805B1 (en) | Voice enhancement system | |
US10614788B2 (en) | Two channel headset-based own voice enhancement | |
US8170221B2 (en) | Audio enhancement system and method | |
EP2546831B1 (en) | Noise suppression device | |
US20090034747A1 (en) | Audio enhancement system and method | |
JP3505085B2 (en) | Audio equipment | |
US10262673B2 (en) | Soft-talk audio capture for mobile devices | |
US20160088407A1 (en) | Method of signal processing in a hearing aid system and a hearing aid system | |
US8199928B2 (en) | System for processing an acoustic input signal to provide an output signal with reduced noise | |
CN117321681A (en) | Speech optimization in noisy environments | |
US8254590B2 (en) | System and method for intelligibility enhancement of audio information | |
JP5149872B2 (en) | Acoustic signal transmitting apparatus, acoustic signal receiving apparatus, acoustic signal transmitting method, acoustic signal receiving method, and program thereof | |
JPH11265199A (en) | Voice transmitter | |
JPH09311696A (en) | Automatic gain control device | |
JP2011141540A (en) | Voice signal processing device, television receiver, voice signal processing method, program and recording medium | |
JP5036283B2 (en) | Auto gain control device, audio signal recording device, video / audio signal recording device, and communication device | |
Vashkevich et al. | Speech enhancement in a smartphone-based hearing aid | |
JPH0956000A (en) | Hearing aid |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110720 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110922 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121031 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5149872 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151207 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |