JP5480842B2 - Clip noise detection device, clip noise detection method, program - Google Patents

Clip noise detection device, clip noise detection method, program Download PDF

Info

Publication number
JP5480842B2
JP5480842B2 JP2011096918A JP2011096918A JP5480842B2 JP 5480842 B2 JP5480842 B2 JP 5480842B2 JP 2011096918 A JP2011096918 A JP 2011096918A JP 2011096918 A JP2011096918 A JP 2011096918A JP 5480842 B2 JP5480842 B2 JP 5480842B2
Authority
JP
Japan
Prior art keywords
clip
input
noise detection
value
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011096918A
Other languages
Japanese (ja)
Other versions
JP2012230160A (en
Inventor
秀之 水野
光昭 磯貝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011096918A priority Critical patent/JP5480842B2/en
Publication of JP2012230160A publication Critical patent/JP2012230160A/en
Application granted granted Critical
Publication of JP5480842B2 publication Critical patent/JP5480842B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

本発明は録音済み信号からクリップノイズ発生時刻を検出するクリップノイズ検出装置、クリップノイズ検出方法、プログラムに関する。   The present invention relates to a clip noise detection device, a clip noise detection method, and a program for detecting a clip noise occurrence time from a recorded signal.

音声や音楽を録音する際、入力音圧レベルが過大となり、信号許容レベルをオーバーしてしまった場合、収録音源の波形に独特のひずみが生じてしまう。このひずみは、クリップノイズと呼ばれている。   When recording voice or music, if the input sound pressure level becomes excessive and exceeds the allowable signal level, a unique distortion occurs in the waveform of the recorded sound source. This distortion is called clip noise.

一般に、クリップノイズの発生を防ぐためには、あらかじめ録音対象の音のダイナミックレンジを測定したり、試しに音声を収録して収録可能な最大音量レベルを超えないかチェックした後、音声を収録する方法がある。その上で、録音中はピークメータ等で録音音量を監視し、万が一最大音量レベルを超えるような場合は、再度録音しなおすなど、基本的には人間の監視により、最大音量を超えることでクリップノイズが発生しないようにしている。これに対して、信号の振幅最大値を監視し、この振幅最大値を特徴量としてヘッドルームの調整を自動的に行うクリップノイズ防止技術が開発されている(非特許文献1参照)。   In general, in order to prevent the occurrence of clip noise, record the sound after measuring the dynamic range of the sound to be recorded in advance or checking whether the maximum volume level that can be recorded by recording the sound is exceeded. There is. In addition, while recording, monitor the recording volume with a peak meter, etc., and in the unlikely event that it exceeds the maximum volume level, re-record, etc., basically clip by exceeding the maximum volume by human monitoring Noise is not generated. On the other hand, a clip noise prevention technique has been developed in which the maximum amplitude value of a signal is monitored and the headroom is automatically adjusted using the maximum amplitude value as a feature amount (see Non-Patent Document 1).

収録音源にクリップノイズが発生していないかチェックする場合、従来は収録音源を再生し、人間が聴いて確認する方法が一般的であった。   In the past, when checking whether clip noise has occurred in the recorded sound source, a method of reproducing the recorded sound source and listening to it for confirmation by humans has been common.

三浦晋、中島弘史、牧野昭二、山田武志、中臺一博、「クリッピングした音響信号の修復」、日本音響学会講演論文集、平成23年3月11日、p.941―944Atsushi Miura, Hiroshi Nakajima, Shoji Makino, Takeshi Yamada, Kazuhiro Nakajo, "Restoration of Clipped Acoustic Signals", Proceedings of the Acoustical Society of Japan, March 11, 2011, p.941-944

人手によりクリップノイズの発生を監視する場合、素人は当然としてプロのミキサー等の音声技術者であっても不注意による監視漏れや、表示機器自体の精度によるレベルオーバがしばしば発生することがある。また、人の聴感上は聞き取れない程度のクリップノイズであっても、スペクトル的には大きな歪みが発生している場合がある。録音された音を用いて様々なディジタル的な分析処理や統計処理を行う際に、聴感上は聞き取れない程度のクリップノイズによる波形歪みが、予期せぬエラー原因となることが問題であった。これに対して、ディジタル収録の場合には、従来から最大レンジ近傍の値をとるサンプルを機械的に監視する技術が存在するが、量子化巾の最大レンジ近傍の値を取るサンプルの有無を調べるだけでは、機器のセッティング等の問題から、最大レンジ以外の箇所でクリップノイズが発生した場合には、その検出が不可能であるという問題があった。そこで本発明では、収録音源を自動解析して正確にクリップノイズ発生時刻を検出することができるクリップノイズ検出装置を提供する。   When the occurrence of clip noise is manually monitored, even an amateur, such as a professional audio engineer such as a professional mixer, may often cause inadvertent monitoring omission or level over due to the accuracy of the display device itself. Even if the clip noise is inaudible to human hearing, there is a case where large distortion occurs in the spectrum. When various digital analysis processing and statistical processing are performed using the recorded sound, waveform distortion due to clip noise that is inaudible in terms of audibility causes an unexpected error. On the other hand, in the case of digital recording, there is a conventional technique for mechanically monitoring samples that take values in the vicinity of the maximum range, but the existence of samples having values in the vicinity of the maximum range of the quantization width is examined. However, due to problems such as device settings, there is a problem that it is impossible to detect when clip noise occurs outside the maximum range. Therefore, the present invention provides a clip noise detection apparatus that can automatically analyze a recorded sound source and accurately detect a clip noise occurrence time.

本発明のクリップノイズ検出装置は、フィルタバンク処理部と、直交検波部と、クリップ強度計算部と、判定部とを備える。フィルタバンク処理部は、信号を入力とし、当該入力信号をN個(Nは2以上の整数)のフィルタからなるフィルタバンクを通過させて、N個のサブバンド信号を出力する。直交検波部は、N個のサブバンド信号を入力とし、当該N個のサブバンド信号に直交検波を行って、N個の複素解析信号を出力する。クリップ強度計算部は、N個の複素解析信号を入力とし、N個の複素解析信号から選択した任意の2個の複素解析信号の相関関係を求め、当該求められた相関関係から時刻ごとにクリップ強度値を計算し、当該計算されたクリップ強度値を出力する。判定部は、クリップ強度値を入力とし、当該クリップ強度値が予め定めた閾値を超過する場合に、当該超過が発生した時刻をクリップノイズ発生時刻として出力する。   The clip noise detection apparatus of the present invention includes a filter bank processing unit, an orthogonal detection unit, a clip strength calculation unit, and a determination unit. The filter bank processing unit receives a signal, passes the input signal through a filter bank including N filters (N is an integer of 2 or more), and outputs N subband signals. The quadrature detection unit receives N subband signals, performs quadrature detection on the N subband signals, and outputs N complex analysis signals. The clip strength calculation unit receives N complex analysis signals as input, obtains a correlation between any two complex analysis signals selected from the N complex analysis signals, and clips each time based on the obtained correlation. The intensity value is calculated and the calculated clip intensity value is output. The determination unit receives the clip strength value, and outputs the time when the excess occurs as the clip noise occurrence time when the clip strength value exceeds a predetermined threshold.

本発明のクリップノイズ検出装置によれば、収録音源を自動解析して正確にクリップノイズ発生時刻を検出することができる。   According to the clip noise detection apparatus of the present invention, the recorded sound source can be automatically analyzed to accurately detect the clip noise occurrence time.

実施例1に係るクリップノイズ検出装置の構成を示すブロック図。1 is a block diagram illustrating a configuration of a clip noise detection device according to Embodiment 1. FIG. 実施例1に係るフィルタバンク処理部の構成を示すブロック図。FIG. 3 is a block diagram illustrating a configuration of a filter bank processing unit according to the first embodiment. 実施例1に係る直交検波部の構成を示すブロック図。FIG. 3 is a block diagram illustrating a configuration of a quadrature detection unit according to the first embodiment. 実施例1に係るクリップ強度計算部の構成を示すブロック図。FIG. 3 is a block diagram illustrating a configuration of a clip strength calculation unit according to the first embodiment. 実施例1に係るクリップノイズ検出装置の動作を示すフローチャート。5 is a flowchart illustrating the operation of the clip noise detection apparatus according to the first embodiment. フィルタバンク処理部のフィルタバンクの通過特性について説明する図。The figure explaining the passage characteristic of the filter bank of a filter bank process part. クリップノイズ発生時刻検出例を示す図。The figure which shows the example of clip noise generation time detection.

以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。   Hereinafter, embodiments of the present invention will be described in detail. In addition, the same number is attached | subjected to the structure part which has the same function, and duplication description is abbreviate | omitted.

まず、図1、図5を参照して、実施例1のクリップノイズ検出装置10の概略を説明する。図1は本実施例に係るクリップノイズ検出装置10の構成を示すブロック図である。図5は本実施例に係るクリップノイズ検出装置10の動作を示すフローチャートである。本実施例のクリップノイズ検出装置10は、フィルタバンク処理部11と、直交検波部12と、クリップ強度計算部13と、判定部14と、閾値記憶部15とを備える。フィルタバンク処理部11は、信号を入力とし、当該入力信号をN個(Nは2以上の整数)のフィルタからなるフィルタバンクを通過させて、N個のサブバンド信号を出力する(S11)。直交検波部12は、N個のサブバンド信号を入力とし、当該N個のサブバンド信号に直交検波を行って、N個の複素解析信号を出力する(S12)。クリップ強度計算部13は、N個の複素解析信号を入力とし、N個の複素解析信号から選択した任意の2個の複素解析信号の相関関係を求め、当該求められた相関関係から時刻ごとにクリップ強度値を計算し、当該計算されたクリップ強度値を出力する(S13)。判定部14は、クリップ強度値を入力とし、当該クリップ強度値が予め定めた閾値を超過する場合に、当該超過が発生した時刻をクリップノイズ発生時刻として出力する(S14)。このとき、判定部14が用いる閾値は、閾値記憶部15にあらかじめ記憶されているものとする。判定部14が用いる閾値は以下のように求めることができる。   First, an outline of the clip noise detection apparatus 10 according to the first embodiment will be described with reference to FIGS. 1 and 5. FIG. 1 is a block diagram illustrating a configuration of a clip noise detection apparatus 10 according to the present embodiment. FIG. 5 is a flowchart showing the operation of the clip noise detection apparatus 10 according to the present embodiment. The clip noise detection apparatus 10 according to the present exemplary embodiment includes a filter bank processing unit 11, a quadrature detection unit 12, a clip strength calculation unit 13, a determination unit 14, and a threshold storage unit 15. The filter bank processing unit 11 receives a signal, passes the input signal through a filter bank including N filters (N is an integer of 2 or more), and outputs N subband signals (S11). The quadrature detection unit 12 receives N subband signals, performs quadrature detection on the N subband signals, and outputs N complex analysis signals (S12). The clip strength calculation unit 13 receives N complex analysis signals, obtains a correlation between two arbitrary complex analysis signals selected from the N complex analysis signals, and calculates the correlation between the obtained correlations for each time. The clip strength value is calculated, and the calculated clip strength value is output (S13). The determination unit 14 receives the clip strength value, and when the clip strength value exceeds a predetermined threshold, outputs the time when the excess has occurred as the clip noise occurrence time (S14). At this time, the threshold used by the determination unit 14 is stored in the threshold storage unit 15 in advance. The threshold value used by the determination unit 14 can be obtained as follows.

1)教師無し判別閾値
データから一意にクリップの有無を判別するため、事前学習を行わずに予め閾値を決定しておき、クリップ強度値が教師無し判別閾値を超えた場合、その時刻をクリップノイズ発生時刻とする。
1) Unsupervised discrimination threshold In order to uniquely determine the presence or absence of a clip from data, a threshold is determined in advance without prior learning, and when the clip intensity value exceeds the unsupervised discrimination threshold, the time is set as clip noise. Time of occurrence.

2)教師有り判別閾値
クリップノイズが存在していることが予め分かっている信号データが学習に用いることができる程度に存在している場合、クリップしている部分とクリップしていない部分のクリップ強度値を例えばSVM(Support Vector Machine)のような機械学習法によってあらかじめ学習しておき、実際の信号のクリップ強度値をSVMに入力して判別する。
2) Supervised discrimination threshold When the signal data that the clip noise is known in advance is present to such an extent that it can be used for learning, the clip strength of the clipped portion and the unclipped portion The value is learned in advance by a machine learning method such as SVM (Support Vector Machine), and the clip strength value of the actual signal is input to the SVM for discrimination.

1)、2)の何れの方法を取るべきかについては、あらかじめ相当量のクリップノイズパタンのデータが存在していれば2)の方法とし、相当量のクリップノイズパタンのデータがなく、音源にどのようにクリップノイズが発生するか不明な場合は、1)の方法とすることが考えられる。ただしクリップノイズパタンのデータが存在しても、ばらつきが大きい場合は、1)の方法とするのが望ましい。   As for which method of 1) and 2) should be adopted, if there is a considerable amount of clip noise pattern data in advance, the method of 2) will be used. If it is unclear how clip noise occurs, the method 1) may be considered. However, even if clip noise pattern data exists, if the variation is large, the method 1) is desirable.

次に、図2、図6を参照して、フィルタバンク処理部11の構成および動作について詳細に説明する。図2は本実施例に係るフィルタバンク処理部11の構成を示すブロック図である。図6はフィルタバンク処理部11のフィルタバンクの通過特性について説明する図である。図2に示すように、フィルタバンク処理部11はN個のフィルタ群(フィルタバンク)により構成される。フィルタバンクは1個のローパスフィルタ、(N−2)個のバンドパスフィルタ、1個のハイパスフィルタよりなる。入力信号は、各フィルタに同時に入力される。各フィルタについては、出力信号の相関性を求めることもあり、直線位相特性となるFIRフィルタを用いるのがもっとも簡単であるが、位相特性を考慮してIIRフィルタで構成しても良い。次に、各フィルタのカットオフ周波数について説明する。フィルタの周波数特性について、図6の(a)(b)のように2種類の構成法がある。   Next, the configuration and operation of the filter bank processing unit 11 will be described in detail with reference to FIGS. FIG. 2 is a block diagram illustrating a configuration of the filter bank processing unit 11 according to the present embodiment. FIG. 6 is a diagram for explaining the pass characteristics of the filter bank of the filter bank processing unit 11. As shown in FIG. 2, the filter bank processing unit 11 includes N filter groups (filter banks). The filter bank is composed of one low-pass filter, (N−2) band-pass filters, and one high-pass filter. Input signals are simultaneously input to the filters. For each filter, the correlation of the output signal may be obtained, and it is simplest to use an FIR filter having a linear phase characteristic. However, an IIR filter may be used in consideration of the phase characteristic. Next, the cutoff frequency of each filter will be described. Regarding the frequency characteristics of the filter, there are two types of configuration methods as shown in FIGS.

(a)通過帯域をオーバラップさせる
この場合、図6(a)に示すとおり各フィルタのカットオフ周波数は隣接するフィルタの通過帯域の中心周波数となる。つまりi番目のフィルタの低域のカットオフ周波数をFl、高域のカットオフ周波数をFh、中心周波数をFcとすると
(A) In this case, the passbands are overlapped. As shown in FIG. 6A, the cutoff frequency of each filter is the center frequency of the passbands of adjacent filters. In other words, if the i-th filter has a low-pass cutoff frequency Fl i , a high-pass cutoff frequency Fh i , and a center frequency Fc i.

Figure 0005480842
となる。
Figure 0005480842
It becomes.

(b)通過帯域をオーバラップさせない
この場合、図6(b)に示すとおり各フィルタの低域のカットオフ周波数は低域側で隣接するフィルタの高域のカットオフ周波数と同じになる。また、各フィルタの高域のカットオフ周波数は高域側で隣接するフィルタの低域のカットオフ周波数と同じになる。つまり
(B) The passbands are not overlapped. In this case, as shown in FIG. 6B, the low-frequency cutoff frequency of each filter is the same as the high-frequency cutoff frequency of the adjacent filter on the low frequency side. Further, the high-frequency cutoff frequency of each filter is the same as the low-frequency cutoff frequency of the adjacent filter on the high frequency side. That is

Figure 0005480842
となる。
Figure 0005480842
It becomes.

(a)(b)の何れが適するかは、入力信号の種別や、目的によって変わる。入力信号が音声であり、人が聞いて気になるクリップ音を検出したいのが目的であれば、(a)の形としてフィルタの中心周波数を周波数帯域の等分割点とするのではなく、聴覚的なメル周波数軸上での等分割点とするのが望ましい。入力信号が音楽で、ディジタル処理上問題となるクリップノイズを検出したい場合は、(b)の形として中心周波数は直線周波数軸上での等分割点とすることができる。 Which of (a) and (b) is suitable depends on the type and purpose of the input signal. If the input signal is voice and the purpose is to detect a clip sound that a person is interested in hearing, the center frequency of the filter is not set as an equal division point of the frequency band as shown in (a), but the auditory sense It is desirable to set equal division points on a typical mel frequency axis. When the input signal is music and it is desired to detect clip noise that is a problem in digital processing, the center frequency can be set to an equal division point on the linear frequency axis as shown in (b).

次に、図3、図5を参照して、直交検波部12の構成および動作について詳細に説明する。図3は本実施例に係る直交検波部12の構成を示すブロック図である。図3に示すように、直交検波部12は直交検波手段12−aと、ローパス手段12−bとを備える。直交検波とは、信号の時間的な処理により解析信号を求める方法の一つである。一般的には以下の式で表現される。   Next, the configuration and operation of the quadrature detection unit 12 will be described in detail with reference to FIGS. 3 and 5. FIG. 3 is a block diagram illustrating a configuration of the quadrature detection unit 12 according to the present embodiment. As shown in FIG. 3, the quadrature detection unit 12 includes quadrature detection means 12-a and low-pass means 12-b. Quadrature detection is one method for obtaining an analytic signal by temporal processing of a signal. Generally, it is expressed by the following formula.

Figure 0005480842
Figure 0005480842

ここでx(t)は入力信号、ωは周波数移動量である。B(t)に対しローパスフィルタにより入力信号の帯域巾の半分より上の帯域をカットすることで、複素解析信号が得られる。当該複素解析信号の振幅が瞬時振幅の推定値となる。直交検波手段12−aは、tを時刻として、N個のサブバンド信号を入力とし、任意のi(i=1,2,3,…,N)について、i番目のサブバンド信号x(t)と対応するi番目のフィルタの中心周波数をFcとした場合に、B(t)=x(t)exp(−jFct)を計算して、当該B(t)を出力する(SS12a)。ローパス手段12−bは、任意のiについて、前記B(t)を入力とし、当該B(t)に、ローパスフィルタリングを施し、複素解析信号A(t)を出力する(SS12b)。 Here, x (t) is an input signal, and ω k is a frequency shift amount. A complex analysis signal is obtained by cutting a band above half of the bandwidth of the input signal with a low-pass filter with respect to B (t). The amplitude of the complex analysis signal is an estimated value of the instantaneous amplitude. Orthogonal detection means 12-a, as a time of t, as input N sub-band signals, any i (i = 1,2,3, ..., N) for, i th sub-band signals x i ( When the center frequency of the i-th filter corresponding to t) is Fc i , B i (t) = x i (t) exp (−jFc i t) is calculated and B i (t) is calculated. Output (SS12a). The low-pass means 12-b receives the B i (t) for an arbitrary i, performs low-pass filtering on the B i (t), and outputs a complex analysis signal A i (t) (SS12b).

次に、図4、図5を参照して、クリップ強度計算部13の構成および動作について詳細に説明する。図4は本実施例に係るクリップ強度計算部13の構成を示すブロック図である。図4に示すように、クリップ強度計算部13は、相関値計算手段13−aと、強度値計算手段13−bとを備える。相関値計算手段13−aは、N個の複素解析信号(A(t)、A(t)、…、A(t))を入力とし、任意のk(k=1,2,3,…,N−1)に対して、 Next, the configuration and operation of the clip strength calculation unit 13 will be described in detail with reference to FIGS. 4 and 5. FIG. 4 is a block diagram illustrating the configuration of the clip strength calculation unit 13 according to the present embodiment. As shown in FIG. 4, the clip strength calculation unit 13 includes a correlation value calculation unit 13-a and an intensity value calculation unit 13-b. Correlation value calculation means 13-a receives N complex analysis signals (A 1 (t), A 2 (t),..., A N (t)) and inputs any k (k = 1, 2, 3, ..., N-1)

Figure 0005480842
Figure 0005480842

を計算して、当該R(t)を相関値として出力する(SS13a)。強度値計算手段13−bは、(k=1,2,3,…,N−1)について、前記相関値R(t)を入力とし、kを予め定めた係数として、 And the R k (t) is output as a correlation value (SS13a). The intensity value calculation means 13-b receives the correlation value R k (t) for (k = 1, 2, 3,..., N−1) and uses k 0 as a predetermined coefficient.

Figure 0005480842
Figure 0005480842

を計算して、当該C(t)をクリップ強度値として出力する(SS13b)。ここで、kは、入力信号の種別によって適切に設定すべきであるが、5からN−5までの値とするのが望ましい。前述したように、判定部14は、クリップ強度値を入力とし、当該クリップ強度値が予め定めた閾値を超過する場合に、当該超過が発生した時刻をクリップノイズ発生時刻として出力する(S14)。 And C (t) is output as a clip strength value (SS13b). Here, k 0 should be appropriately set according to the type of the input signal, but is preferably a value from 5 to N-5. As described above, the determination unit 14 receives the clip strength value, and when the clip strength value exceeds a predetermined threshold, outputs the time when the excess has occurred as the clip noise occurrence time (S14).

図7を用いて、本実施例のクリップノイズ検出装置10にて実際に検出されたクリップノイズについて説明する。図7はクリップノイズ発生時刻検出例を示す図である。図7(a)は、入力信号の例である。図7(b)は、(a)の入力信号にフィルタバンク処理(S11)を施したサブバンド信号の一つを例示している。図7(c)は、(b)のサブバンド信号について、直交検波(SS12a)後に、ローパスフィルタリングを施して(SS12b)得られた複素解析信号の瞬時振幅を例示している。図7(d)は、(c)の複素解析信号の相関値を計算し(SS13a)、当該相関値の平均値から求めたクリップ強度値(SS13b)を例示している。図7(d)の太実線で示すように、予め閾値(教師なし、教師ありのいずれか)を設定しておき、当該閾値を超えるクリップ強度値を示す時刻をクリップノイズ発生時刻として検出することができる。図7(a)のクリップ箇所と、図7(d)のクリップ推定位置とがほぼ一致していることから、本実施例のクリップノイズ検出装置10は、正確にクリップノイズ発生時刻を検出可能であることが分かる。   The clip noise actually detected by the clip noise detection apparatus 10 of the present embodiment will be described with reference to FIG. FIG. 7 is a diagram showing an example of clip noise occurrence time detection. FIG. 7A shows an example of an input signal. FIG. 7B illustrates one of the subband signals obtained by performing filter bank processing (S11) on the input signal of FIG. FIG. 7C illustrates the instantaneous amplitude of the complex analysis signal obtained by performing low-pass filtering (SS12b) after quadrature detection (SS12a) on the subband signal of (b). FIG. 7D illustrates the clip strength value (SS13b) obtained by calculating the correlation value of the complex analysis signal of (c) (SS13a) and calculating from the average value of the correlation values. As shown by a thick solid line in FIG. 7D, a threshold (either unsupervised or supervised) is set in advance, and a time indicating a clip intensity value exceeding the threshold is detected as a clip noise occurrence time. Can do. Since the clip location in FIG. 7A and the estimated clip position in FIG. 7D substantially coincide, the clip noise detection apparatus 10 of this embodiment can accurately detect the clip noise occurrence time. I know that there is.

このように、本実施例のクリップノイズ検出装置10は、入力信号を複数の帯域に分割し、帯域毎の検波信号の全体または一部の相関性を見ることで、クリップノイズ特有の全帯域に渡って雑音が重畳される現象を捕捉することが可能となる。通常の音楽信号や音声信号は、帯域の一部に信号が存在しており、全帯域に渡って信号が存在することはない。一方、単純な雑音(ホワイトノイズ)の場合は、全帯域に信号が存在するが、各帯域の信号特性はランダムであり、相関性はない。従って、帯域分割した信号の相関性を計算し、相関性が高いものを検出することで、正確にクリップノイズ発生時刻を検出することができる。また、帯域分割処理及び、帯域分割後の信号の瞬時振幅の推定を全て時間軸上でのフィルタ処理等で実行することで、時間分解能を高くすることができる。そのため、非常に瞬時的なクリップの場合でも検出が可能となる。   As described above, the clip noise detection apparatus 10 according to the present embodiment divides the input signal into a plurality of bands, and observes all or a part of the correlation of the detection signals for each band, so that the clip noise is detected in all bands. It is possible to capture a phenomenon in which noise is superimposed across. A normal music signal or audio signal has a signal in a part of the band, and the signal does not exist over the entire band. On the other hand, in the case of simple noise (white noise), signals exist in all bands, but the signal characteristics of each band are random and have no correlation. Therefore, the clip noise occurrence time can be accurately detected by calculating the correlation of the band-divided signal and detecting the one having a high correlation. Also, the time resolution can be increased by executing all the band division processing and the estimation of the instantaneous amplitude of the signal after the band division by the filter processing on the time axis. For this reason, even a very instantaneous clip can be detected.

また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。   In addition, the various processes described above are not only executed in time series according to the description, but may be executed in parallel or individually according to the processing capability of the apparatus that executes the processes or as necessary. Needless to say, other modifications are possible without departing from the spirit of the present invention.

また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。   Further, when the above-described configuration is realized by a computer, processing contents of functions that each device should have are described by a program. The processing functions are realized on the computer by executing the program on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。   The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。   The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。   A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   In this embodiment, the present apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.

Claims (8)

クリップノイズ発生時刻を検出するクリップノイズ検出装置であって、
信号を入力とし、当該入力信号をN個(Nは2以上の整数)のフィルタからなるフィルタバンクを通過させて、N個のサブバンド信号を出力するフィルタバンク処理部と、
前記N個のサブバンド信号を入力とし、当該N個のサブバンド信号に直交検波を行って、N個の複素解析信号を出力する直交検波部と、
前記N個の複素解析信号を入力とし、前記N個の複素解析信号から選択した任意の2個の複素解析信号の相関関係を求め、当該求められた相関関係から時刻ごとにクリップ強度値を計算し、当該計算されたクリップ強度値を出力するクリップ強度計算部と、
前記クリップ強度値を入力とし、当該クリップ強度値が予め定めた閾値を超過する場合に、当該超過が発生した時刻をクリップノイズ発生時刻として出力する判定部と
を備えることを特徴とするクリップノイズ検出装置。
A clip noise detection device for detecting clip noise occurrence time,
A filter bank processing unit that takes a signal as an input, passes the input signal through a filter bank including N (N is an integer of 2 or more) filters, and outputs N subband signals;
A quadrature detection unit that receives the N subband signals, performs quadrature detection on the N subband signals, and outputs N complex analysis signals;
Using the N complex analysis signals as input, obtain the correlation between any two complex analysis signals selected from the N complex analysis signals, and calculate the clip strength value for each time from the obtained correlation A clip strength calculation unit for outputting the calculated clip strength value;
A clip noise detection comprising: a determination unit that receives the clip intensity value as input and outputs a time when the excess occurs as a clip noise occurrence time when the clip intensity value exceeds a predetermined threshold value apparatus.
請求項1に記載のクリップノイズ検出装置であって、
前記直交検波部が、
tを時刻として、前記N個のサブバンド信号を入力とし、任意のi(i=1,2,3,…,N)について、i番目のサブバンド信号x(t)と対応するi番目のフィルタの中心周波数をFcとした場合に、B(t)=x(t)exp(−jFct)を計算して、当該B(t)を出力する直交検波手段と、
任意のiについて、前記B(t)を入力とし、当該B(t)に、ローパスフィルタリングを施し、複素解析信号A(t)を出力するローパス手段と
を備えることを特徴とするクリップノイズ検出装置。
The clip noise detection device according to claim 1,
The orthogonal detection unit is
t is time, and the N subband signals are input. For any i (i = 1, 2, 3,..., N), i-th corresponding to the i-th subband signal x i (t) the center frequency of the filter when the Fc i, and orthogonal detection means to calculate a B i (t) = x i (t) exp (-jFc i t), and outputs the B i (t),
For any i, clip as input the B i (t), to the B i (t), subjected to low-pass filtering, characterized in that it comprises a low-pass means for outputting a complex analytic signal A i (t) Noise detection device.
請求項1または2に記載のクリップノイズ検出装置であって、
前記クリップ強度計算部は、
前記N個の複素解析信号(A(t)、A(t)、…、A(t))を入力とし、任意のk(k=1,2,3,…,N−1)に対して、
Figure 0005480842
を計算して、当該R(t)を相関値として出力する相関値計算手段と、
(k=1,2,3,…,N−1)について、前記相関値R(t)を入力とし、kを予め定めた係数として、
Figure 0005480842
を計算して、当該C(t)をクリップ強度値として出力する強度値計算手段と、
を備えることを特徴とするクリップノイズ検出装置。
The clip noise detection device according to claim 1 or 2,
The clip strength calculator
The N complex analysis signals (A 1 (t), A 2 (t),..., A N (t)) are input and arbitrary k (k = 1, 2, 3,..., N−1). Against
Figure 0005480842
And a correlation value calculation means for outputting R k (t) as a correlation value;
For (k = 1, 2, 3,..., N−1), the correlation value R k (t) is input, and k 0 is a predetermined coefficient.
Figure 0005480842
Intensity value calculating means for calculating C (t) as a clip intensity value;
A clip noise detection apparatus comprising:
請求項1から3の何れかに記載のクリップノイズ検出装置であって、
前記閾値を教師あり学習により予め学習しておくことを特徴とするクリップノイズ検出装置。
The clip noise detection device according to any one of claims 1 to 3,
A clip noise detection apparatus, wherein the threshold is learned in advance by supervised learning.
クリップノイズ発生時刻を検出するクリップノイズ検出方法であって、
信号を入力とし、当該入力信号をN個(Nは2以上の整数)のフィルタからなるフィルタバンクを通過させて、N個のサブバンド信号を出力するフィルタバンク処理ステップと、
前記N個のサブバンド信号を入力とし、当該N個のサブバンド信号に直交検波を行って、N個の複素解析信号を出力する直交検波ステップと、
前記N個の複素解析信号を入力とし、前記N個の複素解析信号から選択した任意の2個の複素解析信号の相関関係を求め、当該求められた相関関係から時刻ごとにクリップ強度値を計算し、当該計算されたクリップ強度値を出力するクリップ強度計算ステップと、
前記クリップ強度値を入力とし、当該クリップ強度値が予め定めた閾値を超過する場合に、当該超過が発生した時刻をクリップノイズ発生時刻として出力する判定ステップと
を備えることを特徴とするクリップノイズ検出方法。
A clip noise detection method for detecting clip noise occurrence time,
A filter bank processing step that takes a signal as an input, passes the input signal through a filter bank composed of N (N is an integer of 2 or more) filters, and outputs N subband signals;
A quadrature detection step for receiving the N subband signals, performing quadrature detection on the N subband signals, and outputting N complex analysis signals;
Using the N complex analysis signals as input, obtain the correlation between any two complex analysis signals selected from the N complex analysis signals, and calculate the clip strength value for each time from the obtained correlation A clip strength calculation step for outputting the calculated clip strength value;
A clip noise detection comprising: a step of receiving the clip strength value as input and outputting a time when the excess occurs as a clip noise occurrence time when the clip strength value exceeds a predetermined threshold value Method.
請求項5に記載のクリップノイズ検出方法であって、
前記直交検波ステップが、
tを時刻として、前記N個のサブバンド信号を入力とし、任意のi(i=1,2,3,…,N)について、i番目のサブバンド信号x(t)と対応するi番目のフィルタの中心周波数をFcとした場合に、B(t)=x(t)exp(−jFct)を計算して、当該B(t)を出力する直交検波サブステップと、
任意のiについて、前記B(t)を入力とし、当該B(t)に、ローパスフィルタリングを施し、複素解析信号A(t)を出力するローパスサブステップと
を備えることを特徴とするクリップノイズ検出方法。
The clip noise detection method according to claim 5,
The orthogonal detection step includes:
t is time, and the N subband signals are input. For any i (i = 1, 2, 3,..., N), i-th corresponding to the i-th subband signal x i (t) the center frequency of the filter when the Fc i, B i (t) = x i (t) exp a (-jFc i t) calculated, a quadrature detection substep of outputting the B i (t) ,
And a low-pass sub-step for inputting B i (t) for an arbitrary i, performing low-pass filtering on the B i (t), and outputting a complex analysis signal A i (t). Clip noise detection method.
請求項5または6に記載のクリップノイズ検出方法であって、
前記クリップ強度計算ステップは、
前記N個の複素解析信号(A(t)、A(t)、…、A(t))を入力とし、任意のk(k=1,2,3,…,N−1)に対して、
Figure 0005480842
を計算して、当該R(t)を相関値として出力する相関値計算サブステップと、
(k=1,2,3,…,N−1)について、前記相関値R(t)を入力とし、kを予め定めた係数として、
Figure 0005480842
を計算して、当該C(t)をクリップ強度値として出力する強度値計算サブステップと、
を備えることを特徴とするクリップノイズ検出方法。
The clip noise detection method according to claim 5 or 6,
The clip strength calculation step includes:
The N complex analysis signals (A 1 (t), A 2 (t),..., A N (t)) are input and arbitrary k (k = 1, 2, 3,..., N−1). Against
Figure 0005480842
And a correlation value calculation sub-step for outputting the R k (t) as a correlation value;
For (k = 1, 2, 3,..., N−1), the correlation value R k (t) is input, and k 0 is a predetermined coefficient.
Figure 0005480842
And calculating an intensity value sub-step for outputting the C (t) as a clip intensity value;
A clip noise detection method comprising:
コンピュータを請求項1から4のいずれかに記載のクリップノイズ検出装置として機能させるためのプログラム。   The program for functioning a computer as a clip noise detection apparatus in any one of Claim 1 to 4.
JP2011096918A 2011-04-25 2011-04-25 Clip noise detection device, clip noise detection method, program Expired - Fee Related JP5480842B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011096918A JP5480842B2 (en) 2011-04-25 2011-04-25 Clip noise detection device, clip noise detection method, program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011096918A JP5480842B2 (en) 2011-04-25 2011-04-25 Clip noise detection device, clip noise detection method, program

Publications (2)

Publication Number Publication Date
JP2012230160A JP2012230160A (en) 2012-11-22
JP5480842B2 true JP5480842B2 (en) 2014-04-23

Family

ID=47431775

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011096918A Expired - Fee Related JP5480842B2 (en) 2011-04-25 2011-04-25 Clip noise detection device, clip noise detection method, program

Country Status (1)

Country Link
JP (1) JP5480842B2 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0462599A (en) * 1990-07-02 1992-02-27 N T T Data Tsushin Kk Noise removing device
JP3436614B2 (en) * 1995-08-07 2003-08-11 フクダ電子株式会社 Audio signal conversion device and ultrasonic diagnostic device
JP2005100598A (en) * 2003-08-20 2005-04-14 Sony Corp Signal processing method and signal processor
JP4760278B2 (en) * 2005-10-04 2011-08-31 株式会社ケンウッド Interpolation device, audio playback device, interpolation method, and interpolation program
JP4971010B2 (en) * 2007-03-31 2012-07-11 国立大学法人 東京大学 Sound crack detection device and sound crack detection method
JP2010244602A (en) * 2009-04-03 2010-10-28 Sony Corp Signal processing device, method, and program

Also Published As

Publication number Publication date
JP2012230160A (en) 2012-11-22

Similar Documents

Publication Publication Date Title
RU2596592C2 (en) Spatial audio processor and method of providing spatial parameters based on acoustic input signal
US9161126B2 (en) Systems and methods for protecting a speaker
EP2628317B1 (en) Automatic equalization using adaptive frequency-domain filtering and dynamic fast convolution
JP5730881B2 (en) Adaptive dynamic range enhancement for recording
US9025781B2 (en) Sound quality evaluation apparatus and method thereof
KR20190069537A (en) Distortion detection, prevention, and distortion-cognitive base enhancement
Esquef et al. Edit detection in speech recordings via instantaneous electric network frequency variations
KR102545961B1 (en) Multi-Rate System for Audio Processing
JP4740609B2 (en) Voiced and unvoiced sound detection apparatus and method
US20160014507A1 (en) Systems and methods for protecting a speaker
JP2013512474A (en) Apparatus and method for acoustic communication
EP2042000B1 (en) Method and device for diagnosing the operating state of a sound system
CN104937955B (en) Automatic loud speaker Check up polarity
WO2011036815A1 (en) Monitoring device
JP2008076636A (en) Audio signal interpolation method and audio signal interpolation device
CN113329315B (en) Detection method, device and equipment of audio playing equipment and storage medium
CN107645696A (en) One kind is uttered long and high-pitched sounds detection method and device
JP5782402B2 (en) Voice quality objective evaluation apparatus and method
JP6578221B2 (en) Diagnostic assistance device, diagnostic assistance system, diagnostic assistance method, and diagnostic assistance program
JP5774191B2 (en) Method and apparatus for attenuating dominant frequencies in an audio signal
JP5480842B2 (en) Clip noise detection device, clip noise detection method, program
Patole et al. Reverberation based tampering detection in audio recordings
CN114627897A (en) Audio signal abnormality monitoring method, apparatus, device, medium, and program product
JP6370725B2 (en) Waveform data collection device, water leakage determination device, water leakage determination system, and program for water leakage determination
CN114705286B (en) Machine jolt detection method, device, computer and readable storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130710

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140214

R150 Certificate of patent or registration of utility model

Ref document number: 5480842

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees