JP6229576B2 - Sampling frequency estimation device - Google Patents
Sampling frequency estimation device Download PDFInfo
- Publication number
- JP6229576B2 JP6229576B2 JP2014077380A JP2014077380A JP6229576B2 JP 6229576 B2 JP6229576 B2 JP 6229576B2 JP 2014077380 A JP2014077380 A JP 2014077380A JP 2014077380 A JP2014077380 A JP 2014077380A JP 6229576 B2 JP6229576 B2 JP 6229576B2
- Authority
- JP
- Japan
- Prior art keywords
- sampling frequency
- frame
- signal
- correction target
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
この発明は、同じ波形を各々別個にサンプリングして得られる複数の信号の同期技術に関する。 The present invention relates to a technique for synchronizing a plurality of signals obtained by separately sampling the same waveform.
近年では、ICレコーダなどの手軽にデジタル録音を行える録音機器や、スマートフォンのようにデジタル録音と同時に録画も行える機器が一般に普及している。ここでデジタル録音とは、音波形をサンプリングして得られるサンプル列の形式で音信号を記録することを言う。スマートフォンを用いて例えばライブ演奏の動画と演奏音を奏者から離れた場所で録音しつつ、奏者の近くに置かれたICレコーダで演奏音を録音し、スマートフォンにより録音された演奏音をICレコーダにより録音された演奏音に差し替えて(或いは前者に後者を重ね合わせて)再生する、といったことも行われている。一般にデバイスの設定で全ての録音機器のサンプリング周波数を同一に設定していたとしても、各録音機器のサンプリング周波数には微細なバラツキが生じてしまう。これはサンプリング周波数を決めるクロック・ジェネレータが完全に同一のクロック周波数で動作しないことに起因する。したがって、同じ音波形を複数の録音機器で別個独立にデジタル録音する場合、たとえ録音開始タイミングを揃えたとしても、録音機器毎にサンプリング周波数が異なるために、サンプリングタイミングに時々刻々とズレが生じてしまう。このようなサンプリング周波数のズレを補正する技術としては、特許文献1、非特許文献1および非特許文献2の各先行技術文献に開示の技術が挙げられる。
In recent years, recording devices that can easily perform digital recording, such as IC recorders, and devices that can simultaneously record digital recording, such as smartphones, have become popular. Here, digital recording refers to recording a sound signal in the form of a sample sequence obtained by sampling a sound waveform. For example, while recording a live performance video and performance sound away from the player using a smartphone, the performance sound is recorded with an IC recorder placed near the player, and the performance sound recorded by the smartphone is recorded with the IC recorder. In some cases, the recorded performance sound is replaced (or the former is overlaid with the latter). In general, even if the sampling frequencies of all the recording devices are set to be the same in the device settings, fine variations occur in the sampling frequencies of the recording devices. This is due to the fact that the clock generator that determines the sampling frequency does not operate at the exact same clock frequency. Therefore, when the same sound waveform is separately digitally recorded by multiple recording devices, even if the recording start timing is aligned, the sampling frequency varies from recording device to recording device. End up. As a technique for correcting the deviation of the sampling frequency, there are techniques disclosed in the prior art documents of
非特許文献1には、送信機から基準信号(パイロット信号)を送出し、受信機側で受信した信号に含まれる基準信号からサンプリング周波数ズレによる周波数シフトを検出し、補正する技術が開示されている。特許文献1には、音場の伝達特性を計測するときに計測信号(TSP信号など)を送出する側と、受信する側でサンプリング周波数が異なってしまう場合の補正技術が開示されている。特許文献1に開示の技術では、計測時に雑音の影響を抑制するためにTSP信号を繰り返し送出し、測定した複数のTSP信号を一定時間ごとに切出し、このようにして切り出した各TSP信号の位相差を検出することでサンプリング周波数ズレを推定し補正している。
非特許文献2には、複数の録音機器間のサンプリング周波数のズレを統計信号処理を利用して補正する技術が開示されている。非特許文献2に開示の技術では、まず、複数の録音機器により録音された各録音信号に対して基準信号を定める。そして、その基準信号に対してサンプリング周波数がズレていた場合の信号を統計的にモデル化し、基準信号以外の信号を統計的モデルに当てはめることでサンプリング周波数のズレを推定している。 Non-Patent Document 2 discloses a technique for correcting a sampling frequency shift between a plurality of recording devices using statistical signal processing. In the technique disclosed in Non-Patent Document 2, first, a reference signal is determined for each recording signal recorded by a plurality of recording devices. Then, a signal when the sampling frequency is shifted from the reference signal is statistically modeled, and a signal other than the reference signal is applied to the statistical model to estimate the sampling frequency shift.
しかし、非特許文献1に開示の技術や特許文献1に開示の技術には、制約が多く、汎用性に欠けるといった問題がある。例えば、非特許文献1に開示の技術には、基準信号(パイロット信号)を発生する装置が必要になり、また、基準信号によって録音信号に影響が生じてしまう、といった問題がある。一方、特許文献1に開示の技術には、同一の信号が一定間隔で繰り返し送出されるという条件でなければ利用することができない、といった問題がある。これに対して、非特許文献2には、汎用性に欠けるといった問題はないものの、その実行には多大な計算量を要し、サンプリング周波数ズレの推定を完了するまでに要する計算時間が長い、とった問題がある。
However, the technique disclosed in
本発明は以上に説明した課題に鑑みて為されたものであり、同じ波形を別個独立にサンプリングして得られる複数の信号の同期を従来よりも短い計算時間で実現することが可能で、かつ高い汎用性を有する技術を提供することを目的とする。 The present invention has been made in view of the problems described above, and it is possible to realize synchronization of a plurality of signals obtained by independently sampling the same waveform in a shorter calculation time than in the past, and It aims at providing the technology which has high versatility.
上記課題を解決するために本発明は、同じ波形を別個独立にサンプリングして得られる複数の信号のうちの1つを基準信号とし、残りの信号のうちの1つを補正対象信号として、前記基準信号と前記補正対象信号の一方を時間軸方向にずらしつつ両信号の相関をフレーム毎に算出し、その算出結果に応じて両信号の時間ズレ量をフレーム毎に算出する時間ズレ量算出部と、前記時間ズレ量算出部により算出された時間ズレ量から、各フレームにおける前記補正対象信号のサンプリング周波数の誤差の推定値である第1の推定値をフレーム毎に算出する誤差算出部と、前記誤差算出部によりフレーム毎に算出された前記第1の推定値に統計処理を施して前記補正対象信号全体に亘るサンプリング周波数の誤差の推定値である第2の推定値を算出し出力する統計処理部と、を有することを特徴とするサンプリング周波数推定装置、を提供する。なお、補正対象信号のサンプリング周波数の誤差は基準信号のサンプリング周波数からの補正対象信号のサンプリング周波数のズレであるから、当該誤差と基準信号のサンプリング周波数とから補正対象信号のサンプリング周波数を求めることができる。したがって、当該誤差の推定値を算出すること(すなわち、当該誤差を推定すること)は補正対象信号のサンプリング周波数を推定することと等価である。 In order to solve the above problem, the present invention uses one of a plurality of signals obtained by sampling the same waveform separately and independently as a reference signal, and one of the remaining signals as a correction target signal. A time shift amount calculation unit that calculates the correlation between both signals for each frame while shifting one of the reference signal and the correction target signal in the time axis direction, and calculates the time shift amount of both signals for each frame according to the calculation result An error calculation unit that calculates, for each frame, a first estimated value that is an estimated value of the sampling frequency error of the correction target signal in each frame from the time shift amount calculated by the time shift amount calculation unit; Statistical processing is performed on the first estimated value calculated for each frame by the error calculating unit to calculate a second estimated value that is an estimated value of the sampling frequency error over the entire correction target signal. Providing sampling frequency estimating apparatus, characterized by having a statistical processing unit for outputting. Since the error in the sampling frequency of the correction target signal is a deviation of the sampling frequency of the correction target signal from the sampling frequency of the reference signal, the sampling frequency of the correction target signal can be obtained from the error and the sampling frequency of the reference signal. it can. Therefore, calculating the estimated value of the error (that is, estimating the error) is equivalent to estimating the sampling frequency of the correction target signal.
このようなサンプリング周波数推定装置によれば、同じ波形を別個独立にサンプリングして得られる複数の信号のうちの1つを基準信号とし、残りの信号の各々を補正対象信号として各補正対象信号のサンプリング周波数の誤差の推定値を算出し、時間軸圧伸などの既存の技術を用いてその誤差を補正することで、各補正対象信号を基準信号に同期させることが可能になる。本発明のサンプリング周波数推定装置では、パイロット信号を必要とせず、また各信号は一定時間に亙って繰り返し出力されたものである必要もないため、非特許文献1や特許文献1に開示の技術に比較して汎用性が高い。また詳細については後述するが、本発明のサンプリング周波数推定装置によれば非特許文献2に開示の技術を用いた場合よりも短い計算時間で補正対象信号のサンプリング周波数の誤差を算出することができ、同じ波形を別個独立にサンプリングして得られる複数の信号の同期を従来よりも短い計算時間で実現することが可能になる。
According to such a sampling frequency estimation device, one of a plurality of signals obtained by independently sampling the same waveform is used as a reference signal, and each of the remaining signals is used as a correction target signal. By calculating an estimated value of the sampling frequency error and correcting the error using an existing technique such as time axis companding, it becomes possible to synchronize each correction target signal with the reference signal. The sampling frequency estimation apparatus of the present invention does not require a pilot signal, and each signal does not need to be repeatedly output over a certain period of time. Therefore, the technology disclosed in
統計処理部の具体的な構成としては、誤差算出部によりフレーム毎に算出された第1の推定値(すなわち、各フレームにおける大まかな誤差の推定値)から、統計的にエラーを多く含むと推定される外れ値を除外する第1の統計フィルタ処理と、第1の統計フィルタ処理より外れ値が除外された一群の第1の推定値を平滑化するフィルタ処理(例えば、平均値を算出する処理)と当該一群の第1の推定値から代表値を選択するフィルタ処理(例えば、中央値を選択する処理)の何れか一方からなる第2の統計フィルタ処理とで上記統計処理を構成し、第2の統計フィルタ処理の処理結果を第2の推定値(補正対象信号全体に亘るサンプリング周波数の誤差の推定値)として出力する構成が考えられる。 As a specific configuration of the statistical processing unit, it is estimated that there are statistically many errors from the first estimated value calculated for each frame by the error calculating unit (that is, an estimated value of a rough error in each frame). First statistical filter processing for excluding outliers to be performed, and filter processing for smoothing a group of first estimated values from which outliers have been excluded from the first statistical filter processing (for example, processing for calculating an average value) ) And a second statistical filter process consisting of any one of a filter process for selecting a representative value from the group of first estimated values (for example, a process for selecting a median value), A configuration is conceivable in which the processing result of the second statistical filter processing is output as a second estimated value (estimated value of sampling frequency error over the entire correction target signal).
第1の統計フィルタ処理の具体例としては、誤差算出部によりフレーム毎に算出された第1の推定値をその大きさ順にソートした場合における両端から所定個数分、または両端から所定個数番目の各値に応じて定まる範囲に属さないもの、を外れ値として除去する処理が挙げられる。例えば、上記所定個数が誤差算出部により算出された第1の推定値の総数の1/4であれば、第1四分位数未満の値と第3四分位数より大きい値を外れ値として除外することになる。また、第1四分位数および第3四分位数に重みを付与して上記範囲を定める態様であれば所謂四分位数範囲法により外れ値を除外することになる。 As a specific example of the first statistical filter processing, each of the first estimated value calculated for each frame by the error calculation unit when the first estimated value is sorted in order of the size, or a predetermined number from the both ends. There is a process of removing those that do not belong to the range determined according to the value as outliers. For example, if the predetermined number is 1/4 of the total number of the first estimated values calculated by the error calculating unit, a value less than the first quartile and a value greater than the third quartile are outliers. Will be excluded. In addition, outliers are excluded by the so-called quartile range method if weights are assigned to the first and third quartiles to define the above range.
より好ましい態様においては、時間ズレ量算出部は、基準信号および補正対象信号のパワーが所定の閾値未満であるフレームを時間ズレ量の算出対象から除外することを特徴とする。上記閾値を適切な値に定めておけば、基準信号を充分な強度で含んでいないフレームや補正対象信号を充分な強度で含んでいないフレームは時間ズレ量の算出対象から除外される。基準信号を充分な強度で含んでいないフレームや補正対象信号を充分な強度で含んでいないフレームを参照して時間ズレ量を算出したとしてもエラーを多く含むものとなってしまう。このような時間ズレ量に基づいて算出された誤差の推定値は外れ値として第1の統計フィルタ処理で除外される可能性が高く、そもそも時間ズレ量の算出自体が無駄になってしまう。このような態様によれば、時間ズレ量算出部において無駄な演算が行われることを回避して補正対象信号のサンプリング周波数の推定に要する処理時間をさらに短くしつつ、サンプリング周波数の誤差を高い精度で算出することが可能になる。 In a more preferred aspect, the time deviation amount calculation unit is characterized in that a frame in which the power of the reference signal and the correction target signal is less than a predetermined threshold is excluded from the time deviation amount calculation target. If the threshold is set to an appropriate value, a frame that does not include the reference signal with sufficient intensity and a frame that does not include the correction target signal with sufficient intensity are excluded from the calculation target of the amount of time deviation. Even if the amount of time shift is calculated with reference to a frame that does not include the reference signal with sufficient intensity or a frame that does not include the correction target signal with sufficient intensity, it includes many errors. The estimated error value calculated based on such a time shift amount is likely to be excluded by the first statistical filter process as an outlier, and the calculation of the time shift amount itself becomes useless in the first place. According to such an aspect, it is possible to avoid a wasteful calculation in the time shift amount calculation unit and further reduce the processing time required for estimating the sampling frequency of the correction target signal, while reducing the sampling frequency error with high accuracy. It becomes possible to calculate by.
また、別の好ましい態様においては、時間ズレ量算出部は、基準信号と補正対象信号の相関を表す値(例えば、時間をずらしつつ算出した複数の相互相関関数のうちの最大値)が所定の閾値を下回るフレームを時間ズレ量の算出対象から除外することを特徴とする。上記閾値を適切な値に定めておけば、補正対象信号を構成するフレームのうち基準信号にて対応するフレームとの相関が低いフレームについて時間ズレ量の算出が行われることはない。このようなフレームについて時間ズレ量を算出したとしてもエラーを多く含むものとなってしまい、このような時間ズレ量に基づいて算出された誤差の推定値は外れ値として上記第1の統計フィルタ処理にて除外される可能性が高く、そもそも時間ズレ量の算出自体が無駄になってしまう。このような態様によっても、時間ズレ量算出部において無駄な演算が行われることを回避し補正対象信号のサンプリング周波数の推定に要する処理時間をさらに短くしつつ、サンプリング周波数を高い精度で算出することが可能になる。 In another preferred embodiment, the time deviation amount calculation unit has a value representing a correlation between the reference signal and the correction target signal (for example, a maximum value among a plurality of cross-correlation functions calculated while shifting the time). Frames that are less than the threshold value are excluded from the calculation target of the time shift amount. If the threshold value is set to an appropriate value, the time shift amount is not calculated for a frame having a low correlation with the frame corresponding to the reference signal among the frames constituting the correction target signal. Even if the time shift amount is calculated for such a frame, it contains a lot of errors, and the error estimated value calculated based on such a time shift amount is regarded as an outlier as the first statistical filter processing. In the first place, the calculation of the amount of time deviation itself becomes useless. Even in such an aspect, it is possible to calculate the sampling frequency with high accuracy while avoiding unnecessary calculation in the time deviation amount calculation unit and further shortening the processing time required to estimate the sampling frequency of the correction target signal. Is possible.
上記課題を解決するための別の態様としては、CPU(Central Processing Unit)などの一般的なコンピュータを、上記時間ズレ量算出部、誤差算出部および統計処理部として機能させるプログラムを提供する態様が考えられる。このようなプログラムにしたがって一般的なコンピュータを作動させることで、当該コンピュータを本発明のサンプリング周波数推定装置として機能させることが可能になるからである。なお、このようなプログラムの具体的な提供態様としては、CD−ROM(Compact Disk-Read Only Memory)などのコンピュータ読み取り可能な記録媒体に当該プログラムを書き込んで配布する態様や、インターネットなどの電気通信回線経由のダウンロードにより配布する態様が考えられる。 As another aspect for solving the above problem, there is an aspect that provides a program that causes a general computer such as a CPU (Central Processing Unit) to function as the time shift amount calculation unit, the error calculation unit, and the statistical processing unit. Conceivable. This is because by operating a general computer according to such a program, it becomes possible to cause the computer to function as the sampling frequency estimation device of the present invention. In addition, as a specific provision mode of such a program, a mode in which the program is written and distributed on a computer-readable recording medium such as a CD-ROM (Compact Disk-Read Only Memory), or an electric communication such as the Internet A mode of distribution by downloading via a line is conceivable.
また、上記課題を解決するためのさらに別の態様としては、同じ波形を別個独立にサンプリングして得られる複数の信号のうちの1つを基準信号とし、残りの信号のうちの1つを補正対象信号として、前記基準信号と前記補正対象信号の一方を時間軸方向にずらしつつ両信号の相互相関関数をフレーム毎に算出し、その算出結果に応じて両信号の時間ズレ量をフレーム毎に算出する時間ズレ量算出ステップと、前記時間ズレ量算算出ステップにて算出された時間ズレ量から、各フレームにおける前記補正対象信号のサンプリング周波数の誤差の推定値をフレーム毎に算出する誤差算出ステップと、誤差算出ステップにてフレーム毎に算出された誤差の推定値に統計処理を施して前記補正対象信号のサンプリング周波数の誤差の推定値を算出し出力する統計処理ステップと、を有することを特徴とするサンプリング周波数推定方法を提供する態様も考えられる。また、CPUなどの一般的なコンピュータに、上記時間ズレ量算出ステップ、上記誤差算出ステップおよび上記統計処理ステップの各ステップを実行させるプログラムを提供する態様も考えられる。 As another mode for solving the above problem, one of a plurality of signals obtained by independently sampling the same waveform is used as a reference signal, and one of the remaining signals is corrected. As a target signal, the cross-correlation function of both signals is calculated for each frame while shifting one of the reference signal and the correction target signal in the time axis direction, and the time shift amount of both signals is calculated for each frame according to the calculation result. A time shift amount calculation step to be calculated, and an error calculation step of calculating, for each frame, an estimated value of the sampling frequency error of the correction target signal in each frame from the time shift amount calculated in the time shift amount calculation step. The error calculation step performs statistical processing on the error estimation value calculated for each frame to calculate the sampling frequency error estimation value of the correction target signal. Aspect to provide a sampling frequency estimation method characterized by comprising: a statistical processing step of force, also conceivable. In addition, a mode is also conceivable in which a program for causing a general computer such as a CPU to execute the steps of the time deviation calculation step, the error calculation step, and the statistical processing step is conceivable.
以下図面を参照しつつ本発明の実施形態を説明する。
(A:構成)
図1は、本発明の一実施形態のサンプリング周波数推定装置10の構成例および同サンプリング周波数推定装置10を含む信号処理システム1の構成例を示すブロック図である。この信号処理システム1には、同じ音波形をN(Nは2以上の自然数)台の録音機器(例えばスマートフォンやICレコーダなど)の各々により別個独立にサンプリングして得られた各音信号(サンプル列)Xn(t)(n=1〜N)が入力される。なお、N台の録音機器における録音開始タイミングの同期については既存技術を適宜用いるようにすれば良い。例えば、各録音機器がインターネットなどの電気通信回線経由の通信を実行可能であれば、当該通信により録音開始タイミングを合せれば良く、Bluetooth(登録商標)など他の通信手段による通信が可能であれば、当該通信手段による通信により録音開始タイミングを合せれば良い。
Embodiments of the present invention will be described below with reference to the drawings.
(A: Configuration)
FIG. 1 is a block diagram illustrating a configuration example of a sampling
上記N台の録音機器におけるサンプリング周波数は何れも同じ値(例えば44.1kHz)に設定されてはいるが、各録音機器のクロック・ジェネレータが完全に同一のクロック周波数で動作する訳ではなく、各録音機器におけるサンプリング周波数には微妙なズレがある。このため、各録音機器で録音開始タイミングを揃えて録音を行い、上記N個の音信号をその先頭を揃えて再生したとしても、次第に音がズレ、再生が進むにつれてそのズレは大きくなる。本実施形態の信号処理システム1は、上記N個の音信号間のサンプリング周波数の誤差を推定して補正し、これらN個の音信号を同期させることができるようにするためのものである。
Although the sampling frequencies of the N recording devices are all set to the same value (for example, 44.1 kHz), the clock generators of the recording devices do not operate at the same clock frequency. There is a slight shift in the sampling frequency of recording equipment. For this reason, even when recording is performed with the recording start timings being adjusted at each recording device and the N sound signals are reproduced with their heads aligned, the sound gradually shifts, and the shift increases as playback proceeds. The
図1に示すように信号処理システム1は、サンプリング周波数推定装置10と、時間軸圧伸装置20とを含んでいる。サンプリング周波数推定装置10には、上記N個の音信号が与えられる。サンプリング周波数推定装置10は、これらN個の音信号のうちの1つを基準信号とし、残りのN−1個の音信号の各々を補正対象信号として、基準信号のサンプリング周波数に対する各補正対象信号のサンプリング周波数のズレ(すなわち、誤差)を補正対象信号毎に推定し、その推定結果を示すデータを時間軸圧伸装置20に与える。時間軸圧伸装置20は、補正対象信号毎に推定されたサンプリング周波数の誤差が解消されるように各補正対象信号に時間軸圧伸を施す。これにより、N個の音信号の同期が実現さされる。時間軸圧伸装置20における時間軸圧伸アルゴリズムとしては既存の技術を適宜用いるようにすれば良い。本実施形態では、サンプリング周波数推定装置10に本実施形態の特徴を顕著に示す処理を実行させることで、上記各補正対象信号のサンプリング周波数の誤差の推定を従来よりも短い計算時間で実現しつつ、高い汎用性を確保することが可能になっている。以下では、本実施形態の特徴を顕著に示すサンプリング周波数推定装置10を中心に説明する。
As shown in FIG. 1, the
サンプリング周波数推定装置10は、図1に示すように、短時間フーリエ変換(図1では、「STFT」と表記)部100、時間ズレ量算出部110、誤差算出部120、および統計処理部130を含んでいる。図1に示す各部は電子回路で構成されたハードウェアモジュールであっても良いし、CPU(Central Processing Unit)を信号処理プログラムに従って作動させることで実現されるソフトウェアモジュールであっても良い。
As shown in FIG. 1, the sampling
STFT部100は、サンプリング周波数推定装置10へ入力された音信号Xn(t)(n=1〜N)の各々を所定サンプル数ずつのフレームに区切り、フレーム毎に短時間フーリエ変換を施して周波数領域の信号Xn(f)(fは周波数を表す変数、以下、同じ)に変換して時間ズレ量算出部110に与える。STFT部100にて使用する変換アルゴリズムについては周知のものを適宜利用すれば良い。
The
時間ズレ量算出部110は、N個の音信号のうちの1つを基準信号として選択し、残りのN−1個の音信号の各々を補正対象信号として順次選択し、基準信号と補正対象信号の一方を時間軸方向にずらしつつ両信号の相互相関関数をフレーム毎に算出して両信号の時間ズレ量をフレーム毎に算出する。以下では基準信号としてXref(f)が選択され、補正対象信号としてXk(f)(k≠ref)が選択された場合を例に取って時間ズレ量算出部110が実行する処理を詳細に説明する。
The time shift
時間ズレ量算出部110は、まず、基準信号Xref(f)と補正対象信号Xk(f)(k≠ref)の各々のフレーム毎の相互相関関数C(τ)をτの値を変えつつ算出する。相互相関関数C(τ)を算出するのは、時間ズレ量を補正する方法として相互相関関数が最大となるサンプル点を推定する方法が一般に知られているからである。一般に相互相関関数C(τ)は、時間領域の2つのアナログ信号x(t)とy(t)があった時、以下の数1で表される。また、デジタル信号であれば、以下の数2で表される。
数1或いは数2により算出される相互相関関数C(τ)は、2つの信号のどちらかを時間軸方向にτだけずらして内積を取ることに相当する。「同じ信号が2つの信号のどこかに含まれている」という仮定が成り立つのであれば、相互相関関数が最大となるτを求めることで、2つの信号の時間ズレ量を推定できると考えられる。なお、2つの信号のフーリエ変換X(f)とY(f)とを考えると、相互相関関数C(τ)は以下の数3により計算される。数3の右辺のIFFT()は逆フーリエ変換を表す演算子であり、X*(f)はX(f)の複素共役を表す。
本実施形態の時間ズレ量算出部110は、基準信号Xref(f)と補正対象信号Xk(f)(k≠ref)の各フレームの相互相関関数C(τ)をτの値を変えつつ数3にしたがって算出する。具体的には、時間ズレ量算出部110は、基準信号におけるi番目のフレームについての信号Xref(f)の複素共役を数3右辺のX*(f)とし、補正対象信号におけるi番目のフレームについての信号Xk(f)(k≠ref)を数3右辺のY(f)としてτを変えつつ数3の演算を行い、相互相関関数C(τ)が最大になるτを特定する。そして、時間ズレ量算出部110は、このようにして特定したτを、補正対象信号Xk(f)のi番目のフレームについての時間ズレ量の推定値Nki(すなわち、相互相関関数C(τ)を最大にするτ)として誤差算出部120に与える。他の番号のフレームについても同様である。
The time shift
本実施形態において数1或いは数2の時間領域の演算ではなく、数3に示す周波数領域の演算により相互相関関数C(τ)を算出するようにしたのは、計算量の点で有利なことがあるからである。本実施形態では、時間ズレ量算出部110にて数3に示す演算により相互相関関数C(τ)を算出できるようにするために、STFT部100が設けられている。したがって、時間ズレ量算出部110にて数1或いは数2に示す演算により相互相関関数C(τ)を算出するのであればSTFT部100を省略しても良い。
In the present embodiment, it is advantageous in terms of calculation amount to calculate the cross-correlation function C (τ) by the frequency domain calculation shown in Formula 3 instead of the time domain calculation of
誤差算出部120は、時間ズレ量算出部110から与えられる各フレームの時間ズレ量Nkiに基づいて、基準信号のサンプリング周波数fsに対する補正対象信号のサンプリング周波数の誤差の推定値(以下、第1の推定値)Ekiをフレーム毎に算出する。例えば、i番目のフレームについての時間ズレ量がNkiであり、補正対象信号Xk(f)におけるi番目のフレームの先頭サンプルが当該信号の先頭からSki番目のサンプルであった場合には、誤差算出部120は、当該i番目のフレームについての上記第1の推定値Ekiを以下の数4にしたがって算出し、統計処理部130に与える。前述したように、時間ズレ量算出部110により算出された時間ズレ量Nkiは基準信号の先頭を基準としたズレ量であるため、本実施形態のようにSTFTによって各フレームの相互相関関数を求めた場合にはフレーム先頭を基準としたズレ量である。このため、i番目のフレームでの相互相関関数を基にした補正対象信号Xk(f)のサンプリング周波数の誤差の推定値Ekiは以下の数4により表される。
統計処理部130は、誤差算出部120によりフレーム毎に算出された第1の推定値Ekiに統計処理を施して補正対象信号全体に亘るサンプリング周波数の誤差の推定値(以下、第2の推定値)Eを算出し、時間軸圧伸装置20へ出力する。図1に示すように、統計処理部130は、第1の統計フィルタ処理部130aと第2の統計フィルタ処理部130bとを含んでいる。つまり、統計処理部130の実行する統計処理は、第1の統計フィルタ処理部130aの実行する処理と第2の統計フィルタ処理部130bの実行する処理により構成されている。これら各統計フィルタ処理部の実行する処理の内容は以下の通りである。
The
第1の統計フィルタ処理部130aは、誤差算出部120によりフレーム毎に算出された第1の推定値Ekiから、統計的にエラーを多く含むと推定される外れ値を除外する第1の統計フィルタ処理を実行する。誤差算出部120によりフレーム毎に算出された第1の推定値Ekiには、多くのエラーが含まれていることが多い。上記第1の推定値Ekiは、補正対象信号Xk(f)および基準信号Xref(f)の各々のi番目のフレームの情報のみに基づいて、両信号のサンプリング周波数のズレを大まかに推定した値だからである。図2は人工的にサンプリング周波数を3Hzずらして実験した時のフレーム毎のサンプリング周波数推定結果である。なお、基準信号のサンプリング周波数に対する補正対象信号のサンプリング周波数の誤差が判れば、基準信号のサンプリング周波数と当該誤差から補正対象信号のサンプリング周波数を算出できるのであるから、上記誤差の推定と補正対象信号のサンプリング周波数の推定は等価である。図2に示すように、フレーム毎に推定したサンプリング周波数に大きなバラツキがあるのは、サンプリング周波数ズレに起因するごく小さな時間ズレを高い精度で推定することが難しいためであると考えられる。
The first statistical
本実施形態では、誤差算出部120により算出された第1の推定値Ekiのうち、他のものと比較して大きく外れるような値を外れ値として除去する処理が第1の統計フィルタ処理として採用されている。具体的には、本実施形態では、第1の統計フィルタ処理として所謂四分位数に基づく処理が採用されている。ここで、四分位数とは、処理対象のデータを大きさの順にソートした後に、それらを四等分する区切りの数のことを言い、小さい方から第1四分位数、第2四分位数、第3四分位数と呼ばれる(図3参照)。また、第1四分位数と第2四分位数の差は、四分位数範囲(Interquartile range; IQR)と呼ばれる。四分位数範囲はサンプルのバラつき具合を表す1つの指標である。
In the present embodiment, the first statistical filter process is a process of removing, as an outlier, a value that deviates significantly from the first estimated value E ki calculated by the
より詳細に説明すると、第1の統計フィルタ処理部130aは、まず、誤差算出部120によりフレーム毎に算出された第1の推定値Ekiをその大きさ順にソートする。次いで、第1の統計フィルタ処理部130aは、誤差算出部120によりフレーム毎に算出された第1の推定値Ekiのうち、上記ソート結果における第1四分位数より小さい値、もしくは第3四分位数より大きい値を外れ値として除外し、その残り(すなわち、外れ値を含まない一群の第1の推定値E´ki)を第2の統計フィルタ処理部130bに引き渡す。ここで、外れ値を検出する演算o()は以下の数5により表される。具体的には、数5におけるe(n)に誤差算出部120により算出された第1の推定値Ekiの各々を代入し、演算o()の値が1であれば当該第1の推定値Ekiを外れ値として除外するといった具合である。qLおよびqHはそれぞれ第1四分位数および第3四分位数を表す。
本実施形態では、第1の統計フィルタ処理として四分位数に基づく処理が採用されていたが、四分位数に加えて、四分位数範囲を使った処理であっても良い。具体的には、外れ値であるか否かを識別するための演算として数5に示す演算o()に代えて数6に示す演算o()を行えば良い。数6に示す演算は第1、3四分位数にIQRの値を重み付きで加算あるいは減算することを意味している。α=0とすると、数6は数5と一致する。α=1.5で計算する方法が広く知られており、例えば図4に示す箱ひげ図の上下のひげに当たる部分はこれで計算されている。
第2の統計フィルタ処理部130bは、第1の統計フィルタ処理部130aより外れ値を除外された一群の第1の推定値E´kiから代表値を選択する第2の統計フィルタ処理(具体的には、中央値を選択するフィルタ処理)を実行し、その処理結果を第2の推定値Ekとして時間軸圧伸装置20に与える。なお、上記代表値としては最大値や最小値などを用いることが考えられるが、中央値を用いることが最も好ましいと考えられる。また、第2の統計フィルタ処理部130bの実行する第2の統計フィルタ処理として、第1の統計フィルタ処理部130aより外れ値を除外された一群の第1の推定値E´kiを平滑化するフィルタ処理(第1の統計フィルタ処理部130aより外れ値を除外された一群の第1の推定値E´kiの平均値を算出する処理)を採用しても良いが、本出願人の行った実験によれば、上記中央値を選択するフィルタ処理を採用した方が良好な結果が得られた。このため、本実施形態では、中央値を選択するフィルタ処理が採用されている。
以上がサンプリング周波数推定装置10の構成である。
The second statistical
The above is the configuration of the sampling
(B:実施形態の効果)
本実施形態によれば、N個の音信号のうちの1つを基準信号、残りのN−1個の音信号の各々を補正対象信号とし、基準信号のサンプリング周波数に対する補正対象信号のサンプリング周波数の誤差が補正対象信号毎にサンプリング周波数推定装置10によって推定され、その誤差が解消されるように時間軸圧伸を補正対象信号に施すことで、N個の音信号の同期が実現される。本出願人は本実施形態の効果を評価するために、非特許文献2に開示の技術を対比の対象として、サンプリング周波数の誤差の推定性能および計算速度(サンプリング周波数の誤差の推定値の算出を完了するまでに要した計算時間の時間長)の観点から評価実験を行った。この評価実験の概要は以下の通りである。
(B: Effect of the embodiment)
According to the present embodiment, one of the N sound signals is a reference signal, each of the remaining N-1 sound signals is a correction target signal, and the sampling frequency of the correction target signal with respect to the sampling frequency of the reference signal Is estimated by the sampling
まず、44.1kHzのサンプリング周波数でサンプリングされた16ビットの10曲の市販曲(ジャンルはポップス、各曲の時間長は10秒)の音信号を原信号とし、この原信号そのままを基準信号、この原信号に人工的にリサンプリング(±5Hz)を施した信号を補正対象信号とし、各補正対象信号のサンプリング周波数の誤差を本実施形態のサンプリング周波数推定装置10および非特許文献2に開示の技術により推定した。なお、本評価実験では、CPUとして3.4GHz駆動のCorei7 3770を有し、32GBのRAMを有する計算機をサンプリング周波数推定装置10として用い、STFT部100等の各部の実装にはMATLAB(登録商標)を用いた。MATLAB(登録商標)とは、米国The MathWorks社の数値解析ソフトウェアである。同様に、非特許文献2に開示の手法もC/C++およびMATLAB(登録商標)で同計算機に実装して実行した。また、FFT長は4096サンプルであり、解析窓として窓長が4096サンプルのHamming窓を用い、さらに、相互相関関数C(τ)を算出する際のシフトサイズ(すなわち、τの更新単位)として8192、4096,2048および1024サンプルを用い、使用するデータ範囲を(3/8)×T〜(5/8)×T(Tはデータ数)とした。
First, a sound signal of 10 commercial songs of 16 bits sampled at a sampling frequency of 44.1 kHz (genre is pop, each song has a duration of 10 seconds) is used as an original signal, and the original signal is used as a reference signal. A signal obtained by artificially performing resampling (± 5 Hz) on the original signal is used as a correction target signal, and an error in the sampling frequency of each correction target signal is disclosed in the sampling
図5(a)は、本実施形態についての推定性能に関する実験結果を示す図であり、図5(b)は非特許文献2に開示の手法についての推定性能に関する実験結果を示す図である。図5(a)と図5(b)を対比すれば明らかなように、最高性能では非特許文献2に開示の技術が上回っている(すなわち、推定誤差が小さい)。しかし、例えば2時間(7200秒)録音し、補正後の補正対象信号の基準信号に対する時間ズレを5ミリ秒以下に押さえる(サンプリング周波数の推定誤差を0.03Hz以内に抑える)といった実用的な範囲の性能は本実施形態でも達成されている。したがって、本実施形態でも実用的な範囲での問題は何ら発生しない。また、図5(a)からは、本実施形態ではシフトサイズによらず同程度の推定性能を実現できていることが判る。シフトサイズは計算量に影響する。つまり、図5(a)の実験結果は、本実施形態によれば計算量を少なくしても実用的な範囲の性能を十分に達成できることを意味している。 FIG. 5A is a diagram illustrating an experimental result regarding the estimation performance for the present embodiment, and FIG. 5B is a diagram illustrating an experimental result regarding the estimation performance for the method disclosed in Non-Patent Document 2. As is clear from a comparison between FIG. 5A and FIG. 5B, the technology disclosed in Non-Patent Document 2 exceeds the maximum performance (that is, the estimation error is small). However, for example, recording is performed for 2 hours (7200 seconds), and a practical range in which the time deviation of the corrected correction target signal with respect to the reference signal is suppressed to 5 milliseconds or less (the sampling frequency estimation error is suppressed to within 0.03 Hz). This performance is also achieved in this embodiment. Therefore, no problem in the practical range occurs in this embodiment. Further, from FIG. 5A, it can be seen that the same estimation performance can be realized in this embodiment regardless of the shift size. The shift size affects the calculation amount. That is, the experimental result of FIG. 5A means that according to the present embodiment, a practical range of performance can be sufficiently achieved even if the amount of calculation is reduced.
図6(a)は、本実施形態についての計算速度に関する実験結果を示す図であり、図6(b)は非特許文献2に開示の手法についての計算速度に関する実験結果を示す図である。る。図6(a)と図6(b)を対比すれば明らかなように、非特許文献2に開示の手法に比較して本実施形態の手法は圧倒的に高速(サンプリング周波数ズレの推定を完了するまでに要した計算時間が短い)であり、MATLAB(登録商標)による実装でも、C/C++による非特許文献2に開示の手法の実装を凌ぐ計算速度が得られていることが判る。以上の実験結果を総括すると、本実施形態によれば、非特許文献2に開示の技術に比較して短い計算時間で実用的な範囲の推定性能を達成することができる、と結論付けられる。 FIG. 6A is a diagram illustrating an experimental result regarding the calculation speed for the present embodiment, and FIG. 6B is a diagram illustrating an experimental result regarding the calculation speed for the method disclosed in Non-Patent Document 2. The As is clear from the comparison between FIG. 6A and FIG. 6B, the method of this embodiment is overwhelmingly faster than the method disclosed in Non-Patent Document 2 (estimation of sampling frequency deviation is completed). It is understood that the calculation time required until the calculation is short), and even with the implementation by MATLAB (registered trademark), the calculation speed exceeding the implementation of the method disclosed in Non-Patent Document 2 by C / C ++ is obtained. When the above experimental results are summarized, it can be concluded that according to the present embodiment, a practical range of estimation performance can be achieved in a shorter calculation time than the technique disclosed in Non-Patent Document 2.
以上説明したように本実施形態によれば、同じ音波形を各々別個にサンプリングして得られる複数の音信号の同期を、非特許文献2に開示の技術に比較して短い計算時間で実現することが可能になる。加えて、本実施形態では、サンプリングされた音信号(換言すれば、録音された音信号)だけで同期が可能であり、パイロット信号を必要とはしないので非特許文献1に開示の技術に比較して高い汎用性を有する。また、本実施形態では、同期対象の各音信号は繰り返し送出されたものである必要はなく、特許文献1に開示の技術に比較して高い汎用性を有する。つまり、本実施形態によれば、同じ波形を別個独立にサンプリングして得られる複数の信号の同期を従来よりも短い計算時間で実現することが可能になり、かつ高い汎用性を実現することが可能になる。
As described above, according to the present embodiment, synchronization of a plurality of sound signals obtained by separately sampling the same sound waveform is realized in a shorter calculation time than the technique disclosed in Non-Patent Document 2. It becomes possible. In addition, in the present embodiment, synchronization is possible only with a sampled sound signal (in other words, a recorded sound signal), and a pilot signal is not required, so that it is compared with the technique disclosed in
(C:変形)
以上本発明の一実施形態について説明したが、この実施形態に以下の変形を加えても勿論良い。
(1)上記実施形態では、サンプリング周波数推定装置10に入力される複数の信号が、同じ音波形を各々別個独立にサンプリングして得られた複数の音信号である場合について説明した。しかし、サンプリング周波数推定装置10に入力される複数の信号は、同じ波形を各々別個独立にサンプリングして得られたものであれば良く、音信号に限定される訳ではない。また、上記実施形態では、第1の統計フィルタ処理として四分位数を利用した処理を採用したが、例えば、誤差算出部120によりフレーム毎に算出された推定値をその大きさ順にソートした後にそれらを三等分に区切り、小さい方の区切り位置に対応する値よりも小さいもの、および大きい方の区切り位置に対応する値よりも大きいものを外れ値とする処理を採用しても良い。要は、誤差算出部120によりフレーム毎に算出された第1の推定値をその大きさ順にソートした場合における両端から所定個数分、または両端から所定個数番目の各値に応じて定まる範囲に属さないもの、を外れ値とする処理であれば良い。
(C: deformation)
Although one embodiment of the present invention has been described above, it goes without saying that the following modifications may be added to this embodiment.
(1) In the above embodiment, a case has been described in which the plurality of signals input to the sampling
(2)上記実施形態の統計処理部130が実行する統計処理は、決定論的アプローチによる処理であり、四分位数法等を利用して外れ値を除外する第1の統計フィルタ処理と、第1の統計フィルタ処理の処理結果から代表値(上記実施形態では、中央値)を選択し、当該値を補正対象信号全体に亘るサンプリング周波数の誤差の推定値とする第2の統計フィルタ処理により構成さていた。しかし、フレーム毎に算出された第1の推定値を指数関数族で統計的にモデル化し、モデルパラメータを推定することにより、第2の推定値を算出する処理を上記統計処理として採用しても良い。具体的には、例えばラプラス分布で上記モデル化を行い、ラプラス分布のパラメータを推定することで分布の形状を決定し、決定された分布から最頻値を求め、その最頻値を上記第2の推定値とすることで、サンプリング周波数の誤差の尤も確からしい値を推定するといった具合である。
(2) The statistical processing executed by the
(3)上記実施形態の時間ズレ量算出部110は、相互相関関数C(τ)が最大となるτのみに基づいて時間ズレ量を算出したが、相互相関関数C(τ)の大きい順に最大M個のτを候補として残し、これらM個のτに基づいて時間ズレ量を算出しても良い。例えばこれらM個のτの平均値から時間ズレ量を算出するといった具合である。また、相互相関関数C(τ)の値が所定の閾値以上となる全てのτを時間ズレ量の候補としてもよい。この場合、パワーの大小の影響を避けるため、正規化相互相関関数を用いるようにすれば良い。
(3) The time shift
(4)時間ズレ量算出部110において、基準信号および補正対象信号のパワーが所定の閾値未満であるフレームを時間ズレ量の算出対象から除外するようにしても良い。上記閾値を適切な値に定めておけば、基準信号を充分な強度で含んでいないフレームや補正対象信号を充分な強度で含んでいないフレームが時間ズレ量の算出対象から除外される。基準信号を充分な強度で含んでいないフレームや補正対象信号を充分な強度で含んでいないフレームは、そもそもサンプリング周波数ズレの推定に対する寄与は小さく、このようなフレームについて時間ズレ量を算出したとしてもエラーを多く含むものとなってしまう。このような時間ズレ量に基づいて算出された第1の推定値は外れ値として第1の統計フィルタ処理部130aによって外れ値として除外される可能性が高く、そもそも時間ズレ量の算出自体が無駄になってしまう。このような態様によれば、時間ズレ量算出部110において無駄な演算が行われることを回避しつつ、サンプリング周波数の誤差を高い精度で算出することが可能になる。
(4) The time shift
(5)時間ズレ量算出部110において、相互相関関数C(τ)の最大値が所定の閾値を下回るフレームを時間ズレ量の算出対象から除外するようにしても良い。上記閾値を適切な値に定めておけば、当該閾値を下回る相互相関関数に基づいて時間ズレ量の算出が行われることはない。上記閾値を下回る相互相関関数に基づいて時間ズレ量を算出したとしてもエラーを多く含むものとなってしまい、このような時間ズレ量に基づいて算出され第1の推定値は外れ値として除外される可能性が高く、そもそも時間ズレ量の算出自体が無駄になってしまう。このような態様によっても、時間ズレ量算出部において無駄な演算が行われることを回避しつつ、サンプリング周波数を高い精度で算出することが可能になる。
(5) The time deviation
(6)上記実施形態では、基準信号および補正対象信号をフレームに区切る際のフレームサイズを固定としたが、このような態様ではフレーム番号が大きくなるほど両信号のサンプルズレが大きくなり、相互相関関数C(τ)を計算が無意味になる(或いは、相互相関関数C(τ)を計算できなくなる)ことが考えられる。そこで、相互相関関数C(τ)の最大値が所定の閾値を下回った時点で処理を停止し、サンプリング周波数推定装置10の利用者に何らかの報知を行っても良く、また、フレームサイズを大きくして基準信号および補正対象信号のフレームを区切り直すようにしても良い。
(6) In the above embodiment, the frame size when the reference signal and the correction target signal are divided into frames is fixed. However, in such an aspect, the sample deviation of both signals increases as the frame number increases, and the cross-correlation function It is conceivable that the calculation of C (τ) becomes meaningless (or the cross-correlation function C (τ) cannot be calculated). Therefore, the processing may be stopped when the maximum value of the cross-correlation function C (τ) falls below a predetermined threshold, and some notification may be given to the user of the sampling
(7)上記実施形態では、基準信号と補正対象信号の相互相関関数をフレーム毎に算出することで、各フレームにおける両信号の時間ズレ量を算出した。しかし、両信号を正規化してから両信号の相互相関を算出し、その算出結果に基づいて時間ズレ量を算出しても勿論良い。また、基準信号と補正対象信号の一方を他方に対して時間軸方向にずらしつつ両信号の差信号を算出する処理をフレーム毎に実行するとともに当該差信号の振幅の最大値(或いはパワー)を両信号の相関を表す値として算出し、その算出結果に基づいて両信号のフレーム毎の時間ズレ量を算出しても良く、また両信号の和信号と差信号の比を算出することで両信号の相関を表す値をフレーム毎に算出しその算出結果に応じて両信号のフレーム毎の時間ズレ量を算出しても良い。また、パターンマッチングにより、基準信号と補正対象信号の相関を表す値をフレーム毎に算出し、その算出結果に応じて両信号のフレーム毎の時間ズレ量を算出しても良い。要は、基準信号と補正対象信号の相関をフレーム毎に算出し、その算出結果に応じて両信号のフレーム毎の時間ズレ量を算出する態様であれば良い。 (7) In the above embodiment, the amount of time deviation between both signals in each frame is calculated by calculating the cross-correlation function between the reference signal and the correction target signal for each frame. However, it is of course possible to calculate the cross-correlation between both signals after normalizing both signals and calculate the amount of time deviation based on the calculation result. In addition, a process for calculating a difference signal between the two signals while shifting one of the reference signal and the correction target signal in the time axis direction with respect to the other is executed for each frame, and the maximum value (or power) of the amplitude of the difference signal is set. It may be calculated as a value representing the correlation between both signals, and the amount of time deviation between the frames of both signals may be calculated based on the calculation result, or both ratios may be calculated by calculating the ratio between the sum signal and the difference signal of both signals. A value representing the correlation between the signals may be calculated for each frame, and the time shift amount for each frame of both signals may be calculated according to the calculation result. Further, a value representing the correlation between the reference signal and the correction target signal may be calculated for each frame by pattern matching, and the time shift amount for each frame of both signals may be calculated according to the calculation result. The point is that the correlation between the reference signal and the correction target signal is calculated for each frame, and the time deviation amount for each frame of both signals is calculated according to the calculation result.
1…信号処理システム、10…サンプリング周波数推定装置、20…時間軸圧伸装置、100…STFT部、110…時間ズレ量算出部、120…誤差算出部、130…統計処理部、130a…第1の統計フィルタ処理部、130b…第2の統計フィルタ処理部。
DESCRIPTION OF
Claims (5)
前記時間ズレ量算出部により算出された時間ズレ量から、各フレームにおける前記補正対象信号のサンプリング周波数の誤差の推定値である第1の推定値をフレーム毎に算出する誤差算出部と、
前記誤差算出部によりフレーム毎に算出された前記第1の推定値に統計処理を施して前記補正対象信号全体に亘るサンプリング周波数の誤差の推定値である第2の推定値を算出し出力する統計処理部と、
を有することを特徴とするサンプリング周波数推定装置。 One of a plurality of signals obtained by independently sampling the same waveform is used as a reference signal, one of the remaining signals is used as a correction target signal, and one of the reference signal and the correction target signal is set as a time. Calculating a correlation between both signals for each frame while shifting in the axial direction, and calculating a time shift amount for each frame according to the calculation result;
An error calculation unit that calculates, for each frame, a first estimated value that is an estimated value of an error in the sampling frequency of the correction target signal in each frame from the time shift amount calculated by the time shift amount calculation unit;
A statistic that performs statistical processing on the first estimated value calculated for each frame by the error calculating unit to calculate and output a second estimated value that is an estimated value of the sampling frequency error over the entire correction target signal. A processing unit;
A sampling frequency estimation apparatus comprising:
前記誤差算出部によりフレーム毎に算出された前記第1の推定値から、統計的にエラーを多く含むと推定される外れ値を除外する第1の統計フィルタ処理が含まれるとともに、
前記第1の統計フィルタ処理より外れ値が除外された一群の第1の推定値を平滑化するフィルタ処理と前記一群の第1の推定値から代表値を選択するフィルタ処理の一方が第2の統計フィルタ処理として含まれ、
前記統計処理部は前記第2の統計フィルタ処理の処理結果を、前記第2の推定値として出力する
ことを特徴とする請求項1に記載のサンプリング周波数推定装置。 The statistical processing executed by the statistical processing unit includes
A first statistical filtering process that excludes outliers that are statistically estimated to contain many errors from the first estimated value calculated for each frame by the error calculating unit;
One of a filter process for smoothing a group of first estimated values from which outliers have been excluded from the first statistical filter process and a filter process for selecting a representative value from the group of first estimated values is a second one. Included as statistical filtering,
The sampling frequency estimation apparatus according to claim 1, wherein the statistical processing unit outputs a processing result of the second statistical filter processing as the second estimated value.
5. The time shift amount calculation unit excludes a frame whose value representing a correlation between the reference signal and the correction target signal is below a predetermined threshold from the time shift amount calculation target. The sampling frequency estimation apparatus according to claim 1.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014077380A JP6229576B2 (en) | 2014-04-03 | 2014-04-03 | Sampling frequency estimation device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014077380A JP6229576B2 (en) | 2014-04-03 | 2014-04-03 | Sampling frequency estimation device |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017201493A Division JP6668306B2 (en) | 2017-10-18 | 2017-10-18 | Sampling frequency estimation device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015197941A JP2015197941A (en) | 2015-11-09 |
JP6229576B2 true JP6229576B2 (en) | 2017-11-15 |
Family
ID=54547525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014077380A Expired - Fee Related JP6229576B2 (en) | 2014-04-03 | 2014-04-03 | Sampling frequency estimation device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6229576B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111785289B (en) * | 2019-07-31 | 2023-12-05 | 北京京东尚科信息技术有限公司 | Residual echo cancellation method and device |
CN113467236B (en) * | 2021-06-17 | 2022-10-21 | 中国人民解放军海军工程大学 | Method for time lag compensation of error signal |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3196715B2 (en) * | 1997-10-22 | 2001-08-06 | ヤマハ株式会社 | Communication device for communication of music information, communication method, control device, control method, and medium recording program |
JP2002101500A (en) * | 2000-09-22 | 2002-04-05 | Matsushita Electric Ind Co Ltd | Sound field measurement device |
JP4543586B2 (en) * | 2001-06-25 | 2010-09-15 | ソニー株式会社 | Audio reproduction apparatus and audio reproduction method |
JP3925349B2 (en) * | 2002-08-22 | 2007-06-06 | ヤマハ株式会社 | Apparatus and method for synchronous reproduction of audio data and performance data |
DE102005045627A1 (en) * | 2005-06-22 | 2007-01-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for performing a correlation between a test sound signal that is playable at variable speed and a reference sound signal |
-
2014
- 2014-04-03 JP JP2014077380A patent/JP6229576B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015197941A (en) | 2015-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110265064B (en) | Audio frequency crackle detection method, device and storage medium | |
JP6027087B2 (en) | Acoustic signal processing system and method for performing spectral behavior transformations | |
US10152986B2 (en) | Acoustic processing apparatus, acoustic processing method, and computer program product | |
JP2010154092A (en) | Noise detection apparatus and ethod | |
US20130194007A1 (en) | Asynchronous sampling frequency conversion device, method, and computer program product | |
JP6229576B2 (en) | Sampling frequency estimation device | |
CN107210029A (en) | Method and apparatus for handling succession of signals to carry out polyphony note identification | |
JP6221257B2 (en) | Signal processing apparatus, method and program | |
JP6668306B2 (en) | Sampling frequency estimation device | |
CN109841232B (en) | Method and device for extracting note position in music signal and storage medium | |
US11611839B2 (en) | Optimization of convolution reverberation | |
US11867733B2 (en) | Systems and methods of signal analysis and data transfer using spectrogram construction and inversion | |
JP6597062B2 (en) | Noise reduction device, noise reduction method, noise reduction program | |
JP2014095966A (en) | Information processor, information processing method and program | |
JP2017203931A (en) | Acoustic property measurement device and acoustic property measurement method | |
CN107657962B (en) | Method and system for identifying and separating throat sound and gas sound of voice signal | |
CN112420004A (en) | Method and device for generating songs, electronic equipment and computer readable storage medium | |
JP2016123059A (en) | Signal generator and terminal | |
JP6759927B2 (en) | Utterance evaluation device, utterance evaluation method, and utterance evaluation program | |
JP2020027245A5 (en) | Information processing method, information processing apparatus, and program | |
US20230233931A1 (en) | Information processing apparatus, information processing method, and program | |
JP6183067B2 (en) | Data analysis apparatus and method, program, and recording medium | |
JP4378098B2 (en) | Sound source selection apparatus and method | |
JP6152690B2 (en) | Acoustic analyzer | |
CN116165486A (en) | Method and system for recovering time domain waveform of partial discharge pulse electric field |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170905 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170919 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171002 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6229576 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |