JP6229576B2 - Sampling frequency estimation device - Google Patents

Sampling frequency estimation device Download PDF

Info

Publication number
JP6229576B2
JP6229576B2 JP2014077380A JP2014077380A JP6229576B2 JP 6229576 B2 JP6229576 B2 JP 6229576B2 JP 2014077380 A JP2014077380 A JP 2014077380A JP 2014077380 A JP2014077380 A JP 2014077380A JP 6229576 B2 JP6229576 B2 JP 6229576B2
Authority
JP
Japan
Prior art keywords
sampling frequency
frame
signal
correction target
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014077380A
Other languages
Japanese (ja)
Other versions
JP2015197941A (en
Inventor
祐 高橋
祐 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2014077380A priority Critical patent/JP6229576B2/en
Publication of JP2015197941A publication Critical patent/JP2015197941A/en
Application granted granted Critical
Publication of JP6229576B2 publication Critical patent/JP6229576B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

この発明は、同じ波形を各々別個にサンプリングして得られる複数の信号の同期技術に関する。   The present invention relates to a technique for synchronizing a plurality of signals obtained by separately sampling the same waveform.

近年では、ICレコーダなどの手軽にデジタル録音を行える録音機器や、スマートフォンのようにデジタル録音と同時に録画も行える機器が一般に普及している。ここでデジタル録音とは、音波形をサンプリングして得られるサンプル列の形式で音信号を記録することを言う。スマートフォンを用いて例えばライブ演奏の動画と演奏音を奏者から離れた場所で録音しつつ、奏者の近くに置かれたICレコーダで演奏音を録音し、スマートフォンにより録音された演奏音をICレコーダにより録音された演奏音に差し替えて(或いは前者に後者を重ね合わせて)再生する、といったことも行われている。一般にデバイスの設定で全ての録音機器のサンプリング周波数を同一に設定していたとしても、各録音機器のサンプリング周波数には微細なバラツキが生じてしまう。これはサンプリング周波数を決めるクロック・ジェネレータが完全に同一のクロック周波数で動作しないことに起因する。したがって、同じ音波形を複数の録音機器で別個独立にデジタル録音する場合、たとえ録音開始タイミングを揃えたとしても、録音機器毎にサンプリング周波数が異なるために、サンプリングタイミングに時々刻々とズレが生じてしまう。このようなサンプリング周波数のズレを補正する技術としては、特許文献1、非特許文献1および非特許文献2の各先行技術文献に開示の技術が挙げられる。   In recent years, recording devices that can easily perform digital recording, such as IC recorders, and devices that can simultaneously record digital recording, such as smartphones, have become popular. Here, digital recording refers to recording a sound signal in the form of a sample sequence obtained by sampling a sound waveform. For example, while recording a live performance video and performance sound away from the player using a smartphone, the performance sound is recorded with an IC recorder placed near the player, and the performance sound recorded by the smartphone is recorded with the IC recorder. In some cases, the recorded performance sound is replaced (or the former is overlaid with the latter). In general, even if the sampling frequencies of all the recording devices are set to be the same in the device settings, fine variations occur in the sampling frequencies of the recording devices. This is due to the fact that the clock generator that determines the sampling frequency does not operate at the exact same clock frequency. Therefore, when the same sound waveform is separately digitally recorded by multiple recording devices, even if the recording start timing is aligned, the sampling frequency varies from recording device to recording device. End up. As a technique for correcting the deviation of the sampling frequency, there are techniques disclosed in the prior art documents of Patent Document 1, Non-Patent Document 1, and Non-Patent Document 2.

非特許文献1には、送信機から基準信号(パイロット信号)を送出し、受信機側で受信した信号に含まれる基準信号からサンプリング周波数ズレによる周波数シフトを検出し、補正する技術が開示されている。特許文献1には、音場の伝達特性を計測するときに計測信号(TSP信号など)を送出する側と、受信する側でサンプリング周波数が異なってしまう場合の補正技術が開示されている。特許文献1に開示の技術では、計測時に雑音の影響を抑制するためにTSP信号を繰り返し送出し、測定した複数のTSP信号を一定時間ごとに切出し、このようにして切り出した各TSP信号の位相差を検出することでサンプリング周波数ズレを推定し補正している。   Non-Patent Document 1 discloses a technique for transmitting a reference signal (pilot signal) from a transmitter and detecting and correcting a frequency shift due to a sampling frequency shift from a reference signal included in a signal received on the receiver side. Yes. Patent Document 1 discloses a correction technique in the case where the sampling frequency is different between the side that transmits a measurement signal (TSP signal or the like) and the side that receives it when measuring the transfer characteristic of the sound field. In the technique disclosed in Patent Document 1, a TSP signal is repeatedly transmitted in order to suppress the influence of noise at the time of measurement, and a plurality of measured TSP signals are cut out at regular intervals. By detecting the phase difference, the sampling frequency deviation is estimated and corrected.

非特許文献2には、複数の録音機器間のサンプリング周波数のズレを統計信号処理を利用して補正する技術が開示されている。非特許文献2に開示の技術では、まず、複数の録音機器により録音された各録音信号に対して基準信号を定める。そして、その基準信号に対してサンプリング周波数がズレていた場合の信号を統計的にモデル化し、基準信号以外の信号を統計的モデルに当てはめることでサンプリング周波数のズレを推定している。   Non-Patent Document 2 discloses a technique for correcting a sampling frequency shift between a plurality of recording devices using statistical signal processing. In the technique disclosed in Non-Patent Document 2, first, a reference signal is determined for each recording signal recorded by a plurality of recording devices. Then, a signal when the sampling frequency is shifted from the reference signal is statistically modeled, and a signal other than the reference signal is applied to the statistical model to estimate the sampling frequency shift.

特開2002−101500号公報JP 2002-101500 A

松岡 保静,中島 祐輔, 吉村 健, “移動端末のマイクロホンで情報を取得する音波情報伝達方式”,NTT DocomoTechnical Journal, vol.14, No.2, 2006Matsuoka, Yasushi, Nakajima, Yusuke, Yoshimura, Ken, “Acoustic Information Transmission Method for Acquiring Information Using Mobile Terminal Microphone”, NTT DocomoTechnical Journal, vol.14, No.2, 2006 Shigeki Miyabe, Nobutaka Ono,and Shoji Makino, “BLIND COMPENSATION OF INTER-CHANNEL SAMPLING FREQUENCYMISMATCH WITH MAXIMUM LIKELIHOOD ESTIMATION IN STFT DOMAIN,” proc. ICASSP 2013,pp.674-678Shigeki Miyabe, Nobutaka Ono, and Shoji Makino, “BLIND COMPENSATION OF INTER-CHANNEL SAMPLING FREQUENCYMISMATMAT WITH MAXIMUM LIKELIHOOD ESTIMATION IN STFT DOMAIN,” proc. ICASSP 2013, pp.674-678

しかし、非特許文献1に開示の技術や特許文献1に開示の技術には、制約が多く、汎用性に欠けるといった問題がある。例えば、非特許文献1に開示の技術には、基準信号(パイロット信号)を発生する装置が必要になり、また、基準信号によって録音信号に影響が生じてしまう、といった問題がある。一方、特許文献1に開示の技術には、同一の信号が一定間隔で繰り返し送出されるという条件でなければ利用することができない、といった問題がある。これに対して、非特許文献2には、汎用性に欠けるといった問題はないものの、その実行には多大な計算量を要し、サンプリング周波数ズレの推定を完了するまでに要する計算時間が長い、とった問題がある。   However, the technique disclosed in Non-Patent Document 1 and the technique disclosed in Patent Document 1 have a problem that there are many restrictions and lacks versatility. For example, the technique disclosed in Non-Patent Document 1 requires a device that generates a reference signal (pilot signal), and has a problem that the recording signal is affected by the reference signal. On the other hand, the technique disclosed in Patent Document 1 has a problem that it cannot be used unless the same signal is repeatedly transmitted at a constant interval. On the other hand, although Non-Patent Document 2 does not have a problem of lack of versatility, its execution requires a large amount of calculation and requires a long calculation time to complete estimation of the sampling frequency deviation. There is a problem I took.

本発明は以上に説明した課題に鑑みて為されたものであり、同じ波形を別個独立にサンプリングして得られる複数の信号の同期を従来よりも短い計算時間で実現することが可能で、かつ高い汎用性を有する技術を提供することを目的とする。   The present invention has been made in view of the problems described above, and it is possible to realize synchronization of a plurality of signals obtained by independently sampling the same waveform in a shorter calculation time than in the past, and It aims at providing the technology which has high versatility.

上記課題を解決するために本発明は、同じ波形を別個独立にサンプリングして得られる複数の信号のうちの1つを基準信号とし、残りの信号のうちの1つを補正対象信号として、前記基準信号と前記補正対象信号の一方を時間軸方向にずらしつつ両信号の相関をフレーム毎に算出し、その算出結果に応じて両信号の時間ズレ量をフレーム毎に算出する時間ズレ量算出部と、前記時間ズレ量算出部により算出された時間ズレ量から、各フレームにおける前記補正対象信号のサンプリング周波数の誤差の推定値である第1の推定値をフレーム毎に算出する誤差算出部と、前記誤差算出部によりフレーム毎に算出された前記第1の推定値に統計処理を施して前記補正対象信号全体に亘るサンプリング周波数の誤差の推定値である第2の推定値を算出し出力する統計処理部と、を有することを特徴とするサンプリング周波数推定装置、を提供する。なお、補正対象信号のサンプリング周波数の誤差は基準信号のサンプリング周波数からの補正対象信号のサンプリング周波数のズレであるから、当該誤差と基準信号のサンプリング周波数とから補正対象信号のサンプリング周波数を求めることができる。したがって、当該誤差の推定値を算出すること(すなわち、当該誤差を推定すること)は補正対象信号のサンプリング周波数を推定することと等価である。   In order to solve the above problem, the present invention uses one of a plurality of signals obtained by sampling the same waveform separately and independently as a reference signal, and one of the remaining signals as a correction target signal. A time shift amount calculation unit that calculates the correlation between both signals for each frame while shifting one of the reference signal and the correction target signal in the time axis direction, and calculates the time shift amount of both signals for each frame according to the calculation result An error calculation unit that calculates, for each frame, a first estimated value that is an estimated value of the sampling frequency error of the correction target signal in each frame from the time shift amount calculated by the time shift amount calculation unit; Statistical processing is performed on the first estimated value calculated for each frame by the error calculating unit to calculate a second estimated value that is an estimated value of the sampling frequency error over the entire correction target signal. Providing sampling frequency estimating apparatus, characterized by having a statistical processing unit for outputting. Since the error in the sampling frequency of the correction target signal is a deviation of the sampling frequency of the correction target signal from the sampling frequency of the reference signal, the sampling frequency of the correction target signal can be obtained from the error and the sampling frequency of the reference signal. it can. Therefore, calculating the estimated value of the error (that is, estimating the error) is equivalent to estimating the sampling frequency of the correction target signal.

このようなサンプリング周波数推定装置によれば、同じ波形を別個独立にサンプリングして得られる複数の信号のうちの1つを基準信号とし、残りの信号の各々を補正対象信号として各補正対象信号のサンプリング周波数の誤差の推定値を算出し、時間軸圧伸などの既存の技術を用いてその誤差を補正することで、各補正対象信号を基準信号に同期させることが可能になる。本発明のサンプリング周波数推定装置では、パイロット信号を必要とせず、また各信号は一定時間に亙って繰り返し出力されたものである必要もないため、非特許文献1や特許文献1に開示の技術に比較して汎用性が高い。また詳細については後述するが、本発明のサンプリング周波数推定装置によれば非特許文献2に開示の技術を用いた場合よりも短い計算時間で補正対象信号のサンプリング周波数の誤差を算出することができ、同じ波形を別個独立にサンプリングして得られる複数の信号の同期を従来よりも短い計算時間で実現することが可能になる。   According to such a sampling frequency estimation device, one of a plurality of signals obtained by independently sampling the same waveform is used as a reference signal, and each of the remaining signals is used as a correction target signal. By calculating an estimated value of the sampling frequency error and correcting the error using an existing technique such as time axis companding, it becomes possible to synchronize each correction target signal with the reference signal. The sampling frequency estimation apparatus of the present invention does not require a pilot signal, and each signal does not need to be repeatedly output over a certain period of time. Therefore, the technology disclosed in Non-Patent Document 1 and Patent Document 1 Higher versatility than Although details will be described later, according to the sampling frequency estimation apparatus of the present invention, the error of the sampling frequency of the correction target signal can be calculated in a shorter calculation time than when the technique disclosed in Non-Patent Document 2 is used. The synchronization of a plurality of signals obtained by sampling the same waveform separately and independently can be realized in a shorter calculation time than in the prior art.

統計処理部の具体的な構成としては、誤差算出部によりフレーム毎に算出された第1の推定値(すなわち、各フレームにおける大まかな誤差の推定値)から、統計的にエラーを多く含むと推定される外れ値を除外する第1の統計フィルタ処理と、第1の統計フィルタ処理より外れ値が除外された一群の第1の推定値を平滑化するフィルタ処理(例えば、平均値を算出する処理)と当該一群の第1の推定値から代表値を選択するフィルタ処理(例えば、中央値を選択する処理)の何れか一方からなる第2の統計フィルタ処理とで上記統計処理を構成し、第2の統計フィルタ処理の処理結果を第2の推定値(補正対象信号全体に亘るサンプリング周波数の誤差の推定値)として出力する構成が考えられる。   As a specific configuration of the statistical processing unit, it is estimated that there are statistically many errors from the first estimated value calculated for each frame by the error calculating unit (that is, an estimated value of a rough error in each frame). First statistical filter processing for excluding outliers to be performed, and filter processing for smoothing a group of first estimated values from which outliers have been excluded from the first statistical filter processing (for example, processing for calculating an average value) ) And a second statistical filter process consisting of any one of a filter process for selecting a representative value from the group of first estimated values (for example, a process for selecting a median value), A configuration is conceivable in which the processing result of the second statistical filter processing is output as a second estimated value (estimated value of sampling frequency error over the entire correction target signal).

第1の統計フィルタ処理の具体例としては、誤差算出部によりフレーム毎に算出された第1の推定値をその大きさ順にソートした場合における両端から所定個数分、または両端から所定個数番目の各値に応じて定まる範囲に属さないもの、を外れ値として除去する処理が挙げられる。例えば、上記所定個数が誤差算出部により算出された第1の推定値の総数の1/4であれば、第1四分位数未満の値と第3四分位数より大きい値を外れ値として除外することになる。また、第1四分位数および第3四分位数に重みを付与して上記範囲を定める態様であれば所謂四分位数範囲法により外れ値を除外することになる。   As a specific example of the first statistical filter processing, each of the first estimated value calculated for each frame by the error calculation unit when the first estimated value is sorted in order of the size, or a predetermined number from the both ends. There is a process of removing those that do not belong to the range determined according to the value as outliers. For example, if the predetermined number is 1/4 of the total number of the first estimated values calculated by the error calculating unit, a value less than the first quartile and a value greater than the third quartile are outliers. Will be excluded. In addition, outliers are excluded by the so-called quartile range method if weights are assigned to the first and third quartiles to define the above range.

より好ましい態様においては、時間ズレ量算出部は、基準信号および補正対象信号のパワーが所定の閾値未満であるフレームを時間ズレ量の算出対象から除外することを特徴とする。上記閾値を適切な値に定めておけば、基準信号を充分な強度で含んでいないフレームや補正対象信号を充分な強度で含んでいないフレームは時間ズレ量の算出対象から除外される。基準信号を充分な強度で含んでいないフレームや補正対象信号を充分な強度で含んでいないフレームを参照して時間ズレ量を算出したとしてもエラーを多く含むものとなってしまう。このような時間ズレ量に基づいて算出された誤差の推定値は外れ値として第1の統計フィルタ処理で除外される可能性が高く、そもそも時間ズレ量の算出自体が無駄になってしまう。このような態様によれば、時間ズレ量算出部において無駄な演算が行われることを回避して補正対象信号のサンプリング周波数の推定に要する処理時間をさらに短くしつつ、サンプリング周波数の誤差を高い精度で算出することが可能になる。   In a more preferred aspect, the time deviation amount calculation unit is characterized in that a frame in which the power of the reference signal and the correction target signal is less than a predetermined threshold is excluded from the time deviation amount calculation target. If the threshold is set to an appropriate value, a frame that does not include the reference signal with sufficient intensity and a frame that does not include the correction target signal with sufficient intensity are excluded from the calculation target of the amount of time deviation. Even if the amount of time shift is calculated with reference to a frame that does not include the reference signal with sufficient intensity or a frame that does not include the correction target signal with sufficient intensity, it includes many errors. The estimated error value calculated based on such a time shift amount is likely to be excluded by the first statistical filter process as an outlier, and the calculation of the time shift amount itself becomes useless in the first place. According to such an aspect, it is possible to avoid a wasteful calculation in the time shift amount calculation unit and further reduce the processing time required for estimating the sampling frequency of the correction target signal, while reducing the sampling frequency error with high accuracy. It becomes possible to calculate by.

また、別の好ましい態様においては、時間ズレ量算出部は、基準信号と補正対象信号の相関を表す値(例えば、時間をずらしつつ算出した複数の相互相関関数のうちの最大値)が所定の閾値を下回るフレームを時間ズレ量の算出対象から除外することを特徴とする。上記閾値を適切な値に定めておけば、補正対象信号を構成するフレームのうち基準信号にて対応するフレームとの相関が低いフレームについて時間ズレ量の算出が行われることはない。このようなフレームについて時間ズレ量を算出したとしてもエラーを多く含むものとなってしまい、このような時間ズレ量に基づいて算出された誤差の推定値は外れ値として上記第1の統計フィルタ処理にて除外される可能性が高く、そもそも時間ズレ量の算出自体が無駄になってしまう。このような態様によっても、時間ズレ量算出部において無駄な演算が行われることを回避し補正対象信号のサンプリング周波数の推定に要する処理時間をさらに短くしつつ、サンプリング周波数を高い精度で算出することが可能になる。   In another preferred embodiment, the time deviation amount calculation unit has a value representing a correlation between the reference signal and the correction target signal (for example, a maximum value among a plurality of cross-correlation functions calculated while shifting the time). Frames that are less than the threshold value are excluded from the calculation target of the time shift amount. If the threshold value is set to an appropriate value, the time shift amount is not calculated for a frame having a low correlation with the frame corresponding to the reference signal among the frames constituting the correction target signal. Even if the time shift amount is calculated for such a frame, it contains a lot of errors, and the error estimated value calculated based on such a time shift amount is regarded as an outlier as the first statistical filter processing. In the first place, the calculation of the amount of time deviation itself becomes useless. Even in such an aspect, it is possible to calculate the sampling frequency with high accuracy while avoiding unnecessary calculation in the time deviation amount calculation unit and further shortening the processing time required to estimate the sampling frequency of the correction target signal. Is possible.

上記課題を解決するための別の態様としては、CPU(Central Processing Unit)などの一般的なコンピュータを、上記時間ズレ量算出部、誤差算出部および統計処理部として機能させるプログラムを提供する態様が考えられる。このようなプログラムにしたがって一般的なコンピュータを作動させることで、当該コンピュータを本発明のサンプリング周波数推定装置として機能させることが可能になるからである。なお、このようなプログラムの具体的な提供態様としては、CD−ROM(Compact Disk-Read Only Memory)などのコンピュータ読み取り可能な記録媒体に当該プログラムを書き込んで配布する態様や、インターネットなどの電気通信回線経由のダウンロードにより配布する態様が考えられる。   As another aspect for solving the above problem, there is an aspect that provides a program that causes a general computer such as a CPU (Central Processing Unit) to function as the time shift amount calculation unit, the error calculation unit, and the statistical processing unit. Conceivable. This is because by operating a general computer according to such a program, it becomes possible to cause the computer to function as the sampling frequency estimation device of the present invention. In addition, as a specific provision mode of such a program, a mode in which the program is written and distributed on a computer-readable recording medium such as a CD-ROM (Compact Disk-Read Only Memory), or an electric communication such as the Internet A mode of distribution by downloading via a line is conceivable.

また、上記課題を解決するためのさらに別の態様としては、同じ波形を別個独立にサンプリングして得られる複数の信号のうちの1つを基準信号とし、残りの信号のうちの1つを補正対象信号として、前記基準信号と前記補正対象信号の一方を時間軸方向にずらしつつ両信号の相互相関関数をフレーム毎に算出し、その算出結果に応じて両信号の時間ズレ量をフレーム毎に算出する時間ズレ量算出ステップと、前記時間ズレ量算算出ステップにて算出された時間ズレ量から、各フレームにおける前記補正対象信号のサンプリング周波数の誤差の推定値をフレーム毎に算出する誤差算出ステップと、誤差算出ステップにてフレーム毎に算出された誤差の推定値に統計処理を施して前記補正対象信号のサンプリング周波数の誤差の推定値を算出し出力する統計処理ステップと、を有することを特徴とするサンプリング周波数推定方法を提供する態様も考えられる。また、CPUなどの一般的なコンピュータに、上記時間ズレ量算出ステップ、上記誤差算出ステップおよび上記統計処理ステップの各ステップを実行させるプログラムを提供する態様も考えられる。   As another mode for solving the above problem, one of a plurality of signals obtained by independently sampling the same waveform is used as a reference signal, and one of the remaining signals is corrected. As a target signal, the cross-correlation function of both signals is calculated for each frame while shifting one of the reference signal and the correction target signal in the time axis direction, and the time shift amount of both signals is calculated for each frame according to the calculation result. A time shift amount calculation step to be calculated, and an error calculation step of calculating, for each frame, an estimated value of the sampling frequency error of the correction target signal in each frame from the time shift amount calculated in the time shift amount calculation step. The error calculation step performs statistical processing on the error estimation value calculated for each frame to calculate the sampling frequency error estimation value of the correction target signal. Aspect to provide a sampling frequency estimation method characterized by comprising: a statistical processing step of force, also conceivable. In addition, a mode is also conceivable in which a program for causing a general computer such as a CPU to execute the steps of the time deviation calculation step, the error calculation step, and the statistical processing step is conceivable.

本発明の一実施形態のサンプリング周波数推定装置10の構成例および同サンプリング周波数推定装置10を含む信号処理システム1の構成例を示すブロック図である。It is a block diagram which shows the structural example of the sampling frequency estimation apparatus 10 of one Embodiment of this invention, and the structural example of the signal processing system 1 containing the sampling frequency estimation apparatus 10. FIG. サンプリング周波数推定装置10により得られたフレーム毎のサンプリング周波数の推定結果を示す図である。It is a figure which shows the estimation result of the sampling frequency for every flame | frame obtained by the sampling frequency estimation apparatus. 四分位数と四分位数範囲を説明するための図である。It is a figure for demonstrating a quartile and a quartile range. 四分位数に基づく外れ値除去処理の効果を説明するための図である。It is a figure for demonstrating the effect of the outlier removal process based on a quartile. 本実施形態と非特許文献2に開示の技術についての評価実験の実験結果を示す図である。It is a figure which shows the experimental result of the evaluation experiment about the technique disclosed by this embodiment and a nonpatent literature 2. FIG. 本実施形態と非特許文献2に開示の技術についての評価実験の実験結果を示す図である。It is a figure which shows the experimental result of the evaluation experiment about the technique disclosed by this embodiment and a nonpatent literature 2. FIG.

以下図面を参照しつつ本発明の実施形態を説明する。
(A:構成)
図1は、本発明の一実施形態のサンプリング周波数推定装置10の構成例および同サンプリング周波数推定装置10を含む信号処理システム1の構成例を示すブロック図である。この信号処理システム1には、同じ音波形をN(Nは2以上の自然数)台の録音機器(例えばスマートフォンやICレコーダなど)の各々により別個独立にサンプリングして得られた各音信号(サンプル列)X(t)(n=1〜N)が入力される。なお、N台の録音機器における録音開始タイミングの同期については既存技術を適宜用いるようにすれば良い。例えば、各録音機器がインターネットなどの電気通信回線経由の通信を実行可能であれば、当該通信により録音開始タイミングを合せれば良く、Bluetooth(登録商標)など他の通信手段による通信が可能であれば、当該通信手段による通信により録音開始タイミングを合せれば良い。
Embodiments of the present invention will be described below with reference to the drawings.
(A: Configuration)
FIG. 1 is a block diagram illustrating a configuration example of a sampling frequency estimation apparatus 10 and a configuration example of a signal processing system 1 including the sampling frequency estimation apparatus 10 according to an embodiment of the present invention. In this signal processing system 1, each sound signal (sample) obtained by independently sampling the same sound waveform by each of N (N is a natural number of 2 or more) recording devices (for example, a smartphone or an IC recorder). Column) X n (t) (n = 1 to N) is input. In addition, what is necessary is just to use an existing technique suitably about the synchronization of the recording start timing in N recording apparatuses. For example, if each recording device can execute communication via an electric communication line such as the Internet, the recording start timing may be adjusted by the communication, and communication by other communication means such as Bluetooth (registered trademark) is possible. For example, the recording start timing may be adjusted by communication by the communication means.

上記N台の録音機器におけるサンプリング周波数は何れも同じ値(例えば44.1kHz)に設定されてはいるが、各録音機器のクロック・ジェネレータが完全に同一のクロック周波数で動作する訳ではなく、各録音機器におけるサンプリング周波数には微妙なズレがある。このため、各録音機器で録音開始タイミングを揃えて録音を行い、上記N個の音信号をその先頭を揃えて再生したとしても、次第に音がズレ、再生が進むにつれてそのズレは大きくなる。本実施形態の信号処理システム1は、上記N個の音信号間のサンプリング周波数の誤差を推定して補正し、これらN個の音信号を同期させることができるようにするためのものである。   Although the sampling frequencies of the N recording devices are all set to the same value (for example, 44.1 kHz), the clock generators of the recording devices do not operate at the same clock frequency. There is a slight shift in the sampling frequency of recording equipment. For this reason, even when recording is performed with the recording start timings being adjusted at each recording device and the N sound signals are reproduced with their heads aligned, the sound gradually shifts, and the shift increases as playback proceeds. The signal processing system 1 of the present embodiment is for estimating and correcting an error in sampling frequency between the N sound signals so that these N sound signals can be synchronized.

図1に示すように信号処理システム1は、サンプリング周波数推定装置10と、時間軸圧伸装置20とを含んでいる。サンプリング周波数推定装置10には、上記N個の音信号が与えられる。サンプリング周波数推定装置10は、これらN個の音信号のうちの1つを基準信号とし、残りのN−1個の音信号の各々を補正対象信号として、基準信号のサンプリング周波数に対する各補正対象信号のサンプリング周波数のズレ(すなわち、誤差)を補正対象信号毎に推定し、その推定結果を示すデータを時間軸圧伸装置20に与える。時間軸圧伸装置20は、補正対象信号毎に推定されたサンプリング周波数の誤差が解消されるように各補正対象信号に時間軸圧伸を施す。これにより、N個の音信号の同期が実現さされる。時間軸圧伸装置20における時間軸圧伸アルゴリズムとしては既存の技術を適宜用いるようにすれば良い。本実施形態では、サンプリング周波数推定装置10に本実施形態の特徴を顕著に示す処理を実行させることで、上記各補正対象信号のサンプリング周波数の誤差の推定を従来よりも短い計算時間で実現しつつ、高い汎用性を確保することが可能になっている。以下では、本実施形態の特徴を顕著に示すサンプリング周波数推定装置10を中心に説明する。   As shown in FIG. 1, the signal processing system 1 includes a sampling frequency estimation device 10 and a time axis companding device 20. The N sound signals are given to the sampling frequency estimation apparatus 10. The sampling frequency estimation device 10 uses one of these N sound signals as a reference signal and each of the remaining N−1 sound signals as a correction target signal, thereby correcting each correction target signal with respect to the sampling frequency of the reference signal. The sampling frequency deviation (ie, error) is estimated for each correction target signal, and data indicating the estimation result is given to the time axis companding device 20. The time axis companding device 20 performs time axis companding on each correction target signal so that the error of the sampling frequency estimated for each correction target signal is eliminated. Thereby, synchronization of N sound signals is realized. As the time axis companding algorithm in the time axis companding device 20, an existing technique may be appropriately used. In the present embodiment, by causing the sampling frequency estimation apparatus 10 to execute processing that clearly shows the features of the present embodiment, the estimation of the sampling frequency error of each correction target signal is realized in a shorter calculation time than in the past. It is possible to ensure high versatility. Below, it demonstrates centering on the sampling frequency estimation apparatus 10 which shows the characteristic of this embodiment notably.

サンプリング周波数推定装置10は、図1に示すように、短時間フーリエ変換(図1では、「STFT」と表記)部100、時間ズレ量算出部110、誤差算出部120、および統計処理部130を含んでいる。図1に示す各部は電子回路で構成されたハードウェアモジュールであっても良いし、CPU(Central Processing Unit)を信号処理プログラムに従って作動させることで実現されるソフトウェアモジュールであっても良い。   As shown in FIG. 1, the sampling frequency estimation device 10 includes a short-time Fourier transform (indicated as “STFT” in FIG. 1) unit 100, a time shift amount calculation unit 110, an error calculation unit 120, and a statistical processing unit 130. Contains. Each unit illustrated in FIG. 1 may be a hardware module configured by an electronic circuit, or may be a software module realized by operating a CPU (Central Processing Unit) according to a signal processing program.

STFT部100は、サンプリング周波数推定装置10へ入力された音信号X(t)(n=1〜N)の各々を所定サンプル数ずつのフレームに区切り、フレーム毎に短時間フーリエ変換を施して周波数領域の信号X(f)(fは周波数を表す変数、以下、同じ)に変換して時間ズレ量算出部110に与える。STFT部100にて使用する変換アルゴリズムについては周知のものを適宜利用すれば良い。 The STFT unit 100 divides each of the sound signals X n (t) (n = 1 to N) input to the sampling frequency estimation device 10 into frames of a predetermined number of samples, and performs a short-time Fourier transform for each frame. The signal is converted into a frequency domain signal X n (f) (f is a variable representing frequency, hereinafter the same), and is supplied to the time shift amount calculation unit 110. Any known conversion algorithm used in the STFT unit 100 may be used as appropriate.

時間ズレ量算出部110は、N個の音信号のうちの1つを基準信号として選択し、残りのN−1個の音信号の各々を補正対象信号として順次選択し、基準信号と補正対象信号の一方を時間軸方向にずらしつつ両信号の相互相関関数をフレーム毎に算出して両信号の時間ズレ量をフレーム毎に算出する。以下では基準信号としてXref(f)が選択され、補正対象信号としてX(f)(k≠ref)が選択された場合を例に取って時間ズレ量算出部110が実行する処理を詳細に説明する。 The time shift amount calculation unit 110 selects one of the N sound signals as a reference signal, sequentially selects each of the remaining N−1 sound signals as a correction target signal, and selects the reference signal and the correction target. While shifting one of the signals in the time axis direction, the cross-correlation function of both signals is calculated for each frame, and the amount of time shift between both signals is calculated for each frame. In the following, details of the process performed by the time shift amount calculation unit 110 will be described by taking as an example the case where X ref (f) is selected as the reference signal and X k (f) (k ≠ ref) is selected as the correction target signal. Explained.

時間ズレ量算出部110は、まず、基準信号Xref(f)と補正対象信号X(f)(k≠ref)の各々のフレーム毎の相互相関関数C(τ)をτの値を変えつつ算出する。相互相関関数C(τ)を算出するのは、時間ズレ量を補正する方法として相互相関関数が最大となるサンプル点を推定する方法が一般に知られているからである。一般に相互相関関数C(τ)は、時間領域の2つのアナログ信号x(t)とy(t)があった時、以下の数1で表される。また、デジタル信号であれば、以下の数2で表される。

Figure 0006229576

Figure 0006229576
First, the time shift amount calculation unit 110 changes the value of τ in the cross-correlation function C (τ) for each frame of the reference signal X ref (f) and the correction target signal X k (f) (k ≠ ref). While calculating. The reason why the cross-correlation function C (τ) is calculated is that a method for estimating the sample point at which the cross-correlation function is maximized is generally known as a method for correcting the amount of time deviation. In general, the cross-correlation function C (τ) is expressed by the following formula 1 when there are two analog signals x (t) and y (t) in the time domain. In the case of a digital signal, it is expressed by the following formula 2.
Figure 0006229576

Figure 0006229576

数1或いは数2により算出される相互相関関数C(τ)は、2つの信号のどちらかを時間軸方向にτだけずらして内積を取ることに相当する。「同じ信号が2つの信号のどこかに含まれている」という仮定が成り立つのであれば、相互相関関数が最大となるτを求めることで、2つの信号の時間ズレ量を推定できると考えられる。なお、2つの信号のフーリエ変換X(f)とY(f)とを考えると、相互相関関数C(τ)は以下の数3により計算される。数3の右辺のIFFT()は逆フーリエ変換を表す演算子であり、X(f)はX(f)の複素共役を表す。

Figure 0006229576
The cross-correlation function C (τ) calculated by Equation 1 or Equation 2 corresponds to taking an inner product by shifting either of the two signals by τ in the time axis direction. If the assumption that “the same signal is included somewhere in the two signals” holds, it is considered that the amount of time deviation between the two signals can be estimated by obtaining τ that maximizes the cross-correlation function. . Considering the Fourier transforms X (f) and Y (f) of the two signals, the cross-correlation function C (τ) is calculated by the following equation (3). IFFT () on the right side of Equation 3 is an operator representing inverse Fourier transform, and X * (f) represents a complex conjugate of X (f).
Figure 0006229576

本実施形態の時間ズレ量算出部110は、基準信号Xref(f)と補正対象信号X(f)(k≠ref)の各フレームの相互相関関数C(τ)をτの値を変えつつ数3にしたがって算出する。具体的には、時間ズレ量算出部110は、基準信号におけるi番目のフレームについての信号Xref(f)の複素共役を数3右辺のX(f)とし、補正対象信号におけるi番目のフレームについての信号X(f)(k≠ref)を数3右辺のY(f)としてτを変えつつ数3の演算を行い、相互相関関数C(τ)が最大になるτを特定する。そして、時間ズレ量算出部110は、このようにして特定したτを、補正対象信号X(f)のi番目のフレームについての時間ズレ量の推定値Nki(すなわち、相互相関関数C(τ)を最大にするτ)として誤差算出部120に与える。他の番号のフレームについても同様である。 The time shift amount calculation unit 110 according to the present embodiment changes the value of τ in the cross-correlation function C (τ) of each frame of the reference signal X ref (f) and the correction target signal X k (f) (k ≠ ref). However, the calculation is performed according to Equation 3. Specifically, the time shift amount calculation unit 110 sets the complex conjugate of the signal X ref (f) for the i-th frame in the reference signal as X * (f) on the right side of Equation 3, and sets the i-th in the correction target signal. The signal X k (f) (k ≠ ref) for the frame is changed to Y (f) on the right side of the equation 3 and the calculation of the equation 3 is performed while τ is changed to specify τ that maximizes the cross-correlation function C (τ). . Then, the time shift amount calculation unit 110 uses the τ specified in this way to estimate the time shift amount N ki (that is, the cross-correlation function C () for the i-th frame of the correction target signal X k (f). The error calculation unit 120 is given as τ) that maximizes τ). The same applies to frames with other numbers.

本実施形態において数1或いは数2の時間領域の演算ではなく、数3に示す周波数領域の演算により相互相関関数C(τ)を算出するようにしたのは、計算量の点で有利なことがあるからである。本実施形態では、時間ズレ量算出部110にて数3に示す演算により相互相関関数C(τ)を算出できるようにするために、STFT部100が設けられている。したがって、時間ズレ量算出部110にて数1或いは数2に示す演算により相互相関関数C(τ)を算出するのであればSTFT部100を省略しても良い。   In the present embodiment, it is advantageous in terms of calculation amount to calculate the cross-correlation function C (τ) by the frequency domain calculation shown in Formula 3 instead of the time domain calculation of Formula 1 or Formula 2. Because there is. In the present embodiment, the STFT unit 100 is provided so that the cross-correlation function C (τ) can be calculated by the calculation shown in Equation 3 in the time deviation calculation unit 110. Therefore, the STFT unit 100 may be omitted if the cross-correlation function C (τ) is calculated by the calculation shown in Equation 1 or 2 in the time deviation calculation unit 110.

誤差算出部120は、時間ズレ量算出部110から与えられる各フレームの時間ズレ量Nkiに基づいて、基準信号のサンプリング周波数fに対する補正対象信号のサンプリング周波数の誤差の推定値(以下、第1の推定値)Ekiをフレーム毎に算出する。例えば、i番目のフレームについての時間ズレ量がNkiであり、補正対象信号X(f)におけるi番目のフレームの先頭サンプルが当該信号の先頭からSki番目のサンプルであった場合には、誤差算出部120は、当該i番目のフレームについての上記第1の推定値Ekiを以下の数4にしたがって算出し、統計処理部130に与える。前述したように、時間ズレ量算出部110により算出された時間ズレ量Nkiは基準信号の先頭を基準としたズレ量であるため、本実施形態のようにSTFTによって各フレームの相互相関関数を求めた場合にはフレーム先頭を基準としたズレ量である。このため、i番目のフレームでの相互相関関数を基にした補正対象信号X(f)のサンプリング周波数の誤差の推定値Ekiは以下の数4により表される。

Figure 0006229576
Based on the time shift amount N ki of each frame given from the time shift amount calculation unit 110, the error calculation unit 120 estimates the error (hereinafter referred to as the first value) of the sampling frequency error of the correction target signal with respect to the sampling frequency f s of the reference signal. (Estimated value of 1) E ki is calculated for each frame. For example, when the time shift amount for the i-th frame is N ki and the first sample of the i-th frame in the correction target signal X k (f) is the S ki- th sample from the head of the signal. The error calculation unit 120 calculates the first estimated value E ki for the i-th frame according to the following Equation 4, and provides the statistical processing unit 130 with it. As described above, the time shift amount N ki calculated by the time shift amount calculation unit 110 is a shift amount with reference to the head of the reference signal, so that the cross-correlation function of each frame is calculated by the STFT as in this embodiment. When it is obtained, the amount of deviation is based on the frame head. Therefore, the estimated value E ki of the sampling frequency error of the correction target signal X k (f) based on the cross-correlation function in the i-th frame is expressed by the following equation (4).
Figure 0006229576

統計処理部130は、誤差算出部120によりフレーム毎に算出された第1の推定値Ekiに統計処理を施して補正対象信号全体に亘るサンプリング周波数の誤差の推定値(以下、第2の推定値)Eを算出し、時間軸圧伸装置20へ出力する。図1に示すように、統計処理部130は、第1の統計フィルタ処理部130aと第2の統計フィルタ処理部130bとを含んでいる。つまり、統計処理部130の実行する統計処理は、第1の統計フィルタ処理部130aの実行する処理と第2の統計フィルタ処理部130bの実行する処理により構成されている。これら各統計フィルタ処理部の実行する処理の内容は以下の通りである。 The statistical processing unit 130 performs statistical processing on the first estimated value E ki calculated for each frame by the error calculating unit 120 to estimate the sampling frequency error over the entire correction target signal (hereinafter, the second estimated value). Value) E is calculated and output to the time axis companding device 20. As shown in FIG. 1, the statistical processing unit 130 includes a first statistical filter processing unit 130a and a second statistical filter processing unit 130b. That is, the statistical processing executed by the statistical processing unit 130 includes processing executed by the first statistical filter processing unit 130a and processing executed by the second statistical filter processing unit 130b. The contents of the processing executed by each statistical filter processing unit are as follows.

第1の統計フィルタ処理部130aは、誤差算出部120によりフレーム毎に算出された第1の推定値Ekiから、統計的にエラーを多く含むと推定される外れ値を除外する第1の統計フィルタ処理を実行する。誤差算出部120によりフレーム毎に算出された第1の推定値Ekiには、多くのエラーが含まれていることが多い。上記第1の推定値Ekiは、補正対象信号X(f)および基準信号Xref(f)の各々のi番目のフレームの情報のみに基づいて、両信号のサンプリング周波数のズレを大まかに推定した値だからである。図2は人工的にサンプリング周波数を3Hzずらして実験した時のフレーム毎のサンプリング周波数推定結果である。なお、基準信号のサンプリング周波数に対する補正対象信号のサンプリング周波数の誤差が判れば、基準信号のサンプリング周波数と当該誤差から補正対象信号のサンプリング周波数を算出できるのであるから、上記誤差の推定と補正対象信号のサンプリング周波数の推定は等価である。図2に示すように、フレーム毎に推定したサンプリング周波数に大きなバラツキがあるのは、サンプリング周波数ズレに起因するごく小さな時間ズレを高い精度で推定することが難しいためであると考えられる。 The first statistical filter processing unit 130a excludes outliers that are statistically estimated to contain many errors from the first estimated value Eki calculated for each frame by the error calculating unit 120. Perform filtering. The first estimated value E ki calculated for each frame by the error calculation unit 120 often includes many errors. The first estimated value E ki roughly approximates the deviation of the sampling frequency of both signals based only on the i-th frame information of the correction target signal X k (f) and the reference signal X ref (f). This is because it is an estimated value. FIG. 2 shows a sampling frequency estimation result for each frame when an experiment is performed by artificially shifting the sampling frequency by 3 Hz. If the error of the sampling frequency of the correction target signal with respect to the sampling frequency of the reference signal is known, the sampling frequency of the correction target signal can be calculated from the sampling frequency of the reference signal and the error. The sampling frequency estimates of are equivalent. As shown in FIG. 2, the sampling frequency estimated for each frame has a large variation because it is difficult to estimate a very small time shift due to the sampling frequency shift with high accuracy.

本実施形態では、誤差算出部120により算出された第1の推定値Ekiのうち、他のものと比較して大きく外れるような値を外れ値として除去する処理が第1の統計フィルタ処理として採用されている。具体的には、本実施形態では、第1の統計フィルタ処理として所謂四分位数に基づく処理が採用されている。ここで、四分位数とは、処理対象のデータを大きさの順にソートした後に、それらを四等分する区切りの数のことを言い、小さい方から第1四分位数、第2四分位数、第3四分位数と呼ばれる(図3参照)。また、第1四分位数と第2四分位数の差は、四分位数範囲(Interquartile range; IQR)と呼ばれる。四分位数範囲はサンプルのバラつき具合を表す1つの指標である。 In the present embodiment, the first statistical filter process is a process of removing, as an outlier, a value that deviates significantly from the first estimated value E ki calculated by the error calculation unit 120 as compared to other values. It has been adopted. Specifically, in the present embodiment, a process based on a so-called quartile is employed as the first statistical filter process. Here, the quartile means the number of divisions into which the data to be processed is sorted in order of size and then is divided into four equal parts. The first quartile and the second fourth It is called the quantile and the third quartile (see FIG. 3). Further, the difference between the first quartile and the second quartile is called an interquartile range (IQR). The quartile range is an index that represents the degree of variation of the sample.

より詳細に説明すると、第1の統計フィルタ処理部130aは、まず、誤差算出部120によりフレーム毎に算出された第1の推定値Ekiをその大きさ順にソートする。次いで、第1の統計フィルタ処理部130aは、誤差算出部120によりフレーム毎に算出された第1の推定値Ekiのうち、上記ソート結果における第1四分位数より小さい値、もしくは第3四分位数より大きい値を外れ値として除外し、その残り(すなわち、外れ値を含まない一群の第1の推定値E´ki)を第2の統計フィルタ処理部130bに引き渡す。ここで、外れ値を検出する演算o()は以下の数5により表される。具体的には、数5におけるe(n)に誤差算出部120により算出された第1の推定値Ekiの各々を代入し、演算o()の値が1であれば当該第1の推定値Ekiを外れ値として除外するといった具合である。qおよびqはそれぞれ第1四分位数および第3四分位数を表す。

Figure 0006229576
More specifically, the first statistical filter processing unit 130a first sorts the first estimated values E ki calculated for each frame by the error calculation unit 120 in the order of the size. Next, the first statistical filter processing unit 130a compares the first estimated value E ki calculated for each frame by the error calculating unit 120 with a value smaller than the first quartile in the sorting result, or the third A value larger than the quartile is excluded as an outlier, and the remainder (that is, a group of first estimated values E ′ ki not including an outlier) is delivered to the second statistical filter processing unit 130b. Here, the calculation o () for detecting the outlier is expressed by the following equation 5. Specifically, each of the first estimated values E ki calculated by the error calculating unit 120 is substituted for e (n) in Equation 5, and if the value of the operation o () is 1, the first estimated value is calculated. For example, the value E ki is excluded as an outlier. q L and q H represent the first and third quartiles, respectively.
Figure 0006229576

本実施形態では、第1の統計フィルタ処理として四分位数に基づく処理が採用されていたが、四分位数に加えて、四分位数範囲を使った処理であっても良い。具体的には、外れ値であるか否かを識別するための演算として数5に示す演算o()に代えて数6に示す演算o()を行えば良い。数6に示す演算は第1、3四分位数にIQRの値を重み付きで加算あるいは減算することを意味している。α=0とすると、数6は数5と一致する。α=1.5で計算する方法が広く知られており、例えば図4に示す箱ひげ図の上下のひげに当たる部分はこれで計算されている。

Figure 0006229576
In the present embodiment, processing based on the quartile is employed as the first statistical filter processing, but processing using a quartile range may be used in addition to the quartile. Specifically, the operation o () shown in Equation 6 may be performed instead of the operation o () shown in Equation 5 as an operation for identifying whether it is an outlier. The calculation shown in Equation 6 means that the IQR value is added to or subtracted from the first and third quartiles with weights. When α = 0, Equation 6 is identical to Equation 5. A method of calculating with α = 1.5 is widely known. For example, portions corresponding to the upper and lower whiskers of the box whisker chart shown in FIG. 4 are calculated with this.
Figure 0006229576

第2の統計フィルタ処理部130bは、第1の統計フィルタ処理部130aより外れ値を除外された一群の第1の推定値E´kiから代表値を選択する第2の統計フィルタ処理(具体的には、中央値を選択するフィルタ処理)を実行し、その処理結果を第2の推定値Eとして時間軸圧伸装置20に与える。なお、上記代表値としては最大値や最小値などを用いることが考えられるが、中央値を用いることが最も好ましいと考えられる。また、第2の統計フィルタ処理部130bの実行する第2の統計フィルタ処理として、第1の統計フィルタ処理部130aより外れ値を除外された一群の第1の推定値E´kiを平滑化するフィルタ処理(第1の統計フィルタ処理部130aより外れ値を除外された一群の第1の推定値E´kiの平均値を算出する処理)を採用しても良いが、本出願人の行った実験によれば、上記中央値を選択するフィルタ処理を採用した方が良好な結果が得られた。このため、本実施形態では、中央値を選択するフィルタ処理が採用されている。
以上がサンプリング周波数推定装置10の構成である。
The second statistical filter processing unit 130b performs second statistical filter processing (specifically, selecting a representative value from the group of first estimated values E ′ ki from which outliers have been excluded from the first statistical filter processing unit 130a. the performs filtering) for selecting the median value, gives the time scale modification apparatus 20 the processing result as a second estimate E k. Although the maximum value and the minimum value can be used as the representative value, the median value is considered most preferable. Further, as the second statistical filter processing executed by the second statistical filter processing unit 130b, the group of first estimated values E ′ ki from which outliers are excluded from the first statistical filter processing unit 130a are smoothed. A filter process (a process of calculating an average value of a group of first estimated values E ′ ki from which outliers have been excluded from the first statistical filter processing unit 130a) may be employed. According to experiments, a better result was obtained when the filter processing for selecting the median was adopted. For this reason, in this embodiment, the filter process which selects a median is employ | adopted.
The above is the configuration of the sampling frequency estimation apparatus 10.

(B:実施形態の効果)
本実施形態によれば、N個の音信号のうちの1つを基準信号、残りのN−1個の音信号の各々を補正対象信号とし、基準信号のサンプリング周波数に対する補正対象信号のサンプリング周波数の誤差が補正対象信号毎にサンプリング周波数推定装置10によって推定され、その誤差が解消されるように時間軸圧伸を補正対象信号に施すことで、N個の音信号の同期が実現される。本出願人は本実施形態の効果を評価するために、非特許文献2に開示の技術を対比の対象として、サンプリング周波数の誤差の推定性能および計算速度(サンプリング周波数の誤差の推定値の算出を完了するまでに要した計算時間の時間長)の観点から評価実験を行った。この評価実験の概要は以下の通りである。
(B: Effect of the embodiment)
According to the present embodiment, one of the N sound signals is a reference signal, each of the remaining N-1 sound signals is a correction target signal, and the sampling frequency of the correction target signal with respect to the sampling frequency of the reference signal Is estimated by the sampling frequency estimation device 10 for each correction target signal, and the time axis companding is applied to the correction target signal so as to eliminate the error, thereby synchronizing N sound signals. In order to evaluate the effect of the present embodiment, the present applicant uses the technique disclosed in Non-Patent Document 2 as a comparison target, and estimates the sampling frequency error estimation performance and calculation speed (calculation of the sampling frequency error estimation value). An evaluation experiment was conducted from the viewpoint of the time length of calculation time required to complete. The outline of this evaluation experiment is as follows.

まず、44.1kHzのサンプリング周波数でサンプリングされた16ビットの10曲の市販曲(ジャンルはポップス、各曲の時間長は10秒)の音信号を原信号とし、この原信号そのままを基準信号、この原信号に人工的にリサンプリング(±5Hz)を施した信号を補正対象信号とし、各補正対象信号のサンプリング周波数の誤差を本実施形態のサンプリング周波数推定装置10および非特許文献2に開示の技術により推定した。なお、本評価実験では、CPUとして3.4GHz駆動のCorei7 3770を有し、32GBのRAMを有する計算機をサンプリング周波数推定装置10として用い、STFT部100等の各部の実装にはMATLAB(登録商標)を用いた。MATLAB(登録商標)とは、米国The MathWorks社の数値解析ソフトウェアである。同様に、非特許文献2に開示の手法もC/C++およびMATLAB(登録商標)で同計算機に実装して実行した。また、FFT長は4096サンプルであり、解析窓として窓長が4096サンプルのHamming窓を用い、さらに、相互相関関数C(τ)を算出する際のシフトサイズ(すなわち、τの更新単位)として8192、4096,2048および1024サンプルを用い、使用するデータ範囲を(3/8)×T〜(5/8)×T(Tはデータ数)とした。   First, a sound signal of 10 commercial songs of 16 bits sampled at a sampling frequency of 44.1 kHz (genre is pop, each song has a duration of 10 seconds) is used as an original signal, and the original signal is used as a reference signal. A signal obtained by artificially performing resampling (± 5 Hz) on the original signal is used as a correction target signal, and an error in the sampling frequency of each correction target signal is disclosed in the sampling frequency estimation device 10 of this embodiment and Non-Patent Document 2. Estimated by technology. In this evaluation experiment, a computer having a 3.4 GHz drive Corei7 3770 as a CPU and a 32 GB RAM is used as the sampling frequency estimation apparatus 10, and MATLAB (registered trademark) is used for mounting each part such as the STFT part 100. Was used. MATLAB (registered trademark) is numerical analysis software of The MathWorks, USA. Similarly, the method disclosed in Non-Patent Document 2 was also implemented on the same computer using C / C ++ and MATLAB (registered trademark). Further, the FFT length is 4096 samples, a Hamming window having a window length of 4096 samples is used as an analysis window, and further, 8192 as a shift size (that is, an update unit of τ) when calculating the cross-correlation function C (τ). , 4096, 2048 and 1024 samples were used, and the data range used was (3/8) × T to (5/8) × T (T is the number of data).

図5(a)は、本実施形態についての推定性能に関する実験結果を示す図であり、図5(b)は非特許文献2に開示の手法についての推定性能に関する実験結果を示す図である。図5(a)と図5(b)を対比すれば明らかなように、最高性能では非特許文献2に開示の技術が上回っている(すなわち、推定誤差が小さい)。しかし、例えば2時間(7200秒)録音し、補正後の補正対象信号の基準信号に対する時間ズレを5ミリ秒以下に押さえる(サンプリング周波数の推定誤差を0.03Hz以内に抑える)といった実用的な範囲の性能は本実施形態でも達成されている。したがって、本実施形態でも実用的な範囲での問題は何ら発生しない。また、図5(a)からは、本実施形態ではシフトサイズによらず同程度の推定性能を実現できていることが判る。シフトサイズは計算量に影響する。つまり、図5(a)の実験結果は、本実施形態によれば計算量を少なくしても実用的な範囲の性能を十分に達成できることを意味している。   FIG. 5A is a diagram illustrating an experimental result regarding the estimation performance for the present embodiment, and FIG. 5B is a diagram illustrating an experimental result regarding the estimation performance for the method disclosed in Non-Patent Document 2. As is clear from a comparison between FIG. 5A and FIG. 5B, the technology disclosed in Non-Patent Document 2 exceeds the maximum performance (that is, the estimation error is small). However, for example, recording is performed for 2 hours (7200 seconds), and a practical range in which the time deviation of the corrected correction target signal with respect to the reference signal is suppressed to 5 milliseconds or less (the sampling frequency estimation error is suppressed to within 0.03 Hz). This performance is also achieved in this embodiment. Therefore, no problem in the practical range occurs in this embodiment. Further, from FIG. 5A, it can be seen that the same estimation performance can be realized in this embodiment regardless of the shift size. The shift size affects the calculation amount. That is, the experimental result of FIG. 5A means that according to the present embodiment, a practical range of performance can be sufficiently achieved even if the amount of calculation is reduced.

図6(a)は、本実施形態についての計算速度に関する実験結果を示す図であり、図6(b)は非特許文献2に開示の手法についての計算速度に関する実験結果を示す図である。る。図6(a)と図6(b)を対比すれば明らかなように、非特許文献2に開示の手法に比較して本実施形態の手法は圧倒的に高速(サンプリング周波数ズレの推定を完了するまでに要した計算時間が短い)であり、MATLAB(登録商標)による実装でも、C/C++による非特許文献2に開示の手法の実装を凌ぐ計算速度が得られていることが判る。以上の実験結果を総括すると、本実施形態によれば、非特許文献2に開示の技術に比較して短い計算時間で実用的な範囲の推定性能を達成することができる、と結論付けられる。   FIG. 6A is a diagram illustrating an experimental result regarding the calculation speed for the present embodiment, and FIG. 6B is a diagram illustrating an experimental result regarding the calculation speed for the method disclosed in Non-Patent Document 2. The As is clear from the comparison between FIG. 6A and FIG. 6B, the method of this embodiment is overwhelmingly faster than the method disclosed in Non-Patent Document 2 (estimation of sampling frequency deviation is completed). It is understood that the calculation time required until the calculation is short), and even with the implementation by MATLAB (registered trademark), the calculation speed exceeding the implementation of the method disclosed in Non-Patent Document 2 by C / C ++ is obtained. When the above experimental results are summarized, it can be concluded that according to the present embodiment, a practical range of estimation performance can be achieved in a shorter calculation time than the technique disclosed in Non-Patent Document 2.

以上説明したように本実施形態によれば、同じ音波形を各々別個にサンプリングして得られる複数の音信号の同期を、非特許文献2に開示の技術に比較して短い計算時間で実現することが可能になる。加えて、本実施形態では、サンプリングされた音信号(換言すれば、録音された音信号)だけで同期が可能であり、パイロット信号を必要とはしないので非特許文献1に開示の技術に比較して高い汎用性を有する。また、本実施形態では、同期対象の各音信号は繰り返し送出されたものである必要はなく、特許文献1に開示の技術に比較して高い汎用性を有する。つまり、本実施形態によれば、同じ波形を別個独立にサンプリングして得られる複数の信号の同期を従来よりも短い計算時間で実現することが可能になり、かつ高い汎用性を実現することが可能になる。   As described above, according to the present embodiment, synchronization of a plurality of sound signals obtained by separately sampling the same sound waveform is realized in a shorter calculation time than the technique disclosed in Non-Patent Document 2. It becomes possible. In addition, in the present embodiment, synchronization is possible only with a sampled sound signal (in other words, a recorded sound signal), and a pilot signal is not required, so that it is compared with the technique disclosed in Non-Patent Document 1. And high versatility. In the present embodiment, each sound signal to be synchronized does not need to be repeatedly transmitted, and has higher versatility than the technique disclosed in Patent Document 1. That is, according to the present embodiment, synchronization of a plurality of signals obtained by independently sampling the same waveform can be realized in a shorter calculation time than in the past, and high versatility can be realized. It becomes possible.

(C:変形)
以上本発明の一実施形態について説明したが、この実施形態に以下の変形を加えても勿論良い。
(1)上記実施形態では、サンプリング周波数推定装置10に入力される複数の信号が、同じ音波形を各々別個独立にサンプリングして得られた複数の音信号である場合について説明した。しかし、サンプリング周波数推定装置10に入力される複数の信号は、同じ波形を各々別個独立にサンプリングして得られたものであれば良く、音信号に限定される訳ではない。また、上記実施形態では、第1の統計フィルタ処理として四分位数を利用した処理を採用したが、例えば、誤差算出部120によりフレーム毎に算出された推定値をその大きさ順にソートした後にそれらを三等分に区切り、小さい方の区切り位置に対応する値よりも小さいもの、および大きい方の区切り位置に対応する値よりも大きいものを外れ値とする処理を採用しても良い。要は、誤差算出部120によりフレーム毎に算出された第1の推定値をその大きさ順にソートした場合における両端から所定個数分、または両端から所定個数番目の各値に応じて定まる範囲に属さないもの、を外れ値とする処理であれば良い。
(C: deformation)
Although one embodiment of the present invention has been described above, it goes without saying that the following modifications may be added to this embodiment.
(1) In the above embodiment, a case has been described in which the plurality of signals input to the sampling frequency estimation apparatus 10 are a plurality of sound signals obtained by sampling the same sound waveform separately and independently. However, the plurality of signals input to the sampling frequency estimation apparatus 10 are not limited to sound signals as long as they are obtained by sampling the same waveform separately and independently. Moreover, in the said embodiment, although the process using a quartile was employ | adopted as a 1st statistical filter process, for example, after sorting the estimated value calculated for every flame | frame by the error calculation part 120 in order of the magnitude | size A process may be adopted in which they are divided into three equal parts, and outliers are used that are smaller than the value corresponding to the smaller separation position and larger than the value corresponding to the larger separation position. In short, when the first estimated values calculated for each frame by the error calculation unit 120 are sorted in the order of their size, they belong to a range determined according to a predetermined number of values from both ends or a predetermined number of values from both ends. What is necessary is a process for setting an unexisting value as an outlier.

(2)上記実施形態の統計処理部130が実行する統計処理は、決定論的アプローチによる処理であり、四分位数法等を利用して外れ値を除外する第1の統計フィルタ処理と、第1の統計フィルタ処理の処理結果から代表値(上記実施形態では、中央値)を選択し、当該値を補正対象信号全体に亘るサンプリング周波数の誤差の推定値とする第2の統計フィルタ処理により構成さていた。しかし、フレーム毎に算出された第1の推定値を指数関数族で統計的にモデル化し、モデルパラメータを推定することにより、第2の推定値を算出する処理を上記統計処理として採用しても良い。具体的には、例えばラプラス分布で上記モデル化を行い、ラプラス分布のパラメータを推定することで分布の形状を決定し、決定された分布から最頻値を求め、その最頻値を上記第2の推定値とすることで、サンプリング周波数の誤差の尤も確からしい値を推定するといった具合である。 (2) The statistical processing executed by the statistical processing unit 130 of the above embodiment is processing based on a deterministic approach, and first statistical filter processing that excludes outliers using a quartile method or the like; By selecting a representative value (a median value in the above embodiment) from the processing result of the first statistical filter processing, and using the value as an estimated value of the sampling frequency error over the entire correction target signal, Was composed. However, the first estimated value calculated for each frame is statistically modeled with an exponential function family, and the process for calculating the second estimated value by estimating the model parameter may be adopted as the statistical process. good. Specifically, for example, the above-described modeling is performed using a Laplace distribution, the shape of the distribution is determined by estimating the parameters of the Laplace distribution, a mode value is obtained from the determined distribution, and the mode value is calculated as the second value. The estimated value of the sampling frequency is estimated so that the likelihood of the sampling frequency error is likely.

(3)上記実施形態の時間ズレ量算出部110は、相互相関関数C(τ)が最大となるτのみに基づいて時間ズレ量を算出したが、相互相関関数C(τ)の大きい順に最大M個のτを候補として残し、これらM個のτに基づいて時間ズレ量を算出しても良い。例えばこれらM個のτの平均値から時間ズレ量を算出するといった具合である。また、相互相関関数C(τ)の値が所定の閾値以上となる全てのτを時間ズレ量の候補としてもよい。この場合、パワーの大小の影響を避けるため、正規化相互相関関数を用いるようにすれば良い。 (3) The time shift amount calculation unit 110 of the above embodiment calculates the time shift amount based only on τ that maximizes the cross correlation function C (τ). It is also possible to leave M pieces of τ as candidates and calculate the amount of time deviation based on these M pieces of τ. For example, the amount of time deviation is calculated from the average value of these M τ. Alternatively, all τs for which the value of the cross-correlation function C (τ) is equal to or greater than a predetermined threshold may be set as candidates for the amount of time deviation. In this case, a normalized cross-correlation function may be used to avoid the influence of power magnitude.

(4)時間ズレ量算出部110において、基準信号および補正対象信号のパワーが所定の閾値未満であるフレームを時間ズレ量の算出対象から除外するようにしても良い。上記閾値を適切な値に定めておけば、基準信号を充分な強度で含んでいないフレームや補正対象信号を充分な強度で含んでいないフレームが時間ズレ量の算出対象から除外される。基準信号を充分な強度で含んでいないフレームや補正対象信号を充分な強度で含んでいないフレームは、そもそもサンプリング周波数ズレの推定に対する寄与は小さく、このようなフレームについて時間ズレ量を算出したとしてもエラーを多く含むものとなってしまう。このような時間ズレ量に基づいて算出された第1の推定値は外れ値として第1の統計フィルタ処理部130aによって外れ値として除外される可能性が高く、そもそも時間ズレ量の算出自体が無駄になってしまう。このような態様によれば、時間ズレ量算出部110において無駄な演算が行われることを回避しつつ、サンプリング周波数の誤差を高い精度で算出することが可能になる。 (4) The time shift amount calculation unit 110 may exclude a frame in which the powers of the reference signal and the correction target signal are less than a predetermined threshold from the time shift amount calculation target. If the threshold is set to an appropriate value, a frame that does not include the reference signal with sufficient intensity and a frame that does not include the correction target signal with sufficient intensity are excluded from the calculation target of the time shift amount. Frames that do not contain the reference signal with sufficient intensity and frames that do not contain the signal to be corrected with sufficient intensity have little contribution to the estimation of the sampling frequency deviation in the first place, even if the time deviation amount is calculated for such a frame. It will contain many errors. The first estimated value calculated based on such a time deviation amount is likely to be excluded as an outlier by the first statistical filter processing unit 130a as an outlier, and the calculation of the time deviation amount itself is useless in the first place. Become. According to such an aspect, it is possible to calculate the sampling frequency error with high accuracy while avoiding unnecessary calculation in the time shift amount calculation unit 110.

(5)時間ズレ量算出部110において、相互相関関数C(τ)の最大値が所定の閾値を下回るフレームを時間ズレ量の算出対象から除外するようにしても良い。上記閾値を適切な値に定めておけば、当該閾値を下回る相互相関関数に基づいて時間ズレ量の算出が行われることはない。上記閾値を下回る相互相関関数に基づいて時間ズレ量を算出したとしてもエラーを多く含むものとなってしまい、このような時間ズレ量に基づいて算出され第1の推定値は外れ値として除外される可能性が高く、そもそも時間ズレ量の算出自体が無駄になってしまう。このような態様によっても、時間ズレ量算出部において無駄な演算が行われることを回避しつつ、サンプリング周波数を高い精度で算出することが可能になる。 (5) The time deviation amount calculation unit 110 may exclude a frame in which the maximum value of the cross-correlation function C (τ) is below a predetermined threshold from the calculation target of the time deviation amount. If the threshold value is set to an appropriate value, the time shift amount is not calculated based on the cross-correlation function that is lower than the threshold value. Even if the amount of time deviation is calculated based on the cross-correlation function below the threshold value, it includes a lot of errors, and the first estimated value calculated based on the amount of time deviation is excluded as an outlier. In the first place, the calculation of the amount of time shift itself becomes useless. Also according to such an aspect, it is possible to calculate the sampling frequency with high accuracy while avoiding unnecessary calculation in the time deviation amount calculation unit.

(6)上記実施形態では、基準信号および補正対象信号をフレームに区切る際のフレームサイズを固定としたが、このような態様ではフレーム番号が大きくなるほど両信号のサンプルズレが大きくなり、相互相関関数C(τ)を計算が無意味になる(或いは、相互相関関数C(τ)を計算できなくなる)ことが考えられる。そこで、相互相関関数C(τ)の最大値が所定の閾値を下回った時点で処理を停止し、サンプリング周波数推定装置10の利用者に何らかの報知を行っても良く、また、フレームサイズを大きくして基準信号および補正対象信号のフレームを区切り直すようにしても良い。 (6) In the above embodiment, the frame size when the reference signal and the correction target signal are divided into frames is fixed. However, in such an aspect, the sample deviation of both signals increases as the frame number increases, and the cross-correlation function It is conceivable that the calculation of C (τ) becomes meaningless (or the cross-correlation function C (τ) cannot be calculated). Therefore, the processing may be stopped when the maximum value of the cross-correlation function C (τ) falls below a predetermined threshold, and some notification may be given to the user of the sampling frequency estimation apparatus 10, and the frame size is increased. Thus, the frames of the reference signal and the correction target signal may be re-divided.

(7)上記実施形態では、基準信号と補正対象信号の相互相関関数をフレーム毎に算出することで、各フレームにおける両信号の時間ズレ量を算出した。しかし、両信号を正規化してから両信号の相互相関を算出し、その算出結果に基づいて時間ズレ量を算出しても勿論良い。また、基準信号と補正対象信号の一方を他方に対して時間軸方向にずらしつつ両信号の差信号を算出する処理をフレーム毎に実行するとともに当該差信号の振幅の最大値(或いはパワー)を両信号の相関を表す値として算出し、その算出結果に基づいて両信号のフレーム毎の時間ズレ量を算出しても良く、また両信号の和信号と差信号の比を算出することで両信号の相関を表す値をフレーム毎に算出しその算出結果に応じて両信号のフレーム毎の時間ズレ量を算出しても良い。また、パターンマッチングにより、基準信号と補正対象信号の相関を表す値をフレーム毎に算出し、その算出結果に応じて両信号のフレーム毎の時間ズレ量を算出しても良い。要は、基準信号と補正対象信号の相関をフレーム毎に算出し、その算出結果に応じて両信号のフレーム毎の時間ズレ量を算出する態様であれば良い。 (7) In the above embodiment, the amount of time deviation between both signals in each frame is calculated by calculating the cross-correlation function between the reference signal and the correction target signal for each frame. However, it is of course possible to calculate the cross-correlation between both signals after normalizing both signals and calculate the amount of time deviation based on the calculation result. In addition, a process for calculating a difference signal between the two signals while shifting one of the reference signal and the correction target signal in the time axis direction with respect to the other is executed for each frame, and the maximum value (or power) of the amplitude of the difference signal is set. It may be calculated as a value representing the correlation between both signals, and the amount of time deviation between the frames of both signals may be calculated based on the calculation result, or both ratios may be calculated by calculating the ratio between the sum signal and the difference signal of both signals. A value representing the correlation between the signals may be calculated for each frame, and the time shift amount for each frame of both signals may be calculated according to the calculation result. Further, a value representing the correlation between the reference signal and the correction target signal may be calculated for each frame by pattern matching, and the time shift amount for each frame of both signals may be calculated according to the calculation result. The point is that the correlation between the reference signal and the correction target signal is calculated for each frame, and the time deviation amount for each frame of both signals is calculated according to the calculation result.

1…信号処理システム、10…サンプリング周波数推定装置、20…時間軸圧伸装置、100…STFT部、110…時間ズレ量算出部、120…誤差算出部、130…統計処理部、130a…第1の統計フィルタ処理部、130b…第2の統計フィルタ処理部。
DESCRIPTION OF SYMBOLS 1 ... Signal processing system, 10 ... Sampling frequency estimation apparatus, 20 ... Time-axis companding apparatus, 100 ... STFT part, 110 ... Time deviation calculation part, 120 ... Error calculation part, 130 ... Statistical processing part, 130a ... 1st Statistical filter processing unit, 130b... Second statistical filter processing unit.

Claims (5)

同じ波形を別個独立にサンプリングして得られる複数の信号のうちの1つを基準信号とし、残りの信号のうちの1つを補正対象信号として、前記基準信号と前記補正対象信号の一方を時間軸方向にずらしつつ両信号の相関をフレーム毎に算出し、その算出結果に応じて両信号の時間ズレ量をフレーム毎に算出する時間ズレ量算出部と、
前記時間ズレ量算出部により算出された時間ズレ量から、各フレームにおける前記補正対象信号のサンプリング周波数の誤差の推定値である第1の推定値をフレーム毎に算出する誤差算出部と、
前記誤差算出部によりフレーム毎に算出された前記第1の推定値に統計処理を施して前記補正対象信号全体に亘るサンプリング周波数の誤差の推定値である第2の推定値を算出し出力する統計処理部と、
を有することを特徴とするサンプリング周波数推定装置。
One of a plurality of signals obtained by independently sampling the same waveform is used as a reference signal, one of the remaining signals is used as a correction target signal, and one of the reference signal and the correction target signal is set as a time. Calculating a correlation between both signals for each frame while shifting in the axial direction, and calculating a time shift amount for each frame according to the calculation result;
An error calculation unit that calculates, for each frame, a first estimated value that is an estimated value of an error in the sampling frequency of the correction target signal in each frame from the time shift amount calculated by the time shift amount calculation unit;
A statistic that performs statistical processing on the first estimated value calculated for each frame by the error calculating unit to calculate and output a second estimated value that is an estimated value of the sampling frequency error over the entire correction target signal. A processing unit;
A sampling frequency estimation apparatus comprising:
前記統計処理部の実行する統計処理には、
前記誤差算出部によりフレーム毎に算出された前記第1の推定値から、統計的にエラーを多く含むと推定される外れ値を除外する第1の統計フィルタ処理が含まれるとともに、
前記第1の統計フィルタ処理より外れ値が除外された一群の第1の推定値を平滑化するフィルタ処理と前記一群の第1の推定値から代表値を選択するフィルタ処理の一方が第2の統計フィルタ処理として含まれ、
前記統計処理部は前記第2の統計フィルタ処理の処理結果を、前記第2の推定値として出力する
ことを特徴とする請求項1に記載のサンプリング周波数推定装置。
The statistical processing executed by the statistical processing unit includes
A first statistical filtering process that excludes outliers that are statistically estimated to contain many errors from the first estimated value calculated for each frame by the error calculating unit;
One of a filter process for smoothing a group of first estimated values from which outliers have been excluded from the first statistical filter process and a filter process for selecting a representative value from the group of first estimated values is a second one. Included as statistical filtering,
The sampling frequency estimation apparatus according to claim 1, wherein the statistical processing unit outputs a processing result of the second statistical filter processing as the second estimated value.
前記第1の統計フィルタ処理は、前記誤差算出部によりフレーム毎に算出された前記第1の推定値をその大きさ順にソートした場合における両端から所定個数分、または両端から所定個数番目の各値に応じて定まる範囲に属さないもの、を外れ値とする処理であることを特徴とする請求項2に記載のサンプリング周波数推定装置。   The first statistical filter processing includes a predetermined number of values from both ends or a predetermined number of values from both ends when the first estimated values calculated for each frame by the error calculation unit are sorted in order of size. The sampling frequency estimation apparatus according to claim 2, wherein the sampling frequency estimation apparatus is a process of setting an outlier as a value that does not belong to a range determined according to. 前記時間ズレ量算出部は、前記基準信号および前記補正対象信号の各々のパワーをフレーム毎に算出し、少なくとも一方の信号のパワーが所定の閾値未満であるフレームを時間ズレ量の算出対象から除外することを特徴とする請求項1〜3の何れか1項に記載のサンプリング周波数推定装置。   The time shift amount calculation unit calculates the power of each of the reference signal and the correction target signal for each frame, and excludes a frame in which the power of at least one signal is less than a predetermined threshold from the calculation target of the time shift amount The sampling frequency estimation apparatus according to any one of claims 1 to 3, wherein 前記時間ズレ量算出部は、前記基準信号と前記補正対象信号の相関を表す値が所定の閾値を下回るフレームを時間ズレ量の算出対象から除外することを特徴とする請求項1〜4の何れか1項に記載のサンプリング周波数推定装置。
5. The time shift amount calculation unit excludes a frame whose value representing a correlation between the reference signal and the correction target signal is below a predetermined threshold from the time shift amount calculation target. The sampling frequency estimation apparatus according to claim 1.
JP2014077380A 2014-04-03 2014-04-03 Sampling frequency estimation device Expired - Fee Related JP6229576B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014077380A JP6229576B2 (en) 2014-04-03 2014-04-03 Sampling frequency estimation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014077380A JP6229576B2 (en) 2014-04-03 2014-04-03 Sampling frequency estimation device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017201493A Division JP6668306B2 (en) 2017-10-18 2017-10-18 Sampling frequency estimation device

Publications (2)

Publication Number Publication Date
JP2015197941A JP2015197941A (en) 2015-11-09
JP6229576B2 true JP6229576B2 (en) 2017-11-15

Family

ID=54547525

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014077380A Expired - Fee Related JP6229576B2 (en) 2014-04-03 2014-04-03 Sampling frequency estimation device

Country Status (1)

Country Link
JP (1) JP6229576B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111785289B (en) * 2019-07-31 2023-12-05 北京京东尚科信息技术有限公司 Residual echo cancellation method and device
CN113467236B (en) * 2021-06-17 2022-10-21 中国人民解放军海军工程大学 Method for time lag compensation of error signal

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3196715B2 (en) * 1997-10-22 2001-08-06 ヤマハ株式会社 Communication device for communication of music information, communication method, control device, control method, and medium recording program
JP2002101500A (en) * 2000-09-22 2002-04-05 Matsushita Electric Ind Co Ltd Sound field measurement device
JP4543586B2 (en) * 2001-06-25 2010-09-15 ソニー株式会社 Audio reproduction apparatus and audio reproduction method
JP3925349B2 (en) * 2002-08-22 2007-06-06 ヤマハ株式会社 Apparatus and method for synchronous reproduction of audio data and performance data
DE102005045627A1 (en) * 2005-06-22 2007-01-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for performing a correlation between a test sound signal that is playable at variable speed and a reference sound signal

Also Published As

Publication number Publication date
JP2015197941A (en) 2015-11-09

Similar Documents

Publication Publication Date Title
CN110265064B (en) Audio frequency crackle detection method, device and storage medium
JP6027087B2 (en) Acoustic signal processing system and method for performing spectral behavior transformations
US10152986B2 (en) Acoustic processing apparatus, acoustic processing method, and computer program product
JP2010154092A (en) Noise detection apparatus and ethod
US20130194007A1 (en) Asynchronous sampling frequency conversion device, method, and computer program product
JP6229576B2 (en) Sampling frequency estimation device
CN107210029A (en) Method and apparatus for handling succession of signals to carry out polyphony note identification
JP6221257B2 (en) Signal processing apparatus, method and program
JP6668306B2 (en) Sampling frequency estimation device
CN109841232B (en) Method and device for extracting note position in music signal and storage medium
US11611839B2 (en) Optimization of convolution reverberation
US11867733B2 (en) Systems and methods of signal analysis and data transfer using spectrogram construction and inversion
JP6597062B2 (en) Noise reduction device, noise reduction method, noise reduction program
JP2014095966A (en) Information processor, information processing method and program
JP2017203931A (en) Acoustic property measurement device and acoustic property measurement method
CN107657962B (en) Method and system for identifying and separating throat sound and gas sound of voice signal
CN112420004A (en) Method and device for generating songs, electronic equipment and computer readable storage medium
JP2016123059A (en) Signal generator and terminal
JP6759927B2 (en) Utterance evaluation device, utterance evaluation method, and utterance evaluation program
JP2020027245A5 (en) Information processing method, information processing apparatus, and program
US20230233931A1 (en) Information processing apparatus, information processing method, and program
JP6183067B2 (en) Data analysis apparatus and method, program, and recording medium
JP4378098B2 (en) Sound source selection apparatus and method
JP6152690B2 (en) Acoustic analyzer
CN116165486A (en) Method and system for recovering time domain waveform of partial discharge pulse electric field

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170919

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171002

R151 Written notification of patent or utility model registration

Ref document number: 6229576

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees