JP6011188B2 - Echo path delay measuring apparatus, method and program - Google Patents

Echo path delay measuring apparatus, method and program Download PDF

Info

Publication number
JP6011188B2
JP6011188B2 JP2012204567A JP2012204567A JP6011188B2 JP 6011188 B2 JP6011188 B2 JP 6011188B2 JP 2012204567 A JP2012204567 A JP 2012204567A JP 2012204567 A JP2012204567 A JP 2012204567A JP 6011188 B2 JP6011188 B2 JP 6011188B2
Authority
JP
Japan
Prior art keywords
pitch
signal
echo path
transmission
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012204567A
Other languages
Japanese (ja)
Other versions
JP2014060597A (en
Inventor
青柳 弘美
弘美 青柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2012204567A priority Critical patent/JP6011188B2/en
Publication of JP2014060597A publication Critical patent/JP2014060597A/en
Application granted granted Critical
Publication of JP6011188B2 publication Critical patent/JP6011188B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明はエコー経路遅延測定装置、方法及びプログラムに関し、例えば、音響エコーのエコー経路における伝搬遅延時間(以下、単に遅延時間と呼ぶ)の情報を利用する装置に適用し得るものである。   The present invention relates to an echo path delay measuring apparatus, method, and program, and can be applied to, for example, an apparatus that uses information on propagation delay time (hereinafter simply referred to as delay time) in the echo path of an acoustic echo.

近年、VoIP(Voice over IP)を利用したIP電話が普及している。これを、パーソナルコンピュータ(PC)やスマートフォンなどの情報処理装置上のアプリケーションとして実現するものがあり、一般にソフトフォンと称されている。ソフトフォンにおいては、音声の入出力に際して、情報処理装置に内蔵された汎用的なサウンドデバイス(A/D変換器やD/A変換器を含む)、そのデバイスのドライバが利用される。   In recent years, IP telephones using VoIP (Voice over IP) have become widespread. There is one that realizes this as an application on an information processing apparatus such as a personal computer (PC) or a smartphone, and it is generally called a softphone. In the softphone, a general-purpose sound device (including an A / D converter and a D / A converter) built in the information processing apparatus and a driver of the device are used for voice input / output.

ところが、このようなドライバは、情報処理装置上で動作する他のソフトウェアと時分割で動作させているため、他のソフトウェアの処理によっては、音声の入出力を規定の時間で処理することができない場合も生じる。この結果、音声信号の入出力に途切れや欠落が生じて不連続になり、エコーキャンセラにとってはエコー経路の特性(特に遅延時間)が変化しているように見え、しかも、このようなエコー経路の特性変化は、他のソフトウェア処理との時分割処理の関係で突発的であり、マイクロホンからの音声信号に含まれているエコー成分を消去するのは困難にしていた。   However, such a driver is operated in time division with other software that operates on the information processing apparatus, so that input / output of audio cannot be processed in a specified time depending on the processing of the other software. Sometimes it happens. As a result, the input / output of the audio signal becomes discontinuous due to interruptions and omissions, and it appears to the echo canceller that the characteristics of the echo path (especially the delay time) have changed. The characteristic change is sudden due to the time-division process with other software processes, and it is difficult to eliminate the echo component included in the audio signal from the microphone.

このようなエコー特性の変化に対応する方法として、特許文献1では、ハードウェア構成を工夫する方法が提案されている。   As a method for dealing with such a change in echo characteristics, Patent Document 1 proposes a method for devising a hardware configuration.

しかしながら、特許文献1の記載技術は、情報処理装置の改修又は特殊な回路の追加が必要になり、汎用的な情報処理装置の機能特性を阻害する恐れがあり、話者である情報処理装置のユーザにとっては、使い勝手の悪いものとなっていた。   However, the technology described in Patent Document 1 requires modification of the information processing device or addition of a special circuit, which may hinder the functional characteristics of a general-purpose information processing device. For the user, it was inconvenient.

このような課題を解決するために、特許文献2では、ハードウェアの変更を伴わない手法が提案されている。   In order to solve such a problem, Patent Document 2 proposes a technique that does not involve hardware change.

特許文献2に記載のエコーキャンセラは、送話信号を平滑化した平滑送話信号(送話信号のパワ情報)を算出する平滑送話信号計算手段と、受話信号を平滑化した平滑受話信号(受話信号のパワ情報)を算出する平滑受話信号計算手段と、平滑送話信号及び平滑受話信号の相関に基づき、エコー経路による遅延特性を反映させたエコー経路遅延時間の情報を得る遅延時間情報形成手段とを備えている。   The echo canceller described in Patent Document 2 includes a smoothed speech signal calculation means for calculating a smoothed speech signal (speech signal power information) obtained by smoothing a speech signal, and a smoothed speech signal obtained by smoothing the received signal ( Smooth reception signal calculation means for calculating received signal power information) and delay time information formation for obtaining echo path delay time information reflecting delay characteristics of the echo path based on the correlation between the smooth transmission signal and the smooth reception signal Means.

特開2004−40589号公報JP 2004-40589 A 特開2007−189543号公報JP 2007-189543 A

しかしながら、特許文献2の記載技術では、平滑送話信号と平滑受話信号の相関が背景雑音成分によってたまたま大きくなってエコー経路遅延時間として算出される場合があり、そのため、エコー経路遅延時間を安定的に測定できず、エコーを十分に消去できないことも生じていた。   However, in the technique described in Patent Document 2, there is a case where the correlation between the smooth transmission signal and the smooth reception signal happens to be large due to the background noise component and is calculated as the echo path delay time. In other words, the echo could not be sufficiently erased.

そのため、エコー経路遅延時間をより安定的に測定することができるエコー経路遅延測定装置、方法及びプログラムが望まれている。   Therefore, an echo path delay measuring apparatus, method, and program capable of measuring the echo path delay time more stably are desired.

第1の本発明は、エコー経路における遅延時間を測定するエコー経路遅延測定装置において、(1)送話信号に係るピッチの情報を得る送話ピッチ特性取得手段と、(2)受話信号に係るピッチの情報を得る受話ピッチ特性取得手段と、(3)送話信号に係るピッチの時系列に類似した、受話信号に係るピッチの時系列部分を探索することにより、エコー経路における遅延時間の情報を求める相関分析手段とを有することを特徴とする。   According to a first aspect of the present invention, there is provided an echo path delay measuring apparatus for measuring a delay time in an echo path. (1) Transmission pitch characteristic acquisition means for obtaining pitch information related to a transmission signal; Received pitch characteristic acquisition means for obtaining pitch information, and (3) information on delay time in the echo path by searching for a time series part of the pitch related to the received signal similar to the time series of pitch related to the transmitted signal And a correlation analysis means for obtaining.

第2の本発明は、エコー経路における遅延時間を測定するエコー経路遅延測定方法において、(1)送話ピッチ特性取得手段が、送話信号に係るピッチの情報を得、(2)受話ピッチ特性取得手段が、受話信号に係るピッチの情報を得、(3)相関分析手段が、送話信号に係るピッチの時系列に類似した、受話信号に係るピッチの時系列部分を探索することにより、エコー経路における遅延時間の情報を求めることを特徴とする。   According to a second aspect of the present invention, in an echo path delay measurement method for measuring a delay time in an echo path, (1) a transmission pitch characteristic acquisition unit obtains pitch information related to a transmission signal, and (2) a reception pitch characteristic. The obtaining means obtains information on the pitch related to the received signal, and (3) the correlation analyzing means searches for the time series part of the pitch related to the received signal similar to the time series of the pitch related to the transmitted signal, The delay time information in the echo path is obtained.

第3の本発明は。エコー経路における遅延時間を測定するためのエコー経路遅延測定プログラムであって、コンピュータを、(1)送話信号に係るピッチの情報を得る送話ピッチ特性取得手段と、(2)受話信号に係るピッチの情報を得る受話ピッチ特性取得手段と、(3)送話信号に係るピッチの時系列に類似した、受話信号に係るピッチの時系列部分を探索することにより、エコー経路における遅延時間の情報を求める相関分析手段として機能させることを特徴とする。   The third present invention. An echo path delay measurement program for measuring a delay time in an echo path, comprising: (1) transmission pitch characteristic acquisition means for obtaining pitch information related to a transmission signal; and (2) a reception signal Received pitch characteristic acquisition means for obtaining pitch information, and (3) information on delay time in the echo path by searching for a time series part of the pitch related to the received signal similar to the time series of pitch related to the transmitted signal It is made to function as a correlation analysis means which calculates | requires.

本発明によれば、送話信号及び受話信号のピッチ特性の変動の類似度によって、エコー経路遅延時間を測定するようにしたので、従来より安定的にエコー経路遅延時間を測定することができる。   According to the present invention, since the echo path delay time is measured based on the similarity of the variation in the pitch characteristics of the transmission signal and the reception signal, the echo path delay time can be measured more stably than in the past.

第1の実施形態のエコー経路遅延測定装置の機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of the echo path delay measuring apparatus of 1st Embodiment. 第1の実施形態のエコー経路遅延測定装置における送話ピッチ特性計算回路の処理イメージを示す説明図である。It is explanatory drawing which shows the processing image of the transmission pitch characteristic calculation circuit in the echo path delay measuring apparatus of 1st Embodiment. 第1の実施形態のエコー経路遅延測定装置における相関分析回路の処理イメージを示す説明図である。It is explanatory drawing which shows the process image of the correlation analysis circuit in the echo path delay measuring apparatus of 1st Embodiment. 第2の実施形態のエコー経路遅延測定装置の機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of the echo path delay measuring apparatus of 2nd Embodiment. 第3の実施形態のエコー経路遅延測定装置の機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of the echo path delay measuring apparatus of 3rd Embodiment.

(A)第1の実施形態
以下、本発明によるエコー経路遅延測定装置、方法及びプログラムの第1の実施形態を、図面を参照しながら説明する。第1の実施形態のエコー経路遅延測定装置は、エコーキャンセラ装置に組み込まれて使用されることを意図したものである。
(A) First Embodiment Hereinafter, a first embodiment of an echo path delay measuring apparatus, method and program according to the present invention will be described with reference to the drawings. The echo path delay measuring apparatus according to the first embodiment is intended to be incorporated into an echo canceller apparatus.

第1の実施形態は、受話信号(遠端信号)及び送話信号(近端信号)の各々のピッチ特性を分析し、両ピッチ特性の類似度(相関)を基にエコー経路遅延時間を測定するものである。   In the first embodiment, the pitch characteristics of each of the received signal (far-end signal) and the transmitted signal (near-end signal) are analyzed, and the echo path delay time is measured based on the similarity (correlation) of both pitch characteristics. To do.

(A−1)第1の実施形態の構成
図1は、第1の実施形態のエコー経路遅延測定装置100の機能的構成を示すブロック図である。
(A-1) Configuration of the First Embodiment FIG. 1 is a block diagram showing a functional configuration of the echo path delay measuring apparatus 100 of the first embodiment.

第1の実施形態のエコー経路遅延測定装置は、例えば、PCやスマートフォン等の情報処理装置に搭載されるものである。第1の実施形態のエコー経路遅延測定装置は、例えば、専用ボードとして構築されたものであっても良く、DSP(デジタルシグナルプロセッサ)へのエコー経路遅延測定プログラムの書き込みによって実現されたものであっても良く、CPUと、CPUが実行するソフトウェア(エコー経路遅延測定プログラム)によって実現されたものであっても良いが、機能的には、図1で表すことができる。   The echo path delay measuring device of the first embodiment is mounted on an information processing device such as a PC or a smartphone, for example. The echo path delay measuring apparatus of the first embodiment may be constructed as a dedicated board, for example, and realized by writing an echo path delay measuring program to a DSP (digital signal processor). It may be realized by a CPU and software (echo path delay measurement program) executed by the CPU, but can be functionally represented in FIG.

図1において、第1の実施形態のエコー経路遅延測定装置100は、送話ピッチ特性計算回路101、受話ピッチ特性計算回路102及び相関分析回路103を有する。   In FIG. 1, an echo path delay measuring apparatus 100 according to the first embodiment includes a transmission pitch characteristic calculation circuit 101, a reception pitch characteristic calculation circuit 102, and a correlation analysis circuit 103.

第1の実施形態のエコー経路遅延測定装置100には、図示しない近端のマイクロホンが捕捉し、デジタル化されたデジタル送話信号(以下、送話信号と呼ぶ)s(n)と、図示しないスピーカに向かう遠端からのデジタル受話信号(以下、受話信号と呼ぶ)r(n)とが入力されるものであり、送話信号s(n)と受話信号r(n)とからエコー経路遅延時間の情報Tを得るものである。スピーカから放音された音声、音響をマイクロホンが捕捉するに至る、音声、音響の伝搬経路であるエコー経路での遅延時間特性は一定でないことを前提としている。例えば、エコー経路遅延測定装置100よりスピーカ側で受話信号を処理する構成や、エコー経路遅延測定装置100よりマイクロホン側で送話信号を処理する構成が、CPUによる時分割処理によるソフトウェア処理構成である場合に、このような遅延時間特性の変化が生じる。   The echo path delay measuring apparatus 100 according to the first embodiment captures a digitized digital transmission signal (hereinafter referred to as a transmission signal) s (n) captured by a near-end microphone (not shown), and is not shown. A digital reception signal (hereinafter referred to as reception signal) r (n) from the far end toward the speaker is input, and an echo path delay is generated from the transmission signal s (n) and reception signal r (n). Time information T is obtained. It is assumed that the delay time characteristics in the echo path, which is the propagation path of sound and sound, until the microphone captures the sound and sound emitted from the speaker are assumed to be constant. For example, a configuration in which a received signal is processed on the speaker side from the echo path delay measuring apparatus 100 and a configuration in which a transmitted signal is processed on the microphone side from the echo path delay measuring apparatus 100 are software processing configurations by time division processing by the CPU. In some cases, such a delay time characteristic change occurs.

また、第1の実施形態のエコー経路遅延測定装置100においては、送話信号s(n)は、一定時間のサンプル数ごとに切り出されたフレームを単位に処理され、受話信号r(n)も、一定時間のサンプル数ごとに切り出されたフレームを単位に処理される。以下の説明においては、1フレームのサンプル数をNとして表記している。   Further, in the echo path delay measuring apparatus 100 of the first embodiment, the transmission signal s (n) is processed in units of frames cut out for each number of samples for a certain time, and the reception signal r (n) is also processed. The processing is performed in units of frames cut out for each number of samples for a certain period of time. In the following description, the number of samples in one frame is expressed as N.

送話ピッチ特性計算回路101は、(1)式に示すように、フレーム毎に、現フレームの送話信号s(x−(N−1))〜s(x)と過去の任意の位置の1フレーム分の送話信号s(x−j−(N−1))〜s(x−j)との自己相関RS(j)を計算し、自己相関が最大となるjmaxを探索し、最大となるjmaxを現フレームのズレ量Spとして相関分析回路103に出力するものである。なお、(1)式におけるPS(j)は、(2)式に従って計算される送話信号及び受話信号の双方のパワを考慮したパワの標準的な値である。(1)式及び(2)式における総和Σはnがx−(N−1)〜xについてである。最大のズレ量jmaxは、jが概ね2.5ms〜18.5msとなる範囲で探索する。ズレ量jmaxは、自己相関が最大となるずれであるので、送話信号のその時点のピッチ特性を反映したものとなっている。 As shown in the equation (1), the transmission pitch characteristic calculation circuit 101 has the transmission signals s (x− (N−1)) to s (x) of the current frame and arbitrary past positions for each frame. Calculate autocorrelation RS (j) with transmission signals s (x−j− (N−1)) to s (x−j) for one frame, and search for j max that maximizes autocorrelation. The maximum j max is output to the correlation analysis circuit 103 as the shift amount Sp of the current frame. Note that PS (j) in the equation (1) is a standard value of power considering the power of both the transmission signal and the reception signal calculated according to the equation (2). The sum Σ in the equations (1) and (2) is for n of x− (N−1) to x. The maximum shift amount j max is searched in a range where j is approximately 2.5 ms to 18.5 ms. The shift amount j max is a shift that maximizes the autocorrelation, and therefore reflects the pitch characteristics of the transmitted signal at that time.

図2は、現フレームの送話信号s(x−(N−1))〜s(x)と過去の任意の位置の1フレーム分の送話信号s(x−j−(N−1))〜s(x−j)と、ズレ量jとの関係を概念的に示す説明図である。   FIG. 2 shows transmission signals s (x− (N−1)) to s (x) of the current frame and transmission signals s (x−j− (N−1) for one frame at an arbitrary position in the past. ) To s (x−j) and an explanatory diagram conceptually showing the relationship between the shift amount j.

RS(j)=Σ(s(n)*s(n−j))/PS(j) …(1)
PS(j)=√(Σ(s(n)*s(n))
*√(Σ(s(n−j)*s(n−j))) …(2)
受話ピッチ特性計算回路102は、受話信号r(n)に対して、送話ピッチ特性計算回路101と同様な処理を行い、自己相関が最大となる現フレームのズレ量Rpを相関分析回路103に出力するものである。
RS (j) = Σ (s (n) * s (n−j)) / PS (j) (1)
PS (j) = √ (Σ (s (n) * s (n))
* √ (Σ (s (n−j) * s (n−j))) (2)
The reception pitch characteristic calculation circuit 102 performs the same processing as the transmission pitch characteristic calculation circuit 101 on the reception signal r (n), and sends the deviation Rp of the current frame that maximizes the autocorrelation to the correlation analysis circuit 103. Output.

相関分析回路103は、フレーム単位に与えられる送話信号に係るズレ量Sp及び受話信号に係るズレ量Rpの時系列を各々保存しておき、これらの時系列Sp(M−L+1)〜Sp(M)とRp(M−k−L+1)〜Rp(M−k)との間で、パラメータkを所定の範囲内で変化させながら、(3)式に従って類似誤差R(k)を計算し、類似誤差が最小となるkminを探索し、類似誤差が最小となる、フレーム数で表されているkminをミリ秒(ms)に換算してエコー経路遅延時間Τとして次段に出力するものである。(3)式において、mは時系列上でのフレーム順番(時刻)を表すパラメータである。類似誤差を算出するための時間をL(Lは1以上の任意の整数;Lが1の場合には(3)式における総和処理は不要となる)とし、現フレームの時刻をMとする。(3)式における総和Σは、mがM−L+1からMについてである。類似誤差が最小となるkminは、受話信号に係るピッチ特性の変化傾向と、送話信号に係るピッチ特性の変化傾向とが非常に類似しているので、送話信号がエコーとして受話信号に回り込む際のエコー経路における遅延時間を表す値として捉えることができるものである。 The correlation analysis circuit 103 stores a time series of the deviation amount Sp related to the transmission signal and the deviation amount Rp related to the reception signal given in units of frames, and these time series Sp (ML + 1) to Sp ( M) and Rp (M−k−L + 1) to Rp (M−k), while changing the parameter k within a predetermined range, the similarity error R (k) is calculated according to the equation (3), Search for kmin that minimizes the similar error, convert kmin represented by the number of frames to minimize the similar error, and output to the next stage as the echo path delay time Τ It is. In equation (3), m is a parameter representing the frame order (time) on the time series. The time for calculating the similarity error is L (L is an arbitrary integer greater than or equal to 1; when L is 1, the summation process in equation (3) is not required), and the time of the current frame is M. The sum Σ in equation (3) is for m from M−L + 1 to M. The kmin that minimizes the similarity error is very similar to the change tendency of the pitch characteristic related to the received signal and the change tendency of the pitch characteristic related to the transmitted signal. It can be understood as a value representing the delay time in the echo path when wrapping around.

図3は、送話信号に係るズレ量Spの時系列Sp(M−L+1)〜Sp(M)と受話信号に係るズレ量Rpの時系列Rp(M−k−L+1)〜Rp(M−k)現フレームの送話信号s(x−(N−1))〜s(x)と、パラメータkとの関係を概念的に示す説明図である。   FIG. 3 shows the time series Sp (ML + 1) to Sp (M) of the deviation amount Sp related to the transmission signal and the time series Rp (M−K−L + 1) to Rp (M−) of the deviation amount Rp related to the reception signal. k) It is explanatory drawing which shows notionally the relationship between the transmission signal s (x- (N-1))-s (x) of the present flame | frame, and the parameter k.

R(K)=Σ((Sp(m)−Rp(m−k))
*(Sp(m)−Rp(m−k)) …(3)
ここで、相関分析回路103は、探索した類似誤差の最小値がある値に設定した閾値を超えている場合には、2つの信号の時系列Sp(M−L+1)〜Sp(M)とRp(M−k−L+1)〜Rp(M−k)が類似していないとして、エコー経路遅延時間Τの次段への出力を止めるようにする。
R (K) = Σ ((Sp (m) −Rp (m−k))
* (Sp (m) -Rp (m-k)) (3)
Here, when the minimum value of the searched similar errors exceeds a threshold set to a certain value, the correlation analysis circuit 103 determines the time series Sp (ML + 1) to Sp (M) and Rp of the two signals. Assuming that (Mk−L + 1) to Rp (M−k) are not similar, the output of the echo path delay time Τ to the next stage is stopped.

次段の回路がエコーキャンセラ装置の本体である場合には、例えば、特許文献2に記載のように、エコー経路遅延時間Τが利用される。   When the circuit at the next stage is the main body of the echo canceller apparatus, for example, as described in Patent Document 2, an echo path delay time Τ is used.

(A−2)第1の実施形態の動作
次に、第1の実施形態のエコー経路遅延測定装置100の動作を、上述した図1を参照しながら説明する。
(A-2) Operation of the First Embodiment Next, the operation of the echo path delay measuring apparatus 100 of the first embodiment will be described with reference to FIG. 1 described above.

遠端からの受話信号r(n)は、図示しないスピーカから発音出力され、エコー経路を介して、その時点でエコー経路に固有な遅延時間Tだけ遅れて、図示しないマイクロホンで捕捉され、送話信号s(n)にエコー成分として入り込む。受話信号r(n)は、主に音声信号であるため遠端話者に特有のピッチ特性を有する。例えば、単純波形である正弦波信号はピッチが一定であるが、音声信号の場合、ピッチは一定ではなく緩やかに変動する。受話信号r(n)がエコーとして送話信号s(n)に入り込むので、受話信号r(n)におけるある期間のピッチ特性は、エコー経路の遅延時間Tだけ遅れて、送話信号(におけるエコー成分)s(n)のピッチ特性として表れる。   The reception signal r (n) from the far end is sounded and output from a speaker (not shown), and is captured by a microphone (not shown) via the echo path with a delay time T inherent to the echo path at that time. It enters the signal s (n) as an echo component. Since the received signal r (n) is mainly an audio signal, it has a pitch characteristic peculiar to the far-end speaker. For example, a sine wave signal, which is a simple waveform, has a constant pitch, but in the case of an audio signal, the pitch is not constant but varies slowly. Since the received signal r (n) enters the transmitted signal s (n) as an echo, the pitch characteristic of a certain period in the received signal r (n) is delayed by the delay time T of the echo path, and the transmitted signal (echo in Appears as pitch characteristics of component s (n).

この第1の実施形態のエコー経路遅延測定装置100では、以上のような点に着目し、送話信号s(n)におけるピッチ特性変動と類似する受話信号r(n)におけるピッチ特性変動を探索することを通じて、エコー経路の遅延時間Tを得ることとした。   In the echo path delay measuring apparatus 100 of the first embodiment, paying attention to the above points, the pitch characteristic fluctuation in the received signal r (n) similar to the pitch characteristic fluctuation in the transmission signal s (n) is searched. Thus, the delay time T of the echo path is obtained.

送話信号s(n)は、送話ピッチ特性計算回路101に入力される。送話ピッチ特性計算回路101においては、(1)式に示すように、フレーム毎に、現フレームの送話信号s(x−(N−1))〜s(x)と過去の任意の位置の1フレーム分の送話信号s(x−j−(N−1))〜s(x−j)との自己相関RS(j)が計算され、自己相関RS(j)が最大となるjmaxが、現フレームのズレ量Spとして相関分析回路103に出力される。 The transmission signal s (n) is input to the transmission pitch characteristic calculation circuit 101. In the transmission pitch characteristic calculation circuit 101, as shown in the equation (1), the transmission signal s (x− (N−1)) to s (x) of the current frame and an arbitrary position in the past are shown for each frame. The autocorrelation RS (j) with the transmission signals s (x−j− (N−1)) to s (x−j) for one frame is calculated, and the autocorrelation RS (j) is maximized j max is output to the correlation analysis circuit 103 as the shift amount Sp of the current frame.

受話信号s(n)は、受話ピッチ特性計算回路102に入力される。受話ピッチ特性計算回路102においては、フレーム毎に、現フレームの受話信号r(x−(N−1))〜r(x)と過去の任意の位置の1フレーム分の受話信号r(x−j−(N−1))〜r(x−j)との自己相関RR(j)が計算され((1)式参照)、自己相関RR(j)が最大となるjmaxが、現フレームのズレ量Rpとして相関分析回路103に出力される。 The reception signal s (n) is input to the reception pitch characteristic calculation circuit 102. In the reception pitch characteristic calculation circuit 102, for each frame, reception signals r (x− (N−1)) to r (x) of the current frame and reception signals r (x−) of one frame at any past position. j- (N−1)) to r (x−j) are calculated (see equation (1)), and j max at which autocorrelation RR (j) is maximized is the current frame. Is output to the correlation analysis circuit 103 as a deviation amount Rp.

相関分析回路103においては、フレーム単位に与えられる送話信号に係るズレ量Sp及び受話信号に係るズレ量Rpの時系列が各々保存される。そして、相関分析回路103において、これらの時系列Sp(M−L+1)〜Sp(M)とRp(M−k−L+1)〜Rp(M−k)との間で、パラメータkを所定の範囲内で変化させながら、(3)式に従って類似誤差R(k)が計算され、類似誤差が最小となるフレーム数で表されているkminがミリ秒(ms)に換算されてエコー経路遅延時間Τとして次段に出力される。 In the correlation analysis circuit 103, the time series of the shift amount Sp related to the transmitted signal and the shift amount Rp related to the received signal given in frame units are stored. Then, in the correlation analysis circuit 103, the parameter k is set to a predetermined range between these time series Sp (ML + 1) to Sp (M) and Rp (MkL + 1) to Rp (Mk). , The similar error R (k) is calculated according to the equation (3), and the kmin represented by the number of frames that minimizes the similar error is converted into milliseconds (ms), and the echo path delay time is calculated. It is output to the next stage as Τ.

(A−3)第1の実施形態の効果
第1の実施形態によれば、音声信号(受話信号)の特徴を現すピッチの時間変動を基にエコー経路の遅延時間を測定しているため、特許文献2に記載のパワ変動を基に測定する場合に比べて、背景雑音などの影響を受け難く、安定したエコー経路遅延時間の測定結果を得ることができる。
(A-3) Effect of the First Embodiment According to the first embodiment, the delay time of the echo path is measured based on the time variation of the pitch representing the characteristics of the voice signal (received signal). Compared to the case of measuring based on the power fluctuation described in Patent Document 2, it is less affected by background noise and the like, and a stable echo path delay time measurement result can be obtained.

(B)第2の実施形態
次に、本発明によるエコー経路遅延測定装置、方法及びプログラムの第2の実施形態を、図面を参照しながら説明する。
(B) Second Embodiment Next, a second embodiment of the echo path delay measuring apparatus, method and program according to the present invention will be described with reference to the drawings.

図4は、第2の実施形態のエコー経路遅延測定装置100Aの機能的構成を示すブロック図である。   FIG. 4 is a block diagram showing a functional configuration of the echo path delay measuring apparatus 100A of the second embodiment.

図4において、第2の実施形態のエコー経路遅延測定装置100Aは、送話ピッチ特性計算回路101、受話ピッチ特性計算回路102及び相関分析回路103に加え、送話側LPC(Linear Predictive Coding)分析回路104及び受話側LPC分析回路105を有する。   In FIG. 4, an echo path delay measuring apparatus 100 </ b> A according to the second embodiment includes a transmission side LPC (Linear Predictive Coding) analysis in addition to a transmission pitch characteristic calculation circuit 101, a reception pitch characteristic calculation circuit 102, and a correlation analysis circuit 103. A circuit 104 and a receiver LPC analysis circuit 105;

送話側LPC分析回路104には送話信号s(n)が入力される。送話側LPC分析回路104は、送話信号s(n)に対してLPC分析を行い、分析で得られたLPC係数と残差信号のうち、残差信号を送話ピッチ特性計算回路101に与えるものである。   The transmission signal s (n) is input to the transmission side LPC analysis circuit 104. The transmission-side LPC analysis circuit 104 performs LPC analysis on the transmission signal s (n), and among the LPC coefficients and the residual signals obtained by the analysis, the residual signal is sent to the transmission pitch characteristic calculation circuit 101. Give.

一方、受話側LPC分析回路105には受話信号r(n)が入力される。受話側LPC分析回路105は、受話信号r(n)に対してLPC分析を行い、分析で得られたLPC係数と残差信号のうち、残差信号を受話ピッチ特性計算回路102に与えるものである。   On the other hand, the reception signal r (n) is input to the reception side LPC analysis circuit 105. The reception side LPC analysis circuit 105 performs LPC analysis on the reception signal r (n), and gives a residual signal to the reception pitch characteristic calculation circuit 102 among the LPC coefficient and the residual signal obtained by the analysis. is there.

送話ピッチ特性計算回路101は、第1の実施形態とは異なり、送話信号s(n)ではなく、送話側LPC分析回路104からの残差信号に対して、第1の実施形態で説明した処理を施すものである。   Unlike the first embodiment, the transmission pitch characteristic calculation circuit 101 does not use the transmission signal s (n) but the residual signal from the transmission side LPC analysis circuit 104 in the first embodiment. The processing described is performed.

同様に、受話ピッチ特性計算回路102は、第1の実施形態とは異なり、受話信号r(n)ではなく、受話側LPC分析回路105からの残差信号に対して、第1の実施形態で説明した処理を施すものである。   Similarly, the reception pitch characteristic calculation circuit 102 differs from the first embodiment with respect to the residual signal from the reception side LPC analysis circuit 105 instead of the reception signal r (n) in the first embodiment. The processing described is performed.

残差信号は、周知のように、音声信号(送話信号や受話信号)から声道情報を除外した概ね励振源信号(声帯駆動信号)となっており、音声信号そのものよりピッチが明確になっているものである。そのため、第2の実施形態のエコー経路遅延測定装置100Aでは、送話信号及び受話信号に関し、残差信号からピッチ特性を検出することした。   As is well known, the residual signal is generally an excitation source signal (vocal cord drive signal) obtained by excluding vocal tract information from a voice signal (transmitted signal or received signal), and the pitch becomes clearer than the voice signal itself. It is what. Therefore, in the echo path delay measuring apparatus 100A of the second embodiment, the pitch characteristic is detected from the residual signal with respect to the transmission signal and the reception signal.

以上の点を除けば、第2の実施形態も第1の実施形態と同様である。   Except for the above points, the second embodiment is the same as the first embodiment.

第2の実施形態によれば、第1の実施形態以上に正確に送話信号及び受話信号のピッチの特性を検出でき、その結果、背景雑音などの影響を受け難く、より一段と安定したエコー経路遅延時間の測定結果を得ることができる。   According to the second embodiment, the pitch characteristics of the transmission signal and the reception signal can be detected more accurately than in the first embodiment, and as a result, the echo path is less affected by background noise and the like, and is more stable. A measurement result of the delay time can be obtained.

(C)第3の実施形態
次に、本発明によるエコー経路遅延測定装置、方法及びプログラムの第3の実施形態を、図面を参照しながら説明する。
(C) Third Embodiment Next, a third embodiment of the echo path delay measuring apparatus, method and program according to the present invention will be described with reference to the drawings.

図5は、第3の実施形態のエコー経路遅延測定装置100Bの機能的構成を示すブロック図である。   FIG. 5 is a block diagram showing a functional configuration of the echo path delay measuring apparatus 100B of the third embodiment.

図5において、第3の実施形態のエコー経路遅延測定装置100Bは、送話ピッチ特性計算回路101、受話ピッチ特性計算回路102及び相関分析回路103に加え、有音無音判定回路106を有する。   In FIG. 5, an echo path delay measuring apparatus 100 </ b> B according to the third embodiment includes a sound / silence determination circuit 106 in addition to a transmission pitch characteristic calculation circuit 101, a reception pitch characteristic calculation circuit 102, and a correlation analysis circuit 103.

有音無音判定回路106には送話信号s(n)が与えられる。有音無音判定回路106は、フレーム毎に有音無音判定を行い、その判定結果を相関分析回路103に与えるものである。有音無音判定回路106が適用する有音無音判定方法は、既存のいかなる方法を適用しても良い。ここで、有音又は無音を切り分けるための閾値として、近端話者の音声信号が送話信号に含まれていないエコー信号だけが含まれているときにも「有音」と判定する閾値を適用することが好ましい。   The voice signal s (n) is given to the voice / silence determination circuit 106. The sound / silence determination circuit 106 performs sound / silence determination for each frame and gives the determination result to the correlation analysis circuit 103. As the sound / silence determination method applied by the sound / silence determination circuit 106, any existing method may be applied. Here, as a threshold for separating voice or silence, a threshold for determining “sound” even when the near-end speaker's voice signal includes only an echo signal that is not included in the transmission signal. It is preferable to apply.

第3の実施形態の相関分析回路103は、有音無音判定回路106から与えられたフレーム毎の有音無音判定結果の時系列を保存しておくものである。相関分析回路103は、現フレームが無音のときは、分析を実行せず、エコー経路遅延時間Tを出力させない(なお、有効な分析を行った直前のエコー経路遅延時間Tを出力させるようにしても良い)。相関分析回路103は、現フレームが有音のときは、現フレームから過去に遡って有音が連続している1又は複数のフレームでなる区間を把握し、有音連続フレーム区間の送話系のピッチ特性変動に類似する、受話系のピッチ特性変動を、第1の実施形態で説明した方法により認識し、エコー経路遅延時間Tを求める。   The correlation analysis circuit 103 according to the third embodiment stores a time series of the sound / silence determination result for each frame given from the sound / silence determination circuit 106. When the current frame is silent, the correlation analysis circuit 103 does not perform analysis and does not output the echo path delay time T (note that the echo path delay time T immediately before effective analysis is output). Is also good). When the current frame is sound, the correlation analysis circuit 103 grasps a section composed of one or a plurality of frames in which the sound continues from the current frame to the past, and the transmission system of the sound continuous frame section Is recognized by the method described in the first embodiment, and an echo path delay time T is obtained.

以上の点を除けば、第3の実施形態も第1の実施形態と同様である。   Except for the above points, the third embodiment is the same as the first embodiment.

第3の実施形態によれば、少なくとも送話信号が有音であることを条件としてエコー経路遅延時間を測定するようにしたので、その結果、背景雑音などの影響を受け難く、より一段と安定したエコー経路遅延時間の測定結果を得ることができる。   According to the third embodiment, since the echo path delay time is measured on condition that at least the transmitted signal is sound, as a result, the echo path delay time is hardly affected by background noise and the like, and is more stable. The measurement result of the echo path delay time can be obtained.

(D)他の実施形態
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に、例示するような変形実施形態を挙げることができる。
(D) Other Embodiments In the description of each of the above embodiments, various modified embodiments have been referred to, but further modified embodiments as exemplified below can be given.

第2の実施形態におけるLPC分析回路を追加した技術思想と、第3の実施形態における有音無音判定回路を追加した技術思想とを併用するようにしても良い。   You may make it use together the technical idea which added the LPC analysis circuit in 2nd Embodiment, and the technical idea which added the sound / silence determination circuit in 3rd Embodiment.

上記第2の実施形態では、励振源信号(声帯駆動信号)を得るためにLPC分析を利用するものを示したが、他の方法によって励振源情報を得るようにしても良い。   In the second embodiment, the LPC analysis is used to obtain the excitation source signal (voice band driving signal). However, the excitation source information may be obtained by other methods.

上記第2の実施形態では、送話信号の処理系及び受話信号の処理系の双方にLPC分析回路を設けたものを示したが、一方(例えば、送話信号の処理系)だけにLPC分析回路を設けるようにしても良い。   In the second embodiment, the transmission signal processing system and the reception signal processing system are provided with the LPC analysis circuit, but only one (for example, the transmission signal processing system) performs the LPC analysis. A circuit may be provided.

上記第3の実施形態では、送話信号に対してのみ有音無音判定するものを示したが、受話信号に対しても有音無音判定を行うようにしても良い。例えば、送話信号の有音区間でのピッチ特性変動と、受話信号の有音区間でのピッチ特性変動との間で、類似誤差が最小となるズレフレーム数を求めるようにしても良い。   In the third embodiment, the voice / silence determination is performed only for the transmission signal. However, the voice / silence determination may be performed for the reception signal. For example, you may make it obtain | require the gap frame number with which a similar error becomes the minimum between the pitch characteristic fluctuation | variation in the sound area of a transmission signal, and the pitch characteristic fluctuation | variation in the sound area of a reception signal.

送話信号や受話信号のピッチの検出方法は、上記各実施形態のものに限定されず、また、送話信号のピッチ特性変動と受話信号のピッチ特性変動との間の類似度を示す指標も、類似誤差に限定されないことは勿論である。   The method for detecting the pitch of the transmitted signal and the received signal is not limited to those of the above embodiments, and an index indicating the similarity between the pitch characteristic variation of the transmitted signal and the pitch characteristic variation of the received signal is also provided. Of course, it is not limited to the similar error.

上記各実施形態においては、PCやスマートフォン上のソフトフォンに係るエコーキャンセラ装置を意図してなされたものであるが、本発明の用途は、それに限定されるものではない。エコー経路の特性(特に遅延特性)が突発的に変化する可能性がある装置のエコーキャンセラとして適用することができるだけでなく、エコー経路の特性の変化が緩やかである装置のエコーキャンセラとしても適用することができる。また、対象とするエコーは、音響エコーに限定されない。例えば、PCではある信号線を流れている音声信号が他の信号線にも流れるクロストークが生じることがあるが、このようなクロストークも一種のエコーであり、上記各実施形態で説明した遅延時間の測定方法を適用することができる。特許請求の範囲は、このようなエコーと見なされるエコーをも含むものである。   In each of the above embodiments, an echo canceller apparatus related to a softphone on a PC or a smartphone is intended, but the application of the present invention is not limited thereto. Not only can it be applied as an echo canceller for devices where the characteristics (especially delay characteristics) of the echo path may change suddenly, but it can also be applied as an echo canceller for devices where the change in the characteristics of the echo path is gradual. be able to. The target echo is not limited to an acoustic echo. For example, in a PC, an audio signal that flows through a signal line may cause crosstalk that flows to other signal lines. Such crosstalk is also a kind of echo, and the delay described in the above embodiments. Time measurement methods can be applied. The claims also include echoes that are considered such echoes.

100、100A、100B…エコー経路遅延測定装置、101…送話ピッチ特性計算回路、102…受話ピッチ特性計算回路、103…相関分析回路、104…送話側LPC分析回路、105…受話側LPC分析回路、106…有音無音判定回路。   DESCRIPTION OF SYMBOLS 100, 100A, 100B ... Echo path delay measuring apparatus, 101 ... Transmission pitch characteristic calculation circuit, 102 ... Reception pitch characteristic calculation circuit, 103 ... Correlation analysis circuit, 104 ... Transmission side LPC analysis circuit, 105 ... Reception side LPC analysis Circuit 106: Sound / silence determination circuit.

Claims (5)

エコー経路における遅延時間を測定するエコー経路遅延測定装置において、
送話信号に係るピッチの情報を得る送話ピッチ特性取得手段と、
受話信号に係るピッチの情報を得る受話ピッチ特性取得手段と、
送話信号に係るピッチの時系列に類似した、受話信号に係るピッチの時系列部分を探索することにより、エコー経路における遅延時間の情報を求める相関分析手段と
を有することを特徴とするエコー経路遅延測定装置。
In an echo path delay measuring device for measuring a delay time in an echo path,
Transmission pitch characteristic acquisition means for obtaining pitch information related to the transmission signal;
A reception pitch characteristic acquisition means for obtaining pitch information related to the reception signal;
An echo path comprising: correlation analysis means for obtaining delay time information in the echo path by searching for a time series part of the pitch related to the received signal similar to the time series of the pitch related to the transmitted signal Delay measurement device.
上記送話ピッチ特性取得手段は、
送話信号から声道情報を除去した第1の励振源信号を得る第1の励振源信号取得部と、
上記第1の励振源信号におけるピッチの情報を、送話信号に係るピッチの情報として得る送話ピッチ特性取得部とを備え、
上記受話ピッチ特性取得手段は、
受話信号から声道情報を除去した第2の励振源信号を得る第2の励振源信号取得部と、
上記第2の励振源信号におけるピッチの情報を、受話信号に係るピッチの情報として得る受話ピッチ特性取得部とを備える
ことを特徴とする請求項1に記載のエコー経路遅延測定装置。
The transmission pitch characteristic acquisition means is
A first excitation source signal obtaining unit for obtaining a first excitation source signal obtained by removing vocal tract information from a transmission signal;
A transmission pitch characteristic acquisition unit that obtains pitch information in the first excitation source signal as pitch information related to the transmission signal;
The reception pitch characteristic acquisition means includes:
A second excitation source signal acquisition unit for obtaining a second excitation source signal obtained by removing vocal tract information from the received signal;
The echo path delay measuring apparatus according to claim 1, further comprising: a received pitch characteristic acquisition unit that obtains pitch information in the second excitation source signal as pitch information related to the received signal.
送話信号に対する有音無音判定を行う有音無音判定手段をさらに備え、
上記相関分析手段は、送話信号が有音であることを条件に、エコー経路における遅延時間の情報を求める
ことを特徴とする請求項1又は2に記載のエコー経路遅延測定装置。
A voice / silence determination means for performing voice / silence determination on the transmission signal;
The echo path delay measuring apparatus according to claim 1 or 2, wherein the correlation analysis unit obtains information on a delay time in the echo path on condition that the transmitted signal is voiced.
エコー経路における遅延時間を測定するエコー経路遅延測定方法において、
送話ピッチ特性取得手段が、送話信号に係るピッチの情報を得、
受話ピッチ特性取得手段が、受話信号に係るピッチの情報を得、
相関分析手段が、送話信号に係るピッチの時系列に類似した、受話信号に係るピッチの時系列部分を探索することにより、エコー経路における遅延時間の情報を求める
ことを特徴とするエコー経路遅延測定方法。
In the echo path delay measurement method for measuring the delay time in the echo path,
The transmission pitch characteristic acquisition means obtains pitch information related to the transmission signal,
The received pitch characteristic acquisition means obtains information on the pitch related to the received signal,
An echo path delay characterized in that the correlation analysis means obtains delay time information in the echo path by searching for a time series part of the pitch related to the received signal similar to the time series of the pitch related to the transmitted signal Measuring method.
エコー経路における遅延時間を測定するためのエコー経路遅延測定プログラムであって、
コンピュータを、
送話信号に係るピッチの情報を得る送話ピッチ特性取得手段と、
受話信号に係るピッチの情報を得る受話ピッチ特性取得手段と、
送話信号に係るピッチの時系列に類似した、受話信号に係るピッチの時系列部分を探索することにより、エコー経路における遅延時間の情報を求める相関分析手段と
して機能させることを特徴とするエコー経路遅延測定プログラム。
An echo path delay measurement program for measuring a delay time in an echo path,
Computer
Transmission pitch characteristic acquisition means for obtaining pitch information related to the transmission signal;
A reception pitch characteristic acquisition means for obtaining pitch information related to the reception signal;
It is made to function as a correlation analysis means for obtaining delay time information in the echo path by searching for a time series part of the pitch related to the received signal similar to the time series of the pitch related to the transmitted signal. Echo path delay measurement program.
JP2012204567A 2012-09-18 2012-09-18 Echo path delay measuring apparatus, method and program Active JP6011188B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012204567A JP6011188B2 (en) 2012-09-18 2012-09-18 Echo path delay measuring apparatus, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012204567A JP6011188B2 (en) 2012-09-18 2012-09-18 Echo path delay measuring apparatus, method and program

Publications (2)

Publication Number Publication Date
JP2014060597A JP2014060597A (en) 2014-04-03
JP6011188B2 true JP6011188B2 (en) 2016-10-19

Family

ID=50616687

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012204567A Active JP6011188B2 (en) 2012-09-18 2012-09-18 Echo path delay measuring apparatus, method and program

Country Status (1)

Country Link
JP (1) JP6011188B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113593589B (en) 2020-04-30 2022-06-28 阿波罗智联(北京)科技有限公司 Echo time delay detection method and device and electronic equipment
CN112489670B (en) * 2020-12-01 2023-08-18 广州华多网络科技有限公司 Time delay estimation method, device, terminal equipment and computer readable storage medium

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001003317A1 (en) * 1999-07-02 2001-01-11 Tellabs Operations, Inc. Coded domain adaptive level control of compressed speech
US6937723B2 (en) * 2002-10-25 2005-08-30 Avaya Technology Corp. Echo detection and monitoring
JP4743085B2 (en) * 2006-11-08 2011-08-10 沖電気工業株式会社 Echo canceller
JP5086769B2 (en) * 2007-10-23 2012-11-28 パナソニック株式会社 Loudspeaker

Also Published As

Publication number Publication date
JP2014060597A (en) 2014-04-03

Similar Documents

Publication Publication Date Title
KR102132500B1 (en) Harmonicity-based single-channel speech quality estimation
JP5381982B2 (en) Voice detection device, voice detection method, voice detection program, and recording medium
RU2648604C2 (en) Method and apparatus for generation of speech signal
JP5025485B2 (en) Stereo encoding apparatus and stereo signal prediction method
EP2539887B1 (en) Voice activity detection based on plural voice activity detectors
JP2013535915A (en) System, method, apparatus, and computer-readable medium for multi-microphone position selectivity processing
JP6019969B2 (en) Sound processor
JP2011515881A (en) Method and apparatus for detecting and suppressing echo in packet networks
JP6011188B2 (en) Echo path delay measuring apparatus, method and program
JP2005189518A (en) Voiced/voiceless judgment apparatus and voiced/voiceless judgment method
JP2009115735A (en) Distance-measuring device, distance measurement method, distance measurement program, and recording medium
JP4662912B2 (en) Determining the appropriate measurement window for sound source localization in a reverberant environment
JPWO2020240880A5 (en)
JP2010026323A (en) Speech speed detection device
JP2005215204A (en) Device and method for judging voiced or unvoiced
JP5611393B2 (en) Delay time measuring apparatus, delay time measuring method and program
JP5251473B2 (en) Audio processing apparatus and audio processing method
JP2010277023A (en) Telephone voice section detector and program of the same
JP2004301907A (en) Speech encoding device
JP2016080767A (en) Frequency component extraction device, frequency component extraction method and frequency component extraction program
US20240046927A1 (en) Methods and systems for voice control
JP2012094945A (en) Voice communication system and voice communication apparatus
RU2432624C1 (en) Method of reducing data volume during wideband speech coding
JP6930089B2 (en) Sound processing method and sound processing equipment
JP2004061567A (en) Noise canceller

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160905

R150 Certificate of patent (=grant) or registration of utility model

Ref document number: 6011188

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150