JP6011188B2 - Echo path delay measuring apparatus, method and program - Google Patents
Echo path delay measuring apparatus, method and program Download PDFInfo
- Publication number
- JP6011188B2 JP6011188B2 JP2012204567A JP2012204567A JP6011188B2 JP 6011188 B2 JP6011188 B2 JP 6011188B2 JP 2012204567 A JP2012204567 A JP 2012204567A JP 2012204567 A JP2012204567 A JP 2012204567A JP 6011188 B2 JP6011188 B2 JP 6011188B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- signal
- echo path
- transmission
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明はエコー経路遅延測定装置、方法及びプログラムに関し、例えば、音響エコーのエコー経路における伝搬遅延時間(以下、単に遅延時間と呼ぶ)の情報を利用する装置に適用し得るものである。 The present invention relates to an echo path delay measuring apparatus, method, and program, and can be applied to, for example, an apparatus that uses information on propagation delay time (hereinafter simply referred to as delay time) in the echo path of an acoustic echo.
近年、VoIP(Voice over IP)を利用したIP電話が普及している。これを、パーソナルコンピュータ(PC)やスマートフォンなどの情報処理装置上のアプリケーションとして実現するものがあり、一般にソフトフォンと称されている。ソフトフォンにおいては、音声の入出力に際して、情報処理装置に内蔵された汎用的なサウンドデバイス(A/D変換器やD/A変換器を含む)、そのデバイスのドライバが利用される。 In recent years, IP telephones using VoIP (Voice over IP) have become widespread. There is one that realizes this as an application on an information processing apparatus such as a personal computer (PC) or a smartphone, and it is generally called a softphone. In the softphone, a general-purpose sound device (including an A / D converter and a D / A converter) built in the information processing apparatus and a driver of the device are used for voice input / output.
ところが、このようなドライバは、情報処理装置上で動作する他のソフトウェアと時分割で動作させているため、他のソフトウェアの処理によっては、音声の入出力を規定の時間で処理することができない場合も生じる。この結果、音声信号の入出力に途切れや欠落が生じて不連続になり、エコーキャンセラにとってはエコー経路の特性(特に遅延時間)が変化しているように見え、しかも、このようなエコー経路の特性変化は、他のソフトウェア処理との時分割処理の関係で突発的であり、マイクロホンからの音声信号に含まれているエコー成分を消去するのは困難にしていた。 However, such a driver is operated in time division with other software that operates on the information processing apparatus, so that input / output of audio cannot be processed in a specified time depending on the processing of the other software. Sometimes it happens. As a result, the input / output of the audio signal becomes discontinuous due to interruptions and omissions, and it appears to the echo canceller that the characteristics of the echo path (especially the delay time) have changed. The characteristic change is sudden due to the time-division process with other software processes, and it is difficult to eliminate the echo component included in the audio signal from the microphone.
このようなエコー特性の変化に対応する方法として、特許文献1では、ハードウェア構成を工夫する方法が提案されている。
As a method for dealing with such a change in echo characteristics,
しかしながら、特許文献1の記載技術は、情報処理装置の改修又は特殊な回路の追加が必要になり、汎用的な情報処理装置の機能特性を阻害する恐れがあり、話者である情報処理装置のユーザにとっては、使い勝手の悪いものとなっていた。
However, the technology described in
このような課題を解決するために、特許文献2では、ハードウェアの変更を伴わない手法が提案されている。 In order to solve such a problem, Patent Document 2 proposes a technique that does not involve hardware change.
特許文献2に記載のエコーキャンセラは、送話信号を平滑化した平滑送話信号(送話信号のパワ情報)を算出する平滑送話信号計算手段と、受話信号を平滑化した平滑受話信号(受話信号のパワ情報)を算出する平滑受話信号計算手段と、平滑送話信号及び平滑受話信号の相関に基づき、エコー経路による遅延特性を反映させたエコー経路遅延時間の情報を得る遅延時間情報形成手段とを備えている。 The echo canceller described in Patent Document 2 includes a smoothed speech signal calculation means for calculating a smoothed speech signal (speech signal power information) obtained by smoothing a speech signal, and a smoothed speech signal obtained by smoothing the received signal ( Smooth reception signal calculation means for calculating received signal power information) and delay time information formation for obtaining echo path delay time information reflecting delay characteristics of the echo path based on the correlation between the smooth transmission signal and the smooth reception signal Means.
しかしながら、特許文献2の記載技術では、平滑送話信号と平滑受話信号の相関が背景雑音成分によってたまたま大きくなってエコー経路遅延時間として算出される場合があり、そのため、エコー経路遅延時間を安定的に測定できず、エコーを十分に消去できないことも生じていた。 However, in the technique described in Patent Document 2, there is a case where the correlation between the smooth transmission signal and the smooth reception signal happens to be large due to the background noise component and is calculated as the echo path delay time. In other words, the echo could not be sufficiently erased.
そのため、エコー経路遅延時間をより安定的に測定することができるエコー経路遅延測定装置、方法及びプログラムが望まれている。 Therefore, an echo path delay measuring apparatus, method, and program capable of measuring the echo path delay time more stably are desired.
第1の本発明は、エコー経路における遅延時間を測定するエコー経路遅延測定装置において、(1)送話信号に係るピッチの情報を得る送話ピッチ特性取得手段と、(2)受話信号に係るピッチの情報を得る受話ピッチ特性取得手段と、(3)送話信号に係るピッチの時系列に類似した、受話信号に係るピッチの時系列部分を探索することにより、エコー経路における遅延時間の情報を求める相関分析手段とを有することを特徴とする。 According to a first aspect of the present invention, there is provided an echo path delay measuring apparatus for measuring a delay time in an echo path. (1) Transmission pitch characteristic acquisition means for obtaining pitch information related to a transmission signal; Received pitch characteristic acquisition means for obtaining pitch information, and (3) information on delay time in the echo path by searching for a time series part of the pitch related to the received signal similar to the time series of pitch related to the transmitted signal And a correlation analysis means for obtaining.
第2の本発明は、エコー経路における遅延時間を測定するエコー経路遅延測定方法において、(1)送話ピッチ特性取得手段が、送話信号に係るピッチの情報を得、(2)受話ピッチ特性取得手段が、受話信号に係るピッチの情報を得、(3)相関分析手段が、送話信号に係るピッチの時系列に類似した、受話信号に係るピッチの時系列部分を探索することにより、エコー経路における遅延時間の情報を求めることを特徴とする。 According to a second aspect of the present invention, in an echo path delay measurement method for measuring a delay time in an echo path, (1) a transmission pitch characteristic acquisition unit obtains pitch information related to a transmission signal, and (2) a reception pitch characteristic. The obtaining means obtains information on the pitch related to the received signal, and (3) the correlation analyzing means searches for the time series part of the pitch related to the received signal similar to the time series of the pitch related to the transmitted signal, The delay time information in the echo path is obtained.
第3の本発明は。エコー経路における遅延時間を測定するためのエコー経路遅延測定プログラムであって、コンピュータを、(1)送話信号に係るピッチの情報を得る送話ピッチ特性取得手段と、(2)受話信号に係るピッチの情報を得る受話ピッチ特性取得手段と、(3)送話信号に係るピッチの時系列に類似した、受話信号に係るピッチの時系列部分を探索することにより、エコー経路における遅延時間の情報を求める相関分析手段として機能させることを特徴とする。 The third present invention. An echo path delay measurement program for measuring a delay time in an echo path, comprising: (1) transmission pitch characteristic acquisition means for obtaining pitch information related to a transmission signal; and (2) a reception signal Received pitch characteristic acquisition means for obtaining pitch information, and (3) information on delay time in the echo path by searching for a time series part of the pitch related to the received signal similar to the time series of pitch related to the transmitted signal It is made to function as a correlation analysis means which calculates | requires.
本発明によれば、送話信号及び受話信号のピッチ特性の変動の類似度によって、エコー経路遅延時間を測定するようにしたので、従来より安定的にエコー経路遅延時間を測定することができる。 According to the present invention, since the echo path delay time is measured based on the similarity of the variation in the pitch characteristics of the transmission signal and the reception signal, the echo path delay time can be measured more stably than in the past.
(A)第1の実施形態
以下、本発明によるエコー経路遅延測定装置、方法及びプログラムの第1の実施形態を、図面を参照しながら説明する。第1の実施形態のエコー経路遅延測定装置は、エコーキャンセラ装置に組み込まれて使用されることを意図したものである。
(A) First Embodiment Hereinafter, a first embodiment of an echo path delay measuring apparatus, method and program according to the present invention will be described with reference to the drawings. The echo path delay measuring apparatus according to the first embodiment is intended to be incorporated into an echo canceller apparatus.
第1の実施形態は、受話信号(遠端信号)及び送話信号(近端信号)の各々のピッチ特性を分析し、両ピッチ特性の類似度(相関)を基にエコー経路遅延時間を測定するものである。 In the first embodiment, the pitch characteristics of each of the received signal (far-end signal) and the transmitted signal (near-end signal) are analyzed, and the echo path delay time is measured based on the similarity (correlation) of both pitch characteristics. To do.
(A−1)第1の実施形態の構成
図1は、第1の実施形態のエコー経路遅延測定装置100の機能的構成を示すブロック図である。
(A-1) Configuration of the First Embodiment FIG. 1 is a block diagram showing a functional configuration of the echo path
第1の実施形態のエコー経路遅延測定装置は、例えば、PCやスマートフォン等の情報処理装置に搭載されるものである。第1の実施形態のエコー経路遅延測定装置は、例えば、専用ボードとして構築されたものであっても良く、DSP(デジタルシグナルプロセッサ)へのエコー経路遅延測定プログラムの書き込みによって実現されたものであっても良く、CPUと、CPUが実行するソフトウェア(エコー経路遅延測定プログラム)によって実現されたものであっても良いが、機能的には、図1で表すことができる。 The echo path delay measuring device of the first embodiment is mounted on an information processing device such as a PC or a smartphone, for example. The echo path delay measuring apparatus of the first embodiment may be constructed as a dedicated board, for example, and realized by writing an echo path delay measuring program to a DSP (digital signal processor). It may be realized by a CPU and software (echo path delay measurement program) executed by the CPU, but can be functionally represented in FIG.
図1において、第1の実施形態のエコー経路遅延測定装置100は、送話ピッチ特性計算回路101、受話ピッチ特性計算回路102及び相関分析回路103を有する。
In FIG. 1, an echo path
第1の実施形態のエコー経路遅延測定装置100には、図示しない近端のマイクロホンが捕捉し、デジタル化されたデジタル送話信号(以下、送話信号と呼ぶ)s(n)と、図示しないスピーカに向かう遠端からのデジタル受話信号(以下、受話信号と呼ぶ)r(n)とが入力されるものであり、送話信号s(n)と受話信号r(n)とからエコー経路遅延時間の情報Tを得るものである。スピーカから放音された音声、音響をマイクロホンが捕捉するに至る、音声、音響の伝搬経路であるエコー経路での遅延時間特性は一定でないことを前提としている。例えば、エコー経路遅延測定装置100よりスピーカ側で受話信号を処理する構成や、エコー経路遅延測定装置100よりマイクロホン側で送話信号を処理する構成が、CPUによる時分割処理によるソフトウェア処理構成である場合に、このような遅延時間特性の変化が生じる。
The echo path
また、第1の実施形態のエコー経路遅延測定装置100においては、送話信号s(n)は、一定時間のサンプル数ごとに切り出されたフレームを単位に処理され、受話信号r(n)も、一定時間のサンプル数ごとに切り出されたフレームを単位に処理される。以下の説明においては、1フレームのサンプル数をNとして表記している。
Further, in the echo path
送話ピッチ特性計算回路101は、(1)式に示すように、フレーム毎に、現フレームの送話信号s(x−(N−1))〜s(x)と過去の任意の位置の1フレーム分の送話信号s(x−j−(N−1))〜s(x−j)との自己相関RS(j)を計算し、自己相関が最大となるjmaxを探索し、最大となるjmaxを現フレームのズレ量Spとして相関分析回路103に出力するものである。なお、(1)式におけるPS(j)は、(2)式に従って計算される送話信号及び受話信号の双方のパワを考慮したパワの標準的な値である。(1)式及び(2)式における総和Σはnがx−(N−1)〜xについてである。最大のズレ量jmaxは、jが概ね2.5ms〜18.5msとなる範囲で探索する。ズレ量jmaxは、自己相関が最大となるずれであるので、送話信号のその時点のピッチ特性を反映したものとなっている。
As shown in the equation (1), the transmission pitch
図2は、現フレームの送話信号s(x−(N−1))〜s(x)と過去の任意の位置の1フレーム分の送話信号s(x−j−(N−1))〜s(x−j)と、ズレ量jとの関係を概念的に示す説明図である。 FIG. 2 shows transmission signals s (x− (N−1)) to s (x) of the current frame and transmission signals s (x−j− (N−1) for one frame at an arbitrary position in the past. ) To s (x−j) and an explanatory diagram conceptually showing the relationship between the shift amount j.
RS(j)=Σ(s(n)*s(n−j))/PS(j) …(1)
PS(j)=√(Σ(s(n)*s(n))
*√(Σ(s(n−j)*s(n−j))) …(2)
受話ピッチ特性計算回路102は、受話信号r(n)に対して、送話ピッチ特性計算回路101と同様な処理を行い、自己相関が最大となる現フレームのズレ量Rpを相関分析回路103に出力するものである。
RS (j) = Σ (s (n) * s (n−j)) / PS (j) (1)
PS (j) = √ (Σ (s (n) * s (n))
* √ (Σ (s (n−j) * s (n−j))) (2)
The reception pitch
相関分析回路103は、フレーム単位に与えられる送話信号に係るズレ量Sp及び受話信号に係るズレ量Rpの時系列を各々保存しておき、これらの時系列Sp(M−L+1)〜Sp(M)とRp(M−k−L+1)〜Rp(M−k)との間で、パラメータkを所定の範囲内で変化させながら、(3)式に従って類似誤差R(k)を計算し、類似誤差が最小となるkminを探索し、類似誤差が最小となる、フレーム数で表されているkminをミリ秒(ms)に換算してエコー経路遅延時間Τとして次段に出力するものである。(3)式において、mは時系列上でのフレーム順番(時刻)を表すパラメータである。類似誤差を算出するための時間をL(Lは1以上の任意の整数;Lが1の場合には(3)式における総和処理は不要となる)とし、現フレームの時刻をMとする。(3)式における総和Σは、mがM−L+1からMについてである。類似誤差が最小となるkminは、受話信号に係るピッチ特性の変化傾向と、送話信号に係るピッチ特性の変化傾向とが非常に類似しているので、送話信号がエコーとして受話信号に回り込む際のエコー経路における遅延時間を表す値として捉えることができるものである。
The
図3は、送話信号に係るズレ量Spの時系列Sp(M−L+1)〜Sp(M)と受話信号に係るズレ量Rpの時系列Rp(M−k−L+1)〜Rp(M−k)現フレームの送話信号s(x−(N−1))〜s(x)と、パラメータkとの関係を概念的に示す説明図である。 FIG. 3 shows the time series Sp (ML + 1) to Sp (M) of the deviation amount Sp related to the transmission signal and the time series Rp (M−K−L + 1) to Rp (M−) of the deviation amount Rp related to the reception signal. k) It is explanatory drawing which shows notionally the relationship between the transmission signal s (x- (N-1))-s (x) of the present flame | frame, and the parameter k.
R(K)=Σ((Sp(m)−Rp(m−k))
*(Sp(m)−Rp(m−k)) …(3)
ここで、相関分析回路103は、探索した類似誤差の最小値がある値に設定した閾値を超えている場合には、2つの信号の時系列Sp(M−L+1)〜Sp(M)とRp(M−k−L+1)〜Rp(M−k)が類似していないとして、エコー経路遅延時間Τの次段への出力を止めるようにする。
R (K) = Σ ((Sp (m) −Rp (m−k))
* (Sp (m) -Rp (m-k)) (3)
Here, when the minimum value of the searched similar errors exceeds a threshold set to a certain value, the
次段の回路がエコーキャンセラ装置の本体である場合には、例えば、特許文献2に記載のように、エコー経路遅延時間Τが利用される。 When the circuit at the next stage is the main body of the echo canceller apparatus, for example, as described in Patent Document 2, an echo path delay time Τ is used.
(A−2)第1の実施形態の動作
次に、第1の実施形態のエコー経路遅延測定装置100の動作を、上述した図1を参照しながら説明する。
(A-2) Operation of the First Embodiment Next, the operation of the echo path
遠端からの受話信号r(n)は、図示しないスピーカから発音出力され、エコー経路を介して、その時点でエコー経路に固有な遅延時間Tだけ遅れて、図示しないマイクロホンで捕捉され、送話信号s(n)にエコー成分として入り込む。受話信号r(n)は、主に音声信号であるため遠端話者に特有のピッチ特性を有する。例えば、単純波形である正弦波信号はピッチが一定であるが、音声信号の場合、ピッチは一定ではなく緩やかに変動する。受話信号r(n)がエコーとして送話信号s(n)に入り込むので、受話信号r(n)におけるある期間のピッチ特性は、エコー経路の遅延時間Tだけ遅れて、送話信号(におけるエコー成分)s(n)のピッチ特性として表れる。 The reception signal r (n) from the far end is sounded and output from a speaker (not shown), and is captured by a microphone (not shown) via the echo path with a delay time T inherent to the echo path at that time. It enters the signal s (n) as an echo component. Since the received signal r (n) is mainly an audio signal, it has a pitch characteristic peculiar to the far-end speaker. For example, a sine wave signal, which is a simple waveform, has a constant pitch, but in the case of an audio signal, the pitch is not constant but varies slowly. Since the received signal r (n) enters the transmitted signal s (n) as an echo, the pitch characteristic of a certain period in the received signal r (n) is delayed by the delay time T of the echo path, and the transmitted signal (echo in Appears as pitch characteristics of component s (n).
この第1の実施形態のエコー経路遅延測定装置100では、以上のような点に着目し、送話信号s(n)におけるピッチ特性変動と類似する受話信号r(n)におけるピッチ特性変動を探索することを通じて、エコー経路の遅延時間Tを得ることとした。
In the echo path
送話信号s(n)は、送話ピッチ特性計算回路101に入力される。送話ピッチ特性計算回路101においては、(1)式に示すように、フレーム毎に、現フレームの送話信号s(x−(N−1))〜s(x)と過去の任意の位置の1フレーム分の送話信号s(x−j−(N−1))〜s(x−j)との自己相関RS(j)が計算され、自己相関RS(j)が最大となるjmaxが、現フレームのズレ量Spとして相関分析回路103に出力される。
The transmission signal s (n) is input to the transmission pitch
受話信号s(n)は、受話ピッチ特性計算回路102に入力される。受話ピッチ特性計算回路102においては、フレーム毎に、現フレームの受話信号r(x−(N−1))〜r(x)と過去の任意の位置の1フレーム分の受話信号r(x−j−(N−1))〜r(x−j)との自己相関RR(j)が計算され((1)式参照)、自己相関RR(j)が最大となるjmaxが、現フレームのズレ量Rpとして相関分析回路103に出力される。
The reception signal s (n) is input to the reception pitch
相関分析回路103においては、フレーム単位に与えられる送話信号に係るズレ量Sp及び受話信号に係るズレ量Rpの時系列が各々保存される。そして、相関分析回路103において、これらの時系列Sp(M−L+1)〜Sp(M)とRp(M−k−L+1)〜Rp(M−k)との間で、パラメータkを所定の範囲内で変化させながら、(3)式に従って類似誤差R(k)が計算され、類似誤差が最小となるフレーム数で表されているkminがミリ秒(ms)に換算されてエコー経路遅延時間Τとして次段に出力される。
In the
(A−3)第1の実施形態の効果
第1の実施形態によれば、音声信号(受話信号)の特徴を現すピッチの時間変動を基にエコー経路の遅延時間を測定しているため、特許文献2に記載のパワ変動を基に測定する場合に比べて、背景雑音などの影響を受け難く、安定したエコー経路遅延時間の測定結果を得ることができる。
(A-3) Effect of the First Embodiment According to the first embodiment, the delay time of the echo path is measured based on the time variation of the pitch representing the characteristics of the voice signal (received signal). Compared to the case of measuring based on the power fluctuation described in Patent Document 2, it is less affected by background noise and the like, and a stable echo path delay time measurement result can be obtained.
(B)第2の実施形態
次に、本発明によるエコー経路遅延測定装置、方法及びプログラムの第2の実施形態を、図面を参照しながら説明する。
(B) Second Embodiment Next, a second embodiment of the echo path delay measuring apparatus, method and program according to the present invention will be described with reference to the drawings.
図4は、第2の実施形態のエコー経路遅延測定装置100Aの機能的構成を示すブロック図である。
FIG. 4 is a block diagram showing a functional configuration of the echo path
図4において、第2の実施形態のエコー経路遅延測定装置100Aは、送話ピッチ特性計算回路101、受話ピッチ特性計算回路102及び相関分析回路103に加え、送話側LPC(Linear Predictive Coding)分析回路104及び受話側LPC分析回路105を有する。
In FIG. 4, an echo path
送話側LPC分析回路104には送話信号s(n)が入力される。送話側LPC分析回路104は、送話信号s(n)に対してLPC分析を行い、分析で得られたLPC係数と残差信号のうち、残差信号を送話ピッチ特性計算回路101に与えるものである。
The transmission signal s (n) is input to the transmission side
一方、受話側LPC分析回路105には受話信号r(n)が入力される。受話側LPC分析回路105は、受話信号r(n)に対してLPC分析を行い、分析で得られたLPC係数と残差信号のうち、残差信号を受話ピッチ特性計算回路102に与えるものである。
On the other hand, the reception signal r (n) is input to the reception side
送話ピッチ特性計算回路101は、第1の実施形態とは異なり、送話信号s(n)ではなく、送話側LPC分析回路104からの残差信号に対して、第1の実施形態で説明した処理を施すものである。
Unlike the first embodiment, the transmission pitch
同様に、受話ピッチ特性計算回路102は、第1の実施形態とは異なり、受話信号r(n)ではなく、受話側LPC分析回路105からの残差信号に対して、第1の実施形態で説明した処理を施すものである。
Similarly, the reception pitch
残差信号は、周知のように、音声信号(送話信号や受話信号)から声道情報を除外した概ね励振源信号(声帯駆動信号)となっており、音声信号そのものよりピッチが明確になっているものである。そのため、第2の実施形態のエコー経路遅延測定装置100Aでは、送話信号及び受話信号に関し、残差信号からピッチ特性を検出することした。
As is well known, the residual signal is generally an excitation source signal (vocal cord drive signal) obtained by excluding vocal tract information from a voice signal (transmitted signal or received signal), and the pitch becomes clearer than the voice signal itself. It is what. Therefore, in the echo path
以上の点を除けば、第2の実施形態も第1の実施形態と同様である。 Except for the above points, the second embodiment is the same as the first embodiment.
第2の実施形態によれば、第1の実施形態以上に正確に送話信号及び受話信号のピッチの特性を検出でき、その結果、背景雑音などの影響を受け難く、より一段と安定したエコー経路遅延時間の測定結果を得ることができる。 According to the second embodiment, the pitch characteristics of the transmission signal and the reception signal can be detected more accurately than in the first embodiment, and as a result, the echo path is less affected by background noise and the like, and is more stable. A measurement result of the delay time can be obtained.
(C)第3の実施形態
次に、本発明によるエコー経路遅延測定装置、方法及びプログラムの第3の実施形態を、図面を参照しながら説明する。
(C) Third Embodiment Next, a third embodiment of the echo path delay measuring apparatus, method and program according to the present invention will be described with reference to the drawings.
図5は、第3の実施形態のエコー経路遅延測定装置100Bの機能的構成を示すブロック図である。
FIG. 5 is a block diagram showing a functional configuration of the echo path
図5において、第3の実施形態のエコー経路遅延測定装置100Bは、送話ピッチ特性計算回路101、受話ピッチ特性計算回路102及び相関分析回路103に加え、有音無音判定回路106を有する。
In FIG. 5, an echo path
有音無音判定回路106には送話信号s(n)が与えられる。有音無音判定回路106は、フレーム毎に有音無音判定を行い、その判定結果を相関分析回路103に与えるものである。有音無音判定回路106が適用する有音無音判定方法は、既存のいかなる方法を適用しても良い。ここで、有音又は無音を切り分けるための閾値として、近端話者の音声信号が送話信号に含まれていないエコー信号だけが含まれているときにも「有音」と判定する閾値を適用することが好ましい。
The voice signal s (n) is given to the voice /
第3の実施形態の相関分析回路103は、有音無音判定回路106から与えられたフレーム毎の有音無音判定結果の時系列を保存しておくものである。相関分析回路103は、現フレームが無音のときは、分析を実行せず、エコー経路遅延時間Tを出力させない(なお、有効な分析を行った直前のエコー経路遅延時間Tを出力させるようにしても良い)。相関分析回路103は、現フレームが有音のときは、現フレームから過去に遡って有音が連続している1又は複数のフレームでなる区間を把握し、有音連続フレーム区間の送話系のピッチ特性変動に類似する、受話系のピッチ特性変動を、第1の実施形態で説明した方法により認識し、エコー経路遅延時間Tを求める。
The
以上の点を除けば、第3の実施形態も第1の実施形態と同様である。 Except for the above points, the third embodiment is the same as the first embodiment.
第3の実施形態によれば、少なくとも送話信号が有音であることを条件としてエコー経路遅延時間を測定するようにしたので、その結果、背景雑音などの影響を受け難く、より一段と安定したエコー経路遅延時間の測定結果を得ることができる。 According to the third embodiment, since the echo path delay time is measured on condition that at least the transmitted signal is sound, as a result, the echo path delay time is hardly affected by background noise and the like, and is more stable. The measurement result of the echo path delay time can be obtained.
(D)他の実施形態
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に、例示するような変形実施形態を挙げることができる。
(D) Other Embodiments In the description of each of the above embodiments, various modified embodiments have been referred to, but further modified embodiments as exemplified below can be given.
第2の実施形態におけるLPC分析回路を追加した技術思想と、第3の実施形態における有音無音判定回路を追加した技術思想とを併用するようにしても良い。 You may make it use together the technical idea which added the LPC analysis circuit in 2nd Embodiment, and the technical idea which added the sound / silence determination circuit in 3rd Embodiment.
上記第2の実施形態では、励振源信号(声帯駆動信号)を得るためにLPC分析を利用するものを示したが、他の方法によって励振源情報を得るようにしても良い。 In the second embodiment, the LPC analysis is used to obtain the excitation source signal (voice band driving signal). However, the excitation source information may be obtained by other methods.
上記第2の実施形態では、送話信号の処理系及び受話信号の処理系の双方にLPC分析回路を設けたものを示したが、一方(例えば、送話信号の処理系)だけにLPC分析回路を設けるようにしても良い。 In the second embodiment, the transmission signal processing system and the reception signal processing system are provided with the LPC analysis circuit, but only one (for example, the transmission signal processing system) performs the LPC analysis. A circuit may be provided.
上記第3の実施形態では、送話信号に対してのみ有音無音判定するものを示したが、受話信号に対しても有音無音判定を行うようにしても良い。例えば、送話信号の有音区間でのピッチ特性変動と、受話信号の有音区間でのピッチ特性変動との間で、類似誤差が最小となるズレフレーム数を求めるようにしても良い。 In the third embodiment, the voice / silence determination is performed only for the transmission signal. However, the voice / silence determination may be performed for the reception signal. For example, you may make it obtain | require the gap frame number with which a similar error becomes the minimum between the pitch characteristic fluctuation | variation in the sound area of a transmission signal, and the pitch characteristic fluctuation | variation in the sound area of a reception signal.
送話信号や受話信号のピッチの検出方法は、上記各実施形態のものに限定されず、また、送話信号のピッチ特性変動と受話信号のピッチ特性変動との間の類似度を示す指標も、類似誤差に限定されないことは勿論である。 The method for detecting the pitch of the transmitted signal and the received signal is not limited to those of the above embodiments, and an index indicating the similarity between the pitch characteristic variation of the transmitted signal and the pitch characteristic variation of the received signal is also provided. Of course, it is not limited to the similar error.
上記各実施形態においては、PCやスマートフォン上のソフトフォンに係るエコーキャンセラ装置を意図してなされたものであるが、本発明の用途は、それに限定されるものではない。エコー経路の特性(特に遅延特性)が突発的に変化する可能性がある装置のエコーキャンセラとして適用することができるだけでなく、エコー経路の特性の変化が緩やかである装置のエコーキャンセラとしても適用することができる。また、対象とするエコーは、音響エコーに限定されない。例えば、PCではある信号線を流れている音声信号が他の信号線にも流れるクロストークが生じることがあるが、このようなクロストークも一種のエコーであり、上記各実施形態で説明した遅延時間の測定方法を適用することができる。特許請求の範囲は、このようなエコーと見なされるエコーをも含むものである。 In each of the above embodiments, an echo canceller apparatus related to a softphone on a PC or a smartphone is intended, but the application of the present invention is not limited thereto. Not only can it be applied as an echo canceller for devices where the characteristics (especially delay characteristics) of the echo path may change suddenly, but it can also be applied as an echo canceller for devices where the change in the characteristics of the echo path is gradual. be able to. The target echo is not limited to an acoustic echo. For example, in a PC, an audio signal that flows through a signal line may cause crosstalk that flows to other signal lines. Such crosstalk is also a kind of echo, and the delay described in the above embodiments. Time measurement methods can be applied. The claims also include echoes that are considered such echoes.
100、100A、100B…エコー経路遅延測定装置、101…送話ピッチ特性計算回路、102…受話ピッチ特性計算回路、103…相関分析回路、104…送話側LPC分析回路、105…受話側LPC分析回路、106…有音無音判定回路。
DESCRIPTION OF
Claims (5)
送話信号に係るピッチの情報を得る送話ピッチ特性取得手段と、
受話信号に係るピッチの情報を得る受話ピッチ特性取得手段と、
送話信号に係るピッチの時系列に類似した、受話信号に係るピッチの時系列部分を探索することにより、エコー経路における遅延時間の情報を求める相関分析手段と
を有することを特徴とするエコー経路遅延測定装置。 In an echo path delay measuring device for measuring a delay time in an echo path,
Transmission pitch characteristic acquisition means for obtaining pitch information related to the transmission signal;
A reception pitch characteristic acquisition means for obtaining pitch information related to the reception signal;
An echo path comprising: correlation analysis means for obtaining delay time information in the echo path by searching for a time series part of the pitch related to the received signal similar to the time series of the pitch related to the transmitted signal Delay measurement device.
送話信号から声道情報を除去した第1の励振源信号を得る第1の励振源信号取得部と、
上記第1の励振源信号におけるピッチの情報を、送話信号に係るピッチの情報として得る送話ピッチ特性取得部とを備え、
上記受話ピッチ特性取得手段は、
受話信号から声道情報を除去した第2の励振源信号を得る第2の励振源信号取得部と、
上記第2の励振源信号におけるピッチの情報を、受話信号に係るピッチの情報として得る受話ピッチ特性取得部とを備える
ことを特徴とする請求項1に記載のエコー経路遅延測定装置。 The transmission pitch characteristic acquisition means is
A first excitation source signal obtaining unit for obtaining a first excitation source signal obtained by removing vocal tract information from a transmission signal;
A transmission pitch characteristic acquisition unit that obtains pitch information in the first excitation source signal as pitch information related to the transmission signal;
The reception pitch characteristic acquisition means includes:
A second excitation source signal acquisition unit for obtaining a second excitation source signal obtained by removing vocal tract information from the received signal;
The echo path delay measuring apparatus according to claim 1, further comprising: a received pitch characteristic acquisition unit that obtains pitch information in the second excitation source signal as pitch information related to the received signal.
上記相関分析手段は、送話信号が有音であることを条件に、エコー経路における遅延時間の情報を求める
ことを特徴とする請求項1又は2に記載のエコー経路遅延測定装置。 A voice / silence determination means for performing voice / silence determination on the transmission signal;
The echo path delay measuring apparatus according to claim 1 or 2, wherein the correlation analysis unit obtains information on a delay time in the echo path on condition that the transmitted signal is voiced.
送話ピッチ特性取得手段が、送話信号に係るピッチの情報を得、
受話ピッチ特性取得手段が、受話信号に係るピッチの情報を得、
相関分析手段が、送話信号に係るピッチの時系列に類似した、受話信号に係るピッチの時系列部分を探索することにより、エコー経路における遅延時間の情報を求める
ことを特徴とするエコー経路遅延測定方法。 In the echo path delay measurement method for measuring the delay time in the echo path,
The transmission pitch characteristic acquisition means obtains pitch information related to the transmission signal,
The received pitch characteristic acquisition means obtains information on the pitch related to the received signal,
An echo path delay characterized in that the correlation analysis means obtains delay time information in the echo path by searching for a time series part of the pitch related to the received signal similar to the time series of the pitch related to the transmitted signal Measuring method.
コンピュータを、
送話信号に係るピッチの情報を得る送話ピッチ特性取得手段と、
受話信号に係るピッチの情報を得る受話ピッチ特性取得手段と、
送話信号に係るピッチの時系列に類似した、受話信号に係るピッチの時系列部分を探索することにより、エコー経路における遅延時間の情報を求める相関分析手段と
して機能させることを特徴とするエコー経路遅延測定プログラム。 An echo path delay measurement program for measuring a delay time in an echo path,
Computer
Transmission pitch characteristic acquisition means for obtaining pitch information related to the transmission signal;
A reception pitch characteristic acquisition means for obtaining pitch information related to the reception signal;
It is made to function as a correlation analysis means for obtaining delay time information in the echo path by searching for a time series part of the pitch related to the received signal similar to the time series of the pitch related to the transmitted signal. Echo path delay measurement program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012204567A JP6011188B2 (en) | 2012-09-18 | 2012-09-18 | Echo path delay measuring apparatus, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012204567A JP6011188B2 (en) | 2012-09-18 | 2012-09-18 | Echo path delay measuring apparatus, method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014060597A JP2014060597A (en) | 2014-04-03 |
JP6011188B2 true JP6011188B2 (en) | 2016-10-19 |
Family
ID=50616687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012204567A Active JP6011188B2 (en) | 2012-09-18 | 2012-09-18 | Echo path delay measuring apparatus, method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6011188B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113593589B (en) | 2020-04-30 | 2022-06-28 | 阿波罗智联(北京)科技有限公司 | Echo time delay detection method and device and electronic equipment |
CN112489670B (en) * | 2020-12-01 | 2023-08-18 | 广州华多网络科技有限公司 | Time delay estimation method, device, terminal equipment and computer readable storage medium |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001003317A1 (en) * | 1999-07-02 | 2001-01-11 | Tellabs Operations, Inc. | Coded domain adaptive level control of compressed speech |
US6937723B2 (en) * | 2002-10-25 | 2005-08-30 | Avaya Technology Corp. | Echo detection and monitoring |
JP4743085B2 (en) * | 2006-11-08 | 2011-08-10 | 沖電気工業株式会社 | Echo canceller |
JP5086769B2 (en) * | 2007-10-23 | 2012-11-28 | パナソニック株式会社 | Loudspeaker |
-
2012
- 2012-09-18 JP JP2012204567A patent/JP6011188B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014060597A (en) | 2014-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102132500B1 (en) | Harmonicity-based single-channel speech quality estimation | |
JP5381982B2 (en) | Voice detection device, voice detection method, voice detection program, and recording medium | |
RU2648604C2 (en) | Method and apparatus for generation of speech signal | |
JP5025485B2 (en) | Stereo encoding apparatus and stereo signal prediction method | |
EP2539887B1 (en) | Voice activity detection based on plural voice activity detectors | |
JP2013535915A (en) | System, method, apparatus, and computer-readable medium for multi-microphone position selectivity processing | |
JP6019969B2 (en) | Sound processor | |
JP2011515881A (en) | Method and apparatus for detecting and suppressing echo in packet networks | |
JP6011188B2 (en) | Echo path delay measuring apparatus, method and program | |
JP2005189518A (en) | Voiced/voiceless judgment apparatus and voiced/voiceless judgment method | |
JP2009115735A (en) | Distance-measuring device, distance measurement method, distance measurement program, and recording medium | |
JP4662912B2 (en) | Determining the appropriate measurement window for sound source localization in a reverberant environment | |
JPWO2020240880A5 (en) | ||
JP2010026323A (en) | Speech speed detection device | |
JP2005215204A (en) | Device and method for judging voiced or unvoiced | |
JP5611393B2 (en) | Delay time measuring apparatus, delay time measuring method and program | |
JP5251473B2 (en) | Audio processing apparatus and audio processing method | |
JP2010277023A (en) | Telephone voice section detector and program of the same | |
JP2004301907A (en) | Speech encoding device | |
JP2016080767A (en) | Frequency component extraction device, frequency component extraction method and frequency component extraction program | |
US20240046927A1 (en) | Methods and systems for voice control | |
JP2012094945A (en) | Voice communication system and voice communication apparatus | |
RU2432624C1 (en) | Method of reducing data volume during wideband speech coding | |
JP6930089B2 (en) | Sound processing method and sound processing equipment | |
JP2004061567A (en) | Noise canceller |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150515 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160823 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160905 |
|
R150 | Certificate of patent (=grant) or registration of utility model |
Ref document number: 6011188 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |