JP2010134013A - 信号処理装置及び信号処理方法 - Google Patents

信号処理装置及び信号処理方法 Download PDF

Info

Publication number
JP2010134013A
JP2010134013A JP2008307219A JP2008307219A JP2010134013A JP 2010134013 A JP2010134013 A JP 2010134013A JP 2008307219 A JP2008307219 A JP 2008307219A JP 2008307219 A JP2008307219 A JP 2008307219A JP 2010134013 A JP2010134013 A JP 2010134013A
Authority
JP
Japan
Prior art keywords
signal
reference signal
input signal
period
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008307219A
Other languages
English (en)
Other versions
JP5335390B2 (ja
Inventor
Yukio Okada
幸夫 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Panasonic Electric Works Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Electric Works Co Ltd filed Critical Panasonic Electric Works Co Ltd
Priority to JP2008307219A priority Critical patent/JP5335390B2/ja
Publication of JP2010134013A publication Critical patent/JP2010134013A/ja
Application granted granted Critical
Publication of JP5335390B2 publication Critical patent/JP5335390B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】現時点の直前における入力信号の基本周期を精度良く算出することができる信号処理装置及び信号処理方法を提供する。
【解決手段】テンプレート設定部51は、パケットロスが発生したロス発生時点RTから過去に向けてある時間幅の音声信号をテンプレートTMとして設定する。周期検出部52は、テンプレート設定部51により設定されたテンプレートTMを音声信号に対してロス発生時点RTから過去に向けてスライドさせ、テンプレートTMと音声信号との相関を求め、テンプレートTMと音声信号との相関ピークが最も強く現れたときのスライド量からロス発生時点RTの直前の音声信号の基本周期を検出する。ここで、テンプレート設定部51は、周期検出部52がテンプレートTMのスライド量が増大するにつれてテンプレートTMの時間幅を増大させる。
【選択図】図2

Description

本発明は、入力信号の基本周期を検出する信号処理装置及び信号処理方法に関するものである。
近年、PLCや無線LAN等の通信媒体を用いて音声通話を行うVoIP(Voice over Internet Protocol)通信が知られている。PLCや無線LAN等の通信媒体は、伝送品質が変動しやすいため、パケットロスによる音声品質の劣化が問題となる。パケットロスが発生すると、例えばプツというようなノイズ音が通話中に発生する可能性がある。
そこで、VoIPの通信装置では、パケットロスが発生した場合、直前の音声信号の基本周期(ピッチ)を検出し、パケットロスが発生した直前の基本周期分の音声信号を用いてロス期間を補間する隠蔽処理が行われている。
図7は、従来の隠蔽処理を説明するための音声信号の波形図である。図7において縦軸は通信装置に入力される音声信号の強度を示し、横軸は時間を示している。音声パケットの受信に失敗し、パケットロスが発生すると、通信装置は、パケットロスが発生する直前の所定期間の音声信号をテンプレートとして設定する。
次に、このテンプレートを音声信号に対してパケットロスが発生したした時点から過去に向けてスライドさせる。次に、テンプレートと音声信号との相関演算を実行し、パケットロスが発生する直前の音声信号の基本周期を検出する。
次に、パケットロスが発生してから過去に遡って、基本周期分の音声信号を取り出し、その音声信号をロス期間に繰り返し当てはめてロス期間を補間する。
ここで、この基本周期分の音声信号でロス期間を補間するのは、通話者が例えば「あ」という音声を発した場合、この「あ」の音声は、20msec程度に区切られて1つの音声パケットにのせて送信されるため、ロス期間ではパケットロスが発生する直前の基本周期分の音声信号が繰り返されている可能性が高いからである。
したがって、隠蔽処理を行う場合、パケットロスが発生した直前の音声信号の基本周期を検出することが重要となる。
なお、従来の基本周期の検出手法として下記に示す特許文献1〜4が知られている。特許文献1では、複数の異なる分析窓幅で、入力音声波形の自己相関関数R(τ)を求め、求めた最大値をR(τ)maxとし、V=R(τ)max/R(0)を求め、Vの大きさとτのばらつきとを考慮して、最も信頼できるτの値から入力音声波形のピッチを求める技術が開示されている。
特許文献2では、デジタルサンプルされた音信号の自己相関関数φ(d)を求め、音声信号の概略のピッチを抽出し、抽出した概略のピッチを基本区間として、基本区間の整数倍で音声信号を区切って演算区間を決定し、決定した演算区間の自己相関関数φ´(d)から音声信号のピッチを求める技術が開示されている。
特許文献3では、過去のフレームで抽出したピッチの平均値が大きいときに分析窓長を長く設定すると共に間引き率を高く設定し、逆に前記平均値が小さいときに分析窓長を短く設定すると共に間引き率を低く設定する技術が開示されている。
特許文献4では、予め定められた複数のピッチ候補のそれぞれについて入力音声信号のピッチを求めるにあたり、ピッチ候補が長周期になるにつれて、周期評価に用いる入力音声信号の時間軸上の評価範囲を広くすると共に、入力音声信号のサンプリング周期を狭める技術が開示されている。
特許第3219868号公報 特許第3233448号公報 特許第345941号公報 特開2004−317533号公報
しかしながら、特許文献1〜4の手法は、いずれも、上記の隠蔽処理を行うことを課題としておらず、単に入力信号から基本周期を精度良く検出すること課題としている。そのため、パケットロスが発生した直前の入力信号の基本周期を精度良く検出することができないという問題がある。特に、特許文献1〜4の手法では、パケットロスが発生する直前に入力信号の基本周期が変化した際に、この基本周期とテンプレートの時間幅とがマッチしていない場合、この基本周期を精度良く検出することができないという問題が発生する。
本発明の目的は、現時点の直前における入力信号の基本周期を精度良く算出することができる信号処理装置及び信号処理方法を提供することである。
(1)本発明の一局面による信号処理装置は、現時点から過去に向けてある時間幅の入力信号を基準信号として設定する基準信号設定部と、前記基準信号を前記入力信号に対して現時点から過去に向けてスライドさせ、前記基準信号と前記入力信号との相関を求めることで、前記入力信号の基本周期を検出する周期検出部とを備え、前記基準信号設定部は、前記基準信号のスライド量が増大するにつれて前記基準信号の時間幅を増大させる。
本発明の別の一局面による信号処理方法は現時点から過去に向けてある時間幅の入力信号を基準信号として設定する基準信号設定ステップと、前記基準信号を現在の入力信号から過去の入力信号に向けてスライドさせ、前記基準信号と入力信号との相関を求めることで、前記基本周期を検出する周期検出ステップとを備え、前記周期検出ステップは、前記基準信号のスライド量が増大するにつれて前記基準信号の時間幅を増大させる。
この構成によれば、現時点から過去に向けてある時間幅の入力信号が基準信号として設定される。そして、設定された基準信号が入力信号に対して現時点から過去に向けてスライドされる。そして、基準信号と入力信号との相関が求められ、入力信号の基本周期が検出される。
ここで、基準信号はスライド量が増大するにつれて時間幅が増大される。したがって、スライド量の小さい比較的初期の段階において、現時点のほぼ直前の基本周期分の入力信号が基準信号とされるタイミングが発生する。このとき、基準信号と入力信号との間で強い相関ピークが現れる。一方、スライド量が大きくなると、それに応じて基準信号の時間幅も増大され、基準信号には複数の周波数成分が含まれるようになる。そのため、上記のタイミングで得られる相関ピークほど強い相関ピークを得ることはできなくなる。よって、現時点の直前の入力信号の基本周期を精度良く検出することが可能となる。
更に、スライド量の小さい比較的初期の段階においては、基準信号の時間幅が短いため、計算量を小さくすることができる。
(2)前記入力信号にパケットロスが発生したか否かを検出するパケットロス検出部と、隠蔽処理部とを更に備え、前記周期検出部は、前記パケットロス検出部によりパケットロスが発生したロス発生時点を前記現時点として前記基本周期を検出し、前記隠蔽処理部は、前記ロス発生時点から過去に向けて前記基本周期分の入力信号を取り出し、取り出した入力信号でパケットロスが発生したロス期間を補間することが好ましい。
この構成によれば、パケットロスが発生した場合に、ロス発生時点が現時点とされ、ロス発生時点の直前における入力信号の基本周期が検出される。そして、ロス発生時点から過去に向けて基本周期分の入力信号が取り出され、この入力信号を用いてロス期間が補間されて隠蔽処理が行われる。そのため、隠蔽処理を精度良く行うことができる。
(3)前記基準信号設定部は、前記基準信号のスライド量が所定のスライド基準値になるまで、前記基準信号の時間幅を所定の初期時間幅に設定することが好ましい。
この構成によれば、基準信号のスライド量が比較的小さい場合は、基準信号の時間幅が初期時間幅に設定されるため、スライド量が小さい場合であっても基準信号の時間幅を一定の大きさ以上確保することが可能となり、基準信号と入力信号との間の相関をより精度良く求めることができる。なお、初期時間幅としては、例えば想定される入力信号の基本周期の最小値程度の値を採用すればよい。また、スライド基準値としては、例えば初期時間幅を採用すればよい。
(4)前記周期検出部は、相互相関により前記基準信号と前記入力信号との相関を求めることが好ましい。
この構成によれば、相互相関が採用されているため、基準信号と入力信号との相関を精度良く算出することができる。
(5)前記周期検出部は、AMDFにより前記基準信号と前記入力信号との相関を求めることが好ましい。
この構成によれば、AMDFが採用されているため、比較的少ない計算量でありながら精度良く基準信号と入力信号との相関を算出することができる。
(6)前記入力信号は、所定のサンプリング周期でサンプリングされた信号であり、前記周期検出部は、式(1)を用いて前記相互相関を行うことが好ましい。
Figure 2010134013
但し、φ(τ)は相関値を示し、Nは前記基準信号の時間幅を示し、x(j)は前記基準信号を示し、x(j−τ)は前記入力信号を示し、k+1は前記基準信号の開始点を示し、aは予め定められた係数を示し、τは前記基準信号のスライド量を示し、jは入力信号の各サンプリング点のサンプリング番号を示す。
この構成によれば、式(1)を用いて相互相関が算出されることになる。
(7)前記入力信号は、所定のサンプリング周期でサンプリングされた信号であり、前記周期検出部は、式(2)を用いて前記AMDFを行うことが好ましい。
Figure 2010134013
但し、φ(τ)は相関値を示し、Nは前記基準信号の時間幅を示し、x(j)は前記基準信号を示し、x(j−τ)は前記入力信号を示し、k+1は前記基準信号の開始点を示し、aは予め定められた係数を示し、τは前記基準信号のスライド量を示し、jは入力信号の各サンプリング点のサンプリング番号を示す。
この構成によれば、式(2)を用いてAMDFが行われることになる。
(8)前記基準信号設定部は、前記基準信号のスライド量が所定の変更基準値を超えるまで、前記aを1≦a<2の範囲内の所定の固定値に設定し、前記基準信号のスライド量が前記変更基準値を超えると、前記スライド量が所定の最大スライド量に近づくにつれて、1に近づくように前記aの値を減少させることが好ましい。
この構成によれば、スライド量が小さい場合、基準信号の時間幅をスライド量に対して大きめに設定することができ、スライド量が大きい場合、基準信号の時間幅をスライド量程度の値に設定することができる。そのため、スライド量が小さい場合において、基準信号の時間幅が小さくなりすぎることを防止することができる。
本発明によれば、スライド量が小さい比較的初期の段階において、現時点のほぼ直前の基本周期分の入力信号が基準信号とされるタイミングが発生する。このとき、基準信号と入力信号との間で強い相関ピークが現れる。一方、スライド量が大きくなると、それに応じて基準信号の時間幅も増大され、基準信号には複数の周波数成分が含まれるようになる。そのため、上記のタイミングで得られる相関ピークほど強い相関ピークを得ることはできなくなる。よって、現時点のほぼ直前の入力信号の基本周期を精度良く検出することが可能となる。
以下、本発明の一実施の形態による信号処理装置を通信装置に適用した場合を例に挙げて説明する。図1は、本発明の一実施の形態による信号処理装置が適用された通信装置の全体構成を示すブロック図である。なお、この通信装置は、例えばVoIPによる通話機能を備える通信装置であり、SIP(Session Initiation Protocol)、H.323、IPv4、又はIPv6等の通信プロトコルを用いて所定の通信ネットワークを介して接続された他の通信装置との間で通信を行う。
図1に示すように、本通信装置は、パケット受信部1、遅延ゆらぎ吸収バッファ2、タイマ3、パケットロス検出部4、検出処理部5、隠蔽処理部6、音声出力部7、及びスピーカ8を備えている。
パケット受信部1は、他の通信装置から送信される音声パケットを受信し、この音声パケットを遅延ゆらぎ吸収バッファ2に出力する。この音声パケットは、例えば、RTP(Real-time Transport Protocol)に準拠した音声パケットであり、20msecのデジタルの音声信号を含む。また、音声信号は、例えば、PCMμ−Law等により8kHzのサンプリング周波数でサンプリングされたデジタルの音声信号である。
したがって、パケット受信部1は、音声パケットのRTPヘッダに含まれるシーケンス番号に従って、受信した音声パケットを時系列順に遅延ゆらぎ吸収バッファ2に出力する。なお、RTPヘッダには、シーケンス番号の他タイムスタンプ等が含まれている。シーケンス番号は音声パケットの送信順序を示し、タイムスタンプは、元の音声波形における音声信号の相対的な位置を示す。
遅延ゆらぎ吸収バッファ2は、パケット受信部1から出力された音声パケットを一旦保持し、所定時間遅延させて出力することで音声パケットの遅延ゆらぎを吸収する。
タイマ3は、パケットロス検出部4がパケットロスを検出する際に用いられる。パケットロス検出部4は、遅延ゆらぎ吸収バッファ2が検出処理部5に音声パケットを出力したとき、タイマ3に計時を開始させ、遅延ゆらぎ吸収バッファ2が次の音声パケットを出力する前に、タイマ3による計時時間がパケットロスが発生したと想定される所定時間を超えた場合、パケットロスが発生したと判定する。
検出処理部5は、遅延ゆらぎ吸収バッファ2から順次出力される音声パケットからシーケンス番号及びタイムスタンプに従って音声信号を取り出す。そして、検出処理部5は、パケットロス検出部4によりパケットロスが検出された場合、取り出した音声信号に対して基本周期(ピッチ)の検出処理を行い、パケットロス検出部4によりパケットロスが検出されなかった場合、取り出した音声信号を音声出力部7にそのまま出力する。なお、検出処理部5は、過去一定期間の音声信号を保持するものとする。
また、検出処理部5は、テンプレート設定部51(基準信号設定部の一例)及び周期検出部52を備えている。テンプレート設定部51は、パケットロスが発生したロス発生時点から過去に向けてある時間幅の音声信号をテンプレート(基準信号の一例)として設定する。ここで、テンプレート設定部51は、周期検出部52がテンプレートのスライド量を増大させるにつれてテンプレートの時間幅を増大させる。
周期検出部52は、テンプレート設定部51により設定されたテンプレートを音声信号に対してロス発生時点から過去に向けてスライドさせ、テンプレートと音声信号との相関を求め、テンプレートと音声信号との相関ピークが最も強く現れたときのスライド量からロス発生時点の直前の音声信号の基本周期を検出する。
図2は、テンプレート設定部51及び周期検出部52の処理を説明するための音声信号の波形図である。なお、図2に示す縦軸は音声信号の強度を示し、横軸は時間をサンプル数で示したものである。また、図2に示すテンプレートTJは従来の隠蔽処理に使用されていたテンプレートを示している。
パケットロスが発生すると、従来の通信装置では、例えば、ロス発生時点RTから過去の所定期間分の音声信号をテンプレートTJとして設定する。そして、このテンプレートTJを音声信号に対してロス発生時点RTから過去に向けてスライドさせることで、音声信号とテンプレートTJの相関を求め、最も強い相関ピークが得られたときのテンプレートTJのスライド量から音声信号の基本周期を検出していた。
図3は、従来のテンプレートTJを用いたときのテンプレートTJと音声信号との相関値の演算結果を示したグラフである。なお、図3においては、AMDFを用いて相関値が算出されている。また、図3において、縦軸は相関値を示し、横軸はロス発生時点RTを0としたときの時間をサンプル数で示したものである。また、図3はAMDFによる相関値であるため、値が小さいほど音声信号とテンプレートTJとの相関が強い。
図3では、まず、37サンプルの時点で下に凸の相関ピークPK1が現れ、次に、47サンプルの時点で下に凸の相関ピークPK2が現れ、以後、およそ37サンプルの周期で下に凸の相関ピークが繰り返し現れている。そして、相関ピークPK1の方が相関ピークPK2よりも小さく現れている。そのため、従来の手法では37サンプルが音声信号の基本周期として検出されてしまう。
一方、図2に示すようにロス発生時点RTの直前の音声信号の基本周期は、47サンプルである。そのため、従来の手法では、ロス発生時点RTの直前の音声信号の基本周期が精度良く検出されていないことが分かる。
これは、テンプレートTJの時間幅は、47サンプルより遙かに大きく、テンプレートTJには検出対象となる基本周期が47サンプルの音声信号は1周期分しか含まれていないが、検出対象でない基本周期が37サンプルの音声信号は3周期分も含まれているため、37サンプルで強い相関ピークが現れたと考えられる。
この場合、ロス発生時点RTから過去に遡って37サンプル分の音声信号を取り出し、この音声信号をロス期間に繰り返し当てはめて補間することで、隠蔽処理が行われる。
そのため、ロス期間の波形とロス期間以外の波形とを滑らかに繋ぐことが困難となり、隠蔽処理を精度良く行うことが困難となってしまう。
一方、テンプレートの時間幅が47サンプルより小さい場合、47サンプルの基本周期を検出することはできない。
そこで、本実施の形態では、図2に示すようにテンプレートTMのスライド量が増大されるにつれて、テンプレートTMの時間幅が増大されている。
そのため、例えば図2の3段目に示すテンプレートTMのように、ある程度テンプレートTMをスライドさせたとき、そのテンプレートには、ほぼ検出対象となる47サンプルの音声信号のみが含まれるようになる。一方、図2の4段目のテンプレートTMにおいては、基本周期が47サンプルの音声信号に加えて、基本周期が37サンプルの音声信号も含まれている。そのため、3段目のテンプレートTMと音声信号との相関の方が、4段目のテンプレートTMと音声信号との相関よりも強く表れ、ロス発生時点RTの直前の音声信号の基本周期を精度良く検出することが可能となる。
ここで、周期検出部52は、相関演算として、例えば式(1)に示す相互相関又は式(2)に示すAMDFを採用することが好ましい。
Figure 2010134013
Figure 2010134013
但し、φ(τ)は相関値を示し、NはテンプレートTMの時間幅を示し、x(j)はテンプレートTMを示し、x(j−τ)は音声信号を示し、k+1はテンプレートTMの開始点を示し、aは予め定められた係数を示し、τはテンプレートTMのスライド量を示し、jは音声信号の各サンプリング点のサンプリング番号を示す。
また、テンプレート設定部51は、テンプレートTMのスライド量が所定のスライド基準値になるまで、テンプレートTMの時間幅を所定の初期時間幅に設定することが好ましい。
こうすることで、テンプレートTMのスライド量が比較的小さい場合は、テンプレートTMの時間幅が初期時間幅に設定され、スライド量が小さい場合であってもテンプレートTMの時間幅を一定の大きさ以上確保することが可能となり、テンプレートTMと音声信号(入力信号)との間の相関をより精度良く求めることができる。
更に、テンプレートTMのスライド量がスライド基準値になるまで、テンプレートTMの時間幅は初期時間幅に設定されるが、この初期時間幅を比較的短くすることで、計算量を少なくすることができる。
なお、初期時間幅としては、想定される音声信号の基本周期の最小値程度を採用することが好ましい。また、スライド基準値としては、例えば初期時間幅を採用すればよい。
図4は、テンプレート設定部51及び周期検出部52の処理を説明する図である。図4に示す直線上の各点は音声信号のサンプリング点を示している。また、右端のサンプリング点はロス発生時点RTを示し、各サンプリング点は、左に向かうにつれて過去のサンプリング点を示している。また、ロス発生時点RTを0番目のサンプリング点とする。音声信号の基本周期は、短い場合で3msec程度であり、サンプリング周波数が8kHzとすると、24サンプルに相当する。したがって、初期時間幅として、例えば24サンプルとすればよいが、図4では、説明の便宜上、テンプレートTMの初期時間幅を4とし、a=1とし、スライド基準値を5とする。
まず、パケットロスが発生すると、周期検出部52は、τ=0に設定し、テンプレートTMの初期時間幅が4であるため、ロス発生時点RTから左に4番目のサンプリング点を基準サンプリング点kとして設定し、kからロス発生時点RTに向かうにつれて、1ずつ増えるように各サンプリング点にサンプリング番号を付与し、kから過去に向かうにつれて、1ずつ減少するように各サンプリング点にサンプリング番号を付与する。
そして、テンプレート設定部51は、音声信号x(k+1)〜x(k+4)をテンプレートTM0として設定する。
そして、周期検出部52は、式(1)又は(2)を用いて、テンプレートTM0と音声信号x(j−0)との相関値φ(0)を算出する。この場合テンプレートTM0は、音声信号x(k+1)〜x(k+4)に当てはめられる。
次に、周期検出部52は、τ=1に設定し、τ=0と同様にして、式(1)又は(2)を用いて、テンプレートTM0と音声信号x(j−1)との相関値φ(1)を算出する。この場合、テンプレートTM0は、音声信号x(k)〜x(k+3)に当てはめられる。
以下、τ=4になるまで、テンプレートTM0が音声信号に対して過去に向けてスライドされ、式(1)又は(2)を用いてφ(2),φ(3),φ(4)が算出される。
次に、周期検出部52は、τ=5に設定すると、τ≧スライド基準値(=5)であるため、ロス発生時点RTから左に5番目のサンプリング点を基準サンプリング点kとして設定する。そして、テンプレート設定部51は、音声信号x(k+1)〜x(k+5)をテンプレートTM5として設定する。そして、周期検出部52は、式(1)又は(2)を用いてテンプレートTM5と音声信号x(j−5)との相関値φ(5)を求める。この場合、テンプレートTM5は、音声信号x(k−4)〜x(k)に当てはめられる。
次に、周期検出部52は、τ=6に設定し、ロス発生時点RTから左に6番目のサンプリング点を基準サンプリング点kとして設定する。そして、テンプレート設定部51は、音声信号x(k+1)〜x(k+6)をテンプレートTM6として設定する。そして、周期検出部52は、式(1)又は(2)を用いてテンプレートTM6と音声信号x(j−6)との相関値φ(6)を求める。この場合、テンプレートTM6は、音声信号x(k−5)〜x(k)に当てはめられる。
以後、周期検出部52は、τが最大スライド量であるτmaxになるまで、上記処理を繰り返し、φ(τ)を求める。これにより、テンプレートTMは、スライド量が増大するにつれて、時間幅が増大されることになる。
図5は、図2に示す音声信号に対して本実施の形態による手法を用いて相関値φ(τ)を求めたときの相関値φ(τ)のグラフを示している。なお、図5において、縦軸は相関値φ(τ)を示し、横軸は時間をサンプル数で示したものである。また、図5においては、AMDFにより相関値φ(τ)が算出されている。したがって、図3と同様、相関値の低い相関ピークほど音声信号とテンプレートTMとの相関が強い。
図5においては、ロス発生時点RT(=0)からおよそ47サンプル経過したときに下に凸の相関ピークPK1が現れ、次に、相関ピークPK1が現れてからおよそ37サンプル経過したときに下に凸の相関ピークPK2が現れ、以後、およそ37サンプル経過する毎に下に凸の相関ピークが現れている。また、相関ピークは時間が経過するにつれて値が大きくなっており、テンプレートTMと音声信号との相関が弱くなっている。なお、サンプリング周波数を8kHzとすると、37サンプルは、37×0.125msec=4.625msecに相当し、47サンプルは、47×0.125=5.875msecに相当する。
つまり、図5に示す相関ピークのうち、テンプレートTMを47サンプル分ずらしたときの相関ピークPK1が最小となっている。
そのため、周期検出部52は、最小の相関ピークPK1が現れた時刻である47サンプルをロス発生時点RTの直前の音声信号の基本周期として検出する。したがって、周期検出部52は、図2に示すロス発生時点RTの直前の音声信号の基本周期である47サンプルを検出できていることが分かる。
図1に戻り、隠蔽処理部6は、ロス発生時点RTから過去に向けて周期検出部52により検出された基本周期分の音声信号を取り出し、取り出した音声信号でパケットロスが発生したロス期間を補間する隠蔽処理を行う。
ここで、隠蔽処理部6は、例えば、図2に示す音声信号が入力され、周期検出部52が基本周期として47サンプルを検出したとすると、ロス発生時点RTから過去に向けて47サンプルの音声信号を取り出し、取り出された音声信号をロス期間の最後まで繰り返し当てはめ、ロス期間を補間する。
音声出力部7は、隠蔽処理が行われた音声信号又は隠蔽処理が行われなかった音声信号をアナログ信号に変換し、スピーカ8から音声として出力させる。
図6は、図1に示す通信装置の処理を示すフローチャートである。なお、図6のフローチャートでは、説明の便宜上、a=1としている。まず、ステップS1において、パケットロス検出部4が、パケットロスを検出すると(ステップS1でYES)、周期検出部52は、τ=0に設定する(ステップS2)。
次に、テンプレート設定部51は、τの値に応じた時間幅のテンプレートTMを音声信号から設定する(ステップS3)。このとき、テンプレート設定部51は、τ<スライド基準値の場合は、テンプレートTMの時間幅を初期時間幅に設定し、τ≧スライド基準値の場合、テンプレートTMの時間幅をN=τに設定する。
次に、周期検出部52は、k+1がテンプレートTMの開始点となるように、基準サンプリング点kを設定し、各サンプリング点にサンプリング番号を付与する(ステップS4)。
次に、周期検出部52は、式(1)又は(2)を用いてテンプレートTMと音声信号との相関値を算出する(ステップS5)。
次に、周期検出部52は、τ=τ+1とする(ステップS6)。次に、周期検出部52は、τ≧スライド基準値の場合(ステップS7でYES)、すなわち、テンプレートTMのスライド量がスライド基準値を超えた場合、処理をステップS8に進め、τ<スライド基準値の場合(ステップS7でNO)、処理をステップS5に戻す。ステップS5〜S7の処理が繰り返されることで、初期時間幅のテンプレートTMは、スライド基準値となるまで、音声信号に対して過去に向けてスライドされる。
ステップS8において、τ<τmaxである場合(ステップS8でNO)処理がステップS3に戻され、τ≧τmaxとなるまで、ステップS3〜S8の処理が繰り返される。これにより、テンプレートTMは、スライド量であるτが増大するにつれて時間幅が増大される。
ステップS8において、τ≧τmaxとなった場合(ステップS8でYES)、周期検出部52は、ステップS5で算出した相関値から相関ピークを検出し、検出した相関ピークのうち、テンプレートTMと音声信号との相関が最も強い相関ピークのスライド量を特定し、特定したスライド量から基本周期を検出する(ステップS9)。ここで、式(1)を採用した場合、相関値が最大の値を有する相関ピークがテンプレートTMと音声信号との最も強い相関を示す。また、式(2)を採用した場合、相関値が最小の値を示す相関ピークがテンプレートTMと音声信号との最も強い相関を示す。
また、周期検出部52は、特定したスライド量に音声信号のサンプリング周期を乗じることで、基本周期を算出すればよい。
次に、隠蔽処理部6は、ステップS9で検出された基本周期に従って音声信号を取り出し、取り出した音声信号を用いてロス期間を補間し、隠蔽処理を行う(ステップS10)。
なお、図4の説明では、テンプレート設定部51は、a=1に設定したが、これに限定されず、テンプレートTMのスライド量が所定の変更基準値を超えるまで、aを1≦a<2の範囲内の所定の固定値に設定し、スライド量が変更基準値を超えると、スライド量が最大スライド量(τmax)に近づくにつれて、1に近づくようにaの値を漸次減少させてもよい。変更基準値としては、例えば上記のスライド基準値を採用することができる。
これにより、スライド量が小さい場合、テンプレートTMの時間幅をスライド量に対して大きめに設定することができ、スライド量が大きい場合、テンプレートTMの時間幅をスライド量程度の値に設定することができる。そのため、スライド量が小さい場合において、テンプレートTMの時間幅が小さくなりすぎることによる相関演算精度の低下を防止することができる。
また、相関演算としては、式(1)に示す相互相関、又は式(2)に示すAMDFに代えて、ASDF等の手法を採用してもよい。
このように、本通信装置によれば、ロス発生時点RTから過去に向けてある時間幅の音声信号がテンプレートTMとして設定される。そして、設定されたテンプレートTMが音声信号に対して現時点から過去に向けてスライドされる。そして、テンプレートTMと音声信号との相関が求められ、音声信号の基本周期が検出される。
ここで、テンプレートTMはスライド量が増大するにつれて時間幅が増大される。したがって、スライド量が小さい比較的初期の段階において、現時点のほぼ直前の基本周期分の音声信号がテンプレートTMとされるタイミングが発生する。このとき、テンプレートTMと音声信号との間で強い相関ピークが現れる。一方、スライド量が大きくなると、それに応じてテンプレートTMの時間幅も増大され、テンプレートTMには複数の周波数成分が含まれるようになる。そのため、上記のタイミングで得られる相関ピークほど強い相関ピークを得ることはできなくなる。よって、現時点のほぼ直前の音声信号の基本周期を精度良く検出することが可能となる。
本発明の一実施の形態による信号処理装置が適用された通信装置の全体構成を示すブロック図である。 テンプレート設定部及び周期検出部の処理を説明するための音声信号の波形図である。 従来のテンプレートを用いたときのテンプレートと音声信号との相関値の演算結果を示したグラフである。 テンプレート設定部及び周期検出部の処理を説明する図である。 図2に示す音声信号に対して本実施の形態による手法を用いて相関値を求めたときの相関値のグラフを示している。 図1に示す通信装置の処理を示すフローチャートである。 従来の隠蔽処理を説明するための音声信号の波形図である。
符号の説明
1 パケット受信部
2 遅延ゆらぎ吸収バッファ
3 タイマ
4 パケットロス検出部
5 検出処理部
6 隠蔽処理部
7 音声出力部
8 スピーカ
51 テンプレート設定部
52 周期検出部

Claims (9)

  1. 現時点から過去に向けてある時間幅の入力信号を基準信号として設定する基準信号設定部と、
    前記基準信号を前記入力信号に対して現時点から過去に向けてスライドさせ、前記基準信号と前記入力信号との相関を求めることで、前記入力信号の基本周期を検出する周期検出部とを備え、
    前記基準信号設定部は、前記基準信号のスライド量が増大するにつれて前記基準信号の時間幅を増大させることを特徴とする信号処理装置。
  2. 前記入力信号にパケットロスが発生したか否かを検出するパケットロス検出部と、
    隠蔽処理部とを更に備え、
    前記周期検出部は、前記パケットロス検出部によりパケットロスが発生したロス発生時点を前記現時点として前記基本周期を検出し、
    前記隠蔽処理部は、前記ロス発生時点から過去に向けて前記基本周期分の入力信号を取り出し、取り出した入力信号でパケットロスが発生したロス期間を補間することを特徴とする請求項1記載の信号処理装置。
  3. 前記基準信号設定部は、前記基準信号のスライド量が所定のスライド基準値になるまで、前記基準信号の時間幅を所定の初期時間幅に設定することを特徴とする請求項1又は2記載の信号処理装置。
  4. 前記周期検出部は、相互相関により前記基準信号と前記入力信号との相関を求めることを特徴とする請求項1〜3のいずれかに記載の信号処理装置。
  5. 前記周期検出部は、AMDFにより前記基準信号と前記入力信号との相関を求めることを特徴とする請求項1〜3のいずれかに記載の信号処理装置。
  6. 前記入力信号は、所定のサンプリング周期でサンプリングされた信号であり、
    前記周期検出部は、式(1)を用いて前記相互相関を行うことを特徴とする請求項4記載の信号処理装置。
    Figure 2010134013
    但し、φ(τ)は相関値を示し、Nは前記基準信号の時間幅を示し、x(j)は前記基準信号を示し、x(j−τ)は前記入力信号を示し、k+1は前記基準信号の開始点を示し、aは予め定められた係数を示し、τは前記基準信号のスライド量を示し、jは入力信号の各サンプリング点のサンプリング番号を示す。
  7. 前記入力信号は、所定のサンプリング周期でサンプリングされた信号であり、
    前記周期検出部は、式(2)を用いて前記AMDFを行うことを特徴とする請求項5記載の信号処理装置。
    Figure 2010134013
    但し、φ(τ)は相関値を示し、Nは前記基準信号の時間幅を示し、x(j)は前記基準信号を示し、x(j−τ)は前記入力信号を示し、k+1は前記基準信号の開始点を示し、aは予め定められた係数を示し、τは前記基準信号のスライド量を示し、jは入力信号の各サンプリング点のサンプリング番号を示す。
  8. 前記基準信号設定部は、前記基準信号のスライド量が所定の変更基準値を超えるまで、前記aを1≦a<2の範囲内の所定の固定値に設定し、前記基準信号のスライド量が前記変更基準値を超えると、前記スライド量が所定の最大スライド量に近づくにつれて、1に近づくように前記aの値を減少させることを特徴とする請求項6又は7記載の信号処理装置。
  9. 現時点から過去に向けてある時間幅の入力信号を基準信号として設定する基準信号設定ステップと、
    前記基準信号を現在の入力信号から過去の入力信号に向けてスライドさせ、前記基準信号と入力信号との相関を求めることで、前記基本周期を検出する周期検出ステップとを備え、
    前記周期検出ステップは、前記基準信号のスライド量が増大するにつれて前記基準信号の時間幅を増大させることを特徴とする信号処理方法。
JP2008307219A 2008-12-02 2008-12-02 信号処理装置及び信号処理方法 Active JP5335390B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008307219A JP5335390B2 (ja) 2008-12-02 2008-12-02 信号処理装置及び信号処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008307219A JP5335390B2 (ja) 2008-12-02 2008-12-02 信号処理装置及び信号処理方法

Publications (2)

Publication Number Publication Date
JP2010134013A true JP2010134013A (ja) 2010-06-17
JP5335390B2 JP5335390B2 (ja) 2013-11-06

Family

ID=42345386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008307219A Active JP5335390B2 (ja) 2008-12-02 2008-12-02 信号処理装置及び信号処理方法

Country Status (1)

Country Link
JP (1) JP5335390B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05251997A (ja) * 1992-03-02 1993-09-28 Mitsubishi Electric Corp 信号処理装置
JP2004028730A (ja) * 2002-06-25 2004-01-29 Fuji Xerox Co Ltd 信号周期検出装置、信号周期検出方法および信号周期検出プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05251997A (ja) * 1992-03-02 1993-09-28 Mitsubishi Electric Corp 信号処理装置
JP2004028730A (ja) * 2002-06-25 2004-01-29 Fuji Xerox Co Ltd 信号周期検出装置、信号周期検出方法および信号周期検出プログラム

Also Published As

Publication number Publication date
JP5335390B2 (ja) 2013-11-06

Similar Documents

Publication Publication Date Title
JP5006279B2 (ja) 音声活性検出装置及び移動局並びに音声活性検出方法
US20100268530A1 (en) Signal Pitch Period Estimation
US8892430B2 (en) Noise detecting device and noise detecting method
JP2009050013A (ja) エコー検出および監視
US9773510B1 (en) Correcting clock drift via embedded sine waves
US20090326950A1 (en) Voice waveform interpolating apparatus and method
JP2012504779A (ja) 音声データの伝送にエラーがある際のエラー隠蔽方法
WO2003047115A1 (en) Method for replacing corrupted audio data
JP2003304219A (ja) 受信フレームの同期方法、フレームエッジ検出方法及びそれを用いた受信装置
KR100900669B1 (ko) 무선 사설망 지그비 수신기 및 그 수신 방법
JP2012516591A (ja) オーディオ信号品質予測
JP4818955B2 (ja) 雑音除去装置
US8503579B2 (en) Channel estimator
JP5335390B2 (ja) 信号処理装置及び信号処理方法
CN102333016B (zh) 检测ip单通的方法及ip单通的检测装置
EP3989225B1 (en) Sampling rate determining method, computer device and non-transitory storage medium
CN101976567B (zh) 一种语音信号差错掩盖方法
JP5611393B2 (ja) 遅延時間測定装置、遅延時間測定方法及びプログラム
JP2006279809A (ja) 音声再生装置および音声再生方法
JP5421780B2 (ja) Ofdm信号のシンボル同期情報の決定
TWI566241B (zh) 語音信號處理裝置及語音信號處理方法
JP4971213B2 (ja) Ip電話装置およびそのパケットロス補償方法
JP6609273B2 (ja) エコーキャンセラおよび受信装置
JP2011176742A (ja) 伝送路応答推定器
JP5100536B2 (ja) 遅延プロファイル推定装置および遅延プロファイル推定方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110921

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20120111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130731

R150 Certificate of patent or registration of utility model

Ref document number: 5335390

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150