JP4426186B2 - 音声信号処理装置 - Google Patents

音声信号処理装置 Download PDF

Info

Publication number
JP4426186B2
JP4426186B2 JP2002592111A JP2002592111A JP4426186B2 JP 4426186 B2 JP4426186 B2 JP 4426186B2 JP 2002592111 A JP2002592111 A JP 2002592111A JP 2002592111 A JP2002592111 A JP 2002592111A JP 4426186 B2 JP4426186 B2 JP 4426186B2
Authority
JP
Japan
Prior art keywords
waveform
signal processing
audio signal
predicted
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002592111A
Other languages
English (en)
Other versions
JPWO2002095731A1 (ja
Inventor
靖隆 金山
輝幸 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2002095731A1 publication Critical patent/JPWO2002095731A1/ja
Application granted granted Critical
Publication of JP4426186B2 publication Critical patent/JP4426186B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

技術分野
本発明は、通信ネットワークや端末機におけるリニアPCM音声データなどのデジタル音声データを対象とした音声信号処理装置に関する。
背景技術
今日の情報通信社会において、様々な情報がネットワークを通してやりとりされているが、一昔前に比べるとその扱っているデータは非常に大きくなっており、そしてまた多様化している。今後もこの傾向は続くと思われる。
ネットワークはそのような増え続ける情報量に対応しなければならないが、最近では、そのためのキーワードとして「ブロードバンド化」、「IP化」などの言葉を良く目にする。
「ブロードバンド化」とは、通信経路の伝送能力を高くし、巨大なデータを速やかに伝送できるようにすることであり、「IP化」とはデータをIPパケット単位で送るというものである。パケット交換は回線を占有するわけではないため、データの量に応じた従量課金となり、巨大なデータを扱う今日において非常に重要な方式と言える。
ところで、音声はというと、現在のところ音声情報は回線交換方式で伝送されており、回線を占有している時間に応じた時間課金となっている。回線を占有するわけなので、その間の品質についてはかなり高いものが要求され、また、実際品質はある程度高いと言える。
しかし、時代の流れの中で、音声もIPパケットにより伝送することが検討されており、近い将来「VoIP」とよばれるサービスが始まると考えられる。つまり、音声データも他のデータと同様にパケット交換によって情報のやりとりを行うことになる。
その際音声データは、音声以外のデータのサイズと比較して非常に小さいため、伝送フォーマットは特に圧縮は行わず、現在のATM網で使われているG.711PCMフォーマットとなることが予想される。
しかし、IPパケット交換はエラーが発生してもパケットの再送が可能なデータなどに適した伝送方法であり、音声データのように再送のきかないリアルタイム系の情報においてはある程度の品質劣化が起こると考えられる。
このような品質劣化に起因する音声波形の不連続点があると聴覚上大きな品質劣化が起こることは良く知られているが、音声波形の不連続というのはいろいろな原因で起こるものである。
例えば、最近の移動体通信で使われている音声コーデックはCELP方式などが主であるが、この方式の場合リニアPCMデータをフレーム単位で処理する。フレームからはスペクトル包絡情報や音源情報などのパラメータを抽出し、高い圧縮率での符号化を可能にしている。しかし、フレーム単位で符号化されたデータを復号する場合、フレームとフレームの境目には不連続点が生じやすい。このような不連続点が生じないようにするために、代表的なパラメータ(ピッチ周期など)を用い、重み付けを用いてフレームの境目付近で音声波形の補間を行っている。
他にも、聴覚上の音質を改善するためにフィルタ処理を行う方法などが知られている。また、無線区間における符号化データフレーム(パケット)の消失やデータエラーなどによっても不連続点は生じる。そのときはエラーが起こったことを外部チェックにより伝えてもらい、音声データのレベルを落とす処理などを行うことで聴覚上の品質劣化を抑えている。このような手法の例としては、特開平7−105637や特開平6−326622がある。
上記のようにフレームの境目で補間を行う場合やデータのエラーが生じた場合などは不連続が起こった場所、あるいは不連続が起こる可能性がある場所が予め分かった上での処理であり、主に音声符号化や復号とあわせて行われるものである。しかし、PCMデータをパケット単位で伝送するATM網やIP網において、パケットが消失したり原因不明のビットエラーが起こった場合、そこで生じた不連続点はどこらかもチェックを受けることなく品質劣化の原因を抱えたまま伝送されることになる。
特に、IP網ではパケットの伝送ルートが可変であるため、ルーティングの状態によっては時間的に後に発行されたパケットが先に発行されたパケットを追い越してしまう状況も考えられ、その場合にも不連続点は生じる。
図1は、IP網におけるパケットルーティングの様子を示した図である。
同図では、3つのパケットがそれぞれ順に送信された場合を示している。第1のパケットの後に、第2、第3のパケットが順次送信されても、第2のパケットは、VoIPルータ2を通ってからVoIPルータ1に送信されている。一方、第3のパケットは、直接VoIPルータ1に送信されているため、後から送信された第3のパケットが、第2のパケットを追い越して、送信先に到着することになる。
また、IMT−2000向けの移動体通信網においては、端末機同士での接続の場合にTFO(Tandem Free Operation)と呼ばれる方式を使うことが検討されている。この方式はタンデム接続による品質の劣化を回避する目的があるが、タンデム接続からTFOへの移行、あるいはその逆が行われる時、方式的に不連続点が生じる可能性がある。しかし、それをチェックし、補正する技術はない。
発明の開示
本発明の課題では、不特定に生じる音声波形の不連続点をデジタル音声データを調べることにより検出し、不連続点に起因する品質劣化を補償する音声信号処理装置、特には、リニアPCMデータをチェックし、不連続点を検出し、不連続点を判定された部分には即座に補正をかけ、聴覚上の品質劣化を回避することの出来る音声信号処理装置を提供することである。
本発明の音声信号処理装置は、通信ネットワークにおけるデジタル音声データの処理を行う音声信号処理装置において、入力波形の周期を検出し、該周期から受信する波形を予測する波形予測手段と、該予測された波形と実際に受信された波形との相関値から波形の不連続点を検出する不連続点検出手段と、該不連続点が検出された場合に、該予測された波形と該実際に受信された波形とを用いて不連続点のない補正波形を生成する補正波形生成手段とを備えることを特徴とする。
本発明によれば、受信した波形を直接調べて、不連続点の有無を検出するので、予測できないような原因で不連続点が生じても、不連続点を見つけて、これを補正した波形を生成することが出来る。従って、フレームのつなぎ目など、システムの構成から予測される位置に不連続点が生じた場合のみではなく、波形の任意の位置に発生した不連続点による音声品質の劣化を補償することが出来る。
これにより、本発明では、パケット交換方式による通信ネットワークを介して音声を送受信しても品質の良い音声通信を提供することが出来る。
発明を実施するための最良の形態
本発明では、過去の入力データから周期を求める手段と、求められた周期から未来の音声波形を予測する手段と、予測波形と実際の波形を比較し、補正が必要であるかどうかを判断する手段と、補正が必要な不連続点に対して、重み付けなどの手段を用いて波形を補正する手段を具備する。
図2〜5は、本発明の実施形態の原理を説明する図である。
音声波形を観察すると、有音部分においてはある一定の周期をもって類似した波形が連続して現れることが知られている。これはピッチと呼ばれるものであり、音声を高圧縮する際のパラメータの1つとして、最近の音声符号化方式でも使われている重要なパラメータである。本発明の実施形態では、目的とする音声波形の補正に、このピッチ周期を利用する。図2は、音声波形の例を示しており、kがピッチ周期に相当する。
ピッチ周期は自己相関係数の計算などの方法を使うことで抽出が可能である。自己相関がある程度高い数値を出している場合、ピッチ周期を用いることにより未来の波形(期待する波形)をある程度の誤差の範囲で予測することが可能である。図2で言えば、ピッチ周期がkと求められている場合、kサンプル前のリニアPCMデータの値を現在の値として用いることで予測波形を求めることが出来る。
通常の音声波形では図2のようにきちんとピッチ周期が現れている場合は、実際の波形が予測波形から大きく外れることはあまりない。しかし、図3に示すように、予測波形に対し実際の波形が著しく異なる場合、それは音声波形上の不連続点となり、聴覚上大きく品質を落とす可能性を含むことになる。そのため本実施形態では、毎サンプルで実際の波形と予測波形を比較して不連続点を検出し、不連続点周辺を予測波形を用いて補間する。
実際の波形と予測波形との比較方法として、局所的な相関係数の計算などが挙げられる。図3の点aの近傍を拡大したのが、図4である。図4においてaの近傍a、....、aとbの近傍b、.....、bについて局所的な相関を求めることで著しく波形が乱れたかどうかをチェックする事が出来る。
不連続点と判断されたサンプルについては補正がかけられるが、補正方法としては重み付けを用いる方法などがあるが、特に、本実施形態においては、重み付けの方法を使用することを説明する。図5は重み付けにより予測波形から実際の波形へと徐々に補正されていく様子を示している。すなわち、実線でしめされる実際の波形に不連続点dがある場合、破線で示される予測波形との補間を行う。補間の仕方は、太線で示される補正波形が、不連続点dに近いところでは、予測波形に近い形状となり、徐々に、実際の波形に近づいていくようにする。
図6は、本発明の実施形態の音声信号処理装置の処理ブロック図である。また、図7は、本発明の実施形態の音声信号処理装置の全体の処理フローを示す図である。
本発明の実施形態を図6と図7を用いて説明する。
リニアPCMデータのサンプル列をa(−i)、・・・、a(0)、・・・、a(4)とする。a(0)が補正すべきかどうかが判断されるサンプルであり、a(−1)がそのひとつ過去のサンプルである。また、a(1)、・・・、a(4)はa(0)の後のサンプル値である。本実施形態では、補正すべきサンプル値a(0)より時間的に4サンプル後のサンプル値まで必要となるので、実際の処理においては、補正すべきサンプル値の4サンプル後の値まで読み込んでから処理を行う。
まず、a(0)のサンプルが含まれている部分の波形が周期性を持っているかどうかを調べるために図6の周期検出部10ではa(0)の前の数十サンプル(ここでは40サンプル)でセグメントを形成し、以下の計算を行う。
なお、a(0)の前の数十サンプルは、記憶部14に、入力からの過去のリニアPCMデータが記憶されており、ここから、データを周期検出部10に読み込むようにする。また、周期性の検出のために必要なサンプル数は、ここでは、40サンプルとしているが、実際には、音声データのピッチの一周期を周期検出に使用できるようにサンプル数を決定すべきである。通常、音声データのピッチ周期の検出には、40サンプル程度有れば十分である。サンプリング周波数が異なる場合などにおいては、その周波数に応じて適当なサンプル数を使用するようにする。
Figure 0004426186
この計算でSが最大となる時のkの値とSの値を求める。ただし、逆位相の波形やパワーが小さい波形が補正に影響を及ぼさないようにするため、分子は括弧の中が正であり、かつ、分母で掛け合わされている2つの項がそれぞれある閾値を超えている場合のみを対象とする。すなわち、分子は、2乗されているために、常に正の数であるが、分子の括弧の中の式は、波形が一致している場合に正の大きい値を示し、波形が逆位相となっている場合には、負であって絶対値の大きな値を示す。従って、波形が逆位相となっている場合には、波形の一致が見られないにも関わらず、上記Sが大きな値となってしまうので、これを取り除くため、分子の括弧の中が正の場合に限定する。また、分母の各項の大きさが所定の閾値以上とするのは、音声のパワーが小さい場合を取り除く意味である。分母の各項は、音声のパワーを計算する式となっており、これらの値を所定値以上とすることによって、パワーの小さい音声波形を除去することが出来る。パワーの小さい音声波形を取り除くのは、パワーが小さい音声波形の場合、雑音の影響を受ける可能性が高く、実際の音声波形は、過去の波形と異なるのに、雑音の影響で、上記式で計算した結果、偶然に波形が一致すると判断されてしまう場合を避けるためである。なお、上記閾値は、実験的に本実施形態を利用しようとする各当業者によって適宜決定されるべきものである。
次に、Sがある閾値を超えているかどうかを判断する。超えていた場合は周期的な波形となっていると判断され、周期であるkの値を決定し、図6の予測部11へ送る。超えていない場合は周期的でないと判断され、予測部11や判定部12、補正部13の処理は行わない。なお、Sの判断のための閾値も、実験などを行って、当業者によって適宜設定されるべきものである。
予測部11ではa(0)の近傍がa(−k)の近傍のようになっていると予測する。ここでは、a(0)の近傍をa(−2)、・・・、a(4)、a(−k)の近傍をa(−k−2)、・・・、a(−k+4)とする。予測部11は予測波形を比較判定部12に送る。ここで、予測波形は、a(0)の近傍と同様になっていると判断されたa(−k)の近傍のa(−k−2)〜a(−k+4)のサンプルからなる波形である。そして、予測波形(a(−k)の近傍)と実際の波形(a(0)の近傍)について短区間で以下の計算を行う。なお、ここでの計算は、a(0)とa(−k)のそれぞれの近傍の7サンプルについて行っている。これは、音声波形の一周期よりは十分小さいが、1サンプル毎の雑音的な変化を平均化できる程度に大きい近傍を選択して計算するものである。すなわち、あまり計算するサンプル数が大きすぎると、波形の局所的な不連続を検出することができなくなり、あまりサンプル数が小さすぎると、雑音的なサンプル値の変化でも波形の不連続点と判断してしまうなど、サンプル値の変化に対して敏感になりすぎてしまうので、7サンプル程度がちょうど良いと考えたものである。しかし、本実施形態では、このサンプル数は、必ずしも7サンプルに限定するものではなく、実験などによって当業者が適宜定めるべきものである。
Figure 0004426186
次に、このTが、ある閾値を超えているかどうかを判断し、超えていない場合はその点で著しく波形が乱れたと判断し、補正部13に対して比較判定部12から補正指示が出される。ただし、この場合も分母でかけ合わされている2つの項がある閾値よりも小さい場合は除くようにする。分子の括弧の中が負の場合は−Tとする。ここでも、分母の各項が所定閾値よりも大きい場合のみを使用することにより、音声パワーが小さい場合を取り除き、また、分子の括弧の中が負の場合は、−Tとして、Tの値が負になるようにして、閾値よりも大きくならないようにしている。すなわち、分子の括弧の中が負の場合、つまり、波形が逆位相になっている場合を排除する意味である。また、上述の各閾値は、やはり、実験などにより当業者が適宜決定すべきものである。
補正指示を受けた補正部13では以下に示すような重み付けにより補間を行い、s(補正後の音声データサンプル値)を出力する。一度補正指示がでたらnサンプル(補正後の波形が十分滑らかに実際の波形にほぼ一致するようになるように:このnの値も当業者によって適宜設定されるべきものである)について補正を行い、その間は周期検出、予測、比較判定の機能は停止する。
Figure 0004426186
ここで、offsetとは補正指示がでたときのa(−1)−a(−k−1)の値であり、補正を行う時に1周期(kサンプル)前の値(予測波形)と補正後の波形を滑らかにつなぐために必要な量である。
補正指示がでていない場合は、
Figure 0004426186
となる。
補正部の処理が終わった後、記憶部14はa(4)→a(3)、a(3)→a(2)、a(i)→a(i−1)という具合に値を更新する。なお、s→a(−1)とし、補正結果を記憶部14に記憶される過去の波形データに反映させる。
なお、図6の構成においては、入力からはリニアPCMデータの1サンプルデータが順次入力され、最新のサンプル値は、直接比較判定部12及び補正部13に入力される。記憶部14からは、最新のサンプル値以前の過去のサンプル値が所定数(例えば、40サンプル程度)出力される。例えば、上述の例で言えば、a(4)は、入力から直接比較判定部12、補正部13に入力されるが、a(3)〜a(−40)は、記憶部14からそれぞれの部に入力される。
図7は、本発明の実施形態の全体の処理を示すフローチャートである。
まず、ステップS1において、自己相関係数を計算する。ここでの計算は、上述の説明におけるSの算出にあたる。そして、ステップS2において、周期性があるか否かを判断する。この周期性の判断は、前述の通り、Sの値が所定閾値よりも大きいか否かを判断することにより行い、周期kを決定する。kとは、音声波形の1周期の長さをサンプル数で示したものである。周期性が無いと判断された場合には、ステップS7に進む。この場合、ステップS7では、s=a(0)となり、何ら補正をせずに音声波形のサンプル値を出力する。そして、ステップS8において、新しいサンプル値1つを記憶部14に格納すると共に、一番古いサンプル値を1つ破棄する。
ステップS2において、周期性があると判断された場合には、ステップS3において、波形予測、すなわち、一周期前の過去の波形を予測波形として取得し、ステップS4において、現在の波形と予測波形とを比較する。このステップS4における演算は、前述のTを算出することであり、目的のサンプル値の近傍の少ないサンプル数について、現在の波形と予測波形の相関値を求め、その相関値が所定閾値より大きいか否かを判断することであるが、ステップS4の処理を「比較」と称している。従って、ステップS4の「比較」を行うことによって、現在の波形に不連続点があるか否かが判断される。
そして、ステップS4の比較の結果、現在の音声波形に不連続点があるか否かに従って、ステップS5において、波形の補正が必要か否かを判断する。音声波形に不連続点が無い場合には、補正が必要ないとして、ステップS7、S8に進み、ステップS2において、周期性がない場合と同様の処理を行う。
ステップS5において、補正が必要と判断された場合には、ステップS6において、前述の重み付け演算により、音声波形のサンプル値の補正を行い、これをステップS7において出力し、ステップS8において、補正後のサンプル値を記憶部14に格納すると共に、最も古いサンプル値を破棄する。
図8は、本発明の実施形態に従った音声信号処理装置の適用部分とネットワークを説明する図である。
公衆回線網22は、ネットワーク20を介して移動体網23に接続される。なお、移動体網23は、別の公衆回線網であってもよいし、公衆回線網22が別の移動体網であってもよい。ネットワーク20は、インターネットなどIPパケット交換方式によるネットワークなどである。この場合、ネットワーク20を介して音声を送受するために、VoIPという方式が採用される。ネットワーク20と公衆回線網22との境界装置としてゲートウェイ21が設けられる。また、同様に、移動体網23とネットワーク20の境界装置としてゲートウェイ21が設けられる。
本発明の実施形態に従った音声信号処理装置は、これら境界装置としてのゲートウェイ21に搭載される。すなわち、例えば、公衆回線網22からゲートウェイ21に入力された音声信号は、リニアPCMデータに変換された後、本発明の実施形態の音声信号処理を施され、ネットワーク20にVoIPのフォーマットで送信される。ネットワーク20に送出された音声データを受信したゲートウェイ21は、受信した音声信号をリニアPCMデータに変換し、やはり、本発明の実施形態の音声信号処理を施し、移動体網23に送出する。
移動体網23から公衆回線網22に音声信号を送信する場合も同様である。
また、上記説明では、本発明の実施形態の音声信号処理装置の適用箇所としてゲートウェイを挙げたが、実際には、これには限定されない。すなわち、移動体網23の携帯端末などの移動機内において、受信した音声を再生する場合にも適用可能であるし、移動体網23の基地局、あるいは、公衆回線網22の電話機内に設けて、リニアPCMデータの状態にした音声信号に本発明の実施形態の音声信号処理を行うことも可能である。
産業上の利用可能性
以上本発明によれば、音声波形における不連続点の生じる原因によらず、聴覚上の品質劣化を抑えることが出来る。また、大きな遅延を伴わずに処理を行うことが出来る。
【図面の簡単な説明】
図1は、IP網におけるパケットルーティングの様子を示した図である。
図2は、本発明の実施形態の原理を説明する図(その1)である。
図3は、本発明の実施形態の原理を説明する図(その2)である。
図4は、本発明の実施形態の原理を説明する図(その3)である。
図5は、本発明の実施形態の原理を説明する図(その4)である。
図6は、本発明の実施形態の音声信号処理装置の処理ブロック図である。
図7は、本発明の実施形態の音声信号処理装置の全体の処理フローを示す図である。
図8は、本発明の実施形態に従った音声信号処理装置の適用部分とネットワークを説明する図である。

Claims (22)

  1. 通信ネットワークにおけるデジタル音声データの処理を行う音声信号処理装置において、
    入力波形の周期を検出し、該周期から受信する波形を予測する波形予測手段と、
    該予測された波形と実際に受信された波形との相関値から波形の不連続点を検出する不連続点検出手段と、
    該不連続点が検出された場合に、該予測された波形と該実際に受信された波形とを用いて不連続点のない補正波形を生成する補正波形生成手段と、
    を備えることを特徴とする音声信号処理装置。
  2. 前記入力波形の周期は、該入力波形の自己相関値が所定値以上であることを検出することによって検出されることを特徴とする請求項1に記載の音声信号処理装置。
  3. 前記自己相関値は、前記入力波形の略一周期について演算することを特徴とする請求項2に記載の音声信号処理装置。
  4. 前記これから受信する波形の予測は、予測すべき波形の一周期前の波形を予測波形として行うことを特徴とする請求項1に記載の音声信号処理装置。
  5. 前記不連続点の検出は、不連続点が存在するか否かを判断すべきサンプル点の前後数サンプル点について、前記予測された波形と前記実際に受信された波形との相関値を演算することによって得られることを特徴とする請求項1に記載の音声信号処理装置。
  6. 前記補正波形は、前記予測された波形のサンプル値と前記実際に受信された波形のサンプル値について重み付け補間演算を行うことにより生成されることを特徴とする請求項1に記載の音声信号処理装置。
  7. 前記重み付け補間演算は、前記予測された波形のサンプル値にオフセット量を加えて行われ、前記補正波形と過去に実際に受信された波形とが連続的に接続されることを特徴とする請求項6に記載の音声信号処理装置。
  8. 前記オフセット量は、前記入力波形の周期から割り出される2つのサンプル値に基づいて演算されることを特徴とする請求項7に記載の音声信号処理装置。
  9. 前記通信ネットワークは、音声信号をパケット交換方式により伝送することを特徴とする請求項1に記載の音声信号処理装置。
  10. 前記通信ネットワークは、ATM網あるいはIP網であることを特徴とする請求項9に記載の音声信号処理装置。
  11. 前記デジタル音声データは、リニアPCMデータであることを特徴とする請求項1に記載の音声信号処理装置。
  12. 通信ネットワークにおけるデジタル音声データの処理を行う音声信号処理方法において、
    入力波形の周期を検出し、該周期から受信する波形を予測する波形予測ステップと、
    該予測された波形と実際に受信された波形との相関値から波形の不連続点を検出する不連続点検出ステップと、
    該不連続点が検出された場合に、該予測された波形と該実際に受信された波形とを用いて不連続点のない補正波形を生成する補正波形生成ステップと、
    を備えることを特徴とする音声信号処理方法。
  13. 前記入力波形の周期は、該入力波形の自己相関値が所定値以上であることを検出することによって検出されることを特徴とする請求項12に記載の音声信号処理方法。
  14. 前記自己相関値は、前記入力波形の略一周期について演算することを特徴とする請求項13に記載の音声信号処理方法。
  15. 前記これから受信する波形の予測は、予測すべき波形の一周期前の波形を予測波形として行うことを特徴とする請求項12に記載の音声信号処理方法。
  16. 前記不連続点の検出は、不連続点が存在するか否かを判断すべきサンプル点の前後数サンプル点について、前記予測された波形と前記実際に受信された波形との相関値を演算することによって得られることを特徴とする請求項12に記載の音声信号処理方法。
  17. 前記補正波形は、前記予測された波形のサンプル値と前記実際に受信された波形のサンプル値について重み付け補間演算を行うことにより生成されることを特徴とする請求項12に記載の音声信号処理方法。
  18. 前記重み付け補間演算は、前記予測された波形のサンプル値にオフセット量を加えて行われ、前記補正波形と過去に実際に受信された波形とが連続的に接続されることを特徴とする請求項17に記載の音声信号処理方法。
  19. 前記オフセット量は、前記入力波形の周期から割り出される2つのサンプル値に基づいて演算されることを特徴とする請求項18に記載の音声信号処理方法。
  20. 前記通信ネットワークは、音声信号をパケット交換方式により伝送することを特徴とする請求項12に記載の音声信号処理方法。
  21. 前記通信ネットワークは、ATM網あるいはIP網であることを特徴とする請求項20に記載の音声信号処理方法。
  22. 前記デジタル音声データは、リニアPCMデータであることを特徴とする請求項12に記載の音声信号処理方法。
JP2002592111A 2001-05-22 2001-05-22 音声信号処理装置 Expired - Fee Related JP4426186B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2001/004266 WO2002095731A1 (fr) 2001-05-22 2001-05-22 Processeur de signaux vocaux

Publications (2)

Publication Number Publication Date
JPWO2002095731A1 JPWO2002095731A1 (ja) 2004-09-09
JP4426186B2 true JP4426186B2 (ja) 2010-03-03

Family

ID=11737335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002592111A Expired - Fee Related JP4426186B2 (ja) 2001-05-22 2001-05-22 音声信号処理装置

Country Status (2)

Country Link
JP (1) JP4426186B2 (ja)
WO (1) WO2002095731A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006079349A1 (en) 2005-01-31 2006-08-03 Sonorit Aps Method for weighted overlap-add

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59152496A (ja) * 1983-02-18 1984-08-31 富士通株式会社 音声分析合成装置
JP2585214B2 (ja) * 1986-02-21 1997-02-26 株式会社日立製作所 ピッチ抽出方法
JP2612867B2 (ja) * 1987-10-06 1997-05-21 日本放送協会 音声ピッチ変換方法
JP3219467B2 (ja) * 1992-06-29 2001-10-15 日本電信電話株式会社 音声復号化方法
JP3240832B2 (ja) * 1994-06-06 2001-12-25 日本電信電話株式会社 パケット音声復号方法
JPH10503299A (ja) * 1995-05-10 1998-03-24 フィリップス エレクトロニクス エヌ ベー 改良されたピッチ検出を備えた音声符号化用伝送システム及び方法
JPH11219200A (ja) * 1998-01-30 1999-08-10 Sony Corp 遅延検出装置及び方法、並びに音声符号化装置及び方法

Also Published As

Publication number Publication date
WO2002095731A1 (fr) 2002-11-28
JPWO2002095731A1 (ja) 2004-09-09

Similar Documents

Publication Publication Date Title
Singh et al. VoIP: State of art for global connectivity—A critical review
JP3967338B2 (ja) 無線パケット転送装置
EP1346553B1 (en) Audio signal quality enhancement in a digital network
JP4744332B2 (ja) ゆらぎ吸収バッファ制御装置
JP5133892B2 (ja) ロバストヘッダ圧縮(rohc)効率を向上させるシステムおよび方法
EP2140637B1 (en) Method of transmitting data in a communication system
JP5410601B2 (ja) パケット交換網における遅延の監視
US7924711B2 (en) Method and apparatus to adaptively manage end-to-end voice over internet protocol (VolP) media latency
US20090103517A1 (en) Acoustic signal packet communication method, transmission method, reception method, and device and program thereof
JP2013243690A (ja) サイレント抑圧時のrohcパフォーマンスを向上させる方法と装置
WO2008047560A1 (fr) Appareil de transmission vocale
WO2006009087A1 (ja) ストリームデータ受信再生装置およびストリームデータ受信再生方法
EP2109950B1 (en) Method of transmitting data in a communication system
WO2002037878A2 (en) Method and apparatus for speech quality controlled tandem operation in packet switched networks
EP1330914A2 (en) Method and system for rate adaptation in a packet voice system
JP2008259094A (ja) 無線lan電話通信方法及びシステム
JP4426186B2 (ja) 音声信号処理装置
JP4454255B2 (ja) 音声/fax通信システム、音声/fax受信装置および揺らぎ吸収バッファ量制御方法
JP2003195880A (ja) サーバ・クライアント型音声認識装置
KR20070105151A (ko) 음성 패킷 복구 장치 및 방법
JP2005167684A (ja) 伝送制御装置
Kim Enhanced timing recovery using active jitter estimation for voice-over IP networks
US20040225492A1 (en) Method and apparatus for the detection of previous packet loss in non-packetized speech
JP3460783B2 (ja) 通話機の音声スイッチ
JP2005266411A (ja) 音声圧縮方法および電話器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091208

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091210

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131218

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees