JP2005233993A - 音声伝送システム - Google Patents
音声伝送システム Download PDFInfo
- Publication number
- JP2005233993A JP2005233993A JP2004039372A JP2004039372A JP2005233993A JP 2005233993 A JP2005233993 A JP 2005233993A JP 2004039372 A JP2004039372 A JP 2004039372A JP 2004039372 A JP2004039372 A JP 2004039372A JP 2005233993 A JP2005233993 A JP 2005233993A
- Authority
- JP
- Japan
- Prior art keywords
- data
- missing
- packet
- correction
- packets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Detection And Prevention Of Errors In Transmission (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
【課題】伝送経路で音声パケットのロスが発生しても音声品質低下を抑えることができる音声伝送システムを提供する。
【解決手段】送信するデータの処理単位であるペイロードをパケット構成する前に各パケットに分散して構成し、誤り訂正データをそのデータに対して作成し、誤り訂正パケットとして付加する。その構成としては、1パケットを構成するペイロードの個数N(2以上の整数)、最大バースト欠落耐性値P(2以上の整数)及びデータ補正ブロックに対応するパケットの個数Q(2以上の整数)からP・Q個のパケットになるが、このとき元のデータがそれぞれのパケットに分散させるように並べ替える。さらに欠落補正パケットとしてP個のパケットを構成し、これはパケットでQ個分のうち1個の欠落を訂正できるパケットである。また、ここで構成されたパケットが伝送路上で失われたことが検出できるように、これらのパケットに通し番号を付加する。
【選択図】図1
【解決手段】送信するデータの処理単位であるペイロードをパケット構成する前に各パケットに分散して構成し、誤り訂正データをそのデータに対して作成し、誤り訂正パケットとして付加する。その構成としては、1パケットを構成するペイロードの個数N(2以上の整数)、最大バースト欠落耐性値P(2以上の整数)及びデータ補正ブロックに対応するパケットの個数Q(2以上の整数)からP・Q個のパケットになるが、このとき元のデータがそれぞれのパケットに分散させるように並べ替える。さらに欠落補正パケットとしてP個のパケットを構成し、これはパケットでQ個分のうち1個の欠落を訂正できるパケットである。また、ここで構成されたパケットが伝送路上で失われたことが検出できるように、これらのパケットに通し番号を付加する。
【選択図】図1
Description
本発明は、ネットワークを介してデジタル音声パケットの送受信を行う音声伝送システムに関する。
従来、パケットスイッチングネットワークを使用した音声伝送が行われている。音声伝送にパケットスイッチングネットワークを使用する場合、ネットワーク自体の信頼性が必ずしも完全ではないため、伝送路上でデータの欠落が発生すると、それが音声の欠落につながって聞き苦しい音声となってしまう。この欠点を解決するための方法として、常にインタリーブすることによって、伝送路上での欠落に対する復元を行う方法が提案されている(特許文献1参照)。
また、欠落したパケットに含まれていた音声を推定する方法として、音声パケットを一時的に記憶しておいて、その記憶しておいた音声パケットからデータブロックナンバーを検出することで欠落した音声パケットを検出し、欠落した音声パケットの1つ前の音声パケットを基に欠落した音声パケットの補間データを生成する方法が提案されている(特許文献2参照)。
しかしながら、従来のパケットスイッチングネットワークを使用した音声伝送システムにおける音声パケット欠落対策においては、次のような問題がある。即ち、特許文献1で開示されたデータ転送方法においては、連続したデータ補正に際してその長さに限界がある。また、音声データの場合には完全な復元でなくともある程度の復元ですむ場合もあり、復元不能になった場合に欠落のあった付近のデータ一帯が欠落した状態となって何も対策を施さない場合よりも状態が悪化することがある。
また、特許文献2で開示された音声パケット補間装置においては、未来から過去の予測をするため、遅延の発生がある。また、推定に必要なクロック位相情報をパケット中で送らなければならず、そのための手段が必要となる。
本発明は、かかる点に鑑みてなされたものであり、伝送経路で音声パケットのロスが発生しても音声品質低下を抑えることができる音声伝送システムを提供することを目的とする。
本発明の音声送信装置は、デジタル化された音声データを所定の音声ファイル形式で符号化し、符号化したサンプル値を所定数まとめてペイロードを生成し、このペイロードを1単位とするデータ列を出力する音声符号化手段と、1パケットを構成するペイロードの個数N(2以上の整数)、最大バースト欠落耐性値P(2以上の整数)及びデータ補正ブロックに対応するパケットの個数Q(2以上の整数)からP・Q個のパケットを構成する過程において各パケットにペイロードを分散させる並べ替えを行う並べ替え手段と、前記並べ替え手段にてデータの並べ替えが行われたP・Q個のパケットからP個の欠落訂正パケットを生成する欠落パケット生成手段と、前記データの並べ替えが行われたP・Q個のパケットに通し番号を付加してネットワークに伝送するためのパケットを構成するパケット構成手段と、を備えている。
この構成によれば、パケットの欠落を補正する欠落補正パケットとして、訂正能力の限界を超えて音声データの欠落が発生した場合でも、受信後の欠落音声の推定方法に適した構成になるようにしたので、実効的な欠落耐性の向上が図れ、音声品質低下を抑えることができる。
本発明の音声送信装置は、前記並べ替え手段が、1番目のパケットを1,Q・P+1,2・Q・P+1,…,(N−1)・Q・P+1番目のデータ、2番目のパケットを2,Q・P+2,2・Q・P+2,…,(N−1)・Q・P+2番目のデータ、P番目のパケットをP,Q・P+P,2・Q・P+P,…,(N−1)・Q・P+P番目のデータ、Q・P番目のパケットをQ・P,2・Q・P,3・Q・P,…,N・Q・P番目のデータとするデータ構造を持つものを含み、前記欠落パケット生成手段が、誤り訂正1番目の欠落補正パケットに1番目のデータとして、1,P+1,2・P+1,…,(Q−1)・P+1番目のデータのパリティ、誤り訂正1番目の欠落補正パケットに2番目のデータとして、Q・P+1,Q・P+P+1,…,(2・Q−1)・P+1番目のデータのパリティ、・・・誤り訂正2番目の欠落補正パケットに1番目のデータとして、2,P+2,2・P+2,…,(Q−1)・P+2番目のデータのパリティ、誤り訂正2番目の欠落補正パケットに2番目のデータとして、Q・P+2,Q・P+P+2,…,(2・Q−1)・P+2番目のデータのパリティ・・・というデータ構造を持つものを含む。
本発明の音声受信装置は、ネットワーク上のパケットを受信し音声データと欠落補正データを区別して受信するパケット受信手段と、前記パケット受信手段で受信された音声データのパケットの通し番号を使用して、欠落部を検出する欠落検出手段と、前記欠落部の欠落位置と前記欠落補正データとを用いて欠落補正を行う欠落補正手段と、前記欠落補正された音声データのパケットを含む前記パケット受信手段で受信された音声データの各パケットを構成データの並べ替えを元の状態に復元する並べ替え復元手段と、元の並び順に復元された音声データをサンプル値に戻す音声復号化手段と、前記欠落補正手段による欠落補正が行われなかった欠落部を推定する推定補正手段と、を備えている。
この構成によれば、音声を送信する装置側で並べ替えられたデータを本来のデータ順に並べ替え、復号化した後に、欠落音声推定にて欠落部を補正するので、実効的な欠落耐性の向上が図れ、音声品質低下を抑えることができる。
本発明の音声受信装置は、前記推定補正手段が、過去のサンプルデータを記憶する記憶手段と、最終サンプル値に近いサンプル値を検索する検索手段と、過去のサンプルデータの一部を音声データと置き換えるデータ置き換え手段と、連続欠落を検出して1以下の値を掛ける乗算手段と、推定データの一部と実データの一部を連続的に接続する接続手段と、を備えている。
本発明の音声伝送システムは、前述した本発明の音声送信装置のいずれかと、前述した本発明の音声受信装置のいずれかと、を備えている。
この構成によれば、伝送経路で音声パケットのロスが発生しても音声品質低下を抑えることができる音声伝送システムを提供することができる。
本発明の音声送信方法は、送信するデータの処理単位であるペイロードをパケット構成する前に、1パケットを構成するペイロードの個数N(2以上の整数)、最大バースト欠落耐性値P(2以上の整数)及びデータ補正ブロックに対応するパケットの個数Q(2以上の整数)からP・Q個のパケット構成過程において各パケットにペイロードを分散させる並べ替えを行う並べ替えステップと、前記並べ替えステップにより得られたP・Q個のパケットから欠落補正データを作成して欠落補正パケットとして付加してパケットを構成するパケット構成ステップと、構成した各パケットが伝送路上で失われたことを検出できるようにこれらのパケットに通し番号を付加する通し番号付加ステップと、を備えている。
この方法によれば、パケットの欠落を補正する欠落補正パケットとして、訂正能力の限界を超えて音声データの欠落が発生した場合でも、受信後の欠落音声の推定方法に適した構成になるようにしたので、実効的な欠落耐性の向上が図れ、音声品質低下を抑えることができる。
本発明の音声受信方法は、受信したパケットを音声データと欠落補正データに区別し、音声データのパケットの通し番号を確認する確認ステップと、欠落を検出できた場合には前記欠落補正データを使用して欠落部を補正し、前記補正データをもってしても欠落部をすべて補正できなかった音声データについては、残った欠落部の位置を欠落情報として保持し、正常な音声データ、欠落補正した音声データ、欠落補正が不能な音声データを元のデータ順に並べ替え、復号化した後に欠落音声推定にて欠落部を補正する補正ステップと、この補正に際して推定データと非欠落データの結合部をクロスフェードにて不連続にならないように処理する処理ステップと、を備えている。
この方法によれば、音声を送信する装置側で並べ替えられたデータを本来のデータ順に並べ替え、復号化した後に、欠落音声推定にて欠落部を補正するので、実効的な欠落耐性の向上が図れ、音声品質低下を抑えることができる。
本発明によれば、パケットスイッチングネットワークで音声をパケット化して伝送する音声伝送システムにおいて、伝送経路でパケットロスが発生しても音声品質低下を抑えることができる。
以下、本発明を実施するための最良の形態について、図面を参照して詳細に説明する。図1は、本発明の一実施の形態に係る音声伝送システムの構成を示すブロック図である。
この一実施の形態の音声伝送システムは、音声送信装置100と音声受信装置200とを備えて構成される。以下、音声送信装置100、音声受信装置200の順で説明する。
〔音声送信装置100の構成〕
音声送信装置100は、A/D処理部101と、コーデック部102と、並べ替え処理部103と、メモリ104と、欠落補正データ発生部105と、パケット構成部106とを備えている。A/D処理部101は、マイク等の音声入力装置10から入力されたアナログ音声信号をデジタル変換してコーデック部102に入力する。
音声送信装置100は、A/D処理部101と、コーデック部102と、並べ替え処理部103と、メモリ104と、欠落補正データ発生部105と、パケット構成部106とを備えている。A/D処理部101は、マイク等の音声入力装置10から入力されたアナログ音声信号をデジタル変換してコーデック部102に入力する。
コーデック部102は、入力されたデジタル音声信号に対して符号化(サブバンドADPCM、MPEG2−AAC、MP3など)し、その符号をまとめてペイロードと呼ばれる単位にする。このまとめるサイズは特に規定はしていないが、具体的な例として、24kHzのサンプリング周波数を使用し、サブバンドADPCM(Adaptive Differential Pulse Code Modulation)符号化し、1サンプル4ビット時、256〜512サンプルのまとまりでペイロードとすると、その時間は10〜20ms、データ長は128〜256バイトとなる。
次にパケットサイズを規定する。まずパケット自体のオーバーヘッドを減らすために、ペイロードを幾つかまとめてパケットとなるサイズを決める。例えばパケット中のデータを1024バイトとすると、ペイロード長256バイトのときは4個分をまとめることができる。この値を「N」とする。次に、ともに「2」以上の整数PとQを定める。この場合、「P」は完全回復限界値となる最大バースト欠落耐性値、「Q」はデータ補正ブロックの対応するパケットの個数とする。
並べ替え処理部103は、N・P・Q個のペイロードをひとまとまりとして、連続したペイロードが異なるパケットになるように分散させる。並べ替え処理部103はこの処理においてメモリ104を用いる。欠落補正データ発生部105は、欠落したパケット(以下欠落パケット)を補正するための欠落補正パケットを生成する。生成する欠落補正パケットは、Q個のうち1個の、通し番号(以下で説明)との対応関係を持ち、欠落パケットを修正できるように生成する。欠落補正パケットの例としては、送信側がパケット生成の際にQ個の対象となるパケットのパリティをとることで実現できる。この方法で欠落部がわかれば、残りのデータとこの補正パケットで再度パリティ計算することで、欠落したデータを復旧することができる。
パケット構成部106は、並べ替え処理部103で並べ替えられたパケットから音声データパケットを生成する。この際、音声データパケットには通し番号を付加し、音声データパケットの中のいずれかが欠落した場合に欠落部分を識別できるようにしている。 以上の通し番号を付加した音声データと、欠落補正パケットをそれぞれネットワーク11へ送信する。なお、通し番号生成には、RTP(Real-time Transport Protocol)のシーケンス番号を利用して受信側で検出する。また、音声パケットと欠落補正パケットはUDP(User Datagram Protocol)パケットで構成され、これらの区別には、ポート番号を変えることで対応している。
ここで、図2を用いて並べ替え処理と欠落補正データ発生処理の具体例を説明する。図2は、N=5、P=4、Q=2の例である。コーデック部102(図1参照)から出力されるオリジナルのデータ列(ストリーム)は、「ペイロード」という単位長で構成される(実際にはペイロード長は128〜512バイトである)。この図に向かって左側の四角の枠が、各ペイロードの順序番号を示しており、データに相当するものである。1,2,3,…の順にデータが出てくる。
変換手順の第1ステップとして、P・Q個(この場合は4・2=8である)のペイロードで一種のインタリーブを行って並び替えを行う。これが、この図に向かって右側の上から8段の各ブロックになる。なお、この1段分(5個のペイロード分)が1パケットになる。ここまでが並べ替え処理部103の処理である。
並べ替え処理部103で得られた8段分のパケットに欠落補正データが付加される。この例では、P個即ち4個のパケットが付加される。その中身は、図2に向かって右側の縦の列、P間隔でQ個のペイロードのパリティを取ることで生成される。
例えば、ペイロード長が16ビットで中身が、
「1」:「1000100010001000」
「2」:「1100110011001100」
「3」:「1110111011101110」
「4」:「1111111111111111」
「5」:「1010101010101010」
「6」:「1110111011101110」
「7」:「1001100110011001」
「8」:「0100010001000100」
のとき、
P1,5は「0010001000100010」
P2,6は「0010001000100010」
P3,7は「0111011101110111」
P4,8は「1011101110111011」
となる。このようにして欠落補正データが生成される。
「1」:「1000100010001000」
「2」:「1100110011001100」
「3」:「1110111011101110」
「4」:「1111111111111111」
「5」:「1010101010101010」
「6」:「1110111011101110」
「7」:「1001100110011001」
「8」:「0100010001000100」
のとき、
P1,5は「0010001000100010」
P2,6は「0010001000100010」
P3,7は「0111011101110111」
P4,8は「1011101110111011」
となる。このようにして欠落補正データが生成される。
図3は、音声送信装置100の処理を示すフローチャートである。まず音声入力を行い(ステップS301)、次いでデジタル変換を行う(ステップS302)。そして、データの入れ替えを行い(ステップS303)、さらに連番付加処理を行う(ステップS304)。その後、欠落補正データを生成して(ステップS305)、パケットを構成するパケット化処理を行う(ステップS306)。そして、構成したパケットをネットワーク11へ出力する(ステップS307)。
〔音声受信装置200の構成〕
図1において、音声受信装置200は、パケット受信部201と、欠落検出部202と、欠落補正部203と、並べ替え復元部204と、メモリ205と、コーデック部206と、推定補正部207と、D/A処理部208とを備えている。パケット受信部201は、ネットワーク11からパケットを受け取り、音声パケットと欠落補正パケットに分ける。欠落検出部202は、音声パケットについて通し番号の欠落を検出し、欠落パケットの位置を確定する。
図1において、音声受信装置200は、パケット受信部201と、欠落検出部202と、欠落補正部203と、並べ替え復元部204と、メモリ205と、コーデック部206と、推定補正部207と、D/A処理部208とを備えている。パケット受信部201は、ネットワーク11からパケットを受け取り、音声パケットと欠落補正パケットに分ける。欠落検出部202は、音声パケットについて通し番号の欠落を検出し、欠落パケットの位置を確定する。
欠落補正部203は、パケット受信部201で欠落補正パケットが受信された場合、その欠落補正パケットが対象としているパケットが全て揃っている場合は何もしない。対象パケットのうち1つのみが欠落している場合には、その欠落パケットを補正して入れ替える。2つ以上が欠落している場合は補正することはできないので、欠落情報をそのままにする。また、欠落補正パケットが欠落する場合もあるが、この場合も何もしない。
並べ替え復元部204は、パケットをほどいてペイロード単位の連続したデータに変換する。このときに欠落した部分に関してもその欠落情報は保持し、どこのペイロードが欠落しているかを保ったままのデータとする。並べ替え復元部204はこの処理を行うに際してメモリ205を用いる。コーデック部206は、並べ替え復元部204で復元されたデータを復号する。この際、欠落している部分については、復号した時点ではまだ無音となったままである。推定補正部207は、欠落情報に基づき、欠落箇所に対して推定補間を行う。
推定補間方法は、欠落位置からそれ以前の複数のデータを元に補間し、欠落データと入れ替える。推定補正部207は、図示せぬ、過去のサンプルデータを記憶する記憶手段と、最終サンプル値に近いサンプル値を検索する検索手段と、過去のサンプルデータの一部を音声データと置き換えるデータ置き換え手段と、連続欠落を検出して1以下の値を掛ける乗算手段と、推定データの一部と実データの一部を連続的に接続する接続手段とを備える。
これらの手段により、予め欠落の発生がなく再生している間にそれまでのサンプルデータを保持しておいて、欠落発生時に、ある失われそうな長さ(ペイロード長)+クロスフェード長以前で、最後にとぎれた部分の値と比較して、その部分に近い値となっているサンプルを検索し、そこからペイロード長分を欠落した部分と置き換える。また、補間後データが復旧した部分と不連続になるのを防ぐため、復旧後幾らかのサンプル数は補間データと本来のデータをクロスフェード(以下で説明する)する。この実施の形態では64サンプルとしているが、この値は他の条件によって変動する。また、連続して欠落した場合には2回目以降は出力に対して0.7倍すなわち3dBから0.5倍すなわち6dBの間で一定率で音量を下げる。
この処置は、本装置を使用する実ネットワークである専用線の傾向的特徴として、パケットロスの発生するときは単独であるか、ある程度(例えば100ms程度)まとめて欠落するかのいずれかという傾向がある。前者に対しては上記欠落補正パケットの効果があるが、後者の場合に本方式の効果がある。この場合、上記欠落補正パケットだけでは対応しきれないので、この推定補間が用いられる。
また、保持するデータ量は、4096サンプル(約170ms)としているが、これは実際のネットワークにて発生するバーストロスが100msとみていることによる。なお、近い値を検索するには、ずれがある閾値を定めそれ以下の値の場所とし、その値がない場合ずれが最小の値の場所と識別する。
また、ここでは推定単位長をペイロード長としているが、データ変換方式を変更することによって、複数ペイロードがまとめて失われる可能性が事前にわかっている場合には、推定単位長に複数ペイロード長を指定してもよい。ただし、この場合失われたペイロード長が想定長より短い場合には推定品質の低下の原因となるので、この値は欠落の起こる単位長とする。
2ペイロード分以上が連続して失われた時には、この置き換え処理を繰り返し行い、最後のみクロスフェードで接続するが、この場合クロスフェードの前に2ペイロード目以降の振幅を低くしてもよい。本実施の形態では、70%〜50%の間を選択的に使用している。これは、連続してロスが発生する場合には、2つのみならずそれ以上のロスが発生する可能性があるため、補正の限界となる前に音量を小さくすることによって雑音の発生を抑制することが目的である。不自然に大きい欠落が100msとすると、ペイロード長が256サンプルのとき、約10ペイロード、ペイロード長が512サンプルのとき約5ペイロードとなり、それぞれの場合で、最終時点で略無音化できるレベルとなる。上述したクロスフェードとは、音声の接合部を重ね合わせ、徐々に重み付けを線形に変えて接続することによって連続的にすることである。
ここで、図4〜図8を用いて上記した欠落補正処理と逆並べ替え処理を具体的に説明する。図4及び図5は、P=4、Q=2で補正を行う例である。これらの図において、1つの長い四角がパケットを意味する。図4が実際に送られて来るパケットであり、1〜12の「音声パケット」と、P1,5,9、P2,6,10、P3,7,11、P4,8,12の4個の「欠落補正データ」とが送られてきた場合を想定している。これらのうち、5〜9のパケットが欠落した場合を考える。データを処理して行く際に、P・(Q+1)個のパケット単位で処理することになるが、連番確認により5〜9が欠落していることが判定される。
次に、欠落している番号それぞれについて「補正」可能であるかどうかを判定する。「5」のパケットについては、欠落補正データが「1」,「5」,「9」からなっているので、「9」のパケットが存在しないことにより補正不能と判断する。「6」のパケットについては、欠落補正データが「2」,「6」,「10」からなっているので、「2」と「10」のパケットが全て存在することにより補正可能と判断する。同様に「7」と「8」についても補正可能と判断し、「9」については補正不能と判断する。したがって、「6」,「7」,「8」については補正を行い、欠落状態のままのものは「5」と「9」になる。次に、逆並べ替え処理でデータを本来通りの順序に戻すことになるが、5番目のペイロードと、9番目のペイロード、17番目のペイロード、21番目のペイロードが失われた状態になる。この失われたペイロードに対して欠落推定を行う。
図6は、推定対象が1つの場合(即ち連続していない場合)である。欠落直線の値を、推定単位幅+クロスフェード幅で、近い値になっている部分を検索する。つまり、推定した部分が連続的になるような場所を探すことである。欠落した部分は、そのまま上記の切り出し部分のものを用いるが、欠落が回復した後、不連続になるのを防ぐためにクロスフェード接続を行う。この幅は予め決めておく。ここで、クロスフェード接続とは、接続の両側で連続になるようにするためのものであり、クロスフェード部の先頭は補正部が100%、最後は元々のデータが100%になるようにして、その間のそれぞれの割合は線形にしている。
次に、図7及び図8は連続した推定を行う場合である。基本的には上述した図6のものと同様であるが、連続した2つ目以降はそれぞれ推定したものの、振幅に1以下の値を掛けて振幅を縮小する。実際は0.7〜0.5の間の値を掛けている。
〔欠落補正処理手順〕
次に、図9〜図11に示すフローチャートを参照して音声受信装置200における欠落補正処理の手順について説明する。なお、説明上必要な場合には図1を参照する。
次に、図9〜図11に示すフローチャートを参照して音声受信装置200における欠落補正処理の手順について説明する。なお、説明上必要な場合には図1を参照する。
ネットワーク11からパケットを受信し(ステップS901)、受信したパケットの種類が音声データか欠落補正データであるかを判定する(ステップS902)。この判定処理において、受信したパケットが音声データであれば、それをバッファ(図示略)に追加し(ステップS903)、連番に欠番があるかどうかを確認する(ステップS904)。 一方、欠落補正データである場合はその補正対象としている音声データが既に処理済みであるかどうかを判定し(ステップS905)、処理済みであればその欠落補正データは不要であるので破棄する(ステップS906)。これに対して未処理であれば、欠落補正データ用バッファ(図示略)に追加する(ステップS907)。
ステップS904の処理において、連番に欠落が検出された場合又はステップS907の処理において欠落補正データをバッファに追加した場合は、現有バッファの内容で欠落補正が可能な範囲であるかどうかを判定する(ステップS908)。現有バッファの内容で欠落補正が可能であれば補正処理を行う(ステップS909)。ステップS904の処理で欠落が無かった場合又はステップS909で補正処理を行った場合、ステップS910で再生処理を行う。
〔再生処理手順〕
図10は、上記再生処理の手順を示すフローチャートである。この再生処理では、変換された音声データを復元し、ペイロード単位で処理する。
図10は、上記再生処理の手順を示すフローチャートである。この再生処理では、変換された音声データを復元し、ペイロード単位で処理する。
まず、再生すべきデータの読み出しを行う(ステップS1001)。このとき、該当データが存在するかどうかを判定し(ステップS1002)、存在する場合は圧縮解除(即ち復号化)する(ステップS1003)。そして、その内容を履歴バッファ(図示略)に追加する(ステップS1005)。一方、読み出しデータが存在しなかった場合には推定処理を行う(ステップS1004)。履歴バッファへの追加後はD/A変換(ステップS1006)を行い、音声出力する(ステップS1007)。
〔推定処理手順〕
図11は、上記推定処理の手順を示すフローチャートである。まず、履歴バッファから直前の有効なデータの最終の値に近い値の音声サンプルを検索する(ステップS1101)。次に、推定すべき幅であるペイロード長に接続部の幅を加えた大きさで切り出す(ステップS1102)。そして、推定結果を欠落部分と入れ替える(ステップS1103)。さらに次の部分も欠落しているかどうかを調べ(ステップS1104)、そうであるならば履歴バッファに「1」以下の値を掛け(ステップS1105)、再度ステップS1102からの処理を繰り返す。欠落が続かないのであれば、ステップS1106で非欠落部分とクロスフェード接続して推定処理を完了する。
図11は、上記推定処理の手順を示すフローチャートである。まず、履歴バッファから直前の有効なデータの最終の値に近い値の音声サンプルを検索する(ステップS1101)。次に、推定すべき幅であるペイロード長に接続部の幅を加えた大きさで切り出す(ステップS1102)。そして、推定結果を欠落部分と入れ替える(ステップS1103)。さらに次の部分も欠落しているかどうかを調べ(ステップS1104)、そうであるならば履歴バッファに「1」以下の値を掛け(ステップS1105)、再度ステップS1102からの処理を繰り返す。欠落が続かないのであれば、ステップS1106で非欠落部分とクロスフェード接続して推定処理を完了する。
このように、本実施の形態に係る音声伝送システムによれば、音声送信装置100では、送信するデータの処理単位であるペイロードをパケット構成する前に各パケットに分散して構成し、さらにそれらのパケットから欠落補正訂正データを作成し、欠落補正パケットとして付加する。その構成として、1パケットを構成するペイロードの個数N(2以上の整数)、最大バースト欠落耐性値P(2以上の整数)及びデータ補正ブロックに対応するパケットの個数Q(2以上の整数)からP・Q個のパケットになるのであるが、このとき元のデータがそれぞれのパケットに分散させるように並べ替える。さらに、欠落補正パケットとしてP個のパケットを構成し、これはパケットでQ個分のうち1個の欠落を訂正できるパケットである。また、ここで構成されたパケットが伝送路上で失われたことが検出できるように、これらのパケットに通し番号を付加する。
一方、音声受信装置200では、受信したパケットを音声データと欠落補正データに区別し、音声データのパケットの通し番号を確認し、欠落を検出できた場合には欠落補正データを使用して欠落部を補正し、欠落補正データをもってしても欠落部をすべて補正できなかった音声データについては、残った欠落部の位置を欠落情報として保持し、正常な音声データ、欠落補正した音声データ、欠落補正が不能な音声データを元のデータ順に並べ替え、復号化した後に欠落音声推定にて欠落部を補正し、さらに、この補正に際して推定データと非欠落データの結合部をクロスフェードにて不連続にならないように処理する。
このような構成を採ることで、パケットの欠落を補正する欠落補正パケットとして、訂正能力の限界を超えて音声データの欠落が発生した場合でも、音声受信装置200側で、欠落音声推定にて欠落部を補正するので、実効的な欠落耐性の向上が図れ、音声品質低下を抑えることができる。
なお、上記実施の形態の音声送信装置100におけるデータ入れ替え処理、連番付加処理、欠落補正データ生成処理は、専用のハードウェアで構成しても良いし、CPUを用いてソフトウェア的に行うようにしても良い。因みに、図12は、データ入れ替え処理、連番付加処理及び欠落補正データ生成処理をCPU110で行うようにした場合の構成例である。CPU110は、プログラムメモリ111に記憶されたプログラムに従い、作業用メモリ112を使用しながら上記各処理を行う。なお、パケット化処理はネットワークI/F(インタフェース)部113で行われる。
また、上記実施の形態の音声受信装置200における欠落補正処理と逆並べ替え処理は、専用のハードウェアで構成しても良いし、CPUを用いてソフトウェア的に行うようにしても良い。因みに、図13は、欠落補正処理と逆並べ替え処理をCPU211で行うようにした場合の構成例である。この図において、ネットワークI/F部210は、ネットワーク11からパケットを受け取り、その種類を識別する。CPU211は、プログラムメモリ212に書き込まれている制御プログラムに従い、ネットワークI/F部210からパケット及びパケットの種類を取り込み、それらを作業用メモリ213に展開して欠落補正を行い、その結果をCPU214に渡す。
CPU214は、プログラムメモリ215に書き込まれている制御プログラムに従い、CPU211から受け取ったデータをコーデック部216で復号化させ、作業用メモリ217に展開して推定補正を行った上で、D/A処理部218に渡してアナログ変換させる。D/A変換部218からのアナログ音声信号がスピーカ等の音声出力装置12に入力される。
また、上記実施の形態では、全ての機能が有効な場合であるが、使用するネットワークの品質によっては、欠落補正データと、並べ替えとを選択的に使用しないという形態をとることもできる。例えば、図14は、欠落補正を行わない音声伝送システムの構成を示すブロック図である。なお、この図において、前述した図1と共通する部分には同一の符号を付けている。この図に示すように、欠落補正を行わない分、ネットワーク上の要求帯域が減少し、最低限のコストでネットワークを確保することもでき、ネットワークの有効利用が可能となる。また、ネットワークの品質が低い場合であっても、パケットロス発生で副次的な被害を防ぐこともできる。そしてさらに、欠落補正を行わないことから、欠落補正データ発生部105と、欠落補正部203がそれぞれ不要になり、その分、コストダウンが図れる。
また、図15は、並べ替え処理を行わない音声伝送システムの構成を示すブロック図である。なお、この図において、前述した図1と共通する部分には同一の符号を付けている。この図に示すように、並べ替え処理を行わない分、並べ替え処理のための並べ替え処理部103及びメモリ104と、並べ替えを復元するための並べ替え復元部204及びメモリ205がそれぞれ不要になり、その分、コストダウンが図れる。
本発明は、伝送経路でパケットロスが発生しても音声品質低下を抑えることができるといった効果を有し、パケットスイッチングネットワークを使用した音声伝送を行う用途に適用可能である。
10 音声入力装置
11 ネットワーク
12 音声出力装置
100、100A、100B 音声送信装置
101 A/D処理部
102 コーデック部
103 並べ替え処理部
104 メモリ
105 欠落補正データ発生部
106 パケット構成部
200、200A、200B 音声受信装置
201 パケット受信部
202 欠落検出部
203 欠落補正部
204 並べ替え復元部
205 メモリ
206 コーデック部
207 推定補正部
208 D/A処理部
11 ネットワーク
12 音声出力装置
100、100A、100B 音声送信装置
101 A/D処理部
102 コーデック部
103 並べ替え処理部
104 メモリ
105 欠落補正データ発生部
106 パケット構成部
200、200A、200B 音声受信装置
201 パケット受信部
202 欠落検出部
203 欠落補正部
204 並べ替え復元部
205 メモリ
206 コーデック部
207 推定補正部
208 D/A処理部
Claims (7)
- デジタル化された音声データを所定の音声ファイル形式で符号化し、符号化したサンプル値を所定数まとめてペイロードを生成し、このペイロードを1単位とするデータ列を出力する音声符号化手段と、
1パケットを構成するペイロードの個数N(2以上の整数)、最大バースト欠落耐性値P(2以上の整数)及びデータ補正ブロックに対応するパケットの個数Q(2以上の整数)からP・Q個のパケットを構成する過程において各パケットにペイロードを分散させる並べ替えを行う並べ替え手段と、
前記並べ替え手段にてデータの並べ替えが行われたP・Q個のパケットからP個の欠落訂正パケットを生成する欠落パケット生成手段と、
前記データの並べ替えが行われたP・Q個のパケットに通し番号を付加してネットワークに伝送するためのパケットを構成するパケット構成手段と、
を備えた音声送信装置。 - 前記並べ替え手段は、
1番目のパケットを1,Q・P+1,2・Q・P+1,…,(N−1)・Q・P+1番目のデータ、
2番目のパケットを2,Q・P+2,2・Q・P+2,…,(N−1)・Q・P+2番目のデータ、
P番目のパケットをP,Q・P+P,2・Q・P+P,…,(N−1)・Q・P+P番目のデータ、
Q・P番目のパケットをQ・P,2・Q・P,3・Q・P,…,N・Q・P番目のデータ
とするデータ構造を持ち、
前記欠落パケット生成手段は、
誤り訂正1番目の欠落補正パケットに1番目のデータとして、1,P+1,2・P+1,…,(Q−1)・P+1番目のデータのパリティ、
誤り訂正1番目の欠落補正パケットに2番目のデータとして、Q・P+1,Q・P+P+1,…,(2・Q−1)・P+1番目のデータのパリティ、
・・・
誤り訂正2番目の欠落補正パケットに1番目のデータとして、2,P+2,2・P+2,…,(Q−1)・P+2番目のデータのパリティ、
誤り訂正2番目の欠落補正パケットに2番目のデータとして、Q・P+2,Q・P+P+2,…,(2・Q−1)・P+2番目のデータのパリティ
・・・
というデータ構造を持つ請求項1に記載の音声送信装置。 - ネットワーク上のパケットを受信し音声データと欠落補正データを区別して受信するパケット受信手段と、
前記パケット受信手段で受信された音声データのパケットの通し番号を使用して、欠落部を検出する欠落検出手段と、
前記欠落部の欠落位置と前記欠落補正データとを用いて欠落補正を行う欠落補正手段と、
前記欠落補正された音声データのパケットを含む前記パケット受信手段で受信された音声データの各パケットを構成データの並べ替えを元の状態に復元する並べ替え復元手段と、
元の並び順に復元された音声データをサンプル値に戻す音声復号化手段と、
前記欠落補正手段による欠落補正が行われなかった欠落部を推定する推定補正手段と、
を備えた音声受信装置。 - 前記推定補正手段は、
過去のサンプルデータを記憶する記憶手段と、
最終サンプル値に近いサンプル値を検索する検索手段と、
過去のサンプルデータの一部を音声データと置き換えるデータ置き換え手段と、
連続欠落を検出して1以下の値を掛ける乗算手段と、
推定データの一部と実データの一部を連続的に接続する接続手段と、
を備えた請求項3に記載の音声受信装置。 - 請求項1又は請求項2に記載の音声送信装置と、請求項3又は請求項4に記載の音声受信装置と、を備えた音声伝送システム。
- 送信するデータの処理単位であるペイロードをパケット構成する前に、1パケットを構成するペイロードの個数N(2以上の整数)、最大バースト欠落耐性値P(2以上の整数)及びデータ補正ブロックに対応するパケットの個数Q(2以上の整数)からP・Q個のパケット構成過程において各パケットにペイロードを分散させる並べ替えを行う並べ替えステップと、
前記並べ替えステップにより得られたP・Q個のパケットから欠落補正データを作成して欠落補正パケットとして付加してパケットを構成するパケット構成ステップと、
構成した各パケットが伝送路上で失われたことを検出できるようにこれらのパケットに通し番号を付加する通し番号付加ステップと、
を備えた音声送信方法。 - 受信したパケットを音声データと欠落補正データに区別し、音声データのパケットの通し番号を確認する確認ステップと、
欠落を検出できた場合には前記欠落補正データを使用して欠落部を補正し、前記補正データをもってしても欠落部をすべて補正できなかった音声データについては、残った欠落部の位置を欠落情報として保持し、正常な音声データ、欠落補正した音声データ、欠落補正が不能な音声データを元のデータ順に並べ替え、復号化した後に欠落音声推定にて欠落部を補正する補正ステップと、
この補正に際して推定データと非欠落データの結合部をクロスフェードにて不連続にならないように処理する処理ステップと、
を備えた音声受信方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004039372A JP2005233993A (ja) | 2004-02-17 | 2004-02-17 | 音声伝送システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004039372A JP2005233993A (ja) | 2004-02-17 | 2004-02-17 | 音声伝送システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005233993A true JP2005233993A (ja) | 2005-09-02 |
Family
ID=35017047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004039372A Pending JP2005233993A (ja) | 2004-02-17 | 2004-02-17 | 音声伝送システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005233993A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008111158A1 (ja) * | 2007-03-12 | 2008-09-18 | Fujitsu Limited | 音声波形補間装置および方法 |
JP2009267832A (ja) * | 2008-04-25 | 2009-11-12 | Sanyo Electric Co Ltd | 音声信号処理装置 |
JP2010521911A (ja) * | 2007-03-20 | 2010-06-24 | フラウンホファー・ゲゼルシャフト・ツール・フォルデルング・デル・アンゲバンテン・フォルシュング・アインゲトラーゲネル・フェライン | データパケットのシーケンスを伝送するための装置および方法ならびにデータパケットのシーケンスをデコードするためのデコーダおよび装置 |
US8649277B2 (en) | 2006-06-29 | 2014-02-11 | Nec Corporation | Communication apparatus and method |
JP2016065897A (ja) * | 2014-09-22 | 2016-04-28 | カシオ計算機株式会社 | 楽音制御装置、楽音制御方法及びプログラム |
-
2004
- 2004-02-17 JP JP2004039372A patent/JP2005233993A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8649277B2 (en) | 2006-06-29 | 2014-02-11 | Nec Corporation | Communication apparatus and method |
WO2008111158A1 (ja) * | 2007-03-12 | 2008-09-18 | Fujitsu Limited | 音声波形補間装置および方法 |
JPWO2008111158A1 (ja) * | 2007-03-12 | 2010-06-24 | 富士通株式会社 | 音声波形補間装置および方法 |
JP5233986B2 (ja) * | 2007-03-12 | 2013-07-10 | 富士通株式会社 | 音声波形補間装置および方法 |
JP2010521911A (ja) * | 2007-03-20 | 2010-06-24 | フラウンホファー・ゲゼルシャフト・ツール・フォルデルング・デル・アンゲバンテン・フォルシュング・アインゲトラーゲネル・フェライン | データパケットのシーケンスを伝送するための装置および方法ならびにデータパケットのシーケンスをデコードするためのデコーダおよび装置 |
JP2009267832A (ja) * | 2008-04-25 | 2009-11-12 | Sanyo Electric Co Ltd | 音声信号処理装置 |
JP2016065897A (ja) * | 2014-09-22 | 2016-04-28 | カシオ計算機株式会社 | 楽音制御装置、楽音制御方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008261904A (ja) | 符号化装置、復号化装置、符号化方法および復号化方法 | |
KR101009561B1 (ko) | 패킷 손실 은폐를 위한 피치 예측 | |
WO2013154027A1 (ja) | 復号装置および方法、オーディオ信号処理装置および方法、並びにプログラム | |
CN104934035B (zh) | 语音频码流的解码方法及装置 | |
EP1226691B1 (en) | Lost packet recovery in voice over internet protocol based on time domain interpolation | |
JP4022427B2 (ja) | エラー隠蔽方法、エラー隠蔽プログラム、送信装置、受信装置及びエラー隠蔽装置 | |
JP2005233993A (ja) | 音声伝送システム | |
JP2002221994A (ja) | 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体 | |
US20080294428A1 (en) | Packet loss concealment | |
JP4572755B2 (ja) | 復号化装置,復号化方法及びデジタル音声通信システム | |
JP4536621B2 (ja) | 復号装置、および復号方法 | |
JP4678440B2 (ja) | 音声データ復号装置 | |
WO2001054116A1 (en) | System for lost packet recovery in voice over internet protocol based on time domain interpolation | |
JP3583550B2 (ja) | 補間装置 | |
JP2006279809A (ja) | 音声再生装置および音声再生方法 | |
JP4093174B2 (ja) | 受信装置および方法 | |
KR20070091512A (ko) | 복호화된 오디오 신호의 오류 은폐 방법 및 장치 | |
JP4486387B2 (ja) | エラー補償装置およびエラー補償方法 | |
JPH10282995A (ja) | 欠落音声補間符号化方法、欠落音声補間符号化装置、及び記録媒体 | |
JP2001339368A (ja) | 誤り補償回路及び誤り補償機能を備えた復号装置 | |
JP2007271916A (ja) | 音声データ圧縮装置および伸張装置 | |
JP2007300160A (ja) | デジタル信号切換え装置及びその切換え方法 | |
JP5056048B2 (ja) | 音声データ復号装置 | |
JP5046661B2 (ja) | オーディオ装置 | |
JP2005184231A (ja) | 音声通信端末 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060327 |