JP4758687B2 - 音声パケット送信方法、音声パケット受信方法、それらの方法を用いた装置、プログラム、および記録媒体 - Google Patents
音声パケット送信方法、音声パケット受信方法、それらの方法を用いた装置、プログラム、および記録媒体 Download PDFInfo
- Publication number
- JP4758687B2 JP4758687B2 JP2005177481A JP2005177481A JP4758687B2 JP 4758687 B2 JP4758687 B2 JP 4758687B2 JP 2005177481 A JP2005177481 A JP 2005177481A JP 2005177481 A JP2005177481 A JP 2005177481A JP 4758687 B2 JP4758687 B2 JP 4758687B2
- Authority
- JP
- Japan
- Prior art keywords
- code
- bit
- speech
- value
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Description
大室仲,他"音声特徴量並行送信によるバーストパケットロス耐性の向上", 信学技報(電子情報通信学会), SP2004-77, pp.35-40, 2004.
受信装置では、受信したG.711音声符号を、G.711規格にしたがって復号するとともに、あらかじめ定めた並行送信データのビットが格納されるサンプル点から、並行送信データの情報を抽出し、並行送信データを復号する。
[第1実施形態]
図5は、本発明の音声信号送信装置10の機能構成例である。また、図6に音声信号送信装置10の処理フローを示す。入力音声は、入カバッファ81に蓄えられ(S11)、音声信号をフレームと呼ばれる一定の時間ごとに区切って音声符号化部11と音声特徴量計算部85に送る(S12)。1フレームの時間長は一般には、10ミリ秒から20ミリ秒程度とすることが多い。音声特徴量計算部85では、入力バッファ81に蓄えられた音声信号を用いて、当該フレームの音声特徴量を計算する(S13)。音声特徴量とは、ピッチ周期(音声の基本周波数に相当)、パワなどを指し、これらの特徴量のいずれかのみを利用することもあるし、全部を利用することもある。ピッチ周期は、音声波形または音声波形にスペクトル包絡の逆特性を持つフィルタをかけた信号の自己相関係数を計算することによって得られる。パワは、フレーム内の全サンプルの二乗和により得られる。
音声符号化部11では、フレーム化された音声と音声特徴量符号から、G.711方式とデコーダ互換の符号を生成し、パケット構成部12に送る(S16)。パケット構成部12では、音声特徴量符号の含まれた音声符号からパケットを構成する(S17)。パケット送出部84は、パケット構成部12で作成されたパケットの情報を受け取り、パケット通信網に送出する(S18)。
G.711全コード探索部24、G.711偶数コード探索部25、G.711奇数コード探索部26から出力された1サンプル分のG.711符号は、音声符号バッファ27において1フレーム分蓄えられたのち、1フレーム分の音声符号として出力される(S27)。
[第2実施形態]
図9のようなG.711符号のLSBに別のビット情報を埋め込む方法は、160サンプル点の一部のサンプル点であれば、音質劣化が目立たずに情報を確実に埋め込むことができるが、ときに問題点が存在する。問題が生じる例として、図7のフレーム化入力音声に、静かな部屋で録音された音声を入力した場合がある。ITU−T G.711方式のうち日本や米国で主に使われるμ則の場合、G.711符号のコード255(16進数表現でFF)は量子化値0を表し、コード254(16進数表現でFE)は量子化値8を表す。これに前述の偶数コード探索、奇数コード探索の手法を適用してみる。無音区間のLSBに1を埋め込み、奇数コードのみを探索した場合には、G.711符号を復号したときの音声信号のサンプル値(量子化値)が0となる。しかし、LSBに0を埋め込み、偶数コードのみを探索した場合には、G.711符号を復号したときの音声信号のサンプル値(量子化値)は8となる。つまり、無音区間のLSBに0を埋め込まれた場合に、復号値が8となるので、プーンというノイズが耳につきやすい。ただし、無音区間でなければ、聴覚特性上、ノイズは目立たない。この問題を回避するためには、振幅の小さい音声区間、例えば、振幅値が±4以内のサンプル点では、埋め込まれる値が0の場合でも1の場合でも、再生音声は0のサンプル値であることが望ましい。そこで、μ則のG.711符号のコードと量子化値の対応関係を調べてみると、コード255は量子化値+0(正の値としてのゼロ)、コード127が量子化値−0(負の値としてのゼロ)を表す構造となっている。再生すればどちらも0のサンプル値を表す0に対して、二重のコードが割り当てられていることになる。この冗長性を利用して、例えば入カサンプル値が±4以内のサンプル点では、LSBに1、0の値を埋め込むのではなく、例えば埋め込む値が1のときはコード255、埋め込む値が0のときはコード127(もしくは、逆の対応関係)を使うことにすれば、無音区間でプーンという耳障りなノイズが発生することなく、受信側で埋め込まれたビットの1、0を判定することが可能である。言い換えれば、入カサンプル値が±4以内のサンプル点では、LSBに情報ビットを埋め込むのではなく、MSBに情報ビットを埋め込むことに等しい。
[第3実施形態]
図12は、本発明を適用した受信装置40の機能構成例である。図13に、本発明の受信装置40の処理フローを示す。パケット受信部41は、ネットワークから音声パケットを受信し、受信バッファ42に音声パケットに含まれる音声符号を蓄積するとともに、チェックサム検出部52にも音声符号を送る(S41)。受信バッファ42はゆらぎ吸収バッファとも呼ばれる。受信した音声符号は、第1実施形態で示したように、音声特徴量符号が組み込まれていても、G.711符号と完全な互換性を有している。
チェックサム検出部52では、音声符号に音声特徴量符号およびチェックサムビットが組み込まれているものとして、音声特徴量符号およびチェックサムビットを抽出する(S52−1)。たとえば、図12が図10の構成に対応する音声信号受信部であるとすると、次のように処理される。音声特徴量符号またはチェックサムビットが組み込まれているサンプル点(どのサンプル点に組み込まれているかは、事前に決められているものとする)のコードが255あるいは127であるかを判定する(S52−2)。255または127の場合は、図10の送信部の定義にしたがって1または0のビットの判定を行う(S52−3)。コードが255または127でない場合は、LSBのビットが1か0かによって、組み込まれているビットの1または0を判定する(S52−4)。音声特徴量符号の全ビットとチェックサムビットが抽出できたら、音声特徴量符号のチェックサムを計算しなおし、抽出したチェックサムビットと一致するかどうかを判断する(S52−5)。チェックサムが一致しない場合には、音声特徴量符号は組み込まれていなかったと判断する。本実施形態では、通信路の途中でビット誤りは発生していないものとしている。チェックサムが一致すれば、この音声符号には、音声特徴量符号が正しく組み込まれていた可能性が高い。ここで、「可能性が高い」とは、100%の確実性ではないことを示す。すなわち、音声特徴量符号が音声符号に組み込まれている場合には、チェックサムは一致することは送信時の定義により確実であるが、チェックサムが一致した場合でも、それが音声特徴量符号とチェックサムビットが音声符号に組み込まれた結果であるのか、符号化された音声符号が、たまたまチェックサムビットの一致条件に合致したにすぎないのかの判断ができないためである。そこで、チェックサム検出部52では、あらかじめ決められた連続する複数のフレームにわたってチェックサムが一致するかどうかの判定を行う(S52−6)。1フレームでもチェックサムが一致しない場合には、一連の受信した音声符号には音声特徴量符号が組み込まれていないと判断する。判定を行ったすべてのフレームでチェックサムが一致すれば、一連の受信した音声符号には音声特徴量符号が組み込まれていると判断する。なお、あらかじめ決められた連続する複数のフレーム全部のチェックサムの判定が終了するまでは、受信した音声符号には音声特徴量符号が組み込まれていたかどうかの確実な判断ができない。したがって、フェールセーフの観点から、判定開始初期段階では、音声特徴量符号は組み込まれていなかったものとして処理しておく。チェックサム検出部52の判定結果によって、SW49が制御され、一連の受信した音声符号に音声特徴量符号が組み込まれている場合には、SW49は音声特徴量復号部48側にセットされ(S49−1)、組み込まれていない場合には、SW49は音声特徴量なし側にセットされる(S49−2)。
パケットロスが発生した場合のパケットロスコンシールメントの手法は、本発明の特徴である音声特徴量がG.711互換の音声符号に組み込まれていることを除いて非特許文献1と同様である。なお、非特許文献1では、音声特徴量は、パケットヘッダに組み込むか、データ領域に格納する。たとえば、フレームnにおいて、パケットロスが発生したとする。パケットロスが発生した場合は、受信バッファ探索部46は、受信バッファ42に蓄積された音声符号を探索し、フレームn+1以降で受信されている音声符号のうち、フレームnに時間の近い(タイムスタンプが直近の)音声符号を探索する(S46−1)。探索の結果、フレームn+iの音声符号が得られたとする。例えば、フレームn+1がロスしていないときはi=1、フレームn+1、フレームn+2とも連続してロスしてフレームn+3がロスでない場合はi=3となる。フレームn+iの音声符号は、先読み音声波形復号部47でフレームn+iの音声波形に復号され、パケットロスコンシールメント部44に送られる(S47)。
[第4実施形態]
第1実施形態から第3実施形態は、パケットロスコンシールメントに本発明を適用した例であったが、G.711の音声符号のLSBまたはMSBに組み込まれる符号情報は、他の用途の符号であってもよい。図17に本発明を帯域分割符号化の送信装置60に適用した例を、図18に本発明を帯域分割符号化の受信装置70に適用した例を示す。また、図19に送信側の処理フローを、図20に受信側の処理フローを示す。
なお、本発明は、コンピュータ本体とコンピュータプログラムとして実行することが可能であるし、デジタルシグナルプロセッサや専用LSIに実装して実現することも可能である。
[実験例]
上記のように、G.711の符号化アルゴリズムとして符号のLSBまたはMSBに別の符号を埋め込む方法ならば、音質の劣化を抑えつつ、従来のG.711の符号と完全な互換性を保証することができる。したがって、既存のすべてのシステムやネットワークに、本発明を適用した端末をつないで使用することができる。しかし、あまり多くの情報を埋め込みすぎると、G.711で符号化された音声自体の品質が劣化し、耳障りなノイズが発生してしまう。そこで、G.711符号化の1フレームを160サンプル(20ミリ秒)として、160サンプルあたりに何ビット埋め込むと、人間が聴いたときの品質がどれくらい劣化するかの主観評価試験を実施した。図21はその結果を示したものである。並行して送信したい情報の符号としてそれぞれ0、8、16、32、48ビットと、チェックサムビットとして1ビットを埋め込んだ音声を作成した。図21は、ヘッドフォン受聴により、1(非常に悪い)〜5(非常に良い)の5段階評価を行った結果である。この結果、音声特徴量8ビット(チェックサムビットを加えると9ビット)までは、全く劣化が検知されていない。また、音声特徴量16ビット(チェックサムビットを加えると17ビット)でも、ほとんど劣化が検知されていないことがわかる。32ビットになると劣化が検知され始め、48ビットでは0.25ポイント評価値が低下した。「0.25ポイント評価値が低下」とは、平均して4人に1人は1段階評価値を下げたことを意味する。したがって、160サンプルあたりに埋め込むビットは、16ビットまでであれば品質劣化の影響がなく、32ビットまでであれば平均して10人に1人が1段階評価値を下げる程度であり、実用上の影響ないと判断できる。
Claims (9)
- 音声および音楽を含む音の信号である音声信号を、音声パケットとして送信する音声パケット送信方法であって、
入力バッファが、音声信号をフレームと呼ばれる一定時間ごとに区切って出力するステップと、
ビット列解析部が、前記フレームごとに、音声信号の情報とともに送信したいデータ(以下、「並行送信データ」という。)をビット列に分解するビット列分解ステップと、
偶数コード探索部が、前記フレーム内の各サンプル点のうち、あらかじめ定めた前記ビット列の各ビットに対応するサンプル点では、当該ビットの値が0ならば、G.711の偶数符号に対応する128コードから、入力された音声サンプル値に量子化値の近いコードを探索し、探索結果に従ってLSBが当該ビットの値を表すG.711の音声符号を出力する偶数コード探索ステップと、
奇数コード探索部が、前記各ビットに対応するサンプル点において、当該ビットの値が1ならば、G.711の奇数符号に対応する128コードから、入力された音声サンプル値に量子化値の近いコードを探索し、探索結果に従ってLSBが当該ビットの値を表すG.711の音声符号を出力する奇数コード探索ステップと、
全コード探索部が、前記各ビットに対応するサンプル点以外では、G.711の全256コードから、入力された音声サンプル値に量子化値の近いコードを探索し、探索結果に従ってG.711の音声符号を出力する全コード探索ステップと、
を有する音声パケット送信方法。 - 請求項1記載の音声パケット送信方法であって、
前記各ビットに対応するサンプル点での入力音声の値が、あらかじめ定めた0に近い範囲内の場合であって、当該ビットの値が1ならば、コード255出力部が、G.711のコード255番を探索結果として出力するコード255出力ステップと、
前記各ビットに対応するサンプル点での入力音声の値が、あらかじめ定めた0に近い範囲内の場合であって、当該ビットの値が0ならば、コード127出力部が、G.711のコード127番を探索結果として出力するコード127出力ステップと、をさらに備える、
ことを特徴とする音声パケット送信方法。 - 請求項1または2記載の音声パケット送信方法であって、
前記並行送信データのビット列には、当該並行送信データから計算されるチェックサムビットが含まれる、
ことを特徴とする音声パケット送信方法。 - 音声および音楽を含む音の信号である音声信号を、音声パケットとして受信する音声パケット受信方法であって、
音声波形復号部が、受信したG.711音声符号を、G.711規格にしたがって復号する音声符号復号ステップと、
並行送信データ復号部が、並行送信データのビットが組み込まれているあらかじめ定められたサンプル点のコードがG.711のコード127番または255番であるかを判定し、G.711のコード127番または255番の場合には対応する送信部の定義に従って並行送信データのビットが0か1かを求め、G.711のコード127番または255番でない場合にはそのサンプル点のLSBから並行送信データのビットが0か1かを抽出し、並行送信データを復号する並行送信データ復号ステップと
を有する音声パケット受信方法。 - 請求項4記載の音声パケット受信方法であって、
チェックサム検出部が、チェックサムビットの値が、並行送信データのビット列から計算したチェックサムと一致するかを確認する第1のチェックサム確認ステップと、
前記チェックサム検出部が、前記第1のチェックサム確認ステップでの確認結果が正しいことを、あらかじめ定めた連続するフレーム数確認する第2のチェックサム確認ステップと、
前記第1のチェックサム確認ステップまたは前記第2のチェックサム確認ステップのいずれかの確認結果が正しくなかった場合には、前記並行送信データ復号部が、並行送信データを復号しないことを特徴とする前記並行送信データ復号ステップと
を有する音声パケット受信方法。 - 音声および音楽を含む音の信号である音声信号を、音声パケットとして送信する音声パケット送信装置であって、
音声信号をフレームと呼ばれる一定時間ごとに区切って出力する入力バッファと、
前記フレームごとに、音声信号の情報とともに送信したいデータ(以下、「並行送信データ」という。)をビット列に分解するビット列解析部と、
前記フレームの各サンプル点のうち、あらかじめ定めた前記ビット列の各ビットに対応するサンプル点では、当該ビットの値が0ならば、G.711の偶数符号に対応する128コードから、入力された音声サンプル値に量子化値の近いコードを探索し、探索結果に従ってLSBが当該ビットの値を表すG.711の音声符号を出力する偶数コード探索部と、
前記各ビットに対応するサンプル点において、当該ビットの値が1ならば、G.711の奇数符号に対応する128コードから、入力された音声サンプル値に量子化値の近いコードを探索し、探索結果に従ってLSBが当該ビットの値を表すG.711の音声符号を出力する奇数コード探索部と、
前記各ビットに対応するサンプル点以外では、G.711の全256コードから、入力された音声サンプル値に量子化値の近いコードを探索し、探索結果に従ってG.711の音声符号を出力する全コード探索部と、
を備える音声パケット送信装置。 - 音声および音楽を含む音の信号である音声信号を、音声パケットとして受信する音声パケット受信装置であって、
受信したG.711音声符号を、G.711規格にしたがって復号する音声符号復号部と、
並行送信データのビットが組み込まれているあらかじめ定められたサンプル点のコードがG.711のコード127番または255番であるかを判定し、G.711のコード127番または255番の場合には対応する送信部の定義に従って並行送信データのビットが0か1かを求め、G.711のコード127番または255番でない場合にはそのサンプル点のLSBから並行送信データのビットが0か1かを抽出し、並行送信データを復号する並行送信データ復号部と
を有する音声パケット受信装置。 - 請求項1から5のいずれかに記載の方法の各ステップを、コンピュータにより実行するプログラム。
- 請求項8記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005177481A JP4758687B2 (ja) | 2005-06-17 | 2005-06-17 | 音声パケット送信方法、音声パケット受信方法、それらの方法を用いた装置、プログラム、および記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005177481A JP4758687B2 (ja) | 2005-06-17 | 2005-06-17 | 音声パケット送信方法、音声パケット受信方法、それらの方法を用いた装置、プログラム、および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006352616A JP2006352616A (ja) | 2006-12-28 |
JP4758687B2 true JP4758687B2 (ja) | 2011-08-31 |
Family
ID=37647959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005177481A Expired - Fee Related JP4758687B2 (ja) | 2005-06-17 | 2005-06-17 | 音声パケット送信方法、音声パケット受信方法、それらの方法を用いた装置、プログラム、および記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4758687B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008151408A1 (en) * | 2007-06-14 | 2008-12-18 | Voiceage Corporation | Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711 |
JP5455222B2 (ja) * | 2010-02-19 | 2014-03-26 | Kddi株式会社 | ディジタルオーディオ信号の音質劣化装置、音質回復装置、及び音質劣化・回復システム |
JP5615078B2 (ja) * | 2010-07-22 | 2014-10-29 | アルパイン株式会社 | データ伝送システム |
JP5447628B1 (ja) | 2012-09-28 | 2014-03-19 | パナソニック株式会社 | 無線通信装置及び通信端末 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2676046B2 (ja) * | 1989-01-30 | 1997-11-12 | 日本電信電話株式会社 | ディジタル音声伝送方式 |
JP4022427B2 (ja) * | 2002-04-19 | 2007-12-19 | 独立行政法人科学技術振興機構 | エラー隠蔽方法、エラー隠蔽プログラム、送信装置、受信装置及びエラー隠蔽装置 |
-
2005
- 2005-06-17 JP JP2005177481A patent/JP4758687B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006352616A (ja) | 2006-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4473869B2 (ja) | 音響信号のパケット通信方法、送信方法、受信方法、これらの装置およびプログラム | |
JP4518714B2 (ja) | 音声符号変換方法 | |
US8340973B2 (en) | Data embedding device and data extraction device | |
JP5268952B2 (ja) | データパケットのシーケンスを伝送するための装置および方法ならびにデータパケットのシーケンスをデコードするためのデコーダおよび装置 | |
US6725191B2 (en) | Method and apparatus for transmitting voice over internet | |
US7590532B2 (en) | Voice code conversion method and apparatus | |
CA2408890C (en) | System and methods for concealing errors in data transmission | |
US6871175B2 (en) | Voice encoding apparatus and method therefor | |
JP4758687B2 (ja) | 音声パケット送信方法、音声パケット受信方法、それらの方法を用いた装置、プログラム、および記録媒体 | |
JP2003241799A (ja) | 音響符号化方法、復号化方法、符号化装置、復号化装置及び符号化プログラム、復号化プログラム | |
JP5012897B2 (ja) | 音声パケット受信装置、音声パケット受信方法、およびプログラム | |
JP3566931B2 (ja) | 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体 | |
US20130085751A1 (en) | Voice communication system encoding and decoding voice and non-voice information | |
US6167374A (en) | Signal processing method and system utilizing logical speech boundaries | |
JP3722366B2 (ja) | パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム | |
Ding | Wideband audio over narrowband low-resolution media | |
KR100591544B1 (ko) | VoIP 시스템을 위한 프레임 손실 은닉 방법 및 장치 | |
KR20040050810A (ko) | 부가 음성 데이터를 이용한 패킷 손실 복구 방법 및 이를이용한 송수신기 | |
KR100542435B1 (ko) | 패킷 망에서의 프레임 손실 은닉 방법 및 장치 | |
JP4403103B2 (ja) | 音声信号パケット通信方法、多地点ミキシング方法、およびそれらを利用したシステム、装置 | |
JP2002252644A (ja) | 音声パケット通信装置及び音声パケット通信方法 | |
JP4985743B2 (ja) | 音声符号変換方法 | |
KR20050027272A (ko) | 스피치 프레임들의 에러 경감을 위한 스피치 통신 유닛 및방법 | |
US20030055515A1 (en) | Header for signal file temporal synchronization | |
JP2001296898A (ja) | ハミング距離を利用した音声符号化方式及び音声伝送システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090901 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091021 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101015 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110524 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110603 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4758687 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140610 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |