JP4376681B2 - 音声データ受信装置および音声データ送信装置 - Google Patents

音声データ受信装置および音声データ送信装置 Download PDF

Info

Publication number
JP4376681B2
JP4376681B2 JP2004114471A JP2004114471A JP4376681B2 JP 4376681 B2 JP4376681 B2 JP 4376681B2 JP 2004114471 A JP2004114471 A JP 2004114471A JP 2004114471 A JP2004114471 A JP 2004114471A JP 4376681 B2 JP4376681 B2 JP 4376681B2
Authority
JP
Japan
Prior art keywords
unit
value
section
packet
time length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004114471A
Other languages
English (en)
Other versions
JP2005303531A (ja
Inventor
渉 伏見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2004114471A priority Critical patent/JP4376681B2/ja
Publication of JP2005303531A publication Critical patent/JP2005303531A/ja
Application granted granted Critical
Publication of JP4376681B2 publication Critical patent/JP4376681B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Use Of Switch Circuits For Exchanges And Methods Of Control Of Multiplex Exchanges (AREA)
  • Telephonic Communication Services (AREA)

Description

この発明は、音声データ受信装置および音声データ送信装置に関するものである。
従来の、無音圧縮技術を適用した音声伝送装置においては、受信側機能に揺らぎ吸収バッファを備え、有音区間(トークスパート)の先頭パケットを受信すると、揺らぎ吸収バッファに規定量だけ受信データを蓄積してから復号処理を行い、音声信号を出力していた。
例えば、特許文献1に開示された従来の音声パケット送受信装置は、トークスパートの始まりの音声パケットを受信すると、閾値が設定されたゆらぎ吸収バッファに蓄積し、初期蓄積量だけ蓄積したら音声データを送出する。また、蓄積量が上述の閾値を超えて一定時間経過すると、バッファ制御部により初期蓄積量になるまでデータが廃棄される。情報記憶部は、データの廃棄回数とゆらぎ吸収バッファのアンダーフロー発生回数を記憶保持し、次の有音区間における初期蓄積量の決定に用いる。
特許第3075246号公報
従来の無音圧縮技術を適用した音声伝送装置では、トークスパートの先頭パケットをバッファ内の規定の位置に格納するため、前トークスパート先頭パケットの到着遅延揺らぎ量と現トークスパート先頭パケットの到着遅延揺らぎ量が異なる場合には、受信側でトークスパート間の無音区間の長さが増減する。すなわち、前トークスパートの先頭パケットの到着遅延が大きく、現トークスパートの到着遅延が小さい場合には、前トークスパートと現トークスパート間の無音時間がとても短くなり、また、前トークスパートの先頭パケットの到着遅延が小さく、現トークスパートの到着遅延が大きい場合には、前トークスパートと現トークスパート間の無音時間がとても長くなり、会話音声に不自然さが目立ち、通話音声品質を低下させるという問題点があった。
この発明は上記のような課題を解決するためになされたもので、受信側でトークスパートの間隔をできるだけ一定にすることにより、通話音声の品質を保つことを目的とする。
この発明に係る音声データ受信装置は、有音区間の音声信号のみがパケット化されたパケットデータを受信する音声データ受信装置において、パケットデータを受信するパケット受信部と、受信したパケットデータをヘッダ部分と音声データ部分に分離するヘッダ分離部と、音声データ部分を蓄積する揺らぎ吸収バッファ部と、揺らぎ吸収バッファ部に蓄積されている音声データ部分の残量を監視するバッファ残量監視部と、有音区間の最後のパケットデータのヘッダに含まれる情報と、次の有音区間の先頭パケットデータのヘッダに含まれる情報に基づいて、2つの有音区間に挟まれた無音区間の時間長を算出する無音区間計算部と、無音区間計算部によって算出された無音区間の時間長と、音声データの残量と、予め定められた無音区間時間長の最小値と、揺らぎ吸収バッファ部の格納初期値に基づいて、受信中の有音区間の先頭パケットデータに含まれる音声データを、揺らぎ吸収バッファ部に蓄積する時間を制御するバッファ制御部と、揺らぎ吸収バッファ部から出力された音声データを復号し、音声信号を出力する音声復号部を備え、バッファ制御部は、受信中の有音区間の先頭パケットデータに含まれる音声データを蓄積する時間を、音声データの残量と無音区間時間長の最小値の合計値Aが格納初期値を下回る場合において、無音区間計算部によって算出された無音区間の時間長と音声データの残量の合計値Bが合計値A未満であれば合計値Aに応じた時間長に、合計値A以上かつ格納初期値未満であれば合計値Bに応じた時間長に、格納初期値以上であれば格納初期値に応じた時間長に制御し、合計値Aが格納初期値を上回る場合においては、合計値Aに応じた時間長に制御するようにしたものである。
この発明によれば、バッファ制御部は、無音区間計算部から供給される無音区間の時間長と、バッファ残量監視部から供給される音声データの残量と、予め設定された無音区間時間長の最小値と、揺らぎ吸収バッファ部の格納初期値に基づいて、受信中の有音区間の先頭パケットデータに含まれる音声データを揺らぎ吸収バッファ部に蓄積する時間を決定するようにしたので、受信側での無音区間の時間長をできるだけ一定にすることにより、通話音声の品質を保つことができるという効果がある。
以下、この発明の実施の様々な形態を説明する。
実施の形態1.
図1は、この発明の実施の形態1による、音声伝送装置100が適用される音声伝送システム10の構成を示すブロック図である。図に示すように、音声伝送システム10は、音声伝送装置100、電話機400、通信ネットワーク500を含む。音声伝送装置100は通信ネットワーク500に接続されている。音声伝送装置100は送信処理部200と受信処理部300を備えている。通話者が電話機400を用いて発した音声は、音声伝送装置100を介して相手の電話機400に伝送される。
図2は、音声伝送装置100の送信処理部200の内部構成を示すブロック図である。図に示すように、送信処理部200は、音声符号化部201、有音判定部202、およびパケット送出部203を備えている。
図3は、音声伝送装置100の受信処理部300の内部構成を示すブロック図である。図に示すように、受信処理部300は、ヘッダ分離部301、トークスパート間隔計算部302、バッファ残量監視部303、バッファ制御部304、揺らぎ吸収バッファ部305、音声復号部306を備えている。
次に動作について説明する。
音声信号が送信処理部200に入力されると、音声符号化部201において音声信号に音声符号化処理が施され、符号化音声信号がパケット送出部203に出力される。それと共に、有音判定部202において、入力された音声信号が有音か無音かの判定がなされ、判定結果がパケット送出部203に出力される。
パケット送出部203は、有音判定部202から出力された判定結果に基づいて、音声符号化部201から供給された符号化音声信号の有音部分のみを音声パケットとして生成し、送信先の音声伝送装置100に送信する。
図4は、送信処理部200から送信されるパケットの例を示す図である。ここで、#1〜#7は送信される音声パケットのシーケンス番号である。図に示すように、最初の有音区間にてパケット#1からパケット#4が送信され、無音区間ではパケットは送信されない。次の有音区間でパケット#5からパケット#7が送信される。
各パケットのヘッダ部にはタイムスタンプ情報が含まれている。図中、各パケットのタイムスタンプはTSで示している。ここでは、1つのパケットの時間長をt、パケット#4のタイムスタンプ値をT、無音区間の時間長をtsとすると、例えば、パケット#3のタイムスタンプはT−tと表され、パケット#5のタイムスタンプ値はT+t+tsと表すことができる。
送信処理部200から送信された音声パケットが送信先音声伝送装置100の受信処理部300で受信されると、ヘッダ分離部301においてパケットのヘッダ部が分離され、ヘッダ部はトークスパート間隔計算部302に出力される。それと共に、音声信号部分は、揺らぎ吸収バッファ部305に出力される。
トークスパート間隔計算部302では、入力されたヘッダ部に含まれるタイムスタンプ情報に基づいて、トークスパート間隔(無音区間の時間長)を計算し、その結果をバッファ制御部304に出力する。図4に示した例を用いて説明すると、トークスパート間隔計算部302は、無音区間の後の先頭パケット#5のタイムスタンプ値から、無音区間の前の最後のパケット#4のタイムスタンプ値を差し引き、さらにパケット#4自身の時間長tを差し引くことにより、トークスパート間隔値を求めることができる。すなわち、(パケット#5のタイムスタンプ値)−(パケット#4のタイムスタンプ値)−(1つのパケット時間長)=(T+t+ts)−(T)−(t)=tsとなる。
バッファ残量監視部303は、揺らぎ吸収バッファ部305を監視し、バッファ内に残っている音声信号の残量をバッファ制御部304に出力する。
バッファ制御部304は、トークスパート間隔計算部302から供給されるトークスパート間隔と、バッファ残量監視部303から供給される音声信号の残量、および予め設定された最小トークスパート間隔値と、揺らぎ吸収バッファ部305の格納初期値に基づいて、トークスパートの先頭音声信号の揺らぎ吸収バッファ部305への格納位置を決定し、揺らぎ吸収バッファ部305に指示を通知する。また、バッファ制御部304は、トークスパートの先頭ではない音声信号については、シーケンス番号に沿って並ぶように格納位置を指示する。
揺らぎ吸収バッファ部305は、バッファ制御部304からの指示に基づき、ヘッダ分離部301から供給された音声信号を格納すると共に、格納されている音声信号を格納されている時間が長い順に一定の周期で音声復号部306に出力する。
音声復号部306は、入力された音声信号の復号処理を行い出力する。
音声信号が揺らぎ吸収バッファ部305内に留まる時間、すなわち、バッファ内に入力されてから出力されるまでにかかる時間は、揺らぎ吸収バッファ部305への格納位置により異なる。
ここで、バッファ制御部304の制御について詳しく説明する。図5、図6、および図7は、揺らぎ吸収バッファ部305を模式的に表した図である。図中、右側が揺らぎ吸収バッファ部305の出口方向であり、右側に格納されているデータほどバッファ内に留まる時間が短く、左側に行くほど留まる時間が長くなることを表している。
図5では、前回のトークスパート区間における音声データが残っていない状態の揺らぎ吸収バッファ部305を表している。
バッファ制御部304は、揺らぎ吸収バッファ部305の右端から最小トークスパート間隔を取った位置を最小トークスパート間隔位置(音声データの残量と無音区間時間長の最小値の合計値A)とする。すなわち、最小トークスパート間隔位置に格納されたデータは、最小トークスパート間隔だけバッファ内に留まる。また、同様にバッファの右端から初期格納量を取った位置を格納初期位置(格納初期値)とする。トークスパート間隔計算部302において、パケットヘッダに含まれるタイムスタンプ情報より導き出されたトークスパート間隔値が、最小トークスパート間隔に収まる場合、すなわち、図中、バッファの右端から計ってAの領域に位置する場合(無音区間の時間長と音声データの残量の合計値Bが合計値A未満)には、現トークスパートの先頭音声データを最小トークスパート間隔値の位置に合わせて格納する。また、Bの領域に位置する場合(合計値Bが合計値A以上かつ格納初期値未満)には、現トークスパートの先頭音声データを計算で求めたトークスパート間隔値の位置に合わせて格納する。また、Cの領域に位置する場合(合計値Bが格納初期値以上)には、現トークスパートの先頭音声データを格納初期値の位置に合わせて格納する。
また、図6では、前回のトークスパート区間における音声データが残っている状態の揺らぎ吸収バッファ部305を表している。この場合には、前回のトークスパートの音声データの末尾から最小トークスパート間隔を取った位置を最小トークスパート間隔位置(音声データの残量と無音区間時間長の最小値の合計値A)とし、バッファの右端から初期格納量を取った位置を格納初期位置(格納初期値)とする。なお、図6では、最小トークスパート間隔位置が格納初期位置よりも大きい場合(合計値Aが格納初期値を上回る場合)を示している。トークスパート間隔計算部302においてパケットヘッダに含まれるタイムスタンプ情報より導き出されたトークスパート間隔値が、前回のトークスパート区間における音声データの末尾から計ってAの領域に位置する場合Bの領域に位置する場合Cの領域に位置する場合、何れの場合でも現トークスパートの先頭音声データを最小トークスパート間隔位置に合わせて格納する。
また、図7に示す例は、前回のトークスパート区間における音声データが残っている状態の揺らぎ吸収バッファ部305であって、最小トークスパート間隔位置が格納初期位置よりも小さい場合を示している。図7の例においても図6の例と同様に、前回のトークスパートの音声データの末尾から最小トークスパート間隔を取った位置を最小トークスパート間隔位置(音声データの残量と無音区間時間長の最小値の合計値A)とし、バッファの右端から初期格納量を取った位置を格納初期位置(格納初期値)とする。トークスパート間隔計算部302においてパケットヘッダに含まれるタイムスタンプ情報より導き出されたトークスパート間隔値が、前回のトークスパート区間における音声データの末尾から計ってAの領域に位置する場合(無音区間の時間長と音声データの残量の合計値Bが合計値A未満)には、現トークスパートの先頭音声データを最小トークスパート間隔位置に合わせて格納し、Bの領域に位置する場合(合計値Bが合計値A以上かつ格納初期値未満)には、現トークスパートの先頭音声データを計算で求めたトークスパート間隔値の位置に合わせて格納し、Cの領域に位置する場合(合計値Bが格納初期値以上)には、現トークスパートの先頭音声データを格納初期位置に合わせて格納する。

以上のように、実施の形態1によれば、バッファ制御部304は、トークスパート間隔計算部302から供給されるトークスパート間隔値、バッファ残量監視部303から供給される前回トークスパートにおける音声信号のバッファ残量、予め設定された最小トークスパート間隔値、および揺らぎ吸収バッファ部305の格納初期値に基づいて、受信中のトークスパートの先頭データの揺らぎ吸収バッファ部305への格納位置を決定するようにしたので、無音圧縮技術を適用した音声パケット伝送において、トークスパートの間隔をできるだけ一定に保ち、通話音声品質を確保する事ができる。
また、実施の形態1によれば、トークスパート間隔計算部302は、入力されたパケットヘッダ部に含まれるタイムスタンプ情報に基づいて、トークスパート間隔を計算しているが、トークスパート間隔は他の方法によって計算することもできる。例えば、図8に示すように、送信処理部200から送信されるパケットを受信処理部300で受信する際、無音区間においても、1パケットの時間長に基づいてシーケンス番号をカウントアップすることにより、トークスパート間隔を求めることができる。
また、図9に示すように、トークスパートの先頭パケットに無音区間長情報を含ませるようにするようにしてもよい。
また、音声通信に限らずリアルタイム通信を行うシステムであれば、実施の形態1を適用することにより同様の効果を得ることができる。
実施の形態2.
実施の形態2は、音声伝送装置の受信処理部の構成が実施の形態1と異なる。
図10は、この発明の実施の形態2による音声伝送装置の受信処理部600の内部構成を示すブロック図である。図3と同一の符号は、同一もしくは相当する構成要素を表している。受信処理部600は、遅刻パケットカウント部307を備えている。
次に動作について説明する。
実施の形態1では、最小トークスパート間隔値および揺らぎ吸収バッファ部305の格納初期値は、予め設定された値を用いたが、実施の形態2では、これらの値を動的に制御する。
遅刻パケットカウント部307は、受信処理部600で受信はされたものの、揺らぎ吸収バッファ部305から出力されるべきタイミングから遅れてしまい、遅刻パケットとして廃棄されたパケットをカウントし、トークスパート毎に、受信できたパケットに対する遅刻パケットの割合を算出してバッファ制御部304に通知する。
バッファ制御部304は、遅刻パケットカウント部307から通知された遅刻パケットの割合に基づいて、最小トークスパート間隔値および揺らぎ吸収バッファ部305の格納初期値を決定する。例えば、遅刻パケットの割合がある閾値Aよりも大きい場合には、現在の最小トークスパート間隔値および格納初期値にそれぞれα、βを加えた値を用い、ある閾値Bよりも小さい場合には現在の最小トークスパート間隔値および格納初期値からそれぞれγ、δを差し引いた値を用いる。これを順次トークスパート毎に判定して値を更新する。なお、ここで閾値A、閾値B、変化量α、β、γ、δはそれぞれ予め設定された値であり、最小トークスパート間隔値および揺らぎ吸収バッファ部305の格納初期値には最大値と最小値を設定するようにしてもよい。
以上のように、実施の形態2によれば、遅刻パケットをカウントしてその結果をバッファ制御に用いる事により、トークスパートの間隔をできるだけ保ち、より通話音声品質を向上させる事ができる。
また、図11に示す受信処理部650のように、遅刻パケットカウント部307の代わりにオーバーフローパケットカウント部308を備えるようにしてもよい。
オーバーフローパケットカウント部308は、受信処理部650で受信したパケットのうち、オーバーフローパケットとして廃棄されてしまったパケットをカウントし、トークスパート毎に、受信したパケットに対するオーバーフローパケットの割合を算出してバッファ制御部304に通知する。バッファ制御部304は、通知されたオーバーフローパケットの割合に基づき、最小トークスパート間隔値および揺らぎ吸収バッファ部305の格納初期値を決定する。例えば、オーバーフローパケットの割合がある閾値Aよりも大きい場合には、現在の最小トークスパート間隔値および揺らぎ吸収バッファ部305の格納初期値にそれぞれα、βを加えた値を用い、ある閾値Bよりも小さい場合には現在の最小トークスパート間隔値および揺らぎ吸収バッファ格納初期値からそれぞれγ、δを差し引いた値を用いる。これを順次トークスパート毎に判定して値を更新する。閾値A、閾値B、変化量α、β、γ、δはそれぞれ予め設定された値であり、最小トークスパート間隔値および揺らぎ吸収バッファ部305の格納初期値には最大値と最小値を設定する事としても良い。
また、図12に示す受信処理部700のように、遅刻パケットカウント部307やオーバーフローパケットカウント部308の代わりに到着遅延揺らぎ計測部309を備えるようにしてもよい。
到着遅延揺らぎ計測部309は、トークスパート毎に、受信処理部700で受信したパケットの到着遅延揺らぎ量を計測し、バッファ制御部304に通知する。バッファ制御部304は、到着遅延揺らぎ計測部309から通知された到着遅延揺らぎ量に基づいて、最小トークスパート間隔値および揺らぎ吸収バッファ部305の格納初期値を決定する。
例えば、到着遅延揺らぎ量がある閾値Aよりも大きい場合には現在の最小トークスパート間隔値および揺らぎ吸収バッファ部305の格納初期値にそれぞれα、βを加えた値を用い、ある閾値Bよりも小さい場合には、現在の最小トークスパート間隔値および揺らぎ吸収バッファ部305の格納初期値からそれぞれγ、δを差し引いた値を用いる。これを順次トークスパート毎に判定して値を更新する。閾値A、閾値B、変化量α、β、γ、δはそれぞれ予め設定された値であり、最小トークスパート間隔値および揺らぎ吸収バッファ部305の格納初期値には最大値と最小値を設定するようにしても良い。
また、音声通信に限らずリアルタイム通信を行うシステムであれば、実施の形態2を適用することにより同様な効果を得ることができる。
また、バッファ残量監視部303で観測された、揺らぎ吸収バッファ部305内の前トークスパートの音声データ部分の残量に基づいて、最小トークスパート間隔値と、揺らぎ吸収バッファ部305の格納初期値を決定してもよい。
さらに、バッファ制御部304の制御により得られる実際のトークスパート間隔と、トークスパート間隔計算部302によって算出されたトークスパート間隔の差に基づいて、最小トークスパート間隔値と、揺らぎ吸収バッファ部305の格納初期値を決定してもよい。
実施の形態3.
図13は、この発明の実施の形態3による音声伝送装置の送信処理部250の内部構成を示すブロック図である。また、図14は、実施の形態3による音声伝送装置の受信処理部750の内部構成を示すブロック図である。図2および図3と同一の符号は、同一もしくは相当する構成要素を表している。
図に示すように、送信処理部250は、パケット送出部203とは機能が異なるパケット送出部204を備えている。
また、受信処理部750は、有音判定部310を備えている。
次に動作について説明する。
実施の形態1および実施の形態2では、音声データパケットの送信処理において無音圧縮技術を用い、伝送されるパケットは有音部分のパケットのみとしたが、実施の形態3では、図15に示すように、無音部分も含めて全ての音声データが伝送される。
音声信号が送信処理部250に入力されると、音声符号化部201において音声信号に音声符号化処理が施され、符号化音声信号がパケット送出部204に出力される。パケット送出部204は、音声符号化部201から供給された符号化音声信号を音声パケットとして生成し、送信先の音声伝送装置に送信する。
送信処理部250から送信された音声パケットが送信先音声伝送装置の受信処理部750で受信されると、ヘッダ分離部301においてヘッダ部が分離され、音声信号部分は、揺らぎ吸収バッファ部305に出力される。また、受信されたパケットは有音判定部310に供給され、有音か無音かの判定がなされると共に、その判定結果とヘッダ部の情報がトークスパート間隔計算部302に供給される。
トークスパート間隔計算部302では、有音判定部310から供給されたヘッダ部に含まれるタイムスタンプ情報に基づいて、トークスパート間隔を計算し、その結果をバッファ制御部304に出力する。図15に示したようにパケットが伝送される場合、トークスパート間隔計算部302は、無音区間後のトークスパートの先頭パケット#9のタイムスタンプ値から無音区間前のトークスパートの末尾のパケット#4のタイムスタンプ値を差し引き、さらにパケット#4自身の時間長tを差し引くことにより、トークスパート間隔値を求めることができる。すなわち、(パケット#9のタイムスタンプ値)−(パケット#4のタイムスタンプ値)−(1つのパケット時間長)=(T+5t)−(T)−(t)=4tとなる。
バッファ残量監視部303は、揺らぎ吸収バッファ部305を監視し、バッファ内に残っている音声信号の残量をバッファ制御部304に出力する。
バッファ制御部304は、トークスパート間隔計算部302から供給されるトークスパート間隔と、バッファ残量監視部303から供給される音声信号の残量、および予め設定された最小トークスパート間隔値と、揺らぎ吸収バッファ部305の格納初期値に基づいて、トークスパートの先頭音声信号の揺らぎ吸収バッファ部305への格納位置を決定し、揺らぎ吸収バッファ部305に指示を通知する。また、バッファ制御部304は、トークスパートの先頭ではない音声信号については、シーケンス番号に沿って並ぶように格納位置を指示する。
揺らぎ吸収バッファ部305は、バッファ制御部304からの指示に基づき、ヘッダ分離部301から供給された音声信号を格納すると共に、格納されている音声信号を格納されている時間が長い順に一定の周期で音声復号部306に出力する。音声復号部306は、入力された音声信号の復号処理を行い出力する。
実施の形態1で示したように、揺らぎ吸収バッファ部305への格納位置により、音声信号がバッファ内に留まる時間、すなわち、バッファ内に入力されてから出力されるまでにかかる時間が異なる。
バッファ制御部304の制御については、実施の形態1において、図5〜図7を用いて説明した処理と同様の処理を行うようにしてもよい。
以上のように、実施の形態3によれば、無音圧縮技術を利用していないシステムにおいても、トークスパート間隔値、バッファ残量、予め設定された最小トークスパート間隔値、揺らぎ吸収バッファ格納初期値に基づいて、トークスパートの先頭データの揺らぎ吸収バッファ部305への格納位置を決定することにより、トークスパートの間隔をできるだけ保ち、通話音声品質を確保する事ができる。
また、無音圧縮技術を適用していないシステムにおいても、無音圧縮技術を適用した場合のメリットである、トークスパート毎に到着遅延揺らぎ吸収バッファを初期値に設定することによって到着遅延揺らぎに対する耐性向上を享受できるという効果がある。
また、実施の形態3においても、実施の形態2の遅刻パケットカウント機能や、オーバーフローパケットカウント機能、および到着遅延揺らぎ計測機能を追加することにより、同様の効果を得ることができる。
また、音声通信に限らずリアルタイム通信を行うシステムであれば、実施の形態3を適用することにより同様な効果を得ることができる。
実施の形態4.
図16は、この発明の実施の形態4による音声伝送装置の送信処理部270の内部構成を示すブロック図である。また、図17は、実施の形態4による音声伝送装置の受信処理部800の内部構成を示すブロック図である。図2および図3と同一の符号は、同一もしくは相当する構成要素を表している。
図に示すように、送信処理部270は、パケット送出部203,204とは機能が異なるパケット送出部205を備えている。
また、受信処理部800は、トークスパート間隔計算部302とは機能が異なるトークスパート間隔計算部311を備えている。
次に動作について説明する。
実施の形態1および実施の形態2では、音声データパケットの送信処理において無音圧縮技術を用い、伝送されるパケットは有音部分のパケットのみとしたが、実施の形態4では、図18に示すように、無音部分も含めて全ての音声データが伝送される。
音声信号が送信処理部270に入力されると、音声符号化部201において音声信号に音声符号化処理が施され、符号化音声信号がパケット送出部205に出力される。それと共に、有音判定部202において、入力された音声信号が有音か無音かの判定がなされ、判定結果がパケット送出部205に出力される。
パケット送出部205は、有音判定部202から出力された判定結果に基づいて、音声符号化部201から供給された符号化音声信号をパケットとして生成すると共に、有音判定部202からの判定結果に基づいて、有音であるか否かを示す有音マーカーをヘッダ部に付加して、送信先の音声伝送装置に送信する。
送信処理部270から送信された音声パケットが送信先音声伝送装置の受信処理部800で受信されると、ヘッダ分離部301においてパケットのヘッダ部が分離され、ヘッダ部はトークスパート間隔計算部311およびヘッダ分離部301に出力される。それと共に、音声信号部分が揺らぎ吸収バッファ部305に出力される。
トークスパート間隔計算部311は、入力されたヘッダ部に含まれるタイムスタンプ情報および有音マーカー情報を用いてトークスパート間隔を計算し、その結果をバッファ制御部304に出力する。図18に示した例を用いて説明すると、トークスパート間隔計算部311は、有音マーカー情報が1から0に変わったことによりパケット#5を無音区間の先頭と判断し、有音マーカー情報が0から1に変わったことによりパケット#9をトークスパートの先頭と判断する。
トークスパート先頭のパケット#9のタイムスタンプ値から直前の無音区間の先頭パケット#5のタイムスタンプ値を差し引きくことにより、トークスパート間隔値を求めることができる。すなわち、(パケット#9のタイムスタンプ値)−(パケット#5のタイムスタンプ値)=(T+5t)−(T+t)=4tとなる。
バッファ残量監視部303は、揺らぎ吸収バッファ部305を監視し、バッファ内に残っている音声信号の残量をバッファ制御部304に出力する。
バッファ制御部304は、トークスパート間隔計算部311から供給されるトークスパート間隔と、バッファ残量監視部303から供給される音声信号の残量、および予め設定された最小トークスパート間隔値と、揺らぎ吸収バッファ部305の格納初期値に基づいて、トークスパートの先頭音声信号の揺らぎ吸収バッファ部305への格納位置を決定し、揺らぎ吸収バッファ部305に指示を通知する。また、バッファ制御部304は、トークスパートの先頭ではない音声信号については、シーケンス番号に沿って並ぶように格納位置を指示する。
揺らぎ吸収バッファ部305は、バッファ制御部304からの指示に基づき、ヘッダ分離部301から供給された音声信号を格納すると共に、格納されている音声信号を格納されている時間が長い順に一定の周期で音声復号部306に出力する。
音声復号部306は、入力された音声信号の復号処理を行い出力する。
実施の形態1で示したように、音声信号が揺らぎ吸収バッファ部305内に留まる時間、すなわち、バッファ内に入力されてから出力されるまでにかかる時間は、揺らぎ吸収バッファ部305への格納位置により異なる。
バッファ制御部304の制御については、実施の形態1において、図5〜図7を用いて説明した処理と同様の処理を行うようにしてもよい。
以上のように、実施の形態4によれば、無音圧縮技術を利用していないシステムにおいても、トークスパート間隔値、バッファ残量、予め設定された最小トークスパート間隔値、揺らぎ吸収バッファ格納初期値に基づいて、トークスパートの先頭データの揺らぎ吸収バッファ部305への格納位置を決定することにより、トークスパートの間隔をできるだけ保ち、通話音声品質を確保する事ができる。
また、無音圧縮技術を適用していないシステムにおいても、無音圧縮技術を適用した場合のメリットである、トークスパート毎に到着遅延揺らぎ吸収バッファを初期値に設定することによって到着遅延揺らぎに対する耐性向上を享受できるという効果がある。
また、実施の形態4においても、実施の形態2の遅刻パケットカウント機能や、オーバーフローパケットカウント機能、および到着遅延揺らぎ計測機能を追加することにより、同様の効果を得ることができる。
また、音声通信に限らず、リアルタイム通信を行うシステムについても、本発明の適用により同様な効果が得られる。
また、音声通信に限らずリアルタイム通信を行うシステムであれば、実施の形態4を適用することにより同様な効果を得ることができる。
この発明の実施の形態1による、音声伝送装置が適用される音声伝送システムの構成を示すブロック図である。 この発明の実施の形態1による、音声伝送装置の送信処理部の内部構成を示すブロック図である。 この発明の実施の形態1による、音声伝送装置の受信処理部の内部構成を示すブロック図である。 この発明の実施の形態1による、音声伝送装置から送信される音声パケットの例を示す図である。 この発明の実施の形態1による、揺らぎ吸収バッファ部を模式的に表した図である。 この発明の実施の形態1による、揺らぎ吸収バッファ部を模式的に表した図である。 この発明の実施の形態1による、揺らぎ吸収バッファ部を模式的に表した図である。 この発明の実施の形態1による、音声伝送装置から送信される音声パケットの例を示す図である。 この発明の実施の形態1による、音声伝送装置から送信される音声パケットの例を示す図である。 この発明の実施の形態2による、音声伝送装置の受信処理部の内部構成を示すブロック図である。 この発明の実施の形態2による、音声伝送装置の受信処理部の変形例の内部構成を示すブロック図である。 この発明の実施の形態2による、音声伝送装置の受信処理部の変形例の内部構成を示すブロック図である。 この発明の実施の形態3による、音声伝送装置の送信処理部の内部構成を示すブロック図である。 この発明の実施の形態3による、音声伝送装置の受信処理部の内部構成を示すブロック図である。 この発明の実施の形態3による、音声伝送装置から送信される音声パケットの例を示す図である。 この発明の実施の形態4による、音声伝送装置の送信処理部の内部構成を示すブロック図である。 この発明の実施の形態4による、音声伝送装置の受信処理部の内部構成を示すブロック図である。 この発明の実施の形態4による、音声伝送装置から送信される音声パケットの例を示す図である。
符号の説明
10 音声伝送システム、100 音声伝送装置(音声データ受信装置、音声データ送信装置)、200,250,270 送信処理部(音声データ送信装置)、201 音声符号化部、202 有音判定部、203,204,205 パケット送出部、300,600,650,700,750,800 受信処理部(音声データ受信装置)、301 ヘッダ分離部(パケット受信部)、302,311 トークスパート間隔計算部(無音区間計算部)、303 バッファ残量監視部、304 バッファ制御部、305 揺らぎ吸収バッファ部、306 音声復号部、307 遅刻パケットカウント部、308 オーバーフローパケットカウント部、309 到着遅延揺らぎ計測部、310 有音判定部、400 電話機、500 通信ネットワーク。

Claims (13)

  1. 有音区間の音声信号のみがパケット化されたパケットデータを受信する音声データ受信装置において、
    上記パケットデータを受信するパケット受信部と、
    受信したパケットデータをヘッダ部分と音声データ部分に分離するヘッダ分離部と、
    上記音声データ部分を蓄積する揺らぎ吸収バッファ部と、
    上記揺らぎ吸収バッファ部に蓄積されている音声データ部分の残量を監視するバッファ残量監視部と、
    有音区間の最後のパケットデータのヘッダに含まれる情報と、次の有音区間の先頭パケットデータのヘッダに含まれる情報に基づいて、2つの有音区間に挟まれた無音区間の時間長を算出する無音区間計算部と、
    上記無音区間計算部によって算出された無音区間の時間長と、上記音声データの残量と、予め定められた無音区間時間長の最小値と、上記揺らぎ吸収バッファ部の格納初期値に基づいて、受信中の有音区間の先頭パケットデータに含まれる音声データを、上記揺らぎ吸収バッファ部に蓄積する時間を制御するバッファ制御部と、
    上記揺らぎ吸収バッファ部から出力された音声データを復号し、音声信号を出力する音声復号部を備え
    上記バッファ制御部は、受信中の有音区間の先頭パケットデータに含まれる音声データを蓄積する時間を、
    上記音声データの残量と上記無音区間時間長の最小値の合計値Aが上記格納初期値を下回る場合において、上記無音区間計算部によって算出された無音区間の時間長と上記音声データの残量の合計値Bが上記合計値A未満であれば上記合計値Aに応じた時間長に、上記合計値A以上かつ上記格納初期値未満であれば上記合計値Bに応じた時間長に、上記格納初期値以上であれば上記格納初期値に応じた時間長に制御し、
    上記合計値Aが上記格納初期値を上回る場合においては、上記合計値Aに応じた時間長に制御すること
    を特徴とする音声データ受信装置。
  2. 無音区間計算部は、有音区間の最後のパケットデータのヘッダに含まれるタイムスタンプ値と、次の有音区間の先頭パケットデータのヘッダに含まれるタイムスタンプ値の差を用いて、無音区間の時間長を算出することを特徴とする請求項1記載の音声データ受信装置。
  3. 無音区間計算部は、無音区間の間も受信したパケット毎に振られるシーケンス番号をカウントし、有音区間の最後のパケットデータに振られたシーケンス番号と、次の有音区間の先頭パケットデータに振られたシーケンス番号の差を用いて、無音区間の時間長を算出することを特徴とする請求項1記載の音声データ受信装置。
  4. 無音区間計算部は、有音区間の先頭パケットデータのヘッダに含まれる、当該有音区間前の無音区間時間長情報を用いて、無音区間の時間長を算出することを特徴とする請求項1記載の音声データ受信装置。
  5. 音声信号がパケット化されたパケットデータを受信する音声データ受信装置において、
    上記パケットデータを受信するパケット受信部と、
    受信したパケットデータをヘッダ部分と音声データ部分に分離するヘッダ分離部と、
    上記受信したパケットデータが有音信号を含むものであるか、無音信号であるかを判定する有音判定部と、
    上記音声データ部分を蓄積する揺らぎ吸収バッファ部と、
    上記揺らぎ吸収バッファ部に蓄積されている音声データ部分の残量を監視するバッファ残量監視部と、
    上記有音判定部によって有音と判断された区間の最後のパケットデータのヘッダに含まれる情報と、次の有音区間の先頭パケットデータのヘッダに含まれる情報に基づいて、2つの有音区間に挟まれた無音区間の時間長を算出する無音区間計算部と、
    上記無音区間計算部によって算出された無音区間の時間長と、上記音声データの残量と、予め定められた無音区間時間長の最小値と、上記揺らぎ吸収バッファ部の格納初期値に基づいて、受信中の有音区間の先頭パケットデータに含まれる音声データを、上記揺らぎ吸収バッファ部に蓄積する時間を制御するバッファ制御部と、
    上記揺らぎ吸収バッファ部から出力された音声データを復号し、音声信号を出力する音声復号部を備え
    上記バッファ制御部は、受信中の有音区間の先頭パケットデータに含まれる音声データを蓄積する時間を、
    上記音声データの残量と上記無音区間時間長の最小値の合計値Aが上記格納初期値を下回る場合において、上記無音区間計算部によって算出された無音区間の時間長と上記音声データの残量の合計値Bが上記合計値A未満であれば上記合計値Aに応じた時間長に、上記合計値A以上かつ上記格納初期値未満であれば上記合計値Bに応じた時間長に、上記格納初期値以上であれば上記格納初期値に応じた時間長に制御し、
    上記合計値Aが上記格納初期値を上回る場合においては、上記合計値Aに応じた時間長に制御すること
    を特徴とする音声データ受信装置。
  6. 音声信号がパケット化されたパケットデータを受信する音声データ受信装置において、
    上記パケットデータを受信するパケット受信部と、
    受信したパケットデータをヘッダ部分と音声データ部分に分離するヘッダ分離部と、
    上記音声データ部分を蓄積する揺らぎ吸収バッファ部と、
    上記揺らぎ吸収バッファ部に蓄積されている音声データ部分の残量を監視するバッファ残量監視部と、
    上記ヘッダに含まれる有音無音を示す識別情報に基づいて有音と判断された区間の最後のパケットデータのヘッダに含まれる情報と、次の有音区間の先頭パケットデータのヘッダに含まれる情報に基づいて、2つの有音区間に挟まれた無音区間の時間長を算出する無音区間計算部と、
    上記無音区間計算部によって算出された無音区間の時間長と、上記音声データの残量と、予め定められた無音区間時間長の最小値と、上記揺らぎ吸収バッファ部の格納初期値に基づいて、受信中の有音区間の先頭パケットデータに含まれる音声データを、上記揺らぎ吸収バッファ部に蓄積する時間を制御するバッファ制御部と、
    上記揺らぎ吸収バッファ部から出力された音声データを復号し、音声信号を出力する音声復号部を備え
    上記バッファ制御部は、受信中の有音区間の先頭パケットデータに含まれる音声データを蓄積する時間を、
    上記音声データの残量と上記無音区間時間長の最小値の合計値Aが上記格納初期値を下回る場合において、上記無音区間計算部によって算出された無音区間の時間長と上記音声データの残量の合計値Bが上記合計値A未満であれば上記合計値Aに応じた時間長に、上記合計値A以上かつ上記格納初期値未満であれば上記合計値Bに応じた時間長に、上記格納初期値以上であれば上記格納初期値に応じた時間長に制御し、
    上記合計値Aが上記格納初期値を上回る場合においては、上記合計値Aに応じた時間長に制御すること
    を特徴とする音声データ受信装置。
  7. 到着遅延が大きいため、受信した時点で廃棄されたパケットデータの数をカウントする遅刻パケットカウント部を備え、
    バッファ制御部は、上記遅刻パケットカウント部でカウントされたパケット数に基づいて、無音区間時間長の最小値と、揺らぎ吸収バッファ部の格納初期値を決定することを特徴とする請求項1から請求項6のうちのいずれか1項記載の音声データ受信装置。
  8. 揺らぎ吸収バッファ部のオーバーフローにより、受信した時点で廃棄されたパケットデータの数をカウントするオーバーフローパケットカウント部を備え、
    バッファ制御部は、上記オーバーフローパケットカウント部でカウントされたパケット数に基づいて、無音区間時間長の最小値と、揺らぎ吸収バッファ部の格納初期値を決定することを特徴とする請求項1から請求項6のうちのいずれか1項記載の音声データ受信装置。
  9. 到着遅延の揺らぎ時間を計測する到着遅延揺らぎ計測部を備え、
    バッファ制御部は、上記到着遅延揺らぎ計測部で計測された到着遅延の揺らぎ時間に基づいて、無音区間時間長の最小値と、揺らぎ吸収バッファ部の格納初期値を決定することを特徴とする請求項1から請求項6のうちのいずれか1項記載の音声データ受信装置。
  10. バッファ残量監視部で観測された、揺らぎ吸収バッファ部内の前有音区間の音声データ部分の残量に基づいて、無音区間時間長の最小値と、揺らぎ吸収バッファ部の格納初期値を決定することを特徴とする請求項1から請求項6のうちのいずれか1項記載の音声データ受信装置。
  11. バッファ制御部の制御により得られる実際の無音区間時間長と、無音区間計算部によって算出された無音区間時間長の差に基づいて、無音区間時間長の最小値と、揺らぎ吸収バッファ部の格納初期値を決定することを特徴とする請求項1から請求項6のうちのいずれか1項記載の音声データ受信装置。
  12. 請求項4記載の音声データ受信装置にパケットデータを送信する音声データ送信装置であって、
    入力された音声信号を符号化し、符号化音声信号を出力する音声符号化部と、
    上記入力された音声信号が有音信号であるか、無音信号であるかを判定する有音判定部と、
    上記有音判定部による判定結果に基づいて、上記符号化音声信号のうち、有音信号のみをパケットデータ化して送信するパケット送出部を備え、
    上記パケット送出部は、有音区間の先頭パケットデータのヘッダに、当該有音区間の直前の無音区間の時間長の情報を含ませることを特徴とする音声データ送信装置。
  13. 請求項6記載の音声データ受信装置にパケットデータを送信する音声データ送信装置であって、
    入力された音声信号を符号化し、符号化音声信号を出力する音声符号化部と、
    上記入力された音声信号が有音信号であるか、無音信号であるかを判定する有音判定部と、
    上記符号化音声信号を音声パケット化して送信するパケット送出部を備え、
    上記パケット送出部は、上記有音判定部による判定結果に基づいて、各々のパケットデータのヘッダに、当該パケットデータの有音無音を示す識別情報を含ませることを特徴とする音声データ送信装置。
JP2004114471A 2004-04-08 2004-04-08 音声データ受信装置および音声データ送信装置 Expired - Lifetime JP4376681B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004114471A JP4376681B2 (ja) 2004-04-08 2004-04-08 音声データ受信装置および音声データ送信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004114471A JP4376681B2 (ja) 2004-04-08 2004-04-08 音声データ受信装置および音声データ送信装置

Publications (2)

Publication Number Publication Date
JP2005303531A JP2005303531A (ja) 2005-10-27
JP4376681B2 true JP4376681B2 (ja) 2009-12-02

Family

ID=35334566

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004114471A Expired - Lifetime JP4376681B2 (ja) 2004-04-08 2004-04-08 音声データ受信装置および音声データ送信装置

Country Status (1)

Country Link
JP (1) JP4376681B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080267224A1 (en) * 2007-04-24 2008-10-30 Rohit Kapoor Method and apparatus for modifying playback timing of talkspurts within a sentence without affecting intelligibility
WO2012014275A1 (ja) * 2010-07-26 2012-02-02 パイオニア株式会社 音声送受信装置、音声送受信システム及びサーバ装置

Also Published As

Publication number Publication date
JP2005303531A (ja) 2005-10-27

Similar Documents

Publication Publication Date Title
US7450601B2 (en) Method and communication apparatus for controlling a jitter buffer
JP3891755B2 (ja) パケット受信装置
US7680099B2 (en) Jitter buffer adjustment
US7630409B2 (en) Method and apparatus for improved play-out packet control algorithm
JP2002077233A (ja) リアルタイム情報受信装置
JP2005269632A (ja) 通信端末装置、電話データ受信方法、通信システムおよびゲートウェイ
JP2006140984A (ja) 特定メディアデータの破棄を制御する送信装置及び送信プログラム
US8081614B2 (en) Voice transmission apparatus
US8797850B2 (en) System and method to adapt to network congestion
JPWO2006054442A1 (ja) 送信装置、受信装置及び通信システム
EP2408165B1 (en) Method and receiver for reliable detection of the status of an RTP packet stream
KR101516113B1 (ko) 음성 복호 장치
JP4376681B2 (ja) 音声データ受信装置および音声データ送信装置
JP2004214755A (ja) 動的符号化レート変更方法及びその装置
JP3075246B2 (ja) 音声パケット送受信方法および装置
JP4376165B2 (ja) 受信装置,クロック調整方法および放送システム
JP2010136159A (ja) データ受信装置
KR101963852B1 (ko) 지터 버퍼 관리 장치 및 방법
EP1473860A1 (en) Digital circuit transmission device
JP4457841B2 (ja) 符号化レートを制御する送信装置、送信プログラム及び送信方法
KR101418354B1 (ko) 음성 통신 시스템에서 플레이아웃 스케줄링 방법 및 장치
JP3669660B2 (ja) 通話システム
JP5806719B2 (ja) 音声パケット再生装置とその方法とプログラム
JPH06152648A (ja) データ・パケット通信方法
JP2000183751A (ja) 可変レート符号化・復号装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070219

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071016

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080715

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090303

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090901

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090909

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3