JP3669660B2 - Call system - Google Patents

Call system Download PDF

Info

Publication number
JP3669660B2
JP3669660B2 JP00691297A JP691297A JP3669660B2 JP 3669660 B2 JP3669660 B2 JP 3669660B2 JP 00691297 A JP00691297 A JP 00691297A JP 691297 A JP691297 A JP 691297A JP 3669660 B2 JP3669660 B2 JP 3669660B2
Authority
JP
Japan
Prior art keywords
packet
voice
unit
frame data
buffer memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00691297A
Other languages
Japanese (ja)
Other versions
JPH10210074A (en
Inventor
弘久 飯島
光夫 古村
玲 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Secom Co Ltd
Casio Computer Co Ltd
Original Assignee
Secom Co Ltd
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Secom Co Ltd, Casio Computer Co Ltd filed Critical Secom Co Ltd
Priority to JP00691297A priority Critical patent/JP3669660B2/en
Publication of JPH10210074A publication Critical patent/JPH10210074A/en
Application granted granted Critical
Publication of JP3669660B2 publication Critical patent/JP3669660B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Use Of Switch Circuits For Exchanges And Methods Of Control Of Multiplex Exchanges (AREA)
  • Telephonic Communication Services (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は通話システムに関し、特に、音声情報をインターネット等のパケット通信網を介して送受信する通話システムの音声品質維持のための技術に関する。
【0002】
【背景技術】
近年、音声メール機能を有するパーソナルコンピュータ等のコンピュータを電話網やISDN(Integrated Services Digital Network) などの公衆網に接続することにより、同様に公衆網に接続されたコンピュータとインターネットを介して音声の送受信ができるようにした通話システムがある。かかる通話システムは、特に音声の通信を海外とする場合には、公衆回線使用料がユーザー端末から接続業者(プロバイダー)までの市内電話料金のみで済み、国際電話網を利用する場合に比して安価に通話を行うことができることから広く普及しつつある。
【0003】
また、パーソナルコンピュータ等のコンピュータを使用せずに、電話機間の通話接続にインターネットを使用する通話システムも提案されている。図13は現在提案されている上記通話システムの電話機間の通話接続への適用例を示す図である。同図に示す通話システムでは、電話機101は公衆電話網102により中継局103と接続され、一方、電話機104は公衆電話網105により中継局106と接続される。また、前記中継局103と前記中継局106とがインターネット107により通信接続される。
【0004】
そして、同図に示す通話システムでは、電話機101から送信される音声は中継局103で符号化され、例えば、30ms分の音声を表す符号毎にパケット化される。そして、30ms毎の間隔でIPパケットがインターネット107を介して中継局106に送信され、該中継局106に設けられた図示しない受信バッファに一旦蓄えられる。その後、IPパケットが開梱されて元の音声に復号化され、電話機101から送信される音声が電話機104にて再生される。
【0005】
【発明が解決しようとする課題】
しかし、インターネット107での通信は離散的なデータの通信には適しているものの、電話や放送等における音声や画像データ等の連続的なデータを受信側で即座に再生する形態の通信には不向きであって、上記通話システムにおいては、インターネット107の通信トラフィックの混雑量が増減する場合や、中継局103と中継局106との間の同期が正確に確保されていない場合には、中継局106に設けられた受信バッファがオーバーフローやアンダーフローを起こすことがある。
【0006】
こうした受信バッファのオーバーフローが生じると、電話機104において不連続な音声が再生されることになり、電話機101と電話機104との間の円滑な会話が害される。また、受信バッファのアンダーフローが生じた場合も、電話機104において通話音声が再生されずに無音区間が生じ、電話機101と電話機104との間の円滑な会話が害される。また、この場合、中継局106から電話機104への音声の送信が累積して遅延するという不具合が発生する。以下、かかる不具合について図面に基づいてさらに詳しく説明する。
【0007】
図14は、インターネット107の通信トラフィックの混雑量の時間推移の一例を表す図である。同図において、期間Pはインターネット107の通信トラフィックが通話の基準となる通常の混雑程度の期間を表し、期間Qは期間Pより混雑しているが比較的小さい混雑程度の期間を表す。また、期間Rは期間Pに比べ混雑が緩和されている期間を表し、期間Sは期間Qより更に大きい混雑程度の期間を表す。そして、期間Pでは中継局103から中継局106までに一つのIPパケットが伝送するのに必要な時間、すなわち通信所要時間は100msであり、期間Qでは110msであるとする。また、期間Rでは通信所要時間は90msであり、期間Sでは130msであるとする。
【0008】
以下、同図に示すような通信トラフィックの時間推移を示すインターネット107に8つのIPパケット1〜8を30msの一定間隔で送信する場合、すなわち、IPパケット1及び2が中継局103と中継局106との間を期間Pに伝送され、IPパケット3及び4が中継局103と中継局106との間を期間Qに伝送され、IPパケット5及び6が中継局103と中継局106との間を期間Rに伝送され、そしてIPパケット7及び8が中継局103と中継局106との間を期間Sに伝送される場合について説明する。
【0009】
図15は、各期間P〜Sに伝送するIPパケット1〜8のインターネット107での通信所要時間と、それらのIPパケット1〜8が本来電話機104へ送信されるべき時刻からの遅延時間である送信遅延時間とを、対応づけて表す図である。同図に示すように、IPパケット3〜6に含まれる音声は本来電話機104へ送信されるべき時刻からそれぞれ10ms遅れて送信され、IPパケット7及び8に含まれる音声は本来電話機104へ送信されるべき時刻からそれぞれ30ms遅れて送信される。
【0010】
以下、かかる送信遅延時間の発生原因について、図16に基づいて説明する。図16(a)は、電話機101から送信される240msの音声を示す図であり、図16(b)は、中継局103においてその音声が30ms単位で音声フレームデータに符号化され、IPパケット1〜8にパケット化される様子を示す図である。また、図16(c)は、中継局103から送信されるIPパケットが中継局106で受信される様子を示す図であり、図16(d)は、それらのIPパケットに含まれる音声フレームデータが再び音声に復号化され、電話機104に送信される様子を示す図である。
【0011】
なお、ここでは、音声の符号化レートは4kbps、すなわち1秒間の音声が4kbitに圧縮されるものとし、インターネット107の転送レート(転送速度、通信速度)は12kbpsとする。従って、インターネット107においては、各IPパケット1〜8は元の通話音声時間に対し3分の1の時間に圧縮されて転送される。すなわち、電話機101から送信される音声のうちの30ms分の音声が正味10ms程度のデータに圧縮されて転送される。ここで「正味」とは、パケットのヘッダ情報、誤り検出、誤り訂正等による付加ビットを除外して考えていることを表す。
【0012】
同図(a)及び(b)によれば、まず、電話機101から0〜60msに送信される音声は、それぞれ30msごとに音声フレームデータに符号化された後、IPパケット1及び2にパケット化され、30msの間隔で中継局103から中継局106に送信される。そして、これらのIPパケット1及び2は期間Pにインターネット107に伝送されるため、同図(c)に示すように、それぞれ100ms後に中継局106に到着する。その後、同図(d)に示すように、パケット1及び2に含まれる音声フレームデータは中継局106に到着すると直ちに元の音声に復号化されて電話機104に送信される。
【0013】
また、同図(a)及び(b)によれば、電話機101から60〜120msに送信される音声は、それぞれ30msごとに音声フレームデータに符号化された後、IPパケット3及び4にパケット化され、30msの間隔で中継局103から中継局106に送信される。そして、これらのIPパケット3及び4は、通信トラフィックの混雑が増した期間Qにインターネット107に伝送されるため、同図(c)に示すように、それぞれ110ms後に中継局106に到着する。その後、同図(d)に示すように、IPパケット3及び4に含まれる音声フレームデータは中継局106に到着すると直ちに元の音声に復号化されて電話機104に送信される。
【0014】
このとき、期間Qで最初に到着するIPパケット3は本来の時刻(IPパケット2の中継局106への到着後30ms後、すなわち190ms)よりも10ms遅れて到着し、期間Pで最後に到着するIPパケット2との到着間隔は40msに広がる。その結果、期間Qで最初に到着するIPパケット3に含まれる音声は、本来電話機104に送信されるべき時、すなわち期間Pで最後に到着するIPパケット2に含まれる音声の電話機104への送信終了の時から10ms遅れて送信され、電話機104への送信音声には10msの空白が生じることになる。そして、IPパケット3に含まれる音声は本来電話機104に送信されるべき時刻から10ms遅れて送信される。
【0015】
また、期間Qで2番目に到着するIPパケット4は、通常通り、一つ前のIPパケット3と30msの間隔を空けて到着するが、IPパケット4に含まれる音声は直前に到着したIPパケット3に含まれる音声の電話機104への送信の後で続けて送信されるものであるため、期間Qで最初に到着するIPパケット3の遅延をそのまま引き継いで、本来送信されるべき時間から10ms遅れて送信される。
【0016】
さらに、同図(a)及び(b)によれば、電話機101から120〜180msに送信される音声は、それぞれ30msごとに音声フレームデータに符号化された後、IPパケット5及び6にパケット化され、30msの間隔で中継局103から中継局106に送信される。そして、これらのIPパケット5及び6は、通信トラフィックの混雑の緩和した期間Rにインターネット107に伝送されるため、同図(c)に示すように、それぞれ90ms後に中継局106に到着する。この結果、IPパケット5が240ms、IPパケット6が270msに中継局106に到着する。その後、同図(d)に示すように、IPパケット5及び6に含まれる音声フレームデータは中継局106に到着すると直ちに元の音声に復号化されて電話機104に送信される。
【0017】
同図に示すように、こうしてインターネット107の通信トラフィックの混雑が緩和しても送信遅延時間が減少することはない。これは、直前のIPパケット4に含まれる音声の送信が終了する前に、次のIPパケット5が中継局106に到着したとしても直前のIPパケット4を送信した後でなければ送信されないことに起因する。
【0018】
また、同図(a)及び(b)によれば、電話機101から180〜240msに送信される音声は、それぞれ30msごとに音声フレームデータに符号化された後、IPパケット7及び8にパケット化され、30msの間隔で中継局103から中継局106に送信される。そして、これらのIPパケット7及び8は、通信トラフィックの混雑が大きく増した期間Sにインターネット107に伝送されるため、同図(c)に示すように、それぞれ130ms後に中継局106に到着する。この結果、IPパケット7が340ms、IPパケット8が370msに中継局106に到着する。その後、同図(d)に示すように、IPパケット7及び8に含まれる音声フレームデータは中継局106に到着すると直ちに元の音声に復号化されて電話機104に送信される。
【0019】
この場合は、IPパケット7に含まれる音声は、直前に中継局106に到着したIPパケット6に含まれる音声の電話機104への送信終了時から20ms遅れて送信される。そのため、IPパケット7及び8に含まれる音声は、IPパケット3に含まれる音声の電話機104への送信時に発生した送信遅延時間10msに、さらに20msが加算され、本来電話機104に送信されるべき時刻から30ms遅れて送信されることになる。
【0020】
以上のようにして、IPパケットに含まれる音声の電話機104への送信が、直前に中継局106に到着するIPパケットに含まれる音声の電話機104への送信終了時よりも遅れる場合には、それ以降に到着するIPパケットに含まれる音声についても、すべてその遅延を引き継ぐ。従って、通話時間が長時間に及べば及ぶほど、その間のインターネット107の混雑量の増減により円滑な通話を妨げる程に送信遅延が累積するという不具合が生じる。
【0021】
本発明はかかる課題に鑑みてなされたものであって、パケット通信網を用いて音声接続を行う場合に、受話端末における再生音声の品質を維持することのできる通話システムを提供することを課題とする。
【0030】
【課題を解決するための手段】
本発明は、送話端末から送信される音声情報に基づいて生成される音声フレームデータをパケット化し、パケット通信網を介して受話端末側に順次送信する第一の中継局と、該第一の中継局から送信されるパケットを受信し、該パケットに含まれる音声フレームデータに基づいて生成される音声情報を前記受話端末に順次送信する第二の中継局と、を含む通話システムであって、前記第二の中継局は、前記第一の中継局から受信するパケットに含まれるデータのうちの少なくとも音声フレームデータを一時的に蓄積するバッファメモリと、該バッファメモリに蓄積される音声フレームデータの数を計測する音声フレームデータ数計測手段と、前記バッファメモリのオーバーフローを検出するオーバーフロー検出手段と、前記オーバーフロー検出手段により前記バッファメモリから所定個数以上の音声フレームデータが連続してオーバーフローしたことが検出され、かつ、前記音声フレームデータ数計測手段により前記バッファメモリに蓄積される音声フレームデータの数が前記バッファメモリに蓄積可能な音声フレームデータの最大数に達していると判断される場合に、前記バッファメモリに蓄積される音声フレームデータを所定基準に基づいて選択的に削除する選択削除手段と、を含むことを特徴とする。
【0031】
本発明によれば、前記オーバーフロー検出手段により前記バッファメモリから所定個数以上の音声フレームデータが連続してオーバーフローしたことが検出された場合、すなわち、前記第二の中継局により連続して受信される所定個数のパケットに含まれる音声フレームデータが全て消失した場合で、さらに、前記音声フレームデータ数計測手段により前記バッファメモリに蓄積されるデータ量がバッファの記憶容量に達していると判断される場合には、所定個数を超えるパケットに含まれる音声フレームデータが連続して消失する虞があると判断し、前記バッファメモリに蓄積されるデータから所定基準に合致する音声フレームデータを選択的に削除する。ここで、所定基準とは、例えば、受信される音声フレームデータ中に音声振幅パワを表すデータが含まれる場合、音声振幅パワが小さい旨を表すデータを含み、発声時以外のものであると推定される音声フレームデータを削除する基準や、ほぼ同じデータが継続して現れ、母音部分と思われる部分の一部を削除する基準などを採用できる。また、受信される音声フレームデータがCELP( Codebook-Excited Linear Prediction )方式により圧縮されたものである場合には、コードブックのインデックスとして人の声以外、例えば、背景雑音を表すインデックスを含む音声フレームデータを削除する基準などを採用できる。
【0032】
こうすれば、重要度の低いデータを予め選択して削除することにより、前記バッファメモリがオーバーフローして必要なデータが連続して消失することを防止することができる。この結果、受話端末に送信されるべき音声情報の一部分が大きくまとまって消失することを防止することができ、パケット通信網を用いて音声接続を行う場合にも受話端末における再生音声の品質を維持することができる。尚、前記送話端末及び前記受話端末は、それぞれ、一方向通信や双方向通信などにおける音声情報の送信側の端末及び受信側の端末を意味する。したがって、双方向通信においては発呼側の端末及び着呼側の端末に限定されるものではない。
【0036】
【発明の実施の形態】
以下、本発明の実施の形態について図面に基づき詳細に説明する。
【0037】
[構成]
図1は本実施の形態にかかる通話システムを表す概略図である。以下、同図に従って本通話システムの構成を説明する。
【0038】
1は公衆網の一種である電話網Aに接続された発呼側の電話機であり、2は電話網AとインターネットBの双方に接続される発信局であり、クライアント部3及びサーバー部4を含む。5は、インターネットBと電話網Cの双方と接続される着信局であり、サーバー部6及びクライアント部7を含む。8は、電話網Cに接続された着呼側の電話機である。また、R1はインターネットBにおける通信経路を決定する発信局側ルーターであり、R2はインターネットBにおける通信経路を決定する着信局側ルーターである。
【0039】
尚、本実施の形態では、公衆網である電話網A及び電話網Cを例として示しているが、これに代えて専用網であるCATV網やインターネットを用いても良い。また、Bは専用網であるインターネットを示しているが、これに代えて公衆網である電話網や専用網であるCATV網を用いてもよい。
【0040】
以下、かかる本通話システムの各構成部分についてさらに詳しく説明する。
【0041】
まず、発信局2のクライアント部3について説明する。図2はクライアント部3の構成を示す図である。同図に示すクライアント部3は、自動発信/着信機能を有するNCU(Network Control Unit)31、該NCU31を制御する制御プログラムを有するNCU制御部32、RS232Cインターフェースなどの通信インターフェースを用いたクライアント部3とサーバー部4との通信を制御する通信インターフェース制御部33、音声などのデータをコード化及びデコード化するCODEC34、該CODEC34を制御するCODEC制御部35を含んで構成される。
【0042】
なお、電話網Aがデジタル網(例えば、ISDN)の場合、CODEC34は、音声などのデータをデジタル信号からデジタル信号への圧縮又は展開を行うとともに、コード化又はデコード化するものである。
【0043】
次に、発信局2のサーバー部4について説明する。図3はサーバー部4の構成を示す図である。同図に示すサーバー部4は、RS232Cインターフェースなどの通信インターフェースを用いたクライアント部3とサーバー部4との間の通信を制御する通信インターフェース制御部41、発信情報や音声情報等を一時記憶するバッファを有し、該音声情報等をパケット化して着信側へ転送するパケット通信部42、インターネットBとの通信制御を行うネットワーク制御部43を含んで構成される。
【0044】
次に、着信局5のサーバー部6について説明する。図4はサーバー部6の構成を示す図である。同図に示すサーバー部6は、インターネットBとの通信制御を行うネットワーク制御部61、発信局2と送受信するパケットを一時記憶するバッファを有し、音声情報を着信端末側と送受信するパケット通信部62、RS232Cインターフェースなどの通信インターフェースを用いたクライアント部7とサーバー部6との間の通信を制御する通信インターフェース制御部63を含んで構成される。
【0045】
さらに、着信局5のクライアント部7について説明する。図5はクライアント部7の構成を示す図である。同図に示すクライアント部7はRS232Cインターフェースなどの通信インターフェースを用いたクライアント部7とサーバー部6との間の通信を制御する通信インターフェース制御部71、自動発信/着信機能を有するNCU72、NCU72を制御する制御プログラムを有するNCU制御部73、音声などのデータをコード化及びデコード化をするCODEC74、CODEC74を制御するCODEC制御部75、を含んで構成される。
【0046】
ここで、本通話システムには、音声品質を向上させるため、前記パケット通信部42,62には、受信バッファの管理を行うための機能が付加されている。このための構成は、発呼側のパケット通信部42と着呼側のパケット通信部62とで同様であるから、ここでは、着信局5のサーバー部6に含まれるパケット通信部62について詳しく説明する。
【0047】
図6はパケット通信部62の構成を示す図である。同図に示すパケット通信部62は、送信系統として、符号化音声データをIPパケットに梱包するパケット梱包部621、パケット梱包部621により出力されるIPパケットを所定間隔で順次インターネットBに送出するための送信バッファ部622と、を含む。また、パケット通信部62は、受信系統として、インターネットBから受信するIPパケットを一時的に蓄積する受信バッファ部623と、受信バッファ部623から読み出すIPパケットを開梱するパケット開梱部624と、受信バッファ部623の入力や出力を監視して該受信バッファ部623の蓄積データを管理する受信バッファ管理部625と、を含む。ここで、前記受信バッファ部623は、カウンタ623a,623bと、バッファメモリ623cと、スイッチ623dと、を含み、前記受信バッファ管理部625は、パケット生成挿入部625aと、パケット検索削除部625bと、パケット開梱開始制御部625cと、パケット蓄積数計測部625dと、を含む。
【0048】
カウンタ623aは、IPパケットがインターネットBから受信されるごとにカウント信号を受信バッファ管理部625のパケット蓄積数計測部625dに送信する。またカウンタ623bは、IPパケットがバッファメモリ623cから読み出されるごとにカウント信号を受信バッファ管理部625のパケット蓄積数計測部625dに送信する。バッファメモリ623cは、先入れ先出し式で最大でIPパケットを10個記憶することのできるバッファメモリであり、発信局2から受信するIPパケットを一時的に蓄積する。スイッチ623dは、パケット開梱開始制御部625cからのタイミング信号によりオン又はオフし、オン時にはバッファメモリ623cからの読出しを禁止し、オフ時にはバッファメモリ623cからの読出しを許可するバッファメモリ623cの出力制限手段である。また、前記パケット蓄積数計測部625dは、カウンタ623a,623bから入力されるカウント信号とカウンタ623a,623bから入力されるカウント信号とに基づいてバッファメモリ623cに蓄積されるIPパケットの個数を計測する手段である。パケット生成挿入部625aは、パケット蓄積数計測部625dによりバッファメモリ623cに蓄積されるIPパケットの個数が0であると計測される場合に、30msの無音を表すIPパケットをバッファメモリ623cに挿入する。パケット検索削除部625bは、パケット蓄積数計測部625dによりバッファメモリ623cに蓄積されるIPパケットが容量の75%、すなわち3個以上であると計測される場合に、バッファメモリ623cがオーバーフローの直前の状態にあると判断し、バッファメモリ623cから最小の音声振幅パワの音声を表すIPパケットを検索し、そのIPパケットを削除する。パケット開梱開始制御部625cは、NCU制御部73から通話開始信号が入力されると、一旦バッファメモリ623cからのIPパケットの読出しを禁止すべく、スイッチ623dにタイミング信号を送信する。そして、パケット蓄積数計測部625dにより、バッファメモリ623cにバッファメモリ623cの容量の50%、すなわちIPパケット2個が蓄積されていると計測される場合に、そのバッファメモリ623cからのIPパケットの読出し禁止を解除すべく、スイッチ623dにタイミング信号を送信する。
【0049】
[接続動作]
次に以上説明した構成を有する本通話システムにおける発呼側電話機1と着呼側電話機8との接続動作について説明する。
【0050】
まず、発呼者が発呼側電話機1をオフフックし、発信局2の電話番号をダイヤリングすると、電話網Aの図示しない交換局によって呼出信号が発信局2へ送られる。そして、クライアント部3のNCU制御部32がNCU31を介してその呼出信号を受信すると発呼側電話機1と発信局2が電話網Aにより接続される。
【0051】
次に、発呼者が通話相手先の電話番号を発呼側電話機1からダイヤリングすると、この電話番号は、電話網A、クライアント部3のNCU31、NCU制御部32、通信インターフェース制御部33を経由してサーバー部4へ送信される。通話相手先の電話番号データは、通信インターフェース制御部41を介してパケット通信部42に送信され、パケット通信部42において通話相手先の電話番号データはパケット化される。そして、パケット化された通話相手先の電話番号データはネットワーク制御部43よりルーターR1へ送信され、インターネットB、ルーターR2を介して着信局5に送信される。
【0052】
通話相手先の電話番号データを受信した着信局5では、その通話相手先の電話番号データをサーバー部6のネットワーク制御部61からパケット通信部62に送信する。パケット通信部62では、パケット化された通話相手先の電話番号データを開梱し通信インターフェース制御部63を介してクライアント部7へ送信する。クライアント部7では、通信インターフェース制御部71を経て通話相手先の電話番号をNCU制御部73に送信する。そして、NCU制御部73は受信した通話相手先の電話番号をNCU72から電話網Cの交換器(図示せず)に自動発信する。こうして、相手方(受信者)が着呼側電話機をオフフックすると、応答信号が着信局5のNCU制御部73と発信局2のNCU制御部32とに送信され、それらのNCU制御部73,32は各々CODEC制御部75,35、及びパケット通信部42,62に通話開始信号を送出する。こうして、発信局2のCODEC制御部35と着信局5のCODEC制御部75とによるCODECでの音声接続が開始される。
【0053】
音声接続が開始されると、発呼者の音声は電話網A、発信局2のクライアント部3のCODEC34、通信インターフェース制御部33、通信インターフェース制御部41を経由してパケット通信部42に送信される。そして該パケット通信部42により30msの音声が1個のパケットに変換される。そして、そのパケットは、ネットワーク制御部43、ルーターR1、インターネットB、ルーターR2を経由して着信局5に送信される。尚、音声は前記CODEC34により符号化される際、接続中の信号と区別するために、CODEC制御部35により通話中を示す通話中信号「SPEECH」が付される。こうして、30ms毎に1個のパケットが発信局2から着信局5へ送信される。
【0054】
さらに、音声データは、着信局5のサーバー部6のネットワーク制御部61、パケット通信部62、通信インターフェース制御部63、71、CODEC制御部75、CODEC74、電話網Cを経由して着呼側電話機8に送信される。同様に、相手方(受信者)の音声についても、以上の説明と逆のデータ伝送が行われる。
【0055】
[受信バッファ部制御動作]
本通話システムでは音声接続が開始に伴い、発信局2のサーバー部4に設けられたパケット通信部42と、着信局5のサーバー部6に設けられたパケット通信部62と、においてそれぞれ受信バッファの制御が開始される。これらは同様の制御処理を行うことから、以下では、パケット通信部62における受信バッファの制御処理について説明する。
【0056】
上述のように、パケット通信部62の受信バッファ管理部625には、パケット生成挿入部625aと、パケット検索削除部625bと、パケット開梱開始制御部625cとが設けられていて、それぞれ受信バッファ部623に対する制御処理を行う。ここでは、まず、パケット開梱開始制御部625cの動作について、図7に基づいて説明する。
【0057】
同図に示すように、パケット開梱開始制御部625cは、前述のようにしてNCU制御部73から通話開始信号を受信すると(S101)、受信バッファ部623の出力を一旦停止すべくスイッチ623dへタイミング信号を送信する(S102)。そして、受信バッファ部623に、通話中信号「SPEECH」が付されたIPパケットが蓄積されるのを待ち、パケット蓄積数計測手段から出力されるパケット蓄積数が予め定めるバッファ初期値に達すれば(S103)、受信バッファ部623の出力の停止を解除すべくスイッチ623dへ再びタイミング信号を送信する(S104)。なお、上記バッファ初期値は、例えば、前記受信バッファ部623に蓄積可能な最大数の半分程度に設定すればよい。すなわち、前記受信バッファ部623のIPパケットの最大蓄積可能数が4個の場合は、前記バッファ初期値として2個程度を設定すればよい。
【0058】
以上の制御によれば、前記受信バッファ部623内に上記バッファ初期値と同数のパケットを蓄積した状態で通話を開始することができ、この結果、以下に説明するように、インターネットBの通信トラフィックの混雑量の一時的な増大を吸収して、音声の前記着呼側電話機8への送信遅延の発生を回避させることができ、パケット通信網を用いて音声接続を行う場合に、着呼側電話機8における再生音声の品質を維持することができる。
【0059】
すなわち、例えば、パケット1個当たり30ms分の音声に相当するとし、そのパケットが受信バッファ部623に2個蓄積された状態であるとする。この場合、音声を途切れなく着呼側電話機8へ送信するためには、着信局5へのパケットの到着は30ms以内の周期であることが望ましいが、インターネットBの通信トラフィックの混雑量に対応してこの周期が変動することがありうる。
【0060】
この場合の作用を図8を用いて説明する。図8は、例として、バッファメモリ623cの容量をIPパケット4個分とし、バッファ初期値を2とした場合の通話初期状態を示している。
【0061】
まず、インターネットBの通信トラフィックの混雑量が一時的に増大し、IPパケットの前記受信バッファ部623への到着に遅れが生じた場合を考える。この場合は、同図において、バッファメモリ623c中のIPパケットが順次パケット開梱部624で開梱されて、バッファ蓄積数が区間Aに移行する。すなわち、バッファメモリ623cに30ms分のパケットが2個蓄積されていれば、その時点から60msの間パケットが届かなくとも、バッファメモリ623cに蓄積済のパケットに含まれる音声が順次着呼側電話機8に送信されるため、着呼側電話機8では音声情報は途切れることなく再生される。したがって、以上のバッファ初期値の設定によれば、最大60msのIPパケットの到着の遅れを受信バッファ部623が吸収することができる。ただし、バッファ初期値を比較的大きめの値に設定すれば、その蓄積に要する時間が着呼側電話機8への送信時間の遅れとして現れるため、いわば、発呼側電話機1と着呼側電話機8との間の通信所要時間がその分増加することになる。このため、発呼側電話機と着呼側電話機との間の通信所要時間が、実用的な音声通信の限界といわれる数100msに納まるように、バッファ初期値を設定することが好ましい。
【0062】
ここで、以上の制御を行うことのできる本通話システムが、インターネットBの通信トラフィックの混雑量の増減状況と、発信局2からのパケットの送信状況とが、既に示した図14〜16に基づく説明と同様の状況下にある場合に、着信局5から着呼側電話機8へ送信される音声を図9に基づいて説明する。
【0063】
図9(a)は、発呼側電話機1から送信される240msの音声を示す図であり、図9(b)は、発信局2においてその音声が30msごとにIPパケット1〜8にパケット化される様子を示す図である。また、図9(c)は、発信局2から送信されるIPパケットが着信局5で受信される様子を示す図であり、図9(d)は、それらのIPパケットが再び音声に復号化され、着呼側電話機8に送信される様子を示す図である。
【0064】
同図(a)及び(b)によれば、まず、発呼側電話機1から0〜60msに送信される音声は、それぞれ30msごとに音声フレームデータに符号化された後、IPパケット1及び2にパケット化され、30msの間隔で発信局2から着信局5に送信される。そして、これらのIPパケット1及び2は期間PにインターネットBを伝送するため、同図(c)に示すように、それぞれ100ms後に着信局5に到着する。その後、同図(d)に示すように、パケット開梱開始制御部625cによる受信バッファ部623の制御により、IPパケット1は受信バッファ部623のバッファメモリ623cに一旦蓄積される。この際、IPパケットが一つ通過した旨がカウンタ623aからパケット蓄積数計測部625dに出力され、パケット蓄積数が1であると計測される。また、このとき、スイッチ623dはIPパケットの読出しを禁止された状態のままである。そして、次のIPパケット2が受信バッファ部623のバッファメモリ623cに入力されると、IPパケットが一つ通過した旨がカウンタ623aからパケット蓄積数計測部625dに出力され、パケット蓄積数が2であると計測される。これを受けてパケット開梱開始制御部625cは、スイッチ623dへIPパケットの読出し禁止を解除すべくタイミング信号を送信する。こうして、IPパケット1に含まれる音声フレームデータが元の音声に復号化されて着呼側電話機8に送信され、続いてIPパケット2が元の音声に復号化されて着呼側電話機8に送信される。
【0065】
また、同図(a)及び(b)によれば、発呼側電話機1から60〜120msに送信される音声は、それぞれ30msごとに音声フレームデータに符号化された後、IPパケット3及び4にパケット化され、30msの間隔で発信局2から着信局5に送信される。そして、これらのIPパケット3及び4は、通信トラフィックの混雑が増した期間QにインターネットBを伝送するため、同図(c)に示すように、それぞれ110ms後に着信局5に到着する。その後、同図(d)に示すように、IPパケット3はバッファメモリ623cに一時蓄積され、直前のIPパケット2に含まれる音声の着呼側電話機8への送信が終了すれば、元の音声に復号化されて着呼側電話機8に送信される。IPパケット4も同様に、バッファメモリ623cに一時蓄積され、直前のIPパケット3に含まれる音声の着呼側電話機8への送信が終了すれば、元の音声に復号化されて着呼側電話機8に送信される。
【0066】
このように、パケット開梱開始制御部625cが設けられていない通話システムでは、IPパケット2とIPパケット3との間で送信遅延時間が発生し、これが累積されていたのに対し(図16(d)参照)、本通話システムでは、バッファメモリ623cに蓄積されるパケットがインターネットBの通信トラフィックの混雑量の一時的な増大を吸収するため、音声の送信遅延の発生を回避させることができる。
【0067】
次に、パケット検索削除部625bの動作について、図10に基づいて説明する。
【0068】
同図に示すように、パケット検索削除部625bは、まず、パケット蓄積数計測部625dから入力される受信バッファ部623中のパケット蓄積数が満量の75%以上、すなわち3個以上であるか否かを判断する(S201)。パケットの蓄積数が3個以上であれば、受信バッファ部623がオーバーフローの直前の状態にあると判断して、受信バッファ部623のバッファメモリ623cに蓄積されたパケットから最小の音声振幅パワの音声情報が含まれるパケットを検索し(S202)、そのパケットを削除する(S203)。そして、以上の処理を前記NCU制御部73から通信終了の旨の信号が送信されるまで続ける(S204)。
【0069】
以上の制御によれば、インターネットBの通信トラフィックの混雑量が緩和して、バッファメモリ623c中のパケット蓄積数が図8に示す区間Bに移行し、さらに、バッファメモリ623cがオーバーフローの直前の状態に陥った場合に、バッファメモリ623cから前もってパケットを削除して、オーバーフローの発生を未然に防止することができる。また、この制御によれば、バッファメモリ623cに蓄積されたパケットのうち音声品質に与える影響の少ないパケットを選択的に削除するため、オーバーフローによって重要な音声情報を含むパケットが不可避的に欠落することを防止することができる。
【0070】
次に、パケット生成挿入部625aの動作について、図11に基づいて説明する。
【0071】
同図に示すように、パケット生成挿入部625aは、まず、パケット蓄積数計測部625dから入力される受信バッファ部623中のパケット蓄積数が0であるか否かを監視し(S301)、パケット蓄積数が0であれば無音を表すパケットをバッファメモリ623cに挿入する(S302)。なお、バッファメモリ623cに挿入するパケットは無音を表すものとは限らず、直前のパケットを再度挿入し、或いは、それ以前のパケットに含まれる音声情報に基づいて生成される平均的な音声を表すパケットを挿入する等が採用できる。
【0072】
以上の制御によれば、インターネットBの通信トラフィックの混雑量が増大して、バッファメモリ623c中のパケット蓄積数が図8に示す区間Aに移行し、さらに、受信バッファ部623に入力されるパケットの時間間隔が60ms以上になった場合に着信局5における処理の円滑化を図ることができる。すなわち、この場合、バッファが空になり(図8,区間D)、なお再生する音声を含むパケットが届かないのであるから、着呼側電話機8における音声情報は途切れることとなる。このとき、以上の制御によれば、受信バッファ部623の後段であるパケット開梱部624での処理対象として、ダミー音声を表すパケットを充てることで、処理の円滑化を図ることができる。
【0073】
以上説明したように、本通話システムによれば、バッファメモリ623cの管理を行うことにより、発信局2と着信局5との間の通信路、すなわちインターネットBの通信トラフィックの混雑量の増減や、発信局2及び着信局5の同期確保が困難であることに起因する、オーバーフローやアンダーフローの問題、また、発呼側電話機1及び着呼側電話機8への音声の送信遅延時間の累積の問題を解決することができる。
【0074】
なお、以上説明した本通話システムは種々の変形実施が可能である。例えば、上記説明においては、パケット検索削除部625bが、バッファメモリ623cのオーバーフローを予防する制御を行ったが、所定回数のオーバーフローをそのまま許容し、所定回数以上のオーバーフローが生じる場合には、そのオーバーフローを回避するように受信バッファ部623の制御を行ってもよい。この場合、パケット蓄積数計測部625dは、さらに、カウンタ623a,623bとカウンタ623a,623bから入力されるカウント信号に基づいてバッファメモリ623cのオーバーフローを検出することができるよう構成される。
【0075】
図12は、パケット検索削除部625bの制御動作の変形例を説明するフロー図である。同図に示すように、パケット検索削除部625bは、まず、パケット蓄積数計測部625dから入力されるバッファメモリ623cにオーバーフローが生じた旨の信号に基づいて、バッファメモリ623cに所定回数の連続するオーバーフローがあるか否かを監視する(S401)。そして、バッファメモリ623cに所定回数の連続するオーバーフローが発生すれば、次に、パケット蓄積数計測部625dから入力されるバッファ蓄積数がバッファメモリ623cに最大蓄積可能なパケット数と同数であるか否かを判断する(S402)。そして、バッファメモリ623cに所定回数の連続するオーバーフローが発生し、かつ、バッファ蓄積数がバッファメモリ623cに最大蓄積可能なパケット数と同数であれば、パケット検索削除部625bは、バッファメモリ623cに蓄積されたパケットから最小の音声振幅パワの音声情報が含まれるパケットを検索し(S403)、そのパケットを削除する(S404)。そして、以上の処理を前記NCU制御部73から通信終了の旨の信号が送信されるまで続ける(S405)。
【0076】
以上の制御によれば、インターネットBの通信トラフィックの混雑量が緩和して、バッファメモリ623cが連続して所定回数オーバーフローした場合(図8,区間C)、バッファメモリ623cからパケットを削除して、所定回数以上の連続するパケットのオーバーフローの発生を未然に防止することができる。この結果、着呼側電話機8に送信されるべき音声の一部分が大きくまとまって消失することを防止することができる。なお、以上の説明では、パケット蓄積数計測部625dが所定数の連続するパケットのオーバーフローを検出する場合について説明したが、1個のパケットがオーバーフローする場合でも同様の効果を奏する。すなわち、この場合、2個の連続するパケットがオーバーフローすることを回避することができる。
【0077】
また、バッファメモリ623cがオーバーフローすれば、着呼側電話機8に送信しなければならない音声が30ms分減少するため、着呼側電話機8への送信遅延時間が30ms程改善されることになる。すなわち、受信バッファ部623のオーバーフローには、音声の送信遅延を解消する作用がある。
【図面の簡単な説明】
【図1】 本通話システムの概略構成を示す図である。
【図2】 発信局のクライアント部の構成を示す図である。
【図3】 発信局のサーバー部の構成を示す図である。
【図4】 着信局のサーバー部の構成を示す図である。
【図5】 着信局のクライアント部の構成を示す図である。
【図6】 着信局のパケット通信部の構成を示す図である。
【図7】 パケット開梱開始制御部の動作を説明するフロー図である。
【図8】 通話開始時のバッファメモリの記憶内容を示す図である。
【図9】 本通話システムの作用を説明する図である。
【図10】 パケット検索削除部の動作を説明するフロー図である。
【図11】 パケット生成挿入部の動作を説明するフロー図である。
【図12】 パケット検索削除部の変形例の動作を説明するフロー図である。
【図13】 現在提案されているインターネットを利用した電話機間の通話接続を説明する図である。
【図14】 インターネットの通信トラフィックの混雑量の推移の一例を示す図である。
【図15】 現在提案されているインターネットを利用した電話機間の通話接続の作用を説明する図である。
【図16】 現在提案されているインターネットを利用した電話機間の通話接続の作用を説明する図である。
【符号の説明】
B インターネット、1 発呼側電話機(送話端末,受話端末)、2 発信局(中継局)、5 着信局(中継局)、8 着呼側電話機(受話端末,送話端末)、623 受信バッファ部、623a,623b カウンタ(オーバーフロー判断手段,音声フレームデータ数計測手段)、623c バッファメモリ、623d スイッチ(バッファメモリ出力制限手段)、625 受信バッファ管理部、625a パケット生成挿入部(ダミー音声挿入手段)、625b パケット検索削除部(選択削除手段)、625c パケット開梱開始制御部(バッファメモリ出力制限手段)、625d パケット蓄積数計測部(オーバーフロー判断手段,音声フレームデータ数計測手段)。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a call system, and more particularly to a technique for maintaining voice quality in a call system that transmits and receives voice information via a packet communication network such as the Internet.
[0002]
[Background]
In recent years, by connecting a computer such as a personal computer having a voice mail function to a public network such as a telephone network or ISDN (Integrated Services Digital Network), a computer connected to the public network can also transmit and receive voice over the Internet. There is a call system that can be used. Such a call system requires only a local line charge from the user terminal to the connection provider (provider), especially when the voice communication is overseas, compared to using the international telephone network. It is becoming widespread because it can make calls at low cost.
[0003]
There has also been proposed a call system that uses the Internet for call connection between telephones without using a computer such as a personal computer. FIG. 13 is a diagram showing an application example of the call system currently proposed to call connection between telephones. In the call system shown in the figure, the telephone set 101 is connected to the relay station 103 via the public telephone network 102, while the telephone set 104 is connected to the relay station 106 via the public telephone network 105. Further, the relay station 103 and the relay station 106 are communicatively connected via the Internet 107.
[0004]
In the call system shown in the figure, the voice transmitted from the telephone 101 is encoded by the relay station 103, and is packetized for each code representing, for example, 30 ms of voice. Then, IP packets are transmitted to the relay station 106 via the Internet 107 at intervals of 30 ms and temporarily stored in a reception buffer (not shown) provided in the relay station 106. Thereafter, the IP packet is unpacked and decoded to the original voice, and the voice transmitted from the telephone set 101 is reproduced by the telephone set 104.
[0005]
[Problems to be solved by the invention]
However, although communication on the Internet 107 is suitable for communication of discrete data, it is not suitable for communication in a form in which continuous data such as voice or image data in telephone or broadcast is reproduced immediately on the receiving side. In the above call system, when the traffic amount of communication traffic on the Internet 107 increases or decreases, or when synchronization between the relay station 103 and the relay station 106 is not accurately ensured, the relay station 106 May cause overflow or underflow.
[0006]
When such an overflow of the reception buffer occurs, discontinuous sound is reproduced on the telephone 104, and smooth conversation between the telephone 101 and the telephone 104 is impaired. In addition, when an underflow of the reception buffer occurs, the telephone call 104 is not reproduced and a silent period occurs, and smooth conversation between the telephone set 101 and the telephone set 104 is impaired. Further, in this case, there is a problem that voice transmission from the relay station 106 to the telephone 104 is accumulated and delayed. Hereinafter, this problem will be described in more detail based on the drawings.
[0007]
FIG. 14 is a diagram illustrating an example of temporal transition of the amount of congestion of communication traffic on the Internet 107. In the figure, a period P represents a period of normal congestion in which the communication traffic of the Internet 107 becomes a reference for a call, and a period Q represents a period of congestion that is more congested than the period P but relatively small. In addition, the period R represents a period in which congestion is reduced compared to the period P, and the period S represents a period of congestion that is greater than the period Q. In the period P, the time required for one IP packet to be transmitted from the relay station 103 to the relay station 106, that is, the communication required time is 100 ms, and in the period Q is 110 ms. In the period R, the required communication time is 90 ms, and in the period S is 130 ms.
[0008]
In the following, when eight IP packets 1-8 are transmitted to the Internet 107 showing the time transition of communication traffic as shown in the figure at regular intervals of 30 ms, that is, the IP packets 1 and 2 are transmitted to the relay station 103 and the relay station 106. IP packets 3 and 4 are transmitted in the period Q between the relay station 103 and the relay station 106, and IP packets 5 and 6 are transmitted between the relay station 103 and the relay station 106. A case where the packet is transmitted in the period R and the IP packets 7 and 8 are transmitted in the period S between the relay station 103 and the relay station 106 will be described.
[0009]
FIG. 15 shows the time required for communication on the Internet 107 of the IP packets 1 to 8 transmitted in each period P to S, and the delay time from the time when those IP packets 1 to 8 should be originally transmitted to the telephone 104. It is a figure showing a transmission delay time in association with each other. As shown in the figure, the voice included in the IP packets 3 to 6 is transmitted with a delay of 10 ms from the time when it should be transmitted to the telephone 104, and the voice included in the IP packets 7 and 8 is originally transmitted to the telephone 104. Each transmission is delayed by 30 ms from the expected time.
[0010]
Hereinafter, the cause of the transmission delay time will be described with reference to FIG. FIG. 16 (a) is a diagram showing 240 ms voice transmitted from the telephone set 101. FIG. 16 (b) is a diagram in which the voice is encoded into voice frame data in 30 ms units at the relay station 103, and the IP packet 1 It is a figure which shows a mode that -8 is packetized. FIG. 16C is a diagram illustrating a state where the IP packet transmitted from the relay station 103 is received by the relay station 106, and FIG. 16D is a diagram illustrating voice frame data included in the IP packet. FIG. 4 is a diagram illustrating a state in which is decoded into voice and transmitted to the telephone 104 again.
[0011]
Here, it is assumed that the voice encoding rate is 4 kbps, that is, the voice for one second is compressed to 4 kbit, and the transfer rate (transfer speed, communication speed) of the Internet 107 is 12 kbps. Therefore, on the Internet 107, each IP packet 1-8 is compressed and transferred to one-third of the original call voice time. That is, 30 ms of the voice transmitted from the telephone set 101 is compressed into data of about 10 ms and transferred. Here, “net” means that the additional bits due to packet header information, error detection, error correction, and the like are excluded.
[0012]
According to FIGS. 2A and 2B, first, the voice transmitted from the telephone 101 to 0 to 60 ms is encoded into voice frame data every 30 ms and then packetized into IP packets 1 and 2. And is transmitted from the relay station 103 to the relay station 106 at intervals of 30 ms. Since these IP packets 1 and 2 are transmitted to the Internet 107 in the period P, they arrive at the relay station 106 after 100 ms, respectively, as shown in FIG. Thereafter, as shown in FIG. 4D, the voice frame data included in the packets 1 and 2 is decoded into the original voice as soon as it arrives at the relay station 106 and transmitted to the telephone set 104.
[0013]
Also, according to (a) and (b) of the figure, voice transmitted from the telephone 101 to 60 to 120 ms is encoded into voice frame data every 30 ms, and then packetized into IP packets 3 and 4. And is transmitted from the relay station 103 to the relay station 106 at intervals of 30 ms. Since these IP packets 3 and 4 are transmitted to the Internet 107 during a period Q when the congestion of communication traffic has increased, they arrive at the relay station 106 after 110 ms, respectively, as shown in FIG. Thereafter, as shown in FIG. 4D, when the voice frame data included in the IP packets 3 and 4 arrives at the relay station 106, the voice frame data is immediately decoded and transmitted to the telephone 104.
[0014]
At this time, the IP packet 3 that arrives first in the period Q arrives 10 ms later than the original time (30 ms after arrival of the IP packet 2 at the relay station 106, ie, 190 ms), and arrives last in the period P. The arrival interval with the IP packet 2 extends to 40 ms. As a result, when the voice included in the IP packet 3 arriving first in the period Q is originally to be transmitted to the telephone 104, that is, transmitting the voice included in the IP packet 2 arriving last in the period P to the telephone 104. The message is transmitted with a delay of 10 ms from the end time, and a 10 ms blank is generated in the transmission voice to the telephone set 104. Then, the voice included in the IP packet 3 is transmitted with a delay of 10 ms from the time when it should originally be transmitted to the telephone 104.
[0015]
In addition, the IP packet 4 that arrives second in the period Q arrives at an interval of 30 ms from the previous IP packet 3 as usual, but the voice included in the IP packet 4 arrives immediately before the IP packet. 3 is transmitted after the transmission of the voice included in the telephone 104 to the telephone 104, so that the delay of the IP packet 3 that arrives first in the period Q is taken over as it is, and is delayed by 10 ms from the time to be originally transmitted. Sent.
[0016]
Furthermore, according to (a) and (b) of the figure, the voice transmitted from the telephone set 101 to 120 to 180 ms is encoded into voice frame data every 30 ms and then packetized into IP packets 5 and 6. And is transmitted from the relay station 103 to the relay station 106 at intervals of 30 ms. Since these IP packets 5 and 6 are transmitted to the Internet 107 during a period R in which congestion of communication traffic is eased, the IP packets 5 and 6 arrive at the relay station 106 after 90 ms, respectively, as shown in FIG. As a result, IP packet 5 arrives at relay station 106 at 240 ms and IP packet 6 arrives at 270 ms. Thereafter, as shown in FIG. 4D, the voice frame data included in the IP packets 5 and 6 is decoded into the original voice as soon as it arrives at the relay station 106 and transmitted to the telephone set 104.
[0017]
As shown in the figure, even if the congestion of communication traffic on the Internet 107 is alleviated in this way, the transmission delay time does not decrease. This is because, even if the next IP packet 5 arrives at the relay station 106 before the transmission of the voice included in the previous IP packet 4 is finished, it is not transmitted until after the previous IP packet 4 is transmitted. to cause.
[0018]
Also, according to (a) and (b) of the figure, the voice transmitted from the telephone set 101 to 180 to 240 ms is encoded into voice frame data every 30 ms and then packetized into IP packets 7 and 8. And is transmitted from the relay station 103 to the relay station 106 at intervals of 30 ms. Since these IP packets 7 and 8 are transmitted to the Internet 107 during a period S in which the congestion of communication traffic has greatly increased, they arrive at the relay station 106 after 130 ms, respectively, as shown in FIG. As a result, IP packet 7 arrives at relay station 106 at 340 ms and IP packet 8 arrives at 370 ms. Thereafter, as shown in FIG. 4D, the voice frame data included in the IP packets 7 and 8 is decoded into the original voice as soon as it arrives at the relay station 106 and transmitted to the telephone set 104.
[0019]
In this case, the voice included in the IP packet 7 is transmitted with a delay of 20 ms from the end of transmission of the voice included in the IP packet 6 arriving at the relay station 106 immediately before to the telephone set 104. Therefore, the voice included in the IP packets 7 and 8 is added to the transmission delay time of 10 ms generated when the voice included in the IP packet 3 is transmitted to the telephone 104, and 20 ms is added to the original time to be transmitted to the telephone 104. Will be transmitted 30 ms later.
[0020]
As described above, when the transmission of the voice included in the IP packet to the telephone 104 is delayed from the end of the transmission of the voice included in the IP packet arriving at the relay station 106 immediately before the end of the transmission. All the voices included in the IP packets that arrive thereafter will also take over the delay. Therefore, the longer the call time is, the more the transmission delay accumulates to the extent that the smooth call is hindered due to the increase or decrease in the amount of congestion on the Internet 107 during that time.
[0021]
The present invention has been made in view of such problems, and it is an object of the present invention to provide a call system capable of maintaining the quality of reproduced voice at a receiving terminal when voice connection is performed using a packet communication network. To do.
[0030]
[Means for Solving the Problems]
The present invention packetizes voice frame data generated based on voice information transmitted from a transmitting terminal, and sequentially transmits it to a receiving terminal side via a packet communication network, and the first relay station A second relay station that receives a packet transmitted from a relay station and sequentially transmits voice information generated based on voice frame data included in the packet to the receiving terminal, The second relay station includes a buffer memory that temporarily stores at least audio frame data of data included in a packet received from the first relay station, and audio frame data stored in the buffer memory. Audio frame data number measuring means for measuring the number of overflows, overflow detecting means for detecting overflow of the buffer memory, and overflow detection. A predetermined number or more audio frame data is detected that the overflow continuously from the buffer memory by means,AndThe number of audio frame data stored in the buffer memory by the audio frame data number measuring means is the buffer memory.Of audio frame data that can be stored inmaximumofWhen it is determined that the number has been reached, it is stored in the buffer memory.Voice frameSelecting and deleting means for selectively deleting data based on a predetermined criterion.
[0031]
  According to the present invention, when it is detected by the overflow detection means that a predetermined number or more of audio frame data has continuously overflowed from the buffer memory, that is, continuously received by the second relay station. When all the audio frame data included in the predetermined number of packets is lost, and further, when the audio frame data number measuring unit determines that the amount of data stored in the buffer memory has reached the storage capacity of the buffer Determines that there is a possibility that voice frame data included in a packet exceeding a predetermined number may be continuously lost, and selectively deletes voice frame data that meets a predetermined criterion from the data stored in the buffer memory. .Here, for example, when the data representing the audio amplitude power is included in the received audio frame data, the predetermined criterion includes data indicating that the audio amplitude power is small, and is estimated to be other than during utterance It is possible to adopt a criterion for deleting the voice frame data to be deleted, a criterion for deleting a part of the portion that seems to be a vowel part because almost the same data appears continuously. Also, the received audio frame data is CELP ( Codebook-Excited Linear Prediction In the case of being compressed by the above method, a codebook index other than human voice, for example, a criterion for deleting speech frame data including an index representing background noise can be adopted.
[0032]
  In this way, it is possible to prevent the buffer memory from overflowing and necessary data from being continuously lost by selecting and deleting data of low importance in advance. As a result, it is possible to prevent a part of the voice information to be transmitted to the receiving terminal from being largely lost and maintain the quality of the reproduced voice at the receiving terminal even when voice connection is performed using a packet communication network. can do.The transmitting terminal and the receiving terminal mean a terminal on the transmission side and a terminal on the reception side of voice information in one-way communication and two-way communication, respectively. Therefore, the bidirectional communication is not limited to the calling terminal and the called terminal.
[0036]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0037]
[Constitution]
FIG. 1 is a schematic diagram showing a call system according to the present embodiment. Hereinafter, the configuration of the call system will be described with reference to FIG.
[0038]
Reference numeral 1 denotes a telephone on the calling side connected to a telephone network A which is a kind of public network. Reference numeral 2 denotes a transmitting station connected to both the telephone network A and the Internet B. The client unit 3 and the server unit 4 are connected to each other. Including. A receiving station 5 connected to both the Internet B and the telephone network C includes a server unit 6 and a client unit 7. Reference numeral 8 denotes a telephone on the called side connected to the telephone network C. R1 is a transmitting station side router that determines a communication path in the Internet B, and R2 is a receiving station side router that determines a communication path in the Internet B.
[0039]
In this embodiment, the telephone network A and the telephone network C, which are public networks, are shown as an example, but a CATV network or the Internet, which is a dedicated network, may be used instead. Further, B indicates the Internet which is a dedicated network, but instead of this, a telephone network which is a public network or a CATV network which is a dedicated network may be used.
[0040]
Hereinafter, each component of the call system will be described in more detail.
[0041]
First, the client unit 3 of the transmission station 2 will be described. FIG. 2 is a diagram showing the configuration of the client unit 3. The client unit 3 shown in the figure includes an NCU (Network Control Unit) 31 having an automatic transmission / reception function, an NCU control unit 32 having a control program for controlling the NCU 31, and a client unit 3 using a communication interface such as an RS232C interface. And a communication interface control unit 33 for controlling communication with the server unit 4, a CODEC 34 for encoding and decoding data such as voice, and a CODEC control unit 35 for controlling the CODEC 34.
[0042]
When the telephone network A is a digital network (for example, ISDN), the CODEC 34 compresses or expands data such as voice from a digital signal to a digital signal and encodes or decodes the data.
[0043]
Next, the server unit 4 of the transmission station 2 will be described. FIG. 3 is a diagram showing the configuration of the server unit 4. The server unit 4 shown in the figure includes a communication interface control unit 41 that controls communication between the client unit 3 and the server unit 4 using a communication interface such as an RS232C interface, and a buffer that temporarily stores transmission information, voice information, and the like. A packet communication unit 42 that packetizes the voice information and transfers it to the incoming side, and a network control unit 43 that controls communication with the Internet B.
[0044]
Next, the server unit 6 of the receiving station 5 will be described. FIG. 4 is a diagram showing the configuration of the server unit 6. The server unit 6 shown in the figure includes a network control unit 61 that controls communication with the Internet B, a buffer that temporarily stores packets transmitted and received with the transmitting station 2, and a packet communication unit that transmits and receives voice information with the receiving terminal side. 62, a communication interface control unit 63 that controls communication between the client unit 7 and the server unit 6 using a communication interface such as an RS232C interface.
[0045]
Further, the client unit 7 of the receiving station 5 will be described. FIG. 5 is a diagram showing the configuration of the client unit 7. The client unit 7 shown in the figure controls a communication interface control unit 71 that controls communication between the client unit 7 and the server unit 6 using a communication interface such as an RS232C interface, an NCU 72 having an automatic transmission / reception function, and an NCU 72. An NCU control unit 73 having a control program for encoding, a CODEC 74 for encoding and decoding data such as voice, and a CODEC control unit 75 for controlling the CODEC 74.
[0046]
Here, in this call system, in order to improve the voice quality, a function for managing a reception buffer is added to the packet communication units 42 and 62. Since the configuration for this is the same in the packet communication unit 42 on the calling side and the packet communication unit 62 on the called side, here the packet communication unit 62 included in the server unit 6 of the destination station 5 will be described in detail. To do.
[0047]
FIG. 6 is a diagram showing the configuration of the packet communication unit 62. The packet communication unit 62 shown in the figure serves as a transmission system to send out the IP packet output from the packet packing unit 621 and the packet packing unit 621 sequentially to the Internet B at predetermined intervals. Transmission buffer unit 622. Further, the packet communication unit 62 includes, as a reception system, a reception buffer unit 623 that temporarily stores IP packets received from the Internet B, a packet unpacking unit 624 that unpacks IP packets read from the reception buffer unit 623, A reception buffer management unit 625 that monitors input and output of the reception buffer unit 623 and manages accumulated data in the reception buffer unit 623. Here, the reception buffer unit 623 includes counters 623a and 623b, a buffer memory 623c, and a switch 623d. The reception buffer management unit 625 includes a packet generation insertion unit 625a, a packet search deletion unit 625b, A packet unpacking start control unit 625c and a packet accumulation number measuring unit 625d are included.
[0048]
Each time an IP packet is received from the Internet B, the counter 623a transmits a count signal to the packet accumulation number measurement unit 625d of the reception buffer management unit 625. The counter 623b transmits a count signal to the packet accumulation number measurement unit 625d of the reception buffer management unit 625 every time an IP packet is read from the buffer memory 623c. The buffer memory 623c is a buffer memory capable of storing a maximum of 10 IP packets in a first-in first-out manner, and temporarily stores IP packets received from the transmission station 2. The switch 623d is turned on or off by a timing signal from the packet unpacking start control unit 625c. When the switch 623d is turned on, reading from the buffer memory 623c is prohibited. When the switch 623d is turned off, reading from the buffer memory 623c is permitted. Means. The packet accumulation number measuring unit 625d measures the number of IP packets accumulated in the buffer memory 623c based on the count signals input from the counters 623a and 623b and the count signals input from the counters 623a and 623b. Means. The packet generation / insertion unit 625a inserts an IP packet representing silence of 30 ms into the buffer memory 623c when the number of IP packets accumulated in the buffer memory 623c is measured by the packet accumulation number measurement unit 625d to be zero. . The packet search / deletion unit 625b determines that the buffer memory 623c is immediately before the overflow when the packet accumulation number measurement unit 625d measures 75% of the IP packet accumulated in the buffer memory 623c, that is, three or more. It is determined that the state is in the state, the IP packet representing the voice with the smallest voice amplitude power is searched from the buffer memory 623c, and the IP packet is deleted. When a call start signal is input from the NCU control unit 73, the packet unpacking start control unit 625c transmits a timing signal to the switch 623d to prohibit reading of the IP packet from the buffer memory 623c. When the packet accumulation number measuring unit 625d measures 50% of the capacity of the buffer memory 623c, that is, when two IP packets are accumulated in the buffer memory 623c, the IP packet is read from the buffer memory 623c. In order to release the prohibition, a timing signal is transmitted to the switch 623d.
[0049]
[Connection operation]
Next, a connection operation between the calling side telephone 1 and the called side telephone 8 in the call system having the above-described configuration will be described.
[0050]
First, when the calling party goes off-hooking the calling side telephone 1 and dials the telephone number of the calling station 2, a calling signal is sent to the calling station 2 by an exchange not shown in the telephone network A. When the NCU control unit 32 of the client unit 3 receives the call signal via the NCU 31, the calling side telephone 1 and the calling station 2 are connected by the telephone network A.
[0051]
Next, when the caller dials the telephone number of the other party from the calling side telephone 1, the telephone number is transmitted to the telephone network A, the NCU 31 of the client unit 3, the NCU control unit 32, and the communication interface control unit 33. And transmitted to the server unit 4. The telephone number data of the communication partner is transmitted to the packet communication unit 42 via the communication interface control unit 41, and the telephone number data of the communication partner is packetized in the packet communication unit 42. Then, the packetized telephone number data of the communication partner is transmitted from the network control unit 43 to the router R1, and transmitted to the destination station 5 via the Internet B and the router R2.
[0052]
In the receiving station 5 that has received the telephone number data of the call partner, the telephone number data of the call partner is transmitted from the network control unit 61 of the server unit 6 to the packet communication unit 62. The packet communication unit 62 unpacks the packetized telephone number data of the communication partner and transmits it to the client unit 7 via the communication interface control unit 63. The client unit 7 transmits the telephone number of the communication partner to the NCU control unit 73 via the communication interface control unit 71. Then, the NCU control unit 73 automatically transmits the received telephone number of the communication partner from the NCU 72 to an exchange (not shown) of the telephone network C. Thus, when the other party (recipient) off-hooks the called telephone, a response signal is transmitted to the NCU control unit 73 of the receiving station 5 and the NCU control unit 32 of the transmitting station 2, and the NCU control units 73 and 32 Call start signals are sent to the CODEC control units 75 and 35 and the packet communication units 42 and 62, respectively. Thus, the CODEC voice connection between the CODEC control unit 35 of the transmitting station 2 and the CODEC control unit 75 of the receiving station 5 is started.
[0053]
When the voice connection is started, the caller's voice is transmitted to the packet communication unit 42 via the telephone network A, the CODEC 34 of the client unit 3 of the transmitting station 2, the communication interface control unit 33, and the communication interface control unit 41. The The packet communication unit 42 converts the 30 ms voice into one packet. Then, the packet is transmitted to the destination station 5 via the network control unit 43, the router R1, the Internet B, and the router R2. When the audio is encoded by the CODEC 34, the CODEC control unit 35 adds a busy signal “SPEECH” indicating that the call is in progress in order to distinguish it from the connected signal. Thus, one packet is transmitted from the transmitting station 2 to the receiving station 5 every 30 ms.
[0054]
Further, the voice data is transmitted to the called side telephone via the network control unit 61, the packet communication unit 62, the communication interface control units 63 and 71, the CODEC control unit 75, the CODEC 74, and the telephone network C of the server unit 6 of the receiving station 5. 8 is transmitted. Similarly, for the voice of the other party (recipient), data transmission opposite to that described above is performed.
[0055]
[Receive buffer section control operation]
In this call system, when the voice connection is started, the packet communication unit 42 provided in the server unit 4 of the transmitting station 2 and the packet communication unit 62 provided in the server unit 6 of the receiving station 5 respectively receive the reception buffers. Control begins. Since these perform the same control processing, the reception buffer control processing in the packet communication unit 62 will be described below.
[0056]
As described above, the reception buffer management unit 625 of the packet communication unit 62 is provided with the packet generation / insertion unit 625a, the packet search / deletion unit 625b, and the packet unpacking start control unit 625c. A control process for 623 is performed. Here, first, the operation of the packet unpacking start control unit 625c will be described with reference to FIG.
[0057]
As shown in the figure, when the packet unpacking start control unit 625c receives a call start signal from the NCU control unit 73 as described above (S101), the packet unpacking start control unit 625c sends a switch 623d to temporarily stop the output of the reception buffer unit 623. A timing signal is transmitted (S102). Then, it waits for the IP packet with the call signal “SPEECH” to be accumulated in the reception buffer unit 623, and if the packet accumulation number output from the packet accumulation number measuring means reaches a predetermined buffer initial value ( In step S103, the timing signal is transmitted again to the switch 623d to cancel the stop of the output of the reception buffer unit 623 (S104). The buffer initial value may be set to about half of the maximum number that can be stored in the reception buffer unit 623, for example. That is, when the maximum number of IP packets that can be stored in the reception buffer unit 623 is four, the buffer initial value may be set to about two.
[0058]
According to the above control, a call can be started with the same number of packets as the buffer initial value stored in the reception buffer unit 623. As a result, as described below, communication traffic of the Internet B When the voice connection is made using the packet communication network, it is possible to absorb the temporary increase in the amount of congestion of the voice and avoid the transmission delay of the voice to the called telephone 8. The quality of the reproduced sound in the telephone 8 can be maintained.
[0059]
In other words, for example, it is assumed that the packet corresponds to 30 ms of voice, and that two packets are stored in the reception buffer unit 623. In this case, in order to transmit the voice to the called telephone 8 without interruption, it is desirable that the arrival of the packet at the receiving station 5 has a period of 30 ms or less, but it corresponds to the congestion amount of communication traffic of the Internet B. The lever cycle can vary.
[0060]
The operation in this case will be described with reference to FIG. FIG. 8 shows an initial call state when the capacity of the buffer memory 623c is four IP packets and the buffer initial value is 2, for example.
[0061]
First, let us consider a case where the amount of congestion of communication traffic on the Internet B temporarily increases and a delay occurs in the arrival of IP packets at the reception buffer unit 623. In this case, in the same figure, the IP packets in the buffer memory 623c are sequentially unpacked by the packet unpacking unit 624, and the buffer accumulation number shifts to the section A. That is, if two packets for 30 ms are stored in the buffer memory 623c, even if the packet does not reach for 60 ms from that time, the voices included in the packets stored in the buffer memory 623c are sequentially received by the called telephone 8 Therefore, the call side telephone 8 reproduces the voice information without interruption. Therefore, according to the setting of the buffer initial value described above, the reception buffer unit 623 can absorb the delay of arrival of the IP packet of 60 ms at maximum. However, if the buffer initial value is set to a relatively large value, the time required for the accumulation appears as a delay in the transmission time to the called telephone 8, so to speak, the calling telephone 1 and the called telephone 8. The time required for communication with the network increases accordingly. For this reason, it is preferable to set the buffer initial value so that the time required for communication between the calling side telephone and the called side telephone falls within several hundreds of milliseconds, which is said to be a practical voice communication limit.
[0062]
Here, according to the call system capable of performing the above control, the increase / decrease state of the traffic amount of the communication traffic of the Internet B and the transmission state of the packet from the transmission station 2 are based on FIGS. The voice transmitted from the receiving station 5 to the called telephone 8 when the situation is similar to the description will be described with reference to FIG.
[0063]
FIG. 9A is a diagram showing 240 ms of voice transmitted from the calling side telephone 1, and FIG. 9B is a diagram showing how the voice is packetized into IP packets 1 to 8 every 30 ms at the calling station 2. FIG. It is a figure which shows a mode that it is performed. FIG. 9C is a diagram showing a state where the IP packet transmitted from the source station 2 is received by the destination station 5, and FIG. 9D is a diagram in which those IP packets are decoded into voice again. FIG. 4 is a diagram showing a state where the call is transmitted to the called telephone 8.
[0064]
According to FIGS. 2A and 2B, first, the voice transmitted from the calling telephone 1 to 0 to 60 ms is encoded into voice frame data every 30 ms, and then the IP packets 1 and 2 are transmitted. And is transmitted from the transmitting station 2 to the receiving station 5 at intervals of 30 ms. Since these IP packets 1 and 2 transmit the Internet B in the period P, they arrive at the receiving station 5 after 100 ms, respectively, as shown in FIG. Thereafter, as shown in FIG. 4D, the IP packet 1 is temporarily stored in the buffer memory 623c of the reception buffer unit 623 under the control of the reception buffer unit 623 by the packet unpacking start control unit 625c. At this time, the fact that one IP packet has passed is output from the counter 623a to the packet accumulation number measuring unit 625d, and the packet accumulation number is measured to be one. At this time, the switch 623d remains in a state where reading of the IP packet is prohibited. When the next IP packet 2 is input to the buffer memory 623c of the reception buffer unit 623, the fact that one IP packet has passed is output from the counter 623a to the packet accumulation number measurement unit 625d, and the packet accumulation number is 2. It is measured when there is. In response to this, the packet unpacking start control unit 625c transmits a timing signal to the switch 623d to cancel the prohibition of reading the IP packet. Thus, the voice frame data included in the IP packet 1 is decoded into the original voice and transmitted to the called telephone 8, and then the IP packet 2 is decoded into the original voice and transmitted to the called telephone 8. Is done.
[0065]
Also, according to FIGS. 4A and 4B, the voice transmitted from the calling telephone 1 to 60 to 120 ms is encoded into voice frame data every 30 ms, and then the IP packets 3 and 4 are transmitted. And is transmitted from the transmitting station 2 to the receiving station 5 at intervals of 30 ms. Since these IP packets 3 and 4 are transmitted through the Internet B during the period Q in which the traffic congestion is increased, the IP packets 3 and 4 arrive at the receiving station 5 after 110 ms, respectively, as shown in FIG. Thereafter, as shown in FIG. 4D, the IP packet 3 is temporarily stored in the buffer memory 623c, and when the transmission of the voice included in the immediately preceding IP packet 2 to the called telephone 8 is completed, the original voice is stored. Is transmitted to the called telephone 8. Similarly, the IP packet 4 is also temporarily stored in the buffer memory 623c, and when transmission of the voice included in the previous IP packet 3 to the called telephone 8 is completed, it is decoded into the original voice and is received. 8 is transmitted.
[0066]
As described above, in the call system in which the packet unpacking start control unit 625c is not provided, the transmission delay time occurs between the IP packet 2 and the IP packet 3, and this is accumulated (FIG. 16 ( In this call system, since the packet stored in the buffer memory 623c absorbs a temporary increase in the amount of congestion of communication traffic on the Internet B, occurrence of voice transmission delay can be avoided.
[0067]
Next, the operation of the packet search / deletion unit 625b will be described with reference to FIG.
[0068]
As shown in the figure, the packet search / deletion unit 625b first determines whether the packet accumulation number in the reception buffer unit 623 input from the packet accumulation number measurement unit 625d is 75% or more of the full amount, that is, three or more. It is determined whether or not (S201). If the accumulated number of packets is 3 or more, it is determined that the reception buffer unit 623 is in a state immediately before the overflow, and the audio having the minimum audio amplitude power is determined from the packets accumulated in the buffer memory 623c of the reception buffer unit 623. A packet including the information is searched (S202), and the packet is deleted (S203). The above processing is continued until a signal indicating the end of communication is transmitted from the NCU control unit 73 (S204).
[0069]
According to the above control, the congestion amount of communication traffic on the Internet B is alleviated, the number of packets stored in the buffer memory 623c is shifted to the section B shown in FIG. 8, and the buffer memory 623c is in a state immediately before the overflow. In such a case, the packet can be deleted in advance from the buffer memory 623c to prevent an overflow from occurring. In addition, according to this control, packets that have little influence on voice quality among the packets stored in the buffer memory 623c are selectively deleted, so that packets containing important voice information are inevitably lost due to overflow. Can be prevented.
[0070]
Next, the operation of the packet generation / insertion unit 625a will be described with reference to FIG.
[0071]
As shown in the figure, the packet generation / insertion unit 625a first monitors whether the packet accumulation number in the reception buffer unit 623 input from the packet accumulation number measurement unit 625d is 0 (S301). If the accumulated number is 0, a packet representing silence is inserted into the buffer memory 623c (S302). Note that the packet to be inserted into the buffer memory 623c does not necessarily represent silence, but represents the average voice generated based on the voice information included in the previous packet by inserting the previous packet again. For example, a packet can be inserted.
[0072]
According to the above control, the amount of congestion of communication traffic on the Internet B increases, the number of packets stored in the buffer memory 623c shifts to the section A shown in FIG. 8, and further, packets input to the reception buffer unit 623 When the time interval becomes 60 ms or more, processing at the receiving station 5 can be facilitated. That is, in this case, the buffer becomes empty (section D in FIG. 8), and the packet containing the voice to be reproduced does not reach, so the voice information in the called telephone 8 is interrupted. At this time, according to the above control, processing can be facilitated by allocating a packet representing dummy voice as a processing target in the packet unpacking unit 624, which is a subsequent stage of the reception buffer unit 623.
[0073]
As described above, according to this call system, by managing the buffer memory 623c, the communication path between the transmitting station 2 and the receiving station 5, that is, the increase or decrease in the amount of congestion of communication traffic on the Internet B, Problems of overflow and underflow due to difficulty in ensuring synchronization between the transmitting station 2 and the receiving station 5, and problems of accumulation of audio transmission delay times to the calling telephone 1 and the called telephone 8 Can be solved.
[0074]
Note that the telephone system described above can be variously modified. For example, in the above description, the packet search / deletion unit 625b performs control to prevent overflow of the buffer memory 623c. The reception buffer unit 623 may be controlled so as to avoid this. In this case, the packet accumulation number measuring unit 625d is further configured to be able to detect an overflow of the buffer memory 623c based on the count signals input from the counters 623a and 623b and the counters 623a and 623b.
[0075]
FIG. 12 is a flowchart for explaining a modification of the control operation of the packet search and deletion unit 625b. As shown in the figure, the packet search / deletion unit 625b first continues the buffer memory 623c a predetermined number of times based on a signal indicating that an overflow has occurred in the buffer memory 623c input from the packet accumulation number measurement unit 625d. It is monitored whether there is an overflow (S401). If a predetermined number of consecutive overflows occur in the buffer memory 623c, then whether or not the buffer accumulation number input from the packet accumulation number measurement unit 625d is the same as the maximum number of packets that can be accumulated in the buffer memory 623c. Is determined (S402). If a predetermined number of consecutive overflows occur in the buffer memory 623c and the buffer accumulation number is the same as the maximum number of packets that can be accumulated in the buffer memory 623c, the packet search and deletion unit 625b accumulates in the buffer memory 623c. A packet including voice information with the minimum voice amplitude power is searched from the received packets (S403), and the packet is deleted (S404). The above processing is continued until a signal indicating the end of communication is transmitted from the NCU control unit 73 (S405).
[0076]
According to the above control, when the congestion amount of communication traffic on the Internet B is reduced and the buffer memory 623c continuously overflows a predetermined number of times (FIG. 8, section C), the packet is deleted from the buffer memory 623c, Occurrence of overflow of a continuous packet more than a predetermined number of times can be prevented beforehand. As a result, it is possible to prevent a part of the voice to be transmitted to the called telephone 8 from being largely lost. In the above description, the case where the packet accumulation number measuring unit 625d detects an overflow of a predetermined number of consecutive packets has been described, but the same effect can be obtained even when one packet overflows. That is, in this case, it is possible to avoid two consecutive packets from overflowing.
[0077]
If the buffer memory 623c overflows, the voice that must be transmitted to the called telephone 8 is reduced by 30 ms, so that the transmission delay time to the called telephone 8 is improved by about 30 ms. That is, the overflow of the reception buffer unit 623 has an effect of eliminating the audio transmission delay.
[Brief description of the drawings]
FIG. 1 is a diagram showing a schematic configuration of the call system.
FIG. 2 is a diagram illustrating a configuration of a client unit of a transmission station.
FIG. 3 is a diagram illustrating a configuration of a server unit of a transmission station.
FIG. 4 is a diagram showing a configuration of a server unit of a receiving station.
FIG. 5 is a diagram illustrating a configuration of a client unit of a receiving station.
FIG. 6 is a diagram illustrating a configuration of a packet communication unit of a receiving station.
FIG. 7 is a flowchart illustrating the operation of a packet unpacking start control unit.
FIG. 8 is a diagram showing the contents stored in a buffer memory at the start of a call.
FIG. 9 is a diagram for explaining the operation of the call system.
FIG. 10 is a flowchart for explaining the operation of a packet search and deletion unit.
FIG. 11 is a flowchart for explaining the operation of the packet generation / insertion unit;
FIG. 12 is a flowchart for explaining the operation of a modified example of the packet search and deletion unit.
FIG. 13 is a diagram for explaining a call connection between telephones using the Internet currently proposed.
FIG. 14 is a diagram illustrating an example of a change in the amount of congestion of Internet communication traffic.
FIG. 15 is a diagram for explaining the operation of call connection between telephones using the Internet currently proposed.
FIG. 16 is a diagram for explaining the operation of call connection between telephones using the Internet currently proposed.
[Explanation of symbols]
B Internet, 1 calling telephone (sending terminal, receiving terminal), 2 transmitting station (relay station), 5 receiving station (relay station), 8 receiving telephone (receiving terminal, transmitting terminal), 623 receiving buffer 623a, 623b counter (overflow judgment means, voice frame data number measurement means), 623c buffer memory, 623d switch (buffer memory output restriction means), 625 reception buffer management section, 625a packet generation insertion section (dummy voice insertion means) 625b Packet search deletion unit (selection deletion unit), 625c Packet unpacking start control unit (buffer memory output restriction unit), 625d Packet accumulation number measurement unit (overflow determination unit, voice frame data number measurement unit).

Claims (1)

送話端末から送信される音声情報に基づいて生成される音声フレームデータをパケット化し、パケット通信網を介して受話端末側に順次送信する第一の中継局と、
該第一の中継局から送信されるパケットを受信し、該パケットに含まれる音声フレームデータに基づいて生成される音声情報を前記受話端末に順次送信する第二の中継局と、
を含む通話システムであって、
前記第二の中継局は、
前記第一の中継局から受信するパケットに含まれるデータのうちの少なくとも音声フレームデータを一時的に蓄積するバッファメモリと、
該バッファメモリに蓄積される音声フレームデータの数を計測する音声フレームデータ数計測手段と、
前記バッファメモリのオーバーフローを検出するオーバーフロー検出手段と、
前記オーバーフロー検出手段により前記バッファメモリから所定個数以上の音声フレームデータが連続してオーバーフローしたことが検出され、かつ、前記音声フレームデータ数計測手段により前記バッファメモリに蓄積される音声フレームデータの数が前記バッファメモリに蓄積可能な音声フレームデータの最大数に達していると判断される場合に、前記バッファメモリに蓄積される音声フレームデータを所定基準に基づいて選択的に削除する選択削除手段と、
を含むことを特徴とする通話システム。
A first relay station that packetizes voice frame data generated based on voice information transmitted from a transmitting terminal and sequentially transmits the packet to a receiving terminal via a packet communication network;
A second relay station that receives a packet transmitted from the first relay station and sequentially transmits voice information generated based on voice frame data included in the packet to the receiving terminal;
A call system including:
The second relay station is
A buffer memory for temporarily storing at least voice frame data of data included in a packet received from the first relay station;
Audio frame data number measuring means for measuring the number of audio frame data stored in the buffer memory;
Overflow detection means for detecting an overflow of the buffer memory;
The overflow detection unit by the buffer from the memory of a predetermined number or more audio frame data is detected to be overflowing continuously, and the number of audio frame data accumulated in the buffer memory by the audio frame data number measuring means If it is determined to have reached the maximum number of audio frame data that can be stored in the buffer memory, a selection deleting means selectively deleted based audio frame data accumulated in the buffer memory to a predetermined criterion ,
A call system characterized by including:
JP00691297A 1997-01-17 1997-01-17 Call system Expired - Fee Related JP3669660B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00691297A JP3669660B2 (en) 1997-01-17 1997-01-17 Call system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00691297A JP3669660B2 (en) 1997-01-17 1997-01-17 Call system

Publications (2)

Publication Number Publication Date
JPH10210074A JPH10210074A (en) 1998-08-07
JP3669660B2 true JP3669660B2 (en) 2005-07-13

Family

ID=11651459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00691297A Expired - Fee Related JP3669660B2 (en) 1997-01-17 1997-01-17 Call system

Country Status (1)

Country Link
JP (1) JP3669660B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100342157B1 (en) * 2000-02-29 2002-07-02 박명흠 sound transmission system using UDP protocol for PC-to-Phone method
DE102007018484B4 (en) * 2007-03-20 2009-06-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for transmitting a sequence of data packets and decoder and apparatus for decoding a sequence of data packets

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61156949A (en) * 1984-12-27 1986-07-16 Matsushita Electric Ind Co Ltd Packetized voice communication system
JPS6384227A (en) * 1986-09-29 1988-04-14 Nec Corp Congenstion control system for packet network
JPH02262742A (en) * 1989-04-03 1990-10-25 Oki Electric Ind Co Ltd System and device for voice packet communication

Also Published As

Publication number Publication date
JPH10210074A (en) 1998-08-07

Similar Documents

Publication Publication Date Title
US6658027B1 (en) Jitter buffer management
JP4426454B2 (en) Delay trade-off between communication links
US20060187970A1 (en) Method and apparatus for handling network jitter in a Voice-over IP communications network using a virtual jitter buffer and time scale modification
US7773511B2 (en) Generic on-chip homing and resident, real-time bit exact tests
US6977942B2 (en) Method and a device for timing the processing of data packets
US7477682B2 (en) Echo cancellation for a packet voice system
US8174981B2 (en) Late frame recovery method
US7450601B2 (en) Method and communication apparatus for controlling a jitter buffer
CN101523822B (en) Voice transmission apparatus
JP2002077233A (en) Real-time information receiving apparatus
US20100104049A1 (en) Dual-rate single band communication system
JP2002058002A (en) Video telephone device
US6876627B1 (en) Raincheck on voice over packet network calling
JP2012532529A (en) Mitigating quality of service parameters for non-conversational voice calls over packet-switched networks.
JP3669660B2 (en) Call system
US7542465B2 (en) Optimization of decoder instance memory consumed by the jitter control module
JP4400571B2 (en) Coding data processing method and gateway device in connection between different types of communication networks
JPH10190735A (en) Communication system
JP4117301B2 (en) Audio data interpolation apparatus and audio data interpolation method
US6947412B2 (en) Method of facilitating the playback of speech signals transmitted at the beginning of a telephone call established over a packet exchange network, and hardware for implementing the method
JPH10164129A (en) Calling system
JP4684247B2 (en) Voice communication method and voice communication apparatus
JP2000151716A (en) Gateway
JPH09200213A (en) Audio information transmission system
JPH04356832A (en) High efficiency digital multiplexing transmission system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041005

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041202

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20050126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20050126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050411

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080422

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100422

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100422

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110422

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120422

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120422

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130422

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130422

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140422

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees