JP2004356898A - 音声パケット送信装置とその方法並びに音声パケット受信装置及び音声パケット通信システム - Google Patents

音声パケット送信装置とその方法並びに音声パケット受信装置及び音声パケット通信システム Download PDF

Info

Publication number
JP2004356898A
JP2004356898A JP2003151462A JP2003151462A JP2004356898A JP 2004356898 A JP2004356898 A JP 2004356898A JP 2003151462 A JP2003151462 A JP 2003151462A JP 2003151462 A JP2003151462 A JP 2003151462A JP 2004356898 A JP2004356898 A JP 2004356898A
Authority
JP
Japan
Prior art keywords
packet
voice
frame
data frame
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003151462A
Other languages
English (en)
Other versions
JP4364555B2 (ja
JP2004356898A5 (ja
Inventor
Noboru Harada
登 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003151462A priority Critical patent/JP4364555B2/ja
Publication of JP2004356898A publication Critical patent/JP2004356898A/ja
Publication of JP2004356898A5 publication Critical patent/JP2004356898A5/ja
Application granted granted Critical
Publication of JP4364555B2 publication Critical patent/JP4364555B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】有音状態と無音状態との境界における音声再生品質の向上を図った音声パケット送信装置とその方法並びに音声パケット受信装置及び音声パケット通信システムを提供する。
【解決手段】入力した音声信号4のレベルが所定の閾値レベルSth以下の無音から閾値レベルSthよりも大きい有音になったときに有音となる前の無音の音声データフレームの音声データのレベルを徐々に増加させた音声データに変換した音声データフレームを生成すると共に、有音から無音になったときに有音の後の無音の音声データフレームの音声データのレベルを徐々に減少させた音声データに変換した音声データフレームを生成してパケット化する。これにより、フェードイン・フェードアウト処理が施され音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
本発明は、有音状態と無音状態との境界における音声再生品質の向上、送信機能ボタン利用時の音声送信状態と、音声送信休止状態の境界における音声再生品質の向上を図った音声パケット送信装置とその方法並びに音声パケット受信装置及び音声パケット通信システムに関するものである。
【0002】
【従来の技術】
従来、電子機器のディジタル化に伴い、情報通信においては転送対象となる情報をパケット化して転送することが一般的に行われている。例えば、音声信号を転送する場合には、送信側では、所定のサンプリング周波数にてサンプリングした音声データを所定量ずつ別個のパケットに分散して収納し、パケット単位で転送を行っている。受信側においては、受信したパケットから音声データを取りだし、取り出した音声データを繋ぎ合わせて再生する。
【0003】
即ち、上記のようなパケット通信を行う電子機器では、送信側においては1パケット分のデータが得られた段階でパケットを形成して送信する処理を行い、受信側では受け取ったパケットに収納されているデータの再生に要する時間毎にパケット内のデータを読み出す処理を行っている。これにより、受信側では、例えば音声データのリアルタイム転送の場合、分割して受け取った複数のパケットから連続した音声を再生することができる。
【0004】
このとき、送信する音声データのデータ通信量を削減するために、送信側で、サンプリングして得られた音声データのうち、無音と判定された部分の送信を実際には行わない無音圧縮の技術が利用されている。
【0005】
同様に、無音を自動で判定する変わりに、明示的にユーザの発話意志を機能ボタン等を用いて取得し、発話機能ボタンが押下されている間だけ、音声データを送信し、発話機能ボタンが押下されていない間は、音声データの送信を行わないようにしてデータ通信量を削減する技術が利用されている。
【0006】
この様なパケット通信は、ほとんどの場合コンピュータ装置を使用して行っており、例えば、無線通信を利用した携帯型電話機やインターネット等の通信網を利用した周知のIP電話、配信サーバから音楽などのコンテンツをユーザ端末装置に配信するシステム、及び遠隔会議システムなどに用いられている。
【0007】
【特許文献1】
特開2000−83050号公報
【非特許文献1】
ITU−T Recommendation G.729 Annex B
【0008】
【発明が解決しようとする課題】
しかしながら、前述したようなパケットを用いた音声データの転送においては、有音状態から無音状態に遷移する部分で波形が不連続となるため、この遷移部分で異音が生じ、音声品質が劣化することがある。この様な音声品質の劣化を低減するために、送信側において無音と判定された部分の背景音に関する情報を送信し、受信側で受け取った有音部分の情報と背景音に関する情報から、無音部分の背景音を生成するCNGという技術が知られているが、送信側、受信側で行うには演算処理負荷が高くなるという問題がある。
【0009】
また、有音状態から無音状態に遷移したと同時に受信側で周知のパケット消失補償処理(PLC:Pauqtte Loss Concealment)を行う場合には、パケットが消失して無いのか或いは無音状態のためにパケットが無いのかを判別できないため、送信側が無音と判断して送信を打ち切った場合にも、受信側でパケット消失補償処理が適用され、受け取った最後のパケットから擬似音声を生成してしまうという問題がある。
【0010】
尚、パケット消失補償処理の一例としてはG.711Appendix1等が知られている。
【0011】
また、無音圧縮を行っている場合に、有音状態から無音状態への遷移部分では、判定にヒステリシス特性を用いて話尾が切れないように安全側に調整することが可能であるが、無音状態から有音状態への復帰時に話頭が消失してしまうという問題がある。このような話頭切れに対して安全余裕を設けるためには、常に先読みをして遅延を許容しておく必要があり、現時点ではほとんどのシステムにおいて実現されていない。
【0012】
本発明の目的は上記の問題点に鑑み、有音状態と無音状態との境界における音声再生品質の向上を図った音声パケット送信装置とその方法並びに音声パケット受信装置及び音声パケット通信システムを提供することである。
【0013】
【課題を解決するための手段】
本発明は上記の目的を達成するために、連続して入力した音声に基づく音声データを所定時間間隔で切り取った音声データフレームを生成する音声データフレーム生成手段を備え、該生成した音声データフレームを含んだパケットを生成し、該パケットを通信網を介して送信する音声パケット送信装置において、前記入力した音声が無音であるか否かを判定する無音判定手段と、前記無音判定手段によって入力された音声データフレームが無音と判定された状態が一定時間以上連続する場合にパケットの送信を停止する手段と、送信を停止するにあたって、送信する最後の音声データフレームの音声レベルを、先頭サンプルから末尾サンプルに向けて徐々に減少させた音声データに変換し、該変換された音声データフレームを最終パケットとして送信する手段を備えた音声パケット送信装置を提案する。
【0014】
本発明の音声パケット送信装置によれば、入力された音声データフレームが無音と判定された状態が一定時間以上連続するとパケットの送信が停止される。このとき、送信する最後の音声データフレームの音声レベルは先頭サンプルから末尾サンプルに向けて徐々に減少され、最後に送信される音声データフレームにはフェードアウト処理が施される。
【0015】
これにより、有音状態から無音状態になって最後に送信される音声データ部分すなわち話尾部分の音声レベルが徐々に減少されるフェードアウト処理が施されるため、受信側において有音状態から無音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【0016】
また、本発明は上記の音声パケット送信装置において、前記無音判定手段によって入力された音声データフレームが無音と判定された状態が一定時間以上連続する場合にパケットの送信を停止する手段と、送信を停止するにあたって、無音状態になったと判定された後に入力された音声フレームを少なくとも1つ以上送信する手段と、送信する最後の音声データフレームの音声レベルを、先頭サンプルから末尾サンプルに向かって徐々に減少させた音声データに変換し、該変換された音声データフレームを最終パケットとして送信する手段を備えた音声パケット送信装置を提案する。
【0017】
本発明の音声パケット送信装置によれば、入力された音声データフレームが無音と判定された状態が一定時間以上連続するとパケットの送信が停止される。このとき、無音状態になったと判定された後に入力された音声フレームのうちの1つ以上の音声フレームが送信されると共に、最後に送信される音声データフレームにはその音声レベルが先頭サンプルから末尾サンプルに向かって徐々に減少されるフェードアウト処理が施される。
【0018】
これにより、有音状態から無音状態になったと判定されてから1つ以上の音声データフレームが送信されるので、話尾部分が突然切れることがなくなると共に音声レベルが徐々に減少されるフェードアウト処理が施されるため、受信側において有音状態から無音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【0019】
また、本発明は上記の音声パケット送信装置において、前記音声レベルを先頭サンプルから末尾サンプルに向けて徐々に減少させた音声データフレームを含むパケットを送信した後に、さらに1つの無音音声データフレームを生成し、該無音音声データフレームを含むパケットを送信する手段を備えた音声パケット送信装置を提案する。
【0020】
本発明の音声パケット送信装置によれば、音声レベルが先頭サンプルから末尾サンプルに向けて徐々に減少された音声データフレームを含むパケットを送信した後に、さらに1つの無音音声データフレームを含むパケットが送信されるので、有音状態から無音状態になり、送信が停止されたことを受信側において確実に認識することができる。
【0021】
また、本発明は上記の音声パケット送信装置において、前記入力した音声が有音であるか否かを判定する有音判定手段と、前記入力された音声データフレームが無音であると判定された状態が一定時間以上連続し、パケットの送信を停止している状態で、前記入力された音声データフレームが前記有音判定手段で有音状態であると判定されたときに、パケットの送信を再開する手段と、パケットの送信を再開するにあたって、送信する最初の音声データフレームを、末尾サンプルから先頭サンプルに向かって音声レベルを徐々に減少させた音声データに変換し、有音状態の先頭として該変換された音声データフレームを含むパケットを送信する手段を備えた音声パケット送信装置を提案する。
【0022】
本発明の音声パケット送信装置によれば、入力された音声データフレームが無音であると判定された状態が一定時間以上連続してパケットの送信が停止されている状態で、入力された音声データが有音状態に変わったときに、パケットの送信が再開される。また、このとき、パケットの送信を再開するにあたって、送信する最初の音声データフレームは、先頭サンプルから末尾サンプルに向かって音声レベルが徐々に増加させた音声データに変換され、有音状態の先頭として該変換された音声データフレームを含むパケットが送信される。
【0023】
これにより、無音状態から有音状態になる音声データ部分すなわち話頭部分の音声レベルが徐々に増大されるフェードイン処理が施されるため、受信側において無音状態から有音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることが無く、音声品質の劣化が低減される。
【0024】
また、本発明は上記の音声パケット送信装置において、前記パケットの送信を再開するにあたって、有音と判定された音声データフレームの少なくとも1つ前の無音データフレームを、末尾から先頭に向かって音声レベルを徐々に減少させた音声データに変換し、有音状態の先頭として該変換された音声データフレームを含むパケットを送信し、次に前記有音状態であると判定された音声データフレームを送信する手段を備えた音声パケット送信装置を提案する。
【0025】
本発明の音声パケット送信装置によれば、無音状態の後に、入力した音声レベルが有音状態になったときに、有音状態であると判定された音声データフレームの少なくとも1つ前の音声データフレームが有音状態であるとされ、該音声データフレームを含むパケットから送信が開始される。これにより、無音状態から有音状態への復帰時に話頭が消失してしまうことがなくなる。さらに、話頭部分の音声レベルが徐々に増大されるフェードイン処理が施されるため、受信側において無音状態から有音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることが無く、音声品質の劣化が低減される。
【0026】
また、本発明は上記の音声パケット送信装置において、前記入力された音声データフレームを保持する手段と、前記パケットの送信を再開するにあたって、有音と判定された音声データフレームの少なくとも1つ前の無音データフレームを再分析フレームとして、有音と判定された音声フレームの情報と前記再分析フレームまでの無音と判定された音声データフレームの情報とを用いて再分析する手段と、前記再分析の結果、前記再分析フレームが有音に近いと判定された場合には、前記再分析フレームの1つ前の音声データフレームを、末尾から先頭に向かって音声レベルを徐々に減少させた音声データに変換し、有音状態の先頭として該変換された音声データフレームを含むパケットを送信し、次に前記有音状態であると判定された音声データフレームと前記再分析フレームの1つ前のフレームとの間の無音データフレームを送信し、次に前記有音状態であると判定された音声データフレームを送信する手段と、前記再分析の結果、前記再分析フレームが無音に近いと判定された場合には、該再分析フレームを、末尾から先頭に向かって音声レベルを徐々に減少させた音声データに変換し、有音状態の先頭として該変換された音声データフレームを含むパケットを送信し、次に前記有音であると判定された音声データフレームを送信する手段とを備えた音声パケット送信装置を提案する。
【0027】
本発明の音声パケット送信装置によれば、無音状態から有音状態に変化してパケットの送信が再開されるとき、有音と判定された音声データフレームの少なくとも1つ前の無音データフレームが再分析フレームとされ、有音と判定された音声フレームの情報と再分析フレームまでの無音と判定された音声データフレームの情報とを用いて再分析される。この再分析の結果、前記再分析フレームが有音に近いと判定された場合には、前記再分析フレームの1つ前の音声データフレームが、末尾から先頭に向かって音声レベルを徐々に減少させたフェードイン処理が施された音声データに変換される。さらに、このフェードイン処理が施された音声データフレームが有音状態の先頭とされて、該音声データフレームを含むパケットが送信される。この後、前記有音状態であると判定された音声データフレームまでの無音データフレームを含むパケットが送信され、次に前記有音状態であると判定された音声データフレームを含むパケットが送信される。
【0028】
また、前記再分析の結果、前記再分析フレームが無音に近いと判定された場合には、該無音データフレームが、末尾から先頭に向かって音声レベルを徐々に減少させた音声データに変換され、有音状態の先頭として該変換された音声データフレームを含むパケットが送信された後に、前記有音であると判定された音声データフレームが送信される。
【0029】
また、本発明は上記の音声パケット送信装置において、前記パケットの送信を再開するにあたって、有音と判定された音声データフレームの少なくとも1つ前のフレームを、有音状態の先頭として送信した場合に、余分に送信した無音フレームによって増加した遅延に相当するサンプル数だけ後続のサンプルを短縮する手段を有する音声パケット送信装置を提案する。
【0030】
本発明の音声パケット送信装置によれば、パケットの送信を再開するにあたって、有音と判定された音声データフレームの少なくとも1つ前のフレームから有音状態として送信した場合に、余分に送信した無音フレームによって増加した遅延に相当するサンプル数だけ後続のサンプルが短縮される。これにより、遅延量が調整され、リアルタイムのデータ送信が保持される。
【0031】
また、本発明は上記の音声パケット送信装置において、前記無音判定手段は、入力された音声フレームの音声レベルが所定の閾値レベル以下であるときに無音状態であると判定する手段を備えた音声パケット送信装置を提案する。
【0032】
本発明の音声パケット送信装置によれば、無音判定手段によって、入力された音声フレームの音声レベルが所定の閾値レベル以下であるときに無音状態であると判定される。
【0033】
また、本発明は上記の音声パケット送信装置において、前記有音判定手段は、入力された音声フレームの音声レベルが所定の閾値レベル以上であるときに有音状態であると判定する手段を備えた音声パケット送信装置を提案する。
【0034】
本発明の音声パケット送信装置によれば、有音判定手段によって、入力された音声フレームの音声レベルが所定の閾値レベル以上であるときに有音状態であると判定される。
【0035】
また、本発明は上記の音声パケット送信装置において、無音状態でパケット送信停止状態となっていて、有音により発話開始状態としてパケットを送信するに際して、送信する最初の音声フレームを符号化する場合に、音声符号化器の内部状態を初期化した後に音声フレームを符号化処理する手段と、最初のフレームをパケット化して送信するにあたって、パケット内に無音から復帰した最初のフレームであることを表す情報を含めて送信する手段とを有する音声パケット送信装置を提案する。
【0036】
本発明の音声パケット送信装置によれば、送信休止状態から送信状態に移る際に音声符号化器の内部状態が初期化されてから音声データフレームが符号化処理される。これにより、送信休止前の符号化処理に用いられたデータ等の内部状態が初期化されるので、最適な符号化処理を行うことができる。さらに、送信休止状態から送信状態に移り、最初のフレームをパケット化して送信するにあたって、パケット内に無音から復帰した最初のフレームであることを表す情報を含めて送信されるため、該情報を受信側において参照することにより、最適な復号化処理を行うことができる。
【0037】
また、本発明は上記の音声パケット送信装置において、前記符号化処理手段は、当該フレームを符号化処理するにあたって、符号化器の内部状態を初期化せずに前のフレームに続けて当該フレームを符号化した場合の符号化誤差と、符号化器の内部状態を初期化した後に当該フレームを符号化した場合の符号化誤差とを比較し、誤差の少ない方の符号化結果を送信する手段と、内部状態をリセットした後に当該フレームを符号化した結果を選択した場合には、無音から復帰した最初のフレームであるという情報を送信パケット内に含めて送信する手段とを有する音声パケット送信装置を提案する。
【0038】
本発明の音声パケット送信装置によれば、前記符号化誤差が小さい方の符号化音声データフレームが用いられて、該符号化音声データフレームを含むパケットが送信される。さらに、符号化器の内部状態がリセットされた状態で符号化された符号化音声データフレームが用いられるときには、無音から復帰した最初のフレームであることを表す情報がパケットに含められて送信されるので、受信側において的確な復号化処理を行うことができる。
【0039】
また、本発明は上記の目的を達成するために、連続して入力した音声に基づく音声データを所定時間間隔で切り取った音声データフレームを生成する音声データフレーム生成手段と、ユーザの発話の意志を取得する発話機能ボタンとを供え、該生成した音声データフレームを含んだパケットを生成し、該発話機能ボタンが押されている間だけ音声データフレームを含んだパケットを、通信網を介して送信する音声パケット送信装置において、前記発話機能ボタンが押されている状態か否かを判定する発話機能ボタン押下判定手段と、前記発話機能ボタン押下判定手段によって発話機能ボタンが押されている状態から、押されていない発話休止状態になったと判定された場合にパケットの送信を停止する手段と、送信を停止するにあたって、送信する最後の音声データフレームの音声レベルを、先頭サンプルから末尾サンプルに向かって徐々に減少させた音声データに変換し、該変換された音声データフレームを最終パケットとして送信する手段とを備えた音声パケット送信装置を提案する。
【0040】
本発明の音声パケット送信装置によれば、発話機能ボタンが押されている状態から発話機能ボタンが押されていない発話休止状態になるとパケットの送信が停止される。このとき、送信する最後の音声データフレームの音声レベルは先頭サンプルから末尾サンプルに向けて徐々に減少され、最後に送信される音声データフレームにはフェードアウト処理が施される。
【0041】
これにより、有音状態から無音状態になって最後に送信される音声データ部分すなわち話尾部分の音声レベルが徐々に減少されるフェードアウト処理が施されるため、受信側において有音状態から無音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【0042】
また、本発明は上記の音声パケット送信装置において、前記発話機能ボタン押下判定手段によって発話機能ボタンが押されている状態から押されていない発話休止状態になったと判定された場合にパケットの送信を停止する手段と、送信を停止するにあたって、発話休止状態になったと判定された後に入力された音声フレームを少なくとも1つ以上送信する手段と、送信する最後の音声データフレームの音声レベルを、先頭サンプルから末尾サンプルに向かって徐々に減少させた音声データに変換し、該変換された音声データフレームを最終パケットとして送信する手段とを備えた音声パケット送信装置を提案する。
【0043】
本発明の音声パケット送信装置によれば、発話機能ボタンが押されている状態から押されていない発話休止状態になるとパケットの送信が停止される。このとき、発話機能ボタンが押されていない状態になったと判定された後に入力された音声フレームのうちの1つ以上の音声フレームが送信されると共に、最後に送信される音声データフレームにはその音声レベルが先頭サンプルから末尾サンプルに向かって徐々に減少されるフェードアウト処理が施される。
【0044】
これにより、発話機能ボタンが押されていない状態になったと判定されてから1つ以上の音声データフレームが送信されるので、話尾部分が突然切れることがなくなると共に音声レベルが徐々に減少されるフェードアウト処理が施されるため、受信側において有音状態から無音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【0045】
また、本発明は上記の音声パケット送信装置において、前記音声レベルを先頭サンプルから末尾サンプルに向けて徐々に減少させた音声データフレームを含むパケットを送信した後に、さらに1つの無音音声データフレームを生成し、該無音音声データフレームを含むパケットを送信する手段を備えた音声パケット送信装置を提案する。
【0046】
本発明の音声パケット送信装置によれば、音声レベルが先頭サンプルから末尾サンプルに向けて徐々に減少された音声データフレームを含むパケットを送信した後に、さらに1つの無音音声データフレームを含むパケットが送信されるので、有音状態から無音状態になり、送信が停止されたことを受信側において確実に認識することができる。
【0047】
また、本発明は上記の音声パケット送信装置において、前記発話機能ボタン押下判定手段によって発話機能ボタンが押されていない状態から押されている状態になったと判定された場合に、発話開始状態として、前記停止していたパケットの送信を再開する手段と、パケットの送信を再開するにあたって、送信する最初の音声データフレームを、末尾サンプルから先頭サンプルに向かって音声レベルを徐々に減少させた音声データに変換し、発話状態の先頭として該変換された音声データフレームを含むパケットを送信する手段とを備えた音声パケット送信装置を提案する。
【0048】
本発明の音声パケット送信装置によれば、発話機能ボタンが押されずにパケットの送信が停止されている状態で、発話機能ボタンが押された状態に変わったときに、パケットの送信が再開される。また、このとき、パケットの送信を再開するにあたって、送信する最初の音声データフレームは、先頭サンプルから末尾サンプルに向かって音声レベルが徐々に増加させた音声データに変換され、有音状態の先頭として該変換された音声データフレームを含むパケットが送信される。
【0049】
これにより、発話機能ボタンが押されていない状態から押された状態になったときの音声データ部分すなわち話頭部分の音声レベルが徐々に増大されるフェードイン処理が施されるため、受信側において無音状態から有音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることが無く、音声品質の劣化が低減される。
【0050】
また、本発明は上記の音声パケット送信装置において、前記発話機能ボタン押下判定手段によって発話機能ボタンが押されていない状態から押されている状態になったと判定された場合に、発話開始状態として、前記停止していたパケットの送信を再開する手段と、パケットの送信を再開するにあたって、発話機能ボタンが押された状態になった後に入力された最初の音声データフレームより前の音声データフレームを少なくとも1つ以上送信し、次に前記発話機能ボタンが押された状態になった後に入力された最初の音声データフレームを送信する手段とを備えた音声パケット送信装置を提案する。
【0051】
本発明の音声パケット送信装置によれば、発話機能ボタンが押されていない状態から押されている状態になり、停止していたパケットの送信が再開されるとき、発話機能ボタンが押された状態になった後に入力された最初の音声データフレームより前の音声データフレームが少なくとも1つ以上送信され、次に前記発話機能ボタンが押された状態になった後に入力された最初の音声データフレームが送信される。これにより、話頭切れが防止される。
【0052】
また、本発明は上記の音声パケット送信装置において、前記発話開始状態になった場合にパケットの送信を再開するにあたって、発話開始状態と判定された音声データフレームの少なくとも1つ前のフレームを、送信フレームの先頭として送信した場合に、余分に送信した音声データフレームによって増加した遅延に相当するサンプル数だけ後続のサンプルを短縮する手段を有する音声パケット送信装置を提案する。
【0053】
本発明の音声パケット送信装置によれば、パケットの送信を再開するにあたって、発話開始状態と判定された音声データフレームの少なくとも1つ前のフレームから送信した場合に、余分に送信した音声データフレームによって増加した遅延に相当するサンプル数だけ後続のサンプルが短縮される。これにより、遅延量が調整され、リアルタイムのデータ送信が保持される。
【0054】
また、本発明は上記の音声パケット送信装置において、発話機能ボタンを押下されない状態で、パケット送信停止状態となっていて、発話機能ボタン押下により発話開始状態としてパケットを送信するに際して、送信する最初の音声フレームを符号化する場合に、音声符号化器の内部状態を初期化した後に音声フレームを符号化処理する手段と、最初のフレームをパケット化して送信するにあたって、パケット内に無音から復帰した最初のフレームであることを表す情報を含めて送信する手段とを有する音声パケット送信装置を提案する。
【0055】
本発明の音声パケット送信装置によれば、送信停止状態から送信状態に移る際に音声符号化器の内部状態が初期化されてから音声データフレームが符号化処理される。これにより、送信停止前の符号化処理に用いられたデータ等の内部状態が初期化されるので、最適な符号化処理を行うことができる。
【0056】
さらに、送信停止状態から送信状態に移り、最初のフレームをパケット化して送信するにあたって、パケット内に無音から復帰した最初のフレームであることを表す情報を含めて送信されるため、該情報を受信側において参照することにより、最適な復号化処理を行うことができる。
【0057】
また、本発明は上記の音声パケット送信装置において、前記符号化処理手段は、当該フレームを符号化処理するにあたって、符号化器の内部状態を初期化せずに前のフレームに続けて当該フレームを符号化した場合の符号化誤差と、符号化器の内部状態を初期化した後に当該フレームを符号化した場合の符号化誤差とを比較し、誤差の少ない方の符号化結果を送信する手段と、内部状態をリセットした後に当該フレームを符号化した結果を選択した場合には、無音から復帰した最初のフレームであるという情報を送信パケット内に含めて送信する手段とを有する音声パケット送信装置を提案する。
【0058】
本発明の音声パケット送信装置によれば、前記符号化誤差が小さい方の符号化音声データフレームが用いられて、該符号化音声データフレームを含むパケットが送信される。さらに、符号化器の内部状態がリセットされた状態で符号化された符号化音声データフレームが用いられるときには、無音から復帰した最初のフレームであることを表す情報がパケットに含められて送信されるので、受信側において的確な復号化処理を行うことができる。
【0059】
また、本発明は上記の目的を達成するために、音声入力手段によって入力した音声を音声データに変換する手段を有するコンピュータ装置を用いて、連続して入力した音声に基づく音声データを所定時間間隔で切り取った音声データフレームを生成すると共に該音声データフレームを含んだパケットを生成し、該パケットを通信網を介して送信する音声パケット送信方法において、前記コンピュータ装置は、前記入力した音声が無音であるか否かを判定し、前記入力された音声データフレームが無音と判定された状態が一定時間以上連続する場合にパケットの送信を停止し、送信を停止するにあたって、送信する最後の音声データフレームの音声レベルを、先頭サンプルから末尾サンプルに向けて徐々に減少させた音声データに変換し、前記変換した音声データフレームを最終パケットとして送信する音声パケット送信方法を提案する。
【0060】
本発明の音声パケット送信方法によれば、入力された音声データフレームが無音と判定された状態が一定時間以上連続するとパケットの送信が停止される。このとき、送信する最後の音声データフレームの音声レベルは先頭サンプルから末尾サンプルに向けて徐々に減少され、最後に送信される音声データフレームにはフェードアウト処理が施される。
【0061】
これにより、有音状態から無音状態になって最後に送信される音声データ部分すなわち話尾部分の音声レベルが徐々に減少されるフェードアウト処理が施されるため、受信側において有音状態から無音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【0062】
また、本発明は上記の音声パケット送信方法において、前記コンピュータ装置は、前記入力された音声データフレームが無音であると判定された状態が一定時間以上連続し、パケットの送信を停止している状態で、前記入力された音声データフレームが前記有音判定手段で有音状態であると判定されたときに、パケットの送信を再開し、パケットの送信を再開するにあたって、送信する最初の音声データフレームを、末尾サンプルから先頭サンプルに向かって音声レベルを徐々に減少させた音声データに変換し、有音状態の先頭として前記変換した音声データフレームを含むパケットを送信する音声パケット送信方法を提案する。
【0063】
本発明の音声パケット送信方法置によれば、入力された音声データフレームが無音と判定された状態が一定時間以上連続するとパケットの送信が停止される。このとき、無音状態になったと判定された後に入力された音声フレームのうちの1つ以上の音声フレームが送信されると共に、最後に送信される音声データフレームにはその音声レベルが先頭サンプルから末尾サンプルに向かって徐々に減少されるフェードアウト処理が施される。
【0064】
これにより、有音状態から無音状態になったと判定されてから1つ以上の音声データフレームが送信されるので、話尾部分が突然切れることがなくなると共に音声レベルが徐々に減少されるフェードアウト処理が施されるため、受信側において有音状態から無音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【0065】
また、本発明は上記の目的を達成するために、音声入力手段によって入力した音声を音声データに変換する手段を有するコンピュータ装置を用いて、連続して入力した音声に基づく音声データを所定時間間隔で切り取った音声データフレームを生成すると共に、該生成した音声データフレームを含んだパケットを生成し、ユーザの発話の意志を取得する発話機能ボタンが押されている間だけ音声データフレームを含んだパケットを、通信網を介して送信する音声パケット送信方法において、前記コンピュータ装置は、前記発話機能ボタンが押されている状態か否かを判定し、前記発話機能ボタンが押されている状態から、押されていない発話休止状態になったと判定された場合にパケットの送信を停止し、送信を停止するにあたって、送信する最後の音声データフレームの音声レベルを、先頭サンプルから末尾サンプルに向かって徐々に減少させた音声データに変換し、前記変換した音声データフレームを最終パケットとして送信する音声パケット送信方法を提案する。
【0066】
本発明の音声パケット送信方法によれば、発話機能ボタンが押されている状態から発話機能ボタンが押されていない発話休止状態になるとパケットの送信が停止される。このとき、送信する最後の音声データフレームの音声レベルは先頭サンプルから末尾サンプルに向けて徐々に減少され、最後に送信される音声データフレームにはフェードアウト処理が施される。
【0067】
これにより、有音状態から無音状態になって最後に送信される音声データ部分すなわち話尾部分の音声レベルが徐々に減少されるフェードアウト処理が施されるため、受信側において有音状態から無音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【0068】
また、本発明は上記の音声パケット送信方法において、前記コンピュータ装置は、前記発話機能ボタンが押されていない状態から押されている状態になったと判定された場合に、発話開始状態として、前記停止していたパケットの送信を再開し、パケットの送信を再開するにあたって、送信する最初の音声データフレームを、末尾サンプルから先頭サンプルに向かって音声レベルを徐々に減少させた音声データに変換し、発話状態の先頭として前記変換した音声データフレームを含むパケットを送信する音声パケット送信方法を提案する。
【0069】
本発明の音声パケット送信方法によれば、発話機能ボタンが押されずにパケットの送信が停止されている状態で、発話機能ボタンが押された状態に変わったときに、パケットの送信が再開される。また、このとき、パケットの送信を再開するにあたって、送信する最初の音声データフレームは、先頭サンプルから末尾サンプルに向かって音声レベルが徐々に増加させた音声データに変換され、有音状態の先頭として該変換された音声データフレームを含むパケットが送信される。
【0070】
これにより、発話機能ボタンが押されていない状態から押された状態になったときの音声データ部分すなわち話頭部分の音声レベルが徐々に増大されるフェードイン処理が施されるため、受信側において無音状態から有音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることが無く、音声品質の劣化が低減される。
【0071】
また、本発明は上記の目的を達成するために、受信したパケット内に無音から復帰した最初のフレームであることを表す情報が含まれていた場合に、音声復号化器の内部状態を初期化した後に、フレームの復号処理を行う手段を有する音声パケット受信装置を提案する。
【0072】
本発明の音声パケット受信装置によれば、上記のような音声パケット送信装置から受信したパケットに無音から復帰した最初のフレームであることを意味する情報が含まれているときは、該パケットの音声データフレームから音声再生が開始される。
【0073】
また、本発明は上記の目的を達成するために、音声パケットを生成して該音声パケットを送信する音声パケット送信装置と、前記送信された音声パケットを通信網を介して受信する音声パケット受信装置とからなる音声パケット通信システムにおいて、上記音声パケット送信装置と、上記音声パケット受信装置とからなる音声パケット通信システムを提案する。
【0074】
本発明の音声パケット通信システムによれば、上記のような非常に単純な方法を用いて無音状態と有音状態との間の遷移部分における音声再生品質の向上を図ることができると同時に、受信装置側で非同期にパケット消失補償を行う場合にも影響を与えない。
【0075】
【発明の実施の形態】
以下、図面に基づいて本発明の一実施形態を説明する。
【0076】
図1は本発明の第1実施形態における音声パケット通信システムの機能構成を示すブロック図、図2は本発明の第1実施形態における音声パケット送信装置による音声信号のパケット化を説明する図、図3は本発明の第1実施形態において用いているリアルタイム転送プロトコル(以下、RTPと称する)ヘッダを説明する図である。図において1は音声パケット送信装置(以下、単に送信装置と称する)、2は音声パケット受信装置(以下、単に受信装置と称する)、3はインターネット等の通信網である。本実施形態では、一例として、通信網3を介して送信装置1からUDP/IPを用いて音声パケットをリアルタイムで受信装置2に転送するシステムに関して説明する。
【0077】
送信装置1は、周知のコンピュータ装置から構成され、予め設定されているプログラムよって動作し、音声入力部11と、アナログ/ディジタル(A/D)変換部12、有音無音判定部13、スイッチ部14、フェードイン・フェードアウト処理部15、符号化処理部16、パケット生成部17、送信部18とから構成されている。これらの送信装置1を構成する各部分は、ハードウェア及びソフトウェアの両方によって構成されている。
【0078】
受信装置2は、周知のコンピュータ装置から構成され、予め設定されているプログラムよって動作し、受信部21と、パケット解析部22、復号化処理部23、ディジタル/アナログ(D/A)変換部24、音声出力部25とから構成されている。これらの受信装置2を構成する各部分は、ハードウェア及びソフトウェアの両方によって構成されている。
【0079】
音声入力部11は音声信号を図2に示すようなアナログ電気信号4に変換してA/D変換部12に出力し、A/D変換部12によって所定のサンプリングタイムでディジタル信号に変換された音声データ(サンプル)が有音無音判定部13に備わるバッファに順次格納される。
【0080】
また、図2に示すように、バッファに格納された音声データは、有音無音判定部13によって、所定周期T毎に切り取られ音声データフレームとして先頭から順に1フレームずつ順送りに有音状態であるか無音状態であるかが判定される。
【0081】
さらに、有音無音判定部13は、上記有音状態であるか無音状態であるかの判定結果に基づいて、無音状態から有音状態に変わったときにフェードイン処理を行うためにスイッチ部14を切り替えることによって出力信号をフェードイン・フェードアウト処理部15に出力すると共に、有音状態から無音状態に変わったときにフェードアウト処理を行うためにスイッチ部14を切り替えることによって出力信号をフェードイン・フェードアウト処理部15に出力する。また、有音状態が続いているときは、有音無音判定部13は、スイッチ部14を切り替えることによって出力信号を符号化処理部16に出力する。このとき、図2に示すように所定のしきい値Sthを越えたときに有音状態と判定される。
【0082】
フェードイン・フェードアウト処理部15は、音声入力が無音状態であって送信休止状態にあるときから、音声入力が有音状態になり、送信を開始するときに、音声データフレームの音声レベルを末尾サンプルから先頭サンプルに向けて徐々に減少させるフェードイン処理と、音声入力が有音状態であって送信状態にあるときから、音声入力が無音状態になり、送信を休止するときに、音声データフレームの音声レベルを先頭サンプルから末尾サンプルに向けて徐々に減少させるフェードアウト処理を行う。
【0083】
符号化処理部16は、有音無音判定部13或いはフェードイン・フェードアウト処理部から入力した符号化対象となる音声データフレームの符号化処理を行うが、符号化処理を行うに際して前のフレームを符号化した結果の内部状態を保持し、過去からの予測を行うことで符号化利得を向上させている。
【0084】
本実施例においては、パケット消失により送信元と受信側での符号化器、復号化器の内部状態不一致による品質劣化を低減するために、無音状態から有音状態に変化した場合に、符号化器の内部状態をリセットし初期値を用いることにより伝送誤りによる品質低下の発生を低減している。
【0085】
さらに、符号化処理16は、分析結果に基づいて符号化対象となる音声データフレームを符号化してパケット生成部17に送出する。
【0086】
これにより生成された音声データフレームは、図2に示すように、無音状態の次の有音状態とされた音声データフレームは音声レベルが徐々に増加されるフェードイン処理が施された音声データ31となる。さらに、有音状態の次に無音状態とされた音声データフレームは音声レベルが徐々に減少されるフェードアウト処理が施された音声データ31となる。
【0087】
パケット生成部17は、符号化処理部16から入力した符号化された音声データを含むRTPパケットを生成して送信部18へ送出する。このときのRTPパケットには図3に示すようなRTPヘッダが付加される。
【0088】
RTPヘッダには、周知のように、2ビットのVersion情報Vと、1ビットのPadding情報P、1ビットのExtension情報X、3ビットのCSRC−Count情報CC、1ビットのMarker情報(以下、マーカービットと称する)M、7ビットのPayload−Type情報PT、16ビットのシーケンス番号(順序番号:Sequence Number)、32ビットのタイムスタンプ(Timestamp)、32ビットの同期信号元(SSRC)識別子、32ビットの寄与送信元(CSRC)識別子等が含まれている。
【0089】
また、本実施形態では、無音状態であってパケット送信を停止していた後に有音状態になって最初に送信するパケットのマーカービットMを「1」に設定し、その他のパケットのマーカービットMを「0」に設定する。
【0090】
送信部18は、パケット生成部17から入力したRTPパケットを通信網3を介して受信装置2に送信する。
【0091】
一方、受信装置2の受信部21は、通信網3を介して送信装置1から送信されたRTPパケットを受信しパケット解析部22に送出する。
【0092】
パケット解析部22は、受信部21から入力したRTPパケットを解析してヘッダ部と符号化された音声データフレームに分離すると共に、ヘッダ部の内容を解析し、RTPタイムスタンプに基づいて、送信された順番に符号化された音声データフレームを復号化処理部23に出力する。さらに、パケット解析部22は、RTPヘッダのマーカービットMの値を復号化処理部23に通知する。
【0093】
復号化処理部23は、パケット解析部22から入力した符号化された音声データフレームを復号してディジタル音声データに変換しこのディジタル音声データをD/A変換部23に出力する。また、復号化処理部23は、復号化を行う際に、符号化された音声データフレームを分析しその分析結果を一時記憶すると共に、データ分析を行う際に、一時記憶されている分析結果或いは分析初期値を参照してデータ分析を行う。ここで、一時記憶されている1フレーム前の分析結果を用いることにより前後のフレーム間の相関を考慮した最適な分析及び復号を行えるようにしている。
【0094】
また、復号化処理部23は、パケット解析部22から入力したマーカービットMの値が「1」であるときに、復号化器の内部状態をリセットして初期化する。この初期化により、復号化対象となる音声データフレームが無音状態にあった後に有音状態の音声データフレームを分析するときは内部状態を初期化して復号処理を行うこととなるので、パケット消失等の伝送誤りが発生した場合にも、送信側の符号化器、受信側の復号化器の内部状態が不一致となる状態から復帰することができ、音声品質の劣化を低減することができる。
【0095】
D/A変換部23は、復号化処理部23によって復号して得られたディジタル音声データを入力してアナログ音声信号に変換して音声出力部24に出力する。
【0096】
音声出力部24は、D/A変換部23から入力したアナログ音声データを音声に変換して出力する。
【0097】
次に、上記構成よりなる音声パケット通信システムの動作に関して、主に送信装置の動作に関する処理フローチャートを図4乃至図6に示して説明する。
【0098】
送信装置1においては、駆動開始直後に初期化処理を行う(SA1)。この初期化処理では、変数である無音判定カウントSilentCountの値を「0」に設定すると共にRTPTimeStampの値を「0」に設定する。
【0099】
次に、送信装置1は、処理を開始すると、音声入力部11を介して入力した音声信号は順次A/D変換部12を介して有音無音判定部13のバッファに格納する(SA2)。
【0100】
次いで、送信装置1は、有音無音判定部13のバッファに格納されている先頭の音声データから順に、判定対象となる音声データフレームのパワーが閾値以下であるか否かすなわち無音状態であるか有音状態であるかを判定し(SA3)、音声データフレームのパワーが閾値よりも大きい有音状態のときは後述する前記SA19の処理に移行する。
【0101】
また、音声データフレームのパワーが閾値以下の無音状態のときは、無音判定カウントSilentCountを「1」増加し(SA4)、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きい送信休止状態であるか否かを判定する(SA5)。
【0102】
この判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きい送信休止状態であるときは後述するSA12の処理に移行し、無音判定カウントSilentCountの値がカウント閾値SilentThres以下のときは、無音判定カウントSilentCountの値がカウント閾値SilentThresに等しいか否かすなわち送信休止状態が開始されたか否かを判定する(SA6)。
【0103】
この判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThresに等しくないときは後述するSA7の処理に移行し、無音判定カウントSilentCountの値がカウント閾値SilentThresに等しいときは現在の音声データフレームをフェードアウト処理する(SA7)。
【0104】
次に、フェードアウト処理した音声データフレームを符号化処理し(SA8)、この符号化処理した音声データフレームとこれに対応するRTPタイムスタンプRTPTimeStampとを含むパケットを生成して、このパケットを送信する(SA9)。
【0105】
この後、RTPタイムスタンプRTPTimeStampをフレーム長分増加する(SA10)。即ち、RTPタイムスタンプRTPTimeStampの値にフレーム長FrameLenの値を加算した値を新たなRTPタイムスタンプRTPTimeStampの値とする。
【0106】
次いで、現在の音声データフレームをバッファに保持して(SA11)、前記SA2の処理に移行する。
【0107】
一方、前記SA5の判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きい送信休止状態であるときは、無音判定カウントSilentCountの値がカウント閾値SilentThres+1に等しく送信休止状態になったばかりであるか否かを判定する(SA12)。
【0108】
この判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThres+1に等しくないときは後述するSA16の処理に移行し、無音判定カウントSilentCountの値がカウント閾値SilentThres+1に等しいときは理想的な無音音声データフレームを生成して(SA13)、この無音音声データフレームを符号化し(SA14)、この符号化した理想的な無音音声データフレームとこれに対応するRTPタイムスタンプRTPTimeStampとを含むパケットを生成して、このパケットを送信する(SA15)。この後、前記SA10の処理に移行する。
【0109】
また、前記SA12の判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThres+1に等しくないときは、遅延カウントDelayCountの値からフレーム長FrameLenの値を減算した値を新たな遅延カウントDelayCountの値とし(SA16)、遅延カウントDelayCountの値が0以下であるか否かを判定する(SA17)。
【0110】
この判定の結果、遅延カウントDelayCountの値が0よりも大きいときは前記SA10の処理に移行し、遅延カウントDelayCountの値が0以下であるときは遅延カウントDelayCountの値を0に設定して(SA18)、前記SA10の処理に移行する。
【0111】
一方、前記SA3の判定の結果、音声データフレームのパワーが閾値よりも大きい有音状態のときは、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きいか否かすなわち1つ前のフレームは送信休止状態であるか否かを判定する(SA19)。
【0112】
この判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThres以下のときは後述するSA27の処理に移行する。また、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きいときは、バッファに保持されている1つ前の音声データフレームをフェードイン処理し(SA20)、さらにこのフェードイン処理した音声データフレームを符号化処理する(SA21)。
【0113】
次に、フェードイン処理した音声データフレームと該音声データフレームに対応するRTPタイムスタンプ(RTPTimeStamp−FrameLen)とを含むパケットを生成して該パケットを送信する(SA22)。このとき、RTPヘッダのマーカービットMを「1」に設定しておく。
【0114】
この後、現在の音声データフレームすなわちフェードイン処理した音声データフレームの次の音声データフレームを符号化処理し(SA23)、該符号化処理した音声データフレームと現在のRTPタイムスタンプRTPTimestampとを含むパケットを生成してこれを送信する(SA24)。
【0115】
次に、遅延増加量カウンタDelayCountの値をフレーム長FrameLenの値分だけ増加させる(SA25)と共に、無音判定カウントSilentCountの値を「0」に初期化する(SA26)。この後、前記SA10の処理に移行する。
【0116】
一方、前記SA19の判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThres以下のときは現在の音声データフレームを符号化処理し(SA27)、この符号化処理した音声データフレームとこれに対応する現在のRTPタイムスタンプRTPTimeStampとを含むパケットを生成してこれを送信する(SA28)。この後、無音判定カウントSilentCountの値を「0」に設定して初期化した後(SA29)、前記SA10の処理に移行する。
【0117】
上記実施形態によれば、無音状態から有音状態に遷移するときに有音状態になる1つ前のフレームをフェードイン処理して得られた音声データフレームを含むパケットを送信するので、無音状態から有音状態への復帰時に話頭が消失してしまうことがなくなる。
【0118】
さらに、送信装置1は、音声レベルが先頭サンプルから末尾サンプルに向けて徐々に減少された音声データフレームを含むパケットを送信した後に、さらに1つの理想的な無音音声データフレームを含むパケットが送信されるので、有音状態から無音状態になり、送信が停止されたことを受信側において確実に認識することができる。
【0119】
また、有音状態から無音状態になったときの音声データフレームすなわち話尾部分の音声レベルが徐々に減少されるフェードアウト処理が施されるため、受信側において有音状態から無音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【0120】
さらに、上記実施形態によれば、有音状態から無音状態になったと判定されてから1つ以上の音声データフレームが送信されるので、話尾部分が突然切れることがなくなると共に音声レベルが徐々に減少されるフェードアウト処理が施されるため、受信側において有音状態から無音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【0121】
また、上記実施形態によれば、送信休止状態から送信状態に移り、最初の音声データフレームをパケット化して送信するときに、RTPヘッダのマーカービットMを「1」に設定することによって、無音から復帰した最初の音声データフレームであることを表しているので、このマーカービットMを受信側において参照し、復号化器の内部状態をリセットすることにより、伝送誤りに対する耐性を向上することができる。
【0122】
尚、上記フェードイン処理及びフェードアウト処理を複数の音声データフレームにまたがって施しても良い。また、複数の無音状態の音声データフレームが連続した後に有音状態の音声データフレームが存在したときに上記フェードイン処理を行うようにしても良い。
【0123】
次に、本発明の第2実施形態を説明する。
【0124】
図7は第2実施形態における音声パケット通信システムの機能構成を示すブロック図である。図において、前述した第1実施形態と同一構成部分は同一符号を持って表しその説明を省略する。
【0125】
また、第2実施形態と第1実施形態との相違点は、第2実施形態では前述した第1実施形態における有音無音判定部13に代えて発話機能ボタン制御情報を入力してこの発話機能ボタン制御情報に基づいて有音無音の判定を行う送信判定処理部19を設けたことである。
【0126】
第2実施形態における送信判定処理部19は、第1実施形態における有音無音判定部13が有する機能に加えて、発話者が発話するときに押下する発話機能ボタン(図示せず)から入力した発話機能ボタン制御情報に基づいて、発話制御ボタンが押下されている(オンされている)ことを認識すると共に、発話制御ボタンが押下された時点から数フレーム過去にさかのぼった音声データフレームから送信を開始する機能を備えている。このときもフェードイン処理を行うことは第1実施形態と同様である。ここで、発話者が発話中であるときは発話機能ボタンは押下され続ける。
【0127】
以下に、第2実施形態における処理の詳細を図8乃至図10のフローチャートを参照して説明する。
【0128】
送信装置1においては、駆動開始直後に初期化処理を行う(SB1)。この初期化処理では、変数である無音判定カウントSilentCountの値を「0」に設定すると共にRTPTimeStampの値を「0」に設定する。
【0129】
次に、送信装置1は、処理を開始すると、音声入力部11を介して入力した音声信号は順次A/D変換部12を介して有音無音判定部13のバッファに格納する(SB2)。
【0130】
次いで、送信装置1は、発話機能ボタンが押下されているか否かを判定し(SB3)、発話機能ボタンが押下中であるときは後述する前記SB19の処理に移行する。
【0131】
また、発話機能ボタンが押下されていないときは、無音判定カウントSilentCountの値を「1」増加し(SB4)、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きい送信休止状態であるか否かを判定する(SB5)。
【0132】
この判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きい送信休止状態であるときは後述するSB12の処理に移行し、無音判定カウントSilentCountの値がカウント閾値SilentThres以下のときは、無音判定カウントSilentCountの値がカウント閾値SilentThresに等しいか否かすなわち送信休止状態が開始されたか否かを判定する(SB6)。
【0133】
この判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThresに等しくないときは後述するSB7の処理に移行し、無音判定カウントSilentCountの値がカウント閾値SilentThresに等しいときは現在の音声データフレームをフェードアウト処理する(SB7)。
【0134】
次に、フェードアウト処理した音声データフレームを符号化処理し(SB8)、この符号化処理した音声データフレームとこれに対応するRTPタイムスタンプRTPTimeStampとを含むパケットを生成して、このパケットを送信する(SB9)。
【0135】
この後、RTPタイムスタンプRTPTimeStampをフレーム長分増加する(SB10)。即ち、RTPタイムスタンプRTPTimeStampの値にフレーム長FrameLenの値を加算した値を新たなRTPタイムスタンプRTPTimeStampの値とする。
【0136】
次いで、現在の音声データフレームをバッファに保持して(SB11)、前記SB2の処理に移行する。
【0137】
一方、前記SB5の判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きい送信休止状態であるときは、無音判定カウントSilentCountの値がカウント閾値SilentThres+1に等しく送信休止状態になったばかりであるか否かを判定する(SB12)。
【0138】
この判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThres+1に等しくないときは後述するSB16の処理に移行し、無音判定カウントSilentCountの値がカウント閾値SilentThres+1に等しいときは理想的な無音音声データフレームを生成して(SB13)、この無音音声データフレームを符号化し(SB14)、この符号化した理想的な無音音声データフレームとこれに対応するRTPタイムスタンプRTPTimeStampとを含むパケットを生成して、このパケットを送信する(SB15)。この後、前記SB10の処理に移行する。
【0139】
また、前記SB12の判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThres+1に等しくないときは、遅延カウントDelayCountの値からフレーム長FrameLenの値を減算した値を新たな遅延カウントDelayCountの値とし(SB16)、遅延カウントDelayCountの値が0以下であるか否かを判定する(SB17)。
【0140】
この判定の結果、遅延カウントDelayCountの値が0よりも大きいときは前記SB10の処理に移行し、遅延カウントDelayCountの値が0以下であるときは遅延カウントDelayCountの値を0に設定して(SB18)、前記SB10の処理に移行する。
【0141】
一方、前記SB3の判定の結果、音声データフレームのパワーが閾値よりも大きい有音状態のときは、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きいか否かすなわち1つ前のフレームは送信休止状態であるか否かを判定する(SB19)。
【0142】
この判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThres以下のときは後述するSB22の処理に移行する。また、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きいときは、後述する送信再開処理を実行し(SB20)、無音判定カウントSilentCountの値を「0」に初期化する(SB26)。この後、前記SB10の処理に移行する。
【0143】
一方、前記SB19の判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThres以下のときは現在の音声データフレームを符号化処理し(SB22)、この符号化処理した音声データフレームとこれに対応する現在のRTPタイムスタンプRTPTimeStampとを含むパケットを生成してこれを送信する(SB23)。この後、無音判定カウントSilentCountの値を「0」に設定して初期化した後(SB24)、前記SB10の処理に移行する。
【0144】
(送信再開処理の第1実施例)
図11は第1実施例の送信再開処理における音声信号のパケット化を説明する図、図12は第1実施例の送信再開処理を説明するフローチャートである。
【0145】
第1実施例の送信再開処理では、無音判定カウントSilentCountの値が定数StartFramesの値よりも大きいか否か、すなわち送信停止時間が十分長いか否かを判定し(SC1)、無音判定カウントSilentCountの値が定数StartFramesの値よりも大きいときは送信再開時に時間をさかのぼって送信する音声データフレームの数を設定する(SC2)。このとき、さかのぼる数Nの値を上記定数StartFramesの値に設定する。また、無音判定カウントSilentCountの値が定数StartFramesの値以下のときは数Nの値を無音判定カウントSilentCountの値よりも2だけ小さい数(N = SilentCount − 2)に設定する(SC3)。
【0146】
次に、バッファに保持されているN個前の音声データフレームをフェードイン処理し(SC4)、さらにこのフェードイン処理した音声データフレームを符号化処理する(SC5)。
【0147】
この後、フェードイン処理した音声データフレームとこれに対応するN個前のRTPタイムスタンプ(RTPTimeStamp − FrameLen * N)(ここで、*は乗算を表す)とを含むパケットを生成してこれを送信する(SC6)。このとき、RTPヘッダにおけるマーカービットMを「1」に設定して送信する。
【0148】
次いで、バッファに保持したN−1個前から現在までの音声データフレームを順次符号化処理し、この符号化処理した音声データフレームと、これに対応するRTPタイムスタンプ(RTPTimeStamp − (N−1−i) * FrameLen)とを含むパケットを生成して順次送信する(SC7)。ここで、iは1以上(N−1)以下の整数である。
【0149】
この後、遅延増加量カウンタDelayCountの値をN個のフレーム長分(FrameLen * N)だけ増加させて(DelayCount += FrameLen * N)(SC8)、送信再開処理を終了する。
【0150】
このとき、N個のフレームうち、無音音声データフレームや定常部分を信号処理により間引いたり、DelayCountが正の間だけ将来のフレームについても間引くことによって遅延の増加を抑えるようにすることもできる。その場合には、間引いた分だけDelayCountを減少させる。
【0151】
上記第2実施形態の第1実施例によれば、発話機能ボタンが押下されて発話が開始され、無音状態から有音状態に遷移するときに、発話機能ボタンが押下された瞬間のフレームからN個前のフレームにさかのぼって、フェードイン処理して得られた音声データフレームを含むパケットから送信するので、無音状態から有音状態への復帰時に話頭が消失してしまうことがなくなる。
【0152】
さらに、有音状態から無音状態になったときの音声データフレームすなわち話尾部分の音声レベルが徐々に減少されるフェードアウト処理も第1実施形態と同様に施されるため、受信側において有音状態から無音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【0153】
(送信再開処理の第2実施例)
図13は第2実施例の送信再開処理における音声信号のパケット化を説明する図、図14は第2実施例の送信再開処理を説明するフローチャートである。
【0154】
第2実施例の送信再開処理では、無音判定カウントSilentCountの値が定数StartFramesの値よりも大きいか否か、すなわち送信停止時間が十分長いか否かを判定し(SD1)、無音判定カウントSilentCountの値が定数StartFramesの値よりも大きいときは送信再開時に時間をさかのぼって送信する音声データフレームの数を設定する(SD2)。このとき、さかのぼる数Nの値を上記定数StartFramesの値に設定する。また、無音判定カウントSilentCountの値が定数StartFramesの値以下のときは数Nの値を無音判定カウントSilentCountの値よりも2だけ小さい数(N = SilentCount − 2)に設定する(SD3)。
【0155】
次に、変数iを1に設定(i=1)し(SD4)、バッファに保持されている音声データフレームのうち、現時点の音声データフレームからi個前の音声データフレームのパワーp(i)を計算し(SD5)、パワーp(i)が所定の閾値以下であるか否か、又は変数iの値が(N−1)以上であるか否かを判定する。
【0156】
この判定の結果、パワーp(i)が閾値よりも大きいとき又は変数iの値が(N−1)よりも小さいときは、変数iの値を1だけ増加して(SD7)前記SD5の処理に移行する。また、パワーp(i)が閾値以下であるか又は変数iの値が(N−1)以上であるときは、現時点の音声データフレームよりi個前の音声データフレームの1つ前のフレームをフェードイン処理し(SD8)、さらにこのフェードイン処理した音声データフレームを符号化処理する(SD9)。
【0157】
この後、フェードイン処理した音声データフレームとこれに対応するi個前のRTPタイムスタンプ(RTPTimeStamp − FrameLen * i)(ここで、*は乗算を表す)とを含むパケットを生成してこれを送信する(SD10)。このとき、RTPヘッダにおけるマーカービットMを「1」に設定して送信する。
【0158】
次いで、バッファに保持したi個前から現在までの音声データフレームを順次符号化処理し、この符号化処理した音声データフレームと、これに対応するRTPタイムスタンプ(RTPTimeStamp − (i−j) * FrameLen)とを含むパケットを生成して順次送信する(SD11)。ここで、無音音声データフレームや定常部分を信号処理により間引くことにより、遅延の増加を抑えるようにすることもできる。また、jは1以上i以下の整数である。
【0159】
さらに、遅延増加量カウンタDelayCountの値をN個のフレーム長分(FrameLen * N)だけ増加させて(DelayCount += FrameLen * i)(SD12)、送信再開処理を終了する。
【0160】
上記第2実施形態の第2実施例によれば、発話機能ボタンが押下されて発話が開始され、無音状態から有音状態に遷移するときに、発話機能ボタンが押下された瞬間のフレームから音声データのパワーが閾値以上になる1つまえのフレーム、すなわち現時点のフレームからi個前のフレームにさかのぼって、フェードイン処理して得られた音声データフレームを含むパケットから送信するので、無音状態から有音状態への復帰時に話頭が消失してしまうことがなくなる。
【0161】
さらに、有音状態から無音状態になったときの音声データフレームすなわち話尾部分の音声レベルが徐々に減少されるフェードアウト処理も第1実施形態と同様に施されるため、受信側において有音状態から無音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【0162】
上記第1実施例、第2実施例において、受信側で背景雑音を推定し、パケットを受信しない無音区間に受信側で生成した擬似背景雑音を出力するようなCNGと組み合わせて利用することもできる。この場合には、受信側で受け取った最後のフェードアウト処理を行ったフレームに対して、擬似背景雑音をフェードインしながら足し合わせることで、有音区間から擬似背景雑音区間に連続的に遷移させることができる。また、有音として受信した最初のパケットに対して、擬似背景雑音をフェードアウトしながら足し合わせることで、擬似背景雑音区間から有音区間に連続的に遷移させることができる。
【0163】
次に、本発明の第3実施形態を説明する。
【0164】
図15は本発明の第3実施形態における音声パケット通信システムの機能構成を示すブロック図である。図において、前述した第1実施形態と同一構成部分は同一符号を持って表しその説明を省略する。
【0165】
また、第3実施形態と第1実施形態との相違点は、第3実施形態では前述した第1実施形態における符号化処理部16に代えて符号化処理部16’を備えると共に、パケット解析部22及び復号化処理部23に代えてパケット解析部22’及び復号化処理部23’を設けたことである。
【0166】
符号化処理部16’は後述するように、無音状態から有音状態に遷移したときに用いる分析結果として、分析初期値を参照してデータ分析及び符号化を行った場合のS/N(信号雑音比)と、前記一時記憶されている分析結果を参照してデータ分析及び符号化を行った場合のS/Nとを比較して、良好なS/Nをもつ符号化音声データフレームを使用する。
【0167】
パケット解析部22’は、パケット解析部22が有する機能に加えて、受信パケットを解析してRTPヘッダのマーカービットMが「1」のときにリセット情報を復号化処理部23’に送出する機能を備えている。
【0168】
復号化処理部23’は、復号化処理部23が有する機能に加えて、パケット解析部22’からリセット情報を受けたときにだけ一時記憶されている分析結果ではなく分析初期値を参照してデータ分析を行い、データの復号化処理を行う機能を備えている。
【0169】
図16は符号化処理部16’を示す機能ブロック図である。図に示すように、符号化処理部16’は、入力音声データ保持部161と、符号化部162,163、内部データ保持部164、符号化音声データ保持部165,166、ローカル復号化部167,168、第1誤差計算部169、第2誤差計算部170、誤差比較部171、スイッチ部172とから構成されている。
【0170】
入力音声データ保持部161は、入力した音声データフレームを保持し、この音声データフレームを符号化部162,163と、第1誤差計算部169及び第2誤差計算部170に供給する。
【0171】
符号化部162は、内部データ保持部164に保持されているデータに基づいて、入力音声データ保持部161から供給された音声データフレームを符号化し、これを符号化音声データ保持部165に出力する。
【0172】
符号化部163は、入力音声データ保持部161から供給された音声データフレームを符号化し、これを符号化音声データ保持部166に出力する。ここで、符号化するときは、常に内部状態がリセットされた状態、すなわち前のデータ符号化の状態を参照しないで符号化を行う。
【0173】
内部データ保持部164は、符号化部162において音声データフレームを符号化した符号化音声データを保持し、次の音声データフレームが符号化部162において符号化される際に保持している符号化音声データを符号化部162に供給する。
【0174】
符号化音声データ保持部165は、符号化部162によって符号化された符号化音声データを一時的に保持すると共に、この符号化音声データをローカル復号化部167とスイッチ部172に出力する。
【0175】
符号化音声データ保持部166は、符号化部163によって符号化された符号化音声データを一時的に保持すると共に、この符号化音声データをローカル復号化部168とスイッチ部172に出力する。
【0176】
ローカル復号化部167は、符号化音声データ保持部165から供給された符号化音声データを復号して得られた音声データを第1誤差計算部169に出力する。
【0177】
ローカル復号化部168は、符号化音声データ保持部166から供給された符号化音声データを復号して得られた音声データを第2誤差計算部170に出力する。
【0178】
第1誤差計算部169は、入力音声データ保持部161から供給される音声データとローカル復号化部167から入力した音声データとの誤差分(符号化誤差(S/N))を求めて、これを誤差比較部171に出力する。さらに、第1誤差計算部169は、無音状態から有音状態に遷移したときに内部データ保持部164に保持されているデータを消去して初期化する。
【0179】
第2誤差計算部170は、入力音声データ保持部161から供給される音声データとローカル復号化部168から入力した音声データとの誤差分(符号化誤差(S/N))を求めて、これを誤差比較部171に出力する。
【0180】
誤差比較部171は、第1誤差計算部169から入力した誤差分(符号化誤差(S/N))と第2誤差計算部170から入力した誤差分(符号化誤差(S/N))とを比較して、この比較結果に基づいて、符号化誤差(S/N)が良好な(小さい)方の符号化音声データフレームをパケット生成部17に出力するようにスイッチ部172を切り替える。さらに、誤差比較部171は、前述したように無音状態から有音状態になったときにRTPヘッダのマーカービットMを「1」に設定するようにパケット生成部17に通知する。
【0181】
次に、上記構成よりなる第3実施形態における送信装置1及び受信装置2の動作を図17乃至図20に示すフローチャートを参照して詳細に説明する。
【0182】
送信装置1においては、駆動開始直後に初期化処理を行う(SE1)。この初期化処理では、変数である無音判定カウントSilentCountの値を「0」に設定すると共にRTPTimeStampの値を「0」に設定する。
【0183】
次に、送信装置1は、処理を開始すると、音声入力部11を介して入力した音声信号は順次A/D変換部12を介して有音無音判定部13のバッファに格納する(SE2)。
【0184】
次いで、送信装置1は、有音無音判定部13のバッファに格納されている先頭の音声データから順に、判定対象となる音声データフレームのパワーが閾値以下であるか否かすなわち無音状態であるか有音状態であるかを判定し(SE3)、音声データフレームのパワーが閾値よりも大きい有音状態のときは後述する前記SE19の処理に移行する。
【0185】
また、音声データフレームのパワーが閾値以下の無音状態のときは、無音判定カウントSilentCountを「1」増加し(SE4)、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きい送信休止状態であるか否かを判定する(SE5)。
【0186】
この判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きい送信休止状態であるときは後述するSE12の処理に移行し、無音判定カウントSilentCountの値がカウント閾値SilentThres以下のときは、無音判定カウントSilentCountの値がカウント閾値SilentThresに等しいか否かすなわち送信休止状態が開始されたか否かを判定する(SE6)。
【0187】
この判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThresに等しくないときは後述するSE7の処理に移行し、無音判定カウントSilentCountの値がカウント閾値SilentThresに等しいときは現在の音声データフレームをフェードアウト処理する(SE7)。
【0188】
次に、フェードアウト処理した音声データフレームを符号化処理し(SE8)、この符号化処理した音声データフレームとこれに対応するRTPタイムスタンプRTPTimeStampとを含むパケットを生成して、このパケットを送信する(SE9)。
【0189】
この後、RTPタイムスタンプRTPTimeStampをフレーム長分増加する(SE10)。即ち、RTPタイムスタンプRTPTimeStampの値にフレーム長FrameLenの値を加算した値を新たなRTPタイムスタンプRTPTimeStampの値とする。
【0190】
次いで、現在の音声データフレームをバッファに保持して(SE11)、前記SE2の処理に移行する。
【0191】
一方、前記SE5の判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きい送信休止状態であるときは、無音判定カウントSilentCountの値がカウント閾値SilentThres+1に等しいか否か、すなわち送信休止状態になったばかりであるか否かを判定する(SE12)。
【0192】
この判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThres+1に等しくないときは後述するSE16の処理に移行し、無音判定カウントSilentCountの値がカウント閾値SilentThres+1に等しいときは理想的な無音音声データフレームを生成して(SE13)、この無音音声データフレームを符号化し(SE14)、この符号化した理想的な無音音声データフレームとこれに対応するRTPタイムスタンプRTPTimeStampとを含むパケットを生成して、このパケットを送信する(SE15)。この後、前記SE10の処理に移行する。
【0193】
また、前記SE12の判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThres+1に等しくないときは、遅延カウントDelayCountの値からフレーム長FrameLenの値を減算した値を新たな遅延カウントDelayCountの値とし(SE16)、遅延カウントDelayCountの値が0以下であるか否かを判定する(SE17)。
【0194】
この判定の結果、遅延カウントDelayCountの値が0よりも大きいときは前記SE10の処理に移行し、遅延カウントDelayCountの値が0以下であるときは遅延カウントDelayCountの値を0に設定して(SE18)、前記SE10の処理に移行する。
【0195】
一方、前記SE3の判定の結果、音声データフレームのパワーが閾値よりも大きい有音状態のときは、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きいか否かすなわち1つ前のフレームは送信休止状態であるか否かを判定する(SE19)。
【0196】
この判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThres以下のときは後述するSE28の処理に移行する。また、無音判定カウントSilentCountの値がカウント閾値SilentThresよりも大きいときは、バッファに保持されている1つ前の音声データフレームをフェードイン処理する(SE20)と共に、符号化処理部16’を初期化し(SE21)、さらに前記フェードイン処理した音声データフレームを符号化処理する(SE22)。
【0197】
次に、フェードイン処理した音声データフレームと該音声データフレームに対応するRTPタイムスタンプ(RTPTimeStamp−FrameLen)とを含むパケットを生成して該パケットを送信する(SE23)。このとき、RTPヘッダのマーカービットMを「1」に設定しておく。
【0198】
この後、現在の音声データフレームすなわちフェードイン処理した音声データフレームの次の音声データフレームを符号化処理し(SE24)、該符号化処理した音声データフレームと現在のRTPタイムスタンプRTPTimestampとを含むパケットを生成してこれを送信する(SE25)。
【0199】
次に、遅延増加量カウンタDelayCountの値をフレーム長FrameLenの値分だけ増加させる(SE26)と共に、無音判定カウントSilentCountの値を「0」に初期化する(SE27)。この後、前記SE10の処理に移行する。
【0200】
一方、前記SE19の判定の結果、無音判定カウントSilentCountの値がカウント閾値SilentThres以下のときは現在の音声データフレームを符号化部162によって符号化処理する(SE28)、と共に現在の音声データフレームを符号化部163によって符号化処理する。ここで、符号化部163では内部状態がリセットされているので前回の符号化処理における符号化データは参照されずに符号化処理が行われる。
【0201】
次に、符号化部162によって符号化された符号化音声データフレームのS/Nと、符号化部163によって符号化された符号化音声データフレームのS/Nとを比較し(SE30)、S/Nの良い方の符号化音声データフレームとこれに対応するRTPタイムスタンプとを含むパケットを生成してこれを送信する(SE31)。このとき、符号化部163によって符号化した音声データフレームを用いる場合は、RTPヘッダのマーカービットMを「1」に設定して無音復帰フラグを立てる。
【0202】
この後、無音判定カウントSilentCountの値を「0」に設定して初期化した後(SE32)、前記SE10の処理に移行する。
【0203】
上記実施形態の送信装置によれば、保持されている分析結果に基づいて符号化した音声データフレームにおける音声データのS/N(信号雑音比)と、前記分析結果の初期値に基づいて符号化した音声データフレームにおける音声データの信号雑音比とが比較され、S/Nが大きい方の音声データフレームがパケット生成用の音声データフレームとして採用されるため、符号化対象となる音声データフレームと、この1つ前の音声データフレームとの間の相関関係が良好となるように符号化処理を行うことができるので、受信側において再生時に自然な状態の音声データを得ることができる。
【0204】
次に、受信装置2の動作を図20に示すフローチャートを参照して説明する。
【0205】
受信装置2は、受信処理を開始すると、受信したパケットを解析処理して(SF1)、RTPヘッダと音声データフレームとを分離すると共にRTPヘッダの情報を解析する。
【0206】
上記解析によってRTPヘッダのマーカービットM(無音復帰フラグ)が「1」に設定されフラグがオンになっているか否かを判定し(SF2)、マーカービットMが「0」のときは後述するSF4の処理に移行し、マーカービットMが「1」のときはパケット解析部22’から復号化処理部23’にリセット情報を通知して復号化処理部の内部状態を初期化(リセット)する(SF3)。
【0207】
この後、受信した符号化音声データフレームを復号化処理し(SF4)、復号化処理された音声データフレームの音声再生処理を行う(SF5)。
【0208】
上記受信処理によれば、無音状態から有音状態に遷移した音声データ箇所に加えて、符号化器の内部状態をリセットしても符号化利得に影響を与えない音声データ箇所での送信側符号化器の内部状態リセットをマーカービットMによって認識することができるので、送信側符号化器の内部状態と、受信側の復号化器の内部状態の同期を保つことが可能となる。リセット処理を行うことで、パケット消失等の伝送誤りに際して送信側と受信側の内部状態の不一致を回復することが可能であり、品質の低下を低減できる。
【0209】
尚、上記各実施形態は本発明の一具体例であって本発明が上記実施形態の構成のみに限定されることはない。
【0210】
【発明の効果】
以上説明したように本発明によれば、無音状態になる直前の音声データ部分の音声レベルが徐々に減少されるフェードアウト処理が施されるため、受信側において有音状態から無音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【0211】
さらに、本発明によれば、無音状態であると判定された音声データフレームの少なくとも1つ前のフレームに対応する音声データのレベルが徐々に減少された音声データに変換されて音声データフレームが生成され、該音声データフレームを含むパケットが送信された後に1つの無音データフレームを含むパケットが送信されるので、受信側においては有音状態から無音状態になったことを確実に認識可能になる。
【0212】
また、本発明によれば、無音データフレームを含むパケットを送信した後、入力した音声のレベルが所定のしきい値レベルを越えたときに有音状態であると判定されたときに、有音状態であると判定された音声データフレームの少なくとも1つ前の音声データフレームが有音状態であるとされ、該音声データフレームを含むパケットから送信が開始される。これにより、無音状態から有音状態への復帰時に話頭が消失してしまうことがなくなる。
【0213】
また、本発明によれば、有音状態になる音声データ部分の音声レベルが徐々に増大されるフェードイン処理が施されるため、受信側において無音状態から有音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることが無く、音声品質の劣化を低減することができる。
【0214】
また、本発明によれば、無音状態でパケット送信を停止していた後にパケット送信を開始するときの最初のパケットに有音開始状態を意味する情報を含めるので、この情報によって、受信側においては無音状態から有音状態に復帰したことを認識することができる。
【0215】
また、本発明によれば、音声データフレームを符号化処理するにあたって、符号化器の内部状態を初期化せずに前のフレームに続けて当該フレームを符号化した場合の符号化誤差と、符号化器の内部状態を初期化した後に当該フレームを符号化した場合の符号化誤差とを比較し、誤差の少ない方の符号化結果を送信し、内部状態をリセットした後に当該フレームを符号化した結果を選択した場合には、無音から復帰した最初のフレームであるという情報を送信パケット内に含めて送信するので、前記符号化誤差が小さい方の符号化音声データフレームが用いられ、再生時に自然な状態の音声データを得ることができる。さらに、符号化器の内部状態がリセットされた状態で符号化された符号化音声データフレームが用いられるときには、無音から復帰した最初のフレームであることを表す情報がパケットに含められて送信されるので、受信側において的確な復号化処理を行うことができる。
【0216】
また、本発明によれば、前記有音開始状態を意味する情報が送信パケットに含められるので、受信側において有音状態の開始を容易に認識することができる。
【図面の簡単な説明】
【図1】本発明の第1実施形態における音声パケット通信システムの機能構成を示すブロック図
【図2】本発明の第1実施形態における音声パケット送信装置による音声信号のパケット化を説明する図
【図3】本発明の第1実施形態において用いているリアルタイム転送プロトコルヘッダを説明する図
【図4】本発明の第1実施形態における送信装置のパケット送信処理を説明するフローチャート
【図5】本発明の第1実施形態における送信装置のパケット送信処理を説明するフローチャート
【図6】本発明の第1実施形態における送信装置のパケット送信処理を説明するフローチャート
【図7】本発明の第2実施形態における音声パケット通信システムの機能構成を示すブロック図
【図8】本発明の第2実施形態における送信装置のパケット送信処理を説明するフローチャート
【図9】本発明の第2実施形態における送信装置のパケット送信処理を説明するフローチャート
【図10】本発明の第2実施形態における送信装置のパケット送信処理を説明するフローチャート
【図11】本発明の第2実施形態の第1実施例の送信再開処理における音声信号のパケット化を説明する図
【図12】本発明の第2実施形態の第1実施例の送信再開処理を説明するフローチャート
【図13】本発明の第2実施形態の第2実施例の送信再開処理における音声信号のパケット化を説明する図
【図14】本発明の第2実施形態の第2実施例の送信再開処理を説明するフローチャート
【図15】本発明の第3実施形態における音声パケット通信システムの機能構成を示すブロック図
【図16】本発明の第3実施形態における符号化処理部を示す機能ブロック図
【図17】本発明の第3実施形態における送信装置の動作を説明するフローチャート
【図18】本発明の第3実施形態における送信装置の動作を説明するフローチャート
【図19】本発明の第3実施形態における送信装置の動作を説明するフローチャート
【図20】本発明の第3実施形態における受信装置の動作を説明するフローチャート
【符号の説明】
1…音声パケット送信装置、2…音声パケット受信装置、3…通信網、11…音声入力部、12…アナログ/ディジタル(A/D)変換部、13……有音無音判定部、14…スイッチ部、15…フェードイン・フェードアウト処理部、16,16’…符号化処理部、17…パケット生成部、18…送信部、19…送信判定処理部、21…受信部、22,22’…パケット解析部、23,23’…復号化処理部、24…アナログ/ディジタル(A/D)変換部、25…音声出力部、161…入力音声データ保持部、162,163…符号化部、164…内部データ保持部、165,166…符号化音声データ保持部、167,168…ローカル復号化部、169…第1誤差計算部、170…第2誤差計算部、171…誤差比較部、172…スイッチ部。

Claims (25)

  1. 連続して入力した音声に基づく音声データを所定時間間隔で切り取った音声データフレームを生成する音声データフレーム生成手段を備え、該生成した音声データフレームを含んだパケットを生成し、該パケットを通信網を介して送信する音声パケット送信装置において、
    前記入力した音声が無音であるか否かを判定する無音判定手段と、
    前記無音判定手段によって入力された音声データフレームが無音と判定された状態が一定時間以上連続する場合にパケットの送信を停止する手段と、
    送信を停止するにあたって、送信する最後の音声データフレームの音声レベルを、先頭サンプルから末尾サンプルに向けて徐々に減少させた音声データに変換し、該変換された音声データフレームを最終パケットとして送信する手段を備えた
    ことを特徴とする音声パケット送信装置。
  2. 前記無音判定手段によって入力された音声データフレームが無音と判定された状態が一定時間以上連続する場合にパケットの送信を停止する手段と、
    送信を停止するにあたって、無音状態になったと判定された後に入力された音声フレームを少なくとも1つ以上送信する手段と、
    送信する最後の音声データフレームの音声レベルを、先頭サンプルから末尾サンプルに向かって徐々に減少させた音声データに変換し、該変換された音声データフレームを最終パケットとして送信する手段を備えた
    ことを特徴とする請求項1に記載の音声パケット送信装置。
  3. 前記音声レベルを先頭サンプルから末尾サンプルに向けて徐々に減少させた音声データフレームを含むパケットを送信した後に、さらに1つの無音音声データフレームを生成し、該無音音声データフレームを含むパケットを送信する手段を備えた
    ことを特徴とする請求項1又は請求項2に記載の音声パケット送信装置。
  4. 前記入力した音声が有音であるか否かを判定する有音判定手段と、
    前記入力された音声データフレームが無音であると判定された状態が一定時間以上連続し、パケットの送信を停止している状態で、前記入力された音声データフレームが前記有音判定手段で有音状態であると判定されたときに、パケットの送信を再開する手段と、
    パケットの送信を再開するにあたって、送信する最初の音声データフレームを、末尾サンプルから先頭サンプルに向かって音声レベルを徐々に減少させた音声データに変換し、有音状態の先頭として該変換された音声データフレームを含むパケットを送信する手段を備えた
    ことを特徴とする請求項1乃至請求項3の何れかに記載の音声パケット送信装置。
  5. 前記パケットの送信を再開するにあたって、有音と判定された音声データフレームの少なくとも1つ前の無音データフレームを、末尾から先頭に向かって音声レベルを徐々に減少させた音声データに変換し、有音状態の先頭として該変換された音声データフレームを含むパケットを送信し、次に前記有音状態であると判定された音声データフレームを送信する手段を備えた
    ことを特徴とする請求項1乃至請求項4の何れかに記載の音声パケット送信装置。
  6. 前記入力された音声データフレームを保持する手段と、
    前記パケットの送信を再開するにあたって、有音と判定された音声データフレームの少なくとも1つ前の無音データフレームを再分析フレームとして、有音と判定された音声フレームの情報と前記再分析フレームまでの無音と判定された音声データフレームの情報とを用いて再分析する手段と、
    前記再分析の結果、前記再分析フレームが有音に近いと判定された場合には、前記再分析フレームの1つ前の音声データフレームを、末尾から先頭に向かって音声レベルを徐々に減少させた音声データに変換し、有音状態の先頭として該変換された音声データフレームを含むパケットを送信し、次に前記有音状態であると判定された音声データフレームと前記再分析フレームの1つ前のフレームとの間の無音データフレームを送信し、次に前記有音状態であると判定された音声データフレームを送信する手段と、
    前記再分析の結果、前記再分析フレームが無音に近いと判定された場合には、該再分析フレームを、末尾から先頭に向かって音声レベルを徐々に減少させた音声データに変換し、有音状態の先頭として該変換された音声データフレームを含むパケットを送信し、次に前記有音であると判定された音声データフレームを送信する手段とを備えた
    こと特徴とする請求項1乃至請求項4の何れかに記載の音声パケット送信装置。
  7. 前記パケットの送信を再開するにあたって、有音と判定された音声データフレームの少なくとも1つ前のフレームを、有音状態の先頭として送信した場合に、余分に送信した無音フレームによって増加した遅延に相当するサンプル数だけ後続のサンプルを短縮する手段を有する
    ことを特徴とする請求項5又は請求項6に記載の音声パケット送信装置。
  8. 前記無音判定手段は、入力された音声フレームの音声レベルが所定の閾値レベル以下であるときに無音状態であると判定する手段を備えた
    ことを特徴とする請求項1乃至請求項7の何れかに記載の音声パケット送信装置。
  9. 前記有音判定手段は、入力された音声フレームの音声レベルが所定の閾値レベル以上であるときに有音状態であると判定する手段を備えた
    ことを特徴とする請求項1乃至請求項7の何れかに記載の音声パケット送信装置。
  10. 無音状態でパケット送信停止状態となっていて、有音により発話開始状態としてパケットを送信するに際して、送信する最初の音声フレームを符号化する場合に、音声符号化器の内部状態を初期化した後に音声フレームを符号化処理する手段と、
    最初のフレームをパケット化して送信するにあたって、パケット内に無音から復帰した最初のフレームであることを表す情報を含めて送信する手段とを有することを特徴とする請求項1乃至請求項7の何れかに記載の音声パケット送信装置。
  11. 前記符号化処理手段は、
    当該フレームを符号化処理するにあたって、符号化器の内部状態を初期化せずに前のフレームに続けて当該フレームを符号化した場合の符号化誤差と、符号化器の内部状態を初期化した後に当該フレームを符号化した場合の符号化誤差とを比較し、誤差の少ない方の符号化結果を送信する手段と、
    内部状態をリセットした後に当該フレームを符号化した結果を選択した場合には、無音から復帰した最初のフレームであるという情報を送信パケット内に含めて送信する手段とを有する
    ことを特徴とする請求項10に記載の音声パケット送信装置。
  12. 連続して入力した音声に基づく音声データを所定時間間隔で切り取った音声データフレームを生成する音声データフレーム生成手段と、ユーザの発話の意志を取得する発話機能ボタンとを供え、該生成した音声データフレームを含んだパケットを生成し、該発話機能ボタンが押されている間だけ音声データフレームを含んだパケットを、通信網を介して送信する音声パケット送信装置において、
    前記発話機能ボタンが押されている状態か否かを判定する発話機能ボタン押下判定手段と、
    前記発話機能ボタン押下判定手段によって発話機能ボタンが押されている状態から、押されていない発話休止状態になったと判定された場合にパケットの送信を停止する手段と、
    送信を停止するにあたって、送信する最後の音声データフレームの音声レベルを、先頭サンプルから末尾サンプルに向かって徐々に減少させた音声データに変換し、該変換された音声データフレームを最終パケットとして送信する手段とを備えた
    ことを特徴とする音声パケット送信装置。
  13. 前記発話機能ボタン押下判定手段によって発話機能ボタンが押されている状態から押されていない発話休止状態になったと判定された場合にパケットの送信を停止する手段と、
    送信を停止するにあたって、発話休止状態になったと判定された後に入力された音声フレームを少なくとも1つ以上送信する手段と、
    送信する最後の音声データフレームの音声レベルを、先頭サンプルから末尾サンプルに向かって徐々に減少させた音声データに変換し、該変換された音声データフレームを最終パケットとして送信する手段とを備えた
    こと特徴とする請求項12に記載の音声パケット送信装置。
  14. 前記音声レベルを先頭サンプルから末尾サンプルに向けて徐々に減少させた音声データフレームを含むパケットを送信した後に、さらに1つの無音音声データフレームを生成し、該無音音声データフレームを含むパケットを送信する手段を備えた
    ことを特徴とする請求項12又は請求項13に記載の音声パケット送信装置。
  15. 前記発話機能ボタン押下判定手段によって発話機能ボタンが押されていない状態から押されている状態になったと判定された場合に、発話開始状態として、前記停止していたパケットの送信を再開する手段と、
    パケットの送信を再開するにあたって、送信する最初の音声データフレームを、末尾サンプルから先頭サンプルに向かって音声レベルを徐々に減少させた音声データに変換し、発話状態の先頭として該変換された音声データフレームを含むパケットを送信する手段とを備えた
    ことを特徴とする請求項12乃至請求項14の何れかに記載の音声パケット送信装置。
  16. 前記発話機能ボタン押下判定手段によって発話機能ボタンが押されていない状態から押されている状態になったと判定された場合に、発話開始状態として、前記停止していたパケットの送信を再開する手段と、
    パケットの送信を再開するにあたって、発話機能ボタンが押された状態になった後に入力された最初の音声データフレームより前の音声データフレームを少なくとも1つ以上送信し、次に前記発話機能ボタンが押された状態になった後に入力された最初の音声データフレームを送信する手段とを備えた
    ことを特徴とする請求項12乃至請求項15の何れかに記載の音声パケット送信装置。
  17. 前記発話開始状態になった場合にパケットの送信を再開するにあたって、発話開始状態と判定された音声データフレームの少なくとも1つ前のフレームを、送信フレームの先頭として送信した場合に、余分に送信した音声データフレームによって増加した遅延に相当するサンプル数だけ後続のサンプルを短縮する手段を有する
    ことを特徴とする請求項15又は請求項16に記載の音声パケット送信装置。
  18. 発話機能ボタンを押下されない状態で、パケット送信停止状態となっていて、発話機能ボタン押下により発話開始状態としてパケットを送信するに際して、送信する最初の音声フレームを符号化する場合に、音声符号化器の内部状態を初期化した後に音声フレームを符号化処理する手段と、
    最初のフレームをパケット化して送信するにあたって、パケット内に無音から復帰した最初のフレームであることを表す情報を含めて送信する手段とを有することを特徴とする請求項12乃至請求項15に記載の音声パケット送信装置。
  19. 前記符号化処理手段は、
    当該フレームを符号化処理するにあたって、符号化器の内部状態を初期化せずに前のフレームに続けて当該フレームを符号化した場合の符号化誤差と、符号化器の内部状態を初期化した後に当該フレームを符号化した場合の符号化誤差とを比較し、誤差の少ない方の符号化結果を送信する手段と、
    内部状態をリセットした後に当該フレームを符号化した結果を選択した場合には、無音から復帰した最初のフレームであるという情報を送信パケット内に含めて送信する手段とを有する
    ことを特徴とする請求項18に記載の音声パケット送信装置。
  20. 音声入力手段によって入力した音声を音声データに変換する手段を有するコンピュータ装置を用いて、連続して入力した音声に基づく音声データを所定時間間隔で切り取った音声データフレームを生成すると共に該音声データフレームを含んだパケットを生成し、該パケットを通信網を介して送信する音声パケット送信方法において、
    前記コンピュータ装置は、
    前記入力した音声が無音であるか否かを判定し、
    前記入力された音声データフレームが無音と判定された状態が一定時間以上連続する場合にパケットの送信を停止し、
    送信を停止するにあたって、送信する最後の音声データフレームの音声レベルを、先頭サンプルから末尾サンプルに向けて徐々に減少させた音声データに変換し、
    前記変換した音声データフレームを最終パケットとして送信する
    ことを特徴とする音声パケット送信方法。
  21. 前記コンピュータ装置は、
    前記入力された音声データフレームが無音であると判定された状態が一定時間以上連続し、パケットの送信を停止している状態で、前記入力された音声データフレームが前記有音判定手段で有音状態であると判定されたときに、パケットの送信を再開し、
    パケットの送信を再開するにあたって、送信する最初の音声データフレームを、末尾サンプルから先頭サンプルに向かって音声レベルを徐々に減少させた音声データに変換し、
    有音状態の先頭として前記変換した音声データフレームを含むパケットを送信する
    ことを特徴とする請求項20に記載の音声パケット送信方法。
  22. 音声入力手段によって入力した音声を音声データに変換する手段を有するコンピュータ装置を用いて、連続して入力した音声に基づく音声データを所定時間間隔で切り取った音声データフレームを生成すると共に、該生成した音声データフレームを含んだパケットを生成し、ユーザの発話の意志を取得する発話機能ボタンが押されている間だけ音声データフレームを含んだパケットを、通信網を介して送信する音声パケット送信方法において、
    前記コンピュータ装置は、
    前記発話機能ボタンが押されている状態か否かを判定し、
    前記発話機能ボタンが押されている状態から、押されていない発話休止状態になったと判定された場合にパケットの送信を停止し、
    送信を停止するにあたって、送信する最後の音声データフレームの音声レベルを、先頭サンプルから末尾サンプルに向かって徐々に減少させた音声データに変換し、
    前記変換した音声データフレームを最終パケットとして送信する
    ことを特徴とする音声パケット送信方法。
  23. 前記コンピュータ装置は、
    前記発話機能ボタンが押されていない状態から押されている状態になったと判定された場合に、発話開始状態として、前記停止していたパケットの送信を再開し、
    パケットの送信を再開するにあたって、送信する最初の音声データフレームを、末尾サンプルから先頭サンプルに向かって音声レベルを徐々に減少させた音声データに変換し、
    発話状態の先頭として前記変換した音声データフレームを含むパケットを送信する
    ことを特徴とする請求項22に記載の音声パケット送信方法。
  24. 受信したパケット内に無音から復帰した最初のフレームであることを表す情報が含まれていた場合に、音声復号化器の内部状態を初期化した後に、フレームの復号処理を行う手段を有する
    ことを特徴とする音声パケット受信装置。
  25. 音声パケットを生成して該音声パケットを送信する音声パケット送信装置と、前記送信された音声パケットを通信網を介して受信する音声パケット受信装置とからなる音声パケット通信システムにおいて、
    前記請求項10又は請求項18に記載の音声パケット送信装置と、
    前記請求項24に記載の音声パケット受信装置とからなる
    ことを特徴とする音声パケット通信システム。
JP2003151462A 2003-05-28 2003-05-28 音声パケット送信装置とその方法 Expired - Lifetime JP4364555B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003151462A JP4364555B2 (ja) 2003-05-28 2003-05-28 音声パケット送信装置とその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003151462A JP4364555B2 (ja) 2003-05-28 2003-05-28 音声パケット送信装置とその方法

Publications (3)

Publication Number Publication Date
JP2004356898A true JP2004356898A (ja) 2004-12-16
JP2004356898A5 JP2004356898A5 (ja) 2006-05-18
JP4364555B2 JP4364555B2 (ja) 2009-11-18

Family

ID=34046980

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003151462A Expired - Lifetime JP4364555B2 (ja) 2003-05-28 2003-05-28 音声パケット送信装置とその方法

Country Status (1)

Country Link
JP (1) JP4364555B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007235221A (ja) * 2006-02-27 2007-09-13 Fujitsu Ltd 揺らぎ吸収バッファ装置
JP2008122533A (ja) * 2006-11-09 2008-05-29 Canon Inc 音声処理装置とその制御方法、及び、コンピュータプログラム
JP2009021923A (ja) 2007-07-13 2009-01-29 Yamaha Corp 音声通信装置
JP2010512105A (ja) * 2006-12-08 2010-04-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 効率的なメディアの扱いのための受信機の動作及び実装
JP2010539739A (ja) * 2007-08-31 2010-12-16 インターナショナル・ビジネス・マシーンズ・コーポレーション データ・フローを同期化する方法
JP2015219285A (ja) * 2014-05-14 2015-12-07 沖電気工業株式会社 音声強調装置及びプログラム、並びに、音声復号装置及びプログラム
CN114448957A (zh) * 2022-01-28 2022-05-06 上海小度技术有限公司 音频数据传输方法和装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007235221A (ja) * 2006-02-27 2007-09-13 Fujitsu Ltd 揺らぎ吸収バッファ装置
JP2008122533A (ja) * 2006-11-09 2008-05-29 Canon Inc 音声処理装置とその制御方法、及び、コンピュータプログラム
JP2010512105A (ja) * 2006-12-08 2010-04-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 効率的なメディアの扱いのための受信機の動作及び実装
JP2009021923A (ja) 2007-07-13 2009-01-29 Yamaha Corp 音声通信装置
JP2010539739A (ja) * 2007-08-31 2010-12-16 インターナショナル・ビジネス・マシーンズ・コーポレーション データ・フローを同期化する方法
JP2015219285A (ja) * 2014-05-14 2015-12-07 沖電気工業株式会社 音声強調装置及びプログラム、並びに、音声復号装置及びプログラム
CN114448957A (zh) * 2022-01-28 2022-05-06 上海小度技术有限公司 音频数据传输方法和装置
CN114448957B (zh) * 2022-01-28 2024-03-29 上海小度技术有限公司 音频数据传输方法和装置

Also Published As

Publication number Publication date
JP4364555B2 (ja) 2009-11-18

Similar Documents

Publication Publication Date Title
US20100030557A1 (en) Voice and text communication system, method and apparatus
JP3264822B2 (ja) 移動体通信機器
WO2005099243A1 (ja) 音声通信方法及び装置
JP2001500344A (ja) タンデム型ボコーダの音質を改良する方法および装置
JPWO2006070757A1 (ja) 音声符号化装置および音声符号化方法
US7406414B2 (en) Providing translations encoded within embedded digital information
US8566108B2 (en) Synchronization of multiple real-time transport protocol sessions
KR20090113894A (ko) 일련의 데이터 패킷들을 전송하기 위한 장치와 방법, 디코더, 및 일련의 데이터 패킷들을 디코딩하기 위한 장치
EP2036204B1 (en) Method and apparatus for an audio signal processing
US20100153119A1 (en) Apparatus and method for coding audio data based on input signal distribution characteristics of each channel
JP4364555B2 (ja) 音声パケット送信装置とその方法
JP3211771B2 (ja) 音声送受信装置
KR101011320B1 (ko) 스피치를 저장, 전송 및 재생하기 위하여 포즈 프레임을 식별하여 제외하는 방법 및 장치
US7139704B2 (en) Method and apparatus to perform speech recognition over a voice channel
KR101166650B1 (ko) 배경 잡음 정보를 디코딩하기 위한 방법 및 수단
JP3487158B2 (ja) 音声符号化伝送システム
JP3977784B2 (ja) リアルタイムパケット処理装置及びその方法
US6134519A (en) Voice encoder for generating natural background noise
JP2935213B2 (ja) 音声情報伝送方式
JPH0588697A (ja) 欠落音声補間方式
JP2002252644A (ja) 音声パケット通信装置及び音声パケット通信方法
JPH07334197A (ja) 音声符号化装置
JP2002333900A (ja) 音声符号化復号化方法および音声送受信装置
JPH0530137A (ja) 音声パケツト伝送装置
JP6763194B2 (ja) 符号化装置、復号装置、通信システム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060323

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090818

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090819

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4364555

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130828

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term