JP6154592B2 - 圧縮装置、伸張装置、圧縮伸張装置、圧縮方法、圧縮制御プログラム、および音声データ構造 - Google Patents

圧縮装置、伸張装置、圧縮伸張装置、圧縮方法、圧縮制御プログラム、および音声データ構造 Download PDF

Info

Publication number
JP6154592B2
JP6154592B2 JP2012199362A JP2012199362A JP6154592B2 JP 6154592 B2 JP6154592 B2 JP 6154592B2 JP 2012199362 A JP2012199362 A JP 2012199362A JP 2012199362 A JP2012199362 A JP 2012199362A JP 6154592 B2 JP6154592 B2 JP 6154592B2
Authority
JP
Japan
Prior art keywords
encoded data
compression
bits
unit
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012199362A
Other languages
English (en)
Other versions
JP2014056013A (ja
Inventor
俊平 佐藤
俊平 佐藤
高橋 護
護 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP2012199362A priority Critical patent/JP6154592B2/ja
Publication of JP2014056013A publication Critical patent/JP2014056013A/ja
Application granted granted Critical
Publication of JP6154592B2 publication Critical patent/JP6154592B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、圧縮装置、伸張装置、圧縮伸張装置、圧縮方法、圧縮制御プログラム、および音声データ構造に関する。
インターネット等の通信で利用されるIP(Internet Protocol)を用いた音声通話システムが知られている。このような音声通話システムは、VoIP(Voice over Internet Protocol)システムと呼ばれる。VoIPシステムにおいて、音声データは、通常のIPネットワークシステムと同様に、パケットと呼ばれる単位に分割され、IPネットワーク上に送出される。
VoIPシステムにおいて扱われるデータは、上述したように通話音声データである。従って、VoIPシステムでは、高品質でかつリアルタイムな通信が要求される。また、回線障害を未然に防ぎつつより多くのユーザを収容するため、VoIPシステムでは、ネットワークの回線負荷の低減が、求められている。
回線負荷を低減する代表的な技術として無音圧縮を挙げることができる。無音圧縮において、声を出していない無音部分についてのパケットは、送信されない。ただし、無音圧縮を用いた通話の品質は、無音状態を検出するための検出器の検出精度の影響を受け易い。従って、上記検出器の精度が一定以下の場合、たとえば、受話側で音声の先頭部分が途切れたり、あるいはブツブツ音がするなど、通話品質が安定しない場合もある。
この問題に対して、特許文献1は、有音を検知した以前のデータから有音圧縮を開始する音声圧縮方法について記載する。具体的には、図14に示すように、有音圧縮は、音声検出しきい値を上回ったタイミング(T1時点)から即座に開始されるのではなく、「もしもし」の最初の「も」の時間に相当する期間T0〜T1だけ遡って開始される。このような方法により、受話側で音声の先頭部分が途切れる問題が解消される可能性が高まる。
一方、音声コーデックの方法として、ACELP(ITU−T G.729)やADPCM(ITU−T G.726)が知られている。ACELPやADPCMは、音声データの符号化をリアルタイムに行うことが可能である。また、ACELPやADPCMのデータ圧縮率は比較的高いため、回線負荷は、低く抑えられる。上記において、ACELPは、Algebraic Code Excited Linear Predictionの略である。ADPCMは、Adaptive Differential Pulse Code Modulationの略である。ITU−Tは、International Telecommunication Union Telecommunication Standardization Sectorの略である。
また、リアルタイム音声コーデックの別の例として、μ−law(ITU−T G.711)が知られている。μ−lawは、平均オピニオン評点で高い評価を受ける。平均オピニオン評点とは、マルチメディア(音声、電話、 動画)でコーデックを使って帯域幅を圧縮した際に、圧縮・転送後に受信側で知覚されるメディアの品質の評価を数値で表したものである。すなわち、μ−lawの音声品質は高い。
特開2005−266411号公報
しかしながら、上述した各種方法のうち、VoIPシステムに求められる上記3つの要求(高品質、即時性、低回線負荷)を同時に満たすものはない。
一般的な無音圧縮の欠点を改善した特許文献1の方法の場合、少なくとも音声の高品質化は達成される可能性がある。なぜならば、音声の先頭部分が途切れる問題が回避される可能性が高まるからである。しかしながら、特許文献1における有音圧縮は、図14に示すように、音声検出しきい値を上回った時点から所定の期間(T0〜T1)だけ遡って開始される。すなわち、このことは、音声信号が上記所定の期間だけ遅延することを意味する。よって、特許文献1は、即時性という観点ではVoIPの要求を満たしているとは言い難い。
ACELPやADPCMの場合、即時性、および回線負荷の抑制は達成される可能性がある。しかしながら、ACELPやADPCMは、データ圧縮率が高い反面、μ−lawほどの音声品質を有していない。
μ−lawの場合、即時性と音声品質については問題ないが、ACELPやADPCMと比較してどうしてもデータレートが高くなってしまう。すなわち、μ−lawは、回線負荷を十分に低減できないと言う問題を抱えている。
本発明は、上記課題を解決するためになされたものであり 音声品質が高く、即時性に優れ、しかも回線負荷が低い音声通信を実行することが可能な、圧縮装置、伸張装置、圧縮伸張装置、圧縮方法、圧縮制御プログラム、および音声データ構造を提供することを目的とする。
本発明の圧縮装置は、音声信号を符号化して複数ビットの第1符号化データを生成する符号化部と、無音状態とみなされる所定の数値範囲内に収まる前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを生成する圧縮部と、を備える。
本発明の伸張装置は、音声信号が符号化された複数ビットの第1符号化データが無音状態とみなされる所定の数値範囲内に収まるときに、前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを受信する受信部と、前記共通の値を保持し、前記受信した第2符号化データと前記共通の値のビットとを結合して前記第1符号化データを復元する復元部と、を備える。
本発明の圧縮伸張装置は、音声信号を符号化して複数ビットの第1符号化データを生成する符号化部と、無音状態とみなされる所定の数値範囲内に収まる前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを生成する圧縮部と、を含むデータ圧縮部と、音声信号が符号化された複数ビットの第1符号化データが無音状態とみなされる所定の数値範囲内に収まるときに、前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを他の装置から受信する受信部と、前記他の装置において削除された前記共通の値を保持し、前記受信した第2符号化データと前記他の装置において削除された共通の値のビットとを結合して前記他の装置において生成された第1符号化データを復元する復元部と、を含むデータ伸張部と、を備える。
本発明の圧縮方法は、音声信号を符号化して複数ビットの第1符号化データを生成し、無音状態とみなされる所定の数値範囲内に収まる前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを生成する。
本発明の圧縮制御プログラムは、圧縮装置のコンピュータに、音声信号を符号化して複数ビットの第1符号化データを生成する第1処理と、無音状態とみなされる所定の数値範囲内に収まる前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを生成する第2処理とを実行させる。
本発明の音声データ構造は、音声信号が符号化された複数ビットの第1符号化データが無音状態とみなされる所定の数値範囲内に収まるときに、前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを含む。
本発明によって、音声品質が高く、即時性に優れ、しかも回線負荷が低い音声通信を実行することが可能となる。
本発明の第1の実施形態に係る音声通信システムの構成例を示すブロック図である。 図1に示す第1音声通信装置の構成例を示すブロック図である。 図2に示す送信処理部の構成例を示すブロック図である。 μ−lawの符号化規則を説明する図であり、(a)はμ−law正入力と符号化データとの関係を示す図であり、(b)はμ−law負入力と符号化データとの関係を示す図である。 μ−lawにおいてセグメント番号が1の場合の符号化データのビット配列を示す図である。 図2に示す受信処理部の構成例を示すブロック図である。 第1の実施形態に係る音声通信システム、詳細には、圧縮判定部の動作例を説明するためのデータ変遷図である。 第1の実施形態に係る音声通信システム、詳細には、音声フレーム生成部の動作例を説明するためのデータ変遷図である。 第1の実施形態に係る音声通信システム、詳細には、伸張判定部の動作例を説明するためのデータ変遷図である。 本発明の第2の実施形態に係る圧縮装置の構成例を示すブロック図である。 本発明の第3の実施形態に係る伸張装置の構成例を示すブロック図である。 本発明の第4の実施形態に係る圧縮装置の構成例を示すブロック図である。 図12に示すメモリに記憶される圧縮制御プログラムの構成例を示すブロック図である。 特許文献1の音声圧縮方法を説明するための図である。
[第1の実施形態]
図1は、本発明の第1の実施形態に係る音声通信システム100の構成例を示すブロック図である。音声通信システム100は、第1音声通信装置102と、第2音声通信装置104と、を備える。第1音声通信装置102と第2音声通信装置104は、ネットワーク106を介して互いに接続される。ネットワーク106は、IPプロトコルを利用したパケット通信による音声ネットワークである。第1音声通信装置102および第2音声通信装置104の各々は、入力されたアナログ音声を音声パケットに変換してネットワーク106へ送信するとともに、ネットワーク106から受信した音声パケットを変換してアナログ音声として出力する。すなわち、第1音声通信装置102と第2音声通信装置104との間で、ネットワーク106を介した音声通話が実行される。
なお、第1音声通信装置102と第2音声通信装置104とを同一に構成することができる。以下では、両者が同一に構成される場合を例に挙げるとともに、第2音声通信装置104の構成および動作の説明については省略する。
図2は、第1音声通信装置102の構成例を示すブロック図である。第1音声通信装置102は、音声入力部200と、送信処理部202と、受信処理部204と、音声出力部206と、を備える。
音声入力部200は、操作者の音声を電気信号(アナログ音声信号)に変換する。送信処理部202は、音声入力部200から出力されたアナログ音声信号をデジタル化した後に音声信号パケットに変換し、ネットワーク106へ送信する。受信処理部204は、ネットワーク106から受信した音声信号パケットをアナログ音声信号に変換する。音声出力部206は、アナログ音声信号を、音声に変換する。
図3は、送信処理部202の構成例を示すブロック図である。送信処理部202は、符号化部300と、圧縮判定部302と、音声フレーム生成部304と、送信制御部306と、送信部308と、を備える。
符号化部300は、音声入力部200から入力したアナログ音声信号をμ−lawで符号化し、生成された8ビットの符号化データを圧縮判定部302へ出力する。
圧縮判定部302は、符号化部300から入力した8ビットの符号化データが圧縮可能なデータであるか否かを判定し、この符号化データに圧縮の可否を示す1ビットの圧縮可能フラグを付加して9ビットのデータとして出力する。μ−lawにおいて、無音時の音声データのほとんどがセグメント番号1の範囲内に収まる。そして、図5の太破線で示すとおり、セグメント番号1の範囲内に収まる符号化データの配列は規則的な配列となる。具体的には、セグメント番号1の場合の符号化データにおける上位4ビットのうちMSB(Most Significant Bit)を除いた3ビットの配列は「111(2進数)」となる。圧縮判定部302は、符号化データの上記3ビットの配列を確認することで、符号化データが圧縮可能なデータであるか否かを判定する。以降、符号化データのMSBを符号ビット、符号化データの上位4ビットの内MSBを除いた3ビットを圧縮ビット、符号化データの下位4ビットを非圧縮ビットと記載する。
圧縮ビットが「111(二進数)」である場合、圧縮判定部302は、圧縮可能フラグに「圧縮可」を示す数値(たとえば、“1”)を設定する。一方、圧縮ビットが「111(二進数)」でない場合、圧縮判定部302は、圧縮可能フラグに「圧縮不可」を示す数値(たとえば、“0”)を設定する。
音声フレーム生成部304は、圧縮判定部302より受信した符号化データを、送信制御部306から指示される結合数(以下、正の整数Aと表現する)で結合して音声フレームを生成する。音声フレームは、圧縮の有無を設定する音声ヘッダと、アナログ音声をμ−lawで符号化した符号化データを複数まとめた音声データとを含む。
音声フレーム生成部304は、音声データが無音であった場合に可逆圧縮を実行する。具体的には、受信した符号化データA個の圧縮可能フラグのすべてが「圧縮可」に設定されている場合、音声フレーム生成部304は、符号ビットを受信した順に並べた符号データと、非圧縮ビットを受信した順に並べた非圧縮データとを結合して音声データを生成する。音声フレーム生成部304は、圧縮設定が「有効」に設定された1バイトの音声ヘッダと上記音声データ(圧縮ビットが含まれない音声データ)とを結合して音声フレームを生成する。要するに、音声ヘッダに含まれる圧縮設定は、受信側の音声通信装置での伸張時に参照される情報であり、圧縮を行ったか否かを示す情報(すなわち、圧縮ビットを削除したか否かを示す情報)である。
一方、受信した符号化データA個のうち圧縮可能フラグが「圧縮不可」設定されているものが1つ以上ある場合、音声フレーム生成部304は、符号化データを受信した順に並べた音声データを生成する。音声フレーム生成部304は、圧縮設定が「無効」に設定された1バイトの音声ヘッダと上記音声データ(圧縮ビットが含まれる音声データ)とを結合して音声フレームを生成する。
なお、音声ヘッダにおける圧縮設定は、有効/無効の2通りで表現される。すなわち、音声ヘッダ自体は1バイトであるが、圧縮設定は1ビットで表現することが可能である。ここで、宛先、シーケンス番号等の制御情報を独自の音声ヘッダに付加する音声通信システム(例えば、特開2004−186892号公報参照)が知られている。このような音声通信システムの場合、上記独自の音声ヘッダの空いている1ビットを圧縮設定に使用することが可能であるため、圧縮設定専用の1バイトの音声ヘッダは不要である。従って、このような音声通信システムの場合、音声フレームのデータ量増加を抑制することができる。
送信制御部306は、音声フレーム生成部304に対して、音声パケットの送出間隔に基づいた結合数を通知する。また、送信制御部306は、送信部308に対して、音声パケットの送出を指示する。
送信部308は、送信制御部306からの送出指示に基づき、ネットワーク106上に音声パケットを送出する。音声パケットは、IPヘッダと、音声フレーム生成部304で生成された音声フレームとを含む。
以上説明した送信処理部202内において、符号化部300から音声フレーム生成部304までの一連の各処理は、いずれもシンプルな処理であり、特に長時間を要する処理ではない。従って、上記一連の各処理をG.711の標本化周波数である8kHzのクロックの周期125μsec内に完了させることは、十分に可能である。
図6は、受信処理部204の構成例を示すブロック図である。受信処理部204は、受信部400と、伸張判定部402と、受信バッファ部404と、バッファ管理部406と、復号部408と、を備える。
受信部400は、ネットワーク106から音声パケットを受信する。受信部400は、受信部400は、音声パケットから音声フレームを抽出し、伸張判定部402へ出力する。
伸張判定部402は、受信した音声フレームの音声ヘッダを参照することにより、受信した音声フレームの音声データが圧縮された音声データであるか否かを判定する。圧縮された音声データであった場合、伸張判定部402は、音声データとして送信された符号ビットおよび非圧縮ビットと、圧縮された(音声データとして送信されなかった)圧縮ビットとを結合して元の8ビットの符号化データを復元する。伸張判定部402は、復元された8ビットの符号化データの複数個を結合して音声データを作成し、受信バッファ部404へ出力する。
受信した音声フレームの音声ヘッダが圧縮された音声データでなかった場合、伸張判定部402は、受信した音声データをそのまま受信バッファ部404へ送出する。
受信バッファ部404は、伸張判定部402から出力された音声データを一時的に蓄積する。
なお、受信バッファ部404は、揺らぎ、遅延を吸収する機能(例えば、特開2005−136742号公報)を有することもできる。
復号部408は、受信バッファ部404が蓄積した音声データを読み出して音声信号に復号し、音声出力部206へ出力する。
以下、第1の実施形態に係る音声通信システム100の動作について説明する。なお、以下の説明では、本実施形態の特徴的構成である、圧縮判定部302、音声フレーム生成部304、および伸張判定部402の動作について説明する。
図7は、圧縮判定部302の動作例を説明するためのデータ変遷図である。
圧縮判定部302は、125μsec毎に符号化部300から8ビットの符号化データを入力する。符号化データは、1ビットの符号ビット、3ビットの圧縮ビット、4ビットの非圧縮ビットの計8ビットを含む。圧縮判定部302は、圧縮ビットを参照し、対象の符号化データが圧縮可能なデータであるか否かを判定し、この符号化データに圧縮の可否を示す1ビットの圧縮可能フラグを付加して9ビットのデータとして出力する。圧縮判定部302は、圧縮ビットが「111(二進数)」である場合、圧縮可能フラグに「圧縮可」を示す数値(たとえば、“1”)を設定する。一方、圧縮ビットが「111(二進数)」でない場合、圧縮判定部302は、圧縮可能フラグに「圧縮不可」を示す数値(たとえば、“0”)を設定する。
図8は、音声フレーム生成部304の動作例を説明するためのデータ変遷図である。
音声フレーム生成部304は、予め、送信制御部306から符号化データを結合する数(結合数A)の通知を受ける(ステップS1)。以下では、結合数Aが160である場合を例に挙げる。
音声フレーム生成部304は、125μsec毎に圧縮判定部302から9ビットのデータを入力する。9ビットのデータは、1ビットの圧縮可能フラグと8ビットの符号化データを含む。
音声フレーム生成部304は、160個ごとに9ビットデータの圧縮可能フラグを確認する(ステップS2)。上記確認結果に基づいて、音声フレーム生成部304は、圧縮された音声データあるいは非圧縮の音声データのいずれかを含む音声フレームを生成する(ステップS3)。いずれの場合も、音声フレームは、1バイトの音声ヘッダと複数バイトの音声データを含む。ただし、以下で説明するように、音声ヘッダの設定値および音声データのバイト長は、上記圧縮可能フラグの確認結果によって異なる。
160個すべての圧縮可能フラグが1に設定されている場合、音声フレーム生成部304は、圧縮された音声データを含む音声フレームを生成する(ステップS4)。この音声フレームの音声ヘッダには、圧縮設定が「有効」であることを示す値が設定されている。また、この音声フレームの音声データは、160個の符号化データの符号ビットを受信した順に並べた符号データと、非圧縮ビットを受信した順に並べた非圧縮データとを含む。この場合、符号データは、(160個×1ビット)/8ビット=20バイトである。一方、非圧縮データは、(160個×4ビット)/8ビット=80バイトである。すなわち、この場合の音声データは、20+80=100バイトである。
160個の圧縮可能フラグのうち0が設定されているものが1つ以上ある場合、音声フレーム生成部304は、非圧縮の音声データを含む音声フレームを生成する(ステップS5)。この音声フレームの音声ヘッダには、圧縮設定が「無効」であることを示す値が設定されている。また、この音声フレームの音声データは、160個の符号化データ(8ビット)を含む。すなわち、この場合の音声データは、160バイトである。
図9は、伸張判定部402の動作例を説明するためのデータ変遷図である。
伸張判定部402は、20msec毎に受信部400から音声フレームを受信する。伸張判定部402は、音声フレームの音声ヘッダを参照し、受信した音声フレームの音声データが圧縮された音声データであるか否かを判定する(ステップS10)。
圧縮された音声データであった場合、伸張判定部402は、符号化データ毎に、1ビットの符号ビットと、3ビットの圧縮ビット(この場合、「111(二進数)」)と、非圧縮ビット(4ビット)とを、MSBから順に結合して元の8ビット単位の符号化データを復元する。ここで、符号ビットと非圧縮ビットは、音声フレームにより送信されるが、圧縮ビットは、音声フレームにより送信されない。そこで、受信部204あるいは伸張判定部402の所定の記憶部(不図示)には、圧縮ビットが「111(二進数)」であることが予め記憶されている。伸張判定部402は、上記記憶部を参照して圧縮ビットの値を取得し、上述したように元の8ビットの符号化データを復元する。伸張判定部402は、8ビットに復元された符号化データを160個分結合した音声データ(160バイト)を、受信バッファ404へ出力する。
圧縮された音声データでなかった場合、伸張判定部402は、受信した音声フレームの音声データ(160バイト)を、そのまま受信バッファ部404へ出力する。
以上説明した第1の実施形態において、音声符号化は、μ−lawによって行われる。μ−lawは、平均オピニオン評点で高い評価を受けるほどに音声品質は高い。従って、VoIPの品質要求に十分応えることができる。
また、μ−lawはリアルタイム音声コーディングが可能である。さらに、送信処理部202内の各処理は、シンプルな処理であるため、μ−law(G.711)の標本化周波数(8kHz)の周期(125μsec)内に完了可能である。すなわち、送信処理部202で実行される上記圧縮処理が余計な遅延を発生させることはないので、第1の実施形態において、μ−lawの即時性は、維持される。
さらに、以上説明した第1の実施形態では、μ−lawで符号化された符号化データを圧縮しているので、単にμ−lawで符号化するだけの音声通信システムと比較して、データ量を削減することができる。すなわち、第1の実施形態は、回線負荷を低減させることができる。しかも、この場合の圧縮は可逆圧縮であるため、データの品質が低下することもない。
第1の実施形態によるデータ量削減効果について詳細に説明する。第1の実施形態において圧縮対象となるのはセグメント番号1の範囲内のデータである。セグメント番号1の領域は全領域256のうちの32である。また、符号化データがセグメント番号1の範囲内である場合(すなわち、符号化データが無音データと判断される場合)、圧縮されるのは8ビットのうちの3ビットである。すなわち、第1の実施形態は、32/256の範囲内においてデータ量を約5/8にするだけのデータ量削減効果を有することになる。ここで、無音状態が占める割合が高い(セグメント番号1に収まる割合が高い)通話の場合、より一層データ量削減効果が発揮される。
以上を纏めると、第1の実施形態によって、音声品質が高く、即時性に優れ、しかも回線負荷が低い音声通信を実行することが可能となる。
なお、以上の説明では、音声コーデックとしてITU−T G.711におけるμ−lawを使用する場合を例に挙げたが、第1の実施形態はこれに限定されず、A−lawにも適用することが可能である。この場合、符号化部300の一部の構成を、A−lawに即した構成とすればよい。
[第2の実施形態]
図10は、本発明の第2の実施形態に係る圧縮装置500の構成例を示すブロック図である。圧縮装置500は、符号化部502と、圧縮部504と、を備える。符号化部502は、音声信号を符号化して複数ビットの第1符号化データを生成する。圧縮部504は、無音状態とみなされる所定の数値範囲内に収まる第1符号化データから上記複数ビットのうちの共通の値のビットが削除された第2符号化データを生成する。
以上説明した第2の実施形態の場合、第1符号化データの所定のビットが削除された第2符号化データを生成する。すなわち、ネットワーク上では、第1符号化データではなく、データ量が削減された第2符号化データが送信される。従って、第2の実施形態によって、回線負荷を低減させることができる。さらに、この場合、削除されるビットは共通の値となるビットである。すなわち、受信側は予めその値を認知することができるため、受信側において元の符号化データ(第1符号化データ)を完全に再現することが可能である。従って、この圧縮処理により音声品質が低下することはない。また、第1符号化データの値が無音と判断される数値範囲内に収まっているか否かを判定する処理および共通の値となるビットを削除する処理は、シンプルな処理であり、特に長時間を要する処理ではない。従って、たとえば、符号化処理にリアルタイム音声コーデック(例えば、ITU−T G.711のμ−law)を採用した場合であっても、その音声コーデックの処理遅延以上の遅延が発生することはない。以上を纏めると、第2の実施形態によって、音声品質が高く、即時性に優れ、しかも回線負荷が低い音声通信が実行可能となる。
[第3の実施形態]
図11は、本発明の第3の実施形態に係る伸張装置550の構成例を示すブロック図である。伸張装置550は、受信部552と、復元部554と、を備える。受信部552は、音声信号が符号化された複数ビットの第1符号化データが無音状態とみなされる所定の数値範囲内に収まるときに、第1符号化データから上記複数ビットのうちの共通の値のビットが削除された第2符号化データを受信する。復元部554は、上記共通の値を保持し、受信した第2符号化データと共通の値のビットとを結合して第1符号化データを復元する。
第2の実施形態と同一の理由により、以上説明した第3の実施形態によって、音声品質が高く、即時性に優れ、しかも回線負荷が低い音声通信が実行可能となる。
[第4の実施形態]
図12は、本発明の第3の実施形態に係る圧縮装置600の構成例を示すブロック図である。
圧縮装置600は、CPU(Central Processing Unit)602と、メモリ604と、を備える。メモリ604は、圧縮制御プログラム700を記憶する。CPU602は、圧縮制御プログラム700を実行する。メモリ604の例としては、たとえば、ROM(Read Only Memory)、ハードディスク、リムーバブルメディア、あるいはリムーバブルディスク等を挙げることができる。
図13は、圧縮制御プログラム700の構成例を示すブロック図である。圧縮制御プログラム700は、第1プログラム702と、第2プログラム704と、を含む。
第1プログラム702は、音声信号を符号化して複数ビットの第1符号化データを生成する第1処理を実行するための命令群である。具体的には、第1処理は、第1の実施形態の符号化部300によって実行される処理に相当する。
第2プログラム704は、無音状態とみなされる所定の数値範囲内に収まる前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを生成する第2処理を実行する命令群である。具体的には、第2処理は、第1の実施形態の圧縮判定部302によって実行される処理および音声フレーム生成部304によって実行される処理に相当する。
第1の実施形態と同一の理由により、以上説明した第4の実施形態によって、音声品質が高く、即時性に優れ、しかも回線負荷が低い音声通信が実行可能となる。
100 音声通信システム
102 第1音声通信装置
104 第2音声通信装置
106 ネットワーク
200 音声入力部
202 送信処理部
204 受信処理部
206 音声出力部
300 符号化部
302 圧縮判定部
304 音声フレーム生成部
306 送信制御部
308 送信部
400 受信部
402 伸張判定部
404 受信バッファ部
406 バッファ管理部
408 復号部
500 圧縮装置
502 符号化部
504 圧縮部
550 伸張装置
552 受信部
554 復元部
600 圧縮装置
602 CPU
604 メモリ
700 圧縮制御プログラム
702 第1プログラム
704 第2プログラム

Claims (8)

  1. 音声信号を符号化して複数ビットの第1符号化データを生成する符号化部と、
    無音状態とみなされる所定の数値範囲内に収まる前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを生成する圧縮部と、
    を備えることを特徴とする圧縮装置。
  2. 前記圧縮部は、前記第2符号化データと前記削除を行った旨を示す識別情報とを含むフレームを構成することを特徴とする請求項1記載の圧縮装置。
  3. 前記符号化の方式は、ITU−T G.711規格のμ−law方式であることを特徴とする請求項1または2記載の圧縮装置。
  4. 前記所定の数値範囲は、前記μ−law方式におけるセグメント番号1の範囲を含むことを特徴とする請求項3記載の圧縮装置。
  5. 音声信号が符号化された複数ビットの第1符号化データが無音状態とみなされる所定の数値範囲内に収まるときに、前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを受信する受信部と、
    前記共通の値を保持し、前記受信した第2符号化データと前記共通の値のビットとを結合して前記第1符号化データを復元する復元部と、
    を備えることを特徴とする伸張装置。
  6. 音声信号を符号化して複数ビットの第1符号化データを生成する符号化部と、無音状態とみなされる所定の数値範囲内に収まる前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを生成する圧縮部と、を含むデータ圧縮部と、
    音声信号が符号化された複数ビットの第1符号化データが無音状態とみなされる所定の数値範囲内に収まるときに、前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを他の装置から受信する受信部と、前記他の装置において削除された前記共通の値を保持し、前記受信した第2符号化データと前記他の装置において削除された共通の値のビットとを結合して前記他の装置において生成された第1符号化データを復元する復元部と、を含むデータ伸張部と、
    を備えることを特徴とする圧縮伸張装置。
  7. 音声信号を符号化して複数ビットの第1符号化データを生成し、
    無音状態とみなされる所定の数値範囲内に収まる前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを生成する
    ことを特徴とする圧縮方法。
  8. 圧縮装置のコンピュータに、
    音声信号を符号化して複数ビットの第1符号化データを生成する第1処理と、
    無音状態とみなされる所定の数値範囲内に収まる前記第1符号化データから前記複数ビットのうちの共通の値のビットが削除された第2符号化データを生成する第2処理と
    を実行させることを特徴とする圧縮制御プログラム。
JP2012199362A 2012-09-11 2012-09-11 圧縮装置、伸張装置、圧縮伸張装置、圧縮方法、圧縮制御プログラム、および音声データ構造 Active JP6154592B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012199362A JP6154592B2 (ja) 2012-09-11 2012-09-11 圧縮装置、伸張装置、圧縮伸張装置、圧縮方法、圧縮制御プログラム、および音声データ構造

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012199362A JP6154592B2 (ja) 2012-09-11 2012-09-11 圧縮装置、伸張装置、圧縮伸張装置、圧縮方法、圧縮制御プログラム、および音声データ構造

Publications (2)

Publication Number Publication Date
JP2014056013A JP2014056013A (ja) 2014-03-27
JP6154592B2 true JP6154592B2 (ja) 2017-06-28

Family

ID=50613395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012199362A Active JP6154592B2 (ja) 2012-09-11 2012-09-11 圧縮装置、伸張装置、圧縮伸張装置、圧縮方法、圧縮制御プログラム、および音声データ構造

Country Status (1)

Country Link
JP (1) JP6154592B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6289998A (ja) * 1985-10-16 1987-04-24 日本電気株式会社 音声蓄積システム
JP4871420B2 (ja) * 2011-06-15 2012-02-08 日本電信電話株式会社 符号化方法、符号化装置、復号方法、復号装置及びプログラム

Also Published As

Publication number Publication date
JP2014056013A (ja) 2014-03-27

Similar Documents

Publication Publication Date Title
JPS59153346A (ja) 音声符号化・復号化装置
US20100324914A1 (en) Adaptive Encoding of a Digital Signal with One or More Missing Values
TW200917764A (en) System and method for providing AMR-WB DTX synchronization
JPH11177623A (ja) データ送出装置、データ受信装置及びデータ伝送装置
JPWO2009008220A1 (ja) 音声パケット受信装置、音声パケット受信方法、およびプログラム
JP2002221994A (ja) 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体
KR101516113B1 (ko) 음성 복호 장치
JP4862262B2 (ja) Dtmf信号処理方法、処理装置、中継装置、及び通信端末装置
JP6154592B2 (ja) 圧縮装置、伸張装置、圧縮伸張装置、圧縮方法、圧縮制御プログラム、および音声データ構造
KR100542435B1 (ko) 패킷 망에서의 프레임 손실 은닉 방법 및 장치
JP4406382B2 (ja) 音声符号化選択制御方法
JP2006279809A (ja) 音声再生装置および音声再生方法
JP4572755B2 (ja) 復号化装置,復号化方法及びデジタル音声通信システム
JP2003249977A (ja) データ送出装置、データ受信装置及びデータ伝送装置
JP2016170272A (ja) 送信装置、音声認識システム、送信方法、およびプログラム
US8300622B2 (en) Systems and methods for tandem free operation signal transmission
JP4597360B2 (ja) 音声復号装置及び音声復号方法
JP4392378B2 (ja) 音声符号化選択制御方法
JP2002252644A (ja) 音声パケット通信装置及び音声パケット通信方法
JP6972576B2 (ja) 通信装置、通信システム、通信方法及びプログラム
JP2011259345A (ja) 符号化装置
JP4869882B2 (ja) 音声復号装置
JP3980592B2 (ja) 通信装置、符号化列送信装置、符号化列受信装置、これらの装置として機能させるプログラムとこれを記録した記録媒体、および符号列受信復号方法、通信装置の制御方法
JP2004023191A (ja) 信号符号化方法及び信号復号化方法及び信号符号化装置及び信号復号化装置及び信号符号化プログラム及び信号復号化プログラム
JP4230900B2 (ja) 音声通信端末

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150824

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160927

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170602

R150 Certificate of patent or registration of utility model

Ref document number: 6154592

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350