JP2000075897A - 符号化された音声データの削減方法、及び装置、及びそのプログラムを格納した記録媒体 - Google Patents

符号化された音声データの削減方法、及び装置、及びそのプログラムを格納した記録媒体

Info

Publication number
JP2000075897A
JP2000075897A JP10244159A JP24415998A JP2000075897A JP 2000075897 A JP2000075897 A JP 2000075897A JP 10244159 A JP10244159 A JP 10244159A JP 24415998 A JP24415998 A JP 24415998A JP 2000075897 A JP2000075897 A JP 2000075897A
Authority
JP
Japan
Prior art keywords
audio data
unit
audio
input
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10244159A
Other languages
English (en)
Inventor
Hiromasa Hirata
寛将 平田
Masaru Ando
大 安藤
Yasuhito Hayashi
林  泰仁
Hiroshi Koyano
浩 小谷野
Takehiro Moriya
健弘 守谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10244159A priority Critical patent/JP2000075897A/ja
Publication of JP2000075897A publication Critical patent/JP2000075897A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】端末での処理量を増やさず、かつ、復号した音
声の音質劣化が少ないように符号化音声データを削減す
ることができる符号化音声データの削減方法を提供す
る。 【解決手段】 符号化音声データ処理部において、音響
パワー値のしきい値Sを設定し(S501)、符号化音
声データを符号化の単位であるフレーム単位で、かつ、
1フレーム分の時間間隔で入力し(S503)、入力し
たフレーム単位の符号化音声データから音響パワー値の
情報を有する部分だけを読み込み、読み込んだ情報を解
析して音響パワー値Pを算出し(S504)、音響パワ
ー値Pとしきい値Sを比較し、音響パワー値Pが設定し
たしきい値Sより大きい場合、入力したフレーム単位の
符号化音声データを音声復号化部へ出力し(S50
6)、解析した音響パワー値Pが設定したしきい値Sよ
り小さい場合、音声復号化部へ何も出力しない(S50
7)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声符号化の技術
に係り、特に符号化された音声データ量を削減するため
に用いて好適な符号化された音声データの削減方法、及
び装置、及びそのプログラムを格納した記録媒体に関す
る。
【0002】
【従来の技術】音声を電気的に扱う為には、アナログ信
号である音声波形を一様なステップでサンプリングし、
ディジタル信号に変換しなければならない。このディジ
タル信号への変換により、音声を約64kbit/sの
ビット数のデータ量で表現できる。だが、ディジタル化
された音声信号には大きな冗長性があり、音声波形の相
関、スペクトル特性、ピッチ構造などを利用することで
音声信号を圧縮符号化して、データ量を減少出来る。こ
の音声符号化技術により、音声データの蓄積に要する蓄
積容量を大きく削減出来、また、ディジタルな音声通信
によるネットワークへの負荷を軽減出来る。現在は、さ
らなる音声データの削減が求められており、さらに高圧
縮な音声符号化方式が検討されている。だが、この様な
高圧縮の音声符号化方式では、アルゴリズムの複雑さに
より、符号化/復号化に要する処理量の増加が懸念され
る。マルチメディアアプリケーションレベルで考えた場
合、端末での他のアプリケーションとの連携等を考慮
し、処理量の増加はできるだけ抑えるのが望ましい。
【0003】音声符号化技術では、音声信号から数十m
secの間隔(フレーム)で信号を切り出し、その区間
毎に圧縮符号化して、符号化音声データに変換する。音
声信号全体としては、フレーム単位の符号化音声データ
が時系列的に連続した符号化音声データストリームに変
換される(図1参照)。この符号化音声データストリー
ム中から、フレームを単位として所定の周期で所定のデ
ータ量を削除すれば、音声データ量は削減される(図2
参照)。図2では符号化音声データストリームを3フレ
ーム周期的で3フレーム分削減することで削減された符
号化音声データストリームを得る例を示している。ま
た、この場合、復号化に要する処理量は、削減されてい
る分復号化するデータ量が少ないので、軽減される。し
かし、単に削減した符号化音声データストリームを復号
化すれば、削除された箇所の音声信号はなくなり、復号
音声は話速が上がった“早口”なものとなる(図3
(a)参照)。早口となる問題を回避するには、復号化
の際、削除した箇所で削除したフレーム分の無音信号を
挿入するか、削除したフレーム分の時間だけ復号化処理
を停止すればよい。だが、そうした場合でも、周期的に
符号化音声データを削除する為、復号音声の波形は極端
に不連続になり、かつ、音声を特徴づける子音部分が欠
落して、復号音声の音質は劣化してしまう問題点が残る
(図3(b)参照)。
【0004】
【発明が解決しようとする課題】本発明は、上記の問題
点を克服する為に、端末での処理量を増やさず、かつ、
復号した音声の音質劣化が少ないように、符号化音声デ
ータそのものを削減することができる符号化された音声
データの削減方法、及び装置、及びそのプログラムを格
納した記録媒体を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明では、音声信号を
圧縮符号化し、音声情報の一部として音響パワー値の情
報を含む符号化音声データを生成する音声符号化技術を
用いて、既に圧縮符号化済である該符号化音声データを
蓄積してある符号化音声データ蓄積部、または、既に圧
縮符号化済である該符号化音声データを端末外部から入
力する音声データ入力部と、該符号化音声データを符号
化の単位であるフレーム単位で処理する符号化音声デー
タ処理部と、該符号化音声データを音声信号に復号化す
る音声復号化部と、音声信号を再生出力する音声再生部
とを持つ端末において、該符号化音声データ処理部で
は、 ●該符号化音声データ蓄積部、または、該音声データ入
力部から、該符号化音声データを、符号化の単位である
フレーム単位で、かつ、1フレーム分の時間間隔で、入
力する手段と、 ●該入力したフレーム単位の該符号化音声データから、
音響パワー値の情報を有する部分だけを読み込む手段
と、 ●該読み込んだ情報を解析して、音響パワー値を算出す
る手段と、 ●音響パワー値のしきい値を設定する手段と、 ●該解析した音響パワー値と該設定したしきい値を比較
し、該解析した音響パワー値が該設定したしきい値より
大きい場合、該入力したフレーム単位の該符号化音声デ
ータを該音声復号化部へ出力し、該解析した音響パワー
値が該設定したしきい値より小さい場合、該音声復号化
部へ何も出力しない手段とを持ち、該音声復号化部で
は、 ●該符号化音声データ処理部から出力されるフレーム単
位の該符号化音声データを入力し、次に入力される該符
号化音声データを待たずに、即座に復号化し、該音声再
生部へ出力する手段を持つ場合がある。
【0006】また、本発明では、音声信号を圧縮符号化
し、音声情報の一部として音響パワー値の情報を含めた
符号化音声データを生成する音声符号化技術を用いて、
音声信号を該符号化音声データに圧縮符号化する音声符
号化部、または、既に圧縮符号化済である該符号化音声
データを蓄積してある符号化音声データ蓄積部と、該符
号化音声データを符号化の単位であるフレーム単位で処
理する符号化音声データ処理部と、音声データを蓄積す
る音声データ蓄積部と、該符号化音声データを音声信号
に復号化する音声復号化部と、音声信号を再生出力する
音声再生部とを持つ端末において、該符号化音声データ
処理部では、 ●該音声符号化部、または、該符号化音声データ蓄積部
から、該符号化音声データを、フレーム単位で入力する
手段と、 ●該入力されたフレーム単位の該符号化音声データか
ら、音響パワー値の情報を有する部分だけを読み込む手
段と、 ●該読み込んだ情報を解析して、音響パワー値を算出す
る手段と、 ●音響パワー値のしきい値を設定する手段と、 ●該解析した音響パワー値と該設定したしきい値を比較
し、該解析した音響パワー値が該設定したしきい値より
大きい場合、該入力したフレーム単位の該符号化音声デ
ータを該音声データ蓄積部へ出力し、該解析した音響パ
ワー値が該設定したしきい値より小さい場合、無音であ
ることを示す無音コードを該音声データ蓄積部へ出力す
る手段とを持ち、該音声復号化部では、 ●該音声データ蓄積部から、データを入力する手段と、 ●該入力したデータが該無音コードか否かを判定する手
段と、 ●1フレーム分の無音信号を蓄積する手段と、 ●該判定により、該入力したデータが該無音コードでな
い場合、1フレーム分の符号化音声データを入力して復
号化し、復号化した音声信号を該音声再生部に出力し、
該入力したデータが該無音コードの場合、該無音信号を
該音声再生部に出力する、または、1フレーム分の時間
だけ該音声再生部へ何も出力しない手段とを持つ場合も
ある。
【0007】また、本発明では、音声信号を圧縮符号化
し、音声情報の一部として音響パワー値の情報を含めた
符号化音声データを生成する音声符号化技術を用いて、
音声通信を行うシステムで、音声信号を該符号化音声デ
ータに圧縮符号化する音声符号化部、または、既に圧縮
符号化済である該符号化音声データを蓄積してある符号
化音声データ蓄積部と、該符号化音声データを符号化の
単位であるフレーム単位で処理する符号化音声データ処
理部と、外部の端末へ音声データを出力する音声データ
出力部とを持つ端末を送信端末とし、外部の端末から音
声データを入力する音声データ入力部と、該符号化音声
データを音声信号に復号化する音声復号化部と、音声信
号を再生出力する音声再生部とを持つ端末を受信端末と
する、音声通信システムにおいて、該送信端末の該符号
化音声データ処理部では、 ●該音声符号化部、または、該音声データ蓄積部から、
該符号化音声データを、フレーム単位で入力する手段
と、 ●該入力されたフレーム単位の該符号化音声データか
ら、音響パワー値の情報を有する部分だけを読み込む手
段と、 ●該読み込んだ情報を解析して、音響パワー値を算出す
る手段と、 ●音響パワー値のしきい値を設定する手段と、 ●該解析した音響パワー値と該設定したしきい値を比較
し、該解析した音響パワー値が該設定したしきい値より
大きい場合、該入力したフレーム単位の該符号化音声デ
ータを該音声データ出力部へ出力し、該解析した音響パ
ワー値が該設定したしきい値より小さい場合、無音であ
ることを示す無音コードを該音声データ出力部へ出力す
る手段とを持ち、該受信端末の該音声復号化部では、 ●該音声データ入力部から、データを入力する手段と、 ●該入力したデータが該無音コードか否かを判定する手
段と、 ●1フレーム分の無音信号を蓄積する手段と、 ●該判定により、該入力したデータが該無音コードでな
い場合、1フレーム分の符号化音声データを入力して復
号化し、復号化した音声信号を該音声再生部に出力し、
該入力したデータが該無音コードの場合、該無音信号を
該音声再生部に出力する、または、1フレーム分の時間
だけ該音声再生部に何も出力しない手段とを持つ場合も
ある。
【0008】また、本発明では、音声信号を圧縮符号化
し、音声情報の一部として音響パワー値の情報を含めた
符号化音声データを生成する音声符号化技術を用いて、
音声信号を該符号化音声データに圧縮符号化する音声符
号化部、または、既に圧縮符号化済である該符号化音声
データを蓄積してある符号化音声データ蓄積部と、該符
号化音声データを符号化の単位であるフレーム単位で処
理する符号化音声データ処理部と、音声データを蓄積す
る音声データ蓄積部と、該符号化音声データを音声信号
に復号化する音声復号化部と、音声信号を再生出力する
音声再生部とを持つ端末において、該符号化音声データ
処理部では、 ●該音声符号化部、または、該符号化音声データ蓄積部
から、一度に入力する該符号化音声データのフレーム
(符号化の単位)数を、設定する手段と、 ●該音声符号化部、または、該符号化音声データ蓄積部
から、該符号化音声データを、該設定したフレーム数分
だけ入力する手段と、 ●該入力した該符号化音声データからフレーム毎に、音
響パワー値の情報を含む部分だけを読み込む手段と、 ●該読み込んだ情報を解析して、音響パワー値を算出す
る手段と、 ●上記の方法で、該入力した該符号化音声データのフレ
ーム数分の音響パワー値を求め、該入力した該符号化音
声データ内での音響パワー値の平均値を求める手段と、 ●音響パワー値のしきい値を設定する手段と、 ●該音響パワー値の平均値と該設定したしきい値を比較
し、該音響パワー値の平均値が該設定したしきい値より
も大きい場合、該入力した該符号化音声データを全て該
音声データ蓄積部に出力し、該音響パワー値の平均値が
該設定したしきい値よりも小さい場合、無音であること
を示す無音コードを該音声データ蓄積部に出力する手段
とを持ち、該音声復号化部では、 ●該音声データ蓄積部から、データを入力する手段と、 ●該入力したデータが該無音コードか否かを判定する手
段と、 ●該設定したフレーム数分の無音信号を蓄積する手段
と、 ●該判定により、該入力した音声データが該無音コード
でない場合、1フレーム分の符号化音声データを入力し
て復号化し、復号化した音声信号を該音声再生部に出力
し、該入力したデータが該無音コードの場合、該無音信
号を該音声再生部に出力する、または、該設定したフレ
ーム数分の時間だけ該音声再生部に何も出力しない手段
とを持つ場合もある。
【0009】また、本発明では、音声信号を圧縮符号化
し、音声情報の一部として音響パワー値の情報を含めた
符号化音声データを生成する音声符号化技術を用いて、
音声通信を行うシステムで、音声信号を該符号化音声デ
ータに圧縮符号化する音声符号化部、または、既に圧縮
符号化済である該符号化音声データを蓄積してある符号
化音声データ蓄積部と、該符号化音声データを符号化の
単位であるフレーム単位で処理する符号化音声データ処
理部と、外部の端末へ音声データを出力する音声データ
出力部とを持つ端末を送信端末とし、外部の端末から音
声データを入力する音声データ入力部と、該符号化音声
データを音声信号に復号化する音声復号化部と、音声信
号を再生出力する音声再生部とを持つ端末を受信端末と
する、音声通信システムにおいて、該送信端末の該符号
化音声データ処理部では、 ●該音声符号化部、または、該符号化音声データ蓄積部
から、一度に入力する該符号化音声データのフレーム
(符号化の単位)数を、設定する手段と、 ●該音声符号化部、または、該符号化音声データ蓄積部
から、該符号化音声データを、該設定したフレーム数分
だけ入力する手段と、 ●該入力した該符号化音声データからフレーム毎に、音
響パワー値の情報を含む部分だけを読み込む手段と、 ●該読み込んだ情報を解析して、音響パワー値を算出す
る手段と、●上記の方法で、該入力した該符号化音声デ
ータのフレーム数分の音響パワー値 を求め、該入力した該符号化音声データ内での音響パワ
ー値の平均値を求める手段と、 ●音響パワー値のしきい値を設定する手段と、 ●該音響パワー値の平均値と該設定したしきい値を比較
し、該音響パワー値の平均値が該設定したしきい値より
も大きい場合、該入力した該符号化音声データを全て該
音声データ出力部に出力し、該音響パワー値の平均値が
該設定したしきい値よりも小さい場合、無音であること
を示す無音コードを該音声データ出力部に出力する手段
とを持ち、該受信端末の該音声復号化部では、 ●該音声データ入力部から、データを入力する手段と、 ●該入力したデータが該無音コードか否かを判定する手
段と、 ●該設定したフレーム数分の無音信号を蓄積する手段
と、 ●該判定により、該入力した音声データが該無音コード
でない場合、1フレーム分の符号化音声データを入力し
て復号化し、復号化した音声信号を該音声再生部に出力
し、該入力したデータが該無音コードの場合、該無音信
号を該音声再生部に出力する、または、該設定したフレ
ーム数分の時間だけ該音声再生部に何も出力しない手段
とを持つ場合もある。
【0010】なお、特許請求の範囲の記載における各請
求項記載の発明と、発明の実施形態および図面の記載事
項との対応は次の通りである。請求項1、請求項6およ
び請求項11記載の発明は、符号化音声データ処理部
(100)を示す図4、その処理フローを示す図5の記
載事項に対応している。また、請求項2、請求項3、請
求項7、請求項8、請求項12、および請求項13記載
の発明は、符号化音声データ処理部(200)の構成を
示す図8、その処理フローを示す図9の記載事項に対応
し、かつ、音声復号化部(300)の構成図である図1
1と、その処理フロー図である図12の記載事項に対応
している。請求項4、請求項5、請求項9、請求項1
0、請求項14、および請求項15記載の発明は、符号
化音声データ処理部(400)の構成図である図14、
その処理フロー図である図15の記載事項に対応し、か
つ、音声復号化部(500)の構成図である図17と、
その処理フロー図である図18の記載事項に対応してい
る。
【0011】また、請求項16、17、および18記載
の符号化音声データ処理装置は、図4、図8、および図
14にそれぞれ対応し、請求項19、20、および21
記載の符号化音声データ処理方法は、図5、図9、およ
び図15にそれぞれ対応し、そして、請求項22、2
3、および24記載の記録媒体は、図5、図9、および
図15にそれぞれ対応する。また、また、請求項25お
よび26記載の音声復号化装置は、図11および図17
にそれぞれ対応し、請求項27および28記載の音声復
号化方法は、図12および図18にそれぞれ対応し、そ
して、請求項29および30記載の記録媒体は、図12
および図18にそれぞれ対応する。
【0012】
【発明の実施の形態】まず、図4〜図19を参照して本
発明の基本概念について説明する。本発明による符号化
音声データ処理部(100)の構成図を図4に、その処
理フロー図を図5に示し、本処理部(100)の処理内
容を説明する。本発明では、音声信号を圧縮符号化し、
音声情報の一部として音響パワー値の情報を含む符号化
音声データを生成する音声符号化技術を用いる。そし
て、本処理部(100)は、その様な符号化音声データ
ストリームをフレーム単位で、かつ、1フレーム分の時
間間隔で読み込み、以下の式で与えられる音響パワー値
Pをフレーム毎に解析する。
【0013】
【数1】 (x(i):音声波形のサンプル値、N:1フレームに
含まれるサンプル数)
【0014】そして、音響パワー値Pの値により読み込
んだ符号化音声データを削減された符号化音声データス
トリームとして出力するか否かを決定する。その為、予
め、削除の基準となるしきい値Sをしきい値格納部(1
04)に設定しておく(図5のステップS501)。
【0015】符号化音声データが時系列的に連続した符
号化音声データストリームが本処理部(100)に入力
され始めると(ステップS502)、入力ルーチン(1
01)は符号化音声データをフレーム単位で、かつ、1
フレーム分の時間間隔で、入力する(ステップS50
3)。音響パワー値計測ルーチン(102)は、入力し
たフレーム単位の符号化音声データが圧縮している音声
の音響パワー値を求めるが、一度音声波形に復号化して
から音響パワー値を計測するのではなく、音響パワー値
の情報を有する部分のみを読み取り、その読み込んだ情
報から音響パワー値Pを解析して求める(図6参照,ス
テップS504)。そして、削除判定ルーチン(10
3)は、その解析した音響パワー値Pと、しきい値格納
部(104)に設定したしきい値Sとを比較し(ステッ
プS505)、P>Sの場合は、入力したフレーム単位
の符号化音声データを出力し(ステップS506)、P
<Sの場合は、何も出力しない(ステップS507)。
なお、音響パワー値Pとしきい値Sの比較の際には、ど
ちらかに等号を含んだ判定とすることができる。制御ル
ーチン(105)は各ルーチンを制御して上記の処理を
繰り返す。その結果、本処理部(100)は、フレーム
単位で、かつ、1フレーム分の時間間隔で、削減した符
号化音声データストリームを出力する。
【0016】図7に示す本発明による音声復号化部(1
50)では、図4に示す符号化音声データ処理部(10
0)で削減された符号化音声データストリームを入力
し、リアルタイムに、そして、次に入力される符号化音
声データを待たずに、直ちに復号化する。これにより、
符号化音声データ処理部(100)で削除された箇所で
は、本音声復号化部(150)へは何も入力されず、復
号音声としては無音となり、復号音声の話速が保たれ
る。そして、音声の音響パワー値が高い部分では、符号
化音声データが削除されないので、波形の連続性が保た
れ、かつ、子音部分も残る(図7参照)。その為、復号
音声の音質劣化が少ないものとなる。かつ、復号化する
データ量も削減されている分少ないので、復号化に要す
る処理は軽減されることになる。
【0017】本発明による他の符号化音声データ処理部
(200)の構成図を図8に、その処理フロー図を図9
に示し、本処理部(200)の処理内容を説明する。本
処理部(200)では、予め設計時に、無音であること
を示す数bitの無音コードを無音コード格納部(20
5)に設定しておく。また、音響パワー値を符号化音声
データ削除の決定方法にしている為、符号化音声データ
ストリームを入力し始める前に、そのしきい値Sをしき
い値格納部(204)に設定する(図9のステップS9
01)。符号化音声データストリームが本処理部(20
0)に入力され始めると(ステップS902)、入力ル
ーチン(201)は、符号化音声データをフレーム単位
で入力する(ステップS903)。音響パワー値計測ル
ーチン(202)は、入力したフレーム単位の符号化音
声データが圧縮している音声の音響パワー値を求める
が、一度音声波形に復号化してから音響パワー値を計測
するのではなく、音響パワー値の情報を有する部分のみ
を読み取り、その読み込んだ情報から音響パワー値Pを
解析して求める(図6参照,ステップS904)。そし
て、削除判定ルーチン(203)でその解析した音響パ
ワー値Pとしきい値格納部(204)に設定したしきい
値Sとを比較する(ステップS905)。P>Sの場合
は、入力したフレーム単位の符号化音声データを出力し
(ステップS906)、P<Sの場合は、無音コード格
納部(205)に設定した無音コードを出力する(ステ
ップS907)。制御ルーチン(206)は各ルーチン
を制御して上記の処理を繰り返す。P<Sの場合に出力
される無音コードのデータ量は、符号化音声データに比
べると非常に少なく、本処理部(200)は符号化音声
データストリームを削減して出力することになる(図1
0参照)。
【0018】次に、本発明による他の音声復号化部(3
00)の構成図を図11に、その処理フロー図を図12
に示し、本処理部(300)の処理内容を説明する。本
処理部(300)は、予め設計時に、数bitの無音コ
ードを無音コード格納部(302)に設定しておき、か
つ、1フレーム分の無音信号を無音信号蓄積部(30
5)に蓄積しておく(図12のステップS1201)。
図8に示す符号化音声データ処理部(200)により削
減された符号化音声データストリームが、本処理部(3
00)に入力されると(ステップS1202)、入力ル
ーチン(301)はデータを入力し(ステップS120
3)、無音コード判別ルーチン(303)は、無音コー
ド格納部(302)を参照して、入力したデータが、無
音コードかどうかを判定する(ステップS1204)。
無音コードの場合、無音信号蓄積部(305)に蓄積し
ておいた無音信号を出力する(ステップS1205)。
ここで、何も出力しなければ無音となるので、無音コー
ドの場合、1フレーム分何も出力しないという方法もと
れる。無音コードでない場合、入力ルーチン(301)
がフレーム単位の符号化符号化音声データを入力して、
復号ルーチン(304)が、入力したフレーム単位の符
号化音声データを復号化し、復号音声を出力する(ステ
ップS1206)。制御ルーチン(306)は各ルーチ
ンを制御して上記の処理を繰り返す。その結果、本処理
部(300)は、符号化音声データ処理部(200)よ
り削減された符号化音声データストリームを、話速を保
つて復号化する。この復号化に要する処理量は、符号化
音声データ処理部(200)により複合化するデータ量
が削減されている分少ないので、軽減される。また、音
声の音響パワー値の高い部分では、符号化音声データが
削除されないので、波形の連続性が保たれ、かつ、子音
部分が残る(図13)。その為、音質劣化は少ないもの
となる。
【0019】本発明による他の符号化音声データ処理部
(400)の構成図を図14に、その処理フロー図を図
15に示し、本処理部(400)の処理内容を説明す
る。本処理部(400)でも、予め設計時に、無音であ
ることを示す数bitの無音コードを無音コード格納部
(407)に設定しておく。そして、符号化音声データ
ストリームを入力し始める前に、一度に入力する符号化
音声データのフレーム数Nを、入力フレーム数格納部
(402)に設定しておく。また、本処理部(400)
においても、音響パワー値を符号化音声データ削除の決
定方法にしている為、初めにその削除の基準となるしき
い値Sをしきい値格納部(406)に設定しておく(図
15のステップS1501)。
【0020】符号化音声データが本処理部(400)に
入力されると(ステップS1502)、入力ルーチン
(401)は符号化音声データを入力フレーム数格納部
(402)に設定されているフレーム数N個分の符号化
音声データを入力する(ステップS1503)。音響パ
ワー値計測ルーチン(403)は、入力した符号化音声
データからフレーム毎に音響パワー値を求めるが、一度
音声波形に復号化してから計測するのではなく、音響パ
ワー値の情報を有する部分のみを読み取り、音響パワー
値Pを解析して求める(図6参照,ステップS150
4)。平均音響パワー値計測ルーチン(404)は、音
響パワー値計測ルーチン(403)を制御して、入力し
たフレーム数N個分の符号化音声データ全てから音響パ
ワー値を求め、入力した符号化音声データ中での音響パ
ワー値の平均値P ̄を求める(ステップS1505)。
削除判定ルーチン(405)はその音響パワー値の平均
値P ̄としきい値格納部(406)に設定してあるしき
い値Sと比較する(ステップS1506)。P ̄>Sの
場合は、入力した符号化音声データを全てそのまま出力
し(ステップS1507)、P ̄<Sの場合は、無音コ
ード格納部(407)に設定した無音コードを出力する
(ステップS1508)。制御ルーチン(408)は各
ルーチンを制御して上記の処理を繰り返す。その結果、
本処理部(400)は、フレーム数N個の単位で符号化
音声データを削除し、数bitの無音コードを出力する
ので、符号化音声データストリームを削減して出力する
(図16参照)。
【0021】次に、本発明による他の音声復号化部(5
00)の構成図を図17に、その処理フロー図を図18
に示し、本処理部(500)の処理内容を説明する。本
処理部(500)は、予め設計時に、数bitの無音コ
ードを無音コード格納部(502)に設定しておき、か
つ、フレームN個分の無音信号を無音信号蓄積部(50
5)に蓄積しておく(図18のステップS1801)。
図14に示す符号化音声データ処理部(400)により
削減された符号化音声データストリームが、本処理部
(500)に入力されると(ステップS1802)、入
力ルーチン(501)がデータを入力し(ステップS1
803)、無音コード判別ルーチン(503)が、無音
コード格納部(502)を参照して、入力したデータ
が、無音コードかどうかを判定する(ステップS180
4)。無音コードの場合、無音信号蓄積部(505)に
蓄積しておいた無音信号を出力する(ステップS180
5)。ここで、何も出力しなければ無音となるので、無
音コードの場合、フレームN個分の時間だけ何も出力し
ないという方法もとれる。無音コードでない場合、入力
ルーチンがフレーム単位の符号化符号化音声データを入
力して、復号ルーチン(504)が、入力したフレーム
単位の符号化音声データを復号化し、復号音声を出力す
る(ステップS1806)。制御ルーチン(506)は
各ルーチンを制御して上記の処理を繰り返す。その結
果、本処理部(500)は、符号化音声データ処理部
(400)より削減された符号化音声データストリーム
を、話速を保つて復号化する。この復号化に要する処理
量は、符号化音声データ処理部(400)により複合化
するデータ量が削減されている分少ないので、軽減され
る。また、音声の音響パワー値の高い部分では、符号化
音声データが削除されないので、波形の連続性が保た
れ、かつ、子音部分が残る(図19)。その為、音質劣
化は少ないものとなる。
【0022】次に、図4〜図19を参照して説明した本
発明による符号化音声データ処理部および音声復号化部
を利用して構成する音声再生装置、音声録音/再生装置
等の実施形態について説明する。
【0023】本発明を利用した第一の実施形態を図20
に示す。本実施形態は、符号化音声データを蓄積してお
き、それを復号化し、再生する音声再生装置(200
0)に、本発明の符号化音声データ処理部(2011)
(図4に示す構成に対応する。)と音声復号化部(20
08)を搭載した実施形態である。また、符号化方式と
しては、標準化されている符号化方式であるITU(In
ternational Telecommunications Union),G.729
を使用するものとする。また、符号化音声データの削除
の基準となる音響パワー値のしきい値Sを、しきい値格
納部(2011e)に設定しておく。
【0024】キーボード/マウス(2001)より音声
の再生要求を入力すると、命令受信部(2005)がこ
れを受信し、符号化音声データ出力部(2010)が、
符号化音声データ蓄積部(2009)から、符号化音声
データを時系列的に連続して出力する。その様な符号化
音声データストリームが符号化音声データ処理部(20
11)に入力されると、入力ルーチン(2011b)は
その符号化音声データストリームをフレーム単位で、か
つ、1フレーム分の時間間隔(例えば10msec)で
入力する。音響パワー計測ルーチン(2011c)は、
入力されたフレーム単位の符号化音声データから、その
符号化音声データが圧縮している音声の音響パワー値を
求める。この時、音響パワー計測ルーチン(2011
c)はフレームを一度音声波形に復号化してから音響パ
ワー値を計測するのではなく、フレームの音響パワー値
を導ける情報の部分のみを読み取り、その読み込んだ情
報から音響パワー値Pを解析して求める(図6参照)。
このG.729符号化方式の場合、フレーム単位の符号
化音声データの先頭から9〜19bit目の区間に、音
響パワー値の情報があり、その部分を読み取り、音響パ
ワー値Pを解析する。削除判定ルーチン(2011d)
は、その解析した音響パワー値Pと、しきい値格納部
(2011e)に設定しておいたしきい値Sを比較す
る。P>Sの場合は、入力したフレーム単位の符号化音
声データをそのまま音声復号化部(2008)へ出力
し、P<Sの場合は、何も出力しない。
【0025】制御ルーチン(2011a)は、各ルーチ
ンを制御し、上記の処理を繰り返す。その結果、符号化
音声データ処理部(2011)は、入力される符号化音
声データストリームを削減して、削減した符号化音声デ
ータストリームをフレーム単位で、かつ、1フレーム分
の時間間隔で、音声復号化部(2008)へ出力する。
音声復号化部(2008)は、入力された符号化音声デ
ータを即座に復号化して、復号音声信号を、D/A変化
部(2007)へ出力する。符号化音声データ処理部
(2011)で削除された箇所は、音声復号化部(20
08)へ何も出力されないので、復号音声としては無音
となり、復号音声の話速が保たれる。また、音声復号化
部(2008)では、復号化するデータ量が削減されて
いる分少ないので、復号化の処理量は軽減される。ま
た、符号化音声データが削減されたにも関わらず、音声
の音響パワー値の高い部分では、波形の連続性が保た
れ、かつ、子音部分が残る為、復号音声の音質劣化は最
小のものとなる。そして、この復号音声信号は、D/A
変化部(2007)でアナログ音声波形に変換された後
に、音声データ出力部(2006)から出力されて、ス
ピーカ(2002)により出力される。
【0026】なお、図20に示す音声再生装置(200
0)において、命令受信部(2005)、音声データ出
力部(2006)、D/A変換部(2007)、符号化
音声データ蓄積部(2009)、符号化音声データ出力
部(2010)、および符号化音声データ処理部(20
11)は、音声再生機能を制御するための音声再生機能
制御部(2004)によって制御される。また、音声再
生機能制御部(2004)は、装置全体を制御するため
の装置制御部(2003)によって制御される。
【0027】本発明を利用した第二の実施形態を図21
に示す。本実施形態は、音声を符号化音声データに変換
して蓄積しておき、それを復号化して再生する音声録音
/再生装置(2100)に、本発明の符号化音声データ
処理部(2111)(図8の構成に対応)と音声復号化
部(2112)(図11の構成に対応)を搭載した実施
形態である。また、符号化方式としては、標準化されて
いる符号化方式であるG.729を使用するものとす
る。音声録音/再生装置(2100)の設計時に、無音
コード格納部(2111f)と無音コード格納部(21
12d)に、無音であることを示す数bitの無音コー
ドを設定し、符号化音声データの削除の基準となる音響
パワー値のしきい値Sを、しきい値格納部(2111
e)にその値を設定しておく。
【0028】キーボード/マウス(2101)より録音
要求を入力すると、命令受信部(2105)がこれを受
信し、音声データ入力部(2108)が入力待ち状態に
なる。マイク(2103)を通じて音声を入力すると、
音声は、音声データ入力部(2108)、A/D変換部
(2109)、音声符号化部(2110)を経て符号化
音声データストリームに変換され、符号化音声データ処
理部(2111)へ出力される。
【0029】符号化音声データ処理部(2111)に符
号化音声データストリームが入力されると、入力ルーチ
ン(2111b)がその符号化音声データストリームを
フレーム単位で入力する。音響パワー計測ルーチン(2
111c)は、入力されたフレーム単位の符号化音声デ
ータから、その符号化音声データが圧縮している音声の
音響パワー値を求める。この時、音響パワー計測ルーチ
ン(2111c)はフレームを一度音声波形に復号化し
てから音響パワー値を計測するのではなく、フレームの
音響パワー値の情報を有する部分のみを読み取り、その
読み込んだ情報から音響パワー値Pを解析して求める
(図6参照)。このG.729符号化方式の場合、フレ
ーム単位の符号化音声データの先頭から9〜19bit
目の区間に、音響パワー値の情報があり、その部分を読
み取り、音響パワー値Pを解析する。削除判定ルーチン
(2111d)は、その解析した音響パワー値Pと、そ
れと先に設定済みであるしきい値Sを比較し、P>Sの
場合は、入力したフレーム単位の符号化音声データをそ
のまま音声データ蓄積部(2114)へ出力し、P<S
の場合は、無音コード格納部(2111f)にある無音
コードを音声データ蓄積部(2114)へ出力する。こ
の無音コードは、数bitの情報量で符号化音声データ
よりも非常に少ない情報量である。
【0030】制御ルーチン(2111a)は、各ルーチ
ンを制御し、上記の処理を繰り返す。その結果、符号化
音声データ処理部(2111)は、入力される符号化音
声データストリームを削減して、音声データ蓄積部(2
114)へ出力する。音声データ蓄積部(2114)で
は、データ量が削減されている分、蓄積に要する記憶容
量は少なくなる。
【0031】キーボード/マウス(2101)より、再
生要求が入力されると、音声データ蓄積部(2114)
は、蓄積している音声データを音声復号化部(211
2)へ出力する。音声復号化部(2112)に音声デー
タが入力され始めると、入力ルーチン(2112e)が
データを入力する。無音コード判別ルーチン(2112
c)は、無音コード格納部(2112d)を参照して、
入力したデータが無音コードかそうでないかを判定す
る。無音コードの場合、1フレーム分の時間だけD/A
変換部(2107)へ何も出力せず、無音コードでない
場合、入力ルーチン(2112e)がフレーム単位の符
号化音声データを入力し、復号ルーチン(2112b)
が、入力したフレーム単位の符号化音声データを復号化
し、復号した音声信号をD/A変換部(2107)へ出
力する。制御ルーチン(2112a)は各ルーチンを制
御して上記の処理を繰り返す。
【0032】その結果、音声復号化部(2112)は、
符号化音声データ処理部(2111)より削減され、音
声データ蓄積部(2114)に蓄積されていた符号化音
声データストリームを、話速を保つて復号化する。この
復号化に要する処理量は、符号化音声データ処理部(2
111)により符号化音声データストリームが削減され
ている分、複合化するデータ量が少なく、軽減される。
また、音響パワー値の高い部分では、波形の連続性が保
たれ、かつ、子音部分が残っているので、復号音声の音
質劣化が少ないものとなる。そして、この復号音声信号
は、D/A変換部(2107)、音声データ出力部(2
106)を経て、スピーカー(2102)により出力さ
れる。
【0033】なお、図21に示す音声録音/再生装置
(2100)において、命令受信部(2105)、音声
データ出力部(2106)、D/A変換部(210
7)、音声データ入力部(2108)、A/D変換部
(2109)、音声符号化部(2110)、符号化音声
データ処理部(2111)、音声復号化部(211
2)、および音声データ蓄積部(2114)は、音声録
音/再生機能制御部(2104)によって制御される。
また、音声録音/再生機能制御部(2104)は、装置
全体を制御するための装置制御部(2113)によって
制御される。
【0034】本発明を利用した第三の実施形態を図22
に示す。本実施形態は、音声信号を圧縮符号化した符号
化音声データを用い、IP(Internet Protocol)ネッ
トワークを経由して双方向の音声データパケットの送受
信による音声通信を行うインターネット電話端末A(2
300A)とインターネット電話端末B(2300B)
の両方に、本発明の符号化音声データ処理部と音声復号
化部を搭載した実施形態である。これらインターネット
電話端末の内部構成図を図23に示す。符号化方式とし
ては、標準化されている符号化方式であるG.729を
使用するものとする。また、インターネット電話端末
(2300(2300A,B))には予め(例えば設計
時に)、無音コード格納部(2311f)と無音コード
格納部(2312e)に符号化音声データを消去したこ
とを示す数bitの無音コードを設定し、無音信号蓄積
部(2312b)には1フレーム分の無音信号を蓄積し
ておく。キーボード/マウス(2301)により、符号
化音声データの削除の基準となる音響パワー値のしきい
値Sを入力し、しきい値格納部(2311e)にその値
を設定しておく。そして、接続先選択機能部(230
5)は、キーボード/マウス(2301)により接続先
を指定し、インターネット電話機能制御部(2304)
が各部を制御し、接続先と音声通信を行う為の通信設定
を確立する。
【0035】ユーザが発言する際には、マイク(230
3)がユーザの音声を入力し、入力された音声は音声デ
ータ入力部(2308)、A/D変換部(2309)、
音声符号化部(2310)を経て、符号化音声データス
トリームに変換される。変換された符号化音声データス
トリームは、符号化音声データ処理部(2311)に入
力される。
【0036】符号化音声データ処理部(2311)に符
号化音声データストリームが入力されると、入力ルーチ
ン(2311b)がフレーム単位で符号化音声データで
入力する。音響パワー値計測ルーチン(2311c)
は、入力したフレーム単位の符号化音声データが圧縮し
ている音声の音響パワー値を求めるが、フレームを一度
音声波形に復号化してから音響パワー値を計測するので
はなく、音響パワー値の情報を有する部分のみを読み取
り、その読み込んだ情報から音響パワー値Pを解析して
求める(図6参照)。このG.729符号化方式の場
合、フレーム単位の符号化音声データの先頭から9〜1
9bit目の区間に、音響パワー値の情報があり、その
部分を読み取り、音響パワー値Pを解析する。削除判定
ルーチン(2311d)が、その解析した音響パワー値
Pとしきい値格納部(2311e)に設定してあるしき
い値Sとを比較し、P>Sの場合は、入力したフレーム
単位の符号化音声データをパケット処理部(2314)
へ出力し、P<Sの場合は、無音コード格納部(231
1f)に設定した無音コードをパケット処理部(231
4)へ出力する。制御ルーチン(2311a)は各ルー
チンを制御して上記の処理を繰り返し、その結果、符号
化音声データ処理部(2311)は符号化音声データス
トリームを削減してパケット処理部(2314)へ出力
する。
【0037】パケット処理部(2314)では、入力さ
れる音声データをパケット化し、音声データパケットは
ネットワークインターフェース部(2315)を経由し
て、インターネットまたはIPネットワークへ出力さ
れ、接続先のインターネット電話端末に送信される。こ
の送信される伝送量は、パケット化される音声データ量
が削減されている分、少なくなっているので、ネットワ
ークへの負荷は軽減される。
【0038】音声データパケットの受信側端末では、受
信した音声データパケットをネットワークインタフェー
ス部(2315)を経由して、パケット処理部(231
4)に入力される。パケット処理部(2314)では、
入力した音声データパケットから音声データだけを取り
出す。取り出された音声データは、パケット処理部(2
314)から音声復号化部(2312)に入力される。
【0039】音声復号化部(2312)に音声データが
入力され始めると、入力ルーチン(2312f)が音声
データを入力し、そして、無音コード判別ルーチン(2
312d)が、無音コード格納部(2312e)を参照
して、入力した音声データが無音コードかそうでないか
を判定する。無音コードの場合、無音信号蓄積部(23
12b)に蓄積しておいた無音信号をD/A変換部(2
307)へ出力し、無音コードでない場合、入力ルーチ
ン(2312f)が、フレーム単位の符号化音声データ
を入力し、復号ルーチン(2312c)が、入力したフ
レーム単位の符号化音声データを復号化し、復号した音
声信号をD/A変換部(2307)へ出力する。この音
声信号は、D/A変換部(2307)、音声データ出力
部(2306)を経て、スピーカー(2302)により
出力される。制御ルーチン(2312a)は各ルーチン
を制御して上記の処理を繰り返す。その結果、音声復号
化部(2312)は、符号化音声データ処理部(231
1)で削減された符号化音声データストリームを、話速
を保つて復号化し、D/A変換部(2307)へ出力す
る。この復号化に要する処理量は、削減されている分、
複合化するデータ量は少なく、軽減される。また、音声
の音響パワー値が高い部分では、波形の連続性が保た
れ、かつ、子音部分が残る為、復号音声の音質劣化が少
ないものとなる。
【0040】なお、図23に示すインターネット電話端
末(2300)は、例えば、マイク、スピーカ等が外部
にまたは内蔵されて接続されたパーソナルコンピュータ
と、復号化音声処理部(2311)、音声復号化部(2
312)、インターネット電話機能制御部(2304)
等を実現するインターネット電話用のソフトウェアとの
組み合わせによって構成することが可能である(図22
参照)。また、図23に示すインターネット電話端末
(2300)では、パケット処理部(2314)とネッ
トワークインターフェース部(2315)が通信制御部
(2316)によって制御されるようになっていて、こ
の通信制御部(2316)とインターネット電話機能制
御部(2304)が装置制御部(2313)によって制
御されるようになっている。また、各装置で用いられる
プログラムは、計算機で読み取り可能な記録媒体、ある
いは通信媒体を介して流通させることができる。
【0041】本発明を利用した第四の実施形態を図24
に示す。本実施形態は、音声信号を圧縮符号化した符号
化音声データを用い、IPネットワークを経由して双方
向の音声通信を行うインターネット電話端末A(250
0A)とインターネット電話端末B(2500B)の両
方に、本発明の符号化音声データ処理部と音声復号化部
を搭載した実施形態である。これらインターネット電話
端末の内部構成図を図25に示す。符号化方式として
は、標準化されている符号化方式であるITU,G.7
23.1を使用するものとする。
【0042】インターネット電話端末(2500(25
00A,B))の設計時に、無音コード格納部(251
1h)と無音コード格納部(2512e)に符号化音声
データを消去したことを示す数bitの無音コードを設
定しておく。また、符号化音声データ処理部(251
1)に、一度に入力するフレーム数Nを、入力フレーム
数格納部(2511c)に設定する。また、無音信号蓄
積部(2512b)にフレームN個分の無音信号を蓄積
しておく。また、符号化音声データ処理部(2511)
は、音響パワー値を符号化音声データ削除の決定方法に
している為、予めその削除の基準となる音響パワー値の
しきい値Sをしきい値格納部(2511g)に設定して
おく。
【0043】ユーザが発言する際には、ユーザの音声が
マイク(2503)に入力され、音声は音声データ入力
部(2508)、A/D変換部(2509)、音声符号
化部(2510)を経て符号化音声データストリームに
変換される。変換された符号化音声データストリーム
は、符号化音声データ処理部(2511)に入力され
る。符号化音声データ処理部(2511)に符号化音声
データストリームが入力されると、入力ルーチン(25
11b)が、入力フレーム数格納部(2511c)に設
定したフレーム数N個分の符号化音声データを一度に入
力する。
【0044】音響パワー値計測ルーチン(2511d)
は、入力された符号化音声データから、フレーム毎に音
響パワー値を求めるが、一度音声波形に復号化してから
音響パワー値を計測するのではなく、音響パワー値の情
報を有する部分のみを読み取り、その読み込んだ情報か
ら音響パワー値Pを解析して求める(図6参照)。この
G.723.1符号化方式の場合、フレーム単位の符号
化音声データの先頭から0〜24bit目の区間に、音
響パワー値の情報があり、その部分を読み取り、音響パ
ワー値Pを解析する。平均音響パワー計測ルーチン(2
511e)は、音響パワー値計測ルーチン(2511
d)を制御して、入力したN個のフレーム全てから音響
パワー値を解折し、入力したN個のフレーム間での音響
パワー値の平均値P ̄を求める。削除判定ルーチン(2
511f)は、その音響パワー値の平均値P ̄としきい
値格納部(2511g)に設定してあるしきい値Sと比
較し、P ̄>Sの場合は、入力した符号化音声データを
全てそのままパケット処理部(2514)へ出力し、P
 ̄<Sの場合は、無音コード格納部(2511h)に設
定してある無音コードをパケット処理部(2514)へ
出力する。制御ルーチン(2511a)は各ルーチンを
制御して上記の処理を繰り返す。その結果、符号化音声
データ処理部(2511)は、入力された符号化音声デ
ータストリームをN個のフレーム数を単位として削減し
て、パケット処理部(2514)に出力する。
【0045】パケット処理部(2514)に入力される
符号化音声データは、パケット処理部(2514)でパ
ケット化され、ネットワークインタフェース部(251
5)を経由して、接続先に送信される。この送信される
伝送量は、パケット化される音声データ量が削減されて
いる分、少なくなるので、ネットワークへの負荷は軽減
される。
【0046】音声データパケットの受信側端末では、受
信した音声データパケットをネットワークインタフェー
ス部(2515)を経由して、パケット処理部(251
4)に入力される。パケット処理部(2514)では、
入力した音声データパケットを音声データだけを取り出
す。取り出された音声データは、パケット処理部(25
14)から音声復号化部(2512)に入力される。
【0047】音声復号化部(2512)に音声データが
入力され始めると、入力ルーチン(2512f)が音声
データを入力し、そして、無音コード判別ルーチン(2
512d)が、無音コード格納部(2512e)を参照
して、入力した音声データが無音コードかそうでないか
を判定する。無音コードの場合、無音信号蓄積部(25
12b)に蓄積しておいたフレームN個分の無音信号
を、D/A変換部(2507)へ出力する。無音コード
でない場合、入力ルーチン(2512f)が、フレーム
単位の符号化音声データを入力し、復号ルーチン(25
12c)が、入力したフレーム単位の符号化音声データ
を復号化し、復号した音声信号をD/A変換部(250
7)へ出力する。この音声信号は、D/A変換部(25
07)、音声データ出力部(2506)を経て、スピー
カー(2502)により出力される。制御ルーチン(2
512a)は各ルーチンを制御して上記の処理を繰り返
す。その結果、音声復号化部(2512)は、符号化音
声データ処理部(2511)により削減された符号化音
声データストリームを、話速を保つて復号化し、D/A
変換部(2507)へ出力する。この復号化に要する処
理量は、符号化音声データが削減されている分、複合化
するデータ量が少なく、軽減される。また、音声の音響
パワー値が高い部分では、波形の連続性が保たれ、か
つ、子音部分が残る為、復号音声の音質劣化が少ないも
のとなる。
【0048】なお、図25に示すインターネット電話端
末(2500)では、パケット処理部(2514)とネ
ットワークインターフェース部(2515)が通信制御
部(2521)によって制御されるようになっていて、
この通信制御部(2521)とインターネット電話機能
制御部(2504)が装置制御部(2513)によって
制御されるようになっている。
【0049】本発明を利用した第五の実施形態を図26
に示す。本実施形態は、既に圧縮符号化した符号化音声
データを蓄積してあるサーバ端末(2700)から、ク
ライアント端末(2800)に、インターネット/IP
ネットワークを経由して、サーバ端末(2700)に蓄
積してある符号化音声データを配信するシステムに、本
発明の符号化音声データ処理部と音声復号化部を搭載し
た実施形態である。このサーバ端末(2700)および
クライアント端末(2800)は、それぞれワークステ
ーションと音声データ配信ソフトとの組み合わせ、およ
びパーソナルコンピュータとスピーカと音声データ受信
ソフトとの組み合わせから構成することができる。この
サーバ端末(2700)の内部構成図を図27に、クラ
イアント端末(2800)の内部構成図を図28に示
す。符号化方式としては、標準化されている符号化方式
であるG.723.1を使用するものとする。
【0050】サーバ端末(2700)とクライアント端
末(2800)の設計時に予め、無音コード格納部(2
704h)と無音コード格納部(2808e)に無音で
あることを示す数bitの無音コードを設定しておく。
また、符号化音声データ処理部(2704)に、一度に
入力するフレーム数Nを、入力フレーム数格納部(27
04c)に設定し、無音信号蓄積部(2808b)に
は、フレーム数N個分の無音信号を設定しておく。ま
た、符号化音声データ処理部(2704)は、音響パワ
ー値に基づいて符号化音声データの削除を決定する方法
を用いている為、予めその削除の基準となる音響パワー
値のしきい値Sをしきい値格納部(2704g)に設定
しておく。
【0051】まず始めに、クライアント端末(280
0)から、キーボード/マウス(2801)で接続先選
択機能部(2805)に指示を入力することにより接続
先であるサーバ端末(2700)を指定すると、音声デ
ータ受信機能制御部(2804)と音声データ配信機能
制御部(2702)が各部を制御し、音声通信を確立す
る。
【0052】サーバ端末(2700)では、符号化音声
データ蓄積部(2703)が、蓄積している符号化音声
データを時系列的に連続して、符号化音声データ処理部
(2704)へ出力する。符号化音声データ処理部(2
704)に、その様な符号化音声データストリームが入
力されると、入力ルーチン(2704b)が、入力フレ
ーム数格納部(2704c)に設定したフレーム数N個
分の符号化音声データを一度に入力する。音響パワー値
計測ルーチン(2704d)は、入力された符号化音声
データから、フレーム毎に音響パワー値を求めるが、一
度音声波形に復号化してから音響パワー値を計測するの
ではなく、音響パワー値の情報を有する部分のみを読み
取り、その読み込んだ情報から音響パワー値Pを解析し
て求める(図6参照)。このG.723.1符号化方式
の場合、フレーム単位の符号化音声データの先頭から0
〜24bit目の区間に、音響パワー値の情報があり、
その部分の情報だけを読み取り、音響パワー値Pを解析
する。
【0053】平均音響パワー計測ルーチン(2704
e)は、音響パワー値計測ルーチン(2704d)を制
御して、入力したN個のフレーム全てから音響パワー値
を解析し、入力したN個のフレーム間での音響パワー値
の平均値P ̄を求める。削除判定ルーチン(2704
f)は、その音響パワー値の平均値P ̄としきい値格納
部(2704g)に設定してあるしきい値Sと比較し、
P ̄>Sの場合は、入力した符号化音声データを全てそ
のままパケット処理部(2705)へ出力し、P ̄<S
の場合は、無音コード格納部(2704h)に設定して
ある無音コードをパケット処理部(2705)へ出力す
る。
【0054】制御ルーチン(2704a)は各ルーチン
を制御して上記の処理を繰り返す。その結果、符号化音
声データ処理部(2704)は、入力された符号化音声
データストリームを、フレームN個分を単位として削減
し、パケット処理部(2705)へ出力する。パケット
処理部(2705)は、入力される符号化音声データを
パケット化し、パケット化された音声データは、ネット
ワークインタフェース部(2706)を経由して、接続
先のクライアント端末(2800)へ送信される。この
送信される伝送量は、パケット化される音声データ量が
削減されている分、少なくなり、ネットワークへの負荷
は軽減される。
【0055】クライアント端末(2800)は、配信さ
れた音声データパケットを受信し、受信した音声データ
パケットをネットワークインタフェース部(2811)
を経由して、パケット処理部(2810)に入力する。
パケット処理部(2810)では、入力した音声データ
パケットから音声データだけを取り出す。取り出された
音声データは、パケット処理部(2810)から音声復
号化部(2808)に入力される。音声復号化部(28
08)に音声データが入力され始めると、入力ルーチン
(2808f)が音声データを入力し、そして、無音コ
ード判別ルーチン(2808d)が、無音コード格納部
(2808e)を参照して、入力した音声データが無音
コードかそうでないかを判定する。無音コードの場合、
無音信号蓄積部に蓄積してあるフレームN個分の無音信
号を、D/A変換部(2807)へ出力する。無音コー
ドでない場合、入力ルーチン(2808f)が、フレー
ム単位の符号化音声データを入力し、復号ルーチン(2
808c)が、入力したフレーム単位の符号化音声デー
タを復号化し、復号した音声信号をD/A変換部(28
07)へ出力する。この音声信号は、D/A変換部(2
807)、音声データ出力部(2806)を経て、スピ
ーカー(2802)により出力される。
【0056】制御ルーチン(2808a)は各ルーチン
を制御して上記の処理を繰り返す。その結果、音声復号
化部(2808)は、サーバ端末の符号化音声データ処
理部(2704)で削減された符号化音声データストリ
ームを、話速を保つて復号化し、D/A変換部(280
7)へ出力する。この復号化に要する処理量は、符号化
音声データが削減されている分、複合化するデータ量が
少なく、軽減される。また、音声の音響パワー値が高い
部分では、波形の連続性が保たれ、かつ、子音部分が残
る為、復号音声の音質劣化が少ないものとなる。
【0057】なお、図27に示すサーバ端末(270
0)では、パケット処理部(2705)とネットワーク
インターフェース部(2706)が通信制御部(270
4)によって制御されるようになっていて、この通信制
御部(2704)と音声データ配信機能制御部(270
2)が装置制御部(2701)によって制御されるよう
になっている。また、図28に示すクライアント端末
(2800)では、パケット処理部(2810)とネッ
トワークインターフェース部(2811)が通信制御部
(2809)によって制御されるようになっていて、こ
の通信制御部(2809)と音声データ受信機能制御部
(2804)が装置制御部(2803)によって制御さ
れるようになっている。
【0058】
【発明の効果】以上説明したように、本発明を用いれ
ば、端末での処理量を増やさず、かつ、復号した音声の
音質劣化が少ないように、符号化音声データのデータ量
を削減することが可能となる。
【図面の簡単な説明】
【図1】 音声符号化の概要図である。
【図2】 符号化音声データのデータ量削減方法の例を
示す図である。
【図3】 削減された符号化音声データストリームを復
号化した場合の音声波形を示す図である。
【図4】 本発明の符号化音声データ処理部の構成図で
ある。
【図5】 本発明の符号化音声データ処理部の処理フロ
ー図である。
【図6】 フレームから音響パワー値を解析する方法の
概要図である。
【図7】 本発明の音声復号化部により復号化された音
声波形を示す図である。
【図8】 本発明の符号化音声データ処理部の構成図で
ある。
【図9】 本発明の符号化音声データ処理部の処理フロ
ー図である。
【図10】 本発明の符号化音声データ処理部により削
減された符号化音声データストリームを示す図である。
【図11】 本発明の音声復号化部の構成図である。
【図12】 本発明の音声復号化部の処理フロー図であ
る。
【図13】 本発明の音声復号化部により復号化された
音声波形を示す図である。
【図14】 本発明の符号化音声データ処理部の構成図
である。
【図15】 本発明の符号化音声データ処理部の処理フ
ロー図である。
【図16】 本発明の符号化音声データ処理部により削
減された符号化音声データストリームを示す図である。
【図17】 本発明の音声復号化部の構成図である。
【図18】 本発明の音声復号化部の処理フロー図であ
る。
【図19】 本発明の音声復号化部により復号化された
音声波形を示す図である。
【図20】 本発明の第一の実施形態を示す図である。
【図21】 本発明の第二の実施形態を示す図である。
【図22】 本発明の第三の実施形態を示す図である。
【図23】 本発明の第三の実施形態のインターネット
電話端末の内部構成図である。
【図24】 本発明の第四の実施形態を示す図である。
【図25】 本発明の第四の実施形態のインターネット
電話端末の内部構成図である。
【図26】 本発明の第五の実施形態を示す図である。
【図27】 本発明の第五の実施形態のサーバ端末の内
部構成図である。
【図28】 本発明の第五の実施形態のクライアント端
末の内部構成図である。
【符号の説明】
100,200,400,2011,2111,231
1,2511,2704…符号化音声データ処理部、4
02,2511c,2704c…入力フレーム数格納
部、102,202,403,2011c,2111
c,2311c,2511d,2704d…音響パワー
値計測ルーチン、404,2511e,2704e…平
均音響パワー値計測ルーチン、103,203,40
5,2011d,2111d,2311d,2511
f,2704f…削除判定ルーチン、104,204,
406,2011e,2111e,2311e,251
1g,2704g…しきい値格納部、205,302,
407,502,2111f,2112d,2311
f,2312e,2511h,2512e,2704
h,2808e…無音コード格納部、150,300,
500,2008,2112,2312,2512,2
808…音声復号化部、303,503,2112c,
2312d,2512d,2808d…無音コード判定
ルーチン、304,504,2112b,2312c,
2512c,2808c…復号ルーチン、305,50
5,2312b,2512b,2808b…無音信号蓄
積部
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成11年11月22日(1999.11.
22)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0011
【補正方法】変更
【補正内容】
【0011】また、請求項16、17、および18記載
の符号化音声データ処理装置は、図4、図8、および図
14にそれぞれ対応し、請求項19、20、および21
記載の符号化音声データ処理方法は、図5、図9、およ
び図15にそれぞれ対応し、そして、請求項22、2
3、および24記載の記録媒体は、図5、図9、および
図15にそれぞれ対応する。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 林 泰仁 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 小谷野 浩 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 守谷 健弘 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 Fターム(参考) 5D045 DA20 5K041 AA04 AA07 BB02 CC01 HH11 HH24 HH27 HH41 JJ33

Claims (30)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を圧縮符号化し、音声情報の一
    部として音響パワー値の情報を含む符号化音声データを
    生成する音声符号化技術を用いて、既に圧縮符号化済で
    ある該符号化音声データを蓄積してある符号化音声デー
    タ蓄積部、または、既に圧縮符号化済である該符号化音
    声データを端末外部から入力する音声データ入力部と、
    該符号化音声データを符号化の単位であるフレーム単位
    で処理する符号化音声データ処理部と、該符号化音声デ
    ータを音声信号に復号化する音声復号化部と、音声信号
    を再生出力する音声再生部とを持つ端末において、 該符号化音声データ処理部で、(A)該符号化音声デー
    タ蓄積部、または、該音声データ入力部から、該符号化
    音声データを、符号化の単位であるフレーム単位で、か
    つ、1フレーム分の時間間隔で、入力する過程と、
    (B)該入力したフレーム単位の該符号化音声データか
    ら、音響パワー値の情報を有する部分だけを読み込む過
    程と、(C)該読み込んだ情報を解析して、音響パワー
    値を算出する過程と、(D)音響パワー値のしきい値を
    設定する過程と、(E)該解析した音響パワー値と該設
    定したしきい値を比較し、該解析した音響パワー値が該
    設定したしきい値より大きい場合、該入力したフレーム
    単位の該符号化音声データを該音声復号化部へ出力し、
    該解析した音響パワー値が該設定したしきい値より小さ
    い場合、該音声復号化部へ何も出力しない過程と、該音
    声復号化部で、(F)該符号化音声データ処理部から出
    力されるフレーム単位の該符号化音声データを入力し、
    次に入力される該符号化音声データを待たずに、即座に
    復号化し、該音声再生部に出力する過程を有することを
    特徴とする符号化音声データの削減方法。
  2. 【請求項2】 音声信号を圧縮符号化し、音声情報の一
    部として音響パワー値の情報を含めた符号化音声データ
    を生成する音声符号化技術を用いて、音声信号を該符号
    化音声データに圧縮符号化する音声符号化部、または、
    既に圧縮符号化済である該符号化音声データを蓄積して
    ある符号化音声データ蓄積部と、該符号化音声データを
    符号化の単位であるフレーム単位で処理する符号化音声
    データ処理部と、音声データを蓄積する音声データ蓄積
    部と、該符号化音声データを音声信号に復号化する音声
    復号化部と、音声信号を再生出力する音声再生部とを持
    つ端末において、 該符号化音声データ処理部で、(A)該音声符号化部、
    または、該符号化音声データ蓄積部から、該符号化音声
    データを、フレーム単位で入力する過程と、(B)該入
    力されたフレーム単位の該符号化音声データから、音響
    パワー値の情報を有する部分だけを読み込む過程と、
    (C)該読み込んだ情報を解析して、音響パワー値を算
    出する過程と、(D)音響パワー値のしきい値を設定す
    る過程と、(E)該解析した音響パワー値と該設定した
    しきい値を比較し、該解析した音響パワー値が該設定し
    たしきい値より大きい場合、該入力したフレーム単位の
    該符号化音声データを該音声データ蓄積部へ出力し、該
    解析した音響パワー値が該設定したしきい値より小さい
    場合、無音であることを示す無音コードを該音声データ
    蓄積部へ出力する過程と、 該音声復号化部で、(F)該音声データ蓄積部から、デ
    ータを入力する過程と、(G)該入力したデータが該無
    音コードか否かを判定する過程と、(H)1フレーム分
    の無音信号を蓄積する過程と、(I)該判定により、該
    入力したデータが該無音コードでない場合、1フレーム
    分の符号化音声データを入力して復号化し、復号化した
    音声信号を該音声再生部に出力し、該入力したデータが
    該無音コードの場合、該無音信号を該音声再生部に出力
    する、または、1フレーム分の時間だけ該音声再生部に
    何も出力しない過程とを有することを特徴とする符号化
    音声データの削減方法。
  3. 【請求項3】 音声信号を圧縮符号化し、音声情報の一
    部として音響パワー値の情報を含めた符号化音声データ
    を生成する音声符号化技術を用いて、音声通信を行うシ
    ステムで、音声信号を該符号化音声データに圧縮符号化
    する音声符号化部、または、既に圧縮符号化済である該
    符号化音声データを蓄積してある符号化音声データ蓄積
    部と、該符号化音声データを符号化の単位であるフレー
    ム単位で処理する符号化音声データ処理部と、外部の端
    末へ音声データを出力する音声データ出力部とを持つ端
    末を送信端末とし、外部の端末から音声データを入力す
    る音声データ入力部と、該符号化音声データを音声信号
    に復号化する音声復号化部と、音声信号を再生出力する
    音声再生部とを持つ端末を受信端末とする、音声通信シ
    ステムにおいて、 該送信端末の該符号化音声データ処理部で、(A)該音
    声符号化部、または、該音声データ蓄積部から、該符号
    化音声データを、フレーム単位で入力する過程と、
    (B)該入力されたフレーム単位の該符号化音声データ
    から、音響パワー値の情報を有する部分だけを読み込む
    過程と、(C)該読み込んだ情報を解析して、音響パワ
    ー値を算出する過程と、(D)音響パワー値のしきい値
    を設定する過程と、(E)該解析した音響パワー値と該
    設定したしきい値を比較し、該解析した音響パワー値が
    該設定したしきい値より大きい場合、該入力したフレー
    ム単位の該符号化音声データを該音声データ出力部へ出
    力し、該解析した音響パワー値が該設定したしきい値よ
    り小さい場合、無音であることを示す無音コードを該音
    声データ出力部へ出力する過程と、 該受信端末の該音声復号化部で、(F)該音声データ入
    力部から、データを入力する過程と、(G)該入力した
    データが該無音コードか否かを判定する過程と、(H)
    1フレーム分の無音信号を蓄積する過程と、(I)該判
    定により、該入力したデータが該無音コードでない場
    合、1フレーム分の符号化音声データを入力して復号化
    し、復号化した音声信号を該音声再生部に出力し、該入
    力したデータが該無音コードの場合、該無音信号を該音
    声再生部に出力する、または、1フレーム分の時間だけ
    該音声再生部に何も出力しない過程とを有することを特
    徴とする符号化音声データの削減方法。
  4. 【請求項4】 音声信号を圧縮符号化し、音声情報の一
    部として音響パワー値の情報を含めた符号化音声データ
    を生成する音声符号化技術を用いて、音声信号を該符号
    化音声データに圧縮符号化する音声符号化部、または、
    既に圧縮符号化済である該符号化音声データを蓄積して
    ある符号化音声データ蓄積部と、該符号化音声データを
    符号化の単位であるフレーム単位で処理する符号化音声
    データ処理部と、音声データを蓄積する音声データ蓄積
    部と、該符号化音声データを音声信号に復号化する音声
    復号化部と、音声信号を再生出力する音声再生部とを持
    つ端末において、 該符号化音声データ処理部で、(A)該音声符号化部、
    または、該符号化音声データ蓄積部から、一度に入力す
    る該符号化音声データの符号化の単位となるフレーム数
    を、設定する過程と、(B)該音声符号化部、または、
    該符号化音声データ蓄積部から、該符号化音声データ
    を、該設定したフレーム数分だけ入力する過程と、
    (C)該入力した該符号化音声データからフレーム毎
    に、音響パワー値の情報を含む部分だけを読み込む過程
    と、(D)該読み込んだ情報を解析して、音響パワー値
    を算出する過程と、(E)上記の方法で、該入力した該
    符号化音声データのフレーム数分の音響パワー値を求
    め、該入力した該符号化音声データ内での音響パワー値
    の平均値を求める過程と、(F)音響パワー値のしきい
    値を設定する過程と、(G)該音響パワー値の平均値と
    該設定したしきい値を比較し、該音響パワー値の平均値
    が該設定したしきい値よりも大きい場合、該入力した該
    符号化音声データを全て該音声データ蓄積部に出力し、
    該音響パワー値の平均値が該設定したしきい値よりも小
    さい場合、無音であることを示す無音コードを該音声デ
    ータ蓄積部に出力する過程と、 該音声復号化部で、(H)該音声データ蓄積部から、デ
    ータを入力する過程と、(I)該入力したデータが該無
    音コードか否かを判定する過程と、(J)該設定したフ
    レーム数分の無音信号を蓄積する過程と、(K)該判定
    により、該入力した音声データが該無音コードでない場
    合、1フレーム分の符号化音声データを入力して復号化
    し、復号化した音声信号を該音声再生部に出力し、該入
    力したデータが該無音コードの場合、該無音信号を該音
    声再生部に出力する、または、該設定したフレーム数分
    の時間だけ該音声再生部に何も出力しない過程とを有す
    ることを特徴とする符号化音声データの削減方法。
  5. 【請求項5】 音声信号を圧縮符号化し、音声情報の一
    部として音響パワー値の情報を含めた符号化音声データ
    を生成する音声符号化技術を用いて、音声通信を行うシ
    ステムで、音声信号を該符号化音声データに圧縮符号化
    する音声符号化部、または、既に圧縮符号化済である該
    符号化音声データを蓄積してある符号化音声データ蓄積
    部と、該符号化音声データを符号化の単位であるフレー
    ム単位で処理する符号化音声データ処理部と、外部の端
    末へ音声データを端末外部へ出力する音声データ出力部
    とを持つ端末を送信端末とし、外部の端末から音声デー
    タを入力する音声データ入力部と、該符号化音声データ
    を音声信号に復号化する音声復号化部と、音声信号を再
    生出力する音声再生部とを持つ端末を受信端末とする、
    音声通信システムにおいて、 該送信端末の該符号化音声データ処理部で、(A)該音
    声符号化部、または、該符号化音声データ蓄積部から、
    一度に入力する該符号化音声データの符号化の単位とな
    るフレーム数を、設定する過程と、(B)該音声符号化
    部、または、該符号化音声データ蓄積部から、該符号化
    音声データを、該設定したフレーム数分だけ入力する過
    程と、(C)該入力した該符号化音声データからフレー
    ム毎に、音響パワー値の情報を含む部分だけを読み込む
    過程と、(D)該読み込んだ情報を解析して、音響パワ
    ー値を算出する過程と、(E)上記の方法で、該入力し
    た該符号化音声データのフレーム数分の音響パワー値を
    求め、該入力した該符号化音声データ内での音響パワー
    値の平均値を求める過程と、(F)音響パワー値のしき
    い値を設定する過程と、(G)該音響パワー値の平均値
    と該設定したしきい値を比較し、該音響パワー値の平均
    値が該設定したしきい値よりも大きい場合、該入力した
    該符号化音声データを全て該音声データ出力部に出力
    し、該音響パワー値の平均値が該設定したしきい値より
    も小さい場合、無音であることを示す無音コードを該音
    声データ出力部に出力する過程と、 該受信端末の該音声復号化部で、(H)該音声データ入
    力部から、データを入力する過程と、(I)該入力した
    データが該無音コードか否かを判定する過程と、(J)
    該設定したフレーム数分の無音信号を蓄積する過程と、
    (K)該判定により、該入力した音声データが該無音コ
    ードでない場合、1フレーム分の符号化音声データを入
    力して復号化し、復号化した音声信号を該音声再生部に
    出力し、該入力したデータが該無音コードの場合、該無
    音信号を該音声再生部に出力する、または、該設定した
    フレーム数分の時間だけ該音声再生部に何も出力しない
    過程とを有することを特徴とする符号化音声データの削
    減方法。
  6. 【請求項6】 音声信号を圧縮符号化し、音声情報の一
    部として音響パワー値の情報を含む符号化音声データを
    生成する音声符号化技術を用いて、既に圧縮符号化済で
    ある該符号化音声データを蓄積してある符号化音声デー
    タ蓄積部、または、既に圧縮符号化済である該符号化音
    声データを端末外部から入力する音声データ入力部と、
    該符号化音声データを符号化の単位であるフレーム単位
    で処理する符号化音声データ処理部と、該符号化音声デ
    ータを音声信号に復号化する音声復号化部と、音声信号
    を再生出力する音声再生部とを持つ端末において、 該符号化音声データ処理部では、(A)該符号化音声デ
    ータ蓄積部、または、該音声データ入力部から、該符号
    化音声データを、符号化の単位であるフレーム単位で、
    かつ、1フレーム分の時間間隔で、入力する手段と、
    (B)該入力したフレーム単位の該符号化音声データか
    ら、音響パワー値の情報を有する部分だけを読み込む手
    段と、(C)該読み込んだ情報を解析して、音響パワー
    値を算出する手段と、(D)音響パワー値のしきい値を
    設定する手段と、(E)該解析した音響パワー値と該設
    定したしきい値を比較し、該解析した音響パワー値が該
    設定したしきい値より大きい場合、該入力したフレーム
    単位の該符号化音声データを該音声復号化部へ出力し、
    該解析した音響パワー値が該設定したしきい値より小さ
    い場合、該音声復号化部へ何も出力しない手段とを持
    ち、 該音声復号化部では、(F)該符号化音声データ処理部
    から出力されるフレーム単位の該符号化音声データを入
    力し、次に入力される該符号化音声データを待たずに、
    即座に復号化し、該音声再生部に出力する手段を持つこ
    とを特徴とする符号化音声データの削減装置。
  7. 【請求項7】 音声信号を圧縮符号化し、音声情報の一
    部として音響パワー値の情報を含めた符号化音声データ
    を生成する音声符号化技術を用いて、音声信号を該符号
    化音声データに圧縮符号化する音声符号化部、または、
    既に圧縮符号化済である該符号化音声データを蓄積して
    ある符号化音声データ蓄積部と、該符号化音声データを
    符号化の単位であるフレーム単位で処理する符号化音声
    データ処理部と、音声データを蓄積する音声データ蓄積
    部と、該符号化音声データを音声信号に復号化する音声
    復号化部と、音声信号を再生出力する音声再生部とを持
    つ端末において、 該符号化音声データ処理部では、(A)該音声符号化
    部、または、該符号化音声データ蓄積部から、該符号化
    音声データを、フレーム単位で入力する手段と、(B)
    該入力されたフレーム単位の該符号化音声データから、
    音響パワー値の情報を有する部分だけを読み込む手段
    と、(C)該読み込んだ情報を解析して、音響パワー値
    を算出する手段と、(D)音響パワー値のしきい値を設
    定する手段と、(E)該解析した音響パワー値と該設定
    したしきい値を比較し、該解析した音響パワー値が該設
    定したしきい値より大きい場合、該入力したフレーム単
    位の該符号化音声データを該音声データ蓄積部へ出力
    し、該解析した音響パワー値が該設定したしきい値より
    小さい場合、無音であることを示す無音コードを該音声
    データ蓄積部へ出力する手段とを持ち、 該音声復号化部では、(F)該音声データ蓄積部から、
    データを入力する手段と、(G)該入力したデータが該
    無音コードか否かを判定する手段と、(H)1フレーム
    分の無音信号を蓄積する手段と、(I)該判定により、
    該入力したデータが該無音コードでない場合、1フレー
    ム分の符号化音声データを入力して復号化し、復号化し
    た音声信号を該音声再生部に出力し、該入力したデータ
    が該無音コードの場合、該無音信号を該音声再生部に出
    力する、または、1フレーム分の時間だけ該音声再生部
    に何も出力しない手段とを持つことを特徴とする符号化
    音声データの削減装置。
  8. 【請求項8】 音声信号を圧縮符号化し、音声情報の一
    部として音響パワー値の情報を含めた符号化音声データ
    を生成する音声符号化技術を用いて、音声通信を行うシ
    ステムで、音声信号を該符号化音声データに圧縮符号化
    する音声符号化部、または、既に圧縮符号化済である該
    符号化音声データを蓄積してある符号化音声データ蓄積
    部と、該符号化音声データを符号化の単位であるフレー
    ム単位で処理する符号化音声データ処理部と、外部の端
    末へ音声データを出力する音声データ出力部とを持つ端
    末を送信端末とし、外部の端末から音声データを入力す
    る音声データ入力部と、該符号化音声データを音声信号
    に復号化する音声復号化部と、音声信号を再生出力する
    音声再生部とを持つ端末を受信端末とする、音声通信シ
    ステムにおいて、 該送信端末の該符号化音声データ処理部では、(A)該
    音声符号化部、または、該音声データ蓄積部から、該符
    号化音声データを、フレーム単位で入力する手段と、
    (B)該入力されたフレーム単位の該符号化音声データ
    から、音響パワー値の情報を有する部分だけを読み込む
    手段と、(C)該読み込んだ情報を解析して、音響パワ
    ー値を算出する手段と、(D)音響パワー値のしきい値
    を設定する手段と、(E)該解析した音響パワー値と該
    設定したしきい値を比較し、該解析した音響パワー値が
    該設定したしきい値より大きい場合、該入力したフレー
    ム単位の該符号化音声データを該音声データ出力部へ出
    力し、該解析した音響パワー値が該設定したしきい値よ
    り小さい場合、無音であることを示す無音コードを該音
    声データ出力部へ出力する手段とを持ち、 該受信端末の該音声復号化部では、(F)該音声データ
    入力部から、データを入力する手段と、(G)該入力し
    たデータが該無音コードか否かを判定する手段と、
    (H)1フレーム分の無音信号を蓄積する手段と、
    (I)該判定により、該入力したデータが該無音コード
    でない場合、1フレーム分の符号化音声データを入力し
    て復号化し、復号化した音声信号を該音声再生部に出力
    し、該入力したデータが該無音コードの場合、該無音信
    号を該音声再生部に出力する、または、1フレーム分の
    時間だけ該音声再生部に何も出力しない手段とを持つこ
    とを特徴とする符号化音声データの削減装置。
  9. 【請求項9】 音声信号を圧縮符号化し、音声情報の一
    部として音響パワー値の情報を含めた符号化音声データ
    を生成する音声符号化技術を用いて、音声信号を該符号
    化音声データに圧縮符号化する音声符号化部、または、
    既に圧縮符号化済である該符号化音声データを蓄積して
    ある符号化音声データ蓄積部と、該符号化音声データを
    符号化の単位であるフレーム単位で処理する符号化音声
    データ処理部と、音声データを蓄積する音声データ蓄積
    部と、該符号化音声データを音声信号に復号化する音声
    復号化部と、音声信号を再生出力する音声再生部とを持
    つ端末において、 該符号化音声データ処理部では、(A)該音声符号化
    部、または、該符号化音声データ蓄積部から、一度に入
    力する該符号化音声データの符号化の単位となるフレー
    ム数を、設定する手段と、(B)該音声符号化部、また
    は、該符号化音声データ蓄積部から、該符号化音声デー
    タを、該設定したフレーム数分だけ入力する手段と、
    (C)該入力した該符号化音声データからフレーム毎
    に、音響パワー値の情報を含む部分だけを読み込む手段
    と、(D)該読み込んだ情報を解析して、音響パワー値
    を算出する手段と、(E)上記の方法で、該入力した該
    符号化音声データのフレーム数分の音響パワー値を求
    め、該入力した該符号化音声データ内での音響パワー値
    の平均値を求める手段と、(F)音響パワー値のしきい
    値を設定する手段と、(G)該音響パワー値の平均値と
    該設定したしきい値を比較し、該音響パワー値の平均値
    が該設定したしきい値よりも大きい場合、該入力した該
    符号化音声データを全て該音声データ蓄積部に出力し、
    該音響パワー値の平均値が該設定したしきい値よりも小
    さい場合、無音であることを示す無音コードを該音声デ
    ータ蓄積部に出力する手段とを持ち、 該音声復号化部では、(H)該音声データ蓄積部から、
    データを入力する手段と、(I)該入力したデータが該
    無音コードか否かを判定する手段と、(J)該設定した
    フレーム数分の無音信号を蓄積する手段と、(K)該判
    定により、該入力した音声データが該無音コードでない
    場合、1フレーム分の符号化音声データを入力して復号
    化し、復号化した音声信号を該音声再生部に出力し、該
    入力したデータが該無音コードの場合、該無音信号を該
    音声再生部に出力する、または、該設定したフレーム数
    分の時間だけ該音声再生部に何も出力しない手段とを持
    つことを特徴とする符号化音声データの削減装置。
  10. 【請求項10】 音声信号を圧縮符号化し、音声情報の
    一部として音響パワー値の情報を含めた符号化音声デー
    タを生成する音声符号化技術を用いて、音声通信を行う
    システムで、音声信号を該符号化音声データに圧縮符号
    化する音声符号化部、または、既に圧縮符号化済である
    該符号化音声データを蓄積してある符号化音声データ蓄
    積部と、該符号化音声データを符号化の単位であるフレ
    ーム単位で処理する符号化音声データ処理部と、外部の
    端末へ音声データを端末外部へ出力する音声データ出力
    部とを持つ端末を送信端末とし、外部の端末から音声デ
    ータを入力する音声データ入力部と、該符号化音声デー
    タを音声信号に復号化する音声復号化部と、音声信号を
    再生出力する音声再生部とを持つ端末を受信端末とす
    る、音声通信システムにおいて、 該送信端末の該符号化音声データ処理部では、(A)該
    音声符号化部、または、該符号化音声データ蓄積部か
    ら、一度に入力する該符号化音声データの符号化の単位
    となるフレーム数を、設定する手段と、(B)該音声符
    号化部、または、該符号化音声データ蓄積部から、該符
    号化音声データを、該設定したフレーム数分だけ入力す
    る手段と、(C)該入力した該符号化音声データからフ
    レーム毎に、音響パワー値の情報を含む部分だけを読み
    込む手段と、(D)該読み込んだ情報を解析して、音響
    パワー値を算出する手段と、(E)上記の方法で、該入
    力した該符号化音声データのフレーム数分の音響パワー
    値を求め、該入力した該符号化音声データ内での音響パ
    ワー値の平均値を求める手段と、(F)音響パワー値の
    しきい値を設定する手段と、(G)該音響パワー値の平
    均値と該設定したしきい値を比較し、該音響パワー値の
    平均値が該設定したしきい値よりも大きい場合、該入力
    した該符号化音声データを全て該音声データ出力部に出
    力し、該音響パワー値の平均値が該設定したしきい値よ
    りも小さい場合、無音であることを示す無音コードを該
    音声データ出力部に出力する手段とを持ち、 該受信端末の該音声復号化部では、(H)該音声データ
    入力部から、データを入力する手段と、(I)該入力し
    たデータが該無音コードか否かを判定する手段と、
    (J)該設定したフレーム数分の無音信号を蓄積する手
    段と、(K)該判定により、該入力した音声データが該
    無音コードでない場合、1フレーム分の符号化音声デー
    タを入力して復号化し、復号化した音声信号を該音声再
    生部に出力し、該入力したデータが該無音コードの場
    合、該無音信号を該音声再生部に出力する、または、該
    設定したフレーム数分の時間だけ該音声再生部に何も出
    力しない手段とを持つことを特徴とする符号化音声デー
    タの削減装置。
  11. 【請求項11】 音声信号を圧縮符号化し、音声情報の
    一部として音響パワー値の情報を含む符号化音声データ
    を生成する音声符号化技術を用いて、既に圧縮符号化済
    である該符号化音声データを蓄積してある符号化音声デ
    ータ蓄積部、または、既に圧縮符号化済である該符号化
    音声データを端末外部から入力する音声データ入力部
    と、該符号化音声データを符号化の単位であるフレーム
    単位で処理する符号化音声データ処理部と、該符号化音
    声データを音声信号に復号化する音声復号化部と、音声
    信号を再生出力する音声再生部とを持つ端末において、
    該符号化音声データ処理部では、(A)該符号化音声デ
    ータ蓄積部、または、該音声データ入力部から、該符号
    化音声データを、符号化の単位であるフレーム単位で、
    かつ、1フレーム分の時間間隔で、入力する処理と、
    (B)該入力したフレーム単位の該符号化音声データか
    ら、音響パワー値の情報を有する部分だけを読み込む処
    理と、(C)該読み込んだ情報を解析して、音響パワー
    値を算出する処理と、(D)音響パワー値のしきい値を
    設定する処理と、(E)該解析した音響パワー値と該設
    定したしきい値を比較し、該解析した音響パワー値が該
    設定したしきい値より大きい場合、該入力したフレーム
    単位の該符号化音声データを該音声復号化部へ出力し、
    該解析した音響パワー値が該設定したしきい値より小さ
    い場合、該音声復号化部へ何も出力しない処理とを行
    い、 該音声復号化部では、(F)該符号化音声データ処理部
    から出力されるフレーム単位の該符号化音声データを入
    力し、次に入力される該符号化音声データを待たずに、
    即座に復号化し、該音声再生部に出力する処理を行うた
    めの符号化音声データの削減プログラムを格納した計算
    機読み取り可能な記録媒体。
  12. 【請求項12】 音声信号を圧縮符号化し、音声情報の
    一部として音響パワー値の情報を含めた符号化音声デー
    タを生成する音声符号化技術を用いて、音声信号を該符
    号化音声データに圧縮符号化する音声符号化部、また
    は、既に圧縮符号化済である該符号化音声データを蓄積
    してある符号化音声データ蓄積部と、該符号化音声デー
    タを符号化の単位であるフレーム単位で処理する符号化
    音声データ処理部と、音声データを蓄積する音声データ
    蓄積部と、該符号化音声データを音声信号に復号化する
    音声復号化部と、音声信号を再生出力する音声再生部と
    を持つ端末において、 該符号化音声データ処理部では、(A)該音声符号化
    部、または、該符号化音声データ蓄積部から、該符号化
    音声データを、フレーム単位で入力する処理と、(B)
    該入力されたフレーム単位の該符号化音声データから、
    音響パワー値の情報を有する部分だけを読み込む処理
    と、(C)該読み込んだ情報を解析して、音響パワー値
    を算出する処理と、(D)音響パワー値のしきい値を設
    定する処理と、(E)該解析した音響パワー値と該設定
    したしきい値を比較し、該解析した音響パワー値が該設
    定したしきい値より大きい場合、該入力したフレーム単
    位の該符号化音声データを該音声データ蓄積部へ出力
    し、該解析した音響パワー値が該設定したしきい値より
    小さい場合、無音であることを示す無音コードを該音声
    データ蓄積部へ出力する処理とを行い、 該音声復号化部では、(F)該音声データ蓄積部から、
    データを入力する処理と、(G)該入力したデータが該
    無音コードか否かを判定する処理と、(H)1フレーム
    分の無音信号を蓄積する処理と、(I)該判定により、
    該入力したデータが該無音コードでない場合、1フレー
    ム分の符号化音声データを入力して復号化し、復号化し
    た音声信号を該音声再生部に出力し、該入力したデータ
    が該無音コードの場合、該無音信号を該音声再生部に出
    力する、または、1フレーム分の時間だけ該音声再生部
    に何も出力しない処理とを行うための符号化音声データ
    の削減プログラムを格納した計算機読み取り可能な記録
    媒体。
  13. 【請求項13】 音声信号を圧縮符号化し、音声情報の
    一部として音響パワー値の情報を含めた符号化音声デー
    タを生成する音声符号化技術を用いて、音声通信を行う
    システムで、音声信号を該符号化音声データに圧縮符号
    化する音声符号化部、または、既に圧縮符号化済である
    該符号化音声データを蓄積してある符号化音声データ蓄
    積部と、該符号化音声データを符号化の単位であるフレ
    ーム単位で処理する符号化音声データ処理部と、外部の
    端末へ音声データを出力する音声データ出力部とを持つ
    端末を送信端末とし、外部の端末から音声データを入力
    する音声データ入力部と、該符号化音声データを音声信
    号に復号化する音声復号化部と、音声信号を再生出力す
    る音声再生部とを持つ端末を受信端末とする、音声通信
    システムにおいて、 該送信端末の該符号化音声データ処理部では、(A)該
    音声符号化部、または、該音声データ蓄積部から、該符
    号化音声データを、フレーム単位で入力する処理と、
    (B)該入力されたフレーム単位の該符号化音声データ
    から、音響パワー値の情報を有する部分だけを読み込む
    処理と、(C)該読み込んだ情報を解析して、音響パワ
    ー値を算出する処理と、(D)音響パワー値のしきい値
    を設定する処理と、(E)該解析した音響パワー値と該
    設定したしきい値を比較し、該解析した音響パワー値が
    該設定したしきい値より大きい場合、該入力したフレー
    ム単位の該符号化音声データを該音声データ出力部へ出
    力し、該解析した音響パワー値が該設定したしきい値よ
    り小さい場合、無音であることを示す無音コードを該音
    声データ出力部へ出力する処理とを行い、 該受信端末の該音声復号化部では、(F)該音声データ
    入力部から、データを入力する処理と、(G)該入力し
    たデータが該無音コードか否かを判定する処理と、
    (H)1フレーム分の無音信号を蓄積する処理と、
    (I)該判定により、該入力したデータが該無音コード
    でない場合、1フレーム分の符号化音声データを入力し
    て復号化し、復号化した音声信号を該音声再生部に出力
    し、該入力したデータが該無音コードの場合、該無音信
    号を該音声再生部に出力する、または、1フレーム分の
    時間だけ該音声再生部に何も出力しない処理とを行うた
    めの符号化音声データの削減プログラムを格納した計算
    機読み取り可能な記録媒体。
  14. 【請求項14】 音声信号を圧縮符号化し、音声情報の
    一部として音響パワー値の情報を含めた符号化音声デー
    タを生成する音声符号化技術を用いて、音声信号を該符
    号化音声データに圧縮符号化する音声符号化部、また
    は、既に圧縮符号化済である該符号化音声データを蓄積
    してある符号化音声データ蓄積部と、該符号化音声デー
    タを符号化の単位であるフレーム単位で処理する符号化
    音声データ処理部と、音声データを蓄積する音声データ
    蓄積部と、該符号化音声データを音声信号に復号化する
    音声復号化部と、音声信号を再生出力する音声再生部と
    を持つ端末において、 該符号化音声データ処理部では、(A)該音声符号化
    部、または、該符号化音声データ蓄積部から、一度に入
    力する該符号化音声データの符号化の単位となるフレー
    ム数を、設定する処理と、(B)該音声符号化部、また
    は、該符号化音声データ蓄積部から、該符号化音声デー
    タを、該設定したフレーム数分だけ入力する処理と、
    (C)該入力した該符号化音声データからフレーム毎
    に、音響パワー値の情報を含む部分だけを読み込む処理
    と、(D)該読み込んだ情報を解析して、音響パワー値
    を算出する処理と、(E)上記の方法で、該入力した該
    符号化音声データのフレーム数分の音響パワー値を求
    め、該入力した該符号化音声データ内での音響パワー値
    の平均値を求める処理と、(F)音響パワー値のしきい
    値を設定する処理と、(G)該音響パワー値の平均値と
    該設定したしきい値を比較し、該音響パワー値の平均値
    が該設定したしきい値よりも大きい場合、該入力した該
    符号化音声データを全て該音声データ蓄積部に出力し、
    該音響パワー値の平均値が該設定したしきい値よりも小
    さい場合、無音であることを示す無音コードを該音声デ
    ータ蓄積部に出力する処理とを行い、 該音声復号化部では、(H)該音声データ蓄積部から、
    データを入力する処理と、(I)該入力したデータが該
    無音コードか否かを判定する処理と、(J)該設定した
    フレーム数分の無音信号を蓄積する処理と、(K)該判
    定により、該入力した音声データが該無音コードでない
    場合、1フレーム分の符号化音声データを入力して復号
    化し、復号化した音声信号を該音声再生部に出力し、該
    入力したデータが該無音コードの場合、該無音信号を該
    音声再生部に出力する、または、該設定したフレーム数
    分の時間だけ該音声再生部に何も出力しない処理とを行
    うための符号化音声データの削減プログラムを格納した
    計算機読み取り可能な記録媒体。
  15. 【請求項15】 音声信号を圧縮符号化し、音声情報の
    一部として音響パワー値の情報を含めた符号化音声デー
    タを生成する音声符号化技術を用いて、音声通信を行う
    システムで、音声信号を該符号化音声データに圧縮符号
    化する音声符号化部、または、既に圧縮符号化済である
    該符号化音声データを蓄積してある符号化音声データ蓄
    積部と、該符号化音声データを符号化の単位であるフレ
    ーム単位で処理する符号化音声データ処理部と、外部の
    端末へ音声データを端末外部へ出力する音声データ出力
    部とを持つ端末を送信端末とし、外部の端末から音声デ
    ータを入力する音声データ入力部と、該符号化音声デー
    タを音声信号に復号化する音声復号化部と、音声信号を
    再生出力する音声再生部とを持つ端末を受信端末とす
    る、音声通信システムにおいて、 該送信端末の該符号化音声データ処理部では、(A)該
    音声符号化部、または、該符号化音声データ蓄積部か
    ら、一度に入力する該符号化音声データの符号化の単位
    となるフレーム数を、設定する処理、(B)該音声符号
    化部、または、該符号化音声データ蓄積部から、該符号
    化音声データを、該設定したフレーム数分だけ入力する
    処理と、(C)該入力した該符号化音声データからフレ
    ーム毎に、音響パワー値の情報を含む部分だけを読み込
    む処理と、(D)該読み込んだ情報を解析して、音響パ
    ワー値を算出する処理と、(E)上記の方法で、該入力
    した該符号化音声データのフレーム数分の音響パワー値
    を求め、該入力した該符号化音声データ内での音響パワ
    ー値の平均値を求める処理と、(F)音響パワー値のし
    きい値を設定する処理と、(G)該音響パワー値の平均
    値と該設定したしきい値を比較し、該音響パワー値の平
    均値が該設定したしきい値よりも大きい場合、該入力し
    た該符号化音声データを全て該音声データ出力部に出力
    し、該音響パワー値の平均値が該設定したしきい値より
    も小さい場合、無音であることを示す無音コードを該音
    声データ出力部に出力する処理とを行い、 該受信端末の該音声復号化部では、(H)該音声データ
    入力部から、データを入力する処理と、(I)該入力し
    たデータが該無音コードか否かを判定する処理と、
    (J)該設定したフレーム数分の無音信号を蓄積する処
    理と、(K)該判定により、該入力した音声データが該
    無音コードでない場合、1フレーム分の符号化音声デー
    タを入力して復号化し、復号化した音声信号を該音声再
    生部に出力し、該入力したデータが該無音コードの場
    合、該無音信号を該音声再生部に出力する、または、該
    設定したフレーム数分の時間だけ該音声再生部に何も出
    力しない処理とを行うための符号化音声データの削減プ
    ログラムを格納した計算機読み取り可能な記録媒体。
  16. 【請求項16】 所定のしきい値を格納するしきい値格
    納部と、 音声信号を圧縮符号化し、音声情報の一部として音響パ
    ワー値の情報を含む符号化音声データデータストリーム
    をフレーム単位で、かつ、1フレーム分の時間間隔で読
    み込む入力部と、 入力された符号化音声データデータストリームから音響
    パワー値の情報を有する部分のみを読み取り、入力した
    フレーム単位の符号化音声データが圧縮している音声の
    音響パワー値を求める音響パワー値計測部と、 解析した音響パワー値と、しきい値格納部に設定したし
    きい値とを比較し、音響パワー値がしきい値より大きい
    場合は、入力したフレーム単位の符号化音声データを出
    力し、音響パワー値がしきい値より小さい場合は、何も
    出力しない削除判定部とを備え、 フレーム単位で、かつ、1フレーム分の時間間隔で、削
    減した符号化音声データストリームを出力することを特
    徴とする符号化音声データ処理装置。
  17. 【請求項17】 所定のしきい値を格納するしきい値格
    納部と、 無音を示す無音コードを格納する無音コード格納部と、 音声信号を圧縮符号化し、音声情報の一部として音響パ
    ワー値の情報を含む符号化音声データデータストリーム
    をフレーム単位で読み込む入力部と、 入力された符号化音声データデータストリームから音響
    パワー値の情報を有する部分のみを読み取り、入力した
    フレーム単位の符号化音声データが圧縮している音声の
    音響パワー値を求める音響パワー値計測部と、 解析した音響パワー値と、しきい値格納部に設定したし
    きい値とを比較し、音響パワー値がしきい値より大きい
    場合は入力したフレーム単位の符号化音声データを出力
    し、音響パワー値がしきい値より小さい場合は無音コー
    ド格納部に設定した無音コードを出力する削除判定部と
    を備えることを特徴とする符号化音声データ処理装置。
  18. 【請求項18】 所定のしきい値を格納するしきい値格
    納部と、 無音を示す所定のコードを格納する無音コード格納部
    と、 一度に入力する符号化音声データのフレーム数を格納す
    る入力フレーム数格納部と、 音声信号を圧縮符号化し、音声情報の一部として音響パ
    ワー値の情報を含む符号化音声データデータストリーム
    を、入力フレーム数格納部に設定されているフレーム数
    個分読み込む入力部と、 入力された符号化音声データデータストリームから音響
    パワー値の情報を有する部分のみを読み取り、入力した
    フレーム単位の符号化音声データが圧縮している音声の
    音響パワー値を求める音響パワー値計測部と、 音響パワー値計測部を制御して、入力したフレーム数個
    分の符号化音声データ全てから音響パワー値を求め、入
    力した符号化音声データ中での音響パワー値の平均値を
    求める平均音響パワー値計測部と、 求めた音響パワー値の平均値と、しきい値格納部に設定
    したしきい値とを比較し、音響パワー値の平均値がしき
    い値より大きい場合は入力したフレーム単位の符号化音
    声データを出力し、音響パワー値の平均値がしきい値よ
    り小さい場合は無音コード格納部に設定した無音コード
    を出力する削除判定部とを備えることを特徴とする符号
    化音声データ処理装置。
  19. 【請求項19】 音声信号を圧縮符号化し、音声情報の
    一部として音響パワー値の情報を含む符号化音声データ
    データストリームをフレーム単位で、かつ、1フレーム
    分の時間間隔で読み込み、 入力された符号化音声データデータストリームから音響
    パワー値の情報を有する部分のみを読み取り、入力した
    フレーム単位の符号化音声データが圧縮している音声の
    音響パワー値を求め、 求めた音響パワー値と、予め設定した所定のしきい値と
    を比較し、音響パワー値がしきい値より大きい場合は、
    入力したフレーム単位の符号化音声データを出力し、音
    響パワー値がしきい値より小さい場合は、何も出力しな
    いことによって、 フレーム単位で、かつ、1フレーム分の時間間隔で、削
    減した符号化音声データストリームを出力することを特
    徴とする符号化音声データ処理方法。
  20. 【請求項20】 音声信号を圧縮符号化し、音声情報の
    一部として音響パワー値の情報を含む符号化音声データ
    データストリームをフレーム単位で読み込み、 入力された符号化音声データデータストリームから音響
    パワー値の情報を有する部分のみを読み取り、入力した
    フレーム単位の符号化音声データが圧縮している音声の
    音響パワー値を求め、 求めた音響パワー値と、予め設定した所定のしきい値と
    を比較し、音響パワー値がしきい値より大きい場合は入
    力したフレーム単位の符号化音声データを出力し、音響
    パワー値がしきい値より小さい場合は無音を示す予め設
    定した無音コードを出力することを特徴とする符号化音
    声データ処理方法。
  21. 【請求項21】 音声信号を圧縮符号化し、音声情報の
    一部として音響パワー値の情報を含む符号化音声データ
    データストリームを、予め設定されている所定の複数フ
    レーム個分読み込み、 入力された符号化音声データデータストリームから音響
    パワー値の情報を有する部分のみを読み取り、入力した
    フレーム単位の符号化音声データが圧縮している音声の
    音響パワー値を求め、さらに、入力したフレーム数個分
    の符号化音声データ全てから音響パワー値を求めること
    で、入力した符号化音声データ中での音響パワー値の平
    均値を求め、 求めた音響パワー値の平均値と、予め設定した所定のし
    きい値とを比較し、音響パワー値の平均値がしきい値よ
    り大きい場合は入力したフレーム単位の符号化音声デー
    タを出力し、音響パワー値の平均値がしきい値より小さ
    い場合は無音を示す予め設定した無音コードを出力する
    ことを特徴とする符号化音声データ処理方法。
  22. 【請求項22】 請求項16記載の符号化音声データ処
    理装置を用い、請求項19記載の符号化音声データ処理
    方法を実行するためのプログラムを格納した計算機読み
    取り可能な記録媒体。
  23. 【請求項23】 請求項17記載の符号化音声データ処
    理装置を用い、請求項20記載の符号化音声データ処理
    方法を実行するためのプログラムを格納した計算機読み
    取り可能な記録媒体。
  24. 【請求項24】 請求項18記載の符号化音声データ処
    理装置を用い、請求項21記載の符号化音声データ処理
    方法を実行するためのプログラムを格納した計算機読み
    取り可能な記録媒体。
  25. 【請求項25】 予め設定された無音を示す無音コード
    を格納する無音コード格納部と、 1フレーム分の無音信号を蓄積した無音信号蓄積部と、 所定のフレームを無音コードとすることで削減されたフ
    レームを有する符号化音声データストリームを入力する
    入力部と、 無音コード格納部を参照して、入力したデータが無音コ
    ードかどうかを判定する無音コード判定部と、 入力したフレーム単位の符号化音声データを復号化して
    出力する復号化部と、 無音コード判定部による判定結果が、無音コードであっ
    た場合には、無音信号蓄積部に蓄積しておいた無音信号
    を出力するか、または、1フレーム分何も出力しないか
    し、無音コードでなかった場合には、入力部がフレーム
    単位の符号化符号化音声データを入力して、復号化部に
    よって入力したフレーム単位の符号化音声データを復号
    化し、復号音声を出力するように制御を行う制御部とを
    備えることを特徴とする音声復号化装置。
  26. 【請求項26】 予め設定された無音を示す無音コード
    を格納する無音コード格納部と、 所定の複数フレーム単位を無音コードとすることで削減
    されたフレームを有する符号化音声データストリームを
    入力する入力部と、 前記所定の複数フレーム分の無音信号を蓄積した無音信
    号蓄積部と、 無音コード格納部を参照して、入力したデータが無音コ
    ードかどうかを判定する無音コード判定部と、 入力したフレーム単位の符号化音声データを復号化して
    出力する復号化部と、 無音コード判定部による判定結果が、無音コードであっ
    た場合には、無音信号蓄積部に蓄積しておいた複数フレ
    ーム分の無音信号を出力するか、または、無音信号蓄積
    部に蓄積しておいた無音信号に対応する複数フレーム分
    何も出力しないかし、無音コードでなかった場合には、
    入力部がフレーム単位の符号化符号化音声データを入力
    して、復号化部によって入力したフレーム単位の符号化
    音声データを復号化し、復号音声を出力するように制御
    を行う制御部とを備えることを特徴とする音声復号化装
    置。
  27. 【請求項27】 所定のフレームを無音コードとするこ
    とで削減されたフレームを有する符号化音声データスト
    リームを入力し、 入力したデータが、予め設定された無音を示す無音コー
    ドかどうかを判定し、無音コードであった場合には、予
    め蓄積しておいた無音信号を出力するか、または、1フ
    レーム分何も出力しないかし、 無音コードでなかった場合には、フレーム単位の符号化
    符号化音声データを入力して、入力したフレーム単位の
    符号化音声データを復号化し、復号音声を出力すること
    を特徴とする音声復号化方法。
  28. 【請求項28】 所定の複数フレーム単位を無音コード
    とすることで削減された削減されたフレームを有する符
    号化音声データストリームを入力し、 入力したデータが無音コードかどうかを判定し、 無音コードであった場合には、予め蓄積しておいた前記
    所定の複数フレーム分の無音信号を出力するか、また
    は、該複数フレーム分何も出力しないかし、 無音コードでなかった場合には、フレーム単位の符号化
    符号化音声データを入力して、入力したフレーム単位の
    符号化音声データを復号化し、復号音声を出力すること
    を特徴とする音声復号化方法。
  29. 【請求項29】 請求項25記載の音声復号化装置を用
    い、請求項27記載の音声復号化方法を実行するための
    プログラムを格納した計算機読み取り可能な記録媒体。
  30. 【請求項30】 請求項26記載の音声復号化装置を用
    い、請求項28記載の音声復号化方法を実行するための
    プログラムを格納した計算機読み取り可能な記録媒体。
JP10244159A 1998-08-28 1998-08-28 符号化された音声データの削減方法、及び装置、及びそのプログラムを格納した記録媒体 Pending JP2000075897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10244159A JP2000075897A (ja) 1998-08-28 1998-08-28 符号化された音声データの削減方法、及び装置、及びそのプログラムを格納した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10244159A JP2000075897A (ja) 1998-08-28 1998-08-28 符号化された音声データの削減方法、及び装置、及びそのプログラムを格納した記録媒体

Publications (1)

Publication Number Publication Date
JP2000075897A true JP2000075897A (ja) 2000-03-14

Family

ID=17114652

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10244159A Pending JP2000075897A (ja) 1998-08-28 1998-08-28 符号化された音声データの削減方法、及び装置、及びそのプログラムを格納した記録媒体

Country Status (1)

Country Link
JP (1) JP2000075897A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008536192A (ja) * 2005-04-13 2008-09-04 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション コード化されたオーディオの経済的な音量計測

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008536192A (ja) * 2005-04-13 2008-09-04 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション コード化されたオーディオの経済的な音量計測

Similar Documents

Publication Publication Date Title
JP4724452B2 (ja) デジタルメディア汎用基本ストリーム
US20100324914A1 (en) Adaptive Encoding of a Digital Signal with One or More Missing Values
CN110838894A (zh) 语音处理方法、装置、计算机可读存储介质和计算机设备
JPWO2010074200A1 (ja) 適応差分パルス符号変調の符号化装置及び復号化装置
US6029127A (en) Method and apparatus for compressing audio signals
JP3240832B2 (ja) パケット音声復号方法
JP3248215B2 (ja) 音声符号化装置
JP3784583B2 (ja) 音声蓄積装置
JP3444131B2 (ja) 音声符号化及び復号装置
CN112767955A (zh) 音频编码方法及装置、存储介质、电子设备
US7536298B2 (en) Method of comfort noise generation for speech communication
JP2000075897A (ja) 符号化された音声データの削減方法、及び装置、及びそのプログラムを格納した記録媒体
US6963646B2 (en) Sound signal encoding apparatus and method
JP2004069963A (ja) 音声符号変換装置及び音声符号化装置
JP2003218932A (ja) エラー隠蔽装置及び方法
US6928060B1 (en) Audio data communication
JPH0236628A (ja) 音声信号の送信方式及び送受信方式
US20030065512A1 (en) Communication device and a method for transmitting and receiving of natural speech
JP3942523B2 (ja) ディジタル信号符号化方法、復号化方法、符号器、復号器及びこれらのプログラム
JP3487158B2 (ja) 音声符号化伝送システム
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
KR100590769B1 (ko) 상호 부호화 장치 및 그 방법
KR100875936B1 (ko) 가변대역 멀티코덱 음성 품질 측정 구간 일치를 위한 방법및 그 장치
JPH04357735A (ja) 音声パケット通信装置
JP3688064B2 (ja) 画像圧縮方法及び画像圧縮装置