JP2000075897A

JP2000075897A - 符号化された音声データの削減方法、及び装置、及びそのプログラムを格納した記録媒体

Info

Publication number: JP2000075897A
Application number: JP10244159A
Authority: JP
Inventors: Hiromasa Hirata; 寛将平田; Masaru Ando; 大安藤; Yasuhito Hayashi; 林　　泰仁; Hiroshi Koyano; 浩小谷野; Takehiro Moriya; 健弘守谷
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1998-08-28
Filing date: 1998-08-28
Publication date: 2000-03-14

Abstract

(57)【要約】【課題】端末での処理量を増やさず、かつ、復号した音
声の音質劣化が少ないように符号化音声データを削減す
ることができる符号化音声データの削減方法を提供す
る。【解決手段】符号化音声データ処理部において、音響
パワー値のしきい値Ｓを設定し（Ｓ５０１）、符号化音
声データを符号化の単位であるフレーム単位で、かつ、
１フレーム分の時間間隔で入力し（Ｓ５０３）、入力し
たフレーム単位の符号化音声データから音響パワー値の
情報を有する部分だけを読み込み、読み込んだ情報を解
析して音響パワー値Ｐを算出し（Ｓ５０４）、音響パワ
ー値Ｐとしきい値Ｓを比較し、音響パワー値Ｐが設定し
たしきい値Ｓより大きい場合、入力したフレーム単位の
符号化音声データを音声復号化部へ出力し（Ｓ５０
６）、解析した音響パワー値Ｐが設定したしきい値Ｓよ
り小さい場合、音声復号化部へ何も出力しない（Ｓ５０
７）。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声符号化の技術
に係り、特に符号化された音声データ量を削減するため
に用いて好適な符号化された音声データの削減方法、及
び装置、及びそのプログラムを格納した記録媒体に関す
る。

【０００２】

【従来の技術】音声を電気的に扱う為には、アナログ信
号である音声波形を一様なステップでサンプリングし、
ディジタル信号に変換しなければならない。このディジ
タル信号への変換により、音声を約６４ｋｂｉｔ／ｓの
ビット数のデータ量で表現できる。だが、ディジタル化
された音声信号には大きな冗長性があり、音声波形の相
関、スペクトル特性、ピッチ構造などを利用することで
音声信号を圧縮符号化して、データ量を減少出来る。こ
の音声符号化技術により、音声データの蓄積に要する蓄
積容量を大きく削減出来、また、ディジタルな音声通信
によるネットワークへの負荷を軽減出来る。現在は、さ
らなる音声データの削減が求められており、さらに高圧
縮な音声符号化方式が検討されている。だが、この様な
高圧縮の音声符号化方式では、アルゴリズムの複雑さに
より、符号化／復号化に要する処理量の増加が懸念され
る。マルチメディアアプリケーションレベルで考えた場
合、端末での他のアプリケーションとの連携等を考慮
し、処理量の増加はできるだけ抑えるのが望ましい。

【０００３】音声符号化技術では、音声信号から数十ｍ
ｓｅｃの間隔（フレーム）で信号を切り出し、その区間
毎に圧縮符号化して、符号化音声データに変換する。音
声信号全体としては、フレーム単位の符号化音声データ
が時系列的に連続した符号化音声データストリームに変
換される（図１参照）。この符号化音声データストリー
ム中から、フレームを単位として所定の周期で所定のデ
ータ量を削除すれば、音声データ量は削減される（図２
参照）。図２では符号化音声データストリームを３フレ
ーム周期的で３フレーム分削減することで削減された符
号化音声データストリームを得る例を示している。ま
た、この場合、復号化に要する処理量は、削減されてい
る分復号化するデータ量が少ないので、軽減される。し
かし、単に削減した符号化音声データストリームを復号
化すれば、削除された箇所の音声信号はなくなり、復号
音声は話速が上がった“早口”なものとなる（図３
（ａ）参照）。早口となる問題を回避するには、復号化
の際、削除した箇所で削除したフレーム分の無音信号を
挿入するか、削除したフレーム分の時間だけ復号化処理
を停止すればよい。だが、そうした場合でも、周期的に
符号化音声データを削除する為、復号音声の波形は極端
に不連続になり、かつ、音声を特徴づける子音部分が欠
落して、復号音声の音質は劣化してしまう問題点が残る
（図３（ｂ）参照）。

【０００４】

【発明が解決しようとする課題】本発明は、上記の問題
点を克服する為に、端末での処理量を増やさず、かつ、
復号した音声の音質劣化が少ないように、符号化音声デ
ータそのものを削減することができる符号化された音声
データの削減方法、及び装置、及びそのプログラムを格
納した記録媒体を提供することを目的とする。

【０００５】

【課題を解決するための手段】本発明では、音声信号を
圧縮符号化し、音声情報の一部として音響パワー値の情
報を含む符号化音声データを生成する音声符号化技術を
用いて、既に圧縮符号化済である該符号化音声データを
蓄積してある符号化音声データ蓄積部、または、既に圧
縮符号化済である該符号化音声データを端末外部から入
力する音声データ入力部と、該符号化音声データを符号
化の単位であるフレーム単位で処理する符号化音声デー
タ処理部と、該符号化音声データを音声信号に復号化す
る音声復号化部と、音声信号を再生出力する音声再生部
とを持つ端末において、該符号化音声データ処理部で
は、 ●該符号化音声データ蓄積部、または、該音声データ入
力部から、該符号化音声データを、符号化の単位である
フレーム単位で、かつ、１フレーム分の時間間隔で、入
力する手段と、 ●該入力したフレーム単位の該符号化音声データから、
音響パワー値の情報を有する部分だけを読み込む手段
と、 ●該読み込んだ情報を解析して、音響パワー値を算出す
る手段と、 ●音響パワー値のしきい値を設定する手段と、 ●該解析した音響パワー値と該設定したしきい値を比較
し、該解析した音響パワー値が該設定したしきい値より
大きい場合、該入力したフレーム単位の該符号化音声デ
ータを該音声復号化部へ出力し、該解析した音響パワー
値が該設定したしきい値より小さい場合、該音声復号化
部へ何も出力しない手段とを持ち、該音声復号化部で
は、 ●該符号化音声データ処理部から出力されるフレーム単
位の該符号化音声データを入力し、次に入力される該符
号化音声データを待たずに、即座に復号化し、該音声再
生部へ出力する手段を持つ場合がある。

【０００６】また、本発明では、音声信号を圧縮符号化
し、音声情報の一部として音響パワー値の情報を含めた
符号化音声データを生成する音声符号化技術を用いて、
音声信号を該符号化音声データに圧縮符号化する音声符
号化部、または、既に圧縮符号化済である該符号化音声
データを蓄積してある符号化音声データ蓄積部と、該符
号化音声データを符号化の単位であるフレーム単位で処
理する符号化音声データ処理部と、音声データを蓄積す
る音声データ蓄積部と、該符号化音声データを音声信号
に復号化する音声復号化部と、音声信号を再生出力する
音声再生部とを持つ端末において、該符号化音声データ
処理部では、 ●該音声符号化部、または、該符号化音声データ蓄積部
から、該符号化音声データを、フレーム単位で入力する
手段と、 ●該入力されたフレーム単位の該符号化音声データか
ら、音響パワー値の情報を有する部分だけを読み込む手
段と、 ●該読み込んだ情報を解析して、音響パワー値を算出す
る手段と、 ●音響パワー値のしきい値を設定する手段と、 ●該解析した音響パワー値と該設定したしきい値を比較
し、該解析した音響パワー値が該設定したしきい値より
大きい場合、該入力したフレーム単位の該符号化音声デ
ータを該音声データ蓄積部へ出力し、該解析した音響パ
ワー値が該設定したしきい値より小さい場合、無音であ
ることを示す無音コードを該音声データ蓄積部へ出力す
る手段とを持ち、該音声復号化部では、 ●該音声データ蓄積部から、データを入力する手段と、 ●該入力したデータが該無音コードか否かを判定する手
段と、 ●１フレーム分の無音信号を蓄積する手段と、 ●該判定により、該入力したデータが該無音コードでな
い場合、１フレーム分の符号化音声データを入力して復
号化し、復号化した音声信号を該音声再生部に出力し、
該入力したデータが該無音コードの場合、該無音信号を
該音声再生部に出力する、または、１フレーム分の時間
だけ該音声再生部へ何も出力しない手段とを持つ場合も
ある。

【０００７】また、本発明では、音声信号を圧縮符号化
し、音声情報の一部として音響パワー値の情報を含めた
符号化音声データを生成する音声符号化技術を用いて、
音声通信を行うシステムで、音声信号を該符号化音声デ
ータに圧縮符号化する音声符号化部、または、既に圧縮
符号化済である該符号化音声データを蓄積してある符号
化音声データ蓄積部と、該符号化音声データを符号化の
単位であるフレーム単位で処理する符号化音声データ処
理部と、外部の端末へ音声データを出力する音声データ
出力部とを持つ端末を送信端末とし、外部の端末から音
声データを入力する音声データ入力部と、該符号化音声
データを音声信号に復号化する音声復号化部と、音声信
号を再生出力する音声再生部とを持つ端末を受信端末と
する、音声通信システムにおいて、該送信端末の該符号
化音声データ処理部では、 ●該音声符号化部、または、該音声データ蓄積部から、
該符号化音声データを、フレーム単位で入力する手段
と、 ●該入力されたフレーム単位の該符号化音声データか
ら、音響パワー値の情報を有する部分だけを読み込む手
段と、 ●該読み込んだ情報を解析して、音響パワー値を算出す
る手段と、 ●音響パワー値のしきい値を設定する手段と、 ●該解析した音響パワー値と該設定したしきい値を比較
し、該解析した音響パワー値が該設定したしきい値より
大きい場合、該入力したフレーム単位の該符号化音声デ
ータを該音声データ出力部へ出力し、該解析した音響パ
ワー値が該設定したしきい値より小さい場合、無音であ
ることを示す無音コードを該音声データ出力部へ出力す
る手段とを持ち、該受信端末の該音声復号化部では、 ●該音声データ入力部から、データを入力する手段と、 ●該入力したデータが該無音コードか否かを判定する手
段と、 ●１フレーム分の無音信号を蓄積する手段と、 ●該判定により、該入力したデータが該無音コードでな
い場合、１フレーム分の符号化音声データを入力して復
号化し、復号化した音声信号を該音声再生部に出力し、
該入力したデータが該無音コードの場合、該無音信号を
該音声再生部に出力する、または、１フレーム分の時間
だけ該音声再生部に何も出力しない手段とを持つ場合も
ある。

【０００８】また、本発明では、音声信号を圧縮符号化
し、音声情報の一部として音響パワー値の情報を含めた
符号化音声データを生成する音声符号化技術を用いて、
音声信号を該符号化音声データに圧縮符号化する音声符
号化部、または、既に圧縮符号化済である該符号化音声
データを蓄積してある符号化音声データ蓄積部と、該符
号化音声データを符号化の単位であるフレーム単位で処
理する符号化音声データ処理部と、音声データを蓄積す
る音声データ蓄積部と、該符号化音声データを音声信号
に復号化する音声復号化部と、音声信号を再生出力する
音声再生部とを持つ端末において、該符号化音声データ
処理部では、 ●該音声符号化部、または、該符号化音声データ蓄積部
から、一度に入力する該符号化音声データのフレーム
（符号化の単位）数を、設定する手段と、 ●該音声符号化部、または、該符号化音声データ蓄積部
から、該符号化音声データを、該設定したフレーム数分
だけ入力する手段と、 ●該入力した該符号化音声データからフレーム毎に、音
響パワー値の情報を含む部分だけを読み込む手段と、 ●該読み込んだ情報を解析して、音響パワー値を算出す
る手段と、 ●上記の方法で、該入力した該符号化音声データのフレ
ーム数分の音響パワー値を求め、該入力した該符号化音
声データ内での音響パワー値の平均値を求める手段と、 ●音響パワー値のしきい値を設定する手段と、 ●該音響パワー値の平均値と該設定したしきい値を比較
し、該音響パワー値の平均値が該設定したしきい値より
も大きい場合、該入力した該符号化音声データを全て該
音声データ蓄積部に出力し、該音響パワー値の平均値が
該設定したしきい値よりも小さい場合、無音であること
を示す無音コードを該音声データ蓄積部に出力する手段
とを持ち、該音声復号化部では、 ●該音声データ蓄積部から、データを入力する手段と、 ●該入力したデータが該無音コードか否かを判定する手
段と、 ●該設定したフレーム数分の無音信号を蓄積する手段
と、 ●該判定により、該入力した音声データが該無音コード
でない場合、１フレーム分の符号化音声データを入力し
て復号化し、復号化した音声信号を該音声再生部に出力
し、該入力したデータが該無音コードの場合、該無音信
号を該音声再生部に出力する、または、該設定したフレ
ーム数分の時間だけ該音声再生部に何も出力しない手段
とを持つ場合もある。

【０００９】また、本発明では、音声信号を圧縮符号化
し、音声情報の一部として音響パワー値の情報を含めた
符号化音声データを生成する音声符号化技術を用いて、
音声通信を行うシステムで、音声信号を該符号化音声デ
ータに圧縮符号化する音声符号化部、または、既に圧縮
符号化済である該符号化音声データを蓄積してある符号
化音声データ蓄積部と、該符号化音声データを符号化の
単位であるフレーム単位で処理する符号化音声データ処
理部と、外部の端末へ音声データを出力する音声データ
出力部とを持つ端末を送信端末とし、外部の端末から音
声データを入力する音声データ入力部と、該符号化音声
データを音声信号に復号化する音声復号化部と、音声信
号を再生出力する音声再生部とを持つ端末を受信端末と
する、音声通信システムにおいて、該送信端末の該符号
化音声データ処理部では、 ●該音声符号化部、または、該符号化音声データ蓄積部
から、一度に入力する該符号化音声データのフレーム
（符号化の単位）数を、設定する手段と、 ●該音声符号化部、または、該符号化音声データ蓄積部
から、該符号化音声データを、該設定したフレーム数分
だけ入力する手段と、 ●該入力した該符号化音声データからフレーム毎に、音
響パワー値の情報を含む部分だけを読み込む手段と、 ●該読み込んだ情報を解析して、音響パワー値を算出す
る手段と、●上記の方法で、該入力した該符号化音声デ
ータのフレーム数分の音響パワー値を求め、該入力した該符号化音声データ内での音響パワ
ー値の平均値を求める手段と、 ●音響パワー値のしきい値を設定する手段と、 ●該音響パワー値の平均値と該設定したしきい値を比較
し、該音響パワー値の平均値が該設定したしきい値より
も大きい場合、該入力した該符号化音声データを全て該
音声データ出力部に出力し、該音響パワー値の平均値が
該設定したしきい値よりも小さい場合、無音であること
を示す無音コードを該音声データ出力部に出力する手段
とを持ち、該受信端末の該音声復号化部では、 ●該音声データ入力部から、データを入力する手段と、 ●該入力したデータが該無音コードか否かを判定する手
段と、 ●該設定したフレーム数分の無音信号を蓄積する手段
と、 ●該判定により、該入力した音声データが該無音コード
でない場合、１フレーム分の符号化音声データを入力し
て復号化し、復号化した音声信号を該音声再生部に出力
し、該入力したデータが該無音コードの場合、該無音信
号を該音声再生部に出力する、または、該設定したフレ
ーム数分の時間だけ該音声再生部に何も出力しない手段
とを持つ場合もある。

【００１０】なお、特許請求の範囲の記載における各請
求項記載の発明と、発明の実施形態および図面の記載事
項との対応は次の通りである。請求項１、請求項６およ
び請求項１１記載の発明は、符号化音声データ処理部
（１００）を示す図４、その処理フローを示す図５の記
載事項に対応している。また、請求項２、請求項３、請
求項７、請求項８、請求項１２、および請求項１３記載
の発明は、符号化音声データ処理部（２００）の構成を
示す図８、その処理フローを示す図９の記載事項に対応
し、かつ、音声復号化部（３００）の構成図である図１
１と、その処理フロー図である図１２の記載事項に対応
している。請求項４、請求項５、請求項９、請求項１
０、請求項１４、および請求項１５記載の発明は、符号
化音声データ処理部（４００）の構成図である図１４、
その処理フロー図である図１５の記載事項に対応し、か
つ、音声復号化部（５００）の構成図である図１７と、
その処理フロー図である図１８の記載事項に対応してい
る。

【００１１】また、請求項１６、１７、および１８記載
の符号化音声データ処理装置は、図４、図８、および図
１４にそれぞれ対応し、請求項１９、２０、および２１
記載の符号化音声データ処理方法は、図５、図９、およ
び図１５にそれぞれ対応し、そして、請求項２２、２
３、および２４記載の記録媒体は、図５、図９、および
図１５にそれぞれ対応する。また、また、請求項２５お
よび２６記載の音声復号化装置は、図１１および図１７
にそれぞれ対応し、請求項２７および２８記載の音声復
号化方法は、図１２および図１８にそれぞれ対応し、そ
して、請求項２９および３０記載の記録媒体は、図１２
および図１８にそれぞれ対応する。

【００１２】

【発明の実施の形態】まず、図４〜図１９を参照して本
発明の基本概念について説明する。本発明による符号化
音声データ処理部（１００）の構成図を図４に、その処
理フロー図を図５に示し、本処理部（１００）の処理内
容を説明する。本発明では、音声信号を圧縮符号化し、
音声情報の一部として音響パワー値の情報を含む符号化
音声データを生成する音声符号化技術を用いる。そし
て、本処理部（１００）は、その様な符号化音声データ
ストリームをフレーム単位で、かつ、１フレーム分の時
間間隔で読み込み、以下の式で与えられる音響パワー値
Ｐをフレーム毎に解析する。

【００１３】

【数１】（ｘ（ｉ）：音声波形のサンプル値、Ｎ：１フレームに
含まれるサンプル数）

【００１４】そして、音響パワー値Ｐの値により読み込
んだ符号化音声データを削減された符号化音声データス
トリームとして出力するか否かを決定する。その為、予
め、削除の基準となるしきい値Ｓをしきい値格納部（１
０４）に設定しておく（図５のステップＳ５０１）。

【００１５】符号化音声データが時系列的に連続した符
号化音声データストリームが本処理部（１００）に入力
され始めると（ステップＳ５０２）、入力ルーチン（１
０１）は符号化音声データをフレーム単位で、かつ、１
フレーム分の時間間隔で、入力する（ステップＳ５０
３）。音響パワー値計測ルーチン（１０２）は、入力し
たフレーム単位の符号化音声データが圧縮している音声
の音響パワー値を求めるが、一度音声波形に復号化して
から音響パワー値を計測するのではなく、音響パワー値
の情報を有する部分のみを読み取り、その読み込んだ情
報から音響パワー値Ｐを解析して求める（図６参照，ス
テップＳ５０４）。そして、削除判定ルーチン（１０
３）は、その解析した音響パワー値Ｐと、しきい値格納
部（１０４）に設定したしきい値Ｓとを比較し（ステッ
プＳ５０５）、Ｐ＞Ｓの場合は、入力したフレーム単位
の符号化音声データを出力し（ステップＳ５０６）、Ｐ
＜Ｓの場合は、何も出力しない（ステップＳ５０７）。
なお、音響パワー値Ｐとしきい値Ｓの比較の際には、ど
ちらかに等号を含んだ判定とすることができる。制御ル
ーチン（１０５）は各ルーチンを制御して上記の処理を
繰り返す。その結果、本処理部（１００）は、フレーム
単位で、かつ、１フレーム分の時間間隔で、削減した符
号化音声データストリームを出力する。

【００１６】図７に示す本発明による音声復号化部（１
５０）では、図４に示す符号化音声データ処理部（１０
０）で削減された符号化音声データストリームを入力
し、リアルタイムに、そして、次に入力される符号化音
声データを待たずに、直ちに復号化する。これにより、
符号化音声データ処理部（１００）で削除された箇所で
は、本音声復号化部（１５０）へは何も入力されず、復
号音声としては無音となり、復号音声の話速が保たれ
る。そして、音声の音響パワー値が高い部分では、符号
化音声データが削除されないので、波形の連続性が保た
れ、かつ、子音部分も残る（図７参照）。その為、復号
音声の音質劣化が少ないものとなる。かつ、復号化する
データ量も削減されている分少ないので、復号化に要す
る処理は軽減されることになる。

【００１７】本発明による他の符号化音声データ処理部
（２００）の構成図を図８に、その処理フロー図を図９
に示し、本処理部（２００）の処理内容を説明する。本
処理部（２００）では、予め設計時に、無音であること
を示す数ｂｉｔの無音コードを無音コード格納部（２０
５）に設定しておく。また、音響パワー値を符号化音声
データ削除の決定方法にしている為、符号化音声データ
ストリームを入力し始める前に、そのしきい値Ｓをしき
い値格納部（２０４）に設定する（図９のステップＳ９
０１）。符号化音声データストリームが本処理部（２０
０）に入力され始めると（ステップＳ９０２）、入力ル
ーチン（２０１）は、符号化音声データをフレーム単位
で入力する（ステップＳ９０３）。音響パワー値計測ル
ーチン（２０２）は、入力したフレーム単位の符号化音
声データが圧縮している音声の音響パワー値を求める
が、一度音声波形に復号化してから音響パワー値を計測
するのではなく、音響パワー値の情報を有する部分のみ
を読み取り、その読み込んだ情報から音響パワー値Ｐを
解析して求める（図６参照，ステップＳ９０４）。そし
て、削除判定ルーチン（２０３）でその解析した音響パ
ワー値Ｐとしきい値格納部（２０４）に設定したしきい
値Ｓとを比較する（ステップＳ９０５）。Ｐ＞Ｓの場合
は、入力したフレーム単位の符号化音声データを出力し
（ステップＳ９０６）、Ｐ＜Ｓの場合は、無音コード格
納部（２０５）に設定した無音コードを出力する（ステ
ップＳ９０７）。制御ルーチン（２０６）は各ルーチン
を制御して上記の処理を繰り返す。Ｐ＜Ｓの場合に出力
される無音コードのデータ量は、符号化音声データに比
べると非常に少なく、本処理部（２００）は符号化音声
データストリームを削減して出力することになる（図１
０参照）。

【００１８】次に、本発明による他の音声復号化部（３
００）の構成図を図１１に、その処理フロー図を図１２
に示し、本処理部（３００）の処理内容を説明する。本
処理部（３００）は、予め設計時に、数ｂｉｔの無音コ
ードを無音コード格納部（３０２）に設定しておき、か
つ、１フレーム分の無音信号を無音信号蓄積部（３０
５）に蓄積しておく（図１２のステップＳ１２０１）。
図８に示す符号化音声データ処理部（２００）により削
減された符号化音声データストリームが、本処理部（３
００）に入力されると（ステップＳ１２０２）、入力ル
ーチン（３０１）はデータを入力し（ステップＳ１２０
３）、無音コード判別ルーチン（３０３）は、無音コー
ド格納部（３０２）を参照して、入力したデータが、無
音コードかどうかを判定する（ステップＳ１２０４）。
無音コードの場合、無音信号蓄積部（３０５）に蓄積し
ておいた無音信号を出力する（ステップＳ１２０５）。
ここで、何も出力しなければ無音となるので、無音コー
ドの場合、１フレーム分何も出力しないという方法もと
れる。無音コードでない場合、入力ルーチン（３０１）
がフレーム単位の符号化符号化音声データを入力して、
復号ルーチン（３０４）が、入力したフレーム単位の符
号化音声データを復号化し、復号音声を出力する（ステ
ップＳ１２０６）。制御ルーチン（３０６）は各ルーチ
ンを制御して上記の処理を繰り返す。その結果、本処理
部（３００）は、符号化音声データ処理部（２００）よ
り削減された符号化音声データストリームを、話速を保
つて復号化する。この復号化に要する処理量は、符号化
音声データ処理部（２００）により複合化するデータ量
が削減されている分少ないので、軽減される。また、音
声の音響パワー値の高い部分では、符号化音声データが
削除されないので、波形の連続性が保たれ、かつ、子音
部分が残る（図１３）。その為、音質劣化は少ないもの
となる。

【００１９】本発明による他の符号化音声データ処理部
（４００）の構成図を図１４に、その処理フロー図を図
１５に示し、本処理部（４００）の処理内容を説明す
る。本処理部（４００）でも、予め設計時に、無音であ
ることを示す数ｂｉｔの無音コードを無音コード格納部
（４０７）に設定しておく。そして、符号化音声データ
ストリームを入力し始める前に、一度に入力する符号化
音声データのフレーム数Ｎを、入力フレーム数格納部
（４０２）に設定しておく。また、本処理部（４００）
においても、音響パワー値を符号化音声データ削除の決
定方法にしている為、初めにその削除の基準となるしき
い値Ｓをしきい値格納部（４０６）に設定しておく（図
１５のステップＳ１５０１）。

【００２０】符号化音声データが本処理部（４００）に
入力されると（ステップＳ１５０２）、入力ルーチン
（４０１）は符号化音声データを入力フレーム数格納部
（４０２）に設定されているフレーム数Ｎ個分の符号化
音声データを入力する（ステップＳ１５０３）。音響パ
ワー値計測ルーチン（４０３）は、入力した符号化音声
データからフレーム毎に音響パワー値を求めるが、一度
音声波形に復号化してから計測するのではなく、音響パ
ワー値の情報を有する部分のみを読み取り、音響パワー
値Ｐを解析して求める（図６参照，ステップＳ１５０
４）。平均音響パワー値計測ルーチン（４０４）は、音
響パワー値計測ルーチン（４０３）を制御して、入力し
たフレーム数Ｎ個分の符号化音声データ全てから音響パ
ワー値を求め、入力した符号化音声データ中での音響パ
ワー値の平均値Ｐ￣を求める（ステップＳ１５０５）。
削除判定ルーチン（４０５）はその音響パワー値の平均
値Ｐ￣としきい値格納部（４０６）に設定してあるしき
い値Ｓと比較する（ステップＳ１５０６）。Ｐ￣＞Ｓの
場合は、入力した符号化音声データを全てそのまま出力
し（ステップＳ１５０７）、Ｐ￣＜Ｓの場合は、無音コ
ード格納部（４０７）に設定した無音コードを出力する
（ステップＳ１５０８）。制御ルーチン（４０８）は各
ルーチンを制御して上記の処理を繰り返す。その結果、
本処理部（４００）は、フレーム数Ｎ個の単位で符号化
音声データを削除し、数ｂｉｔの無音コードを出力する
ので、符号化音声データストリームを削減して出力する
（図１６参照）。

【００２１】次に、本発明による他の音声復号化部（５
００）の構成図を図１７に、その処理フロー図を図１８
に示し、本処理部（５００）の処理内容を説明する。本
処理部（５００）は、予め設計時に、数ｂｉｔの無音コ
ードを無音コード格納部（５０２）に設定しておき、か
つ、フレームＮ個分の無音信号を無音信号蓄積部（５０
５）に蓄積しておく（図１８のステップＳ１８０１）。
図１４に示す符号化音声データ処理部（４００）により
削減された符号化音声データストリームが、本処理部
（５００）に入力されると（ステップＳ１８０２）、入
力ルーチン（５０１）がデータを入力し（ステップＳ１
８０３）、無音コード判別ルーチン（５０３）が、無音
コード格納部（５０２）を参照して、入力したデータ
が、無音コードかどうかを判定する（ステップＳ１８０
４）。無音コードの場合、無音信号蓄積部（５０５）に
蓄積しておいた無音信号を出力する（ステップＳ１８０
５）。ここで、何も出力しなければ無音となるので、無
音コードの場合、フレームＮ個分の時間だけ何も出力し
ないという方法もとれる。無音コードでない場合、入力
ルーチンがフレーム単位の符号化符号化音声データを入
力して、復号ルーチン（５０４）が、入力したフレーム
単位の符号化音声データを復号化し、復号音声を出力す
る（ステップＳ１８０６）。制御ルーチン（５０６）は
各ルーチンを制御して上記の処理を繰り返す。その結
果、本処理部（５００）は、符号化音声データ処理部
（４００）より削減された符号化音声データストリーム
を、話速を保つて復号化する。この復号化に要する処理
量は、符号化音声データ処理部（４００）により複合化
するデータ量が削減されている分少ないので、軽減され
る。また、音声の音響パワー値の高い部分では、符号化
音声データが削除されないので、波形の連続性が保た
れ、かつ、子音部分が残る（図１９）。その為、音質劣
化は少ないものとなる。

【００２２】次に、図４〜図１９を参照して説明した本
発明による符号化音声データ処理部および音声復号化部
を利用して構成する音声再生装置、音声録音／再生装置
等の実施形態について説明する。

【００２３】本発明を利用した第一の実施形態を図２０
に示す。本実施形態は、符号化音声データを蓄積してお
き、それを復号化し、再生する音声再生装置（２００
０）に、本発明の符号化音声データ処理部（２０１１）
（図４に示す構成に対応する。）と音声復号化部（２０
０８）を搭載した実施形態である。また、符号化方式と
しては、標準化されている符号化方式であるＩＴＵ（In
ternational Telecommunications Union)，Ｇ．７２９
を使用するものとする。また、符号化音声データの削除
の基準となる音響パワー値のしきい値Ｓを、しきい値格
納部（２０１１ｅ）に設定しておく。

【００２４】キーボード／マウス（２００１）より音声
の再生要求を入力すると、命令受信部（２００５）がこ
れを受信し、符号化音声データ出力部（２０１０）が、
符号化音声データ蓄積部（２００９）から、符号化音声
データを時系列的に連続して出力する。その様な符号化
音声データストリームが符号化音声データ処理部（２０
１１）に入力されると、入力ルーチン（２０１１ｂ）は
その符号化音声データストリームをフレーム単位で、か
つ、１フレーム分の時間間隔（例えば１０ｍｓｅｃ）で
入力する。音響パワー計測ルーチン（２０１１ｃ）は、
入力されたフレーム単位の符号化音声データから、その
符号化音声データが圧縮している音声の音響パワー値を
求める。この時、音響パワー計測ルーチン（２０１１
ｃ）はフレームを一度音声波形に復号化してから音響パ
ワー値を計測するのではなく、フレームの音響パワー値
を導ける情報の部分のみを読み取り、その読み込んだ情
報から音響パワー値Ｐを解析して求める（図６参照）。
このＧ．７２９符号化方式の場合、フレーム単位の符号
化音声データの先頭から９〜１９ｂｉｔ目の区間に、音
響パワー値の情報があり、その部分を読み取り、音響パ
ワー値Ｐを解析する。削除判定ルーチン（２０１１ｄ）
は、その解析した音響パワー値Ｐと、しきい値格納部
（２０１１ｅ）に設定しておいたしきい値Ｓを比較す
る。Ｐ＞Ｓの場合は、入力したフレーム単位の符号化音
声データをそのまま音声復号化部（２００８）へ出力
し、Ｐ＜Ｓの場合は、何も出力しない。

【００２５】制御ルーチン（２０１１ａ）は、各ルーチ
ンを制御し、上記の処理を繰り返す。その結果、符号化
音声データ処理部（２０１１）は、入力される符号化音
声データストリームを削減して、削減した符号化音声デ
ータストリームをフレーム単位で、かつ、１フレーム分
の時間間隔で、音声復号化部（２００８）へ出力する。
音声復号化部（２００８）は、入力された符号化音声デ
ータを即座に復号化して、復号音声信号を、Ｄ／Ａ変化
部（２００７）へ出力する。符号化音声データ処理部
（２０１１）で削除された箇所は、音声復号化部（２０
０８）へ何も出力されないので、復号音声としては無音
となり、復号音声の話速が保たれる。また、音声復号化
部（２００８）では、復号化するデータ量が削減されて
いる分少ないので、復号化の処理量は軽減される。ま
た、符号化音声データが削減されたにも関わらず、音声
の音響パワー値の高い部分では、波形の連続性が保た
れ、かつ、子音部分が残る為、復号音声の音質劣化は最
小のものとなる。そして、この復号音声信号は、Ｄ／Ａ
変化部（２００７）でアナログ音声波形に変換された後
に、音声データ出力部（２００６）から出力されて、ス
ピーカ（２００２）により出力される。

【００２６】なお、図２０に示す音声再生装置（２００
０）において、命令受信部（２００５）、音声データ出
力部（２００６）、Ｄ／Ａ変換部（２００７）、符号化
音声データ蓄積部（２００９）、符号化音声データ出力
部（２０１０）、および符号化音声データ処理部（２０
１１）は、音声再生機能を制御するための音声再生機能
制御部（２００４）によって制御される。また、音声再
生機能制御部（２００４）は、装置全体を制御するため
の装置制御部（２００３）によって制御される。

【００２７】本発明を利用した第二の実施形態を図２１
に示す。本実施形態は、音声を符号化音声データに変換
して蓄積しておき、それを復号化して再生する音声録音
／再生装置（２１００）に、本発明の符号化音声データ
処理部（２１１１）（図８の構成に対応）と音声復号化
部（２１１２）（図１１の構成に対応）を搭載した実施
形態である。また、符号化方式としては、標準化されて
いる符号化方式であるＧ．７２９を使用するものとす
る。音声録音／再生装置（２１００）の設計時に、無音
コード格納部（２１１１ｆ）と無音コード格納部（２１
１２ｄ）に、無音であることを示す数ｂｉｔの無音コー
ドを設定し、符号化音声データの削除の基準となる音響
パワー値のしきい値Ｓを、しきい値格納部（２１１１
ｅ）にその値を設定しておく。

【００２８】キーボード／マウス（２１０１）より録音
要求を入力すると、命令受信部（２１０５）がこれを受
信し、音声データ入力部（２１０８）が入力待ち状態に
なる。マイク（２１０３）を通じて音声を入力すると、
音声は、音声データ入力部（２１０８）、Ａ／Ｄ変換部
（２１０９）、音声符号化部（２１１０）を経て符号化
音声データストリームに変換され、符号化音声データ処
理部（２１１１）へ出力される。

【００２９】符号化音声データ処理部（２１１１）に符
号化音声データストリームが入力されると、入力ルーチ
ン（２１１１ｂ）がその符号化音声データストリームを
フレーム単位で入力する。音響パワー計測ルーチン（２
１１１ｃ）は、入力されたフレーム単位の符号化音声デ
ータから、その符号化音声データが圧縮している音声の
音響パワー値を求める。この時、音響パワー計測ルーチ
ン（２１１１ｃ）はフレームを一度音声波形に復号化し
てから音響パワー値を計測するのではなく、フレームの
音響パワー値の情報を有する部分のみを読み取り、その
読み込んだ情報から音響パワー値Ｐを解析して求める
（図６参照）。このＧ．７２９符号化方式の場合、フレ
ーム単位の符号化音声データの先頭から９〜１９ｂｉｔ
目の区間に、音響パワー値の情報があり、その部分を読
み取り、音響パワー値Ｐを解析する。削除判定ルーチン
（２１１１ｄ）は、その解析した音響パワー値Ｐと、そ
れと先に設定済みであるしきい値Ｓを比較し、Ｐ＞Ｓの
場合は、入力したフレーム単位の符号化音声データをそ
のまま音声データ蓄積部（２１１４）へ出力し、Ｐ＜Ｓ
の場合は、無音コード格納部（２１１１ｆ）にある無音
コードを音声データ蓄積部（２１１４）へ出力する。こ
の無音コードは、数ｂｉｔの情報量で符号化音声データ
よりも非常に少ない情報量である。

【００３０】制御ルーチン（２１１１ａ）は、各ルーチ
ンを制御し、上記の処理を繰り返す。その結果、符号化
音声データ処理部（２１１１）は、入力される符号化音
声データストリームを削減して、音声データ蓄積部（２
１１４）へ出力する。音声データ蓄積部（２１１４）で
は、データ量が削減されている分、蓄積に要する記憶容
量は少なくなる。

【００３１】キーボード／マウス（２１０１）より、再
生要求が入力されると、音声データ蓄積部（２１１４）
は、蓄積している音声データを音声復号化部（２１１
２）へ出力する。音声復号化部（２１１２）に音声デー
タが入力され始めると、入力ルーチン（２１１２ｅ）が
データを入力する。無音コード判別ルーチン（２１１２
ｃ）は、無音コード格納部（２１１２ｄ）を参照して、
入力したデータが無音コードかそうでないかを判定す
る。無音コードの場合、１フレーム分の時間だけＤ／Ａ
変換部（２１０７）へ何も出力せず、無音コードでない
場合、入力ルーチン（２１１２ｅ）がフレーム単位の符
号化音声データを入力し、復号ルーチン（２１１２ｂ）
が、入力したフレーム単位の符号化音声データを復号化
し、復号した音声信号をＤ／Ａ変換部（２１０７）へ出
力する。制御ルーチン（２１１２ａ）は各ルーチンを制
御して上記の処理を繰り返す。

【００３２】その結果、音声復号化部（２１１２）は、
符号化音声データ処理部（２１１１）より削減され、音
声データ蓄積部（２１１４）に蓄積されていた符号化音
声データストリームを、話速を保つて復号化する。この
復号化に要する処理量は、符号化音声データ処理部（２
１１１）により符号化音声データストリームが削減され
ている分、複合化するデータ量が少なく、軽減される。
また、音響パワー値の高い部分では、波形の連続性が保
たれ、かつ、子音部分が残っているので、復号音声の音
質劣化が少ないものとなる。そして、この復号音声信号
は、Ｄ／Ａ変換部（２１０７）、音声データ出力部（２
１０６）を経て、スピーカー（２１０２）により出力さ
れる。

【００３３】なお、図２１に示す音声録音／再生装置
（２１００）において、命令受信部（２１０５）、音声
データ出力部（２１０６）、Ｄ／Ａ変換部（２１０
７）、音声データ入力部（２１０８）、Ａ／Ｄ変換部
（２１０９）、音声符号化部（２１１０）、符号化音声
データ処理部（２１１１）、音声復号化部（２１１
２）、および音声データ蓄積部（２１１４）は、音声録
音／再生機能制御部（２１０４）によって制御される。
また、音声録音／再生機能制御部（２１０４）は、装置
全体を制御するための装置制御部（２１１３）によって
制御される。

【００３４】本発明を利用した第三の実施形態を図２２
に示す。本実施形態は、音声信号を圧縮符号化した符号
化音声データを用い、ＩＰ（Internet Protocol）ネッ
トワークを経由して双方向の音声データパケットの送受
信による音声通信を行うインターネット電話端末Ａ（２
３００Ａ）とインターネット電話端末Ｂ（２３００Ｂ）
の両方に、本発明の符号化音声データ処理部と音声復号
化部を搭載した実施形態である。これらインターネット
電話端末の内部構成図を図２３に示す。符号化方式とし
ては、標準化されている符号化方式であるＧ．７２９を
使用するものとする。また、インターネット電話端末
（２３００（２３００Ａ，Ｂ））には予め（例えば設計
時に）、無音コード格納部（２３１１ｆ）と無音コード
格納部（２３１２ｅ）に符号化音声データを消去したこ
とを示す数ｂｉｔの無音コードを設定し、無音信号蓄積
部（２３１２ｂ）には１フレーム分の無音信号を蓄積し
ておく。キーボード／マウス（２３０１）により、符号
化音声データの削除の基準となる音響パワー値のしきい
値Ｓを入力し、しきい値格納部（２３１１ｅ）にその値
を設定しておく。そして、接続先選択機能部（２３０
５）は、キーボード／マウス（２３０１）により接続先
を指定し、インターネット電話機能制御部（２３０４）
が各部を制御し、接続先と音声通信を行う為の通信設定
を確立する。

【００３５】ユーザが発言する際には、マイク（２３０
３）がユーザの音声を入力し、入力された音声は音声デ
ータ入力部（２３０８）、Ａ／Ｄ変換部（２３０９）、
音声符号化部（２３１０）を経て、符号化音声データス
トリームに変換される。変換された符号化音声データス
トリームは、符号化音声データ処理部（２３１１）に入
力される。

【００３６】符号化音声データ処理部（２３１１）に符
号化音声データストリームが入力されると、入力ルーチ
ン（２３１１ｂ）がフレーム単位で符号化音声データで
入力する。音響パワー値計測ルーチン（２３１１ｃ）
は、入力したフレーム単位の符号化音声データが圧縮し
ている音声の音響パワー値を求めるが、フレームを一度
音声波形に復号化してから音響パワー値を計測するので
はなく、音響パワー値の情報を有する部分のみを読み取
り、その読み込んだ情報から音響パワー値Ｐを解析して
求める（図６参照）。このＧ．７２９符号化方式の場
合、フレーム単位の符号化音声データの先頭から９〜１
９ｂｉｔ目の区間に、音響パワー値の情報があり、その
部分を読み取り、音響パワー値Ｐを解析する。削除判定
ルーチン（２３１１ｄ）が、その解析した音響パワー値
Ｐとしきい値格納部（２３１１ｅ）に設定してあるしき
い値Ｓとを比較し、Ｐ＞Ｓの場合は、入力したフレーム
単位の符号化音声データをパケット処理部（２３１４）
へ出力し、Ｐ＜Ｓの場合は、無音コード格納部（２３１
１ｆ）に設定した無音コードをパケット処理部（２３１
４）へ出力する。制御ルーチン（２３１１ａ）は各ルー
チンを制御して上記の処理を繰り返し、その結果、符号
化音声データ処理部（２３１１）は符号化音声データス
トリームを削減してパケット処理部（２３１４）へ出力
する。

【００３７】パケット処理部（２３１４）では、入力さ
れる音声データをパケット化し、音声データパケットは
ネットワークインターフェース部（２３１５）を経由し
て、インターネットまたはＩＰネットワークへ出力さ
れ、接続先のインターネット電話端末に送信される。こ
の送信される伝送量は、パケット化される音声データ量
が削減されている分、少なくなっているので、ネットワ
ークへの負荷は軽減される。

【００３８】音声データパケットの受信側端末では、受
信した音声データパケットをネットワークインタフェー
ス部（２３１５）を経由して、パケット処理部（２３１
４）に入力される。パケット処理部（２３１４）では、
入力した音声データパケットから音声データだけを取り
出す。取り出された音声データは、パケット処理部（２
３１４）から音声復号化部（２３１２）に入力される。

【００３９】音声復号化部（２３１２）に音声データが
入力され始めると、入力ルーチン（２３１２ｆ）が音声
データを入力し、そして、無音コード判別ルーチン（２
３１２ｄ）が、無音コード格納部（２３１２ｅ）を参照
して、入力した音声データが無音コードかそうでないか
を判定する。無音コードの場合、無音信号蓄積部（２３
１２ｂ）に蓄積しておいた無音信号をＤ／Ａ変換部（２
３０７）へ出力し、無音コードでない場合、入力ルーチ
ン（２３１２ｆ）が、フレーム単位の符号化音声データ
を入力し、復号ルーチン（２３１２ｃ）が、入力したフ
レーム単位の符号化音声データを復号化し、復号した音
声信号をＤ／Ａ変換部（２３０７）へ出力する。この音
声信号は、Ｄ／Ａ変換部（２３０７）、音声データ出力
部（２３０６）を経て、スピーカー（２３０２）により
出力される。制御ルーチン（２３１２ａ）は各ルーチン
を制御して上記の処理を繰り返す。その結果、音声復号
化部（２３１２）は、符号化音声データ処理部（２３１
１）で削減された符号化音声データストリームを、話速
を保つて復号化し、Ｄ／Ａ変換部（２３０７）へ出力す
る。この復号化に要する処理量は、削減されている分、
複合化するデータ量は少なく、軽減される。また、音声
の音響パワー値が高い部分では、波形の連続性が保た
れ、かつ、子音部分が残る為、復号音声の音質劣化が少
ないものとなる。

【００４０】なお、図２３に示すインターネット電話端
末（２３００）は、例えば、マイク、スピーカ等が外部
にまたは内蔵されて接続されたパーソナルコンピュータ
と、復号化音声処理部（２３１１）、音声復号化部（２
３１２）、インターネット電話機能制御部（２３０４）
等を実現するインターネット電話用のソフトウェアとの
組み合わせによって構成することが可能である（図２２
参照）。また、図２３に示すインターネット電話端末
（２３００）では、パケット処理部（２３１４）とネッ
トワークインターフェース部（２３１５）が通信制御部
（２３１６）によって制御されるようになっていて、こ
の通信制御部（２３１６）とインターネット電話機能制
御部（２３０４）が装置制御部（２３１３）によって制
御されるようになっている。また、各装置で用いられる
プログラムは、計算機で読み取り可能な記録媒体、ある
いは通信媒体を介して流通させることができる。

【００４１】本発明を利用した第四の実施形態を図２４
に示す。本実施形態は、音声信号を圧縮符号化した符号
化音声データを用い、ＩＰネットワークを経由して双方
向の音声通信を行うインターネット電話端末Ａ（２５０
０Ａ）とインターネット電話端末Ｂ（２５００Ｂ）の両
方に、本発明の符号化音声データ処理部と音声復号化部
を搭載した実施形態である。これらインターネット電話
端末の内部構成図を図２５に示す。符号化方式として
は、標準化されている符号化方式であるＩＴＵ，Ｇ．７
２３．１を使用するものとする。

【００４２】インターネット電話端末（２５００（２５
００Ａ，Ｂ））の設計時に、無音コード格納部（２５１
１ｈ）と無音コード格納部（２５１２ｅ）に符号化音声
データを消去したことを示す数ｂｉｔの無音コードを設
定しておく。また、符号化音声データ処理部（２５１
１）に、一度に入力するフレーム数Ｎを、入力フレーム
数格納部（２５１１ｃ）に設定する。また、無音信号蓄
積部（２５１２ｂ）にフレームＮ個分の無音信号を蓄積
しておく。また、符号化音声データ処理部（２５１１）
は、音響パワー値を符号化音声データ削除の決定方法に
している為、予めその削除の基準となる音響パワー値の
しきい値Ｓをしきい値格納部（２５１１ｇ）に設定して
おく。

【００４３】ユーザが発言する際には、ユーザの音声が
マイク（２５０３）に入力され、音声は音声データ入力
部（２５０８）、Ａ／Ｄ変換部（２５０９）、音声符号
化部（２５１０）を経て符号化音声データストリームに
変換される。変換された符号化音声データストリーム
は、符号化音声データ処理部（２５１１）に入力され
る。符号化音声データ処理部（２５１１）に符号化音声
データストリームが入力されると、入力ルーチン（２５
１１ｂ）が、入力フレーム数格納部（２５１１ｃ）に設
定したフレーム数Ｎ個分の符号化音声データを一度に入
力する。

【００４４】音響パワー値計測ルーチン（２５１１ｄ）
は、入力された符号化音声データから、フレーム毎に音
響パワー値を求めるが、一度音声波形に復号化してから
音響パワー値を計測するのではなく、音響パワー値の情
報を有する部分のみを読み取り、その読み込んだ情報か
ら音響パワー値Ｐを解析して求める（図６参照）。この
Ｇ．７２３．１符号化方式の場合、フレーム単位の符号
化音声データの先頭から０〜２４ｂｉｔ目の区間に、音
響パワー値の情報があり、その部分を読み取り、音響パ
ワー値Ｐを解析する。平均音響パワー計測ルーチン（２
５１１ｅ）は、音響パワー値計測ルーチン（２５１１
ｄ）を制御して、入力したＮ個のフレーム全てから音響
パワー値を解折し、入力したＮ個のフレーム間での音響
パワー値の平均値Ｐ￣を求める。削除判定ルーチン（２
５１１ｆ）は、その音響パワー値の平均値Ｐ￣としきい
値格納部（２５１１ｇ）に設定してあるしきい値Ｓと比
較し、Ｐ￣＞Ｓの場合は、入力した符号化音声データを
全てそのままパケット処理部（２５１４）へ出力し、Ｐ
￣＜Ｓの場合は、無音コード格納部（２５１１ｈ）に設
定してある無音コードをパケット処理部（２５１４）へ
出力する。制御ルーチン（２５１１ａ）は各ルーチンを
制御して上記の処理を繰り返す。その結果、符号化音声
データ処理部（２５１１）は、入力された符号化音声デ
ータストリームをＮ個のフレーム数を単位として削減し
て、パケット処理部（２５１４）に出力する。

【００４５】パケット処理部（２５１４）に入力される
符号化音声データは、パケット処理部（２５１４）でパ
ケット化され、ネットワークインタフェース部（２５１
５）を経由して、接続先に送信される。この送信される
伝送量は、パケット化される音声データ量が削減されて
いる分、少なくなるので、ネットワークへの負荷は軽減
される。

【００４６】音声データパケットの受信側端末では、受
信した音声データパケットをネットワークインタフェー
ス部（２５１５）を経由して、パケット処理部（２５１
４）に入力される。パケット処理部（２５１４）では、
入力した音声データパケットを音声データだけを取り出
す。取り出された音声データは、パケット処理部（２５
１４）から音声復号化部（２５１２）に入力される。

【００４７】音声復号化部（２５１２）に音声データが
入力され始めると、入力ルーチン（２５１２ｆ）が音声
データを入力し、そして、無音コード判別ルーチン（２
５１２ｄ）が、無音コード格納部（２５１２ｅ）を参照
して、入力した音声データが無音コードかそうでないか
を判定する。無音コードの場合、無音信号蓄積部（２５
１２ｂ）に蓄積しておいたフレームＮ個分の無音信号
を、Ｄ／Ａ変換部（２５０７）へ出力する。無音コード
でない場合、入力ルーチン（２５１２ｆ）が、フレーム
単位の符号化音声データを入力し、復号ルーチン（２５
１２ｃ）が、入力したフレーム単位の符号化音声データ
を復号化し、復号した音声信号をＤ／Ａ変換部（２５０
７）へ出力する。この音声信号は、Ｄ／Ａ変換部（２５
０７）、音声データ出力部（２５０６）を経て、スピー
カー（２５０２）により出力される。制御ルーチン（２
５１２ａ）は各ルーチンを制御して上記の処理を繰り返
す。その結果、音声復号化部（２５１２）は、符号化音
声データ処理部（２５１１）により削減された符号化音
声データストリームを、話速を保つて復号化し、Ｄ／Ａ
変換部（２５０７）へ出力する。この復号化に要する処
理量は、符号化音声データが削減されている分、複合化
するデータ量が少なく、軽減される。また、音声の音響
パワー値が高い部分では、波形の連続性が保たれ、か
つ、子音部分が残る為、復号音声の音質劣化が少ないも
のとなる。

【００４８】なお、図２５に示すインターネット電話端
末（２５００）では、パケット処理部（２５１４）とネ
ットワークインターフェース部（２５１５）が通信制御
部（２５２１）によって制御されるようになっていて、
この通信制御部（２５２１）とインターネット電話機能
制御部（２５０４）が装置制御部（２５１３）によって
制御されるようになっている。

【００４９】本発明を利用した第五の実施形態を図２６
に示す。本実施形態は、既に圧縮符号化した符号化音声
データを蓄積してあるサーバ端末（２７００）から、ク
ライアント端末（２８００）に、インターネット／ＩＰ
ネットワークを経由して、サーバ端末（２７００）に蓄
積してある符号化音声データを配信するシステムに、本
発明の符号化音声データ処理部と音声復号化部を搭載し
た実施形態である。このサーバ端末（２７００）および
クライアント端末（２８００）は、それぞれワークステ
ーションと音声データ配信ソフトとの組み合わせ、およ
びパーソナルコンピュータとスピーカと音声データ受信
ソフトとの組み合わせから構成することができる。この
サーバ端末（２７００）の内部構成図を図２７に、クラ
イアント端末（２８００）の内部構成図を図２８に示
す。符号化方式としては、標準化されている符号化方式
であるＧ．７２３．１を使用するものとする。

【００５０】サーバ端末（２７００）とクライアント端
末（２８００）の設計時に予め、無音コード格納部（２
７０４ｈ）と無音コード格納部（２８０８ｅ）に無音で
あることを示す数ｂｉｔの無音コードを設定しておく。
また、符号化音声データ処理部（２７０４）に、一度に
入力するフレーム数Ｎを、入力フレーム数格納部（２７
０４ｃ）に設定し、無音信号蓄積部（２８０８ｂ）に
は、フレーム数Ｎ個分の無音信号を設定しておく。ま
た、符号化音声データ処理部（２７０４）は、音響パワ
ー値に基づいて符号化音声データの削除を決定する方法
を用いている為、予めその削除の基準となる音響パワー
値のしきい値Ｓをしきい値格納部（２７０４ｇ）に設定
しておく。

【００５１】まず始めに、クライアント端末（２８０
０）から、キーボード／マウス（２８０１）で接続先選
択機能部（２８０５）に指示を入力することにより接続
先であるサーバ端末（２７００）を指定すると、音声デ
ータ受信機能制御部（２８０４）と音声データ配信機能
制御部（２７０２）が各部を制御し、音声通信を確立す
る。

【００５２】サーバ端末（２７００）では、符号化音声
データ蓄積部（２７０３）が、蓄積している符号化音声
データを時系列的に連続して、符号化音声データ処理部
（２７０４）へ出力する。符号化音声データ処理部（２
７０４）に、その様な符号化音声データストリームが入
力されると、入力ルーチン（２７０４ｂ）が、入力フレ
ーム数格納部（２７０４ｃ）に設定したフレーム数Ｎ個
分の符号化音声データを一度に入力する。音響パワー値
計測ルーチン（２７０４ｄ）は、入力された符号化音声
データから、フレーム毎に音響パワー値を求めるが、一
度音声波形に復号化してから音響パワー値を計測するの
ではなく、音響パワー値の情報を有する部分のみを読み
取り、その読み込んだ情報から音響パワー値Ｐを解析し
て求める（図６参照）。このＧ．７２３．１符号化方式
の場合、フレーム単位の符号化音声データの先頭から０
〜２４ｂｉｔ目の区間に、音響パワー値の情報があり、
その部分の情報だけを読み取り、音響パワー値Ｐを解析
する。

【００５３】平均音響パワー計測ルーチン（２７０４
ｅ）は、音響パワー値計測ルーチン（２７０４ｄ）を制
御して、入力したＮ個のフレーム全てから音響パワー値
を解析し、入力したＮ個のフレーム間での音響パワー値
の平均値Ｐ￣を求める。削除判定ルーチン（２７０４
ｆ）は、その音響パワー値の平均値Ｐ￣としきい値格納
部（２７０４ｇ）に設定してあるしきい値Ｓと比較し、
Ｐ￣＞Ｓの場合は、入力した符号化音声データを全てそ
のままパケット処理部（２７０５）へ出力し、Ｐ￣＜Ｓ
の場合は、無音コード格納部（２７０４ｈ）に設定して
ある無音コードをパケット処理部（２７０５）へ出力す
る。

【００５４】制御ルーチン（２７０４ａ）は各ルーチン
を制御して上記の処理を繰り返す。その結果、符号化音
声データ処理部（２７０４）は、入力された符号化音声
データストリームを、フレームＮ個分を単位として削減
し、パケット処理部（２７０５）へ出力する。パケット
処理部（２７０５）は、入力される符号化音声データを
パケット化し、パケット化された音声データは、ネット
ワークインタフェース部（２７０６）を経由して、接続
先のクライアント端末（２８００）へ送信される。この
送信される伝送量は、パケット化される音声データ量が
削減されている分、少なくなり、ネットワークへの負荷
は軽減される。

【００５５】クライアント端末（２８００）は、配信さ
れた音声データパケットを受信し、受信した音声データ
パケットをネットワークインタフェース部（２８１１）
を経由して、パケット処理部（２８１０）に入力する。
パケット処理部（２８１０）では、入力した音声データ
パケットから音声データだけを取り出す。取り出された
音声データは、パケット処理部（２８１０）から音声復
号化部（２８０８）に入力される。音声復号化部（２８
０８）に音声データが入力され始めると、入力ルーチン
（２８０８ｆ）が音声データを入力し、そして、無音コ
ード判別ルーチン（２８０８ｄ）が、無音コード格納部
（２８０８ｅ）を参照して、入力した音声データが無音
コードかそうでないかを判定する。無音コードの場合、
無音信号蓄積部に蓄積してあるフレームＮ個分の無音信
号を、Ｄ／Ａ変換部（２８０７）へ出力する。無音コー
ドでない場合、入力ルーチン（２８０８ｆ）が、フレー
ム単位の符号化音声データを入力し、復号ルーチン（２
８０８ｃ）が、入力したフレーム単位の符号化音声デー
タを復号化し、復号した音声信号をＤ／Ａ変換部（２８
０７）へ出力する。この音声信号は、Ｄ／Ａ変換部（２
８０７）、音声データ出力部（２８０６）を経て、スピ
ーカー（２８０２）により出力される。

【００５６】制御ルーチン（２８０８ａ）は各ルーチン
を制御して上記の処理を繰り返す。その結果、音声復号
化部（２８０８）は、サーバ端末の符号化音声データ処
理部（２７０４）で削減された符号化音声データストリ
ームを、話速を保つて復号化し、Ｄ／Ａ変換部（２８０
７）へ出力する。この復号化に要する処理量は、符号化
音声データが削減されている分、複合化するデータ量が
少なく、軽減される。また、音声の音響パワー値が高い
部分では、波形の連続性が保たれ、かつ、子音部分が残
る為、復号音声の音質劣化が少ないものとなる。

【００５７】なお、図２７に示すサーバ端末（２７０
０）では、パケット処理部（２７０５）とネットワーク
インターフェース部（２７０６）が通信制御部（２７０
４）によって制御されるようになっていて、この通信制
御部（２７０４）と音声データ配信機能制御部（２７０
２）が装置制御部（２７０１）によって制御されるよう
になっている。また、図２８に示すクライアント端末
（２８００）では、パケット処理部（２８１０）とネッ
トワークインターフェース部（２８１１）が通信制御部
（２８０９）によって制御されるようになっていて、こ
の通信制御部（２８０９）と音声データ受信機能制御部
（２８０４）が装置制御部（２８０３）によって制御さ
れるようになっている。

【００５８】

【発明の効果】以上説明したように、本発明を用いれ
ば、端末での処理量を増やさず、かつ、復号した音声の
音質劣化が少ないように、符号化音声データのデータ量
を削減することが可能となる。

【図面の簡単な説明】

【図１】音声符号化の概要図である。

【図２】符号化音声データのデータ量削減方法の例を
示す図である。

【図３】削減された符号化音声データストリームを復
号化した場合の音声波形を示す図である。

【図４】本発明の符号化音声データ処理部の構成図で
ある。

【図５】本発明の符号化音声データ処理部の処理フロ
ー図である。

【図６】フレームから音響パワー値を解析する方法の
概要図である。

【図７】本発明の音声復号化部により復号化された音
声波形を示す図である。

【図８】本発明の符号化音声データ処理部の構成図で
ある。

【図９】本発明の符号化音声データ処理部の処理フロ
ー図である。

【図１０】本発明の符号化音声データ処理部により削
減された符号化音声データストリームを示す図である。

【図１１】本発明の音声復号化部の構成図である。

【図１２】本発明の音声復号化部の処理フロー図であ
る。

【図１３】本発明の音声復号化部により復号化された
音声波形を示す図である。

【図１４】本発明の符号化音声データ処理部の構成図
である。

【図１５】本発明の符号化音声データ処理部の処理フ
ロー図である。

【図１６】本発明の符号化音声データ処理部により削
減された符号化音声データストリームを示す図である。

【図１７】本発明の音声復号化部の構成図である。

【図１８】本発明の音声復号化部の処理フロー図であ
る。

【図１９】本発明の音声復号化部により復号化された
音声波形を示す図である。

【図２０】本発明の第一の実施形態を示す図である。

【図２１】本発明の第二の実施形態を示す図である。

【図２２】本発明の第三の実施形態を示す図である。

【図２３】本発明の第三の実施形態のインターネット
電話端末の内部構成図である。

【図２４】本発明の第四の実施形態を示す図である。

【図２５】本発明の第四の実施形態のインターネット
電話端末の内部構成図である。

【図２６】本発明の第五の実施形態を示す図である。

【図２７】本発明の第五の実施形態のサーバ端末の内
部構成図である。

【図２８】本発明の第五の実施形態のクライアント端
末の内部構成図である。

【符号の説明】

１００，２００，４００，２０１１，２１１１，２３１
１，２５１１，２７０４…符号化音声データ処理部、４
０２，２５１１ｃ，２７０４ｃ…入力フレーム数格納
部、１０２，２０２，４０３，２０１１ｃ，２１１１
ｃ，２３１１ｃ，２５１１ｄ，２７０４ｄ…音響パワー
値計測ルーチン、４０４，２５１１ｅ，２７０４ｅ…平
均音響パワー値計測ルーチン、１０３，２０３，４０
５，２０１１ｄ，２１１１ｄ，２３１１ｄ，２５１１
ｆ，２７０４ｆ…削除判定ルーチン、１０４，２０４，
４０６，２０１１ｅ，２１１１ｅ，２３１１ｅ，２５１
１ｇ，２７０４ｇ…しきい値格納部、２０５，３０２，
４０７，５０２，２１１１ｆ，２１１２ｄ，２３１１
ｆ，２３１２ｅ，２５１１ｈ，２５１２ｅ，２７０４
ｈ，２８０８ｅ…無音コード格納部、１５０，３００，
５００，２００８，２１１２，２３１２，２５１２，２
８０８…音声復号化部、３０３，５０３，２１１２ｃ，
２３１２ｄ，２５１２ｄ，２８０８ｄ…無音コード判定
ルーチン、３０４，５０４，２１１２ｂ，２３１２ｃ，
２５１２ｃ，２８０８ｃ…復号ルーチン、３０５，５０
５，２３１２ｂ，２５１２ｂ，２８０８ｂ…無音信号蓄
積部

─────────────────────────────────────────────────────

【手続補正書】

【提出日】平成１１年１１月２２日（１９９９．１１．
２２）

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】特許請求の範囲

【補正方法】変更

【補正内容】

【特許請求の範囲】

【手続補正２】

【補正対象書類名】明細書

【補正対象項目名】００１１

【補正方法】変更

【補正内容】

【００１１】また、請求項１６、１７、および１８記載
の符号化音声データ処理装置は、図４、図８、および図
１４にそれぞれ対応し、請求項１９、２０、および２１
記載の符号化音声データ処理方法は、図５、図９、およ
び図１５にそれぞれ対応し、そして、請求項２２、２
３、および２４記載の記録媒体は、図５、図９、および
図１５にそれぞれ対応する。

───────────────────────────────────────────────────── フロントページの続き (72)発明者林泰仁東京都新宿区西新宿三丁目19番２号日本電信電話株式会社内 (72)発明者小谷野浩東京都新宿区西新宿三丁目19番２号日本電信電話株式会社内 (72)発明者守谷健弘東京都新宿区西新宿三丁目19番２号日本電信電話株式会社内Ｆターム(参考） 5D045 DA20 5K041 AA04 AA07 BB02 CC01 HH11 HH24 HH27 HH41 JJ33

Claims

【特許請求の範囲】

【請求項１】音声信号を圧縮符号化し、音声情報の一
部として音響パワー値の情報を含む符号化音声データを
生成する音声符号化技術を用いて、既に圧縮符号化済で
ある該符号化音声データを蓄積してある符号化音声デー
タ蓄積部、または、既に圧縮符号化済である該符号化音
声データを端末外部から入力する音声データ入力部と、
該符号化音声データを符号化の単位であるフレーム単位
で処理する符号化音声データ処理部と、該符号化音声デ
ータを音声信号に復号化する音声復号化部と、音声信号
を再生出力する音声再生部とを持つ端末において、該符号化音声データ処理部で、（Ａ）該符号化音声デー
タ蓄積部、または、該音声データ入力部から、該符号化
音声データを、符号化の単位であるフレーム単位で、か
つ、１フレーム分の時間間隔で、入力する過程と、
（Ｂ）該入力したフレーム単位の該符号化音声データか
ら、音響パワー値の情報を有する部分だけを読み込む過
程と、（Ｃ）該読み込んだ情報を解析して、音響パワー
値を算出する過程と、（Ｄ）音響パワー値のしきい値を
設定する過程と、（Ｅ）該解析した音響パワー値と該設
定したしきい値を比較し、該解析した音響パワー値が該
設定したしきい値より大きい場合、該入力したフレーム
単位の該符号化音声データを該音声復号化部へ出力し、
該解析した音響パワー値が該設定したしきい値より小さ
い場合、該音声復号化部へ何も出力しない過程と、該音
声復号化部で、（Ｆ）該符号化音声データ処理部から出
力されるフレーム単位の該符号化音声データを入力し、
次に入力される該符号化音声データを待たずに、即座に
復号化し、該音声再生部に出力する過程を有することを
特徴とする符号化音声データの削減方法。
【請求項２】音声信号を圧縮符号化し、音声情報の一
部として音響パワー値の情報を含めた符号化音声データ
を生成する音声符号化技術を用いて、音声信号を該符号
化音声データに圧縮符号化する音声符号化部、または、
既に圧縮符号化済である該符号化音声データを蓄積して
ある符号化音声データ蓄積部と、該符号化音声データを
符号化の単位であるフレーム単位で処理する符号化音声
データ処理部と、音声データを蓄積する音声データ蓄積
部と、該符号化音声データを音声信号に復号化する音声
復号化部と、音声信号を再生出力する音声再生部とを持
つ端末において、該符号化音声データ処理部で、（Ａ）該音声符号化部、
または、該符号化音声データ蓄積部から、該符号化音声
データを、フレーム単位で入力する過程と、（Ｂ）該入
力されたフレーム単位の該符号化音声データから、音響
パワー値の情報を有する部分だけを読み込む過程と、
（Ｃ）該読み込んだ情報を解析して、音響パワー値を算
出する過程と、（Ｄ）音響パワー値のしきい値を設定す
る過程と、（Ｅ）該解析した音響パワー値と該設定した
しきい値を比較し、該解析した音響パワー値が該設定し
たしきい値より大きい場合、該入力したフレーム単位の
該符号化音声データを該音声データ蓄積部へ出力し、該
解析した音響パワー値が該設定したしきい値より小さい
場合、無音であることを示す無音コードを該音声データ
蓄積部へ出力する過程と、該音声復号化部で、（Ｆ）該音声データ蓄積部から、デ
ータを入力する過程と、（Ｇ）該入力したデータが該無
音コードか否かを判定する過程と、（Ｈ）１フレーム分
の無音信号を蓄積する過程と、（Ｉ）該判定により、該
入力したデータが該無音コードでない場合、１フレーム
分の符号化音声データを入力して復号化し、復号化した
音声信号を該音声再生部に出力し、該入力したデータが
該無音コードの場合、該無音信号を該音声再生部に出力
する、または、１フレーム分の時間だけ該音声再生部に
何も出力しない過程とを有することを特徴とする符号化
音声データの削減方法。
【請求項３】音声信号を圧縮符号化し、音声情報の一
部として音響パワー値の情報を含めた符号化音声データ
を生成する音声符号化技術を用いて、音声通信を行うシ
ステムで、音声信号を該符号化音声データに圧縮符号化
する音声符号化部、または、既に圧縮符号化済である該
符号化音声データを蓄積してある符号化音声データ蓄積
部と、該符号化音声データを符号化の単位であるフレー
ム単位で処理する符号化音声データ処理部と、外部の端
末へ音声データを出力する音声データ出力部とを持つ端
末を送信端末とし、外部の端末から音声データを入力す
る音声データ入力部と、該符号化音声データを音声信号
に復号化する音声復号化部と、音声信号を再生出力する
音声再生部とを持つ端末を受信端末とする、音声通信シ
ステムにおいて、該送信端末の該符号化音声データ処理部で、（Ａ）該音
声符号化部、または、該音声データ蓄積部から、該符号
化音声データを、フレーム単位で入力する過程と、
（Ｂ）該入力されたフレーム単位の該符号化音声データ
から、音響パワー値の情報を有する部分だけを読み込む
過程と、（Ｃ）該読み込んだ情報を解析して、音響パワ
ー値を算出する過程と、（Ｄ）音響パワー値のしきい値
を設定する過程と、（Ｅ）該解析した音響パワー値と該
設定したしきい値を比較し、該解析した音響パワー値が
該設定したしきい値より大きい場合、該入力したフレー
ム単位の該符号化音声データを該音声データ出力部へ出
力し、該解析した音響パワー値が該設定したしきい値よ
り小さい場合、無音であることを示す無音コードを該音
声データ出力部へ出力する過程と、該受信端末の該音声復号化部で、（Ｆ）該音声データ入
力部から、データを入力する過程と、（Ｇ）該入力した
データが該無音コードか否かを判定する過程と、（Ｈ）
１フレーム分の無音信号を蓄積する過程と、（Ｉ）該判
定により、該入力したデータが該無音コードでない場
合、１フレーム分の符号化音声データを入力して復号化
し、復号化した音声信号を該音声再生部に出力し、該入
力したデータが該無音コードの場合、該無音信号を該音
声再生部に出力する、または、１フレーム分の時間だけ
該音声再生部に何も出力しない過程とを有することを特
徴とする符号化音声データの削減方法。
【請求項４】音声信号を圧縮符号化し、音声情報の一
部として音響パワー値の情報を含めた符号化音声データ
を生成する音声符号化技術を用いて、音声信号を該符号
化音声データに圧縮符号化する音声符号化部、または、
既に圧縮符号化済である該符号化音声データを蓄積して
ある符号化音声データ蓄積部と、該符号化音声データを
符号化の単位であるフレーム単位で処理する符号化音声
データ処理部と、音声データを蓄積する音声データ蓄積
部と、該符号化音声データを音声信号に復号化する音声
復号化部と、音声信号を再生出力する音声再生部とを持
つ端末において、該符号化音声データ処理部で、（Ａ）該音声符号化部、
または、該符号化音声データ蓄積部から、一度に入力す
る該符号化音声データの符号化の単位となるフレーム数
を、設定する過程と、（Ｂ）該音声符号化部、または、
該符号化音声データ蓄積部から、該符号化音声データ
を、該設定したフレーム数分だけ入力する過程と、
（Ｃ）該入力した該符号化音声データからフレーム毎
に、音響パワー値の情報を含む部分だけを読み込む過程
と、（Ｄ）該読み込んだ情報を解析して、音響パワー値
を算出する過程と、（Ｅ）上記の方法で、該入力した該
符号化音声データのフレーム数分の音響パワー値を求
め、該入力した該符号化音声データ内での音響パワー値
の平均値を求める過程と、（Ｆ）音響パワー値のしきい
値を設定する過程と、（Ｇ）該音響パワー値の平均値と
該設定したしきい値を比較し、該音響パワー値の平均値
が該設定したしきい値よりも大きい場合、該入力した該
符号化音声データを全て該音声データ蓄積部に出力し、
該音響パワー値の平均値が該設定したしきい値よりも小
さい場合、無音であることを示す無音コードを該音声デ
ータ蓄積部に出力する過程と、該音声復号化部で、（Ｈ）該音声データ蓄積部から、デ
ータを入力する過程と、（Ｉ）該入力したデータが該無
音コードか否かを判定する過程と、（Ｊ）該設定したフ
レーム数分の無音信号を蓄積する過程と、（Ｋ）該判定
により、該入力した音声データが該無音コードでない場
合、１フレーム分の符号化音声データを入力して復号化
し、復号化した音声信号を該音声再生部に出力し、該入
力したデータが該無音コードの場合、該無音信号を該音
声再生部に出力する、または、該設定したフレーム数分
の時間だけ該音声再生部に何も出力しない過程とを有す
ることを特徴とする符号化音声データの削減方法。
【請求項５】音声信号を圧縮符号化し、音声情報の一
部として音響パワー値の情報を含めた符号化音声データ
を生成する音声符号化技術を用いて、音声通信を行うシ
ステムで、音声信号を該符号化音声データに圧縮符号化
する音声符号化部、または、既に圧縮符号化済である該
符号化音声データを蓄積してある符号化音声データ蓄積
部と、該符号化音声データを符号化の単位であるフレー
ム単位で処理する符号化音声データ処理部と、外部の端
末へ音声データを端末外部へ出力する音声データ出力部
とを持つ端末を送信端末とし、外部の端末から音声デー
タを入力する音声データ入力部と、該符号化音声データ
を音声信号に復号化する音声復号化部と、音声信号を再
生出力する音声再生部とを持つ端末を受信端末とする、
音声通信システムにおいて、該送信端末の該符号化音声データ処理部で、（Ａ）該音
声符号化部、または、該符号化音声データ蓄積部から、
一度に入力する該符号化音声データの符号化の単位とな
るフレーム数を、設定する過程と、（Ｂ）該音声符号化
部、または、該符号化音声データ蓄積部から、該符号化
音声データを、該設定したフレーム数分だけ入力する過
程と、（Ｃ）該入力した該符号化音声データからフレー
ム毎に、音響パワー値の情報を含む部分だけを読み込む
過程と、（Ｄ）該読み込んだ情報を解析して、音響パワ
ー値を算出する過程と、（Ｅ）上記の方法で、該入力し
た該符号化音声データのフレーム数分の音響パワー値を
求め、該入力した該符号化音声データ内での音響パワー
値の平均値を求める過程と、（Ｆ）音響パワー値のしき
い値を設定する過程と、（Ｇ）該音響パワー値の平均値
と該設定したしきい値を比較し、該音響パワー値の平均
値が該設定したしきい値よりも大きい場合、該入力した
該符号化音声データを全て該音声データ出力部に出力
し、該音響パワー値の平均値が該設定したしきい値より
も小さい場合、無音であることを示す無音コードを該音
声データ出力部に出力する過程と、該受信端末の該音声復号化部で、（Ｈ）該音声データ入
力部から、データを入力する過程と、（Ｉ）該入力した
データが該無音コードか否かを判定する過程と、（Ｊ）
該設定したフレーム数分の無音信号を蓄積する過程と、
（Ｋ）該判定により、該入力した音声データが該無音コ
ードでない場合、１フレーム分の符号化音声データを入
力して復号化し、復号化した音声信号を該音声再生部に
出力し、該入力したデータが該無音コードの場合、該無
音信号を該音声再生部に出力する、または、該設定した
フレーム数分の時間だけ該音声再生部に何も出力しない
過程とを有することを特徴とする符号化音声データの削
減方法。
【請求項６】音声信号を圧縮符号化し、音声情報の一
部として音響パワー値の情報を含む符号化音声データを
生成する音声符号化技術を用いて、既に圧縮符号化済で
ある該符号化音声データを蓄積してある符号化音声デー
タ蓄積部、または、既に圧縮符号化済である該符号化音
声データを端末外部から入力する音声データ入力部と、
該符号化音声データを符号化の単位であるフレーム単位
で処理する符号化音声データ処理部と、該符号化音声デ
ータを音声信号に復号化する音声復号化部と、音声信号
を再生出力する音声再生部とを持つ端末において、該符号化音声データ処理部では、（Ａ）該符号化音声デ
ータ蓄積部、または、該音声データ入力部から、該符号
化音声データを、符号化の単位であるフレーム単位で、
かつ、１フレーム分の時間間隔で、入力する手段と、
（Ｂ）該入力したフレーム単位の該符号化音声データか
ら、音響パワー値の情報を有する部分だけを読み込む手
段と、（Ｃ）該読み込んだ情報を解析して、音響パワー
値を算出する手段と、（Ｄ）音響パワー値のしきい値を
設定する手段と、（Ｅ）該解析した音響パワー値と該設
定したしきい値を比較し、該解析した音響パワー値が該
設定したしきい値より大きい場合、該入力したフレーム
単位の該符号化音声データを該音声復号化部へ出力し、
該解析した音響パワー値が該設定したしきい値より小さ
い場合、該音声復号化部へ何も出力しない手段とを持
ち、該音声復号化部では、（Ｆ）該符号化音声データ処理部
から出力されるフレーム単位の該符号化音声データを入
力し、次に入力される該符号化音声データを待たずに、
即座に復号化し、該音声再生部に出力する手段を持つこ
とを特徴とする符号化音声データの削減装置。
【請求項７】音声信号を圧縮符号化し、音声情報の一
部として音響パワー値の情報を含めた符号化音声データ
を生成する音声符号化技術を用いて、音声信号を該符号
化音声データに圧縮符号化する音声符号化部、または、
既に圧縮符号化済である該符号化音声データを蓄積して
ある符号化音声データ蓄積部と、該符号化音声データを
符号化の単位であるフレーム単位で処理する符号化音声
データ処理部と、音声データを蓄積する音声データ蓄積
部と、該符号化音声データを音声信号に復号化する音声
復号化部と、音声信号を再生出力する音声再生部とを持
つ端末において、該符号化音声データ処理部では、（Ａ）該音声符号化
部、または、該符号化音声データ蓄積部から、該符号化
音声データを、フレーム単位で入力する手段と、（Ｂ）
該入力されたフレーム単位の該符号化音声データから、
音響パワー値の情報を有する部分だけを読み込む手段
と、（Ｃ）該読み込んだ情報を解析して、音響パワー値
を算出する手段と、（Ｄ）音響パワー値のしきい値を設
定する手段と、（Ｅ）該解析した音響パワー値と該設定
したしきい値を比較し、該解析した音響パワー値が該設
定したしきい値より大きい場合、該入力したフレーム単
位の該符号化音声データを該音声データ蓄積部へ出力
し、該解析した音響パワー値が該設定したしきい値より
小さい場合、無音であることを示す無音コードを該音声
データ蓄積部へ出力する手段とを持ち、該音声復号化部では、（Ｆ）該音声データ蓄積部から、
データを入力する手段と、（Ｇ）該入力したデータが該
無音コードか否かを判定する手段と、（Ｈ）１フレーム
分の無音信号を蓄積する手段と、（Ｉ）該判定により、
該入力したデータが該無音コードでない場合、１フレー
ム分の符号化音声データを入力して復号化し、復号化し
た音声信号を該音声再生部に出力し、該入力したデータ
が該無音コードの場合、該無音信号を該音声再生部に出
力する、または、１フレーム分の時間だけ該音声再生部
に何も出力しない手段とを持つことを特徴とする符号化
音声データの削減装置。
【請求項８】音声信号を圧縮符号化し、音声情報の一
部として音響パワー値の情報を含めた符号化音声データ
を生成する音声符号化技術を用いて、音声通信を行うシ
ステムで、音声信号を該符号化音声データに圧縮符号化
する音声符号化部、または、既に圧縮符号化済である該
符号化音声データを蓄積してある符号化音声データ蓄積
部と、該符号化音声データを符号化の単位であるフレー
ム単位で処理する符号化音声データ処理部と、外部の端
末へ音声データを出力する音声データ出力部とを持つ端
末を送信端末とし、外部の端末から音声データを入力す
る音声データ入力部と、該符号化音声データを音声信号
に復号化する音声復号化部と、音声信号を再生出力する
音声再生部とを持つ端末を受信端末とする、音声通信シ
ステムにおいて、該送信端末の該符号化音声データ処理部では、（Ａ）該
音声符号化部、または、該音声データ蓄積部から、該符
号化音声データを、フレーム単位で入力する手段と、
（Ｂ）該入力されたフレーム単位の該符号化音声データ
から、音響パワー値の情報を有する部分だけを読み込む
手段と、（Ｃ）該読み込んだ情報を解析して、音響パワ
ー値を算出する手段と、（Ｄ）音響パワー値のしきい値
を設定する手段と、（Ｅ）該解析した音響パワー値と該
設定したしきい値を比較し、該解析した音響パワー値が
該設定したしきい値より大きい場合、該入力したフレー
ム単位の該符号化音声データを該音声データ出力部へ出
力し、該解析した音響パワー値が該設定したしきい値よ
り小さい場合、無音であることを示す無音コードを該音
声データ出力部へ出力する手段とを持ち、該受信端末の該音声復号化部では、（Ｆ）該音声データ
入力部から、データを入力する手段と、（Ｇ）該入力し
たデータが該無音コードか否かを判定する手段と、
（Ｈ）１フレーム分の無音信号を蓄積する手段と、
（Ｉ）該判定により、該入力したデータが該無音コード
でない場合、１フレーム分の符号化音声データを入力し
て復号化し、復号化した音声信号を該音声再生部に出力
し、該入力したデータが該無音コードの場合、該無音信
号を該音声再生部に出力する、または、１フレーム分の
時間だけ該音声再生部に何も出力しない手段とを持つこ
とを特徴とする符号化音声データの削減装置。
【請求項９】音声信号を圧縮符号化し、音声情報の一
部として音響パワー値の情報を含めた符号化音声データ
を生成する音声符号化技術を用いて、音声信号を該符号
化音声データに圧縮符号化する音声符号化部、または、
既に圧縮符号化済である該符号化音声データを蓄積して
ある符号化音声データ蓄積部と、該符号化音声データを
符号化の単位であるフレーム単位で処理する符号化音声
データ処理部と、音声データを蓄積する音声データ蓄積
部と、該符号化音声データを音声信号に復号化する音声
復号化部と、音声信号を再生出力する音声再生部とを持
つ端末において、該符号化音声データ処理部では、（Ａ）該音声符号化
部、または、該符号化音声データ蓄積部から、一度に入
力する該符号化音声データの符号化の単位となるフレー
ム数を、設定する手段と、（Ｂ）該音声符号化部、また
は、該符号化音声データ蓄積部から、該符号化音声デー
タを、該設定したフレーム数分だけ入力する手段と、
（Ｃ）該入力した該符号化音声データからフレーム毎
に、音響パワー値の情報を含む部分だけを読み込む手段
と、（Ｄ）該読み込んだ情報を解析して、音響パワー値
を算出する手段と、（Ｅ）上記の方法で、該入力した該
符号化音声データのフレーム数分の音響パワー値を求
め、該入力した該符号化音声データ内での音響パワー値
の平均値を求める手段と、（Ｆ）音響パワー値のしきい
値を設定する手段と、（Ｇ）該音響パワー値の平均値と
該設定したしきい値を比較し、該音響パワー値の平均値
が該設定したしきい値よりも大きい場合、該入力した該
符号化音声データを全て該音声データ蓄積部に出力し、
該音響パワー値の平均値が該設定したしきい値よりも小
さい場合、無音であることを示す無音コードを該音声デ
ータ蓄積部に出力する手段とを持ち、該音声復号化部では、（Ｈ）該音声データ蓄積部から、
データを入力する手段と、（Ｉ）該入力したデータが該
無音コードか否かを判定する手段と、（Ｊ）該設定した
フレーム数分の無音信号を蓄積する手段と、（Ｋ）該判
定により、該入力した音声データが該無音コードでない
場合、１フレーム分の符号化音声データを入力して復号
化し、復号化した音声信号を該音声再生部に出力し、該
入力したデータが該無音コードの場合、該無音信号を該
音声再生部に出力する、または、該設定したフレーム数
分の時間だけ該音声再生部に何も出力しない手段とを持
つことを特徴とする符号化音声データの削減装置。
【請求項１０】音声信号を圧縮符号化し、音声情報の
一部として音響パワー値の情報を含めた符号化音声デー
タを生成する音声符号化技術を用いて、音声通信を行う
システムで、音声信号を該符号化音声データに圧縮符号
化する音声符号化部、または、既に圧縮符号化済である
該符号化音声データを蓄積してある符号化音声データ蓄
積部と、該符号化音声データを符号化の単位であるフレ
ーム単位で処理する符号化音声データ処理部と、外部の
端末へ音声データを端末外部へ出力する音声データ出力
部とを持つ端末を送信端末とし、外部の端末から音声デ
ータを入力する音声データ入力部と、該符号化音声デー
タを音声信号に復号化する音声復号化部と、音声信号を
再生出力する音声再生部とを持つ端末を受信端末とす
る、音声通信システムにおいて、該送信端末の該符号化音声データ処理部では、（Ａ）該
音声符号化部、または、該符号化音声データ蓄積部か
ら、一度に入力する該符号化音声データの符号化の単位
となるフレーム数を、設定する手段と、（Ｂ）該音声符
号化部、または、該符号化音声データ蓄積部から、該符
号化音声データを、該設定したフレーム数分だけ入力す
る手段と、（Ｃ）該入力した該符号化音声データからフ
レーム毎に、音響パワー値の情報を含む部分だけを読み
込む手段と、（Ｄ）該読み込んだ情報を解析して、音響
パワー値を算出する手段と、（Ｅ）上記の方法で、該入
力した該符号化音声データのフレーム数分の音響パワー
値を求め、該入力した該符号化音声データ内での音響パ
ワー値の平均値を求める手段と、（Ｆ）音響パワー値の
しきい値を設定する手段と、（Ｇ）該音響パワー値の平
均値と該設定したしきい値を比較し、該音響パワー値の
平均値が該設定したしきい値よりも大きい場合、該入力
した該符号化音声データを全て該音声データ出力部に出
力し、該音響パワー値の平均値が該設定したしきい値よ
りも小さい場合、無音であることを示す無音コードを該
音声データ出力部に出力する手段とを持ち、該受信端末の該音声復号化部では、（Ｈ）該音声データ
入力部から、データを入力する手段と、（Ｉ）該入力し
たデータが該無音コードか否かを判定する手段と、
（Ｊ）該設定したフレーム数分の無音信号を蓄積する手
段と、（Ｋ）該判定により、該入力した音声データが該
無音コードでない場合、１フレーム分の符号化音声デー
タを入力して復号化し、復号化した音声信号を該音声再
生部に出力し、該入力したデータが該無音コードの場
合、該無音信号を該音声再生部に出力する、または、該
設定したフレーム数分の時間だけ該音声再生部に何も出
力しない手段とを持つことを特徴とする符号化音声デー
タの削減装置。
【請求項１１】音声信号を圧縮符号化し、音声情報の
一部として音響パワー値の情報を含む符号化音声データ
を生成する音声符号化技術を用いて、既に圧縮符号化済
である該符号化音声データを蓄積してある符号化音声デ
ータ蓄積部、または、既に圧縮符号化済である該符号化
音声データを端末外部から入力する音声データ入力部
と、該符号化音声データを符号化の単位であるフレーム
単位で処理する符号化音声データ処理部と、該符号化音
声データを音声信号に復号化する音声復号化部と、音声
信号を再生出力する音声再生部とを持つ端末において、
該符号化音声データ処理部では、（Ａ）該符号化音声デ
ータ蓄積部、または、該音声データ入力部から、該符号
化音声データを、符号化の単位であるフレーム単位で、
かつ、１フレーム分の時間間隔で、入力する処理と、
（Ｂ）該入力したフレーム単位の該符号化音声データか
ら、音響パワー値の情報を有する部分だけを読み込む処
理と、（Ｃ）該読み込んだ情報を解析して、音響パワー
値を算出する処理と、（Ｄ）音響パワー値のしきい値を
設定する処理と、（Ｅ）該解析した音響パワー値と該設
定したしきい値を比較し、該解析した音響パワー値が該
設定したしきい値より大きい場合、該入力したフレーム
単位の該符号化音声データを該音声復号化部へ出力し、
該解析した音響パワー値が該設定したしきい値より小さ
い場合、該音声復号化部へ何も出力しない処理とを行
い、該音声復号化部では、（Ｆ）該符号化音声データ処理部
から出力されるフレーム単位の該符号化音声データを入
力し、次に入力される該符号化音声データを待たずに、
即座に復号化し、該音声再生部に出力する処理を行うた
めの符号化音声データの削減プログラムを格納した計算
機読み取り可能な記録媒体。
【請求項１２】音声信号を圧縮符号化し、音声情報の
一部として音響パワー値の情報を含めた符号化音声デー
タを生成する音声符号化技術を用いて、音声信号を該符
号化音声データに圧縮符号化する音声符号化部、また
は、既に圧縮符号化済である該符号化音声データを蓄積
してある符号化音声データ蓄積部と、該符号化音声デー
タを符号化の単位であるフレーム単位で処理する符号化
音声データ処理部と、音声データを蓄積する音声データ
蓄積部と、該符号化音声データを音声信号に復号化する
音声復号化部と、音声信号を再生出力する音声再生部と
を持つ端末において、該符号化音声データ処理部では、（Ａ）該音声符号化
部、または、該符号化音声データ蓄積部から、該符号化
音声データを、フレーム単位で入力する処理と、（Ｂ）
該入力されたフレーム単位の該符号化音声データから、
音響パワー値の情報を有する部分だけを読み込む処理
と、（Ｃ）該読み込んだ情報を解析して、音響パワー値
を算出する処理と、（Ｄ）音響パワー値のしきい値を設
定する処理と、（Ｅ）該解析した音響パワー値と該設定
したしきい値を比較し、該解析した音響パワー値が該設
定したしきい値より大きい場合、該入力したフレーム単
位の該符号化音声データを該音声データ蓄積部へ出力
し、該解析した音響パワー値が該設定したしきい値より
小さい場合、無音であることを示す無音コードを該音声
データ蓄積部へ出力する処理とを行い、該音声復号化部では、（Ｆ）該音声データ蓄積部から、
データを入力する処理と、（Ｇ）該入力したデータが該
無音コードか否かを判定する処理と、（Ｈ）１フレーム
分の無音信号を蓄積する処理と、（Ｉ）該判定により、
該入力したデータが該無音コードでない場合、１フレー
ム分の符号化音声データを入力して復号化し、復号化し
た音声信号を該音声再生部に出力し、該入力したデータ
が該無音コードの場合、該無音信号を該音声再生部に出
力する、または、１フレーム分の時間だけ該音声再生部
に何も出力しない処理とを行うための符号化音声データ
の削減プログラムを格納した計算機読み取り可能な記録
媒体。
【請求項１３】音声信号を圧縮符号化し、音声情報の
一部として音響パワー値の情報を含めた符号化音声デー
タを生成する音声符号化技術を用いて、音声通信を行う
システムで、音声信号を該符号化音声データに圧縮符号
化する音声符号化部、または、既に圧縮符号化済である
該符号化音声データを蓄積してある符号化音声データ蓄
積部と、該符号化音声データを符号化の単位であるフレ
ーム単位で処理する符号化音声データ処理部と、外部の
端末へ音声データを出力する音声データ出力部とを持つ
端末を送信端末とし、外部の端末から音声データを入力
する音声データ入力部と、該符号化音声データを音声信
号に復号化する音声復号化部と、音声信号を再生出力す
る音声再生部とを持つ端末を受信端末とする、音声通信
システムにおいて、該送信端末の該符号化音声データ処理部では、（Ａ）該
音声符号化部、または、該音声データ蓄積部から、該符
号化音声データを、フレーム単位で入力する処理と、
（Ｂ）該入力されたフレーム単位の該符号化音声データ
から、音響パワー値の情報を有する部分だけを読み込む
処理と、（Ｃ）該読み込んだ情報を解析して、音響パワ
ー値を算出する処理と、（Ｄ）音響パワー値のしきい値
を設定する処理と、（Ｅ）該解析した音響パワー値と該
設定したしきい値を比較し、該解析した音響パワー値が
該設定したしきい値より大きい場合、該入力したフレー
ム単位の該符号化音声データを該音声データ出力部へ出
力し、該解析した音響パワー値が該設定したしきい値よ
り小さい場合、無音であることを示す無音コードを該音
声データ出力部へ出力する処理とを行い、該受信端末の該音声復号化部では、（Ｆ）該音声データ
入力部から、データを入力する処理と、（Ｇ）該入力し
たデータが該無音コードか否かを判定する処理と、
（Ｈ）１フレーム分の無音信号を蓄積する処理と、
（Ｉ）該判定により、該入力したデータが該無音コード
でない場合、１フレーム分の符号化音声データを入力し
て復号化し、復号化した音声信号を該音声再生部に出力
し、該入力したデータが該無音コードの場合、該無音信
号を該音声再生部に出力する、または、１フレーム分の
時間だけ該音声再生部に何も出力しない処理とを行うた
めの符号化音声データの削減プログラムを格納した計算
機読み取り可能な記録媒体。
【請求項１４】音声信号を圧縮符号化し、音声情報の
一部として音響パワー値の情報を含めた符号化音声デー
タを生成する音声符号化技術を用いて、音声信号を該符
号化音声データに圧縮符号化する音声符号化部、また
は、既に圧縮符号化済である該符号化音声データを蓄積
してある符号化音声データ蓄積部と、該符号化音声デー
タを符号化の単位であるフレーム単位で処理する符号化
音声データ処理部と、音声データを蓄積する音声データ
蓄積部と、該符号化音声データを音声信号に復号化する
音声復号化部と、音声信号を再生出力する音声再生部と
を持つ端末において、該符号化音声データ処理部では、（Ａ）該音声符号化
部、または、該符号化音声データ蓄積部から、一度に入
力する該符号化音声データの符号化の単位となるフレー
ム数を、設定する処理と、（Ｂ）該音声符号化部、また
は、該符号化音声データ蓄積部から、該符号化音声デー
タを、該設定したフレーム数分だけ入力する処理と、
（Ｃ）該入力した該符号化音声データからフレーム毎
に、音響パワー値の情報を含む部分だけを読み込む処理
と、（Ｄ）該読み込んだ情報を解析して、音響パワー値
を算出する処理と、（Ｅ）上記の方法で、該入力した該
符号化音声データのフレーム数分の音響パワー値を求
め、該入力した該符号化音声データ内での音響パワー値
の平均値を求める処理と、（Ｆ）音響パワー値のしきい
値を設定する処理と、（Ｇ）該音響パワー値の平均値と
該設定したしきい値を比較し、該音響パワー値の平均値
が該設定したしきい値よりも大きい場合、該入力した該
符号化音声データを全て該音声データ蓄積部に出力し、
該音響パワー値の平均値が該設定したしきい値よりも小
さい場合、無音であることを示す無音コードを該音声デ
ータ蓄積部に出力する処理とを行い、該音声復号化部では、（Ｈ）該音声データ蓄積部から、
データを入力する処理と、（Ｉ）該入力したデータが該
無音コードか否かを判定する処理と、（Ｊ）該設定した
フレーム数分の無音信号を蓄積する処理と、（Ｋ）該判
定により、該入力した音声データが該無音コードでない
場合、１フレーム分の符号化音声データを入力して復号
化し、復号化した音声信号を該音声再生部に出力し、該
入力したデータが該無音コードの場合、該無音信号を該
音声再生部に出力する、または、該設定したフレーム数
分の時間だけ該音声再生部に何も出力しない処理とを行
うための符号化音声データの削減プログラムを格納した
計算機読み取り可能な記録媒体。
【請求項１５】音声信号を圧縮符号化し、音声情報の
一部として音響パワー値の情報を含めた符号化音声デー
タを生成する音声符号化技術を用いて、音声通信を行う
システムで、音声信号を該符号化音声データに圧縮符号
化する音声符号化部、または、既に圧縮符号化済である
該符号化音声データを蓄積してある符号化音声データ蓄
積部と、該符号化音声データを符号化の単位であるフレ
ーム単位で処理する符号化音声データ処理部と、外部の
端末へ音声データを端末外部へ出力する音声データ出力
部とを持つ端末を送信端末とし、外部の端末から音声デ
ータを入力する音声データ入力部と、該符号化音声デー
タを音声信号に復号化する音声復号化部と、音声信号を
再生出力する音声再生部とを持つ端末を受信端末とす
る、音声通信システムにおいて、該送信端末の該符号化音声データ処理部では、（Ａ）該
音声符号化部、または、該符号化音声データ蓄積部か
ら、一度に入力する該符号化音声データの符号化の単位
となるフレーム数を、設定する処理、（Ｂ）該音声符号
化部、または、該符号化音声データ蓄積部から、該符号
化音声データを、該設定したフレーム数分だけ入力する
処理と、（Ｃ）該入力した該符号化音声データからフレ
ーム毎に、音響パワー値の情報を含む部分だけを読み込
む処理と、（Ｄ）該読み込んだ情報を解析して、音響パ
ワー値を算出する処理と、（Ｅ）上記の方法で、該入力
した該符号化音声データのフレーム数分の音響パワー値
を求め、該入力した該符号化音声データ内での音響パワ
ー値の平均値を求める処理と、（Ｆ）音響パワー値のし
きい値を設定する処理と、（Ｇ）該音響パワー値の平均
値と該設定したしきい値を比較し、該音響パワー値の平
均値が該設定したしきい値よりも大きい場合、該入力し
た該符号化音声データを全て該音声データ出力部に出力
し、該音響パワー値の平均値が該設定したしきい値より
も小さい場合、無音であることを示す無音コードを該音
声データ出力部に出力する処理とを行い、該受信端末の該音声復号化部では、（Ｈ）該音声データ
入力部から、データを入力する処理と、（Ｉ）該入力し
たデータが該無音コードか否かを判定する処理と、
（Ｊ）該設定したフレーム数分の無音信号を蓄積する処
理と、（Ｋ）該判定により、該入力した音声データが該
無音コードでない場合、１フレーム分の符号化音声デー
タを入力して復号化し、復号化した音声信号を該音声再
生部に出力し、該入力したデータが該無音コードの場
合、該無音信号を該音声再生部に出力する、または、該
設定したフレーム数分の時間だけ該音声再生部に何も出
力しない処理とを行うための符号化音声データの削減プ
ログラムを格納した計算機読み取り可能な記録媒体。
【請求項１６】所定のしきい値を格納するしきい値格
納部と、音声信号を圧縮符号化し、音声情報の一部として音響パ
ワー値の情報を含む符号化音声データデータストリーム
をフレーム単位で、かつ、１フレーム分の時間間隔で読
み込む入力部と、入力された符号化音声データデータストリームから音響
パワー値の情報を有する部分のみを読み取り、入力した
フレーム単位の符号化音声データが圧縮している音声の
音響パワー値を求める音響パワー値計測部と、解析した音響パワー値と、しきい値格納部に設定したし
きい値とを比較し、音響パワー値がしきい値より大きい
場合は、入力したフレーム単位の符号化音声データを出
力し、音響パワー値がしきい値より小さい場合は、何も
出力しない削除判定部とを備え、フレーム単位で、かつ、１フレーム分の時間間隔で、削
減した符号化音声データストリームを出力することを特
徴とする符号化音声データ処理装置。
【請求項１７】所定のしきい値を格納するしきい値格
納部と、無音を示す無音コードを格納する無音コード格納部と、音声信号を圧縮符号化し、音声情報の一部として音響パ
ワー値の情報を含む符号化音声データデータストリーム
をフレーム単位で読み込む入力部と、入力された符号化音声データデータストリームから音響
パワー値の情報を有する部分のみを読み取り、入力した
フレーム単位の符号化音声データが圧縮している音声の
音響パワー値を求める音響パワー値計測部と、解析した音響パワー値と、しきい値格納部に設定したし
きい値とを比較し、音響パワー値がしきい値より大きい
場合は入力したフレーム単位の符号化音声データを出力
し、音響パワー値がしきい値より小さい場合は無音コー
ド格納部に設定した無音コードを出力する削除判定部と
を備えることを特徴とする符号化音声データ処理装置。
【請求項１８】所定のしきい値を格納するしきい値格
納部と、無音を示す所定のコードを格納する無音コード格納部
と、一度に入力する符号化音声データのフレーム数を格納す
る入力フレーム数格納部と、音声信号を圧縮符号化し、音声情報の一部として音響パ
ワー値の情報を含む符号化音声データデータストリーム
を、入力フレーム数格納部に設定されているフレーム数
個分読み込む入力部と、入力された符号化音声データデータストリームから音響
パワー値の情報を有する部分のみを読み取り、入力した
フレーム単位の符号化音声データが圧縮している音声の
音響パワー値を求める音響パワー値計測部と、音響パワー値計測部を制御して、入力したフレーム数個
分の符号化音声データ全てから音響パワー値を求め、入
力した符号化音声データ中での音響パワー値の平均値を
求める平均音響パワー値計測部と、求めた音響パワー値の平均値と、しきい値格納部に設定
したしきい値とを比較し、音響パワー値の平均値がしき
い値より大きい場合は入力したフレーム単位の符号化音
声データを出力し、音響パワー値の平均値がしきい値よ
り小さい場合は無音コード格納部に設定した無音コード
を出力する削除判定部とを備えることを特徴とする符号
化音声データ処理装置。
【請求項１９】音声信号を圧縮符号化し、音声情報の
一部として音響パワー値の情報を含む符号化音声データ
データストリームをフレーム単位で、かつ、１フレーム
分の時間間隔で読み込み、入力された符号化音声データデータストリームから音響
パワー値の情報を有する部分のみを読み取り、入力した
フレーム単位の符号化音声データが圧縮している音声の
音響パワー値を求め、求めた音響パワー値と、予め設定した所定のしきい値と
を比較し、音響パワー値がしきい値より大きい場合は、
入力したフレーム単位の符号化音声データを出力し、音
響パワー値がしきい値より小さい場合は、何も出力しな
いことによって、フレーム単位で、かつ、１フレーム分の時間間隔で、削
減した符号化音声データストリームを出力することを特
徴とする符号化音声データ処理方法。
【請求項２０】音声信号を圧縮符号化し、音声情報の
一部として音響パワー値の情報を含む符号化音声データ
データストリームをフレーム単位で読み込み、入力された符号化音声データデータストリームから音響
パワー値の情報を有する部分のみを読み取り、入力した
フレーム単位の符号化音声データが圧縮している音声の
音響パワー値を求め、求めた音響パワー値と、予め設定した所定のしきい値と
を比較し、音響パワー値がしきい値より大きい場合は入
力したフレーム単位の符号化音声データを出力し、音響
パワー値がしきい値より小さい場合は無音を示す予め設
定した無音コードを出力することを特徴とする符号化音
声データ処理方法。
【請求項２１】音声信号を圧縮符号化し、音声情報の
一部として音響パワー値の情報を含む符号化音声データ
データストリームを、予め設定されている所定の複数フ
レーム個分読み込み、入力された符号化音声データデータストリームから音響
パワー値の情報を有する部分のみを読み取り、入力した
フレーム単位の符号化音声データが圧縮している音声の
音響パワー値を求め、さらに、入力したフレーム数個分
の符号化音声データ全てから音響パワー値を求めること
で、入力した符号化音声データ中での音響パワー値の平
均値を求め、求めた音響パワー値の平均値と、予め設定した所定のし
きい値とを比較し、音響パワー値の平均値がしきい値よ
り大きい場合は入力したフレーム単位の符号化音声デー
タを出力し、音響パワー値の平均値がしきい値より小さ
い場合は無音を示す予め設定した無音コードを出力する
ことを特徴とする符号化音声データ処理方法。
【請求項２２】請求項１６記載の符号化音声データ処
理装置を用い、請求項１９記載の符号化音声データ処理
方法を実行するためのプログラムを格納した計算機読み
取り可能な記録媒体。
【請求項２３】請求項１７記載の符号化音声データ処
理装置を用い、請求項２０記載の符号化音声データ処理
方法を実行するためのプログラムを格納した計算機読み
取り可能な記録媒体。
【請求項２４】請求項１８記載の符号化音声データ処
理装置を用い、請求項２１記載の符号化音声データ処理
方法を実行するためのプログラムを格納した計算機読み
取り可能な記録媒体。
【請求項２５】予め設定された無音を示す無音コード
を格納する無音コード格納部と、１フレーム分の無音信号を蓄積した無音信号蓄積部と、所定のフレームを無音コードとすることで削減されたフ
レームを有する符号化音声データストリームを入力する
入力部と、無音コード格納部を参照して、入力したデータが無音コ
ードかどうかを判定する無音コード判定部と、入力したフレーム単位の符号化音声データを復号化して
出力する復号化部と、無音コード判定部による判定結果が、無音コードであっ
た場合には、無音信号蓄積部に蓄積しておいた無音信号
を出力するか、または、１フレーム分何も出力しないか
し、無音コードでなかった場合には、入力部がフレーム
単位の符号化符号化音声データを入力して、復号化部に
よって入力したフレーム単位の符号化音声データを復号
化し、復号音声を出力するように制御を行う制御部とを
備えることを特徴とする音声復号化装置。
【請求項２６】予め設定された無音を示す無音コード
を格納する無音コード格納部と、所定の複数フレーム単位を無音コードとすることで削減
されたフレームを有する符号化音声データストリームを
入力する入力部と、前記所定の複数フレーム分の無音信号を蓄積した無音信
号蓄積部と、無音コード格納部を参照して、入力したデータが無音コ
ードかどうかを判定する無音コード判定部と、入力したフレーム単位の符号化音声データを復号化して
出力する復号化部と、無音コード判定部による判定結果が、無音コードであっ
た場合には、無音信号蓄積部に蓄積しておいた複数フレ
ーム分の無音信号を出力するか、または、無音信号蓄積
部に蓄積しておいた無音信号に対応する複数フレーム分
何も出力しないかし、無音コードでなかった場合には、
入力部がフレーム単位の符号化符号化音声データを入力
して、復号化部によって入力したフレーム単位の符号化
音声データを復号化し、復号音声を出力するように制御
を行う制御部とを備えることを特徴とする音声復号化装
置。
【請求項２７】所定のフレームを無音コードとするこ
とで削減されたフレームを有する符号化音声データスト
リームを入力し、入力したデータが、予め設定された無音を示す無音コー
ドかどうかを判定し、無音コードであった場合には、予
め蓄積しておいた無音信号を出力するか、または、１フ
レーム分何も出力しないかし、無音コードでなかった場合には、フレーム単位の符号化
符号化音声データを入力して、入力したフレーム単位の
符号化音声データを復号化し、復号音声を出力すること
を特徴とする音声復号化方法。
【請求項２８】所定の複数フレーム単位を無音コード
とすることで削減された削減されたフレームを有する符
号化音声データストリームを入力し、入力したデータが無音コードかどうかを判定し、無音コードであった場合には、予め蓄積しておいた前記
所定の複数フレーム分の無音信号を出力するか、また
は、該複数フレーム分何も出力しないかし、無音コードでなかった場合には、フレーム単位の符号化
符号化音声データを入力して、入力したフレーム単位の
符号化音声データを復号化し、復号音声を出力すること
を特徴とする音声復号化方法。
【請求項２９】請求項２５記載の音声復号化装置を用
い、請求項２７記載の音声復号化方法を実行するための
プログラムを格納した計算機読み取り可能な記録媒体。
【請求項３０】請求項２６記載の音声復号化装置を用
い、請求項２８記載の音声復号化方法を実行するための
プログラムを格納した計算機読み取り可能な記録媒体。