JP3145358B2

JP3145358B2 - 無音期間圧縮方法

Info

Publication number: JP3145358B2
Application number: JP36260498A
Authority: JP
Inventors: エス．アリシエド; アイエンガーヴァス
Original assignee: Lucent Technologies Inc
Current assignee: Nokia of America Corp
Priority date: 1997-12-22
Filing date: 1998-12-21
Publication date: 2001-03-12
Anticipated expiration: 2018-12-21
Also published as: KR100343480B1; KR19990063482A; US6049765A; TW401671B; JPH11250579A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、デジタル音声処理
システム用のデータ圧縮系に関し、特に、音声圧縮の効
率を改善することにより、ボイスメッセージシステム用
のボイス記憶容量を最小にする技術に関する。

【０００２】

【従来の技術】デジタル化されたボイスメッセージを記
録する音声処理システムは、大量の記憶容量を必要とす
る。ボイスメッセージをある時間記憶するのに必要なメ
モリ量は、サンプリングレートに依存する。例えば、１
秒当たり８０００バイトのサンプルをとるサンプリング
レートは、線形μ法則符号化またはＡ法則符号化圧縮を
用いると、ボイスメッセージの１分当たり４８００００
バイトのデータが発生する。このような大量のデータが
発生するために、線形μ法則またはＡ法則を用いた圧縮
音声サンプルの記憶量は、多くの場合実際的ではない。
従って、多くのデジタルボイスメッセージシステムは、
音声圧縮技術または音声符号化技術を用いてボイスメッ
セージの記憶容量を低減している。

【０００３】音声記憶に用いられる、共通の音声符号化
／圧縮アルゴリズムは、符号励起線形予測（code excit
ed linear predictive：ＣＥＬＰ）ベースの符号化であ
る。このＣＥＬＰベースのアルゴリズムは、人間の音声
系のデジタルモデルに基づいて音声信号を再構成してい
る。これらのアルゴリズムは、符号化された圧縮ビット
ストリームのフレームを提供し、人間の音声系のモデル
に基づいて再構成可能な、短期のスペクトラム線形予測
係数と、音声化情報と、ゲイン情報（フレームとサブフ
レームベースの）を含む。音声圧縮を採用するか否か
は、再生の際の音声の所望の品質と、リアルタイムの音
声のサンプリングレートと、音声メッセージメモリに記
憶する前に進行中の音声圧縮および他の関連タスクを処
理するために利用できる、処理機能に依存する。ＣＥＬ
Ｐのビットレートは、例えば、最大６．８kb/s、あるい
はそれ以上まで変動する。

【０００４】音声メッセージのデータ圧縮をさらに最大
にするための技術は、無音、休止、あるいは、リアルタ
イムの音声メッセージ内の背景ノイズに対応する期間の
符号化を省略することである。従来、記憶された音声の
無音期間の圧縮は、無音、休止、あるいは、音声中の背
景ノイズのみを含むと決定された圧縮音声の各フレーム
を取り除くことにより行われていた。この解析は、音声
メッセージの符号化のような他の処理と同時に行われる
大量の処理機能を必要としている。

【０００５】ところが、進行中の無音のフレームを除去
することは、話された言葉の最初の部分または最後の部
分を切り取ってしまう（クリッピングと称する）ことが
ある。これらのクリッピング部分は、この従来のシステ
ムにより、再生不可能となされた進行中の決定により、
再生不可能なまま送出されてしまう。また、来入するボ
イス信号に関連するプロセッサのルックアヘッドの機能
は有限である。例えば、現代のＣＥＬＰは、約２０〜２
５ミリ秒（ms）のフレームのみをルックアップできるに
すぎない。その結果、進行中の無音期間を圧縮して再生
された音声の品質は劣化し好ましくない。

【０００６】デジタル信号プロセッサ（ＤＳＰ）あるい
は他のプロセッサを用いて従来は、リアルタイム、ある
いはほぼリアルタイムに近い形で、ボイス信号を圧縮デ
ジタルサンプルに圧縮して、ボイスメッセージを記憶す
るのに必要な記憶容量を低減している。ある種の従来の
システムにおいては、ＤＳＰはボイスメッセージを符号
化し記憶する前に、音声メッセージ内の無音期間あるい
は休止期間を確認し抑制するための音声解析を実行して
いる。しかし、従来のシステムにおいては、音声解析は
ボイスメッセージの圧縮とリアルタイムで同時に行わ
れ、そのため、音声圧縮と音声解析の両方のタスクを同
時に処理するパワフルなプロセッサを必要としている。

【０００７】図３は、リアルタイムの音声信号の一部が
クリッピングされる状態の詳細を示す。図３は、従来の
リアルタイムの時間領域のベースの音声解析により決定
された、実時間音声信号４０２とノイズしきい値レベル
４００とを示す。このノイズしきい値レベル４００は、
過去の音声からのリアルタイムベースにのみ基づいて決
定された実時間音声信号４０２内の背景ノイズあるいは
他の不要な情報の最大レベルを表している。ノイズしき
い値レベル４００以上のレベルを有する実時間音声信号
４０２の部分が符号化され記憶される。しかし、ノイズ
しきい値レベル４００以下にある実時間音声信号４０２
内の無音期間あるいは休止期間の間生成された音声サン
プルも廃棄され、無音期間あるいは休止期間のレベルと
時間を表す変数で記憶されたものでもって置換される。

【０００８】ボイスメッセージの圧縮されたサンプルの
符号化と記憶は、無音期間あるいは休止期間がノイズし
きい値レベル４００以上の信号により遮断されたと決定
された後再開される。このノイズしきい値レベル４００
は、変動する背景ノイズレベルを補償するために適応す
るものである。実時間音声信号４０２の解析と無音期間
あるいは休止期間の後、サンプルの符号化と記憶を再開
するのに間に合う正確な点を決定することは、ある程度
長い処理時間を必要とする。過剰の遅延およびバッファ
リングが導入されるのを回避するために、リアルタイム
の処理の間ルックアヘッドできる範囲は限られているた
めに、ボイスメッセージシステムは、実時間音声信号４
０２がノイズしきい値レベル４００を越えた直後の点、
ｔ１、ｔ２の間の実時間音声信号４０２の部分は符号化
し記憶しない。このため実時間音声信号４０２の一部
は、記憶された音声メッセージからクリッピングされ、
無音に置き換えられてしまう。

【０００９】符号化あるいは圧縮を実行するプロセッサ
の負荷量は、音声信号の性質および他のファクタにより
変動するために圧縮と音声解析プロセスの両方を同時に
実行することはプロセッサの機能を越えてしまう。この
同時の解析が発生すると、システムは、例えば無音期間
の圧縮のような音声解析の機能を先に実行し、その結
果、圧縮ルーティンの効率が低下し圧縮されたボイスメ
ッセージの記憶容量が大きくなる。

【００１０】図４は、従来の無音期間圧縮技術を示し、
リアルタイムの音声が無音期間の時間検出に基づいて、
同時に解析され圧縮される。

【００１１】図４において、リアルタイムのアナログ音
声が時間領域解析モジュール３２０内で、時間領域で解
析され、有声無音決定モジュール３００内に入力され
る。この有声無音決定モジュール３００は、現在のリア
ルタイムの音声が所定のノイズしきい値レベル以上であ
るかあるいは以下であるかを決定する。これは従来の進
行中の時間領域技術を用いて決定される。現在のリアル
タイムの音声が、ノイズしきい値以上の場合には、音声
は無音ではないとみなされ、ノイズしきい値以下の場合
には現在の音声信号は無音期間であるとみなされる。し
かし、従来のシステムで実行される音声中の無音期間、
背景ノイズ、休止期間を決定するための音声の進行中の
時間領域解析は、悪いＳ／Ｎ比の条件以下のように性能
が悪くなってしまう。

【００１２】特にリアルタイムの音声は、音声エンコー
ダ３０２に入力され、ＣＥＬＰフレームに圧縮され、ボ
イスメッセージシステムのメモリ３０４内に記憶され
る。リアルタイムの音声信号が、ノイズしきい値レベル
以上の音声または他の可聴音を含むときには、音声は音
声エンコーダ３０２によりＣＥＬＰ符号化データのフレ
ーム内に圧縮され、そしてこれがその後メモリ３０４内
に記憶される。しかし、有声（音）無音決定モジュール
３００がリアルタイムの音声が休止期間のみを含むと決
定した場合あるいは現在決定されたノイズしきい値レベ
ル以下と決定した場合には、音声エンコーダ３０２によ
る符号化は中止され無音のみを含むＣＥＬＰフレームの
数を表すカウンターがスタートする。しきい値レベル以
上の音声または他の可聴音が、リアルタイムの音声信号
内に現れると、無音フレームカウンターの最後の値とレ
ベルはメモリ３０４内に記憶され、音声エンコーダ３０
２が再度活性化され、メモリ３０４内にＣＥＬＰ符号化
データフレームの記憶が再開される。背景ノイズのしき
い値は背景ノイズレベル更新モジュール３０６内で更新
される。有声無音決定モジュール３００と、音声エンコ
ーダ３０２と背景ノイズレベル更新モジュール３０６は
すべてデジタル信号プロセッサ内に含まれる。

【００１３】従来の技術においては、ノイズのしきい値
はリアルタイムのアナログ音声信号の現在または過去の
状態の時間領域に基づいて決定され、リアルタイム音声
の将来（過去ではない）の符号化にのみ影響を及ぼす。
スペクトラム解析も公知であるが、この解析方法は大き
な処理パワーを必要とし、リアルタイムの進行中のアプ
リケーションを実行するのには実際的ではない。ノイズ
レベルが突然低下すると、有声無音決定モジュール３０
０はそれには直ちに応答することができず、無音ではな
いリアルタイムの音声部分がクリッピングされてしま
う。同様にまたノイズレベルが突然に上昇すると、リア
ルタイム音声の無音期間の決定が、完全には最適化され
ない。

【００１４】

【発明が解決しようとする課題】従って、本発明の目的
は、音声期間と無音期間を正確にかつ適正に分離して、
特にノイズレベルが突然変化した場合でも、ボイスメッ
セージシステムの処理能力に過負荷にならないような、
新たな音声メッセージシステムを提供することである。

【００１５】

【課題を解決するための手段】本発明によれば、無音期
間の圧縮方法は、メモリからあらかじめ記憶された圧縮
音声メッセージを取り出し、その後これを解析して圧縮
音声メッセージのスペクトラム特性を決定する。その
後、このスペクトラム特性に基づいて圧縮音声メッセー
ジを改変して無音圧縮された音声メッセージを生成し、
この無音圧縮された音声メッセージをメモリに再び記憶
する。

【００１６】本発明のオフラインの音声圧縮技術を組み
込んだ、ボイスメッセージシステムは、リアルタイムの
アナログ音声メッセージに基づいて、リアルタイムのデ
ジタル音声サンプルを受信する入力を有する。音声エン
コーダが、このリアルタイムのデジタル音声サンプルを
圧縮し記憶装置内にそれを記憶する。あるモジュール
が、記憶された圧縮デジタル音声サンプルを記憶装置か
ら取り出し、そこから無音期間を除去して、無音期間を
圧縮したデジタル音声サンプルをメモり内に再度記憶
し、これにより入力されたリアルタイムのアナログ音声
メッセージを表す、ボイスメッセージの再生が可能とな
る。

【００１７】

【発明の実施の形態】図１は、本発明によるボイスメッ
セージシステムにおける、圧縮ボイスメッセージの取り
出しと解析と再記憶の機能ブロック図である。

【００１８】同図において、リアルタイムの音声信号
は、従来のＡ／Ｄコンバータ１１２に入力され、このＡ
／Ｄコンバータ１１２が、デジタルサンプルを音声エン
コーダ１０８に出力する。このＡ／Ｄコンバータ１１２
は、Ａ／Ｄデバイス、例えば、線形、μ法則、Ａ法則、
ＡＣＰＣＭ、またはシグマデルタ（Σ／Δ）出力信号を
適宜与える。

【００１９】音声エンコーダ１０８は、Ａ／Ｄコンバー
タ１１２からの出力を受信し、この音声エンコーダ１０
８は、ＣＥＬＰ線形予測符号化（Linear Predictive Co
ding：ＬＰＣ）、あるいは適応型差分パルス符号化変調
（Adaptive Differential Pulse Code Modulation：Ａ
ＤＰＣＭ）とを含む、従来の圧縮技術を実行する。本発
明によれば、ボイスメッセージ内の無音期間の圧縮は音
声メッセージがモジュール１００内に受信され、記憶さ
れた後実行される。しかし、本発明によれば無音期間圧
縮はボイスメッセージがメモリ１１０内に記憶された後
実行されるが、最初の記憶の前に進行中に無音期間の圧
縮を実行してもよい。

【００２０】次に、動作について述べると、Ａ／Ｄコン
バータ１１２は、例えば８KHzのレートでリアルタイム
でアナログ音声信号をサンプル化し、線形、μ法則、Ａ
法則、ＡＤＰＣＭ、またはΣ／Δデジタル音声サンプル
を生成する。音声エンコーダ１０８はこのデジタル音声
サンプルを、符号化し圧縮してこの圧縮されたボイスメ
ッセージはメモリ１１０に記憶する。

【００２１】ボイスメッセージが受信され符号化されメ
モリ１１０内に記憶された後、このボイスメッセージシ
ステムは、後で、ボイスメッセージが取り出され符号化
され記憶されている間でプロセッサを利用できる時間よ
りもさらに多くのプロセッサの利用時間が得られるよう
にする。この時点あるいはさらに別の遅い時点におい
て、デジタル信号プロセッサの利用可能なパワーが増加
するのを利用して、圧縮して記憶されたボイスメッセー
ジを取り出し解析し再処理する。

【００２２】例えば、圧縮され記憶されたボイスメッセ
ージは、メモリ１１０から取り出され再度解析されてリ
アルタイムでないがパワフルなアルゴリズムを用いてよ
り正確なパラメータを決定し、そしてこの決定されたパ
ラメータに基づいて再度圧縮し記憶する。図１は、無音
期間あるいは休止期間をより正確に特定し改変する記憶
された圧縮ボイスメッセージを再度解析する例を示す。

【００２３】特に、この記憶された圧縮ボイスメッセー
ジは、モジュール１００により取り出される。ノイズし
きい値レベルのようなパラメータが、音声信号の現在お
よび過去のレベル（従来技術と同様に）に基づくだけで
なく、ボイスメッセージの将来のレベルにも基づいてモ
ジュール１０２内で再度計算される。言い換えると、ボ
イスメッセージ全体が再度解析されて、無音期間に関連
するパラメータを決定する。音声信号における無音期間
すなわち休止期間の開始と終了を後で決定するために、
この決定はノイズレベルの突然の変動の予め得られた知
識でなされる。

【００２４】無音期間、休止期間あるいは背景のノイズ
期間を決定するために、時間領域解析および／またはス
ペクトラム解析を行うためには、圧縮されたメッセージ
内の情報が用いられる。例えば、ピッチゲインのような
ＣＥＬＰ音声化情報を解析して、無音期間、休止期間あ
るいは背景ノイズ期間を決定する。このような期間にお
いては、音声化するものはなくかくしてピッチゲインは
小さいと予測される。逆に、音声を含む期間において
は、ピッチゲインのような音声化情報は高いと予測され
る。

【００２５】オフラインの解析においては、スペクトラ
ム情報が圧縮されたデータから取り出される。さらにま
たオフラインの無音期間圧縮により緩和した時間条件が
得られると、圧縮された音声は、時間領域的におよび／
またはスペクトラム的に脱圧縮され解析され、モジュー
ル１０２内で無音部分、休止部分、および／または背景
ノイズ部分の位置をより詳細に決定し確認しさらにその
決定精度を上げる。

【００２６】スペクトラム解析を用いて、時間領域でな
された決定を引用することもできる。例えば、記憶され
たボイスメッセージを時間領域で復号化または脱圧縮し
て解析するか、あるいは時間領域でなされた前の解析
を、無音期間、休止期間、または背景ノイズのみを含む
部分に関連する第１の一時的決定として用いることがで
きる。その後、スペクトラム情報を無音領域で解析し
て、一時的に決定された、無音部分、休止部分、背景ノ
イズ部分が実際に正確であるか否かを認証する。例え
ば、無音部分、休止部分、あるいは背景ノイズ部分にお
ける、スペクトラム変動は、最小と予測できるが、音声
を含むボイスメッセージの部分は、大量のスペクトラム
変動を含むと予測される。

【００２７】モジュール１０２で決定された、無音期間
あるいは休止期間は、モジュール１０２内でより正確に
再計算されたパラメータに基づいて、モジュール１０４
内で改変される。

【００２８】例えば、一実施例においては、モジュール
１０４は、符号化された無音期間のビットレートを低減
し、その結果無音期間のみを含むボイスメッセージの部
分の圧縮比率を上げることができる。モジュール１０４
の他の実施例においては、無音期間は除去される。

【００２９】最後に、無音期間が圧縮されたボイスメッ
セージは、モジュール１０６によりメモリ１１０内に再
度記憶され、このボイスメッセージシステムのそれ以外
の部分では従来どおり動作する。

【００３０】図２は、再生用にボイスメッセージを取り
出すＤＳＰの部分を示す。同図において、モジュール１
５０は無音期間を圧縮したボイスメッセージをメモリ１
１０から取りだし、この無音期間が圧縮されたボイスメ
ッセージを音声エンコーダ１０８内で実行された符号化
に対応する復号化プロセスを用い、そしてモジュール１
０４内で実行されたプロセスの逆を行い脱圧縮する。例
えば、無音期間がモジュール１０４内で取り除かれる
と、モジュール１５０はこの無音部分、休止部分、また
は背景ノイズ部分を無音期間が除去された期間の間、モ
ジュール１０４により合成された無音信号でもって置換
する。一方、無音期間のビットレートは、モジュール１
０４により変化されている場合には、モジュール１５０
はより高い圧縮率で記憶された無音期間を脱圧縮する。
その後この脱圧縮されたボイスメッセージは、Ｄ／Ａコ
ンバータ１５２内でアナログ信号に変換され、従来の再
生装置に送られる。

【００３１】オフラインの無音期間圧縮も自動的に実行
することができる。例えば、ボイスメッセージが、残さ
れた電話の呼びが終了した直後に、ボイスメッセージは
自動的に取り出され無音期間が圧縮されそしてメモリ内
に記憶される。この無音期間の圧縮は、別の実施例にお
いては自動ベースで特定の選択されたボイスメッセージ
に基づいて無音期間の圧縮を実行する。例えば、特定の
ボイスメッセージの入力されたときに（例えば受信し記
憶された後５日間削除されない場合）に応じて、無音圧
縮を行う。

【００３２】別法として、無音期間の圧縮は、メモリ１
１０内に記憶された、選択されたボイスメッセージに基
づいて実行することもできる。オフラインで無音期間が
圧縮されたボイスメッセージの選択は、様々な条件に基
づいてなされる。例えば、ユーザは、手動で（または他
のソフトウエア制御の下で）、無音期間の圧縮は、手動
による選択の後受信したすべてのボイスメッセージに基
づいてなされるよう指示することもできる。

【００３３】他の実施例においては、ユーザは、手動で
（またはソフトウエア制御の下で）、無音期間の圧縮は
メモリ１１０内にすでに記憶されたすべての（または選
択された）ボイスメッセージに基づくよう指示すること
もできる。

【００３４】さらに別の実施例においては、無音期間の
圧縮は、ボイスメッセージが最初に再生された後特定の
ボイスメッセージに基づいて実行するよう選択すること
もできる。かくして、メッセージはもっとも高品質でま
ず聞かれ、ユーザが再生後ボイスメッセージを削除しな
い場合には、自動的にオフラインで無音期間を圧縮し再
度記憶される。

【００３５】さらに別の実施例においては、無音期間の
圧縮は、ボイスメモリの残った容量に基づいて実行して
もよい。例えば、無音期間の圧縮は、オフラインで記憶
されたボイスメッセージに応じてなされ、ボイスメモリ
がある容量に到達したときに利用できるボイスメモリを
最大にするようにしてもよい。

【００３６】以前に記憶され圧縮されたボイスメッセー
ジのオフラインの解析と再処理により、プロセッサの選
択と用いられる符号化と実行される解析の選択の幅が広
がる。例えばボイスメッセージはすでに、メモリ１１０
内に記憶されているために、デジタル信号プロセッサ
が、リアルタイムの処理に通常関連する時間とプロセッ
サの条件から切り離すことができる。かくして低いＭＩ
ＰＳのＤＳＰまたはプロセッサを用いることができる。
さらにまた、ボイス処理システムが動作している大部分
の時間、プロセッサはオフラインあるいは軽い負荷条件
であるために、その間にデジタル信号プロセッサは、時
間のかかる解析および／または再符号化ルーチンを実行
することもできる。圧縮され記憶されたボイスメッセー
ジの解析は周波数領域でも行うことができ、これは通
常、時間領域よりもより多くの処理時間とパワーを必要
とする、ノイズのしきい値レベルのようなパラメータを
より正確に決定できる。

【００３７】

【発明の効果】以上述べたように、本発明によるボイス
メッセージの再処理と解析は、新たなボイスメッセージ
のリアルタイムの受信のような、より高い優先度のリア
ルタイムの機能により中断される、しかし、プロセッサ
の要件は、大幅に低減しているが、その理由は音声信号
の解析はリアルタイムでは行われず、また、音声信号の
符号化と同時に行われるものではないからである。

【００３８】このため、本発明は、より正確に決定され
たパラメータに基づいて、音声信号の解析と、無音期間
のオフラインの圧縮を実行でき、かつ好ましくないクリ
ッピングが行われずに無音期間を改変するために、自動
的にオンラインで実行される無音期間の圧縮を換算する
かあるいは全体を置換することもできる。

【図面の簡単な説明】

【図１】本発明による記憶された音声メッセージの無音
圧縮機能を示すブロック図。

【図２】本発明による音声メッセージの無音脱圧縮と、
再生機能を示すブロック図。

【図３】従来の圧縮と記憶システムにおける音声情報の
好ましくないクリッピングに用いられる、タイミングを
表す図。

【図４】従来の音声圧縮機能を表す機能ブロック図。

【符号の説明】

１００モジュール（圧縮して記憶された音声メッセー
ジの取り出しを行う）１０２モジュール（メッセージ全体に基づいてパラメ
ータを再計算する）１０４モジュール（再計算されたパラメータに基づい
て無音期間を改変する）１０６モジュール（無音圧縮された音声メッセージを
再記憶する）１０８音声エンコーダ１１０メモリ１１２Ａ／Ｄコンバータ１５０モジュール（再記憶された無音圧縮音声メッセ
ージを取り出し、脱圧縮する）１５２Ｄ／Ａコンバータ３００有声無音決定モジュール３０２音声エンコーダ３０４メモリ３０６背景ノイズレベル更新モジュール３２０時間領域解析モジュール４００ノイズしきい値レベル４０２実時間音声信号

───────────────────────────────────────────────────── フロントページの続き (73)特許権者 596077259 600 ＭｏｕｎｔａｉｎＡｖｅｎｕｅ, ＭｕｒｒａｙＨｉｌｌ，ＮｅｗＪｅｒｓｅｙ 07974−0636Ｕ．Ｓ．Ａ. (72)発明者ヴァスアイエンガーアメリカ合衆国，18104 ペンシルヴァニア，アレンタウン，アスコットサークル 4101 (56)参考文献特開平11−52995（ＪＰ，Ａ) 特開昭64−42070（ＪＰ，Ａ) 特開平９−326168（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G11B 20/10 G11B 31/00

Claims

(57)【特許請求の範囲】

【請求項１】（Ａ）予め記憶された圧縮音声メッセー
ジをメモリから取り出すステップと、（Ｂ）前記圧縮音声メッセージのスペクトラム特性を決
定するために、前記圧縮音声メッセージを解析するステ
ップと、（Ｃ）無音圧縮された音声メッセージを得るように、前
記スペクトラム特性に基づいて前記予め記憶された圧縮
音声メッセージを改変するステップと、（Ｄ）前記無音圧縮された音声メッセージを前記メモリ
に記憶するステップとからなることを特徴とする無音圧
縮方法。
【請求項２】前記（Ｃ）ステップは、長期の無音期間
を取り除くことを特徴とする請求項１記載の方法。
【請求項３】前記（Ｃ）ステップは、長期の無音期間
の圧縮率を増加させることを特徴とする請求項１記載の
方法。
【請求項４】前記（Ｂ）ステップは、前記無音圧縮さ
れた音声メッセージの無音期間を示すように解析するこ
とを特徴とする請求項１記載の方法。
【請求項５】前記スペクトラム特性は、ノイズのしき
い値レベルであることを特徴とする請求項１記載の方
法。
【請求項６】前記（Ｂ）ステップは、前記スペクトラ
ム特性を決定するために、前記予め記憶された圧縮音声
メッセージの全体に対して、スペクトラム解析を実行す
るステップを含むことを特徴とする請求項１記載の方
法。
【請求項７】（Ｅ）前記無音圧縮された音声メッセー
ジを脱圧縮するステップをさらに有することを特徴とす
る請求項２記載の方法。
【請求項８】（Ｆ）脱圧縮した無音圧縮された音声メ
ッセージにおいて、前記（Ｃ）ステップにおいて取り除
かれた前記長期の無音期間を戻すステップをさらに有す
ることを特徴とする請求項７記載の方法。
【請求項９】当該方法は、音声メッセージが最初に受
領された後に、ユーザが介入することなく自動的に行わ
れることを特徴とする請求項１記載の方法。
【請求項１０】当該方法は、前記予め記憶された圧縮
音声メッセージが少なくとも１回再生された後に、前記
予め記憶された圧縮音声メッセージに対して実行される
ことを特徴とする請求項１記載の方法。
【請求項１１】当該方法は、前記予め記憶された圧縮
音声メッセージが、所定の時間経過した後に、前記予め
記憶された圧縮音声メッセージに対して実行されること
を特徴とする請求項１記載の方法。
【請求項１２】当該方法は、ユーザの選択により、前
記予め記憶された圧縮音声メッセージに対して実行され
ることを特徴とする請求項１記載の方法。
【請求項１３】（Ａ）実時間でボイスメッセージを受
信するステップと、（Ｂ）前記ボイスメッセージを記憶装置内に記憶するス
テップと、（Ｃ）前記ボイスメッセージを前記記憶装置から取り出
すステップと、（Ｄ）取り出したボイスメッセージのスペクトラム特性
を判断するために、取り出したボイスメッセージを解析
するステップと、（Ｅ）前記スペクトラム特性に基づいて、取り出したボ
イスメッセージ内の無音期間を判断するステップと、（Ｆ）判断した無音期間に従って無音圧縮ボイスメッセ
ージデータを生成するステップと、（Ｇ）前記無音圧縮ボイスメッセージデータを記憶装置
内に記憶するステップとからなることを特徴とする圧縮
された音声を記憶する方法。
【請求項１４】前記（Ｄ）ステップは、前記ボイスメ
ッセージ内の無音期間を決定するために、取り出したボ
イスメッセージに対して、スペクトラム解析を実行する
ステップを含むことを特徴とする請求項１３記載の方
法。
【請求項１５】（Ｈ）前記ボイスメッセージデータか
ら無音期間を除くステップをさらに有することを特徴と
する請求項１３記載の方法。
【請求項１６】前記（Ｆ）ステップは、前記記憶装置
から無音圧縮ボイスメッセージデータを取り出すステッ
プと、前記ボイスメッセージデータから除いた無音期間を戻す
ことにより、前記無音圧縮ボイスメッセージデータを脱
圧縮するステップとを有することを特徴とする請求項１
５記載の方法。
【請求項１７】前記（Ｆ）ステップは、前記無音期間
の圧縮率を増加させるステップを含むことを特徴とする
請求項１３記載の方法。
【請求項１８】オフライン音声圧縮を行うボイスメッ
セージシステムであって、（Ａ）リアルタイムアナログ音声メッセージに基づいて
リアルタイムデジタル音声サンプルを受信する入力と、（Ｂ）前記入力が受信したリアルタイムデジタル音声サ
ンプルを圧縮することによって圧縮デジタル音声サンプ
ルを生成する音声エンコーダと、（Ｃ）前記音声エンコーダに接続され、前記圧縮デジタ
ル音声サンプルを記憶する記憶装置と、（Ｄ）前記圧縮デジタル音声サンプルを前記記憶装置か
ら取り出し、前記リアルタイムアナログ音声メッセージ
のスペクトラム特性を判断するために前記圧縮デジタル
音声サンプルを解析し、無音圧縮デジタル音声サンプル
を生成するために前記スペクトル特性に基づいて前記圧
縮デジタル音声サンプルの無音期間を改変し、前記無音
圧縮デジタル音声サンプルを記憶装置に記憶するモジュ
ールとからなることを特徴とするボイスメッセージシス
テム。
【請求項１９】前記無音期間の改変によって、長期の
無音期間が取り除かれることを特徴とする請求項１８記
載のシステム。
【請求項２０】前記無音期間の改変は、無音期間の圧
縮率を増加させることを特徴とする請求項１８記載のシ
ステム。
【請求項２１】前記無音圧縮デジタル音声サンプルを
脱圧縮し、脱圧縮した無音圧縮デジタル音声サンプルに
て以前に取り除いた無音期間を再び戻す音声デコーダを
さらに有することを特徴とする請求項１９記載のシステ
ム。
【請求項２２】以前に取り除いた前記無音圧縮デジタ
ル音声サンプルにおける無音期間を再び戻すアルゴリズ
ムをさらに有することを特徴とする請求項１９記載のシ
ステム。
【請求項２３】前記スペクトラム特性は、ノイズのし
きい値レベルであることを特徴とする請求項１９記載の
システム。
【請求項２４】前記無音圧縮デジタル音声サンプルを
記憶装置から取り出し、前記無音圧縮デジタル音声サン
プルからアナログ音声を生成し、前記リアルタイムアナ
ログ音声スピーチに対応する音声を再生する再生モジュ
ールをさらに有することを特徴とする請求項１８記載の
システム。
【請求項２５】前記スペクトラム特性は、ノイズのし
きい値レベルであることを特徴とする請求項１８記載の
システム。
【請求項２６】前記モジュールは、リアルタイムアナ
ログ音声メッセージを最初に受領した後に、ユーザが介
入することなく自動的に動作を開始するように構成され
ていることを特徴とする請求項１８記載のシステム。
【請求項２７】前記モジュールは、前記圧縮デジタル
音声サンプルが少なくとも１回再生された後に動作を開
始することを特徴とする請求項１８記載のシステム。
【請求項２８】前記モジュールは、前記圧縮された音
声メッセージが所定の時間経過した後に動作を開始する
ことを特徴とする請求項１８記載のシステム。
【請求項２９】前記モジュールは、ユーザの選択に応
じて動作を開始することを特徴とする請求項１８記載の
システム。
【請求項３０】音声記憶容量を減らすためにオフライ
ン音声圧縮機能を備えるデジタルボイスメッセージシス
テムであって、（Ａ）リアルタイムアナログ音声メッセージに基づいて
リアルタイムデジタル音声サンプルを受信する入力と、（Ｂ）前記リアルタイムデジタル音声サンプルを記憶す
るメモリと、（Ｃ）前記リアルタイムアナログ音声メッセージが終了
した後に、前記リアルタイムデジタル音声サンプルを前
記メモリから取り出す音声エンコーダと、ここで、前記音声エンコーダは、前記リアルタイムアナログ音声
メッセージのスペクトラム特性を判断するためにリアル
タイムデジタル音声サンプルを解析し、前記リアルタイ
ムアナログ音声メッセージのスペクトル特性に基づい
て、前記リアルタイムアナログ音声メッセージを表すの
に必要なビット数を減らすことにより、無音圧縮音声サ
ンプルを生成し、前記無音圧縮音声サンプルを前記メモ
リに記憶するモジュールを備え、（Ｄ）前記無音圧縮音声サンプルを前記メモリから取り
出し、その無音圧縮音声サンプルからアナログ音声を生
成し、リアルタイムアナログ音声メッセージを表す音声
メッセージを再生する再生デバイスとを有することを特
徴とするデジタルボイスメッセージシステム。
【請求項３１】（Ａ）リアルタイムアナログ音声メッ
セージに基づいてリアルタイムデジタル音声サンプルを
受信する入力と、（Ｂ）前記入力が受信したリアルタイムデジタル音声サ
ンプルを圧縮することによって圧縮デジタル音声サンプ
ルを生成する音声エンコーダと、（Ｃ）前記音声エンコーダに接続され、前記圧縮デジタ
ル音声サンプルを記憶する記憶装置と、（Ｄ）前記圧縮デジタル音声サンプルを前記記憶装置か
ら取り出し、前記リアルタイムアナログ音声メッセージ
のスペクトラム特性を判断するために前記圧縮デジタル
音声サンプルを解析し、無音圧縮デジタル音声サンプル
を生成するために前記スペクトル特性に基づいて前記圧
縮デジタル音声サンプルの無音期間を改変し、前記無音
圧縮デジタル音声サンプルを記憶装置に記憶するモジュ
ールとからなることを特徴とする電話応答装置。
【請求項３２】前記無音期間の改変によって、長期の
無音期間が取り除かれることを特徴とする請求項３１記
載の装置。
【請求項３３】前記無音圧縮デジタル音声サンプルを
脱圧縮し、脱圧縮した無音圧縮デジタル音声サンプルに
て以前に取り除いた無音期間を再び戻す音声デコーダを
さらに有することを特徴とする請求項３２記載の装置。
【請求項３４】以前に取り除いた前記無音圧縮デジタ
ル音声サンプルにおける無音期間を再び戻すアルゴリズ
ムをさらに有することを特徴とする請求項３２記載の装
置。
【請求項３５】前記スペクトラム特性は、ノイズのし
きい値レベルであることを特徴とする請求項３２記載の
装置。
【請求項３６】前記無音圧縮デジタル音声サンプルを
記憶装置から取り出し、前記無音圧縮デジタル音声サン
プルからアナログ音声を生成し、前記リアルタイムアナ
ログ音声スピーチに対応する音声を再生する再生モジュ
ールをさらに有することを特徴とする請求項３１記載の
装置。
【請求項３７】前記モジュールは、リアルタイムアナ
ログ音声メッセージを最初に受領した後に、ユーザが介
入することなく自動的に動作を開始するように構成され
ていることを特徴とする請求項３１記載の装置。
【請求項３８】前記モジュールは、前記圧縮デジタル
音声サンプルが少なくとも１回再生された後に動作を開
始することを特徴とする請求項３１記載の装置。
【請求項３９】前記モジュールは、前記圧縮された音
声メッセージが所定の時間経過した後に動作を開始する
ことを特徴とする請求項３１記載の装置。
【請求項４０】前記モジュールは、ユーザの選択に応
じて動作を開始することを特徴とする請求項３１記載の
装置。
【請求項４１】前記無音期間の改変は、無音期間の圧
縮率を増加させることを特徴とする請求項３１記載の装
置。