JP2965788B2

JP2965788B2 - 音声用利得制御装置および音声記録再生装置

Info

Publication number: JP2965788B2
Application number: JP4110527A
Authority: JP
Inventors: 貴彦中野; 修一吉川
Original assignee: Consejo Superior de Investigaciones Cientificas CSIC
Current assignee: Consejo Superior de Investigaciones Cientificas CSIC
Priority date: 1991-04-30
Filing date: 1992-04-28
Publication date: 1999-10-18
Anticipated expiration: 2014-10-18
Also published as: JPH05204395A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声コーデック（ＣＯ
ＤＥＣ：ｃｏｄｅｒとｄｅｃｏｄｅｒとの合成語）に用
いられる音声用自動利得制御に関し、特に、マイクロフ
ォン等の音声入力装置から入力される音声信号の利得
（ゲイン）を適正値に自動的に制御する音声用自動利得
制御装置および該音声用自動利得制御装置を備えた音声
記録再生装置に関する。

【０００２】

【従来の技術】音声コーデックは、一般に、アナログ信
号である音声を符号化する機能と符号化されたデータを
復号化する機能の両方を合わせ持つ装置である。このよ
うな音声コーデックにより、音声入力装置を通して入力
されるアナログの音声信号を符号化（コード）データに
変換し、しかる後、符号化データをテープカートリッジ
等の記録媒体に録音する構成を有する音声録音再生装置
がある。

【０００３】留守番電話機能付き電話機に於ては、磁気
テープによる音声記録再生装置に代えて、半導体記憶装
置を使用した音声記録再生装置を採用するものがある。
このような半導体記憶装置による音声記録再生装置で
は、音声信号を符号化して一旦この半導体記憶装置に記
憶させておき、後にこれを復号化して音声として再生す
ることになる。

【０００４】再生された音質の向上を図るためには、音
声信号の振幅が適当な大きさになるように、音声用利得
制御装置によって音声信号の利得を適正値に制御する必
要がある。従来、この種の利得制御は、音声信号を監視
（統計処理）して得られる平均化された音声振幅または
音声パワーを、利得係数としてフィードバックするフィ
ードバック制御により、行われていた。例えば、音声信
号の特徴を抽出する方法として、統計的手法による度数
分布に基づく方法がある。

【０００５】

【発明が解決しようとする課題】しかしながら、音声信
号を長い時間観測した場合、該度数分布はその形が振幅
の小さい音声信号の発生確率が高く、振幅の大きい音声
信号の発生確率が低い分布となり、一様分布にならな
い。このため、該度数分布法によれば、音声の性質を精
度よく把握できず、精度のよい振幅係数が得られないた
め、結局音質の低下を来すことになる。特に、短い会話
では音声を特定の性質に限定できず、適正な振幅情報を
得ることが困難であるため、より大きな問題になる。加
えて、会話の場合はイントーネーションの影響を受け易
いという問題もある。

【０００６】また、音声用利得制御装置が音声信号の振
幅に応じて随時フィードバックしながら利得制御を行っ
たのでは、音声が抑揚の乏しい単調なものとなる。しか
し、留守番電話機能付き電話機等に用いられる音声記録
再生装置では、音声信号の記録時と再生時とが時間的に
異なるために、事後的に利得をどのように調整するかを
決定することが可能である。そこで、音声信号を所定区
間ごとに区切り、この区間内の振幅の平均値に基づいて
利得の調整量を計算し、これを音声信号のディジタルデ
ータと共に記録する音声用利得制御装置が既に開発され
ている。このように音声信号の所定区間ごとに利得制御
を行えば、その間の音声の抑揚等を保存することができ
る。しかし、通常の話言葉の音声には、言葉が発せられ
る有音部分と、この言葉の区切りごとの無音部分とが存
在する。そして、この無音部分の多い話言葉では、所定
区間内に無音部分の占める割り合いが多くなり、音声信
号の振幅の平均値が異常に低くなる。このため、従来の
音声用利得制御装置は、音声信号を所定区間ごとに区切
って利得を調整する場合に、無音部分の多い音声では適
正な利得の調整を行うことができなくなるという問題が
生じていた。また、この問題を解決するために音声信号
を区切る区間を短くしたのでは、随時振幅をフィードバ
ックした場合と同様に、抑揚の乏しいものとなるだけで
あり問題の解決とならない。

【０００７】さらに、上記従来の音声記録再生装置で
は、音声信号が利得制御されて符号化された後に記録媒
体に記憶されるため、再生時には常に利得制御後の音声
信号のみが復号化されることになる。このため、従来の
音声記録再生装置は、再生された音声の大きさや抑揚が
単調なものとなり、記録されたメッセージのニュアンス
を正確に伝えることができないという問題が生じてい
た。

【０００８】本発明の目的は、音声信号に含まれるノイ
ズやイントネーシヨンに影響されず、精度のよい利得制
御が行える音声用利得制御装置を提供することにある。

【０００９】本発明の他の目的は、所定区間の音声信号
について振幅の度数分布を作成し、この度数分布から有
音部分のみを抽出して平均値を計算することにより、無
音部分の影響を受けない利得制御を行うことができる音
声用利得制御装置を提供することにある。

【００１０】本発明の更に他の目的は、音声信号の利得
制御を所定区間ごとに行い、また、この利得制御のため
の利得係数を音声信号のディジタルデータとは別に記録
しておくことにより、記録データの増加を最小限に留め
ながら、音声の大きさや抑揚を損なうことなく再生する
ことができる音声記録再生装置を提供することにある。

【００１１】

【課題を解決するための手段】本発明の音声用利得制御
装置は、音声入力装置から入力される音声信号の利得を
自動的に制御する音声用利得制御装置であって、該音声
信号の振幅の小さい信号の振幅を引き伸ばし、該振幅の
小さい信号と振幅の大きい信号の発生確率を平均化する
非線形変換回路と、該非線形変換回路により平均化され
た音声信号に基づき利得制御用の振幅値を算出し、算出
値により利得を決定する利得決定回路とを備え、決定さ
れた該利得により該音声信号の振幅を制御することによ
り、上記目的が達成される。

【００１２】前記非線形変換回路および前記利得決定回
路が乗算器、ＲＯＭ、ＲＡＭおよび演算装置を備えたデ
ジタルシグナルプロセッサで構成され、該非線形変換回
路および前記利得決定回路の演算処理内容をソフトウェ
ア的に行ってもよい。

【００１３】前記非線形変換回路のソフトウェア的演算
処理を非線形量子化法の一手法であるμ則圧縮特性法に
よって行ってもよい。

【００１４】前記利得決定回路のソフトウェア的演算処
理を、前記非線形変換回路から前記利得決定回路に与え
られる入力レベルと、予め設定された該入力レベルの最
大値とを比較し、該入力レベルが該最大値よりも大きい
場合に、該最大値を入力レベルとして採用し、該最大値
に従って利得を決定するソフトウェア的処理手順で行っ
てもよい。

【００１５】前記デジタルシグナルプロセッサの乗算機
能を用いて前記非線形変換回路からの入力信号をフィル
タ処理してもよい。

【００１６】本発明の音声用利得制御装置は、音声信号
を符号化して記憶装置に記録する音声記録再生装置にお
いて用いられる音声用利得制御装置であって、音声信号
の所定区間ごとにおける振幅の度数分布を作成する度数
分布作成手段と、該度数分布作成手段が作成した度数分
布から有音部分のみを抽出する有音部分抽出手段と、該
有音部分抽出手段が抽出した有音部分の度数分布からそ
の振幅の平均値を計算する平均値計算手段と、該平均値
計算手段が計算した平均値に基づいて利得を決定する利
得決定手段とを備えており、そのことにより上記目的が
達成される。

【００１７】本発明の音声記録再生装置は、音声信号を
符号化して記憶装置に記録し、これを復号化して再生す
る音声記録再生装置であって、音声信号を符号化して該
記憶装置に記録する符号化手段と、この音声信号の所定
区間ごとの振幅の平均値を計算する平均値計算手段と、
該平均値計算手段が計算した平均値から利得係数を計算
して該記憶装置に記録する利得係数計算手段と、該記憶
装置から符号化された信号を読み出し、復号化する復号
化手段と、該復号化手段が復号化した音声信号につい
て、該利得係数計算手段が計算した利得係数を該記憶装
置から読み出し、該利得計数に基づいて利得の調整を行
う利得制御手段とを備えており、そのことにより上記目
的が達成される。

【００１８】

【実施例】図１は、本発明の音声用利得制御装置が音声
コーデックを備えた音声記録再生装置に用いられたシス
テムのブロック図を示している。

【００１９】音声入力装置１０は、一連の音声信号列を
監視し、該音声信号列の振幅を所定のサンプリングピッ
チでサンプリングする。サンプリングされた信号は、音
声コーデック２０に入力される。音声コーデック２０は
入力信号を符号化されたデータに符号化し、次いで該符
号化データを復号して乗算器３０に与える。より詳細に
は、音声コーデック２０内の符号化回路により符号化さ
れた符号化データが、例えば、該音声録音再生装置の録
音部に出力され、続いてテープカートリッジ等の記録媒
体（不図示）に録音される。これにより会話内容等が録
音される。記録媒体から読みだされた符号化データは、
音声コーデック２０内の復号化回路で復号され、乗算器
３０に与えられる。

【００２０】乗算器３０には、音声用利得制御装置４０
により決定された利得係数が入力されるようになってお
り、復号化された信号に該利得係数を掛けた信号、すな
わち利得制御が行われた適正な振幅の信号を出力する。

【００２１】該音声用利得制御装置は４０は、音声入力
装置１０がサンプリングした音声信号が入力される非線
形変換回路４１と、該非線形変換回路４１により信号処
理された信号が入力される振幅計算回路４２と、該振幅
計算回路４２により計算された利得制御用の振幅値によ
り前記利得係数を計算し、これを乗算器３０に与える利
得決定回路４３で構成される。

【００２２】本発明の重要な特徴は、非線形変換回路４
１で非線形変換した音声信号に基づいて、振幅計算回路
４２により振幅を計算することにある。非線形変換回路
４１、振幅計算回路４２及び利得決定回路４３の回路そ
のものは、従来から存在する公知のものを用いてもよ
い。

【００２３】本実施例の非線形変換回路４１は、入力さ
れた音声信号を以下に示す内容で非線形変換する。すな
わち、音声信号中の振幅の小さい信号について、該信号
の振幅や時間軸を拡張する非線形変換処理を行う。これ
により、振幅の小さい信号と振幅の大きい信号の発生確
率が平均化される。それ故、該音声信号を統計処理して
その度数分布を求めると、一様な度数分布が得られる。
加えて、このような平均化処理によれば、音声信号に含
まれる信号振幅の大きなノイズが圧縮されるので、該ノ
イズの悪影響を排除できる。従って、平均化された音声
信号に基づき利得を制御すれば、ノイズやイントネーシ
ョンの影響の少ない適正な利得制御が可能になる。

【００２４】振幅計算回路４２は、非線形変換回路４１
により発生確率を平均化された音声信号の振幅に基づい
て、利得制御に必要な振幅を計算する。振幅を計算する
方法には、種々の方法が知られている。非線形変換回路
４１から入力されてくる信号の振幅の所定期間ごとの最
大値を得て、それぞれの期間の振幅の最大値を各々の期
間についての「振幅」とする方法や、所定期間内の度数
分布に基づいて平均振幅を得て、その平均振幅を各々の
期間についての「振幅」とする方法が公知である。

【００２５】計算された振幅データは、利得決定回路４
３に入力され、ここで計算された振幅値に対応した利得
が決定（算出）され、振幅係数として乗算器３０に出力
される。

【００２６】上記の利得制御に必要な振幅計算と並行し
て、音声コーデック２０においては、符号化処理が行わ
れる。すなわち、本実施例では、音声コーデックでの音
質に影響を与えないように、符号化処理に平行して利得
の決定が行われるシステム構成になっている。

【００２７】非線形変換回路４１、振幅計算回路４２お
よび利得決定回路４３からなる本実施例の音声用利得制
御装置４０は、アナログ回路によっても実現できるが、
ＤＳＰ（Digital Signal Processor）で音声用利得制御
装置４０を構成し、そのソフトウェアで非線形変換回路
４１、振幅計算回路４２および利得決定回路４３の演算
処理を実行すれば、演算処理を迅速、かつ精度よく行え
る利点がある。以下にその詳細を説明する。

【００２８】図２は、ＤＳＰのシステム構成を示す。Ｄ
ＳＰのディジタル信号処理には、乗算、加算が頻繁に行
われる。このためのハードウェアとして、ＤＳＰには、
並列乗算器（以下単に乗算器という）１０４が設けられ
るる。乗算器１０４における乗算は、乗数のそれぞれの
行（ビット）毎に被乗数との間で掛算（ＡＮＤ操作）を
行って部分積を算出し、この部分積を加算して最終的な
積を求めるという形で行われる。並列乗算器１０４はこ
の部分積の算出、部分積の加算を並列に行うことで処理
を高速化している。

【００２９】ここで、ＤＳＰで実行する演算処理は、乗
算結果を次々に累積する、いわゆる積和演算が多いのが
特徴である。このため、ＤＳＰの演算回路、すなわちＡ
ＬＵ１００は乗算器１０４による乗算の結果の累積が連
続して毎サイクル実行できるように設計がなされてい
る。すなわち、乗算器１０４の乗算結果を直接ＡＬＵ１
００に入力させることができ、また、ＡＬＵ１００の演
算結果は累積用のレジスタであるアキュームレータ１０
５に格納（蓄積）されると共に、アキュームレータ１０
５の出力はＡＬＵ１００に与えられるようになっている
（図２参照）。また、アキュームレータ１０５の出力
は、セレクタ１０３を介して乗算器１０４に与えられる
ようになっている。

【００３０】このようにＤＳＰでは、乗算・加算等を高
速に行うことができるが、ＡＬＵ１００の処理能力を引
き出し、該ＡＬＵ１００のスループットを上げるには次
々にデータをＡＬＵ１００に与える必要がある。このた
め、ＤＳＰでは、複数のデータ・バス１０７（図示例で
は１組のデータバスのみ示す）が設けられている。図示
するデータ・バス１０７は、アドレス・バス１０６から
与えられるアドレスにより、対応するアドレスにデータ
が書き込み／読み出されるＲＯＭ１０１、ＲＡＭ１０２
の出力と乗算器１０４の入力レジスタを結ぶバスとして
機能する。すなわち、このデータ・バス１０７は乗算器
１０４に対し乗数、被乗数を毎サイクル設定するための
バスであり、このデータ・バス１０７により、ＲＡＭ１
０２、ＲＯＭ１０１から連続してデータが読み出されて
乗算が行われる。

【００３１】次に、図３および図４を参照して、ＡＬＵ
１００による非線形変換処理の内容について説明する。
ここで、この非線形変換処理は、上記の非線形変換回路
４１の処理内容と同様であり、ＲＯＭ１０１に格納され
た非線形変換処理のためのプログラム、すなわちＲＯＭ
１０１に格納されたプログラムデータに従ったアルゴリ
ズムをＡＬＵ１００が実行することにより行われる。よ
り具体的には、非線形量子化法の一手法であるμ則圧縮
特性法に従った非線形変換処理が行われる。この非線形
変換処理は、下記（１）式で示す変換式のｙ（圧縮後信
号レベル）を算出し、このｙを上記音声入力装置１０か
らの入力レベルを平均化処理した一様な度数分布として
得る。

【００３２】ｙ＝（ｘ−ａ）・（１６／ｂ）＋ｃ …（１）但し、ｘ：圧縮前信号レベル（音声入力装置１０からの
入力レベル）ａ、ｂ、ｃ：音声入力装置１０の特性に合わせた係数である。

【００３３】以下に、図３および図４に従いｙの算出手
順をより詳細に説明する。まず、このプログラムがスタ
ートすると、ＡＬＵ１００はステップＳ１で、上記
（１）式の変換式を得るための係数ａ、ｂ、ｃにそれぞ
れ０、３２、０を設定する。続いて、ステップＳ２で音
声入力装置１０からの入力レベルｘの値が３１より大き
いか否かを判定し、小さいことを確認すると、図４に示
すステップＳ１６に進み、ここで入力レベル−ａを入力
レベルに設定する。すなわち、ステップＳ１６では、上
記（１）式中の（ｘ−ａ）を算出する。

【００３４】一方、ステップＳ２で入力レベルｘが３１
以上であると判定すると、この場合には入力レベルｘの
設定処理を行わず、次にステップＳ３で係数ａ、ｂ、ｃ
にそれぞれ３１、６４、１６を設定する。そして、ステ
ップＳ４で入力レベルｘが９５より大きいか否かを判定
し、小さいことを確認すると、上記同様にしてステップ
Ｓ１６に進み、ここでこのときの入力レベルｘ−ａを入
力レベルｘに設定する。

【００３５】ステップＳ４で入力レベルｘが９５以上で
あると判定すると、次にステップＳ５で係数ａ、ｂ、ｃ
をそれぞれ９５、１２８、３２に設定し、ステップＳ６
で入力レベルｘが２２３より大きいか否かを判定する。
入力レベルｘが２２３よりも小さいことを確認すると、
上記同様にステップＳ１６に進み、ここで入力レベルｘ
の設定処理を行い、２２３以上である場合はステップＳ
７で新たな係数ａ、ｂ、ｃ設定を行う。以下同様にし
て、ステップＳ７〜ステップＳ１５の処理を行ってステ
ップＳ１６に進み、係数ａに対応した入力レベルｘ−ａ
を設定する。

【００３６】ステップＳ１６で入力レベルｘの設定処理
が行われると、ＡＬＵ１００は、次にステップＳ１７で
乗算器１０４に演算ステップＳ１６で算出された入力レ
ベル（ｘ−ａ）に（１６／ｂ）を掛ける乗算処理を行わ
せ、これにより算出される上記（１）式中の（ｘ−ａ）
×（１６／ｂ）を新たな入力レベルとしてアキュームレ
ータ１０５に蓄積する。

【００３７】続いて、ステップＳ１８で、アキュームレ
ータ１０５に蓄積された入力レベル（ｘ−ａ）×（１６
／ｂ）を読み出し、乗算器１０４に該入力レベル（ｘ−
ａ）×（１６／ｂ）に係数ｃを加算させる処理を行わ
せ、この値（ｘ−ａ）×（１６／ｂ）＋ｃを最終的に入
力レベル、すなわち変換後の信号レベルｙとして得、こ
ひの値をアキュームレータ１０５に蓄積する。

【００３８】次に、図６に従い上記の振幅計算回路４２
の演算処理に相当する処理の内容について説明する。Ａ
ＬＵ１００は、ＲＯＭ１０１に格納された振幅計算のた
めのプログラムがスタートすると、ＡＬＵ１００はステ
ップＳ６１で、入力レベルｘの値がデフォルト値より大
きいか否かを判定し、大きいことを確認すると、入力レ
ベルを最大値に設定する。一方、ステップＳ６１で入力
レベルがデフォルト値以下であると判定すると、この場
合には最大値の設定処理を行わず、エンドに進む。こう
して、非線形変換回路から振幅計算回路に逐次入力され
る複数の入力レベルについて、上記処理と同様の処理を
繰り返し行うことにより、所定期間に於ける入力レベル
（非線形変換回路４１の出力）の最大値を得ることがで
きる。この例では、入力レベルの最大値を得て、それを
各期間の「振幅」としている。しかし、ＤＳＰの有する
乗算機能を用いて、種々の方法で振幅を得ることが可能
である。例えば、雑音を「振幅」と計算しないように、
入力レベルに対してフィルタ処理を行い、振幅計算の際
に入力レベルから雑音を排除することも可能である。

【００３９】このように、非線形変換回路により音声信
号中の振幅の小さい信号を引き伸ばして該信号の振幅や
時間軸を拡張すると、音声信号振幅の発生確率を平均化
できる。そして、この平均化により該音声信号に含まれ
る信号振幅の大きなノイズが圧縮される。従って、平均
化された音声信号に基づき利得を制御すれば、ノイズや
イントネーションの影響の少ない適正な利得制御が行え
る。

【００４０】図７は、本発明による他の音声用利得制御
装置の構成を示している。この音声利得制御装置によれ
ば、音声入力装置１から音声信号が入力されると、まず
度数分布作成手段２によって音声信号の所定区間ごとに
おける振幅の度数分布が作成される。この度数分布は、
音声信号の所定区間（例えばサンプリング期間）を細分
化すると共に、各期間ごとにその音声信号の振幅を量子
化し、この量子化した値が一致する期間の数を計数して
作成したヒストグラムである。

【００４１】次に、有音部分抽出手段３がこの度数分布
から有音部分のみを抽出する。度数分布は、その所定区
間内における音声信号の振幅レベルごとの度数を表すも
のであるため、ある一定の振幅レベル以下の度数を切り
捨てれば、有音部分のみの度数分布を抽出することがで
きる。

【００４２】そして、平均値計算手段４がこの有音部分
のみを抽出した度数分布からその振幅の平均値を計算
し、利得決定手段５がこの平均値に基づいて利得を決定
する。従って、音声信号の有音部分のレベルが一定であ
れば、無音部分の多い少ないにかかわりなく一定の平均
値を得ることができ、これによって有音部分にのみ基づ
いた利得を決定することができる。

【００４３】この結果、本発明の音声用利得制御装置に
よれば、音声信号の無音部分の影響を受けることなく、
常に最適な利得制御を行うことができるようになる。

【００４４】図８は、本発明の音声用利得制御装置を備
えた音声記録再生装置の構成を示す。

【００４５】音声入力装置１０から入力された音声信号
は、符号化回路１２と度数分布作成回路１３ａとに送ら
れる。符号化回路１２は、通常のＰＣＭ（pulse code m
odulation）方式によって音声信号をディジタルデータ
に変換する回路でもよいが、好ましくは、長時間記録を
可能にするために、ＡＤＰＣＭ（adaptive differentia
l PCM）方式等によって符号化データの圧縮を行う回路
である。符号化回路１７によって符号化されたディジタ
ルデータは、後に復号化回路１６によって復号化され
る。復号化回路１６は、符号化回路１２によって符号化
されたディジタルデータを同じ方式の逆変換によって音
声信号に復号化する回路である。そして、復号化回路１
６によって復号化された音声信号は、振幅調整回路１９
を介して音声出力装置１８に送られ、音声として再生さ
れる。本実施例の音声コーデックは、符号化回路１２と
復号化回路１６とからなる。

【００４６】度数分布作成回路１３ａは、入力された音
声信号をサンプリング及び量子化して、所定サンプリン
グ数の期間ごとに量子化された振幅の度数分布を作成す
る回路である。この度数分布は、音声信号の所定サンプ
リング数の期間内において、量子化した音声信号の振幅
が一致するサンプリング期間の数を計数して作成したヒ
ストグラムである。度数分布作成回路１３ａの出力は、
有音部分抽出回路１３ｂに接続されている。有音部分抽
出回路１３ｂは、度数分布作成回路１３ａが作成した度
数分布から有音部分のみを抽出する回路である。また、
有音部分抽出回路１３ｂの出力は、平均値計算回路１３
ｃに接続されている。平均値計算回路１３ｃは、入力さ
れた度数分布に基づいて、その所定サンプリング数の期
間内の振幅レベルの平均値を計算する回路である。そし
て、平均値計算回路１３ｃが計算した振幅レベルの平均
値に基づいて、後に利得決定回路１４が音声信号の利得
を決定する。

【００４７】利得決定回路１４の出力は、利得制御回路
１７を介して振幅調整回路１９に接続されている。利得
制御回路１８は、利得決定回路１４が決定した利得に基
づいて振幅調整回路１９を制御し、復号化回路１６が復
号化した音声信号の利得を調整する回路である。

【００４８】本実施例の度数分布作成回路１３ａと有音
部分抽出回路１３ｂと平均値計算回路１３ｃとを、図１
に示された実施例の振幅計算回路４２として用いること
も可能である。

【００４９】以下に、上記構成の音声用利得制御装置を
備えた音声記録再生装置の動作を説明する。

【００５０】音声入力装置１０からの音声信号は、符号
化回路１２と度数分布作成回路１３ａとに入力される。
符号化回路１２に送られた音声信号は、ＡＤＰＣＭ方式
等によってディジタルデータに符号化され、適宜図示し
ない半導体記憶装置に一旦記憶される。

【００５１】度数分布作成回路１３ａに送られた音声信
号は、まず所定サンプリング数の期間ごとに度数分布が
作成される。次に、この度数分布は、有音部分抽出回路
１３ｂに送られて有音部分のみが抽出される。度数分布
は、その所定サンプリング数の期間内における音声信号
の振幅レベルごとの度数を表すものであるため、ある一
定の振幅レベル以下の度数を切り捨てることにより、有
音部分のみの度数分布を抽出することができる。そし
て、この有音部分のみを抽出した度数分布は、平均値計
算回路１３ｃに送られて平均値が計算され、適宜図示し
ない半導体記憶装置に一旦記憶される。従って、音声信
号における有音部分のレベルが一定であれば、無音部分
の多い少ないにかかわりなく一定の平均値を得ることが
できる。

【００５２】上述のようにして半導体記憶装置に記憶さ
れたディジタルデータは、順次読み出されて復号化回路
１６により音声信号に復号化される。そして、この音声
信号は、振幅調整回路１９を介して音声出力装置１８に
送られ音声として再生される。また、この半導体記憶装
置に記憶された平均値のデータは、ディジタルデータが
所定サンプリング数だけ読み出されるたびに１つずつ読
み出され、利得決定回路１４に送られる。利得決定回路
１４では、この平均値のデータに基づいて利得を決定
し、これを利得制御回路１７に送ることにより、振幅調
整回路１９を通過する音声信号の利得の調整を行う。

【００５３】この結果、音声出力装置１８から再生され
た音声は、元の音声における無音部分の多い少ないに影
響されることなく、有音部分のみに基づいて常に最適な
利得制御を行うことができるようになる。

【００５４】図９は、本発明による音声録音再生装置の
構成を示している。音声入力装置２１から入力された音
声信号は、符号化手段２２により必要に応じてデータ圧
縮されて符号化される。また、この音声信号は、平均値
計算手段２３によって所定区間ごとの振幅の平均値を計
算され、利得決定（利得係数計算）手段２４により利得
係数が計算される。このようにして計算された利得係数
は、符号化手段２２によって符号化された所定区間ごと
のディジタルデータと共に半導体記憶装置２５に記憶さ
れる。

【００５５】この音声信号を再生する場合には、まず復
号化手段２６がディジタルデータを半導体記憶装置２５
から読み出し復号化する。また、利得制御手段２７は、
所定区間のディジタルデータが復号化されるたびに、半
導体記憶装置２５から利得係数を読み出し、この利得係
数に基づいて復号化された音声信号の利得を調整する。

【００５６】この結果、本発明の音声記録再生装置によ
れば、従来と同様に音声信号の利得を調整して、例えば
音声出力装置２８から出力することができる。しかも、
本発明の場合には、利得係数が所定区間にわたって一定
となるので、この区間内の音声の抑揚をある程度保存し
て再生することができる。さらに、この利得係数は、音
声の所定区間ごとに生成されるものであるため、音声信
号のディジタルデータに付加しても、データ量が大幅に
増加するようなこともない。また、利得制御手段２７の
利得係数を強制的に固定すれば、元の音声の大きさや抑
揚をそのままにして再生することもできる。

【００５７】図１０は、留守番電話機能付き電話機に用
いられた本発明の音声録音再生装置の構成を示すブロッ
ク図である。音声入力装置（電話回線）１０から入力さ
れた音声信号は、スイッチ１１の接点１１ａ及び接点１
１ｂによって二方の回路に切り替えて送られる。スイッ
チ１１の接点１１ａ側の回路は、スイッチ９の接点９ａ
を介して受話器１８ｂに接続されている。また、スイッ
チ１１の接点１１ｂ側の回路は、二分岐されて符号化回
路１２と平均値計算回路１３ｄの入力に接続されてい
る。

【００５８】符号化回路１２は、通常のＰＣＭ（pulse
code modulation）方式によって音声信号をディジタル
データに変換する回路でもよいが、一般には長時間記録
を可能にするために、ＡＤＰＣＭ（adaptive different
ial PCM）方式等によって符号化データの圧縮を行う回
路を使用する。符号化回路１２によって符号化されたデ
ィジタルデータは、半導体記憶装置１５に順次記憶され
る。また、半導体記憶装置１５に記憶されたディジタル
データは、復号化回路１６によって順次読み出される。
復号化回路１６は、符号化回路１２によって符号化され
たディジタルデータを同じ方式の逆変換によって音声信
号に復号化する回路である。

【００５９】平均値計算回路１３ｄは、入力された音声
信号をサンプリングして所定サンプリング数の期間ごと
にその振幅の大きさの平均値を計算する回路である。な
お、この音声信号のサンプリングは、符号化回路１２に
おけるサンプリングと共に一括して行うこともできる。
平均値計算回路１３ｄが計算した平均値は、利得決定回
路１４に送られる。利得決定回路１４は、平均値計算回
路１３ｄが計算した平均値と所定の基準振幅値とを比較
して、その比から利得係数を計算する回路である。そし
て、利得決定回路１４によって計算された利得係数も、
半導体記憶装置１５の他の領域に順次記憶される。ただ
し、この利得係数は、音声信号の複数のサンプリング期
間ごとに１データが生成されるだけので、符号化回路１
２から出力されるディジタルデータと比較しても僅かな
記憶容量を占有するにすぎない。半導体記憶装置１５に
記憶された利得係数は、利得制御回路１７によって読み
出される。利得制御回路１７は、復号化回路１６から出
力された音声信号に、この音声信号の所定期間ごとに読
み出した利得係数を乗ずることにより、再生する音声信
号の利得を調整する回路である。そして、利得制御回路
１７の出力も、スイッチ９の接点９ｂを介して受話器１
８ｂに接続されている。

【００６０】上記構成の音声記録再生装置の動作を説明
する。

【００６１】通常の通話時には、スイッチ１１が接点１
１ａ側に接続され、スイッチ９が接点９ａ側に接続され
る。従って、電話回線１０からの音声信号は、そのまま
受話器１８ｂに送られ、通常の通話を行うことができ
る。

【００６２】また、留守番電話機能が働いている場合に
は、スイッチ１１が接点１１ｂ側に接続される。従っ
て、電話回線１０からの音声信号は、まず符号化回路１
２と平均値計算回路１３ｄとに入力される。

【００６３】符号化回路１２に送られた音声信号は、Ａ
ＤＰＣＭ方式等によってディジタル信号に符号化され、
半導体記憶装置１５に順次記憶される。また、平均値計
算回路１３ｄに送られた音声信号は、所定サンプリング
数の期間ごとにその振幅の大きさの平均値が計算され
る。そして、この平均値は、利得決定回路１４に送られ
て所定の基準振幅値と比較され、その比から利得係数が
計算されると共に、この利得係数が半導体記憶装置１５
の他の領域に順次記憶される。

【００６４】上記のようにして留守中に記録された電話
のメッセージを再生する場合には、スイッチ１１を接点
２１ｂ側に接続する。すると、復号化回路１６が半導体
記憶装置１５からディジタルデータを順次読み出しなが
らこれを音声信号に復号化する。また、この際、利得制
御回路１７も、復号化された音声信号の所定期間ごとに
半導体記憶装置１５の他の領域から利得係数を順次読み
出し、この利得係数を該当期間内の音声信号に乗ずるこ
とにより利得を調整する。従って、スイッチ２２を介し
て受話器１８に出力される音声信号は利得制御されたも
のとなる。ただし、この利得係数は、複数のサンプリン
グ期間について一定となるので、この期間内での音声の
抑揚はある程度保存される。

【００６５】また、上記メッセージを利得制御をせずに
聞きたい場合には、利得制御回路１７の利得係数を半導
体記憶装置１５から読み出さずに固定して設定する。す
ると、復号化回路１６で復号化された音声信号を元の音
声の大きさや抑揚を保持したままで再生することができ
るようになる。

【００６６】なお、本実施例の平均値計算回路１３ｄの
代わりに、図８に示されている度数分布作成回路１３
ａ、有音部分抽出回路１３ｂ及び平均値計算回路１３ｃ
を用いてもよい。

【００６７】

【発明の効果】このように、本発明の音声用利得制御装
置によれば、非線形変換回路により音声信号の振幅の発
生確率を平均化する非線形変換処理を行い、続いて平均
化された信号により利得制御に必要な振幅を求め、求め
られた振幅に対応した利得により音声信号の利得制御を
行う構成をとるので、ノイズやイントネーションの悪影
響を排除できる。従って、利得制御の信頼性を向上で
き、音声コーデックを備えた音声録音再生装置に応用す
る場合は、音質の向上を格段に図れる利点がある。ま
た、音声信号に無音部分が占める割り合いの多い少ない
に影響されることなく、有音部分のみに基づいて常に最
適な利得制御を行うことができるようになる。

【００６８】更に、記録データの増加を最小限に留めな
がら、音声の大きさや抑揚を損なうことなく再生するこ
とができるようになる。

【図面の簡単な説明】

【図１】本発明の音声用利得制御装置が音声コーデック
を備えた音声記録再生装置に用いられたときのブロック
図を示している。

【図２】Digital Signal Processorの構成を示してい
る。

【図３】本発明の実施例に用いられる非線形変換回路の
変換動作の一部を示すフローチャートである。

【図４】実施例で行われる上記変換動作の残りを示すフ
ローチャートである。

【図５】実施例で行われる非線形変換の変換関係を示す
グラフである。

【図６】本発明の実施例に用いられる振幅計算回路の動
作を示すフローチャートである。

【図７】本発明による音声用利得制御装置の構成を示し
ている。

【図８】本発明の音声用利得制御装置を備えた音声記録
再生装置の構成を示す。

【図９】本発明による音声録音再生装置の構成を示して
いる。

【図１０】留守番電話機能付き電話機に用いられた本発
明の音声録音再生装置の構成を示すブロック図である。

【符号の説明】

１０音声入力装置２０音声コーデック装置４１非線形変換回路４２振幅計算回路４３利得決定回路

フロントページの続き (56)参考文献特開昭58−87595（ＪＰ，Ａ) 特開昭59−94938（ＪＰ，Ａ) 特開昭62−21335（ＪＰ，Ａ) 特開昭62−152225（ＪＰ，Ａ) 特開昭62−243447（ＪＰ，Ａ) 特開昭63−313929（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁶，ＤＢ名) H03G 3/30 G10L 3/02 G10L 9/18

Claims

(57)【特許請求の範囲】

【請求項１】音声入力装置から入力される音声信号の利
得を自動的に制御する音声用利得制御装置において、該音声信号の振幅の小さい信号の振幅を引き伸ばし、該
振幅の小さい信号と振幅の大きい信号の発生確率を平均
化する非線形変換回路と、該非線形変換回路により平均化された音声信号に基づき
利得制御用の振幅値を算出し、算出値により利得を決定
する利得決定回路とを備え、決定された該利得により該
音声信号の振幅を制御する音声用利得制御装置。
【請求項２】前記非線形変換回路および前記利得決定回
路が乗算器、ＲＯＭ、ＲＡＭおよび演算装置を備えたデ
ジタルシグナルプロセッサで構成され、該非線形変換回
路および前記利得決定回路の演算処理内容をソフトウェ
ア的に行う請求項１に記載の音声用利得制御装置。
【請求項３】前記非線形変換回路のソフトウェア的演算
処理を非線形量子化法の一手法であるμ則圧縮特性法に
よって行う請求項２に記載の音声用利得制御装置。
【請求項４】前記利得決定回路のソフトウェア的演算処
理を、前記非線形変換回路から前記利得決定回路に与え
られる入力レベルと、予め設定された該入力レベルの最
大値とを比較し、該入力レベルが該最大値よりも大きい
場合に、該最大値を入力レベルとして採用し、該最大値
に従って利得を決定するソフトウェア的処理手順で行う
請求項２に記載の音声用利得制御装置。
【請求項５】前記デジタルシグナルプロセッサの乗算機
能を用いて前記非線形変換回路からの入力信号をフィル
タ処理した請求項２に記載の音声用利得制御装置。
【請求項６】音声信号を符号化して記憶装置に記録する
音声記録再生装置において用いられる音声用利得制御装
置であって、音声信号の所定区間ごとにおける振幅の度数分布を作成
する度数分布作成手段と、該度数分布作成手段が作成した度数分布から有音部分の
みを抽出する有音部分抽出手段と、該有音部分抽出手段が抽出した有音部分の度数分布から
その振幅の平均値を計算する平均値計算手段と、該平均値計算手段が計算した平均値に基づいて利得を決
定する利得決定手段とを備えている音声用利得制御装
置。
【請求項７】音声信号を符号化して記憶装置に記録し、
これを復号化して再生する音声記録再生装置であって、音声信号を符号化して該記憶装置に記録する符号化手段
と、この音声信号の所定区間ごとの振幅の平均値を計算する
平均値計算手段と、該平均値計算手段が計算した平均値から利得係数を計算
して該記憶装置に記録する利得係数計算手段と、該記憶装置から符号化された信号を読み出し、復号化す
る復号化手段と、該復号化手段が復号化した音声信号について、該利得係
数計算手段が計算した利得係数を該記憶装置から読み出
し、該利得計数に基づいて利得の調整を行う利得制御手
段とを備えている音声記録再生装置。