JPH0830292A - 利得調整装置 - Google Patents

利得調整装置

Info

Publication number
JPH0830292A
JPH0830292A JP6167732A JP16773294A JPH0830292A JP H0830292 A JPH0830292 A JP H0830292A JP 6167732 A JP6167732 A JP 6167732A JP 16773294 A JP16773294 A JP 16773294A JP H0830292 A JPH0830292 A JP H0830292A
Authority
JP
Japan
Prior art keywords
frame
audio signal
gain
input
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6167732A
Other languages
English (en)
Inventor
Hideo Okano
秀生 岡野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP6167732A priority Critical patent/JPH0830292A/ja
Publication of JPH0830292A publication Critical patent/JPH0830292A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】フレーム単位の処理を行う信号に対してフレー
ム間の入力レベル調整を行うことができるようにするこ
と。 【構成】入力音声信号をA/D変換器4にてディジタル
信号に変換し、DSP部5にて圧縮して記録媒体10に
記録する際に、DSP部5は、1フレーム分の入力信号
データが蓄積されると、区間データの最大値の検索とエ
ネルギーの算出を行い、ファジー推論を用いて次の区間
のデータの最大値を予測して、利得調整値予測を行い、
A/D変換器4へ入力されるアナログ音声信号の利得を
この予測された利得調整値に制御する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えばマイクロホンよ
り入力した音声信号を加工処理してメモリ等の記録媒体
に記録し、またその記録した信号をスピーカで再生でき
るような音声記録再生装置に於いて、入力及び出力音声
信号の利得を調整する利得調整装置に関する。
【0002】
【従来の技術】一般に、音声記録再生装置即ちテープレ
コーダの用途の一つとして、口述記録がある。この口述
記録は、例えば、予め送るべき手紙の内容をテープレコ
ーダにてテープに音声で記録しておき、秘書などにこの
録音したテープを渡し、この秘書などは、そのテープを
再生して音声を聞きながら手紙をタイプ作成する、ある
いは、会議の内容を録音しておき、後でこの録音を聞き
ながら議事録を作成する、等、様々な利用法がある。
【0003】このようなアナログ方式の音声記録再生装
置に於いては、ほぼ一定のレベルで音声をテープに記録
できるように、入力信号の振幅に応じて利得を調整し、
遅延時間(2,3秒)を持たせて、利得を元に戻すよう
操作している。このため、背景雑音が多い環境で録音を
行うと、この録音された音を再生したとき、無音が上記
遅延時間以上続いた場合には、有音の時より背景雑音が
大きくなるという問題点があった。
【0004】この問題点に対処するため、例えば特開平
5−198090号公報に示されているような装置が開
発されている。この公報に開示された装置は、入力信号
の調整制御手段と、それからレベル調整された出力信号
よりレベル調整値を計算する制御手段とを持ち、レベル
調整値記憶部を持っている。
【0005】
【発明が解決しようとする課題】しかしながら、上記公
報に開示されたような従来のものは、レベル調整された
入力信号のレベルから次の信号のレベル値を制御するフ
ィードバック構成であるため、フレーム単位の処理を行
う信号に対してフレーム間の入力レベル調整ができなか
った。
【0006】本発明は、上記の点に鑑みてなされたもの
で、フレーム単位の処理を行う信号に対してフレーム間
の入力レベル調整ができる利得調整装置を提供すること
を目的とする。
【0007】
【課題を解決するための手段】上記の目的を達成するた
めに、請求項1に記載の発明による利得調整装置は、フ
レーム単位で順次入力音声信号の所定の処理をする音声
信号処理手段と、上記音声信号処理手段に供給される音
声信号の各フレーム毎の最大振幅を検出する検出手段
と、上記検出手段からの出力に基づき次のフレームの利
得値を予測する予測手段とを備えることを特徴とする。
【0008】また、請求項2に記載の発明によれる利得
調整装置は、フレーム単位で順次入力音声信号の所定の
処理をする音声信号処理手段と、上記音声信号処理手段
に供給される音声信号の各フレーム毎のフレームエネル
ギーを演算する演算手段と、上記演算手段からの出力に
基づき次のフレームの利得値を予測する予測手段とを備
えることを特徴とする。
【0009】あるいは、請求項3に記載の発明によれる
利得調整装置は、フレーム単位で順次入力音声信号の所
定の処理をする音声信号処理手段と、上記音声信号処理
手段に供給される音声信号の各フレーム毎の最大振幅を
検出する検出手段と、上記音声信号処理手段に供給され
る音声信号の各フレーム毎のフレームエネルギーを演算
する演算手段と、上記検出手段及び演算手段からの出力
に基づき次のフレームの利得値を予測する予測手段とを
備えることを特徴とする。
【0010】そして、請求項4に記載の発明によれれ
ば、上記請求項1乃至3のいずれかに記載の利得調整装
置に於いて、上記予測手段は、ファジー推論を用いて次
のフレームの利得値を予測することを特徴とする。
【0011】
【作用】即ち、請求項1に記載の利得調整装置によれ
ば、検出手段は、フレーム単位で順次入力音声信号の所
定の処理をする音声信号処理手段に供給される音声信号
の各フレーム毎の最大振幅を検出し、予測手段は、この
検出手段からの出力に基づき次のフレームの利得値を予
測する。
【0012】また、請求項2に記載の利得調整装置によ
れば、演算手段は、フレーム単位で順次入力音声信号の
所定の処理をする音声信号処理手段に供給される音声信
号の各フレーム毎のフレームエネルギーを演算し、予測
手段は、この演算手段からの出力に基づき次のフレーム
の利得値を予測する。
【0013】あるいは、請求項3に記載の利得調整装置
によれば、検出手段は、フレーム単位で順次入力音声信
号の所定の処理をする音声信号処理手段に供給される音
声信号の各フレーム毎の最大振幅を検出し、また、演算
手段は、上記音声信号処理手段に供給される音声信号の
各フレーム毎のフレームエネルギーを演算する。そし
て、予測手段は、これら検出手段及び演算手段からの出
力に基づき次のフレームの利得値を予測する。
【0014】そして、請求項4に記載の利得調整装置に
よれば、上記請求項1乃至3のいずれかに記載の利得調
整装置に於いて、予測手段は、ファジー推論を用いて次
のフレームの利得値を予測する。
【0015】
【実施例】以下、図面を参照して、本発明の一実施例を
説明する。図1は、本発明による一実施例としての利得
調整装置が適用された音声記録再生装置のブロック構成
図である。
【0016】この音声記録再生装置では、マイクロホン
1が増幅器(AMP)2、低減通過フィルタ(LPF)
3、及びアナログ/ディジタル(A/D)変換器4を介
して、ディジタル信号処理(DSP)部5に接続されて
いる。このDSP部5には、制御回路6及びデータ入出
力(I/O)バッファ7が接続されている。データI/
Oバッファ7は、上記制御回路6に接続されると共に、
主制御回路8に接続されている。また、上記DSP部5
には、ディジタル/アナログ(D/A)変換器11及び
AMP12を介してスピーカ13が接続されている。
【0017】一方、上記主制御回路8には、アドレス制
御回路9及びそれに接続された記録媒体(半導体メモリ
部)10が脱着自在に接続されている。また、この主制
御回路8には、駆動回路14を介して表示器15が接続
されると共に、主電源スイッチ16を介して電池BAT
が接続されている。さらには、この主制御回路8には、
録音ボタンREC、再生ボタンPL、停止ボタンST、
早送りボタンFF、戻しボタンREW、Iマークボタン
I、EマークボタンE、音声起動(ボイスアクティブデ
ィテクタ)ボタンVADが接続されている。また、この
主制御回路8には、外部へのデータ送信部材としての赤
外光LED17、電圧比較器18の出力端が接続されて
おり、この電圧比較器18の入力端は、外部からのデー
タ受信部材としてのPINダイオード19に接続されて
いる。そして、主制御回路8にはさらに、電磁石20及
びリードスイッチ(REED)21が接続されている。
【0018】なお、上記記録媒体10は、一時記録媒体
部101と主記録媒体部102とから構成されている。
一時記録媒体部101には、SRAM,EEPROM,
高誘電体メモリ,フラッシュメモリ,などのように、主
記録媒体部102に比べ、比較的高速で読み書きが行え
るものが用いられる。一方、主記録媒体部102には、
フラッシュメモリ,光磁気ディスク,磁気ディスク,磁
気テープ,などが用いられる。本実施例では、このう
ち、一時記録媒体部101にSRAMを用い、主記録媒
体部102にはフラッシュメモリを用いている。
【0019】即ち、本実施例の音声記録再生装置では、
マイクロホン1より得られるアナログ信号を、AMP2
により増幅し、LPF3を通した後、A/D変換器4に
よってディジタル信号に変換して、音声信号処理手段、
検出手段、予測手段、及び演算手段の構成要素であるD
SP部5に入力する。このDSP部5は、録音動作時に
音声を圧縮し、また再生動作時に音声を伸張する。該D
SP部5の動作は制御回路6により制御され、圧縮した
音声をデータI/Oバッファ7を介して主制御回路8に
送る。
【0020】記録手段及び再生手段の構成要素である主
制御回路8は、複数の操作ボタン及びスイッチの操作に
応じて、上記DSP部5と、アドレス制御回路9及び当
該記録再生装置に脱着自在な記録媒体としての半導体メ
モリ部10の動作を制御する。即ち、アドレス制御回路
9に適当なアドレス信号を与え、データI/Oバッファ
7から供給された音声データを記録媒体10に記録、あ
るいは、記録媒体10に記録されているデータを読み出
して上記データI/Oバッファ7を介してDSP部5に
供給する。
【0021】なお、ここで音声情報の記録位置を示す情
報であるアドレスは、着脱自在な記録媒体10に記録さ
せても良く、記録再生装置側に設けられている不図示の
アドレス制御回路に付随する不図示半導体メモリ(内部
記録部)に記録させるようにしても良い。
【0022】上記DSP部5で伸張された読み出しデー
タは、D/A変換器11によりアナログ信号に変換さ
れ、AMP12で増幅された後、スピーカ13に出力さ
れる。また、上記主制御回路8は、駆動回路14を制御
して表示器15に動作モードなどの各種情報を表示させ
る。
【0023】上記記録媒体10の主記録媒体部102
は、本実施例では、図2に示すような記録構成を有して
いる。即ち、メモリ空間は、インデックス部10Aと音
声データ部10Bとに大きく2分されている。インデッ
クス部10Aは、音声データ部10Bに記録されている
複数の音声メッセージファイル10B1,10B2,1
0B3,…それぞれについて、操作開始位置情報10A
1と操作終了位置10A2、その他符号モードや操作条
件が記録される。また、現在の音声データ部10Bに対
する動作位置を示す動作位置情報10A3が記録され
る。
【0024】なお、上記主制御回路8に接続されるボタ
ンとしては、録音ボタンREC、再生ボタンPL、停止
ボタンST、早送りボタンFF、戻しボタンREW、I
マークボタンI、EマークボタンE、音声起動ボタンV
ADがあり、スイッチとしては電池BATとの間に主電
源スイッチ16がある。ここで、IマークやEマークと
は、次のようなものである。即ち、記録媒体には複数の
文書が記録されることから、この種の音声情報記録装置
では、文章録音者により録音時にIマークボタンIを操
作することにより、記録媒体に記録された複数文章間の
優先関係を示すインストラクション(I)マークという
タイピストや秘書向けの指示用インデックスマークを記
録することができるようになっていて、文章録音者はこ
のIマークを使って、音声によって具体的に優先関係を
指示するということが可能になっている。また、複数文
章間の区切りを示すため、EマークボタンEの操作によ
り、エンド(E)マークというインデックスマークを記
録することができるようになっている。
【0025】また、データ転送を行うとき、別の本体に
データ転送開始を伝える手段として、主制御回路8に
は、例えば磁気を利用して伝えるための電磁石20が接
続され、別の本体からのデータ転送開始信号を受信する
手段としてリードスイッチREED21が接続されてい
る。
【0026】このデータ転送開始信号の送受信方法とし
ては、送信側は、磁気を利用した他の手段としての磁気
ヘッドやホール素子を用いたり、ソレノイドを駆動した
力学的手段に変換して送信し、受信側では、マイクロス
イッチなどで受信するという方法がある。また、可視光
や赤外光を利用するLEDやレーザ発光ダイオード、さ
らにはLCDを利用した光シャッタのようなものを用い
てデータ転送開始信号を送信し、受信側ではPINダイ
オードやホトトランジスタなどの光を電気に変換してデ
ータ転送開始信号を受信しても良い。あるいは、電波や
マイクロ波を利用した場合には、送信側は発振器とアン
テナを用い、受信側にはアンテナを受信器としてローパ
スフィルタなどを用いても良い。さらに、スピーカより
ある特定の音や超音波を出力して転送開始を報知して、
受信側ではマイクから入力される特定の音や超音波を入
力し、認識したら転送開始を判断するという手段であっ
ても良い。
【0027】また、記録媒体10に記録されているデー
タを送信するための部材として、主制御回路8には、赤
外光LED17が接続されている。そして、データを受
信するための部材として、主制御回路8には、PINダ
イオード19を経由して赤外光入力し電気に変換された
信号を、さらにON/OFF信号に増幅又は変換する電
圧比較器(COMP)18が接続されている。
【0028】次に、このような構成の音声記録再生装置
の動作を詳細に説明する。電池BATがセットされ、電
源が供給されると主制御回路8は、図3のフローチャー
トに示すような動作を開始する。
【0029】即ち、まず、主制御回路8の外部条件や内
部の記録部の初期設定を行う(ステップS1)。ただし
この時点では、当該音声記録再生装置の全体への電力供
給を指示するための主電源スイッチ16はOFF状態に
ある。初期設定を完了した後、主制御回路8は主電源ス
イッチ16がONされたかどうか検出する(ステップS
2)。検出の結果、主電源スイッチ16がON状態にあ
ることを検出したならば、当該音声記録再生装置全体の
電力供給するための電池BATと各回路との間に設けら
れている不図示スイッチをONにして、その後、電源が
ONされたときに同時に停止ボタンSTが押されている
か、リードスイッチREED21がONされているかど
うか判定を行い(ステップS3)、この条件であるとき
データ転送すると判断され、データ転送処理(ステップ
S4)に進む。
【0030】もし上記条件でなければ、記録媒体10
(主記録媒体部102)より、インデックス部10Aの
情報を読み込む。即ち、操作開始位置情報10A1、操
作終了位置情報10A2、その他符号モードや操作条件
等を読み込む。この時、記録媒体10から読み込んだデ
ータによって、記録媒体10が既にインデックスを正常
に記録したものかどうか、即ち、記録媒体10のフォー
マットが正常かどうかを判断する(ステップS5)。
【0031】ここで、記録媒体10としてフォーマット
されていないものを入れていた時には、正常でないと判
断され、その場合には、記録媒体10のインデックス部
10Aに利用条件を示す情報を入力し且つ音声データ部
10Bに“0”を入力する処理であるメモリフォーマッ
ト(初期化)を行うかどうか確認する(ステップS
6)。即ち、駆動回路14を制御して、メモリフォーマ
ットを行うか否かの確認表示を表示器15に行わせる。
【0032】ここで、メモリフォーマット処理を確認指
示するボタン(録音ボタンREC兼用)が押されたなら
ば、記録媒体10のフォーマット(初期化)を行い(ス
テップS7)、このフォーマット完了後、駆動回路14
を制御して表示器15にて初期設定完了表示を行う(ス
テップS8)。
【0033】また、メモリフォーマットをしないことを
確認指示するボタン(停止ボタンST兼用)が押された
ときには、駆動回路14を制御して表示器15にて記録
媒体10が正常でないことを表示すると共に、記録媒体
10を取り替えるべきである旨の指示表示を行い、当該
音声記録再生装置全体に電力を供給するための電池BA
Tと各回路との間に設けられた不図示スイッチをOFF
にする(ステップS9)。その後、記録媒体10交換の
ために、主電源スイッチ16がOFFされるのを待ち
(ステップS10)、それがOFFされたことを検出す
ると、上記ステップS2に戻る。
【0034】一方、記録媒体10が正常に初期設定が完
了されたものは、初期設定完了表示後、インデックス部
10Aから読み出した情報(動作位置情報10A3)よ
り現在の動作位置を検出し、駆動回路14を制御して表
示器15にてその検出した位置の表示を行う(ステップ
S11)、その後、当該装置の操作ボタンのどれかが押
されたかどうかを検出しながら各回路を待ち状態にする
(ステップS12)。
【0035】そして、いずれかの操作ボタンが押された
ことを検出すると、まず、操作されたのが録音ボタンR
ECがどうか検出し(ステップS13)、もし録音ボタ
ンRECが押されれば、DSP部5を制御してA/D変
換器4から入力される音声情報を圧縮し、アドレス制御
回路9を制御して記録媒体10の主記録媒体部102の
音声データ部10Bに記録を行う録音処理に入る(ステ
ップS14)。
【0036】操作されたのが録音ボタンRECでないと
きには、次に、再生ボタンPLの検出を行う(ステップ
S15)。ここで、もし再生ボタンPLが押されていれ
ば、アドレス制御回路9を制御して記録媒体10の主記
録媒体部102の音声データ部10Bから記録されてい
るデータを読み出し、DSP部5に送って伸長処理を行
い、D/A変換器11に音声情報を送る再生処理に入る
(ステップS16)。
【0037】また、再生ボタンPLが押されていないと
きは、早送りボタンFFが押されているかどうか、ボタ
ンの状態を検出する(ステップS17)。もし早送りボ
タンFFが押されていれば、動作位置を順次適当な速度
(例えば、再生の20倍速)で早送りを行う早送り処理
に入る(ステップS18)。
【0038】早送りボタンFFが押されていなければ、
戻しボタンREWが押されているかボタンの状態を検出
する(ステップS19)。もし戻しボタンREWが押さ
れていれば、上記早送りの場合と逆の方向に同様の速度
で動作位置の移動を行う戻し処理に入る(ステップS2
0)。
【0039】上記ステップS14,S16,S18,S
20の各処理は、停止ボタンSTが押されると、各処理
から抜けて上記ステップS12に戻る。また、操作され
たのが録音,再生,早送り,戻し等のボタンでなけれ
ば、電源OFF又は各種の設定ボタンの状態の検出を行
う(ステップS21)。
【0040】主電源スイッチ16が電源OFF操作され
た時には、アドレス制御回路9を制御して記録媒体10
の主記録媒体部102のインデックス部10A内の情報
を消去し、主制御回路8内部の不図示記録部に記録して
あるインデックス情報を、記録媒体10のインデックス
部10Aに記録する(ステップS22)。
【0041】このインデックス転送処理が完了すると、
当該装置全体、つまり各回路の給電のための不図示電源
スイッチをOFFにする(ステップS23)。そして、
上記ステップS2に戻る。
【0042】また、上記ステップS21に於いて、主電
源スイッチ16がOFFでないと判断されたときには、
設定ボタンの状態を検出し、その状態を内部の記録部に
記録した後、上記ステップS12に戻る。なおここで、
設定ボタンは、実際に当該装置に設けられたボタンでは
なく、録音ボタンREC,再生ボタンPL,停止ボタン
ST,早送りボタンFF,戻しボタンREW,Iマーク
ボタンI,EマークボタンE,音声起動ボタンVADの
うち、幾つかの同時押しにより代用されるボタンであ
る。
【0043】次に、録音時のDSP部5内部に構成され
たリミッタ機能付き音声入力処理部の動作について、図
4の(A)に示すフローチャートを参照して、さらに詳
細に説明する。
【0044】まず、録音開始時の最初の音声入力かを判
定する(ステップS31)。そして、もし初回であると
きには、リミッタ調整値や音声入力値を格納するための
内部に構成された不図示レジスタバッファの初期設定を
行う(ステップS32)。
【0045】そして、A/D変換器4からの音声入力値
をレジスタバッファXnに格納する(ステップS3
3)。その後、次に入力されてくるであろう音声入力信
号を過去のデータにより予測する(ステップS34)。
この予測は、過去のデータに基づき予測する方式をと
り、過去のデータは2〜200個の値をとり、好ましく
は2〜64個をとる。特には、2〜5個をとるのが好ま
しい。
【0046】過去のデータ予測する方法としては、ディ
ジタルフィルタ処理によって次の入力信号Xn+1を得る
方法を用いる。また、本実施例では、最も簡単な構成を
採用したもので、例えば図4の(B)に示すように、い
ま入力された信号Xnと一つ前に入力された信号Xn-1
より、次に入力されてくる音声入力信号Xn+1を Xn+1=2Xn−Xn-1 で予測するものとしている。
【0047】そして、この予測した次のデータの値の絶
対値が、A/D変換器4の入力最大値を越えたかどうか
を判定を行い(ステップS35)、もし越えると予測さ
れた場合には、A/D変換器4へ入力されるアナログ音
声信号のゲイン制御を行う(ステップS36)。このゲ
イン制御は、例えば、AMP2として制御電圧によって
利得を制御できるものを採用し、DSP部5内部にPW
M信号とLPFを組み合わた回路を構成してAMP2に
制御電圧を出力したり、内部にD/A変換器を構成して
AMP2に制御電圧を出力することにより行うことがで
きる。
【0048】そして、このゲイン制御処理が行われたな
らば、あるいは、上記予測した次のデータの値の絶対値
が、A/D変換器4の入力最大値に達しないと判定され
た場合には、この音声入力処理を抜ける。
【0049】次に、録音時のDSP部5内部に構成され
た自動利得調整処理部の動作について図5の(A)に示
すフローチャートを参照して、さらに詳細に説明する。
録音命令が主制御回路8から伝えられ、上記音声入力処
理部によって1フレーム:20msec(160個分)
の区間入力信号データが蓄積されると、DSP部5の自
動利得調整処理部は、図5の(A)に示す録音処理ルー
チンを行う。
【0050】まず、蓄積された区間データの最大値の検
索とエネルギーの算出を行う(ステップS41)。そし
て、次の区間のデータの最大値を予測して、次の区間の
利得調整値予測を行う。即ち、まず、曖昧制御や上記リ
ミッタ処理と同様にエネルギーの変化量を利用して最大
値を予測し、次に、この予測された値の絶対値がA/D
変換器4の入力最大値を越えるかどうか判定し、A/D
変換器4への入力アナログ信号がA/D変換器4の入力
最大値より低い値になるような利得調整値を算出する
(ステップS42)。
【0051】そして、区間データのエネルギーや最大値
より、無音かどうか判定を行う(ステップS43)。こ
こで、無音と判定したならば(ステップS44)、無音
部直前の有音部の利得調整値にする処理を行う(ステッ
プS45)。なお、本実施例では、所定時間(例えば、
1フレーム:20msec)内の音声信号とディジタル
処理によって導かれる予測信号の残差との相互相関を算
出して、その算出した値と音声信号の自己相関値との比
を取り、有声音、無声音、無音を判断する。
【0052】次に、あるいは有音と判定された場合に
は、音声符号化処理を行う(ステップS46)。その
後、再度次の区間データが有音か予測判定を行い(ステ
ップS47)、有音であればA/D変換器4の入力最大
値を越えるかどうか判定を行い、もし越えると予測され
たならば、A/D変換器4へ入力されるアナログ音声信
号の利得調整処理を行う(ステップS48)。この利得
調整処理は、例えば、AMP2として制御電圧によって
利得を制御できるものを採用し、DSP部5内部にPW
M信号とLPFを組み合わた回路を構成してAMP2に
制御電圧を出力したり、内部にD/A変換器を構成して
AMP2に制御電圧を出力することにより、上記ステッ
プS42で予測された調整値に利得を制御する。
【0053】そして、上記ステップS48かステップS
47で次の区間が無音であると予測されたならば、この
ルーチンを抜け出る。次に、上記ステップS42に於け
る利得調整値予測処理について、図5の(B)のフロー
チャートを参照して、さらに詳細に説明する。この予測
処理は、ファジー推論を利用したもので、図6の(A)
に示すように変化する音声について、フレーム(20m
sec)単位で行われる。
【0054】ここで、上記ステップS41に於いて、現
在のフレームの間の入力信号の最大値(正の数のみ)及
びエネルギーが算出記憶されており、また一つ前のフレ
ームの間の最大値とエネルギーとが一つ前のフレームに
ついて行われた同様のステップS41に於いて算出記憶
されいるので、まず、これら算出記憶された値から、図
6の(B)の左側に示すように、現在の状態を評価しフ
ァジー値を推論する(ステップS51)。例えば、制御
すべき利得調整値と現フレーム間の最大値、利得調整値
と現フレーム間のエネルギー、利得調整値と現フレーム
間−前フレーム間との最大値変化量、利得調整値と現フ
レーム間−前フレーム間とのエネルギー変化量のルール
(メンバーシップ関数)から各推論結果としてのファジ
ー値を得る。なお、図6の(B)は簡略化のため、最大
値及びエネルギー変化量のルール(メンバーシップ関
数)から得た2つのファジー値のみを示している。ま
た、ファジー推論は、例えば、マムダニ(Mamdan
i)の方式を用いる。
【0055】次に、図6の(B)の右側に示すように、
この推論処理によって得られたそれぞれのファジー値
(集合的表現された値)を、合成して、その重心を算出
することにより、最終的な確定値としての利得調整値を
算出する(ステップS52)。そして、このルーチンを
抜けて、上記ステップS43に進む。
【0056】上記ステップS51でのルール(メンバー
シップ関数)の利得調整規則については以下のようなも
のが用いられる。例えば、最大値については、以下のル
ールA1,A2,A3を用いる。
【0057】A1:IF 最大値が入力最大値より低い
THEN 利得を高くする A2:IF 最大値が最適 THEN 利得をそのまま
にする A3:IF 最大値が入力最大値より高い THEN
利得を低くする 例えば、エネルギーの変化については、以下のルールB
1,B2,B3を用いる。
【0058】B1:IF エネルギーが低い THEN
利得を高くする B2:IF エネルギーが最適 THEN 利得をその
ままにする B3:IF エネルギーが高い THEN 利得を低く
する ここで、マムダニ(Mamdani)のファジー推論法
(min−max−重心法)を、図7を参照して説明し
ておく。
【0059】例えば、最大振幅値入力をAのファジー集
合とし、エネルギー変化入力をBのファジー集合で表
し、例えばそれぞれのルールをA1,A2,A3及びB
1,B2,B3としたならば、それぞれ利得のファジー
推論形式
【0060】
【数1】 に対するマムダニの「min−max−重心法」は、入
力値X0 とY0 のファジー規則から利得値の小さい方の
値で頭切りしたものがCのファジー集合として出力され
る。
【0061】
【数2】 と与えられる。これによって各ファジー規則による推論
結果Ciは次のように求められる。
【0062】
【数3】 で、最終的に結合結果C’の代表値Z0 は、C’の重心
値として与えられ、利得が推論される。
【0063】さらに、上記ステップS51でのルール
(メンバーシップ関数)の利得調整規則については、以
下のようなものを用いても良い。例えば、最大値とエネ
ルギーの変化量については、以下のルールD1,D2,
D3を用いる。
【0064】 D1:IF 最大値変化且つエネルギー変化量がマイナスである THEN 利得を高くする D2:IF 最大値変化且つエネルギー変化量がない THEN 利得をそのままにする D3:IF 最大値変化且つエネルギー変化量がプラスである THEN 利得を低くする なお、上記のファジー推論で利得を予測する方法では、
制御すべき利得調整値と現フレーム間の最大値、利得調
整値と現フレーム間のエネルギー、利得調整値と現フレ
ーム間−前フレーム間との最大値変化量、利得調整値と
現フレーム間−前フレーム間とのエネルギー変化量のル
ール(メンバーシップ関数)から各ファジーのうち、幾
つかの組み合わせで行っても良い。例えば、制御すべき
利得調整値と現フレーム間の最大値、利得調整値と現フ
レーム間−前フレーム間とのエネルギー変化量のルール
(メンバーシップ関数)のみを使用する。また、いずれ
か一つのみを利用して行うこともできる。
【0065】また、上記のようなファジー推論を使用し
ないで利得調整値を予測する方法としては、いまN個
(20msecのときサンプリンブ周波数8KHzで1
60個)のサンプルせさた入力信号の区間に入力された
エネルギーEnと、最大値Xmax (n)と、一つ前に入
力された区間エネルギーEn-1より、次に入力されてく
る音声入力信号の最大値Xmax (n+1)を Xmax (n+1)=Xmax (n)+{(En−En-1)/
N}1/2 で予測するという方法もある。
【0066】以上詳述したように、本実施例によれば、
録音時に入力される音声の入力信号の振幅最大値の変化
や区間エネルギーの値から次のフレームの最大値が所定
量を越えると予測されるとき、次のフレーム区間の入力
ゲインを調整する。あるいは、録音時に入力される音声
の入力信号の振幅最大値の変化と区間エネルギーの値か
らなるメンバーシップ関数を持ちいたファジー推論によ
り次のフレームの利得調整値を予測して、入力ゲインを
調整する。したがって、録音時にアナログ/ディジタル
変換のレンジを最適に保ち、フレーム単位の処理を行う
信号に対して、予測して最適な入力レベルに調整するこ
とができる。特に、フレーム間の音声の曖昧な変化を予
測して最適な入力レベルに調整することができる。
【0067】なお、複数ポジションを持つスライドスイ
ッチにより、上記複数のボタンを統合するようにしても
良いことは勿論である。上記具体的な実施例から、次の
ような構成の技術的思想が導き出され、以下のような効
果を奏する。
【0068】(1) フレーム単位で順次入力音声信号
の所定の処理をする音声信号処理手段と、上記音声信号
処理手段に供給される音声信号の各フレーム毎の最大振
幅を検出する検出手段と、上記検出手段からの出力に基
づき次のフレームの利得値を予測する予測手段とを備え
ることを特徴とする利得調整装置。この構成によれば、
フレーム単位の処理を行う信号に対してフレーム間の入
力レベル調整を行うことができるという効果を奏する。
【0069】(2) フレーム単位で順次入力音声信号
の所定の処理をする音声信号処理手段と、上記音声信号
処理手段に供給される音声信号の各フレーム毎のフレー
ムエネルギーを演算する演算手段と、上記演算手段から
の出力に基づき次のフレームの利得値を予測する予測手
段とを備えることを特徴とする利得調整装置。この構成
によれば、フレーム単位の処理を行う信号に対してフレ
ーム間の入力レベル調整を行うことができるという効果
を奏する。
【0070】(3) フレーム単位で順次入力音声信号
の所定の処理をする音声信号処理手段と、上記音声信号
処理手段に供給される音声信号の各フレーム毎の最大振
幅を検出する検出手段と、上記音声信号処理手段に供給
される音声信号の各フレーム毎のフレームエネルギーを
演算する演算手段と、上記検出手段及び演算手段からの
出力に基づき次のフレームの利得値を予測する予測手段
とを備えることを特徴とする利得調整装置。この構成に
よれば、フレーム単位の処理を行う信号に対してフレー
ム間の入力レベル調整を行うことができるという効果を
奏する。
【0071】(4) 上記予測手段は、ファジー推論を
用いて次のフレームの利得値を予測することを特徴とす
る上記(1)乃至(3)のいずれかに記載の利得調整装
置。この構成によれば、上記(1)乃至(3)のいずれ
かに記載の効果に加えて、フレーム間の音声の曖昧な変
化を予測して最適なレベルに調整することができるとい
う効果を奏する。
【0072】(5) フレーム単位で順次入力音声信号
の所定の処理をする音声信号処理手段と、録音時に各フ
レーム毎のフレーム間の最大値及びフレームエネルギー
を演算する演算手段と、上記演算手段より得られた情報
に基づき次のフレームの利得値を予測する予測手段とを
備えることを特徴とする利得調整装置。この構成によれ
ば、フレーム単位の処理を行う信号に対してフレーム間
の入力レベル調整を行うことができるという効果を奏す
る。
【0073】(6) フレーム単位で順次入力音声信号
の所定の処理をする音声信号処理手段と、録音時に各フ
レーム毎のフレーム間の最大値及びフレームエネルギー
のいずれか一方を演算する演算手段と、上記演算手段よ
り得られた情報に基づき次のフレームの利得値を予測す
る予測手段とを備えることを特徴とする利得調整装置。
この構成によれば、フレーム単位の処理を行う信号に対
してフレーム間の入力レベル調整を行うことができると
いう効果を奏する。
【0074】(7) 上記予測手段は、ファジー推論を
用いて次のフレームの利得値を予測することを特徴とす
る上記(5)又は(6)に記載の利得調整装置。この構
成によれば、上記(5)又は(6)に記載の効果に加え
て、フレーム間の音声の曖昧な変化を予測して最適なレ
ベルに調整することができるという効果を奏する。
【0075】
【発明の効果】請求項1に記載の発明によれば、入力音
声信号の各フレーム毎の最大振幅を検出して次のフレー
ムの利得値を予測するので、フレーム単位の処理を行う
信号に対してフレーム間の入力レベル調整を行うことが
できるという効果を奏する。
【0076】請求項2に記載の発明によれば、入力音声
信号の各フレーム毎のフレームエネルギーを演算して次
のフレームの利得値を予測するので、フレーム単位の処
理を行う信号に対してフレーム間の入力レベル調整を行
うことができるという効果を奏する。
【0077】請求項3に記載の発明によれば、入力音声
信号の各フレーム毎の最大振幅を検出し、さらに入力音
声信号の各フレーム毎のフレームエネルギーを演算し
て、次のフレームの利得値を予測するので、フレーム単
位の処理を行う信号に対してフレーム間の入力レベル調
整を行うことができるという効果を奏する。
【0078】請求項4に記載の発明によれば、請求項1
乃至3のいずれかに記載の発明の効果に加えて、ファジ
ー推論を用いて次のフレームの利得値を予測するので、
フレーム間の音声の曖昧な変化を予測して最適なレベル
に調整することができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明による一実施例の音声情報処理装置の適
用された音声記録再生装置のブロック構成図である。
【図2】記録媒体の主記録媒体部の記録構成を示す図で
ある。
【図3】主制御回路の動作フローチャートである。
【図4】(A)はDSP部に於けるリミッタ機能付き音
声入力処理部の動作を説明するためのフローチャートで
あり、(B)は次に入力されてくる音声入力信号を予測
する方法を説明するための時間に関する入力信号の振幅
値を示す図である。
【図5】(A)はDSP部に於ける自動利得調整処理部
の動作を説明するためのフローチャートであり、(B)
は(A)中の利得調整予測処理のフローチャートであ
る。
【図6】(A)は入力音声信号を示す図であり、(B)
はファジー推論を用いた利得予測処理を説明するための
図である。
【図7】マムダニ(Mamdani)のファジー推論法
(min−max−重心法)を説明するための図であ
る。
【符号の説明】
1…マイクロホン、2,12…増幅器(AMP)、3…
低域通過フィルタ(LPF)、4…アナログ/ディジタ
ル(A/D)変換器、5…ディジタル信号処理(DS
P)部、6…制御回路、7…データ入出力(I/O)バ
ッファ、8…主制御回路、9…アドレス制御回路、10
…記録媒体、10A…インデックス部、10A1…操作
開始位置情報、10A2…操作終了位置情報、10A3
…動作位置情報、10B…音声データ部、10B1,1
0B2,10B3…音声メッセージファイル、11…デ
ィジタル/アナログ(D/A)変換器、13…スピー
カ、14…駆動回路、15…表示器、16…主電源スイ
ッチ、17…赤外光LED、18…電圧比較器、19…
PINダイオード、20…電磁石、21…リードスイッ
チ(REED)、101…一時記録媒体部、102…主
記録媒体部、REC…録音ボタン、PL…再生ボタン、
ST…停止ボタン、FF…早送りボタン、REW…戻し
ボタン、I…Iマークボタン、E…Eマークボタン、V
AD…音声起動ボタン。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 フレーム単位で順次入力音声信号の所定
    の処理をする音声信号処理手段と、 前記音声信号処理手段に供給される音声信号の各フレー
    ム毎の最大振幅を検出する検出手段と、 前記検出手段からの出力に基づき次のフレームの利得値
    を予測する予測手段と、 を具備したことを特徴とする利得調整装置。
  2. 【請求項2】 フレーム単位で順次入力音声信号の所定
    の処理をする音声信号処理手段と、 前記音声信号処理手段に供給される音声信号の各フレー
    ム毎のフレームエネルギーを演算する演算手段と、 前記演算手段からの出力に基づき次のフレームの利得値
    を予測する予測手段と、 を具備したことを特徴とする利得調整装置。
  3. 【請求項3】 フレーム単位で順次入力音声信号の所定
    の処理をする音声信号処理手段と、 前記音声信号処理手段に供給される音声信号の各フレー
    ム毎の最大振幅を検出する検出手段と、 前記音声信号処理手段に供給される音声信号の各フレー
    ム毎のフレームエネルギーを演算する演算手段と、 前記検出手段及び演算手段からの出力に基づき次のフレ
    ームの利得値を予測する予測手段と、 を具備したことを特徴とする利得調整装置。
  4. 【請求項4】 前記予測手段は、ファジー推論を用いて
    次のフレームの利得値を予測することを特徴とする請求
    項1乃至3のいずれかに記載の利得調整装置。
JP6167732A 1994-07-20 1994-07-20 利得調整装置 Withdrawn JPH0830292A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6167732A JPH0830292A (ja) 1994-07-20 1994-07-20 利得調整装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6167732A JPH0830292A (ja) 1994-07-20 1994-07-20 利得調整装置

Publications (1)

Publication Number Publication Date
JPH0830292A true JPH0830292A (ja) 1996-02-02

Family

ID=15855128

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6167732A Withdrawn JPH0830292A (ja) 1994-07-20 1994-07-20 利得調整装置

Country Status (1)

Country Link
JP (1) JPH0830292A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007522493A (ja) * 2004-01-13 2007-08-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号エンハンスメント

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007522493A (ja) * 2004-01-13 2007-08-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号エンハンスメント

Similar Documents

Publication Publication Date Title
JPH0830292A (ja) 利得調整装置
JPH10116097A (ja) 音声再生装置
JPH0830293A (ja) 音声情報処理装置
JPH103300A (ja) ディジタル音声記録再生装置
JPH06332500A (ja) 可変速再生機能付音声再生装置
JPH0962296A (ja) 音声記録装置および音声再生装置
JPS6122399A (ja) 録音再生方式
JPH07271398A (ja) 音声記録装置
JP2000020091A (ja) 音声記録再生装置
JPH0950299A (ja) 音声記録再生装置
JPH0990994A (ja) 音声起動録音装置
JPH0981524A (ja) 携帯型電子機器
JP2000194396A (ja) 音声記録再生装置
JPH09218694A (ja) 音声記録再生装置および音声記録再生システム
JPH1152995A (ja) 音声再生装置
JPH09114497A (ja) 音声記録再生装置
JPH0720900A (ja) 音声情報記録装置
JPH11312394A (ja) 音声記録装置
JPH07160300A (ja) 音声記録装置及び音声再生装置
JPS63282798A (ja) 音声録音再生装置の動作制御回路
JP3461384B2 (ja) 音声データ転送装置
JP4276716B2 (ja) 音声データ記録再生装置
JPH09305200A (ja) 音声記録装置
JPH0973686A (ja) オートバックスペース装置
JPH11305800A (ja) 音声再生装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20011002