JPH09114497A

JPH09114497A - 音声記録再生装置

Info

Publication number: JPH09114497A
Application number: JP7268303A
Authority: JP
Inventors: Hideo Okano; 秀生岡野
Original assignee: Olympus Optical Co Ltd
Current assignee: Olympus Corp
Priority date: 1995-10-17
Filing date: 1995-10-17
Publication date: 1997-05-02

Abstract

(57)【要約】【課題】音声の再生中に記録停止や編集等が行われた前
後の部分において異音等が発生せず良質な音声を再生で
きる音声記録再生装置を提供する。【解決手段】過去の音声データと過去のパラメータのう
ちどちらか一方を用いて符号化パラメータの抽出を行な
い、抽出された符号化パラメータを用いて音声符号化を
行うＤＳＰ５と、少なくとも音声の記録が停止されたか
あるいは編集作業が行われたことを表す符号化初期化情
報Ｃ＝“１”を記録する主制御回路６と、過去の復号化
音声データと過去のパラメータのいずれか一方を用い
て、復号化信号の予測を行なうＤＳＰ５と、音声の再生
時に、音声の記録が停止されたかあるいは編集作業が行
われたことを表す情報Ｃ＝“１”を検出したときはＤＳ
Ｐ５の適応コードブックの内容を初期化する主制御回路
６とを具備する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声記録再生装置に
関する。

【０００２】

【従来の技術】近年、マイクロフォン等によって得られ
た音声信号をディジタル信号に変換して例えば半導体メ
モリに記録しておき、再生時において、半導体メモリか
らこの音声信号を読み出してアナログ信号に変換し、ス
ピーカ等により音声として出力する、いわゆるディジタ
ルレコーダと呼ばれている音声記録再生装置が知られて
いる。特開昭６３−２５９７００号公報はこのような音
声記録再生装置を開示している。

【０００３】概して音声記録再生装置においては、半導
体メモリに記録されるデータ量を節約するために、ディ
ジタル化された音声信号に対して高能率な符号化を施す
ことによって発生するデータ量をできるだけ少なくして
いる。高能率な符号化のために広く用いられている手段
として、適応コードブックを備えたコード駆動線形予測
符号化方式がある。このコード駆動線形予測符号化方式
は４Ｋｂ／ｓから１６Ｋｂ／ｓ程度のビットレートを用
いた場合に比較的高音質な再生音声が得られることが知
られている。

【０００４】

【発明が解決しようとする課題】上記した音声記録再生
装置において用いられる適応コードブックは過去の音源
信号を用いて作成されるが、使用者が一旦録音を停止
し、その後再度録音を行った場合や、挿入録音や音声の
一部切り取り等の編集作業を行った場合は、適応コード
ブックに記録される音声データの内容はその前後で無関
係になってしまう。これにより、上記のごとく録音され
た内容を連続的に再生した場合、録音停止や編集作業等
が行われた前後の部分において異音等が発生してしまう
という問題があった。

【０００５】本発明の音声記録再生装置はこのような課
題に着目してなされたものであり、その目的とするとこ
ろは、音声の再生中に記録停止や編集等が行われた前後
の部分において異音等が発生せず良質な音声を再生でき
る音声記録再生装置を提供することにある。

【０００６】

【課題を解決するための手段】上記の目的を達成するた
めに、第１の発明に係る音声記録再生装置は、過去の音
声データと過去のパラメータのうちどちらか一方を用い
て符号化パラメータの抽出を行う符号化パラメータ抽出
手段と、抽出された符号化パラメータを用いて音声符号
化を行う音声符号化手段と、少なくとも音声の記録が停
止されたかあるいは編集作業が行われたことを表す情報
を記録する記録手段と、過去の復号化音声データと過去
のパラメータのいずれか一方を用いて、復号化信号の予
測を行なう予測手段と、音声の再生時に、音声の記録が
停止されたかあるいは編集作業が行われたことを表す情
報を検出したときは予測手段の内容を初期化する初期化
手段とを具備する。

【０００７】また、第２の発明に係る音声再生装置は、
過去の復号化した音声データと過去のパラメータのうち
どちらか一方を用いて復号化信号の予測を行う予測手段
と、予測された復号化信号を用いて音声復号化を行う復
号化手段と、少なくとも音声の記録が停止されたかある
いは編集作業が行なわれたことを表す情報に基づいて前
記予測手段の内容を初期化する初期化手段とを具備す
る。

【０００８】また、第３の発明に係る音声記録再生装置
は、過去の駆動音源音声データが記録された第１の適応
コードブックを用いて符号化パラメータの抽出を行う符
号化パラメータ抽出手段と、抽出された符号化パラメー
タを用いて音声符号化を行う符号化手段と、音声の記録
が停止されたかあるいは編集作業が行われたことを表す
情報を記録する記録手段と、第２の適応コードブックに
記録された過去の復号化した駆動音源音声データを用い
て復号化信号の予測を行う予測手段と、予測された復号
化信号を用いて音声復号化を行う復号化手段と、音声の
再生時に、少なくとも音声の記録が停止されたかあるい
は編集作業が行われたことを表す情報を検出したときは
予測手段の内容を初期化する初期化手段とを具備する。

【０００９】すなわち、第１の発明に係る音声記録再生
装置においては、過去の音声データと過去のパラメータ
のうちどちらか一方を用いて符号化パラメータの抽出を
行ない、抽出された符号化パラメータを用いて音声符号
化を行う。このとき、少なくとも音声の記録が停止され
たかあるいは編集作業が行われたことを表す情報を記録
しておく。そして、音声の再生時に、音声の記録が停止
されたかあるいは編集作業が行われたことを表す情報を
検出したときは、過去の復号化音声データと過去のパラ
メータのいずれか一方を用いて復号化信号の予測を行な
う予測手段の内容を初期化するようにする。

【００１０】また、第２の発明に係る音声再生装置にお
いては、過去の復号化した音声データと過去のパラメー
タのうちどちらか一方を用いて予測手段によって復号化
信号の予測を行ない、予測された復号化信号を用いて音
声復号化を行う。このとき、少なくとも音声の記録が停
止されたかあるいは編集作業が行なわれたことを表す情
報に基づいて前記予測手段の内容を初期化するようにす
る。

【００１１】また、第３の発明に係る音声記録再生装置
においては、過去の駆動音源音声データが記録された第
１の適応コードブックを用いて符号化パラメータの抽出
を行ない、抽出された符号化パラメータを用いて音声符
号化を行う。このとき、音声の記録が停止されたかある
いは編集作業が行われたことを表す情報を記録してお
く。次に、第２の適応コードブックに記録された過去の
復号化した駆動音源音声データを用いて予測手段によっ
て復号化信号の予測を行ない、予測された復号化信号を
用いて音声復号化を行う。この音声の再生時に、少なく
とも音声の記録が停止されたかあるいは編集作業が行わ
れたことを表す情報を検出したときは予測手段の内容を
初期化するようにする。

【００１２】

【発明の実施の形態】以下、図面を参照して、本発明の
一実施形態を説明する。図１は本発明が適用される音声
記録再生装置の構成を示す図である。同図において、マ
イクロフォン１は増幅器（ＡＭＰ）２、低域通過フィル
ター（ＬＰＦ）、アナログ／ディジタル（Ａ／Ｄ）変換
器４を介して、ディジタル信号処理部（以下ＤＳＰと呼
ぶ）５が内蔵された主制御回路６のＤ１端子に接続され
ている。この主制御回路６は、音声の圧縮及び伸長を行
なう圧縮伸長手段、入力信号が無音であるか有音である
かを判断する判断手段、時間軸圧縮手段、入力信号レベ
ルを検出又は予測する検出（予測）手段、条件付き時間
軸圧縮手段、高速で入力された信号を検出する検出手段
及びデータ処理手段としての機能を具備している。

【００１３】また、スピーカ１３は増幅器（ＡＭＰ）１
２、ディジタル／アナログ（Ｄ／Ａ）変換器１１を介し
て主制御回路６のＤ２端子に接続されている。ここで、
上記したＡ／Ｄ変換器４とＤ／Ａ変換器１１とはＣＯＤ
ＥＣを構成している。

【００１４】主制御回路６のＤ３端子はメモリ制御回路
７に接続され、Ｄ４端子は当該音声記録再生装置に脱着
可能な半導体メモリ部１０に接続されている。また、主
制御回路６のＤ５端子は発光ダイオード（ＬＥＤ）１７
に接続されている。このＬＥＤ１７は半導体メモリ部１
０に記録されたデータを送信する送信手段であり、同時
に、外部からのデータを受信可能であることを示す出力
信号を出力する。ＬＥＤ１７をデータの送受信のみに利
用するときは赤外発光ダイオードが使用されるが、録音
や再生時に有音が入力又は出力されると発光する表示器
としても兼用することができる。この場合、可視光成分
を多く含み、例えばピーク波長が５００ｎｍ〜１０００
ｎｍ、好ましくは６００ｎｍ〜９００ｎｍの比較的低い
波長の赤外発光ダイオード等が用いられる。

【００１５】主制御回路６のＤ６端子はスイッチ２５に
接続されるとともに、Ｄ７端子は駆動回路９を介して表
示器８に接続されている。主制御回路６のＤ８端子は電
圧比較器（ＣＯＭＰ）１６を介してＰＩＮダイオード１
４と抵抗１５との接続点に接続されている。ここで、Ｐ
ＩＮダイオード１４、電圧比較器１６、抵抗１５はデー
タ受信手段またはデータ転送開始信号を受信する手段を
構成している。

【００１６】主制御回路６のＤ９端子はＤＣ−ＤＣコン
バータ２０に接続され、このＤＣ−ＤＣコンバータ２０
はａ接点とｂ接点との間で切り替え可能な主電源スイッ
チ１９とリレー２６との並列接続回路とを介して、電池
（ＢＡＴ）１８に接続されている。主制御回路６のＤ１
０端子はリレー２６に接続されるとともに、Ｄ１１端子
は主電源スイッチ１９のａ接点に接続されている。

【００１７】ここでＤＣ−ＤＣコンバータ２０は、電池
１８から昇圧した電圧を出力して各手段に安定した電源
電圧を供給すると同時に、電池１８の電圧が一定値以下
であるかどうかを表す信号をＤ９端子に送る。これによ
って主制御回路６は電池１８の消耗状態を検出すること
ができる。主電源スイッチ１９と並列にリレー２６が接
続されているが、これは主電源スイッチ１９がＯＦＦに
されても電源がすぐに停止しないようにするためであ
り、かつ主電源スイッチ１９がＯＦＦされたことは主電
源スイッチ１９がａ接点側に切り替えられたときの電池
１８の電圧を検出することによって行なっている。

【００１８】主制御回路６のＤ１２端子はダイオード２
１を介して、トランジスタ２４と抵抗２３とコンデンサ
２２とに接続され、トランジスタ２４はマイクロホン１
と増幅器２との接続点に接続されている。

【００１９】さらに、主制御回路６には録音ボタン（Ｒ
ＥＣ）と、再生ボタン（ＰＬ）と、停止ボタン（ＳＴ）
と、早送りボタン（ＦＦ）と、早戻しボタン（ＲＥＷ）
と、Ｉ（Instruction ）マークボタンＩと、Ｅ（ＥＮ
Ｄ）マークボタンＥと、音声起動（ボイスアクティブデ
ィテクタ）ボタンＶＡＤ等の操作ボタンが接続されてい
る。

【００２０】また、図１に示すように、半導体メモリ１
０は一時記録媒体部１００ａと主記録媒体部１００ｂと
から構成されている。主記録媒体部１００ｂにはフラッ
シュメモリや光磁気ディスク、磁気ディスクや磁気テー
プなどが用いられる。また、一時記録媒体部１００ａに
はＳＲＡＭやＤＲＡＭ、ＥＥＰＲＯＭや高誘電体メモリ
やフラッシュメモリなど、主記録媒体部１００ｂと比較
して比較的高速で読み書きが行えるものが用いられる。
本実施形態では一時記録媒体部１００ａにはＳＲＡＭを
用い、主記録媒体部１００ｂにはフラッシュメモリを用
いる。

【００２１】図２は図１に示す半導体メモリ部１０の記
録構成を示す図である。即ち、メモリ空間は、インデッ
クス部１０Ａと音声データ部１０Ｂとに大きく二分され
ている。インデックス部１０Ａには、次の音声ファイル
データの先頭アドレス位置情報１０Ａ１と、音声ファイ
ルデータのサイズ情報１０Ａ２と、ファイルの消去用フ
ラグ情報１０Ａ３と、録音のファイル番号１０Ａ４と、
音声符号化方式の識別情報１０Ａ５と、ファイルの状態
を表すフラグ情報１０Ａ６と、編集（挿入）できるファ
イルの最大値数（ｎ）１０Ａ７と、挿入されている音声
データまでの長さ情報１０Ａ８とが記録されている他
に、編集時の開始位置アドレス情報と、ファイルデータ
の先頭アドレス位置情報と、ファイルサイズ情報とが、
第１の編集の開始位置アドレス情報１０Ａ９と、第１の
編集のファイルデータの先頭アドレス位置情報１０Ａ１
０と、第１の編集のファイルサイズ情報１０Ａ１１か
ら、最大挿入できる第ｎの編集の開始位置アドレス情報
１０Ａ１２、最大挿入できる第ｎの編集のファイルデー
タの先頭アドレス情報１０Ａ１３、最大挿入できる第ｎ
の編集のファイルサイズ情報１０Ａ１４まで記録されて
いる。

【００２２】また、音声データ部１０Ｂには、第１のフ
レームデータ１０Ｂ１、第２のフレームデータ１０Ｂ
２、…、第ｍのフレームデータ１０Ｂｍまでの音声符号
化データが記録されている。本実施形態では、この音声
符号化データ１０Ｂの各フレームデータ１０Ｂ１、１０
Ｂ２、…、１０Ｂｍごとに、後述する適応コードブック
の内容を初期化するかどうかを表す符号化初期化情報Ｃ
を記録する。この符号化初期化情報Ｃの記録位置として
は、例えば各フレームデータの第１バイト目の最上位ビ
ットか又は最下位ビットに割り付けられる。あるいは各
フレームデータの最終バイト目の最上位ビットか又は最
下位ビットに割り付けられる。本実施形態では各フレー
ムデータの第１バイト目の第４ビットに符号化初期化情
報Ｃが割り付けられている。

【００２３】なお、上記した半導体メモリ部１０におい
て、音声情報の記録位置を示す情報は、本実施形態では
脱着自在な半導体メモリ部１０に記録されているが、こ
の情報は記録再生装置のメモリ制御回路７に付随する不
図示の半導体メモリ（主制御部６の内部）に記録するよ
うにしても良い。

【００２４】ここで、上記したＩマークやＥマークにつ
いて簡単に説明を加える。記録媒体には複数の文書が記
録されることから、この種の音声情報記録装置では、文
書録音者が録音時にＩマークボタンＩを操作することに
より、記録媒体に記録された複数文章間の優先関係を示
すために、インストラクション（Ｉ）マークと呼ばれる
インデックスマークを文書とともに記録することができ
る。これにより、記録された文書をタイプするタイピス
トや秘書等は、このＩマークを参照することにより、文
書をタイプするときの優先関係を音声によって容易に知
ることができる。また、文書録音者はＥマークボタンＥ
を操作することにより、複数文章間の区切りをタイピス
ト等に知らせることができる。

【００２５】図３は図１に示すＤＳＰ５の構成において
符号化部の構成を示す図であり、図４はその復号化部の
構成を示す図である。図３は適応コードブックを備えた
コード駆動線形予測符号化装置のブロック図である。同
図において、適応コードブック１３５は乗算器１３２を
介して加算器１３０の第１入力端子に接続され、確率コ
ードブック１３６は乗算器１３３とスイッチ１３１とを
介して加算器１３０の第２入力端子に接続されている。
加算器１３０の出力端子は合成フィルタ１２５を介して
減算器１２６の第１入力端子に接続されるとともに、遅
延回路１３４を介して適応コードブック１３５に接続さ
れている。

【００２６】また、入力端子１２１に接続されたバッフ
ァメモリ１２２はＬＰＣ分析器１２３を介して合成フィ
ルタ１２５に接続されるとともに、サブフレーム分割器
１２４を介して減算器１２６の第２入力端子に接続され
ている。減算器１２６の出力端子は聴感重み付けフィル
タ１２７を介して誤差評価器１２８の入力端子に接続さ
れている。この誤差評価器１２８の出力端子は適応コー
ドブック１３５と、乗算器１３２、１３３と、確率コー
ドブック１３６とに接続されている。

【００２７】さらに、マルチプレクサ１２９はＬＰＣ分
析器１２３と誤差評価器１２８とに接続されている。上
記した符号化部は過去の駆動音源音声データが記録され
た適応コードブック１３５を用いて符号化パラメータの
抽出を行う符号化パラメータ抽出手段と、抽出された符
号化パラメータを用いて音声符号化を行う符号化手段
（確率コードブック１３６を含む）としての機能を有し
ている。

【００２８】図４は、図３のコード駆動線形予測符号化
装置に対応する復号化装置のブロック図である。同図に
おいて、適応コードブック１４１は乗算器１４３を介し
て加算器１４５の第１入力端子に接続され、確率コード
ブック１４２は乗算器１４４とスイッチ１４８とを介し
て加算器１４５の第２入力端子に接続されている。加算
器１４５の出力端子は合成フィルタ１４６に接続される
とともに、遅延回路１４７を介して適応コードブック１
４１に接続されている。さらに、デマルチプレクサ１４
０は適応コードブック１４１と、確率コードブック１４
２と、乗算器１４３、１４４と、合成フィルタ１４６と
に接続されている。

【００２９】上記した復号化部は、適応コードブック１
４１に記録された過去の復号化した駆動音源音声データ
を用いて復号化信号の予測を行う予測手段（適応コード
ブック１４１を含む）と、予測された復号化信号を用い
て音声復号化を行う復号化手段（確率コードブック１４
２を含む）としての機能を有している。

【００３０】以下に録音開始後、音声が半導体メモリ部
１０に記録され、その後、再生されるまでの動作を説明
する。録音時、マイクロフォン１より得られるアナログ
音声信号をＡＭＰ２により増幅して、ＬＦＰ３を通して
周波数の帯域制限を行った後、Ａ／Ｄ変換器４によって
デジタル信号に変換して、主制御回路６の内部のＤＳＰ
５に入力する。

【００３１】このとき、マイクロフォン１より入力され
た信号の大きさが検出され、検出値が定格値、例えばＡ
／Ｄ変換器４の最大レンジの−６ｄＢよりも大きいとき
は、主制御回路６の第１２端子に接続されているダイオ
ード２１にパルスが出力されてコンデンサ２２に電荷が
蓄積されトランジスタ２４に電圧が加わる。すると増幅
器２とトランジスタ２４とグラウンド間のインピーダン
スが変化して増幅器２に入力される信号が制限され、利
得調整が行われる。コンデンサ２２に蓄えられた電荷は
抵抗２３を介して徐々に放電される。

【００３２】ＤＳＰ５の符号化処理によって圧縮された
音声データはその後、主制御回路６の第３端子及び第４
端子を通じて半導体メモリ部１０に記録される。再生時
においては、主制御回路６は半導体メモリ部１０に記録
されている音声データを読み出してＤＳＰ５に供給す
る。ＤＳＰ５の復号化処理によって伸長された音声デー
タはＤ／Ａ変換器１１によりアナログ信号に変換され、
増幅器１２で増幅された後、スピーカ１３から音声とし
て出力される。また、主制御回路６は駆動回路９を制御
して表示器８に現在の動作モードなどの各種情報を表示
させる。

【００３３】以下に、ＤＳＰ５による符号化処理を図３
を参照して詳細に説明する。図３において、入力端子１
２１から、例えば８ＫＨｚでサンプリングされた原音声
信号を入力し、予め定められたフレーム間隔（例えば２
０ｍｓ、すなわち１６０サンプル）の音声信号をバッフ
ァメモリ１２２に格納する。バッファメモリ１２２はフ
レーム単位で原音声信号をＬＰＣ分析器１２３に送出す
る。

【００３４】ＬＰＣ分析器１２３は、原音声信号に対し
て線形予測（ＬＰＣ）分析を行い、スペクトル特性を表
す線形予測パラメータαを抽出し、合成フィルタ１２５
およびマルチプレクサ１２９に送出する。サブフレーム
分割器１２４は、フレームの原音声信号を予め定められ
たサブフレーム間隔（例えば５ｍｓ、すなわち４０サン
プル）に分割する。これによってフレームの原音声信号
から、第１サブフレームから第４サブフレームまでのサ
ブフレーム信号が作成される。

【００３５】ここで、適応コードブック１３５の遅延Ｌ
とゲインβは、以下の処理によって決定される。まず、
先行サブフレームにおける合成フィルタ１２５の入力信
号すなわち駆動音源信号に、ピッチ周期に相当する遅延
を遅延回路１３４で与えて適応コードベクトルとして作
成する。例えば、想定するピッチ周期を４０〜１６７サ
ンプルとすると、４０〜１６７サンプル遅れの１２８種
類の信号が適応コードベクトルとして作成され、適応コ
ードブック１３５に格納される。このときスイッチ１３
１は開いた状態となっている。したがって、各適応コー
ドベクトルは乗算器１３２でゲイン値が可変されて乗算
された後、加算器１３０を通過してそのまま合成フィル
タ１２５に入力される。合成フィルタ１２５はＬＰＣ分
析器１２３からの線形予測パラメータαを用いて合成処
理を行い、合成ベクトルを減算器１２６に送出する。

【００３６】減算器１２６は原音声ベクトルと合成ベク
トルとの減算を行い、得られた誤差ベクトルを聴感重み
付けフィルタ１２７に送出する。聴感重み付けフィルタ
１２７は誤差ベクトルに対して聴感特性を考慮した重み
付け処理を行い、誤差評価器１２８に送出する。誤差評
価器１２８は誤差ベクトルの２乗平均を計算し、２乗平
均値が最小となる適応コードベクトルを検索して、その
遅れＬとゲインβをマルチプレクサ１２９に送出する。
このようにして、適応コードブック１３５の遅延Ｌとゲ
インβが決定される。

【００３７】次に、確率コードブック１３６のインデッ
クスｉとゲインγは、以下の処理によって決定される。
確率コードブック１３６には、サブフレーム長に対応す
る次元数（すなわち４０次元）の確率的信号ベクトルが
例えば５１２種類、予め格納されており、各々にインデ
ックスが付与されている。このときスイッチ１３１は閉
じた状態となっている。まず、前記処理によって決定さ
れた最適な適応コードベクトルを、乗算器１３３で最適
ゲインβを乗じたのち、加算器１３０に送出する次に、
乗算器１３３で各確率コードベクトルにゲイン値を可変
して乗じた後、加算器１３０に入力する。加算器１３０
は前記最適ゲインβを乗じた最適な適応コードベクトル
と各確率コードベクトルとの加算を行い、加算結果を合
成フィルタ１２５に入力する。

【００３８】この後の処理は前記の適応コードブックの
パラメータの決定処理と同様に行われる。すなわち、合
成フィルタ１２５はＬＰＣ分析器１２３からの線形予測
パラメータαを用いて合成処理を行い、合成ベクトルを
減算器１２６に送出する。減算器１２６は原音声ベクト
ルと合成ベクトルとの減算を行い、得られた誤差ベクト
ルを聴感重み付けフィルタ１２７に送出する。聴感重み
付けフィルタ１２７は誤差ベクトルに対して聴感特性を
考慮した重み付け処理を行い、誤差評価器１２８に送出
する。誤差評価器１２８は誤差ベクトルの２乗平均を計
算し、その２乗平均値が最小となる確率コードベクトル
を検索して、そのインデックスｉとゲインγをマルチプ
レクサ１２９に送出する。このようにして、確率コード
ブック１３６のインデックスｉとゲインγが決定され
る。

【００３９】マルチプレクサ１２９は、量子化された線
形予測パラメータα、適応コードブック１３５の遅れ
Ｌ、ゲインβ、確率コードブック１３６のインデックス
ｉ、ゲインγの各々をマルチプレクスして図１に示すメ
モリ制御回路７を介して半導体メモリ部１０に転送す
る。

【００４０】次に、ＤＳＰ５による復号化動作を図４を
参照して詳細に説明する。図４において、デマルチプレ
クサ１４０は受信した信号を線形予測パラメータα、適
応コードブック１３５の遅れＬ、ゲインβ、確率コード
ブック１３６のインデックスｉ、ゲインγに分解して、
分解された線形予測パラメータαを合成フィルタ１４６
に、遅れＬとゲインβを各々適応コードブック１４１と
乗算器１４３に、インデックスｉとゲインγを各々確率
コードブック１４２と乗算器１４４に出力する。

【００４１】次に、デマルチプレクサ１４０から出力さ
れた適応コードブック１４１の遅れＬに基づいて適応コ
ードブック１４１の適応コードベクトルを選択する。こ
こで適応コードブック１４１は符号化装置における適応
コードブック１３５の内容と同じ内容を有する。すなわ
ち、適応コードブック１４１には遅延回路１４７を介し
て過去の駆動音源信号が入力される。乗算器１４３は受
信したゲインβにより入力された適応コードベクトルを
増幅し、加算器１４５に送出する。

【００４２】次に、デマルチプレクサ１４０から出力さ
れた確率コードブック１４２のインデックスｉに基づい
て確率コードブック１４２のコードベクトルを選択す
る。ここで確率コードブック１４２は符号化装置におけ
る確率コードブック１３６の内容と同じ内容を有する。
乗算器１４４は受信したゲインγにより、入力された確
率コードベクトルを増幅し、加算器１４５に送出する。
加算器１４５は増幅された確率コードベクトルと増幅さ
れた適応コードベクトルとを加算して合成フィルタ１４
６および遅延回路１４７に送出する。合成フィルタ１４
６は受信した線形予測パラメータαを係数として合成処
理を行い、合成音声信号を出力する。

【００４３】次に、上記した主制御回路６の全体的動作
を詳細に説明する。電池ＢＡＴがセットされ、電源が供
給されると主制御回路６は、図５のフローチャートに示
すような動作を開始する。

【００４４】即ち、まず、主制御回路６の外部条件や内
部の記憶部の初期設定を行う（ステップＳ１）。このと
き、主制御回路のＤ９端子には、電池１８の電源電圧が
定格値この場合例えば１Ｖ以上であるかどうか、又は電
池１８に流れる電流から電池１８のインピーダンスが定
格値より高いかどうかの電池１８の状態についての検出
信号がＤＣ−ＤＣコンバータ２０から入力されている。
主制御部６は初期設定を完了した後、この検出信号に基
づいて電池１８が使用できる容量をもっているか否か、
すなわち電源電圧が十分な大きさかどうかを検出する
（ステップＳ２）。検出の結果、電池１８が使用可能な
状態にないことを検出したならば、当該音声録音再生装
置全体の電力供給を停止して電池１８と各回路との間に
設けられている不図示のスイッチをＯＦＦにして電池１
８の容量がないことを表す表示を駆動回路９を介して表
示器８にて行う。

【００４５】また、ステップＳ２において、電池１８が
使用可能な状態にあることを検出したならば、リレー２
６をＯＮにして、その後スイッチ２５又は停止ボタンＳ
Ｔと早送りボタンＦＦが同時に押されているか否かによ
ってデータ転送を行うか否かを判定する（ステップＳ
３）。ここでＹＥＳの場合はデータ転送処理に移行する
（ステップＳ２３）。

【００４６】また、ステップＳ３の判定がＮＯのとき
は、半導体メモリ部１０のインデックス部１０Ａの情
報、即ち、操作開始位置情報１０Ａ１、操作終了位置情
報１０Ａ２、その他符号モードや操作条件等を読み込
む。

【００４７】このとき、半導体メモリ部１０に所定のイ
ンデックスが正常に記録されているかどうか、即ち、半
導体メモリ部１０のフォーマットが正常かどうかを判断
する（ステップＳ４）。ここで、半導体メモリ部１０に
フォーマットされていないデータが記録されているとき
は正常でないと判断され、その場合は半導体メモリ部１
０のインデックス部１０Ａに利用条件を示す情報を入力
し、且つ音声データ部１０Ｂに“０”を入力する処理で
あるメモリーフォーマット（初期化）を行うかどうかを
確認する（ステップＳ５）。この場合は駆動回路９を制
御して、メモリーフォーマットを行うか否かの確認表示
を表示器８に行わせる。

【００４８】ここで、メモリフォーマット処理を確認指
示するボタン（録音ボタンＲＥＣ兼用）が押されたなら
ば、半導体メモリ部１０のフォーマット（初期化）を行
い（ステップＳ６）、このフォーマットの完了後、駆動
回路９を制御して表示部８にて初期設定完了の表示を行
う（ステップＳ７）。

【００４９】また、ステップＳ５でメモリーフォーマッ
トをしないことを確認指示するボタン（停止ボタンＳＴ
兼用）が押されたときには、駆動回路１４を制御して表
示器１５にて半導体メモリ部１０が正常でないことを示
すエラー表示を行なうとともに（ステップＳ８）、半導
体メモリ部１０を取り替えるべきである旨を指示表示す
る。

【００５０】そして、当該音声録音再生装置全体に電力
を供給する為の電池ＢＡＴと各回路との間に設けられた
不図示のスイッチをＯＦＦにした後、半導体メモリ部１
０の交換のために、主電源スイッチ１９がＯＦＦされる
のを待ち（ステップＳ９）、それがＯＦＦされたことを
検出すると、ステップＳ２２に移行して電源スイッチを
ＯＦＦする。

【００５１】一方、半導体メモリ部１０の初期設定が正
常に完了したときは、初期設定完了表示後、インデック
ス部１０Ａから読み出した情報より現在の動作位置の検
出を行う（ステップＳ１０）、その後、当該装置の操作
ボタンのどれかが押されたかどうかを検出しながら各回
路を待機状態にする（ステップＳ１１）。

【００５２】そして、いずれかの操作ボタンが押された
ことを検出すると、まず、操作されたのが録音ボタンＲ
ＥＣがどうか検出し（ステップＳ１２）、もし録音ボタ
ンＲＥＣが押されれば、ＤＳＰ５を制御してＡ／Ｄ変換
器４から入力された音声データを圧縮し、メモリ制御回
路７を制御して半導体メモリ部１０の音声データ部１０
Ｂに記録する録音処理に入る（ステップＳ１３）。

【００５３】操作されたのが録音ボタンＲＥＣでないと
きには、次の再生ボタンＰＬの検出を行う（ステップＳ
１４）。ここで、もし再生ボタンＰＬが押されていれ
ば、メモリ制御回路７を制御して半導体メモリ部１０の
音声データ部１０Ｂから記録されているデータを読み出
し、ＤＳＰ５に送って伸長処理を行い、Ｄ／Ａ変換器１
１に音声データを送る再生処理に入る（ステップＳ１
５）。

【００５４】また、再生ボタンＰＬが押されていないと
きには、早送りボタンが押されているかどうかを判定す
べく早送りボタンＦＦの状態を検出する（ステップＳ１
６）。もし早送りボタンＦＦが押されていれば、動作位
置を順次適当な速度（例えば、再生の２０倍速）で早送
りを行う早送り処理に入る（ステップＳ１７）。

【００５５】早送りボタンＦＦが押されていなければ、
早戻しボタンＲＥＷが押されているかどうかを判定すべ
く早戻しボタンＲＥＷの状態を検出する（ステップＳ１
８）。もし早戻しボタンＲＥＷが押されていれば、上記
早送りの場合と同様の速度で動作位置の移動を行う早戻
し処理に入る（ステップＳ１９）。

【００５６】上記ステップＳ１３、Ｓ１５、Ｓ１７、Ｓ
１９の各処理は停止ボタンＳＴが押されると、各処理か
らぬけて上記ステップＳ１１に戻る。また、操作された
のが録音、再生、早送り、早戻し等のボタンでなけれ
ば、主電源スイッチ１９のＯＦＦ又は各種の設定ボタン
の状態の検出を行う（ステップＳ２０）。

【００５７】主電源スイッチ１９が電源ＯＦＦされた時
には、メモリ制御回路７を制御して半導体メモリ部１０
のインデックス部１０Ａ内の情報を更新するため、主制
御回路６内部の不図示の記憶部に記憶してあるインデッ
クス情報を、半導体メモリ部１０のインデックス部１０
Ａに転送して記録する（ステップＳ２１）。このインデ
ックス転送処理が完了すると、当該装置全体に電源を供
給している電源スイッチをＯＦＦにする（ステップＳ２
２）。

【００５８】また、上記ステップＳ２０において、主電
源スイッチ１９がＯＦＦでないと判断されたときには、
各種の設定ボタンの状態を検出して内部の記録部に記録
した後、上記ステップＳ１１に戻る。なおここで、設定
ボタンは実際に当該装置に設けられたボタンではなく、
録音ボタンＲＥＣ、再生ボタンＰＬ、停止ボタンＳＴ、
早送りボタンＦＦ、早戻しボタンＲＥＷ、Ｉマークボタ
ンＩ、ＥマークボタンＥ、音声起動（無音圧縮）ボタン
ＶＡＤのうち、幾つかの同時押しにより代用されるボタ
ンである。

【００５９】次に、図５のステップＳ１３における録音
処理の詳細を図６のフローチャートを参照して説明す
る。制御回路６は、録音ボタンＲＥＣが押されて録音モ
ードが設定されたことを検出すると（ステップＳ３
１）、前記した録音処理に移行し、まず、その時の録音
条件（例えば、音声起動、又は無音圧縮や音声圧縮レー
トの適応可変タイプ利用等）を検出する。本実施形態の
動作条件として、動作開始時に音声起動や無音圧縮を行
わない設定が行われていることが条件になる。この検出
された録音条件を表す信号を条件モード信号としてＤＳ
Ｐ５へ送る（ステップＳ３２）。そして、次の音声ファ
イルデータの先頭アドレス位置情報１０Ａ１と、音声フ
ァイルデータのサイズ情報１０Ａ２と、ファイルの消去
用フラグ情報１０Ａ３と、録音のファイル番号１０Ａ４
と、音声符号化方式の認識情報１０Ａ５と、ファイルの
状態を表すフラグ情報１０Ａ６と、編集（挿入）できる
ファイルの最大値数（ｎ）１０Ａ７と、挿入されている
音声データまでの長さ情報１０Ａ８とが記録されるとと
もに、編集時の開始位置アドレス情報と、ファイルデー
タの先頭アドレス位置情報と、ファイルサイズ情報と
が、第１の編集の開始位置アドレス情報１０Ａ９、第１
の編集のファイルデータの先頭アドレス位置情報１０Ａ
１０、第１の編集のファイルサイズ情報１０Ａ１１か
ら、最大挿入できる第ｎの編集の開始位置アドレス情報
１０Ａ１２、最大挿入できる第ｎの編集のファイルデー
タの先頭アドレス情報１０Ａ１３、最大挿入できる第ｎ
の編集のファイルサイズ情報１０Ａ１４まで順に半導体
メモリ部１０のインデックス部１０Ａに記録される。ま
た、音声データ部１０Ｂには、第１のフレームデータ１
０Ｂ１、第２のフレームデータ１０Ｂ２、第３のフレー
ムデータ１０Ｂ３、…、第ｍのフレームデータ１０Ｂｍ
が順に記録される。

【００６０】次に主制御回路６の内部記憶部に記憶され
たメモリ管理アドレス情報（録音位置情報）を読み込ん
で設定する（ステップＳ３３）。次に、無音時間を測定
するための無音期間のカウント値ｎを初期設定値０にし
て（ステップＳ３４）、当該装置の切換え情報を表す値
ＶＦを初期設定値０にする（ステップＳ３５）。次に、
ＤＳＰ５において圧縮符号化された音声データを主制御
回路６から半導体メモリ部１０に転送する（ステップＳ
３６）。本実施形態におけるＤＳＰ５は、上記したよう
に、コードブックを用いて励起（残差）信号をベクトル
量子化する符号励起線形予測符号化（ＣＥＬＰ：Code E
xcited Linear Predictive Coding ）のような分析合成
型の音声符号化方式を用いる。このＣＥＬＰ方式の音声
符号化は、所定の時間（例えば、２０ｍｓｅｃ）内の入
力音声信号を１フレームとして扱い（例えば、サンプル
周波数が８ＫＨｚのとき１６０個のデータを１フレーム
のデータにする）、この１フレームの音声データを使っ
て次の各パラメータを導く。

【００６１】すなわち、まず、線形予測係数（ＬＰＣ）
（短期予測フィルター係数又は反射係数等）を計算し量
子化して出力する。そして、音源情報データとしていく
つかの音源情報の励起（残差）信号モデル（コードブッ
ク）の類似度を判定して、一番似ているモデルを見つけ
出す。その時の音源情報の励起（残差）信号モデルの番
号（インデックス）と利得情報を量子化して符号化を行
う。

【００６２】この符号化の過程で１フレームの音声デー
タが無音か否かの判定を行なう（ステップＳ３７）。無
音かどうかを検出する方法として、ＤＳＰ５は１フレー
ムの音声データのエネルギー（各サンプルデータの２乗
総和）もしくは１フレーム内の最大値や音声信号と残差
信号との相互相関を算出するなどして無音かどうかを判
定し、無音は０で有音は１として符号化して出力する。
主制御回路６はＤＳＰ５から転送されたデータに基づい
てそのデータが無音かどうかを判定する。

【００６３】そして、もし無音であれば無音周期カウン
ト値ｎに１を足し、カウントアップする（ステップＳ３
８）。もし無音でなければ無音周期カウント値ｎをリセ
ットして初期設定値０にする（ステップＳ３９）。次に
無音が一定値以上経過したかどうかを判定するため、こ
の無音周期カウント値ｎが、例えば、判定値ＬＩＭ＝５
００（５００フレーム無音が続くことを意味する。この
場合は１０秒間無音が続いたものと判定する。）以上で
あるかどうかの判定を行う（ステップＳ４０）。この判
定値ＬＩＭは５〜６５５３５程度の範囲の値であり、好
ましくは１００〜３０００程度、特に１５０〜５００程
度の値であることが望ましい。本実施形態では判定値Ｌ
ＩＭ＝５００を採用する。

【００６４】そして、もし、判定値ＬＩＭが５００以上
であれば切換え情報値ＶＦに１加算する（ステップＳ４
１）。この切換え情報値ＶＦが０の時は初期設定状態、
ＶＦが１のときは音声起動（無音圧縮）モード、ＶＦが
２以上で停止の状態に切り換える。判定値ＬＩＭの値は
無音が連続的に発生する場合、その発生頻度により可変
することもできる。例えば、切換え情報値ＶＦが０のと
きに判定値ＬＩＭを５００に設定し、切換え情報値ＶＦ
が１のときには判定値ＬＩＭを５０に設定するなど、そ
れぞれ違う値に設定して使われることもある。このよう
な判定値ＬＩＭを可変にすることで、話者のしゃべり方
が無音を多く含むようなしゃべり方をする場合（例え
ば、考えながら口述記録を行う場合）には、記録媒体を
効率良く利用する録音モードに自動的に切り替わる操作
が行われる。

【００６５】次に、この切換え情報値ＶＦが０かどうか
を判定し（ステップＳ４２）、もし切換え情報値ＶＦが
０ならば、ＤＳＰ５から転送された音声符号化データを
制御命令とともにメモリ制御回路７に出力し（ステップ
Ｓ４３）、メモリ制御回路７によって符号化データが半
導体メモリ部１０に記録される。次に、主制御回路６の
内部記憶部に記憶している動作位置情報を更新する（ス
テップＳ４４）。更新する値は、インデックス部１０Ａ
の次の音声ファイルデータの先頭アドレス位置情報１０
Ａ１と音声ファイルデータのサイズ１０Ａ２である。

【００６６】次に、停止（ＳＴＯＰ）ボタンＳＴが押さ
れたかどうかを検出し（ステップＳ４５）、押されてい
なければ上記ステップＳ３６へ戻って上記動作を繰り返
す。また、停止ボタンＳＴが押されていれば、主制御回
路６の内部記憶部に記憶されている動作位置情報をイン
デックス部１０Ａに記録するとともに、再生時に適応コ
ードブック１４１の内容を初期化するために使用される
符号化初期化情報Ｃ＝“１”を最後に符号化したフレー
ムの例えば図２の音声データ部１０Ｂに記録する（ステ
ップＳ４８）。そして録音処理を抜ける。このように、
主制御回路６は符号化初期化情報Ｃ＝“１”を記録する
記録手段としての機能を有している。

【００６７】また、ステップＳ４２で切換え情報値ＶＦ
が０でないと判定され、ステップＳ４６で切換え情報値
ＶＦの値が１であればステップＳ４５に移行する。ま
た、ステップＳ４６で切換え情報値ＶＦが１でないと判
定されると、主制御回路６の内部記憶部に記憶されてい
る動作位置情報を更新する（ステップＳ４７）。そし
て、内部記憶部に記憶している動作位置情報をインデッ
クス部１０Ａに記録した後、ステップＳ４８へ移行し
て、再生時に適応コードブック１４１の内容を初期化す
るために使用される符号化初期化情報Ｃ＝“１”を最後
に符号化したフレームの例えば図２の音声データ部１０
Ｂに記録してこの録音処理を抜ける。

【００６８】以下に図５のステップＳ１５における再生
処理の詳細を図７に示すフローチャートを参照して説明
する。まず、ステップＳ６１において上記再生ボタンＰ
Ｌが押されていることを検出すると再生処理のサブルー
チンに移行する（音声再生モードの検出）。主制御回路
６はそのときの音声再生の条件（無音圧縮、スピード再
生、ノイズ除去等）を検出するとともに、読み出しブロ
ック数を計数するための内部カウンタをリセットする。
そしてこの検出された条件により音声再生の条件モード
を表す信号をＤＳＰ５に送る（ステップＳ６２）。

【００６９】その後、上記主制御回路６の内部記憶部に
記憶されている音声データの読み出し位置を算出してイ
ンデックス情報部１０Ａの動作位置情報により得て、駆
動回路９を制御してその動作位置情報を再生開始位置と
して表示部８に表示する（ステップＳ６３）。そして、
半導体メモリ部１０の音声データ部１０Ｂから音声メッ
セージファイルの読み込みを行なうため、内部記憶部に
記憶している動作開始位置情報とインデックス情報部１
０Ａより算出したアドレスをメモリ制御回路７に出力す
る（ステップＳ６４）。これにより、半導体メモリ部１
０の音声データ部１０Ｂより１ブロックの音声データ
（例えば、音声を２０ｍｓのブロックに分けたデータ）
が主制御回路６に読み込まれる（ステップＳ６５）。

【００７０】ここで、早聞き処理を行なうかどうかを音
声起動ボタンＶＡＤの状態により設定されるモードを検
出して判断を行なう（ステップＳ６６）。そして、早聞
きを行なう場合には、さらにもう１ブロック分の音声デ
ータを半導体メモリ部１０から主制御回路６に読み込む
（ステップＳ６７）。そして、時間圧縮処理を行なうか
どうかを判断し（ステップＳ６８）、もし時間圧縮処理
を行なうモードでなければステップＳ６９に移行する
が、時間圧縮処理を行なうモードであれば、時間軸圧縮
を行なう命令をＤＳＰ５へ出力して時間軸圧縮を行ない
（ステップＳ７４）、その後ステップＳ６９に移行す
る。

【００７１】ステップＳ６９では図２の音声データ部１
０Ｂの符号化初期化情報Ｃが“１”かどうかを判断し、
Ｃ＝“１”ならば適応コードブック１４１の内容を初期
化する（ステップＳ７０）。次に１フレーム分の音声デ
ータをＤＳＰ５へ転送する（ステップＳ７１）。このよ
うに主制御回路６は適応コードブック１４１の内容を初
期化する初期化手段としての機能を有している。ここ
で、適応コードブック１４１の内容を初期化するとは、
適応コードブック１４１に“０”を書き込むことを意味
する。

【００７２】そして、主制御回路６は、インデックス情
報部１０Ａのデータや内部記憶部に記憶されている再生
位置データにより次に再生すべき音声データの位置（動
作位置）情報を算出して、内部記憶部に記憶されている
再生位置情報を更新する（ステップＳ７２）。その後、
停止（ＳＴＯＰ）ボタンＳＴが押されているかどうかを
検出する（ステップＳ７３）。ここで停止ボタンＳＴが
押されていれば再生処理を抜けるが、押されていないと
きはステップＳ６４に戻って再生処理を継続する。

【００７３】なお、上記した実施形態では停止（ＳＴＯ
Ｐ）ボタンＳＴが押されて録音が停止されたときに符号
化初期化情報Ｃ＝“１”を記録するようにしたが、この
他に挿入録音や音声の一部切り取り等の編集作業を行っ
た場合にＣ＝“１”を記録するようにしてもよい。

【００７４】上記した実施形態によれば、録音停止や編
集作業等が行われた前後の部分については符号化音声デ
ータとともに符号化初期化情報Ｃ＝“１”を記録してお
き、再生時にこの符号化初期化情報Ｃの状態に基づいて
適応コードブック１４１の内容を初期化するようにした
ので、音声の再生中に異音等が発生することがなく良質
な音声を再生できるようになる。

【００７５】

【発明の効果】請求項１、２、３に記載の発明によれ
ば、音声の再生中に記録停止や編集等が行われた前後の
部分において異音等が発生せず良質な音声を再生できる
効果を奏する。

【図面の簡単な説明】

【図１】本実施形態に係る音声記録再生装置の構成を示
す図である。

【図２】図１に示す半導体メモリ部の記録構成を示す図
である。

【図３】ＤＳＰの符号化部の構成を示す図である。

【図４】ＤＳＰの復号化部の構成を示す図である。

【図５】主制御回路の全体的動作を説明するためのフロ
ーチャートである。

【図６】図５に示すフローチャートの録音処理の詳細を
説明するためのフローチャートである。

【図７】図５に示すフローチャートの再生処理の詳細を
説明するためのフローチャートである。

【符号の説明】

５…デジタル信号処理部（ＤＳＰ）、６…主制御回路、
７…メモリ制御回路、１０…半導体メモリ部、１２５、
１４６…合成フィルタ、１３５、１４１…適応コードブ
ック、１３６、１４２…確率コードブック。

Claims

【特許請求の範囲】

【請求項１】過去の音声データと過去のパラメータの
うちどちらか一方を用いて符号化パラメータの抽出を行
う符号化パラメータ抽出手段と、抽出された符号化パラメータを用いて音声符号化を行う
音声符号化手段と、少なくとも音声の記録が停止されたかあるいは編集作業
が行われたことを表す情報を記録する記録手段と、過去の復号化音声データと過去のパラメータのいずれか
一方を用いて、復号化信号の予測を行なう予測手段と、音声の再生時に、音声の記録が停止されたかあるいは編
集作業が行われたことを表す情報を検出したときは予測
手段の内容を初期化する初期化手段と、を具備したことを特徴とする音声記録再生装置。
【請求項２】過去の復号化した音声データと過去のパ
ラメータのうちどちらか一方を用いて復号化信号の予測
を行う予測手段と、予測された復号化信号を用いて音声復号化を行う復号化
手段と、少なくとも音声の記録が停止されたかあるいは編集作業
が行なわれたことを表す情報に基づいて前記予測手段の
内容を初期化する初期化手段と、を具備したことを特徴とする音声再生装置。
【請求項３】過去の駆動音源音声データが記録された
第１の適応コードブックを用いて符号化パラメータの抽
出を行う符号化パラメータ抽出手段と、抽出された符号化パラメータを用いて音声符号化を行う
符号化手段と、音声の記録が停止されたかあるいは編集作業が行われた
ことを表す情報を記録する記録手段と、第２の適応コードブックに記録された過去の復号化した
駆動音源音声データを用いて復号化信号の予測を行う予
測手段と、予測された復号化信号を用いて音声復号化を行う復号化
手段と、音声の再生時に、少なくとも音声の記録が停止されたか
あるいは編集作業が行われたことを表す情報を検出した
ときは予測手段の内容を初期化する初期化手段と、を具備したことを特徴とする音声記録再生装置。