JP3483513B2

JP3483513B2 - 音声録音再生装置

Info

Publication number: JP3483513B2
Application number: JP2000057087A
Authority: JP
Inventors: 佐々木　　寛; 正康佐藤
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2000-03-02
Filing date: 2000-03-02
Publication date: 2004-01-06
Anticipated expiration: 2020-03-02
Also published as: JP2001249690A; US6778956B1

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ベクトル量子化と
アナログフラッシュメモリを組合わせて符号化効率の向
上を図る音声録音再生装置に関する。

【０００２】

【従来の技術】近年、音声データの録音再生市場が、非
常に活発化・急成長してきている。これは、音声データ
の録音再生技術が、ＩＣレコーダ等のビジネスツールと
して、あるいはラジオ等の付加機能の一つとして、録音
再生時間の長時間化、録音再生装置の低価格化を理由
に、ユーザーニーズを満足しつつあることによる。

【０００３】前者のＩＣレコーダ等のビジネスツールと
しての録音再生装置の場合は、録音時間の長時間化・音
質の高品質化が必須のキーワードとなり、近年の高能率
圧縮符号化技術の急速な進歩により実現可能となった。
この高能率圧縮符号化技術は、音声データの複雑で高度
なデジタル信号処理を大量に必要とするため、高速かつ
高性能な信号処理専用ＬＳＩが必須条件となり、その結
果、装置全体のコストも高価になりがちである。

【０００４】一方、ラジオ等の付加価値機能としての録
音再生装置の場合は、商品自体の価格を抑えるために、
録音再生装置の低コスト化が必須の要件となり、次い
で、録音再生時間の長時間化・音質の高品質化という課
題が残る。このため、複雑で高度なデジタル信号処理を
可能な限り避け、簡単な回路・構成による音声の録音再
生技術が必要となる。

【０００５】現在、この低価格音声録音再生市場におい
て、音声データをアナログフラッシュメモリに記録し、
必要に応じて、これを再生する音声録音再生装置がある
（以下、第１の従来技術とする）。

【０００６】＜第１の従来技術＞第１の従来技術とし
て、低価格録音再生装置であるアナログフラッシュメモ
リを用いた音声録音装置を挙げ、その構成・動作・特徴
について説明する（図１２、図１３参照）。

【０００７】図１２は第１の従来技術における音声録音
再生装置の構成を示しており、エイリアンジング防止の
ためのローパスフィルタ（１００、１０３）と、フィル
タ通過後の入力信号を記録するためのアナログフラッシ
ュメモリ（１０１）と、それらを制御するためのコント
ローラ（１０２）から成る。

【０００８】まず、録音時の動作について説明する。
（１）音声信号をマイク等の音声データ入力機器から入
力し、（２）入力された音声データを、ローパスフィル
タ１００に通す。このフィルタは、録音する音声帯域を
制限して、エイリアシングを防止するためフィルタであ
る。図１３において波形２００が、音声データに相当す
る。（３）フィルタ１００を通過した音声データを、コ
ントローラ１０２が、予め設定されている周期（標本化
周波数）に従ってサンプリングし、音声データ値を取得
する。（４）次にコントローラ１０２は、取得した音声
データ値に相当するだけの電荷を、アナログフラッシュ
メモリ１０１に記録する。このステップにより、入力音
声データの１サンプル値が、１個のアナログフラッシュ
に記録されることになる。

【０００９】上記（１）から（４）の処理ステップを、
入力音声データが終了するまで繰り返し、全サンプリン
グデータをアナログフラッシュに記録する。

【００１０】次に、再生時の動作について説明する。
（１）コントローラ１０２は、アナログフラッシュに記
録された電荷量を取得し、（２）録音時と同様に標本化
周波数にしたがって、この値を音声波形としてローパス
フィルタ１０３へ転送する。この段階では、音声波形
は、階段状になっている。そこで、このローパスフィル
タを通すことで、元の滑らかな波形に戻される。

【００１１】以上の処理が、アナログフラッシュメモリ
を用いた音声録音再生装置の動作概略である。

【００１２】以上説明したように、第１の従来技術によ
れば、（１）アナログフラッシュを利用することで、１サンプ
ル値をアナログフラッシュメモリ１セルで記録できる。
デジタルメモリを使用する場合は、量子化ビット数だけ
のメモリが必要であるのだから、アナログフラッシュメ
モリの使用により実装面積を小さくすることができる。（２）符号化処理を行わず、音声データをそのままメモ
リに記録するだけなので、非常に単純な回路構成で実現
することができる。以上の理由により、装置全体のコストを小さく抑え、低
価格な音声録音再生装置を実現することができる。

【００１３】（長時間録音時間化に伴う問題点）第１の
従来技術において、録音時間の長時間化を考える場合、
まずメモリを増やす方法が考えられる。これは、「録音
時間の増分×標本化周波数のデータ」を記録するための
メモリを追加し、さらに「該追加メモリをコントロール
するためのコントローラ」を追加すること、つまり構造
上の変更により、録音時間の長時間化を達成する方法で
ある。しかし、この方法では、上記２つの構造上の変更
により実装面積が増加してしまうため、装置のコスト増
加につながってしまう。

【００１４】次に考えられる方法として、メモリを増や
さずに長時間録音する手段、つまり符号化技術を用いて
音声データを圧縮する方法が考えられる。これは、音声
データをそのまま記録するのではなく、効率良く符号化
すること、つまり、元の音声データの質を損なうことな
く別のデータに変換することでデータ容量を小さくし、
録音時間の長時間化を達成する方法である。しかし、Ｃ
ＥＬＰ等に代表される高能率圧縮符号化方式では、メモ
リ増加を防ぐことはできるが、反面、符号復号化に大量
の演算処理を必要とするため、処理能力の高いＬＳＩが
必要となり、やはりコスト大につながってしまう。

【００１５】＜第２の従来技術＞比較的演算量の少ない
符号化方式で、前述の第１の従来技術と組合わせること
が考えられる符号化方式として、ベクトル量子化（以下
ＶＱとする）方式がある。以下、図１４と図１５を使用
して、ＶＱ方式の構成・動作・特徴、および、第１の従
来技術と組合わせることの効果について説明する。

【００１６】図１４はＶＱを用いた音声データの録音再
生装置の構成図である。この装置は、エイリアジング防
止のためのローパスフィルタ（３００，３０５）、全体
を制御するためのコントローラ（３０３）、および、録
音データを記録するためのメモリ（３０４）、音声デー
タを符号化するためのＶＱ処理部（３０１）とコードブ
ック（３０２）を備えている。

【００１７】なお、コードブックとは、複数個のフレー
ム波形の標準パタンを登録したフレーム波形辞書のこと
であり、その作成方法について説明する。

【００１８】フレーム波形辞書を作成する代表的な既存
方法の一つとして「ＬＢＧアルゴリズム」がある。この
ＬＢＧアルゴリズムは、実際の音声データからフレーム
波形辞書を容易に作成することができるアルゴリズムで
あり、大きく２つの処理『セントロイド（波形パタンに
相当する）の二分割処理と最適化処理』に分けられる。
簡単に言えば、学習データから１個の初期セントロイド
を作成することからスタートして、必要とするセントロ
イド数に達するまで、上記２つの処理を交互に繰り返す
ことでフレーム波形辞書を作成する方法であ。

【００１９】以下、図１６を参照してＬＢＧアルゴリズ
ムの動作フローについて簡単に説明する。（１）学習させる実際の音声データと共に、必要とする
セントロイド数（＝波形パタン数）、制御パラメータを
与える。（２）初期セントロイドＣ１を作成する。Ｃ１は、学習
波形ｘの平均値で計算する。（ステップ５０１）（３）現在のセントロイド数を２倍にする（セントロイ
ドの分割処理）。具体的には、セントロイドＣｋに対し
て、乱数ベクトルｒと、制御パラメータＳを用いて、２
つのセントロイドＣｋとＣｋ＋ｎを作成する。（ステッ
プ５０３）（４）全セントロイドについて、上記（３）の処理を施
す。（５）次に、上記（３）、（４）の処理によって、２倍
に増えたセントロイドを最適な状態の配置にする。具体
的には、学習データを、現在のセントロイドでＶＱ処理
し、その際の量子化誤差Ｅｉ（ステップ５０４）が小さ
くなるように、セントロイドの配置を繰り返し修正する
（ステップ５０６）。最終的に、ステップ５０５の条件
を満足したとき、現在のセントロイドが最適な状態に配
置されたと判断する。（６）判定処理５０５を通過したセントロイドは、制御
パラメータであるＮｅｎｄ（目標とするセントロイド
数）に達していれば、処理終了とし、そうでなければ、
（３）に戻りセントロイドの分割処理に戻る。

【００２０】次に、ＶＱ符号化方式の動作フローについ
て説明する。なお、ここでは説明を簡潔にするため、入
力音声信号はローパスフィルタを既に通過したものと
し、入力音声信号４００をＶＱにより符号化する場合を
考える。

【００２１】（１）第１の従来技術と同様に、音声信号
の信号値を、既に設定されている標本化周波数に従って
取得する。（２）次に、前記サンプリングされたデータを、数点
（図１５では連続する４点となっている）を、１個のフ
レーム波形（４０１）にまとめる。（３）次に、予め用意しておいたフレーム波形辞書（４
０３）に登録されている多くのフレーム波形の中から、
前記フレーム波形（４０１）に最も類似したものを選択
（４０２）する。図１５ではフレーム波形辞書に２５６
個の波形パタンが登録されている。（４）さらに、フレーム波形辞書（４０３）に登録され
ているコードパタンには、パタン番号がユニークに割当
てられており、選択されたフレーム波形にも、ユニーク
なパタン番号が割当てられている。図１５では、選択さ
れた波形パタンには、パタン番号Ｋが割当てられてい
る。この仕組みにより、複数のサンプルデータを１個の
パタン番号に符号化（＝変換）していることに相当す
る。図１５では、４個のサンプルデータを１個のパタン
番号データに変換しているので、データ容量を１／４倍
に圧縮している。（５）選択されたフレーム波形に対応するコード番号Ｋ
を、メモリに格納することで、符号化された音声データ
がメモリに上に記録される。再生時は、これとは逆順の
動作になる。

【００２２】以下にＶＱ方式の利点について述べる。（１）連続する複数のサンプルデータを１つのパタン番
号に変換、つまり符号化することにより、データ容量を
小さくすることができる（圧縮効果）。（２）複数のサンプルデータを１つのフレーム波形とし
て扱うための手段と、波形辞書に登録された波形パタン
の中からフレーム波形に類似したパタンを検索するため
の手段を設けるだけで、比較的容易に実現できる。

【００２３】よって、第１の従来技術とＶＱ方式を組合
わせることは、（２）の理由により、実装上比較的容易
であると共に、それに伴うコストも小さく抑えることが
できる。また、（１）の理由により、メモリ増加をせず
に録音時間の長時間化が可能になる。

【００２４】

【発明が解決しようとする課題】以上、述べたように第
１の従来技術に第２の従来技術を組合わせることによ
り、録音時間の長時間化の実現可能性が高くなる。しか
し、各従来技術には以下の問題点があり、容易に組合わ
せることはできない。

【００２５】（１）第２の従来技術であるＶＱにおい
て、高品質の録音再生を行うためには、大量のフレーム
波形をフレーム波形辞書に登録しておく必要がある。（２）第１の従来技術において、アナログフラッシュメ
モリの性質上、１セルで記憶できる値に上限がある（つ
まり解像度に上限がある）。そのため、１セルに記憶す
ることのできる符号値が制限される（フレーム波形辞書
に登録できる波形パタン数を制限される）。

【００２６】従って、第１の従来技術と第２の従来技術
を単に組合わせるだけでは、長時間録音を可能にするこ
とはできるものの、記録する音声データの音質が劣化す
るという問題が生じる。この問題を解決する方法とし
て、フレーム波形辞書に登録する波形パタン数を大量に
すると同時に、その波形番号を１セルで記憶するのでは
なく、複数セルを使って記憶することが考えられる。例
えば、フレーム波形辞書を複数個用意する方法である。
つまり、１つのフレーム波形辞書には、少数の波形パタ
ンを登録しておき、ＶＱにより、入力音声データをフレ
ーム波形辞書の番号と波形パタン番号の２つに符号化す
ることで、音質劣化を抑えようとする方法である。

【００２７】しかし、この方法では、フレーム波形辞書
に登録できる波形パタン数をクリアすることはできる
が、１サンプルデータを符号化するにあたり、コード番
号とコードブック番号という複数の符号データに変換し
なければならず、データ圧縮率が低下する。

【００２８】本発明は、ＶＱとアナログフラッシュメモ
リを組合わせるときに生じる上記問題点を解決し、符号
化効率を低下させることのない音声録音再生装置を提供
することを目的とする。

【００２９】

【課題を解決するための手段】そのために、請求項１の
発明に係る音声録音再生装置においては、コードブック
にコードパタンをパワー順にソートして登録しておき、
コードパタンの選択範囲の大きさ（アナログフラッシュ
メモリで記録できる値以下）を示す固定パラメータと、
この選択範囲のコードブック始端からのオフセット量を
示す変動パラメータを用意する。波形選択時には、現在
の選択範囲内にあるコードパタンの中から選択すると
し、この選択範囲は、先行フレームの符号化結果である
コード番号を元に、前記オフセット量を逐次更新するこ
とで最適位置にシフトして決定するように構成される。

【００３０】また、請求項２の発明に係る音声録音再生
装置においては、学習データをパワーの大きさに応じた
複数のサブクラスに分割した上でコードブックを作成
し、さらに各コードブックの上下端にはフラグを設定
し、また登録パタンの平均パワー順にコードブック番号
を割当てておく。波形選択時においては、カレントコー
ドブックに登録されているコードパタンの中から選択す
るとし、該カレントコードブックは、先行フレームのコ
ード番号が、該カレントコードブックに設定されたフラ
グを上回った／下回った場合に、コードブック番号を加
算／減算することで、後続フレームに最適なカレントコ
ードブックに切替えるように構成される。

【００３１】

【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照して詳細に説明する。＜第１の実施形態＞第１の実施形態においては、まず、
１枚のコードブックに大量のコードパタンをパワー順に
ソートした上で登録作成しておき、かつ、コードパタン
の選択範囲の大きさ（アナログフラッシュメモリで記録
できる値以下）を示す固定パラメータと、該選択範囲の
コードブック始端からのオフセット量を示す変動パラメ
ータを用意する。

【００３２】波形選択時においては、選択範囲内にある
コードパタンの中から選択するとし、該選択範囲は、先
行フレームの符号化結果であるコード番号を元に、前記
オフセット量を逐次更新することで最適位置にシフトす
る。これにより、アナログフラッシュメモリの制限内で
の符号化が行え、かつ、コード番号以外の符号量を使用
しないので、符号化効率を向上させることできる。

【００３３】＜構成＞図１は、第１の実施形態における
音声録音再生装置の構成図を示したものである。この実
施形態においては、エイリアジング防止のためのローパ
スフィルタ６００と、予め設定しておいた標本化周波数
に従い音声信号をサンプリングし、予め設定しておいた
フレーム長の連続するサンプルデータをフレーム波形と
して一時格納するためのフレーム波形格納部６０１と、
フレーム波形の標準パタンとしてコードパタンが大量に
登録されているコードブック格納部６０４と、前記フレ
ーム波形と前記コードブックに登録されているコードパ
タンの中から、前記フレーム波形に最も類似したコード
パタンを選択するための波形選択部６０２と、前記波形
選択部で選択されたコードパタンに対応するコード番号
を記録するためのアナログフラッシュメモリ６０３と、
先行フレームの符号結果を要因として、前記コードブッ
クにおける選択範囲を変更するためのコードパタン選択
範囲変更部６０５から構成されている。

【００３４】また、コードブック格納部は、非常に大量
のコードパタンが登録された１個のコードブックと選択
範囲のサイズＷと選択範囲のコードブック始端からのオ
フセット量Ｂを格納するためのバッファとで構成され
る。このコードブックは、Ｎ個のコード番号（デジタル
値）とＮ個のコードパタン（１個のコードパタンはＬ個
のデジタル値から成る）から構成されており、コード番
号とコードパタンは一対一に対応している。選択範囲の
サイズＷは、対象フレームを符号化するときの、コード
パタン検索可能範囲幅を示すパラメータであり、オフセ
ット量Ｂは、現在の選択範囲が、コードブックのどの位
置から開始するかを示すためのパラメータである。さら
に、コードブックに登録されているコードパタンは、予
めそのパワー順にソートされていて、内部コード番号
は、最小パワーのコードパタンを１とし、その他は、パ
ワーの順に１ずつ大きくなるよう割当てておく（図４参
照）。

【００３５】＜動作＞まず、録音時の動作について説明
する。（１）入力音声信号は、フレーム波形格納部６０１にお
いて、設定された時間間隔（標本化周波数の逆数）で、
サンプリングデータに変換される。（２）さらに、同フレーム波形格納部において、連続す
るサンプリングデータを、予め設定されているフレーム
長Ｌと同じ個数になるまでバッファリングし、Ｌ個に達
したらフレーム波形として、波形選択部６０２へ転送す
る。（３）波形選択部６０２は、コードブック格納部６０４
の中で、コードパタン選択範囲変更部により設定された
選択範囲中にある複数のコードパタンから、フレーム波
形に最も類似したコードパタンを選択し、そのコードパ
タンに割当てられたコード番号を取得する。（４）取得されたコード番号は、図示しないＤ／Ａ変換
器を介してそのコード番号に相当するアナログ値（電荷
量）に変換されてアナログフラッシュメモリ６０３へ書
込まれる。これにより、アナログフラッシュメモリにＬ
個分の音声サンプルデータが圧縮されて記録される。（５）波形選択部６０２は、後続コード用にコードパタ
ン選択範囲を更新するために、コード番号（デジタル
値）をコードパタン選択範囲変更部６０５へも転送す
る。（６）コードパタン選択範囲変更部６０５は、入力され
たコード番号を元に、コードパタン選択範囲を変更す
る。本処理ステップは、本実施形態における中心部分で
あるため、後で詳細な説明を行う。（７）上記（１）から（６）までの処理を、入力音声信
号が終るまで繰り返す。以上の処理で、録音が完了する。

【００３６】次に再生時の動作について説明する。（１）波形選択部６０２は、アナログフラッシュメモリ
６０３から第１フレーム目のコード番号を取得する。な
お、このコード番号は、アナログフラッシュメモリ上で
は、電荷の形（アナログ値）で記録されているため、こ
の電荷量に相当するデジタルのコード番号に変換した上
で取得する。（２）波形選択部６０２は、取得したコード番号が割当
てられたコードパタンを、コードブック格納部６０４か
ら取得する。ただし、コード番号は選択範囲内における
番号であるため、選択範囲のオフセット量と選択範囲幅
を使って、コードブック内における番号に変換した上で
取得する。（３）波形選択部６０２は、取得したコードパタンをフ
レーム波形として、フレーム波形格納部６０１へ送出す
る。（４）フレーム波形格納部６０１は、フレーム波形を、
予め設定された時間間隔でフレーム内部にある各データ
をローパスフィルタへ送出する。（５）音声データを滑らかにするためにローパスフィル
タ６００に通して、音声信号を出力する。以上（１）から（５）までの処理を、アナログフラッシ
ュメモリに記録した最後の符号データになるまで繰り返
す。以上が、再生時の処理手順である。

【００３７】以下、コードパタン選択範囲変更部の処理
の詳細について、図４と図５を用いて説明する。（１）コードブック格納部にあるオフセット量パラメー
タＢを初期値０に設定する（図４−、図５−１００
０）。（２）波形選択部６０２は、オフセット量Ｂを取得する
（図４−、図５−１００１）。（３）波形選択部６０２は、波形選択処理に必要となる
ループカウンタｋをＢ＋１に設定する（図５−１００
２）。（４）波形選択部６０２は、波形選択処理に必要となる
距離ｄ_minを初期化する（図５−１００３）。距離ｄ_min
は、複数あるコードパタンとフレーム波形との最小距離
を一時的に格納しておくためのバッファである。また、
図５においては初期値が無限大となっているが、実際に
は、取りうる距離値よりも十分に大きな値であればよ
い。（５）コードパタン（ベクトルＣ_k）とフレーム波形
（ベクトルｘ_t）との波形距離ｄ_kを次式により計算する
（図５−１００４）。ここでＬは、フレーム波形長であ
り、本実施形態においてはＬ＝４である。（６）計算した波形距離ｄ_kと最小距離ｄ_minを比較し、
ｄ_kの方が小さい場合は、最小距離ｄ_minを更新し、この
時のループカウンタｋをバッファｋ_minに設定する（図
５−１００５）。（７）ループカウンタｋをカウントアップし、（５）と
（６）の処理を繰り返し、カウンタｋが選択可能範囲の
上限値Ｂ＋Ｗに達したときループ終了とする。なお、本
実施形態ではＷ＝２５６である。（８）バッファｋ_minの値から、オフセット量Ｂを減算
し、これを選択波形のコード番号とする（図５−１００
６、また、（３）−（７）までの処理が図４−に相
当）。（９）求められたコード番号ｋ_minを図示しないＤ／Ａ
変換器によりアナログ値(電荷量）に変換してアナログ
フラッシュメモリへ書込む（図４−、図５−１００
７）。（１０）同コード番号ｋ_min（デジタル値）を選
択範囲変更部へ送出する（図４−）。（１１）コードパタン選択範囲変更部６０５において、
コードブック格納部６０４よりオフセット量Ｂを取得す
る（図４−、図５−１００８）。（１２）オフセット量Ｂをコード番号ｋ_minを用いて更
新する（図４−、図５−１００７）。（１３）（１２）の処理により、後続フレーム用の選択
範囲が、ｋ_min−Ｗ／２＋１だけシフトして更新され、
選択範囲が変更される。

【００３８】以上の処理フローにより、１フレーム毎に
先行フレームの結果を用いて、選択範囲を変更すること
ができる。

【００３９】次に、図２を用いて、本実施形態における
コードブックの作成手順について説明する。（１）ＬＢＧアルゴリズムを用いて、コードブックを作
成する（７００）。（２）作成したコードブックをソートする。具体的に
は、（３）〜（６）の処理で実現する。（３）ループカウンタｋを初期値１に設定する。（４）コードブックのコードパタン（ベクトルＣ_k）の
パワーＰ_kを計算し、バッファに格納する（７０１）。（５）ループカウンタｋをカウントアップし、コードパ
タン数ｎになるまで、（４）の処理を繰り返す。（６）コードパタンを計算したパワーＰ_k順にソートす
る（７０２）。

【００４０】以上説明したように、第１の実施形態によ
れば、予めコードブックをコードパタンのパワーによっ
てソートしておき、現在どの範囲を選択可能としている
かを示すための２つのパラメータ（選択範囲幅とオフセ
ット量）をコードブック格納部に設け、先行フレームの
符号化結果であるコード番号が、選択範囲の中心になる
ようにオフセットパラメータを更新させることで、先行
フレームのパワー周辺のコードパタンを、後続フレーム
用のコードブックとして用いることができるので、フレ
ーム波形選択範囲の自動切替えが可能となる。

【００４１】このフレーム波形選択範囲の自動切替えが
可能となったことにより、大量のコードパタンの中か
ら、対象フレームの符号化に必要なコードパタンを、効
率よく抽出することが可能となり、コスト増を抑えなが
ら、録音時間の長時間化が可能となる。

【００４２】＜第２の実施形態＞第２の実施形態におい
ては、まず、学習データをパワーの大きさに応じた複数
のサブクラスに分割した上でコードブックを作成し、さ
らに各コードブックの上下端にはフラグを設定し、また
登録パタンの平均パワー順にコードブック番号を割当て
ておく。波形選択時には、カレントコードブックに登録
されているコードパタンの中から選択し、このカレント
コードブックは、先行フレームのコード番号が、カレン
トコードブックに設定されたフラグを上回った／下回っ
た場合に、コードブック番号を加算／減算することで、
後続フレームに最適なカレントコードブックに切替え
る。これにより、これにより、アナログフラッシュメモ
リの制限内での符号化が行え、かつ、コード番号以外の
符号量を使用しないので、前述の問題点を解決できる。

【００４３】さらに、第２の実施形態においては、学習
データを複数のサブクラスに分割した上で、コードブッ
クを設計するため、パワーの小さな箇所にはサブクラス
をより多く割当て、パワーの大きな箇所にはサブクラス
を少なく割当てることが可能となるため、聴感上の音質
向上にも効果がある。

【００４４】＜構成＞図６は、第２の実施形態における
音声録音再生装置の構成図を示している。図示のよう
に、この実施形態においては、予め設定しておいた標本
化周波数に従ってエイリアジングを防止するためのロー
パスフィルタ１１００と、同標本化周波数に従って音声
信号をサンプリングし、予め設定しておいたフレーム長
の連続するサンプルデータをフレーム波形として一時格
納するためのフレーム波形格納部１１０１と、フレーム
波形の標準パタンを登録したコードブックが複数格納さ
れているコードブック格納部１１０４と、コードブック
に登録されているコードパタンの中から、フレーム波形
に最も類似したコードパタンを選択するための波形選択
部１１０２と、波形選択部で選択されたコードパタンに
対応するコード番号をアナログ値で記録するためのアナ
ログフラッシュメモリ１１０３と、先行フレームの符号
結果を元に、コードブック格納部１１０４の中から、後
続用のコードブックを選択するためのコードブック切替
え部１１０５から構成されている。

【００４５】コードブック格納部１１０４は、複数のコ
ードブックと切替え条件パラメータ格納部から構成され
ており、切替え条件パラメータ格納部には、現在使用中
のコードブック番号（以下カレントコードブック番号）
と、カレントコードブックの切替え条件パラメータが格
納される。さらに、各コードブックは、登録されるコー
ドパタンをパワー順にソートしてコード番号が割り当て
られ、コードブック番号Ｕｉと切替え条件パラメータＬ
ｉとが設定されている。このコードブック番号は、カレ
ントコードブック番号からコードブックを参照するため
のＩＤ番号であり、１番から順に、コードブック格納部
に格納された数まで割当てられる番号である。一方、切
替え条件パラメータは、カレントコードブック番号更新
のための判定パラメータである。具体的には、カレント
コードブックとなった時に、切替え条件パラメータ格納
部にロードされ、先行フレームのコード番号が、Ｕｉ以
上の場合は、カレントコードブック番号を１だけ加算
し、以下の場合は、１だけ減算するためのパラメータで
ある（図７参照）。また、第１の実施形態と同様に、こ
のコードブックは、Ｎ個のコード番号（デジタル値）と
Ｎ個のコードパタン（１個のコードパタンはＬ個のデジ
タル値から成る）から構成されており、コード番号とコ
ードパタンは一対一に対応している。

【００４６】＜動作＞まず、録音時の動作について説明
する。（１）入力音声信号は、エイリアジング防止のために設
けたローパスフィルタ１１００により、予め設定された
通過帯域だけが通過するように制限される。（２）フレーム波形格納部１１０１において、設定され
た時間間隔（標本化周波数の逆数）で、波形データをサ
ンプリングする。以下このデータをサンプルデータとす
る。（３）フレーム波形格納部１１０１において、連続する
サンプリングデータを、予め設定されているフレーム長
Ｌと同じ個数になるまでバッファリングする。Ｌ個に達
した時、フレーム波形として、波形選択部１１０２へ送
出される。（４）波形選択部１１０２は、コードブック格納部１１
０４の中で、コードブック切替え部１１０５により設定
されたカレントコードブックに登録されているコードパ
タンの中から、フレーム波形に最も類似したコードパタ
ンを選択し、このコードパタンに割当てられたコード番
号を取得する。（５）波形選択部１１０２は、取得したコード番号を図
示しないＤ／Ａ変換器によりアナログ値（電荷量）に変
換し、アナログフラッシュメモリ１１０３へ書込む。こ
れにより、アナログフラッシュメモリにＬ個分の音声サ
ンプルデータが圧縮されて記録されたことになる。（６）波形選択部１１０２は、後続コード用にコードブ
ックを変更するために、コード番号（デジタル値）をコ
ードブック切替部１１０５へも転送する。（７）コードブック切替部１１０５は、入力されたコー
ド番号を元に、コードブックを変更する。本処理ステッ
プは、本実施形態における中心箇所であるため、後で詳
細に説明する。（８）（１）から（７）までの処理を、入力音声信号が
終るまで繰り返す。以上の処理で、録音が完了する。

【００４７】次に再生時の動作について説明する。（１）波形選択部１１０２は、アナログフラッシュメモ
リ１１０３から第１フレーム目のコード番号を取得す
る。なお、このコード番号は、アナログフラッシュメモ
リ上では、電荷の形で記録されているため、図示しない
Ａ／Ｄ変換器を用いてこの電荷量に相当するデジタルの
コード番号に変換した上で取得する。（２）波形選択部１１０２は、取得したコード番号が割
当てられたコードパタンを、コードブック格納部のカレ
ントコードブックの中から取得する。（３）波形選択部１１０２は、取得したコードパタンを
フレーム波形として、フレーム波形格納部１１０１へ送
出する。（４）フレーム波形格納部１１０２は、フレーム波形
を、予め設定された時間間隔でフレーム内部の各データ
をローパスフィルタ１１００へ送出する。（５）音声データを滑らかにするためにローパスフィル
タに通して、音声信号を出力する。（６）（１）から（５）までの処理を、アナログフラッ
シュメモリに記録した最後の符号データになるまで繰り
返す。以上が、再生時の処理手順である。

【００４８】次に、図８を用いて、本実施形態における
コードブックの作成手順について説明する。コードブッ
クの作成手順は、大きく３段階に別れる。（第１段階）学習データの分割（第２段階）ＬＢＧアルゴリズムを用いたコードブック
の学習（第３段階）切替え条件パラメータの設定以下では、図８のフローチャートにしたがって、上記３
段階の作成手順について説明する。

【００４９】（第１段階）学習データの分割（１）第１の実施形態と同様に、実際の音声データＸ
を、学習データとして準備する（１３００）。（２）フレーム波形を１単位として、全フレーム波形
（ベクトルｘ_t）のパワーＰ_tを計算する（１３０１）。（３）学習データＸを、フレーム波形のパワーに応じて
Ｍ個の学習データに分割する。ただし、隣接する学習デ
ータ集合Ｘ_iとＸ_i+1は、要素に重複があるように分割す
る。具体的には、図９のように、学習データを、経験的
に設定した値を閾値として５分割し、学習データに含ま
れるフレーム波形のパワーが１４０１の範囲内であれ
ば、このフレーム波形をＸ₁に分類し、１４０２の範囲
であれば、フレーム波形をＸ₂に分類し、Ｘ₃からＸ₅に
ついても同様に分類する（１３０２）。

【００５０】（第２段階）ＬＢＧアルゴリズムを用いた
コードブックの学習（４）ＬＢＧアルゴリズムを用いて、Ｍ個の各学習デー
タを元にｃｏｄｅｂｏｏｋ_iを作成する。本実施形態で
は、図９のＸ₁からｃｏｄｅｂｏｏｋ₁を、Ｘ₂からｃｏ
ｄｅｂｏｏｋ₂を、Ｘ₃からｃｏｄｅｂｏｏｋ₃を、Ｘ₄か
らｃｏｄｅｂｏｏｋ₄を、Ｘ₅からｃｏｄｅｂｏｏｋ₅を
順に作成する。したがって、格納しているコードパタン
のパワー範囲が、コードブック番号の順に、大きくなっ
ていくことになる（１３０３）。（５）作成したコードブックに登録されたコードパタン
を、コードパタンのパワーをキーとしてソーティングす
る。パワーをキーとしたソート手順は、第１の実施形態
における方法と同様である（１３０４）。

【００５１】（第３段階）切替え条件パラメータの設定（５）最後に、コードブックｃｏｄｅｂｏｏｋ_iの切替
え条件パラメータＵ_iとＬ_iを設定する。具体的には、パ
ラメーＬ_iには、先行フレームのコード番号がパラメー
タＬ_i以下の場合に、コードブックｃｏｄｅｂｏｏｋ_iよ
りもｃｏｄｅｂｏｏｋ_i _ー ₁の方が量子化ノイズを抑える
ことができるという閾値を設定し、パラメータＵ_iに
は、先行フレームのコード番号が、Ｕ_i以上の場合、コ
ードブックｃｏｄｅｂｏｏｋ_iよりもｃｏｄｅｂｏｏｋ
_i+1の方が量子化ノイズを抑えることができるという閾
値を設定する。本実施形態においては、図７のように、
実際に作成されたコードブックのコードブックパタンと
パワーのヒストグラムを考慮して、経験的に設定した
（１３０５）。

【００５２】次に、本実施形態の中心部分である「コー
ドブック切り替え部」の処理について、図１０と図１１
を用いて詳細に説明する。まず、はじめに、コードブッ
ク格納部について説明する。現在使用中のコードブック
（以下、カレントコードブック）を自動的に切替えるよ
うにするため、該格納部には、以下のような構造上の工
夫がある。（１）コードブック格納部は、複数のコードブック（コ
ードパタンと内部コードパタン番号の組）と、カレント
コードブック番号Ｎと、カレントコードブックの切替え
番号Ｕ、Ｌを格納するためのバッファとで構成される。（２）コードブックに登録されている各コードパタン
は、前述した通り、予めそのパワー順にソートされてい
る。内部コード番号は、最小パワーのコードパタンを１
とし、その他は、パワーの順に１ずつ大きくなるよう割
当てておく。（３）各コードブックは、パワー順に並んでおり、コー
ドブックの上下端においては、隣接コードブックとパワ
ー空間上での重複がある。そして、その領域を切替え領
域として設定している。

【００５３】次に処理手順について説明する。（１）コードブック格納部にあるカレントコードブック
番号Ｎを初期値０に、切替え番号Ｕ、Ｌをカレントコー
ドブックの切替え番号Ｕ₀、Ｌ₀に設定する（図１０−
）。（２）波形選択部は１１０２、カレントコードブック番
号Ｎを取得する（図１０−、図１１−１５００）。（３）波形選択部１１０２は、波形選択処理に必要とな
る距離ｄ_minを初期化する（図１１−１５０１）。距離
ｄ_minは、複数あるコードパタンとフレーム波形との最
小距離を一時的に格納しておくためのバッファである。
図１１においては初期値を無限大としているが、実際に
は、取りうる距離値よりも十分に大きな値であればよ
い。（４）波形選択部１１０２は、波形選択処理に必要とな
るループカウンタｋを１に設定する（図１１−１５０
２）。（５）カレントコードブックのコードパタン（ベクトル
Ｃ_k）とフレーム波形（ベクトルｘ_t）との波形距離ｄ_k
を計算する（図１１−１５０３）。この波形距離ｄ
_kは、第１の実施形態と同様にユークリド距離で計算す
る。ここでＬは、フレーム波形長であり、本実施形態に
おいてはＬ＝４である。（６）計算した波形距離ｄ_kと最小距離ｄ_minを比較し、
ｄ_kの方が小さい場合は、最小距離ｄ_minを更新し、この
時のループカウンタｋをバッファｋ_minに設定する（図
１１−１５０４）。（７）ループカウンタｋをカウントアップし、（５）と
（６）の処理を繰り返し、カウンタｋがカレントコード
ブックのコードパタン数Ｗに達したときループ終了とす
る。なお、本実施形態ではＷ＝２５６である。（８）求められたコード番号ｋ_minをＤ／Ａ変換器によ
りアナログ値に変換してアナログフラッシュメモリへ書
込む（図１０−、図１１−１５０５）。（１０）コード番号ｋ_min（デジタル値）をコードブッ
ク切替え部へ送出する（図１０−）。（１１）コードブック切替部１１０５において、コード
ブック格納部１１０４よりカレントコードブック番号Ｎ
と上方向切替え番号Ｕと下方向切替え番号Ｌを取得する
（図１０−、図１１−１５０６）。（１２）先行フレームのコード番号ｋ_minと、取得した
下方向切替え番号Ｌの大小比較を行い、Ｌよりも小さい
コード番号である時、カレントコードブック番号Ｎを１
減じて、コードブック格納部へ設定する（図１０−、
図１１−１５０７）。（１３）先行フレームのコード番号ｋ_minと、取得した
上方向切替え番号Ｕの大小比較を行い、Ｕよりも大きい
コード番号である時、カレントコードブック番号Ｎに１
加えて、コードブック格納部へ設定する（図１０−、
図１１−１５０９）。（１４）（１２）、（１３）のどちらでもない場合は、
カレントコードブック番号の更新を行わない（図１１−
１５０８）。以上の処理により、１フレーム毎に先行フレームの符号
結果を参照して、コードブックを自動的に切り替えるこ
とができる。

【００５４】以上説明したように、第２の実施形態によ
れば、複数のコードブックをコードパタンのパワーによ
ってソートしておき、かつ、隣接するコードブック同士
は、一部分重複する領域を持たせ、これを切替え範囲と
設定し、この領域に先行フレームの符号結果が含まれる
場合は、隣接コードブックを後続フレーム用のコードブ
ックとすることで、コードブックの自動切替えが可能と
なる。

【００５５】そして、この自動切替えが可能となったこ
とにより、大量のコードパタンの中から、対象フレーム
の符号化に必要なコードパタンを、効率よく抽出するこ
とが出来、コスト増を抑えながら、録音時間の長時間化
が可能となる。

【００５６】さらに、第２の実施形態では、コードブッ
クを複数に分割することで、各コードブックの範疇を自
在に設計することができる。つまり、音の小さい箇所で
は、コードブックの学習範囲を小さくし、音の大きな箇
所では、コードブックの学習範囲を大きくすることがで
きる。これにより、聴感上ノイズが認識されやすい小さ
な箇所ほど、詳細に学習することができるので、コード
パタンを多く用意することができ、聴感上の音質が向上
するという効果がある。

【００５７】

【発明の効果】以上詳細に説明したように、第一の発明
によれば、予め設定した標本化周波数に基づいてサンプ
リングした音声信号をアナログフラッシュメモリに記録
する音声録音再生装置において、連続する複数個のサン
プルデータを１個のフレーム波形として格納するフレー
ム波形格納手段と、フレーム波形の標準パタンをパワー
順にソートし、ソートされた標準パタンとパタン番号の
組が登録されたコードブックと、フレーム波形をコード
ブックから選択するための選択範囲サイズと、選択範囲
のコードブック始端からのオフセット量とを格納してい
るコードブック格納手段と、コードブック格納手段に登
録されたコードパタンの中から、入力フレーム波形に最
も類似したコードパタンを選択する波形選択手段と、波
形選択手段で選択したコードパタンに対応するコード番
号をアナログ値に変換してアナログフラッシュメモリに
記録する手段と、先行フレームの符号化結果であるコー
ド番号に基づいて、前記選択範囲のオフセット量を逐次
更新するコードパタン選択範囲変更部と、を設けたの
で、フレーム波形選択範囲の自動切替えが可能となり、
コード番号以外の符号量を使用しないで済むようになる
ので符号化効率が大幅に向上する。また、フレーム波形
選択範囲の自動切替えが可能となったことにより、大量
のコードパタンの中から、対象フレームの符号化に必要
なコードパタンを、効率よく抽出することが可能とな
り、コスト増を抑えながら、録音時間の長時間化が可能
となる。

【００５８】また、第二の発明によれば、予め設定した
標本化周波数に基づいてサンプリングした音声信号をア
ナログフラッシュメモリに記録する音声録音再生装置に
おいて、連続する複数個のサンプルデータを１個のフレ
ーム波形として格納するフレーム波形格納部手段と、登
録されたパタンの平均パワーがその大きさの順にソート
されているフレーム波形の標準パタンを登録した複数の
コードブックと、現在使用中のコードブック番号とコー
ドブックの切替え条件パラメータとを格納しているコー
ドブック格納手段と、コードブック格納手段に登録され
たコードパタンの中から、入力フレーム波形に最も類似
したコードパタンを選択する波形選択手段と、波形選択
手段で選択したコードパタンに対応するコード番号をア
ナログ値に変換してアナログフラッシュメモリに記録す
る手段と、先行フレームの符号化結果であるコード番号
とコードブック切替え条件パラメータとを比較すること
によりコードブック番号を逐次更新するためのコードパ
タン選択範囲変更部と、を設けた構成としたので、コー
ドブックの自動切替えが可能となる。そして、この自動
切替えが可能となったことにより、大量のコードパタン
の中から、対象フレームの符号化に必要なコードパタン
を、効率よく抽出することが出来、コスト増を抑えなが
ら、録音時間の長時間化が可能となる。

【００５９】さらに、コードブックを複数に分割するこ
とで、各コードブックの範疇を自在に設計することがで
きる。つまり、音の小さい箇所では、コードブックの学
習範囲を小さくし、音の大きな箇所では、コードブック
の学習範囲を大きくすることができる。これにより、聴
感上ノイズが認識されやすい小さな箇所ほど、詳細に学
習することができるので、コードパタンを多く用意する
ことができ、聴感上の音質が向上するという効果があ
る。

【図面の簡単な説明】

【図１】第１の実施形態を示す全体構成図である。

【図２】第１の実施形態におけるコードブック作成手順
を示すフローチャートである。

【図３】第１の実施形態におけるコードブックの並べ替
えの一例を示す図である。

【図４】第１の実施形態におけるコードブックの構成と
選択範囲切り替え処理の概要を説明するための図であ
る。

【図５】第１の実施形態における波形選択およびコード
パタン選択範囲の切り替え処理手順を示すフローチャー
トである。

【図６】第２の実施形態を示す全体構成図である。

【図７】第２の実施形態におけるコードブックの構成を
示す図である。

【図８】第２の実施形態におけるコードブック作成手順
を示すフローチャートである。

【図９】第２の実施形態における学習データの分割例を
示す図である。

【図１０】第２の実施形態におけるコードブック切り替
え手順の概要説明図である。

【図１１】第２の実施形態における波形選択およびコー
ドブック切り替えフローチャートである。

【図１２】第１の従来技術を説明するための全体構成図
である。

【図１３】第１の従来技術における音声データの記録手
順の概略を説明する図である。

【図１４】第２の従来技術におけるベクトル量子化を用
いた符号化装置の構成図である。

【図１５】第２の従来技術におけるベクトル量子化によ
る音声データの圧縮を示す図である。

【図１６】従来技術におけるＬＢＧアルゴリズムのフロ
ーチャートである。

【符号の説明】

６００，１１００ローパスフィルタ６０１，１１０１フレーム波形格納部６０２，１１０２波形選択部６０３，１１０３アナログフラッシュメモリ６０４，１１０４コードブック格納部６０５選択範囲変更部１１０５コードブック切り替え部

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平11−305799（ＪＰ，Ａ) 特開平４−212999（ＪＰ，Ａ) 特開平３−211600（ＪＰ，Ａ) 特開平４−24699（ＪＰ，Ａ) 特開平３−33799（ＪＰ，Ａ) 特開平４−90217（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/00

Claims

(57)【特許請求の範囲】

【請求項１】予め設定した標本化周波数に基づいてサ
ンプリングした音声信号をアナログフラッシュメモリに
記録する音声録音再生装置において、連続する複数個のサンプルデータを１個のフレーム波形
として格納するフレーム波形格納手段と、フレーム波形の標準パタンをパワー順にソートし、ソー
トされた標準パタンとパタン番号の組が登録されたコー
ドブックと、フレーム波形をコードブックから選択する
ための選択範囲サイズと、選択範囲のコードブック始端
からのオフセット量とを格納しているコードブック格納
手段と、コードブック格納手段に登録されたコードパタンの中か
ら、入力フレーム波形に最も類似したコードパタンを選
択する波形選択手段と、波形選択手段で選択したコードパタンに対応するコード
番号をアナログ値に変換してアナログフラッシュメモリ
に記録する手段と、先行フレームの符号化結果であるコード番号に基づい
て、前記選択範囲のオフセット量を逐次更新するコード
パタン選択範囲変更部と、を設けたことを特徴とする音
声録音再生装置。
【請求項２】予め設定した標本化周波数に基づいてサ
ンプリングした音声信号をアナログフラッシュメモリに
記録する音声録音再生装置において、連続する複数個のサンプルデータを１個のフレーム波形
として格納するフレーム波形格納部手段と、登録されたパタンの平均パワーがその大きさの順にソー
トされているフレーム波形の標準パタンを登録した複数
のコードブックと、現在使用中のコードブック番号とコ
ードブックの切替え条件パラメータとを格納しているコ
ードブック格納手段と、コードブック格納手段に登録されたコードパタンの中か
ら、入力フレーム波形に最も類似したコードパタンを選
択する波形選択手段と、波形選択手段で選択したコードパタンに対応するコード
番号をアナログ値に変換してアナログフラッシュメモリ
に記録する手段と、先行フレームの符号化結果であるコード番号とコードブ
ック切替え条件パラメータとを比較することによりコー
ドブック番号を逐次更新するためのコードパタン選択範
囲変更部と、を設けたことを特徴とする音声録音再生装
置。