JPH09114497A - 音声記録再生装置 - Google Patents

音声記録再生装置

Info

Publication number
JPH09114497A
JPH09114497A JP7268303A JP26830395A JPH09114497A JP H09114497 A JPH09114497 A JP H09114497A JP 7268303 A JP7268303 A JP 7268303A JP 26830395 A JP26830395 A JP 26830395A JP H09114497 A JPH09114497 A JP H09114497A
Authority
JP
Japan
Prior art keywords
recording
audio
data
past
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7268303A
Other languages
English (en)
Inventor
Hideo Okano
秀生 岡野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP7268303A priority Critical patent/JPH09114497A/ja
Priority to US08/544,461 priority patent/US5809468A/en
Publication of JPH09114497A publication Critical patent/JPH09114497A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】音声の再生中に記録停止や編集等が行われた前
後の部分において異音等が発生せず良質な音声を再生で
きる音声記録再生装置を提供する。 【解決手段】過去の音声データと過去のパラメータのう
ちどちらか一方を用いて符号化パラメータの抽出を行な
い、抽出された符号化パラメータを用いて音声符号化を
行うDSP5と、少なくとも音声の記録が停止されたか
あるいは編集作業が行われたことを表す符号化初期化情
報C=“1”を記録する主制御回路6と、過去の復号化
音声データと過去のパラメータのいずれか一方を用い
て、復号化信号の予測を行なうDSP5と、音声の再生
時に、音声の記録が停止されたかあるいは編集作業が行
われたことを表す情報C=“1”を検出したときはDS
P5の適応コードブックの内容を初期化する主制御回路
6とを具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声記録再生装置に
関する。
【0002】
【従来の技術】近年、マイクロフォン等によって得られ
た音声信号をディジタル信号に変換して例えば半導体メ
モリに記録しておき、再生時において、半導体メモリか
らこの音声信号を読み出してアナログ信号に変換し、ス
ピーカ等により音声として出力する、いわゆるディジタ
ルレコーダと呼ばれている音声記録再生装置が知られて
いる。特開昭63−259700号公報はこのような音
声記録再生装置を開示している。
【0003】概して音声記録再生装置においては、半導
体メモリに記録されるデータ量を節約するために、ディ
ジタル化された音声信号に対して高能率な符号化を施す
ことによって発生するデータ量をできるだけ少なくして
いる。高能率な符号化のために広く用いられている手段
として、適応コードブックを備えたコード駆動線形予測
符号化方式がある。このコード駆動線形予測符号化方式
は4Kb/sから16Kb/s程度のビットレートを用
いた場合に比較的高音質な再生音声が得られることが知
られている。
【0004】
【発明が解決しようとする課題】上記した音声記録再生
装置において用いられる適応コードブックは過去の音源
信号を用いて作成されるが、使用者が一旦録音を停止
し、その後再度録音を行った場合や、挿入録音や音声の
一部切り取り等の編集作業を行った場合は、適応コード
ブックに記録される音声データの内容はその前後で無関
係になってしまう。これにより、上記のごとく録音され
た内容を連続的に再生した場合、録音停止や編集作業等
が行われた前後の部分において異音等が発生してしまう
という問題があった。
【0005】本発明の音声記録再生装置はこのような課
題に着目してなされたものであり、その目的とするとこ
ろは、音声の再生中に記録停止や編集等が行われた前後
の部分において異音等が発生せず良質な音声を再生でき
る音声記録再生装置を提供することにある。
【0006】
【課題を解決するための手段】上記の目的を達成するた
めに、第1の発明に係る音声記録再生装置は、過去の音
声データと過去のパラメータのうちどちらか一方を用い
て符号化パラメータの抽出を行う符号化パラメータ抽出
手段と、抽出された符号化パラメータを用いて音声符号
化を行う音声符号化手段と、少なくとも音声の記録が停
止されたかあるいは編集作業が行われたことを表す情報
を記録する記録手段と、過去の復号化音声データと過去
のパラメータのいずれか一方を用いて、復号化信号の予
測を行なう予測手段と、音声の再生時に、音声の記録が
停止されたかあるいは編集作業が行われたことを表す情
報を検出したときは予測手段の内容を初期化する初期化
手段とを具備する。
【0007】また、第2の発明に係る音声再生装置は、
過去の復号化した音声データと過去のパラメータのうち
どちらか一方を用いて復号化信号の予測を行う予測手段
と、予測された復号化信号を用いて音声復号化を行う復
号化手段と、少なくとも音声の記録が停止されたかある
いは編集作業が行なわれたことを表す情報に基づいて前
記予測手段の内容を初期化する初期化手段とを具備す
る。
【0008】また、第3の発明に係る音声記録再生装置
は、過去の駆動音源音声データが記録された第1の適応
コードブックを用いて符号化パラメータの抽出を行う符
号化パラメータ抽出手段と、抽出された符号化パラメー
タを用いて音声符号化を行う符号化手段と、音声の記録
が停止されたかあるいは編集作業が行われたことを表す
情報を記録する記録手段と、第2の適応コードブックに
記録された過去の復号化した駆動音源音声データを用い
て復号化信号の予測を行う予測手段と、予測された復号
化信号を用いて音声復号化を行う復号化手段と、音声の
再生時に、少なくとも音声の記録が停止されたかあるい
は編集作業が行われたことを表す情報を検出したときは
予測手段の内容を初期化する初期化手段とを具備する。
【0009】すなわち、第1の発明に係る音声記録再生
装置においては、過去の音声データと過去のパラメータ
のうちどちらか一方を用いて符号化パラメータの抽出を
行ない、抽出された符号化パラメータを用いて音声符号
化を行う。このとき、少なくとも音声の記録が停止され
たかあるいは編集作業が行われたことを表す情報を記録
しておく。そして、音声の再生時に、音声の記録が停止
されたかあるいは編集作業が行われたことを表す情報を
検出したときは、過去の復号化音声データと過去のパラ
メータのいずれか一方を用いて復号化信号の予測を行な
う予測手段の内容を初期化するようにする。
【0010】また、第2の発明に係る音声再生装置にお
いては、過去の復号化した音声データと過去のパラメー
タのうちどちらか一方を用いて予測手段によって復号化
信号の予測を行ない、予測された復号化信号を用いて音
声復号化を行う。このとき、少なくとも音声の記録が停
止されたかあるいは編集作業が行なわれたことを表す情
報に基づいて前記予測手段の内容を初期化するようにす
る。
【0011】また、第3の発明に係る音声記録再生装置
においては、過去の駆動音源音声データが記録された第
1の適応コードブックを用いて符号化パラメータの抽出
を行ない、抽出された符号化パラメータを用いて音声符
号化を行う。このとき、音声の記録が停止されたかある
いは編集作業が行われたことを表す情報を記録してお
く。次に、第2の適応コードブックに記録された過去の
復号化した駆動音源音声データを用いて予測手段によっ
て復号化信号の予測を行ない、予測された復号化信号を
用いて音声復号化を行う。この音声の再生時に、少なく
とも音声の記録が停止されたかあるいは編集作業が行わ
れたことを表す情報を検出したときは予測手段の内容を
初期化するようにする。
【0012】
【発明の実施の形態】以下、図面を参照して、本発明の
一実施形態を説明する。図1は本発明が適用される音声
記録再生装置の構成を示す図である。同図において、マ
イクロフォン1は増幅器(AMP)2、低域通過フィル
ター(LPF)、アナログ/ディジタル(A/D)変換
器4を介して、ディジタル信号処理部(以下DSPと呼
ぶ)5が内蔵された主制御回路6のD1端子に接続され
ている。この主制御回路6は、音声の圧縮及び伸長を行
なう圧縮伸長手段、入力信号が無音であるか有音である
かを判断する判断手段、時間軸圧縮手段、入力信号レベ
ルを検出又は予測する検出(予測)手段、条件付き時間
軸圧縮手段、高速で入力された信号を検出する検出手段
及びデータ処理手段としての機能を具備している。
【0013】また、スピーカ13は増幅器(AMP)1
2、ディジタル/アナログ(D/A)変換器11を介し
て主制御回路6のD2端子に接続されている。ここで、
上記したA/D変換器4とD/A変換器11とはCOD
ECを構成している。
【0014】主制御回路6のD3端子はメモリ制御回路
7に接続され、D4端子は当該音声記録再生装置に脱着
可能な半導体メモリ部10に接続されている。また、主
制御回路6のD5端子は発光ダイオード(LED)17
に接続されている。このLED17は半導体メモリ部1
0に記録されたデータを送信する送信手段であり、同時
に、外部からのデータを受信可能であることを示す出力
信号を出力する。LED17をデータの送受信のみに利
用するときは赤外発光ダイオードが使用されるが、録音
や再生時に有音が入力又は出力されると発光する表示器
としても兼用することができる。この場合、可視光成分
を多く含み、例えばピーク波長が500nm〜1000
nm、好ましくは600nm〜900nmの比較的低い
波長の赤外発光ダイオード等が用いられる。
【0015】主制御回路6のD6端子はスイッチ25に
接続されるとともに、D7端子は駆動回路9を介して表
示器8に接続されている。主制御回路6のD8端子は電
圧比較器(COMP)16を介してPINダイオード1
4と抵抗15との接続点に接続されている。ここで、P
INダイオード14、電圧比較器16、抵抗15はデー
タ受信手段またはデータ転送開始信号を受信する手段を
構成している。
【0016】主制御回路6のD9端子はDC−DCコン
バータ20に接続され、このDC−DCコンバータ20
はa接点とb接点との間で切り替え可能な主電源スイッ
チ19とリレー26との並列接続回路とを介して、電池
(BAT)18に接続されている。主制御回路6のD1
0端子はリレー26に接続されるとともに、D11端子
は主電源スイッチ19のa接点に接続されている。
【0017】ここでDC−DCコンバータ20は、電池
18から昇圧した電圧を出力して各手段に安定した電源
電圧を供給すると同時に、電池18の電圧が一定値以下
であるかどうかを表す信号をD9端子に送る。これによ
って主制御回路6は電池18の消耗状態を検出すること
ができる。主電源スイッチ19と並列にリレー26が接
続されているが、これは主電源スイッチ19がOFFに
されても電源がすぐに停止しないようにするためであ
り、かつ主電源スイッチ19がOFFされたことは主電
源スイッチ19がa接点側に切り替えられたときの電池
18の電圧を検出することによって行なっている。
【0018】主制御回路6のD12端子はダイオード2
1を介して、トランジスタ24と抵抗23とコンデンサ
22とに接続され、トランジスタ24はマイクロホン1
と増幅器2との接続点に接続されている。
【0019】さらに、主制御回路6には録音ボタン(R
EC)と、再生ボタン(PL)と、停止ボタン(ST)
と、早送りボタン(FF)と、早戻しボタン(REW)
と、I(Instruction )マークボタンIと、E(EN
D)マークボタンEと、音声起動(ボイスアクティブデ
ィテクタ)ボタンVAD等の操作ボタンが接続されてい
る。
【0020】また、図1に示すように、半導体メモリ1
0は一時記録媒体部100aと主記録媒体部100bと
から構成されている。主記録媒体部100bにはフラッ
シュメモリや光磁気ディスク、磁気ディスクや磁気テー
プなどが用いられる。また、一時記録媒体部100aに
はSRAMやDRAM、EEPROMや高誘電体メモリ
やフラッシュメモリなど、主記録媒体部100bと比較
して比較的高速で読み書きが行えるものが用いられる。
本実施形態では一時記録媒体部100aにはSRAMを
用い、主記録媒体部100bにはフラッシュメモリを用
いる。
【0021】図2は図1に示す半導体メモリ部10の記
録構成を示す図である。即ち、メモリ空間は、インデッ
クス部10Aと音声データ部10Bとに大きく二分され
ている。インデックス部10Aには、次の音声ファイル
データの先頭アドレス位置情報10A1と、音声ファイ
ルデータのサイズ情報10A2と、ファイルの消去用フ
ラグ情報10A3と、録音のファイル番号10A4と、
音声符号化方式の識別情報10A5と、ファイルの状態
を表すフラグ情報10A6と、編集(挿入)できるファ
イルの最大値数(n)10A7と、挿入されている音声
データまでの長さ情報10A8とが記録されている他
に、編集時の開始位置アドレス情報と、ファイルデータ
の先頭アドレス位置情報と、ファイルサイズ情報とが、
第1の編集の開始位置アドレス情報10A9と、第1の
編集のファイルデータの先頭アドレス位置情報10A1
0と、第1の編集のファイルサイズ情報10A11か
ら、最大挿入できる第nの編集の開始位置アドレス情報
10A12、最大挿入できる第nの編集のファイルデー
タの先頭アドレス情報10A13、最大挿入できる第n
の編集のファイルサイズ情報10A14まで記録されて
いる。
【0022】また、音声データ部10Bには、第1のフ
レームデータ10B1、第2のフレームデータ10B
2、…、第mのフレームデータ10Bmまでの音声符号
化データが記録されている。本実施形態では、この音声
符号化データ10Bの各フレームデータ10B1、10
B2、…、10Bmごとに、後述する適応コードブック
の内容を初期化するかどうかを表す符号化初期化情報C
を記録する。この符号化初期化情報Cの記録位置として
は、例えば各フレームデータの第1バイト目の最上位ビ
ットか又は最下位ビットに割り付けられる。あるいは各
フレームデータの最終バイト目の最上位ビットか又は最
下位ビットに割り付けられる。本実施形態では各フレー
ムデータの第1バイト目の第4ビットに符号化初期化情
報Cが割り付けられている。
【0023】なお、上記した半導体メモリ部10におい
て、音声情報の記録位置を示す情報は、本実施形態では
脱着自在な半導体メモリ部10に記録されているが、こ
の情報は記録再生装置のメモリ制御回路7に付随する不
図示の半導体メモリ(主制御部6の内部)に記録するよ
うにしても良い。
【0024】ここで、上記したIマークやEマークにつ
いて簡単に説明を加える。記録媒体には複数の文書が記
録されることから、この種の音声情報記録装置では、文
書録音者が録音時にIマークボタンIを操作することに
より、記録媒体に記録された複数文章間の優先関係を示
すために、インストラクション(I)マークと呼ばれる
インデックスマークを文書とともに記録することができ
る。これにより、記録された文書をタイプするタイピス
トや秘書等は、このIマークを参照することにより、文
書をタイプするときの優先関係を音声によって容易に知
ることができる。また、文書録音者はEマークボタンE
を操作することにより、複数文章間の区切りをタイピス
ト等に知らせることができる。
【0025】図3は図1に示すDSP5の構成において
符号化部の構成を示す図であり、図4はその復号化部の
構成を示す図である。図3は適応コードブックを備えた
コード駆動線形予測符号化装置のブロック図である。同
図において、適応コードブック135は乗算器132を
介して加算器130の第1入力端子に接続され、確率コ
ードブック136は乗算器133とスイッチ131とを
介して加算器130の第2入力端子に接続されている。
加算器130の出力端子は合成フィルタ125を介して
減算器126の第1入力端子に接続されるとともに、遅
延回路134を介して適応コードブック135に接続さ
れている。
【0026】また、入力端子121に接続されたバッフ
ァメモリ122はLPC分析器123を介して合成フィ
ルタ125に接続されるとともに、サブフレーム分割器
124を介して減算器126の第2入力端子に接続され
ている。減算器126の出力端子は聴感重み付けフィル
タ127を介して誤差評価器128の入力端子に接続さ
れている。この誤差評価器128の出力端子は適応コー
ドブック135と、乗算器132、133と、確率コー
ドブック136とに接続されている。
【0027】さらに、マルチプレクサ129はLPC分
析器123と誤差評価器128とに接続されている。上
記した符号化部は過去の駆動音源音声データが記録され
た適応コードブック135を用いて符号化パラメータの
抽出を行う符号化パラメータ抽出手段と、抽出された符
号化パラメータを用いて音声符号化を行う符号化手段
(確率コードブック136を含む)としての機能を有し
ている。
【0028】図4は、図3のコード駆動線形予測符号化
装置に対応する復号化装置のブロック図である。同図に
おいて、適応コードブック141は乗算器143を介し
て加算器145の第1入力端子に接続され、確率コード
ブック142は乗算器144とスイッチ148とを介し
て加算器145の第2入力端子に接続されている。加算
器145の出力端子は合成フィルタ146に接続される
とともに、遅延回路147を介して適応コードブック1
41に接続されている。さらに、デマルチプレクサ14
0は適応コードブック141と、確率コードブック14
2と、乗算器143、144と、合成フィルタ146と
に接続されている。
【0029】上記した復号化部は、適応コードブック1
41に記録された過去の復号化した駆動音源音声データ
を用いて復号化信号の予測を行う予測手段(適応コード
ブック141を含む)と、予測された復号化信号を用い
て音声復号化を行う復号化手段(確率コードブック14
2を含む)としての機能を有している。
【0030】以下に録音開始後、音声が半導体メモリ部
10に記録され、その後、再生されるまでの動作を説明
する。録音時、マイクロフォン1より得られるアナログ
音声信号をAMP2により増幅して、LFP3を通して
周波数の帯域制限を行った後、A/D変換器4によって
デジタル信号に変換して、主制御回路6の内部のDSP
5に入力する。
【0031】このとき、マイクロフォン1より入力され
た信号の大きさが検出され、検出値が定格値、例えばA
/D変換器4の最大レンジの−6dBよりも大きいとき
は、主制御回路6の第12端子に接続されているダイオ
ード21にパルスが出力されてコンデンサ22に電荷が
蓄積されトランジスタ24に電圧が加わる。すると増幅
器2とトランジスタ24とグラウンド間のインピーダン
スが変化して増幅器2に入力される信号が制限され、利
得調整が行われる。コンデンサ22に蓄えられた電荷は
抵抗23を介して徐々に放電される。
【0032】DSP5の符号化処理によって圧縮された
音声データはその後、主制御回路6の第3端子及び第4
端子を通じて半導体メモリ部10に記録される。再生時
においては、主制御回路6は半導体メモリ部10に記録
されている音声データを読み出してDSP5に供給す
る。DSP5の復号化処理によって伸長された音声デー
タはD/A変換器11によりアナログ信号に変換され、
増幅器12で増幅された後、スピーカ13から音声とし
て出力される。また、主制御回路6は駆動回路9を制御
して表示器8に現在の動作モードなどの各種情報を表示
させる。
【0033】以下に、DSP5による符号化処理を図3
を参照して詳細に説明する。図3において、入力端子1
21から、例えば8KHzでサンプリングされた原音声
信号を入力し、予め定められたフレーム間隔(例えば2
0ms、すなわち160サンプル)の音声信号をバッフ
ァメモリ122に格納する。バッファメモリ122はフ
レーム単位で原音声信号をLPC分析器123に送出す
る。
【0034】LPC分析器123は、原音声信号に対し
て線形予測(LPC)分析を行い、スペクトル特性を表
す線形予測パラメータαを抽出し、合成フィルタ125
およびマルチプレクサ129に送出する。サブフレーム
分割器124は、フレームの原音声信号を予め定められ
たサブフレーム間隔(例えば5ms、すなわち40サン
プル)に分割する。これによってフレームの原音声信号
から、第1サブフレームから第4サブフレームまでのサ
ブフレーム信号が作成される。
【0035】ここで、適応コードブック135の遅延L
とゲインβは、以下の処理によって決定される。まず、
先行サブフレームにおける合成フィルタ125の入力信
号すなわち駆動音源信号に、ピッチ周期に相当する遅延
を遅延回路134で与えて適応コードベクトルとして作
成する。例えば、想定するピッチ周期を40〜167サ
ンプルとすると、40〜167サンプル遅れの128種
類の信号が適応コードベクトルとして作成され、適応コ
ードブック135に格納される。このときスイッチ13
1は開いた状態となっている。したがって、各適応コー
ドベクトルは乗算器132でゲイン値が可変されて乗算
された後、加算器130を通過してそのまま合成フィル
タ125に入力される。合成フィルタ125はLPC分
析器123からの線形予測パラメータαを用いて合成処
理を行い、合成ベクトルを減算器126に送出する。
【0036】減算器126は原音声ベクトルと合成ベク
トルとの減算を行い、得られた誤差ベクトルを聴感重み
付けフィルタ127に送出する。聴感重み付けフィルタ
127は誤差ベクトルに対して聴感特性を考慮した重み
付け処理を行い、誤差評価器128に送出する。誤差評
価器128は誤差ベクトルの2乗平均を計算し、2乗平
均値が最小となる適応コードベクトルを検索して、その
遅れLとゲインβをマルチプレクサ129に送出する。
このようにして、適応コードブック135の遅延Lとゲ
インβが決定される。
【0037】次に、確率コードブック136のインデッ
クスiとゲインγは、以下の処理によって決定される。
確率コードブック136には、サブフレーム長に対応す
る次元数(すなわち40次元)の確率的信号ベクトルが
例えば512種類、予め格納されており、各々にインデ
ックスが付与されている。このときスイッチ131は閉
じた状態となっている。まず、前記処理によって決定さ
れた最適な適応コードベクトルを、乗算器133で最適
ゲインβを乗じたのち、加算器130に送出する次に、
乗算器133で各確率コードベクトルにゲイン値を可変
して乗じた後、加算器130に入力する。加算器130
は前記最適ゲインβを乗じた最適な適応コードベクトル
と各確率コードベクトルとの加算を行い、加算結果を合
成フィルタ125に入力する。
【0038】この後の処理は前記の適応コードブックの
パラメータの決定処理と同様に行われる。すなわち、合
成フィルタ125はLPC分析器123からの線形予測
パラメータαを用いて合成処理を行い、合成ベクトルを
減算器126に送出する。減算器126は原音声ベクト
ルと合成ベクトルとの減算を行い、得られた誤差ベクト
ルを聴感重み付けフィルタ127に送出する。聴感重み
付けフィルタ127は誤差ベクトルに対して聴感特性を
考慮した重み付け処理を行い、誤差評価器128に送出
する。誤差評価器128は誤差ベクトルの2乗平均を計
算し、その2乗平均値が最小となる確率コードベクトル
を検索して、そのインデックスiとゲインγをマルチプ
レクサ129に送出する。このようにして、確率コード
ブック136のインデックスiとゲインγが決定され
る。
【0039】マルチプレクサ129は、量子化された線
形予測パラメータα、適応コードブック135の遅れ
L、ゲインβ、確率コードブック136のインデックス
i、ゲインγの各々をマルチプレクスして図1に示すメ
モリ制御回路7を介して半導体メモリ部10に転送す
る。
【0040】次に、DSP5による復号化動作を図4を
参照して詳細に説明する。図4において、デマルチプレ
クサ140は受信した信号を線形予測パラメータα、適
応コードブック135の遅れL、ゲインβ、確率コード
ブック136のインデックスi、ゲインγに分解して、
分解された線形予測パラメータαを合成フィルタ146
に、遅れLとゲインβを各々適応コードブック141と
乗算器143に、インデックスiとゲインγを各々確率
コードブック142と乗算器144に出力する。
【0041】次に、デマルチプレクサ140から出力さ
れた適応コードブック141の遅れLに基づいて適応コ
ードブック141の適応コードベクトルを選択する。こ
こで適応コードブック141は符号化装置における適応
コードブック135の内容と同じ内容を有する。すなわ
ち、適応コードブック141には遅延回路147を介し
て過去の駆動音源信号が入力される。乗算器143は受
信したゲインβにより入力された適応コードベクトルを
増幅し、加算器145に送出する。
【0042】次に、デマルチプレクサ140から出力さ
れた確率コードブック142のインデックスiに基づい
て確率コードブック142のコードベクトルを選択す
る。ここで確率コードブック142は符号化装置におけ
る確率コードブック136の内容と同じ内容を有する。
乗算器144は受信したゲインγにより、入力された確
率コードベクトルを増幅し、加算器145に送出する。
加算器145は増幅された確率コードベクトルと増幅さ
れた適応コードベクトルとを加算して合成フィルタ14
6および遅延回路147に送出する。合成フィルタ14
6は受信した線形予測パラメータαを係数として合成処
理を行い、合成音声信号を出力する。
【0043】次に、上記した主制御回路6の全体的動作
を詳細に説明する。電池BATがセットされ、電源が供
給されると主制御回路6は、図5のフローチャートに示
すような動作を開始する。
【0044】即ち、まず、主制御回路6の外部条件や内
部の記憶部の初期設定を行う(ステップS1)。このと
き、主制御回路のD9端子には、電池18の電源電圧が
定格値この場合例えば1V以上であるかどうか、又は電
池18に流れる電流から電池18のインピーダンスが定
格値より高いかどうかの電池18の状態についての検出
信号がDC−DCコンバータ20から入力されている。
主制御部6は初期設定を完了した後、この検出信号に基
づいて電池18が使用できる容量をもっているか否か、
すなわち電源電圧が十分な大きさかどうかを検出する
(ステップS2)。検出の結果、電池18が使用可能な
状態にないことを検出したならば、当該音声録音再生装
置全体の電力供給を停止して電池18と各回路との間に
設けられている不図示のスイッチをOFFにして電池1
8の容量がないことを表す表示を駆動回路9を介して表
示器8にて行う。
【0045】また、ステップS2において、電池18が
使用可能な状態にあることを検出したならば、リレー2
6をONにして、その後スイッチ25又は停止ボタンS
Tと早送りボタンFFが同時に押されているか否かによ
ってデータ転送を行うか否かを判定する(ステップS
3)。ここでYESの場合はデータ転送処理に移行する
(ステップS23)。
【0046】また、ステップS3の判定がNOのとき
は、半導体メモリ部10のインデックス部10Aの情
報、即ち、操作開始位置情報10A1、操作終了位置情
報10A2、その他符号モードや操作条件等を読み込
む。
【0047】このとき、半導体メモリ部10に所定のイ
ンデックスが正常に記録されているかどうか、即ち、半
導体メモリ部10のフォーマットが正常かどうかを判断
する(ステップS4)。ここで、半導体メモリ部10に
フォーマットされていないデータが記録されているとき
は正常でないと判断され、その場合は半導体メモリ部1
0のインデックス部10Aに利用条件を示す情報を入力
し、且つ音声データ部10Bに“0”を入力する処理で
あるメモリーフォーマット(初期化)を行うかどうかを
確認する(ステップS5)。この場合は駆動回路9を制
御して、メモリーフォーマットを行うか否かの確認表示
を表示器8に行わせる。
【0048】ここで、メモリフォーマット処理を確認指
示するボタン(録音ボタンREC兼用)が押されたなら
ば、半導体メモリ部10のフォーマット(初期化)を行
い(ステップS6)、このフォーマットの完了後、駆動
回路9を制御して表示部8にて初期設定完了の表示を行
う(ステップS7)。
【0049】また、ステップS5でメモリーフォーマッ
トをしないことを確認指示するボタン(停止ボタンST
兼用)が押されたときには、駆動回路14を制御して表
示器15にて半導体メモリ部10が正常でないことを示
すエラー表示を行なうとともに(ステップS8)、半導
体メモリ部10を取り替えるべきである旨を指示表示す
る。
【0050】そして、当該音声録音再生装置全体に電力
を供給する為の電池BATと各回路との間に設けられた
不図示のスイッチをOFFにした後、半導体メモリ部1
0の交換のために、主電源スイッチ19がOFFされる
のを待ち(ステップS9)、それがOFFされたことを
検出すると、ステップS22に移行して電源スイッチを
OFFする。
【0051】一方、半導体メモリ部10の初期設定が正
常に完了したときは、初期設定完了表示後、インデック
ス部10Aから読み出した情報より現在の動作位置の検
出を行う(ステップS10)、その後、当該装置の操作
ボタンのどれかが押されたかどうかを検出しながら各回
路を待機状態にする(ステップS11)。
【0052】そして、いずれかの操作ボタンが押された
ことを検出すると、まず、操作されたのが録音ボタンR
ECがどうか検出し(ステップS12)、もし録音ボタ
ンRECが押されれば、DSP5を制御してA/D変換
器4から入力された音声データを圧縮し、メモリ制御回
路7を制御して半導体メモリ部10の音声データ部10
Bに記録する録音処理に入る(ステップS13)。
【0053】操作されたのが録音ボタンRECでないと
きには、次の再生ボタンPLの検出を行う(ステップS
14)。ここで、もし再生ボタンPLが押されていれ
ば、メモリ制御回路7を制御して半導体メモリ部10の
音声データ部10Bから記録されているデータを読み出
し、DSP5に送って伸長処理を行い、D/A変換器1
1に音声データを送る再生処理に入る(ステップS1
5)。
【0054】また、再生ボタンPLが押されていないと
きには、早送りボタンが押されているかどうかを判定す
べく早送りボタンFFの状態を検出する(ステップS1
6)。もし早送りボタンFFが押されていれば、動作位
置を順次適当な速度(例えば、再生の20倍速)で早送
りを行う早送り処理に入る(ステップS17)。
【0055】早送りボタンFFが押されていなければ、
早戻しボタンREWが押されているかどうかを判定すべ
く早戻しボタンREWの状態を検出する(ステップS1
8)。もし早戻しボタンREWが押されていれば、上記
早送りの場合と同様の速度で動作位置の移動を行う早戻
し処理に入る(ステップS19)。
【0056】上記ステップS13、S15、S17、S
19の各処理は停止ボタンSTが押されると、各処理か
らぬけて上記ステップS11に戻る。また、操作された
のが録音、再生、早送り、早戻し等のボタンでなけれ
ば、主電源スイッチ19のOFF又は各種の設定ボタン
の状態の検出を行う(ステップS20)。
【0057】主電源スイッチ19が電源OFFされた時
には、メモリ制御回路7を制御して半導体メモリ部10
のインデックス部10A内の情報を更新するため、主制
御回路6内部の不図示の記憶部に記憶してあるインデッ
クス情報を、半導体メモリ部10のインデックス部10
Aに転送して記録する(ステップS21)。このインデ
ックス転送処理が完了すると、当該装置全体に電源を供
給している電源スイッチをOFFにする(ステップS2
2)。
【0058】また、上記ステップS20において、主電
源スイッチ19がOFFでないと判断されたときには、
各種の設定ボタンの状態を検出して内部の記録部に記録
した後、上記ステップS11に戻る。なおここで、設定
ボタンは実際に当該装置に設けられたボタンではなく、
録音ボタンREC、再生ボタンPL、停止ボタンST、
早送りボタンFF、早戻しボタンREW、Iマークボタ
ンI、EマークボタンE、音声起動(無音圧縮)ボタン
VADのうち、幾つかの同時押しにより代用されるボタ
ンである。
【0059】次に、図5のステップS13における録音
処理の詳細を図6のフローチャートを参照して説明す
る。制御回路6は、録音ボタンRECが押されて録音モ
ードが設定されたことを検出すると(ステップS3
1)、前記した録音処理に移行し、まず、その時の録音
条件(例えば、音声起動、又は無音圧縮や音声圧縮レー
トの適応可変タイプ利用等)を検出する。本実施形態の
動作条件として、動作開始時に音声起動や無音圧縮を行
わない設定が行われていることが条件になる。この検出
された録音条件を表す信号を条件モード信号としてDS
P5へ送る(ステップS32)。そして、次の音声ファ
イルデータの先頭アドレス位置情報10A1と、音声フ
ァイルデータのサイズ情報10A2と、ファイルの消去
用フラグ情報10A3と、録音のファイル番号10A4
と、音声符号化方式の認識情報10A5と、ファイルの
状態を表すフラグ情報10A6と、編集(挿入)できる
ファイルの最大値数(n)10A7と、挿入されている
音声データまでの長さ情報10A8とが記録されるとと
もに、編集時の開始位置アドレス情報と、ファイルデー
タの先頭アドレス位置情報と、ファイルサイズ情報と
が、第1の編集の開始位置アドレス情報10A9、第1
の編集のファイルデータの先頭アドレス位置情報10A
10、第1の編集のファイルサイズ情報10A11か
ら、最大挿入できる第nの編集の開始位置アドレス情報
10A12、最大挿入できる第nの編集のファイルデー
タの先頭アドレス情報10A13、最大挿入できる第n
の編集のファイルサイズ情報10A14まで順に半導体
メモリ部10のインデックス部10Aに記録される。ま
た、音声データ部10Bには、第1のフレームデータ1
0B1、第2のフレームデータ10B2、第3のフレー
ムデータ10B3、…、第mのフレームデータ10Bm
が順に記録される。
【0060】次に主制御回路6の内部記憶部に記憶され
たメモリ管理アドレス情報(録音位置情報)を読み込ん
で設定する(ステップS33)。次に、無音時間を測定
するための無音期間のカウント値nを初期設定値0にし
て(ステップS34)、当該装置の切換え情報を表す値
VFを初期設定値0にする(ステップS35)。次に、
DSP5において圧縮符号化された音声データを主制御
回路6から半導体メモリ部10に転送する(ステップS
36)。本実施形態におけるDSP5は、上記したよう
に、コードブックを用いて励起(残差)信号をベクトル
量子化する符号励起線形予測符号化(CELP:Code E
xcited Linear Predictive Coding )のような分析合成
型の音声符号化方式を用いる。このCELP方式の音声
符号化は、所定の時間(例えば、20msec)内の入
力音声信号を1フレームとして扱い(例えば、サンプル
周波数が8KHzのとき160個のデータを1フレーム
のデータにする)、この1フレームの音声データを使っ
て次の各パラメータを導く。
【0061】すなわち、まず、線形予測係数(LPC)
(短期予測フィルター係数又は反射係数等)を計算し量
子化して出力する。そして、音源情報データとしていく
つかの音源情報の励起(残差)信号モデル(コードブッ
ク)の類似度を判定して、一番似ているモデルを見つけ
出す。その時の音源情報の励起(残差)信号モデルの番
号(インデックス)と利得情報を量子化して符号化を行
う。
【0062】この符号化の過程で1フレームの音声デー
タが無音か否かの判定を行なう(ステップS37)。無
音かどうかを検出する方法として、DSP5は1フレー
ムの音声データのエネルギー(各サンプルデータの2乗
総和)もしくは1フレーム内の最大値や音声信号と残差
信号との相互相関を算出するなどして無音かどうかを判
定し、無音は0で有音は1として符号化して出力する。
主制御回路6はDSP5から転送されたデータに基づい
てそのデータが無音かどうかを判定する。
【0063】そして、もし無音であれば無音周期カウン
ト値nに1を足し、カウントアップする(ステップS3
8)。もし無音でなければ無音周期カウント値nをリセ
ットして初期設定値0にする(ステップS39)。次に
無音が一定値以上経過したかどうかを判定するため、こ
の無音周期カウント値nが、例えば、判定値LIM=5
00(500フレーム無音が続くことを意味する。この
場合は10秒間無音が続いたものと判定する。)以上で
あるかどうかの判定を行う(ステップS40)。この判
定値LIMは5〜65535程度の範囲の値であり、好
ましくは100〜3000程度、特に150〜500程
度の値であることが望ましい。本実施形態では判定値L
IM=500を採用する。
【0064】そして、もし、判定値LIMが500以上
であれば切換え情報値VFに1加算する(ステップS4
1)。この切換え情報値VFが0の時は初期設定状態、
VFが1のときは音声起動(無音圧縮)モード、VFが
2以上で停止の状態に切り換える。判定値LIMの値は
無音が連続的に発生する場合、その発生頻度により可変
することもできる。例えば、切換え情報値VFが0のと
きに判定値LIMを500に設定し、切換え情報値VF
が1のときには判定値LIMを50に設定するなど、そ
れぞれ違う値に設定して使われることもある。このよう
な判定値LIMを可変にすることで、話者のしゃべり方
が無音を多く含むようなしゃべり方をする場合(例え
ば、考えながら口述記録を行う場合)には、記録媒体を
効率良く利用する録音モードに自動的に切り替わる操作
が行われる。
【0065】次に、この切換え情報値VFが0かどうか
を判定し(ステップS42)、もし切換え情報値VFが
0ならば、DSP5から転送された音声符号化データを
制御命令とともにメモリ制御回路7に出力し(ステップ
S43)、メモリ制御回路7によって符号化データが半
導体メモリ部10に記録される。次に、主制御回路6の
内部記憶部に記憶している動作位置情報を更新する(ス
テップS44)。更新する値は、インデックス部10A
の次の音声ファイルデータの先頭アドレス位置情報10
A1と音声ファイルデータのサイズ10A2である。
【0066】次に、停止(STOP)ボタンSTが押さ
れたかどうかを検出し(ステップS45)、押されてい
なければ上記ステップS36へ戻って上記動作を繰り返
す。また、停止ボタンSTが押されていれば、主制御回
路6の内部記憶部に記憶されている動作位置情報をイン
デックス部10Aに記録するとともに、再生時に適応コ
ードブック141の内容を初期化するために使用される
符号化初期化情報C=“1”を最後に符号化したフレー
ムの例えば図2の音声データ部10Bに記録する(ステ
ップS48)。そして録音処理を抜ける。このように、
主制御回路6は符号化初期化情報C=“1”を記録する
記録手段としての機能を有している。
【0067】また、ステップS42で切換え情報値VF
が0でないと判定され、ステップS46で切換え情報値
VFの値が1であればステップS45に移行する。ま
た、ステップS46で切換え情報値VFが1でないと判
定されると、主制御回路6の内部記憶部に記憶されてい
る動作位置情報を更新する(ステップS47)。そし
て、内部記憶部に記憶している動作位置情報をインデッ
クス部10Aに記録した後、ステップS48へ移行し
て、再生時に適応コードブック141の内容を初期化す
るために使用される符号化初期化情報C=“1”を最後
に符号化したフレームの例えば図2の音声データ部10
Bに記録してこの録音処理を抜ける。
【0068】以下に図5のステップS15における再生
処理の詳細を図7に示すフローチャートを参照して説明
する。まず、ステップS61において上記再生ボタンP
Lが押されていることを検出すると再生処理のサブルー
チンに移行する(音声再生モードの検出)。主制御回路
6はそのときの音声再生の条件(無音圧縮、スピード再
生、ノイズ除去等)を検出するとともに、読み出しブロ
ック数を計数するための内部カウンタをリセットする。
そしてこの検出された条件により音声再生の条件モード
を表す信号をDSP5に送る(ステップS62)。
【0069】その後、上記主制御回路6の内部記憶部に
記憶されている音声データの読み出し位置を算出してイ
ンデックス情報部10Aの動作位置情報により得て、駆
動回路9を制御してその動作位置情報を再生開始位置と
して表示部8に表示する(ステップS63)。そして、
半導体メモリ部10の音声データ部10Bから音声メッ
セージファイルの読み込みを行なうため、内部記憶部に
記憶している動作開始位置情報とインデックス情報部1
0Aより算出したアドレスをメモリ制御回路7に出力す
る(ステップS64)。これにより、半導体メモリ部1
0の音声データ部10Bより1ブロックの音声データ
(例えば、音声を20msのブロックに分けたデータ)
が主制御回路6に読み込まれる(ステップS65)。
【0070】ここで、早聞き処理を行なうかどうかを音
声起動ボタンVADの状態により設定されるモードを検
出して判断を行なう(ステップS66)。そして、早聞
きを行なう場合には、さらにもう1ブロック分の音声デ
ータを半導体メモリ部10から主制御回路6に読み込む
(ステップS67)。そして、時間圧縮処理を行なうか
どうかを判断し(ステップS68)、もし時間圧縮処理
を行なうモードでなければステップS69に移行する
が、時間圧縮処理を行なうモードであれば、時間軸圧縮
を行なう命令をDSP5へ出力して時間軸圧縮を行ない
(ステップS74)、その後ステップS69に移行す
る。
【0071】ステップS69では図2の音声データ部1
0Bの符号化初期化情報Cが“1”かどうかを判断し、
C=“1”ならば適応コードブック141の内容を初期
化する(ステップS70)。次に1フレーム分の音声デ
ータをDSP5へ転送する(ステップS71)。このよ
うに主制御回路6は適応コードブック141の内容を初
期化する初期化手段としての機能を有している。ここ
で、適応コードブック141の内容を初期化するとは、
適応コードブック141に“0”を書き込むことを意味
する。
【0072】そして、主制御回路6は、インデックス情
報部10Aのデータや内部記憶部に記憶されている再生
位置データにより次に再生すべき音声データの位置(動
作位置)情報を算出して、内部記憶部に記憶されている
再生位置情報を更新する(ステップS72)。その後、
停止(STOP)ボタンSTが押されているかどうかを
検出する(ステップS73)。ここで停止ボタンSTが
押されていれば再生処理を抜けるが、押されていないと
きはステップS64に戻って再生処理を継続する。
【0073】なお、上記した実施形態では停止(STO
P)ボタンSTが押されて録音が停止されたときに符号
化初期化情報C=“1”を記録するようにしたが、この
他に挿入録音や音声の一部切り取り等の編集作業を行っ
た場合にC=“1”を記録するようにしてもよい。
【0074】上記した実施形態によれば、録音停止や編
集作業等が行われた前後の部分については符号化音声デ
ータとともに符号化初期化情報C=“1”を記録してお
き、再生時にこの符号化初期化情報Cの状態に基づいて
適応コードブック141の内容を初期化するようにした
ので、音声の再生中に異音等が発生することがなく良質
な音声を再生できるようになる。
【0075】
【発明の効果】請求項1、2、3に記載の発明によれ
ば、音声の再生中に記録停止や編集等が行われた前後の
部分において異音等が発生せず良質な音声を再生できる
効果を奏する。
【図面の簡単な説明】
【図1】本実施形態に係る音声記録再生装置の構成を示
す図である。
【図2】図1に示す半導体メモリ部の記録構成を示す図
である。
【図3】DSPの符号化部の構成を示す図である。
【図4】DSPの復号化部の構成を示す図である。
【図5】主制御回路の全体的動作を説明するためのフロ
ーチャートである。
【図6】図5に示すフローチャートの録音処理の詳細を
説明するためのフローチャートである。
【図7】図5に示すフローチャートの再生処理の詳細を
説明するためのフローチャートである。
【符号の説明】
5…デジタル信号処理部(DSP)、6…主制御回路、
7…メモリ制御回路、10…半導体メモリ部、125、
146…合成フィルタ、135、141…適応コードブ
ック、136、142…確率コードブック。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 過去の音声データと過去のパラメータの
    うちどちらか一方を用いて符号化パラメータの抽出を行
    う符号化パラメータ抽出手段と、 抽出された符号化パラメータを用いて音声符号化を行う
    音声符号化手段と、 少なくとも音声の記録が停止されたかあるいは編集作業
    が行われたことを表す情報を記録する記録手段と、 過去の復号化音声データと過去のパラメータのいずれか
    一方を用いて、復号化信号の予測を行なう予測手段と、 音声の再生時に、音声の記録が停止されたかあるいは編
    集作業が行われたことを表す情報を検出したときは予測
    手段の内容を初期化する初期化手段と、 を具備したことを特徴とする音声記録再生装置。
  2. 【請求項2】 過去の復号化した音声データと過去のパ
    ラメータのうちどちらか一方を用いて復号化信号の予測
    を行う予測手段と、 予測された復号化信号を用いて音声復号化を行う復号化
    手段と、 少なくとも音声の記録が停止されたかあるいは編集作業
    が行なわれたことを表す情報に基づいて前記予測手段の
    内容を初期化する初期化手段と、 を具備したことを特徴とする音声再生装置。
  3. 【請求項3】 過去の駆動音源音声データが記録された
    第1の適応コードブックを用いて符号化パラメータの抽
    出を行う符号化パラメータ抽出手段と、 抽出された符号化パラメータを用いて音声符号化を行う
    符号化手段と、 音声の記録が停止されたかあるいは編集作業が行われた
    ことを表す情報を記録する記録手段と、 第2の適応コードブックに記録された過去の復号化した
    駆動音源音声データを用いて復号化信号の予測を行う予
    測手段と、 予測された復号化信号を用いて音声復号化を行う復号化
    手段と、 音声の再生時に、少なくとも音声の記録が停止されたか
    あるいは編集作業が行われたことを表す情報を検出した
    ときは予測手段の内容を初期化する初期化手段と、 を具備したことを特徴とする音声記録再生装置。
JP7268303A 1994-10-21 1995-10-17 音声記録再生装置 Withdrawn JPH09114497A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7268303A JPH09114497A (ja) 1995-10-17 1995-10-17 音声記録再生装置
US08/544,461 US5809468A (en) 1994-10-21 1995-10-18 Voice recording and reproducing apparatus having function for initializing contents of adaptive code book

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7268303A JPH09114497A (ja) 1995-10-17 1995-10-17 音声記録再生装置

Publications (1)

Publication Number Publication Date
JPH09114497A true JPH09114497A (ja) 1997-05-02

Family

ID=17456662

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7268303A Withdrawn JPH09114497A (ja) 1994-10-21 1995-10-17 音声記録再生装置

Country Status (1)

Country Link
JP (1) JPH09114497A (ja)

Similar Documents

Publication Publication Date Title
US6031915A (en) Voice start recording apparatus
JPH07325600A (ja) 携帯用録音再生装置,icメモリカ−ド記録フォ−マット,録音及び再生方法
JP2005518560A (ja) 音楽部分を自動で選り分けて格納するデジタル再生装置及びその方法
US6173265B1 (en) Voice recording and/or reproducing method and apparatus for reducing a deterioration of a voice signal due to a change over from one coding device to another coding device
JP2001053869A (ja) 音声蓄積装置及び音声符号化装置
JPH10116097A (ja) 音声再生装置
US5809468A (en) Voice recording and reproducing apparatus having function for initializing contents of adaptive code book
JPH09114497A (ja) 音声記録再生装置
JPH10124099A (ja) 音声記録装置
JP3727689B2 (ja) ディジタル音声記録再生装置
JPH0990994A (ja) 音声起動録音装置
JPH0962296A (ja) 音声記録装置および音声再生装置
JPH07271398A (ja) 音声記録装置
JPH09218694A (ja) 音声記録再生装置および音声記録再生システム
JPH103300A (ja) ディジタル音声記録再生装置
JPH0854895A (ja) 再生装置
JP2582762B2 (ja) 無音圧縮音声録音装置
JPH07271399A (ja) 録音モード切換え機能付き音声記録装置
JPH1152995A (ja) 音声再生装置
JPH0728384A (ja) 語学練習機
JPH06139289A (ja) 情報再生装置
JPH06332500A (ja) 可変速再生機能付音声再生装置
JPH07129198A (ja) 音声記録装置及び音声再生装置
JPH07160300A (ja) 音声記録装置及び音声再生装置
JPH11175100A (ja) 記録装置または再生装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030107