JP2861005B2 - 音声蓄積再生装置 - Google Patents
音声蓄積再生装置Info
- Publication number
- JP2861005B2 JP2861005B2 JP63307475A JP30747588A JP2861005B2 JP 2861005 B2 JP2861005 B2 JP 2861005B2 JP 63307475 A JP63307475 A JP 63307475A JP 30747588 A JP30747588 A JP 30747588A JP 2861005 B2 JP2861005 B2 JP 2861005B2
- Authority
- JP
- Japan
- Prior art keywords
- memory
- pitch
- waveform
- voice
- thinning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声機能付きワークステーションにおける
音声メモ、通信システムにおけるボイスメール等の音声
蓄積再生装置に関し、特に蓄積した音声を、音質を変え
ずに高速(2倍速以上の早口)再生可能な、使い勝手の
よい音声蓄積再生装置に関する。
音声メモ、通信システムにおけるボイスメール等の音声
蓄積再生装置に関し、特に蓄積した音声を、音質を変え
ずに高速(2倍速以上の早口)再生可能な、使い勝手の
よい音声蓄積再生装置に関する。
従来、蓄積した音声を高速に再生する装置あるいは手
法として、 (1)特開昭57−85099号に開示されている如く、サン
プリングクロックと出力クロックの比で、時間軸を変換
する装置 (2)特開昭59−75295号に開示されている如く、休止
区間の長さを調整することにより、音声の再生速度を変
える装置 (3)アイ・イー・イー・イー,トランザクション オ
ン アコースティクス,スピーチ アンド シグナル
プロセシング,エイ エス エス ピー27(1979年)第
121〜133頁(IEEE,Trans.Acoustics,Speech and Signal
Processing,ASSP−27(1979),pp.121−133)において
論じられている如く、音声のピッチ単位で波形を間引い
て出力する手法 等が知られている。
法として、 (1)特開昭57−85099号に開示されている如く、サン
プリングクロックと出力クロックの比で、時間軸を変換
する装置 (2)特開昭59−75295号に開示されている如く、休止
区間の長さを調整することにより、音声の再生速度を変
える装置 (3)アイ・イー・イー・イー,トランザクション オ
ン アコースティクス,スピーチ アンド シグナル
プロセシング,エイ エス エス ピー27(1979年)第
121〜133頁(IEEE,Trans.Acoustics,Speech and Signal
Processing,ASSP−27(1979),pp.121−133)において
論じられている如く、音声のピッチ単位で波形を間引い
て出力する手法 等が知られている。
上記従来技術には、それぞれ、下記の如き問題があっ
た。
た。
(1)は、音質について配慮がなされておらず、音声が
テープレコーダを早回し再生したように甲高い声に変化
して、話者の特徴が失なわれるという点 (2)は、音声のポーズを削除するため、発声内容が不
自然になるとともに、意味が不明確になるばかりでな
く、それほどの高速性能が得られないという点 (3)は、音質を変えずにある程度まで高速に再生でき
るので、音声メモ等の音声蓄積再生装置には好適な手法
であるが、未だ、2倍以上の高速再生の手法と装置化に
ついての配慮がなされておらず、2倍速以上の再生を実
現するには如何に間引いて行くかという点、また、フレ
ーム単位で音声を扱う音声蓄積再生装置に適用する場
合、如何に実時間で処理するかという点 に問題があった。
テープレコーダを早回し再生したように甲高い声に変化
して、話者の特徴が失なわれるという点 (2)は、音声のポーズを削除するため、発声内容が不
自然になるとともに、意味が不明確になるばかりでな
く、それほどの高速性能が得られないという点 (3)は、音質を変えずにある程度まで高速に再生でき
るので、音声メモ等の音声蓄積再生装置には好適な手法
であるが、未だ、2倍以上の高速再生の手法と装置化に
ついての配慮がなされておらず、2倍速以上の再生を実
現するには如何に間引いて行くかという点、また、フレ
ーム単位で音声を扱う音声蓄積再生装置に適用する場
合、如何に実時間で処理するかという点 に問題があった。
本発明は上記事情に鑑みてなされたもので、その目的
とするところは、従来の技術における上述の如き問題を
解消し、フレーム単位で音声を入力して、2倍速以上の
ピッチ単位の波形間引きを実時間で処理可能な、比較的
小型の音声蓄積再生装置を提供することにある。
とするところは、従来の技術における上述の如き問題を
解消し、フレーム単位で音声を入力して、2倍速以上の
ピッチ単位の波形間引きを実時間で処理可能な、比較的
小型の音声蓄積再生装置を提供することにある。
本発明の上述の目的は、ディジタル化された音声を蓄
積し、該ディジタル化音声を読み出して音声のピッチ単
位で波形を間引いて、ディジタル/アナログ変換回路を
介して音声出力する音声蓄積再生装置において、ピッチ
単位で波形を間引いた音声に対して、繰り返してピッチ
単位で波形を間引く処理を行う手段を設け間引かれた音
声を再生することによって達成される。
積し、該ディジタル化音声を読み出して音声のピッチ単
位で波形を間引いて、ディジタル/アナログ変換回路を
介して音声出力する音声蓄積再生装置において、ピッチ
単位で波形を間引いた音声に対して、繰り返してピッチ
単位で波形を間引く処理を行う手段を設け間引かれた音
声を再生することによって達成される。
さらに具体的構成として、ディジタル化された音声デ
ータを蓄える第1のメモリと、上記音声データの波形に
ピッチ単位で間引き処理を施して蓄える第2のメモリと
を有し、さらに、前記第1のメモリの音声と前記第2の
メモリの音声を選択して入力し、上記間引き処理を行い
前記第2のメモリに出力する間引き処理手段とを設けた
ことを特徴としている。
ータを蓄える第1のメモリと、上記音声データの波形に
ピッチ単位で間引き処理を施して蓄える第2のメモリと
を有し、さらに、前記第1のメモリの音声と前記第2の
メモリの音声を選択して入力し、上記間引き処理を行い
前記第2のメモリに出力する間引き処理手段とを設けた
ことを特徴としている。
本発明に係る音声蓄積再生装置においては、一旦ピッ
チ単位で波形を間引いた音声に対して、繰り返してピッ
チ単位で波形を間引くようにしたので、比較的小型で、
録音時間に対して短い再生時間(2倍速以上)で品質を
落さずに音声を出力することが可能になる。
チ単位で波形を間引いた音声に対して、繰り返してピッ
チ単位で波形を間引くようにしたので、比較的小型で、
録音時間に対して短い再生時間(2倍速以上)で品質を
落さずに音声を出力することが可能になる。
また、上述した如き第1のメモリ,第2のメモリ,間
引き処理手段の作用は次のようになる。前記第1のメモ
リには、符号化音声を復号した音声波形を蓄える。前記
間引き処理手段は、まず、前記第1のメモリから2ピッ
チ分の波形(vi1およびvi2、ここで、viは復号した音声
波形の1ピッチ分を表す)を入力して1ピッチ長に間引
き、前記第2のメモリに出力する(vo1、voは間引き後
の1ピッチ長の波形を表す)。これを第1段の間引きと
いう。
引き処理手段の作用は次のようになる。前記第1のメモ
リには、符号化音声を復号した音声波形を蓄える。前記
間引き処理手段は、まず、前記第1のメモリから2ピッ
チ分の波形(vi1およびvi2、ここで、viは復号した音声
波形の1ピッチ分を表す)を入力して1ピッチ長に間引
き、前記第2のメモリに出力する(vo1、voは間引き後
の1ピッチ長の波形を表す)。これを第1段の間引きと
いう。
次に、間引き処理手段は、前記第2のメモリからv
o1、また第1のメモリから次の1ピッチ長の波形vi3を
入力し、再び1ピッチ長に間引いて、第2のメモリの第
1段の間引きと同一の番地に書込む(vo1)。これを第
2段の間引きという。このように2段の間引きを行うこ
とによって、3ピッチ長の音声波形(vi1〜vi3)が1ピ
ッチ長の波形(vo1)に短縮され、録音時間に比べて1/3
の早口再生が可能になる。
o1、また第1のメモリから次の1ピッチ長の波形vi3を
入力し、再び1ピッチ長に間引いて、第2のメモリの第
1段の間引きと同一の番地に書込む(vo1)。これを第
2段の間引きという。このように2段の間引きを行うこ
とによって、3ピッチ長の音声波形(vi1〜vi3)が1ピ
ッチ長の波形(vo1)に短縮され、録音時間に比べて1/3
の早口再生が可能になる。
以下、本発明の実施例を図面に基づいて詳細に説明す
る。
る。
第1図は、本発明の一実施例を示す構成図である。図
において、1はマイク、2は増幅およびA/D変換回路、
3はCCITT G.721勧告に準拠したADPCMエンコーダ、M1は
マイク1から入力して増幅し、8KHzサンプリングでA/D
変換後、上記ADPCMエンコーダ3で32Kb/sに符号化した
音声を蓄積する、比較的大容量のメモリ、また、M2は1
フレーム分(例えば40msに相当する320サンプル点)の
符号化音声を蓄えるメモリ、4はフレーム単位で符号化
音声を音声波形に復号する、CCITT勧告に準拠したADPCM
デコーダ、M3は1フレーム前の間引き処理で残った音声
波形(Vzと言う)と、復号した1フレーム分の音声波形
(Vfと言う)を蓄えるメモリを示す(以下、VzとVfを総
称してVtと言う)。
において、1はマイク、2は増幅およびA/D変換回路、
3はCCITT G.721勧告に準拠したADPCMエンコーダ、M1は
マイク1から入力して増幅し、8KHzサンプリングでA/D
変換後、上記ADPCMエンコーダ3で32Kb/sに符号化した
音声を蓄積する、比較的大容量のメモリ、また、M2は1
フレーム分(例えば40msに相当する320サンプル点)の
符号化音声を蓄えるメモリ、4はフレーム単位で符号化
音声を音声波形に復号する、CCITT勧告に準拠したADPCM
デコーダ、M3は1フレーム前の間引き処理で残った音声
波形(Vzと言う)と、復号した1フレーム分の音声波形
(Vfと言う)を蓄えるメモリを示す(以下、VzとVfを総
称してVtと言う)。
MCUは、音声蓄積時にはADPCMエンコーダ3の出力をM1
に取込み、再生時には転送要求信号TREQが入力される度
に、M1にある符号化音声を1フレームずつM2に転送し
て、転送が終わるとADPCMデコーダ3を起動(FRUN)す
る、マイクロコンピュータを中心に構成される転送制御
回路である。PWRは、M3の音声波形Vfを読出してフレー
ムのパワ(電力)を計算し、パワが予め設定された閾値
以上のときは有声フレーム、閾値未満のときは無音また
は無声フレームであると判定(V/U判定)してフラグの
形態(VUF)で出力するパワ処理回路である。
に取込み、再生時には転送要求信号TREQが入力される度
に、M1にある符号化音声を1フレームずつM2に転送し
て、転送が終わるとADPCMデコーダ3を起動(FRUN)す
る、マイクロコンピュータを中心に構成される転送制御
回路である。PWRは、M3の音声波形Vfを読出してフレー
ムのパワ(電力)を計算し、パワが予め設定された閾値
以上のときは有声フレーム、閾値未満のときは無音また
は無声フレームであると判定(V/U判定)してフラグの
形態(VUF)で出力するパワ処理回路である。
また、PTHは、有声フレーム(VUF=1)のときはVfを
読出してフレームのピッチ(基本周波数:P)を計算して
出力し、VUF=0のときはPを予め決められた値,例え
ば、106(単位はサンプル点数)に設定して出力するピ
ッチ処理回路を示している。TDSは、M3から音声波形Vt
或いはM4から音声波形Voを読出してピッチ(P)単位で
波形を間引いて行き、間引いた波形を再びM4に書込むと
ともに、Vtの波形数がピッチの整数倍でないために間引
き処理できなかった残波形VzをM3の一定の番地に移動す
る間引き処理回路である。
読出してフレームのピッチ(基本周波数:P)を計算して
出力し、VUF=0のときはPを予め決められた値,例え
ば、106(単位はサンプル点数)に設定して出力するピ
ッチ処理回路を示している。TDSは、M3から音声波形Vt
或いはM4から音声波形Voを読出してピッチ(P)単位で
波形を間引いて行き、間引いた波形を再びM4に書込むと
ともに、Vtの波形数がピッチの整数倍でないために間引
き処理できなかった残波形VzをM3の一定の番地に移動す
る間引き処理回路である。
M4は間引き処理回路による書込み/読出しのアクセス
と、出力制御回路による読出しのアクセスが並行して可
能な2頁構成の出力波形メモリ、また、OCTは、M4のTDS
が書込み/読出しをしている頁とは別な頁から、サンプ
リング周期(8KHz)毎に出力波形Voutを読出してD/A変
換回路5に出力し、設定された数Noutの読出しが終了す
ると、TREQをMCUに出力するとともに、M4の頁を切替え
て出力波形を読出す出力制御回路である。
と、出力制御回路による読出しのアクセスが並行して可
能な2頁構成の出力波形メモリ、また、OCTは、M4のTDS
が書込み/読出しをしている頁とは別な頁から、サンプ
リング周期(8KHz)毎に出力波形Voutを読出してD/A変
換回路5に出力し、設定された数Noutの読出しが終了す
ると、TREQをMCUに出力するとともに、M4の頁を切替え
て出力波形を読出す出力制御回路である。
メモリの詳細な構成を、第2図(a)〜(d)に示
す。図中、M1〜M4は、それぞれ第1図と対応している。
す。図中、M1〜M4は、それぞれ第1図と対応している。
M1には1フレーム320サンプル点分のADPCM符号化音声
AVがフレーム順に(F=1,2,‥‥,N)蓄積されている。
符号化音声は、例えば、図(a)下段のように4サンプ
ル点分が1ワードにパックされているので、1フレーム
当り80ワードになる。M2には、(b)に示す如くM1から
転送された1フレーム分の符号化音声AV(F=i)の他
に、パワ処理回路PWRがV/U判定を行うために読出す閾値
PWRTH、ピッチ処理回路PTHがピッチ計算で使用する波形
の相関閾値PTTH、ピッチ探索範囲PTMIN、PTMAX、間引き
処理回路TDSが使用する間引き速度のパターンCPATが蓄
えられている。
AVがフレーム順に(F=1,2,‥‥,N)蓄積されている。
符号化音声は、例えば、図(a)下段のように4サンプ
ル点分が1ワードにパックされているので、1フレーム
当り80ワードになる。M2には、(b)に示す如くM1から
転送された1フレーム分の符号化音声AV(F=i)の他
に、パワ処理回路PWRがV/U判定を行うために読出す閾値
PWRTH、ピッチ処理回路PTHがピッチ計算で使用する波形
の相関閾値PTTH、ピッチ探索範囲PTMIN、PTMAX、間引き
処理回路TDSが使用する間引き速度のパターンCPATが蓄
えられている。
第2図(b)に示したCPATは、2.5倍速再生のための
値で、 Cpは1,1,0,1,0,1,1,0,1,0,‥‥ とピッチ毎に周期的に読出される(“1"のときに間引
く)。2倍速再生の場合、MCUが、 Ct=(0010) Cp=(10) と設定することにより Cpは1,0,1,0,… のように読出される。3倍速再生では、 Ct=(0011) Cp=(110) と設定し、 Cpは1,1,0,1,1,0,‥‥ のように読出される。
値で、 Cpは1,1,0,1,0,1,1,0,1,0,‥‥ とピッチ毎に周期的に読出される(“1"のときに間引
く)。2倍速再生の場合、MCUが、 Ct=(0010) Cp=(10) と設定することにより Cpは1,0,1,0,… のように読出される。3倍速再生では、 Ct=(0011) Cp=(110) と設定し、 Cpは1,1,0,1,1,0,‥‥ のように読出される。
間引き速度のパターンCPATは、上に示した如く、MCU
によってフレーム単位で設定することができる。
によってフレーム単位で設定することができる。
M3には第i−1フレームの間引き処理で残った残波形
Vz(F=i−1)が1番地からIz番地に、第iフレーム
の波形Vf(F=i)がIz+1番地からIz+320番地に蓄
えられている。残波形については、一般に1フレームの
サンプル数Nとn×P(Pはピッチに相当するサンプル
数、nは自然数)は等しくないので、 Iz=(Iz′+N)−n×P のサンプル点の波形Vzが、未処理で残る。ここに、Iz′
は1フレーム前の残波形数を示す。
Vz(F=i−1)が1番地からIz番地に、第iフレーム
の波形Vf(F=i)がIz+1番地からIz+320番地に蓄
えられている。残波形については、一般に1フレームの
サンプル数Nとn×P(Pはピッチに相当するサンプル
数、nは自然数)は等しくないので、 Iz=(Iz′+N)−n×P のサンプル点の波形Vzが、未処理で残る。ここに、Iz′
は1フレーム前の残波形数を示す。
M4は、間引き処理回路TDSと出力制御回路OCTが並行し
てアクセスできるように2頁で構成されたメモリであ
り、間引き処理をした出力波形Voが蓄えられる。TDSがM
4のある頁を書込み/読出しアクセスしているとき、OCT
は他方の頁に蓄えられている1フレーム前の間引き結果
Voutを読出して、D/A変換回路に送出する。
てアクセスできるように2頁で構成されたメモリであ
り、間引き処理をした出力波形Voが蓄えられる。TDSがM
4のある頁を書込み/読出しアクセスしているとき、OCT
は他方の頁に蓄えられている1フレーム前の間引き結果
Voutを読出して、D/A変換回路に送出する。
上述の如く構成された本実施例の動作を、以下第3図
〜第5図を用いて説明する。第3図は、装置全体の動作
をフローチャートで示したもの、第4図は、ピッチ単位
で波形を間引くTDSの動作の詳細を示したもの、第5図
は、全体の動作タイミングを示したものである。
〜第5図を用いて説明する。第3図は、装置全体の動作
をフローチャートで示したもの、第4図は、ピッチ単位
で波形を間引くTDSの動作の詳細を示したもの、第5図
は、全体の動作タイミングを示したものである。
第3図において、PLAYは蓄積した音声の再生を開始す
る入口を示す。まず、転送制御回路MCUは、残波形数Iz
を0にして、M1からM2に第1フレームの符号化音声(AV
(F=1)),間引き速度のパターンCPAT等を転送し、
信号FRUNによりADPCMデコーダ4を起動する。該デコー
ダ4は、M2の符号化音声を読出して、音声波形(Vf(F
=1))に復号し、VfをM3に書込む。デコードが終了す
ると、パワ処理回路PWRが、M3から音声波形(Vf)を読
出して、パワを計算し、有声/無声の判定をする(VU
F)。次に、ピッチ処理回路PTHは、フレームが有声(VU
F=1)のときにはピッチ(P)を計算し、無音,無声
のときにはPを106に設定する。
る入口を示す。まず、転送制御回路MCUは、残波形数Iz
を0にして、M1からM2に第1フレームの符号化音声(AV
(F=1)),間引き速度のパターンCPAT等を転送し、
信号FRUNによりADPCMデコーダ4を起動する。該デコー
ダ4は、M2の符号化音声を読出して、音声波形(Vf(F
=1))に復号し、VfをM3に書込む。デコードが終了す
ると、パワ処理回路PWRが、M3から音声波形(Vf)を読
出して、パワを計算し、有声/無声の判定をする(VU
F)。次に、ピッチ処理回路PTHは、フレームが有声(VU
F=1)のときにはピッチ(P)を計算し、無音,無声
のときにはPを106に設定する。
間引き処理回路TDSは、Vt(Iz点のVzと320点のVf)を
処理の対象にするので、図中のステップTDS1で残波形数
をIz+320に設定する。(第1フレームでは残波形数は
0なので、ここでIz=320に設定される。) 続いて、間引き処理回路TDSは、間引き速度のパター
ンCpに応じて、ピッチP単位にIz点の音声波形Vtの間引
きを行う。これを第4図を用いて詳細に説明する。
処理の対象にするので、図中のステップTDS1で残波形数
をIz+320に設定する。(第1フレームでは残波形数は
0なので、ここでIz=320に設定される。) 続いて、間引き処理回路TDSは、間引き速度のパター
ンCpに応じて、ピッチP単位にIz点の音声波形Vtの間引
きを行う。これを第4図を用いて詳細に説明する。
第4図は、2.5倍速再生(Cp=1,1,0,1,0,1,1,0,1,0,
…‥‥の繰返し),第1フレームのピッチP1=58(単位
はサンプル点数、周波数単位では138Hz),第2フレー
ムのピッチP2=65(123Hz)としたときの間引きの動作
例を示す。
…‥‥の繰返し),第1フレームのピッチP1=58(単位
はサンプル点数、周波数単位では138Hz),第2フレー
ムのピッチP2=65(123Hz)としたときの間引きの動作
例を示す。
(1)第1フレームではIz=320を初期値にして、間引
きを開始する。まず、Cp=1(この場合は、第1番目の
1)でIz≧2P1なのでVtをピッチ単位に間引く。すなわ
ち、M3の1〜2P1番地から2P1点の波形Vtを読出して、そ
れぞれの波形に図示した窓関数Wを乗じた後、左半分の
1ピッチ分の波形と、P1だけ隔たった右半分の1ピッチ
分の波形を加算して出力波形Voを得、M4の1〜P1番地に
格納する。これを式で示せば、 となり、2ピッチ分のVtが1ピッチ長のVoに間引かれ
る。間引いた後は、 Iz=Iz−2P1 =320−116=204 に残波形数を更新し、CpとしてM2から次のパターンを読
出しておく。以上が第3図のステップTDS2の説明であ
る。
きを開始する。まず、Cp=1(この場合は、第1番目の
1)でIz≧2P1なのでVtをピッチ単位に間引く。すなわ
ち、M3の1〜2P1番地から2P1点の波形Vtを読出して、そ
れぞれの波形に図示した窓関数Wを乗じた後、左半分の
1ピッチ分の波形と、P1だけ隔たった右半分の1ピッチ
分の波形を加算して出力波形Voを得、M4の1〜P1番地に
格納する。これを式で示せば、 となり、2ピッチ分のVtが1ピッチ長のVoに間引かれ
る。間引いた後は、 Iz=Iz−2P1 =320−116=204 に残波形数を更新し、CpとしてM2から次のパターンを読
出しておく。以上が第3図のステップTDS2の説明であ
る。
(2)次に、Cp=1(この場合は、第2番目の1)でIz
≧P1なので、ステップTDS3で示される第2段目の間引き
を行う。M4の1〜P1番地からP1点の波形(すなわち、前
記Vo)を、M3の2P1+1〜3P1番地からP1点の波形を読出
して、それぞれの波形に窓関数Wを乗じた後、加算して
出力波形Voを得、再びM4の1〜P1番地に格納する。これ
を式で示せば、 となる。間引いた後は、 Iz=Iz−P1 =204−58=146 に残波形数を更新し、CpとしてM2からピッチに対応し
て、次の次のパターンを読出しておく。以上が第3図の
ステップTDS3の説明である。
≧P1なので、ステップTDS3で示される第2段目の間引き
を行う。M4の1〜P1番地からP1点の波形(すなわち、前
記Vo)を、M3の2P1+1〜3P1番地からP1点の波形を読出
して、それぞれの波形に窓関数Wを乗じた後、加算して
出力波形Voを得、再びM4の1〜P1番地に格納する。これ
を式で示せば、 となる。間引いた後は、 Iz=Iz−P1 =204−58=146 に残波形数を更新し、CpとしてM2からピッチに対応し
て、次の次のパターンを読出しておく。以上が第3図の
ステップTDS3の説明である。
上に示したように、(1)と(2)で3ピッチ分のVt
が1ピッチ長のVoに間引かれる。(2)を終了して第3
図のラベルtに戻る。
が1ピッチ長のVoに間引かれる。(2)を終了して第3
図のラベルtに戻る。
(3)Cp=1(この場合は、第3番目の1)でIz=146
≧2P1なので、再びステップTDS2を行う。すなわち、M3
の3P1+1〜5P1番地から2P1点の波形Vtを読出して、
(1)と同様にして出力波形Voを得、これをM4のP1+1
〜2P1番地に格納する。残波形数を Iz=Iz−2P1 =146−116=30 に更新し、CpとしてM2から次のパターンを読出してお
く。
≧2P1なので、再びステップTDS2を行う。すなわち、M3
の3P1+1〜5P1番地から2P1点の波形Vtを読出して、
(1)と同様にして出力波形Voを得、これをM4のP1+1
〜2P1番地に格納する。残波形数を Iz=Iz−2P1 =146−116=30 に更新し、CpとしてM2から次のパターンを読出してお
く。
(4)次に、Cp=0(ここでは、第2番目の0)なの
で、次のパターンを読出してラベルtに戻る。
で、次のパターンを読出してラベルtに戻る。
(5)Cp=1(第2周期目の第1番目の1)であるが、
Iz=30<P1なので、M3の5P1+1〜5P1+Iz番地の波形
を、残波形としてM3の1〜Iz番地に移動する。
Iz=30<P1なので、M3の5P1+1〜5P1+Iz番地の波形
を、残波形としてM3の1〜Iz番地に移動する。
(6)出力制御回路OCTは、M4の頁を切替えて第2フレ
ームの符号化音声転送要求信号TREQをMCUに出力し、第
1フレームの間引き処理を終了する(第3図ラベルfに
戻る)。
ームの符号化音声転送要求信号TREQをMCUに出力し、第
1フレームの間引き処理を終了する(第3図ラベルfに
戻る)。
このように、第1フレームでは320点の入力波形Vtを
ピッチ単位で間引いた結果、2ピッチ長(116点)の出
力波形Voutが得られる。なお、残波形数Izは30点であ
る。
ピッチ単位で間引いた結果、2ピッチ長(116点)の出
力波形Voutが得られる。なお、残波形数Izは30点であ
る。
第2フレームの符号化音声に対する処理は、ラベルf
から開始する。Iz=30なので、ステップTDS1で、 Iz=Iz+320=350 に設定される。なお、M3の1〜30番地には、第1フレー
ムの残波形Vz(F=1)が格納されており、また31〜35
0番地には、第2フレームの復号した音声波形Vf(F=
2)が格納されている。以下、TDSの動作は、第1フレ
ームと同様で、ピッチP2=65単位でVtを間引いて行く。
その結果、Voutは130点、Izは25点になる。
から開始する。Iz=30なので、ステップTDS1で、 Iz=Iz+320=350 に設定される。なお、M3の1〜30番地には、第1フレー
ムの残波形Vz(F=1)が格納されており、また31〜35
0番地には、第2フレームの復号した音声波形Vf(F=
2)が格納されている。以下、TDSの動作は、第1フレ
ームと同様で、ピッチP2=65単位でVtを間引いて行く。
その結果、Voutは130点、Izは25点になる。
以下、同様にして、MCUによるフレーム数管理の下
で、M1に蓄積された符号化音声の全フレームの処理が終
了すれば、第3図のSTOPに進んで、再生を終える。
で、M1に蓄積された符号化音声の全フレームの処理が終
了すれば、第3図のSTOPに進んで、再生を終える。
なお、第3図のステップTDS4は、Cp=0でIz≧Pのと
きは、間引かないで、1ピッチ分の波形をそのままM3
(Vt)からM4(Vo)に出力する動作を示している。この
ときには、Iz=Iz−Pに残波形数を更新して、次のCpを
M2から読出しておく。ステップTDS4は、例えば1.5倍速
再生(Cp=1,0,0,‥‥)で第2番目の0のときに動作す
る。
きは、間引かないで、1ピッチ分の波形をそのままM3
(Vt)からM4(Vo)に出力する動作を示している。この
ときには、Iz=Iz−Pに残波形数を更新して、次のCpを
M2から読出しておく。ステップTDS4は、例えば1.5倍速
再生(Cp=1,0,0,‥‥)で第2番目の0のときに動作す
る。
ステップTDS5は、Cp=1で、2P>Iz≧Pのときには、
1ピッチ分の波形を、そのままM3からM4に出力する動作
を示している。このときは、Iz=Iz−Pに残波形数を更
新して、次のCpをM2から読出しておく。ステップTDS5は
リアルタイム処理のために必要な動作で、例えば、P=
163(49Hz)でVt<326点なるフレームにおいて、出力波
形Voのサンプル数Noutが0点になることを回避する動作
を示している。
1ピッチ分の波形を、そのままM3からM4に出力する動作
を示している。このときは、Iz=Iz−Pに残波形数を更
新して、次のCpをM2から読出しておく。ステップTDS5は
リアルタイム処理のために必要な動作で、例えば、P=
163(49Hz)でVt<326点なるフレームにおいて、出力波
形Voのサンプル数Noutが0点になることを回避する動作
を示している。
ステップTDS6は、1フレーム分の波形を間引いた結
果、Noutが96点未満のときには、M4に書込まれたVoの最
終の1ピッチ分を2度繰返して出力することを示してい
る。これは、現状のハードウェア(例えば、ディジタル
・シグナルプロセッサ)を使用して、1フレームのADPC
Mデコード処理等に最低96サンプル時間(12m s)が必要
なためである。
果、Noutが96点未満のときには、M4に書込まれたVoの最
終の1ピッチ分を2度繰返して出力することを示してい
る。これは、現状のハードウェア(例えば、ディジタル
・シグナルプロセッサ)を使用して、1フレームのADPC
Mデコード処理等に最低96サンプル時間(12m s)が必要
なためである。
最後に、装置の動作タイミングを、第5図を用いて説
明する。出力制御回路OCTは、前述のデコーダ4,パワ処
理回路PWR,ピッチ処理回路PTHおよび間引き処理回路TDS
が、第iフレームの音声を処理して出力波形をM4のある
頁に書込んでいるとき、M4の別な頁から第i−1フレー
ムの音声を処理したNi−1点の出力波形Vout(F=i−
1)をサンプリング周期毎に読出して、D/A変換回路に
出力している。上記Ni−1は前述のNout(i−1)と同
じで、出力制御回路OCTにあるカウンタに、第i−1フ
レームの間引き処理が終了したときにロードされている
ものである。
明する。出力制御回路OCTは、前述のデコーダ4,パワ処
理回路PWR,ピッチ処理回路PTHおよび間引き処理回路TDS
が、第iフレームの音声を処理して出力波形をM4のある
頁に書込んでいるとき、M4の別な頁から第i−1フレー
ムの音声を処理したNi−1点の出力波形Vout(F=i−
1)をサンプリング周期毎に読出して、D/A変換回路に
出力している。上記Ni−1は前述のNout(i−1)と同
じで、出力制御回路OCTにあるカウンタに、第i−1フ
レームの間引き処理が終了したときにロードされている
ものである。
Ni−1点のD/A出力が終了すると、出力制御回路OCT
は、第i+1フレームの符号化音声をM2に転送する要求
TREQを、MCUに発生し、M4の読出し頁を切替えて、次の
サンプリングタイミングからはNi点のVout(F=i)の
D/A出力を開始する。
は、第i+1フレームの符号化音声をM2に転送する要求
TREQを、MCUに発生し、M4の読出し頁を切替えて、次の
サンプリングタイミングからはNi点のVout(F=i)の
D/A出力を開始する。
このように、本装置は、125×Ni(μsec)を区切りに
して、フレーム毎の音声をピッチ単位で間引き処理して
行く。
して、フレーム毎の音声をピッチ単位で間引き処理して
行く。
上記実施例においては、主として、蓄積した音声の再
生について説明したが、音声の蓄積については、マイク
から入力して増幅し、8KHzサンプリングでA/D変換後、A
DPCMエンコーダ3で32Kb/s(4ビット/サンプリング)
に符号化して比較的大容量のメモリM1に蓄積するわけ
で、従来と同様と考えて良い。
生について説明したが、音声の蓄積については、マイク
から入力して増幅し、8KHzサンプリングでA/D変換後、A
DPCMエンコーダ3で32Kb/s(4ビット/サンプリング)
に符号化して比較的大容量のメモリM1に蓄積するわけ
で、従来と同様と考えて良い。
上記実施例においては、音声の符号化方式としてCCIT
T G.721勧告に準拠したADPCM方式を用いた例を示した
が、これは、他の方式によっても良いことは言うまでも
ない。例えば、音声の符号化方式としてPARCOR方式を用
い、第1図のADPCMエンコーダをPARCOR分析器で、ま
た、デコーダ4をPARCOR合成器で構成して、PARCOR分析
では、1フレームの音声のスペクトルパラメータと、音
源情報としてV/Uフラグとピッチを計算する。この情報
を前記M1とM2に蓄える。この場合には、第1図のパワ処
理回路PWRおよびピッチ処理回路PTHは、M2に転送された
V/Uフラグおよびピッチを読出す回路となる。
T G.721勧告に準拠したADPCM方式を用いた例を示した
が、これは、他の方式によっても良いことは言うまでも
ない。例えば、音声の符号化方式としてPARCOR方式を用
い、第1図のADPCMエンコーダをPARCOR分析器で、ま
た、デコーダ4をPARCOR合成器で構成して、PARCOR分析
では、1フレームの音声のスペクトルパラメータと、音
源情報としてV/Uフラグとピッチを計算する。この情報
を前記M1とM2に蓄える。この場合には、第1図のパワ処
理回路PWRおよびピッチ処理回路PTHは、M2に転送された
V/Uフラグおよびピッチを読出す回路となる。
また、無声フレーム(子音など)に対しては、間引き
を行うと明瞭性が低下して音質が劣化する場合がある。
これを回避するために、間引き処理回路TDSは、無声フ
レームでは、間引きを行わずにM3の波形Vtをそのまま出
力波形としてM4に書込む回路としても良い。
を行うと明瞭性が低下して音質が劣化する場合がある。
これを回避するために、間引き処理回路TDSは、無声フ
レームでは、間引きを行わずにM3の波形Vtをそのまま出
力波形としてM4に書込む回路としても良い。
なお、話者により発声速度が異なるのを微調整するよ
うな場合にも、前述の間引き速度のパターンCPATを、MC
Uによってフレーム単位で設定することで、対処するこ
とができる。
うな場合にも、前述の間引き速度のパターンCPATを、MC
Uによってフレーム単位で設定することで、対処するこ
とができる。
以上述べた如く、本発明によれば、音声を符号化して
蓄積し、蓄積した符号化音声を読出して復号し、音声の
ピッチ単位で波形を間引いて、ディジタル/アナログ変
換回路を介して出力する、音声蓄積再生装置において、
一旦ピッチ単位で波形を間引いた音声に対して、繰返し
てピッチ単位で波形を間引く手段を設けたので、録音時
間に対して1/2以下の短時間で再生可能な、比較的小型
の音声蓄積再生装置を実現できるという効果を奏するも
のである。
蓄積し、蓄積した符号化音声を読出して復号し、音声の
ピッチ単位で波形を間引いて、ディジタル/アナログ変
換回路を介して出力する、音声蓄積再生装置において、
一旦ピッチ単位で波形を間引いた音声に対して、繰返し
てピッチ単位で波形を間引く手段を設けたので、録音時
間に対して1/2以下の短時間で再生可能な、比較的小型
の音声蓄積再生装置を実現できるという効果を奏するも
のである。
第1図は本発明の一実施例を示す構成図、第2図はメモ
リの詳細な構成を示す図、第3図は装置全体の動作を示
すフローチャート、第4図はピッチ単位で波形を間引く
TDSの動作の詳細を示す図、第5図は全体の動作タイミ
ングを示す図である。 M1:メモリ、M2:フレームメモリ、4:ADPCMデコーダ、M3:
波形メモリ、PWR:パワ処理回路、PTH:ピッチ処理回路、
TDS:間引き処理回路、M4:出力波形メモリ、OCT:出力制
御回路、MCU:転送制御回路。
リの詳細な構成を示す図、第3図は装置全体の動作を示
すフローチャート、第4図はピッチ単位で波形を間引く
TDSの動作の詳細を示す図、第5図は全体の動作タイミ
ングを示す図である。 M1:メモリ、M2:フレームメモリ、4:ADPCMデコーダ、M3:
波形メモリ、PWR:パワ処理回路、PTH:ピッチ処理回路、
TDS:間引き処理回路、M4:出力波形メモリ、OCT:出力制
御回路、MCU:転送制御回路。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平1−93795(JP,A) 特開 昭61−121094(JP,A) 特開 昭61−121095(JP,A) 特開 昭59−82608(JP,A) IEEE Trarsaction On Acoustics And S igual Processing V ol.ASSP−31 No.1 FEB 1983,pp.258−272 (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 9/18 JICST(JOIS)
Claims (6)
- 【請求項1】ディジタル化された音声を蓄積し、該ディ
ジタル化音声を読み出して音声のピッチ単位で波形を間
引いて、ディジタル/アナログ変換回路を介して音声出
力する音声蓄積再生装置において、 ピッチ単位で波形を間引いた音声に対して、繰返してピ
ッチ単位で波形を間引く処理を行う手段を設け間引かれ
た音声を再生することを特徴とする音声蓄積再生装置。 - 【請求項2】ディジタル化された音声データを蓄える第
1のメモリと、上記音声データの波形にピッチ単位で間
引き処理を施して蓄える第2のメモリとを有し、さら
に、前記第1のメモリの音声と前記第2のメモリの音声
を選択して入力し、上記間引き処理を行い前記第2のメ
モリに出力する間引き処理手段とを設けたことを特徴と
する音声蓄積再生装置。 - 【請求項3】上記第1のメモリは少なくともフレーム単
位の音声データと該音声データの圧縮率を示す間引きパ
ターンを有しており、上記間引き手段は、上記間引きパ
ターンに応じて前記第1のメモリの音声と前記第2のメ
モリの音声を選択して入力し、ピッチ単位で波形を間引
いて前記第2のメモリに出力し、また、間引きパターン
によっては、前記第1のメモリの音声をピッチ単位でそ
のまま前記第2のメモリに出力する間引き処理手段を設
けたことを特徴とする、請求項2記載の音声蓄積再生装
置。 - 【請求項4】1フレーム毎に、音声を符号化して蓄積
し、蓄積した符号化音声を読出して復号し、音声のピッ
チ単位で波形を間引いて、ディジタル/アナログ変換回
路を介して出力する音声蓄積再生装置において、 復号した1フレーム分の音声を蓄える第1のメモリと、
ピッチ単位で波形を間引いた音声を蓄える第2のメモリ
と、前記第1のメモリの音声と前記第2のメモリの音声
を選択して入力し、ピッチ単位で波形を間引いて前記第
2のメモリに出力し、前記第1のメモリ中の未処理の音
声数が所定の値以下になったときには前記第1のメモリ
の音声をピッチ単位でそのまま前記第2のメモリに出力
する間引き処理手段とを設けたことを特徴とする音声蓄
積再生装置。 - 【請求項5】1フレーム分の音声を処理した結果、前記
第2のメモリに出力された音声数が所定の値以下の場合
には、前記第2のメモリの音声をピッチ単位で繰り返し
て前記第2のメモリに付加する間引き処理手段を設けた
ことを特徴とする、請求項4記載の音声蓄積再生装置。 - 【請求項6】ディジタル化された音声データを蓄積する
第1のメモリと、上記第1のメモリからフレーム単位の
音声データを読みだして、該フレームを構成するピッチ
単位で該フレームの時間長を変化させる音声ピッチ処理
手段とを有する音声蓄積再生装置において、 上記音声ピッチ処理手段は隣接する複数のピッチから合
成されたピッチを作成し、上記複数のピッチのいずれか
に隣接している上記合成を受けていないピッチと、上記
合成ピッチとを連続するピッチとして出力することを特
徴とする音声蓄積再生装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63307475A JP2861005B2 (ja) | 1988-12-05 | 1988-12-05 | 音声蓄積再生装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63307475A JP2861005B2 (ja) | 1988-12-05 | 1988-12-05 | 音声蓄積再生装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02153396A JPH02153396A (ja) | 1990-06-13 |
JP2861005B2 true JP2861005B2 (ja) | 1999-02-24 |
Family
ID=17969528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63307475A Expired - Fee Related JP2861005B2 (ja) | 1988-12-05 | 1988-12-05 | 音声蓄積再生装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2861005B2 (ja) |
-
1988
- 1988-12-05 JP JP63307475A patent/JP2861005B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
IEEE Trarsaction On Acoustics And Sigual Processing Vol.ASSP−31 No.1 FEB 1983,pp.258−272 |
Also Published As
Publication number | Publication date |
---|---|
JPH02153396A (ja) | 1990-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0714089B1 (en) | Code-excited linear predictive coder and decoder, and method thereof | |
US4912768A (en) | Speech encoding process combining written and spoken message codes | |
EP0380572A4 (en) | Generating speech from digitally stored coarticulated speech segments | |
JPS623439B2 (ja) | ||
JP2000511651A (ja) | 記録されたオーディオ信号の非均一的時間スケール変更 | |
JP2001282278A (ja) | 音声情報処理装置及びその方法と記憶媒体 | |
JP2612868B2 (ja) | 音声の発声速度変換方法 | |
JP2861005B2 (ja) | 音声蓄積再生装置 | |
JP2860991B2 (ja) | 音声蓄積再生装置 | |
JP2865714B2 (ja) | 音声蓄積再生装置 | |
JPH03233500A (ja) | 音声合成方式およびこれに用いる装置 | |
JP3457393B2 (ja) | 話速変換方法 | |
JP3086458B2 (ja) | 音声合成装置 | |
JPH0854895A (ja) | 再生装置 | |
JP2709198B2 (ja) | 音声合成方法 | |
JPH08160991A (ja) | 音声素片作成方法および音声合成方法、装置 | |
JP3241582B2 (ja) | 韻律制御装置及び方法 | |
JP4648183B2 (ja) | 連続メディアデータ短縮再生方法、複合メディアデータ短縮再生方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP3083830B2 (ja) | 音声の発声時間長制御方法および装置 | |
JPH07210192A (ja) | 出力データ制御方法及び装置 | |
JPH04213500A (ja) | 音声の符号化方法及び装置 | |
JP2962777B2 (ja) | 音声信号の時間軸伸長圧縮装置 | |
JP2003271198A (ja) | 圧縮データ処理装置、方法および圧縮データ処理プログラム | |
JPH0376479B2 (ja) | ||
JPH0329999A (ja) | 音声蓄積再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |