JPS5849879B2 - 音声の情報圧縮記録再生方式 - Google Patents
音声の情報圧縮記録再生方式Info
- Publication number
- JPS5849879B2 JPS5849879B2 JP53075382A JP7538278A JPS5849879B2 JP S5849879 B2 JPS5849879 B2 JP S5849879B2 JP 53075382 A JP53075382 A JP 53075382A JP 7538278 A JP7538278 A JP 7538278A JP S5849879 B2 JPS5849879 B2 JP S5849879B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- waveform
- sound source
- audio
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Description
【発明の詳細な説明】
本発明は音声の情報圧縮伝送および記録方式の改良に関
するものである。
するものである。
音声の情報圧縮( low bit rate )伝送
または記録方式は、音声応答装置または画像応答装置用
の音声記録用、さらには音声情報の高能率伝送のための
手段として最近ますますその重要性が増大し、各地で研
究、実験が盛んに行なわれている。
または記録方式は、音声応答装置または画像応答装置用
の音声記録用、さらには音声情報の高能率伝送のための
手段として最近ますますその重要性が増大し、各地で研
究、実験が盛んに行なわれている。
その中で最も有望な方式の1つとして、音声波形の情報
を線形予測係数(以下LPCと略記)またはそれと等価
な偏自己相関係数(以下 PARCOR係数と略記)に変換し、その予測残差波形
から有声・無声の別(V/U)、有声音の場合その強度
Avとピッチ周期τ、無声音の場合その強度Auを音源
情報として抽出し、上記のLPC/PARCOR係数と
ともに記録または伝送する方式がよく知られている。
を線形予測係数(以下LPCと略記)またはそれと等価
な偏自己相関係数(以下 PARCOR係数と略記)に変換し、その予測残差波形
から有声・無声の別(V/U)、有声音の場合その強度
Avとピッチ周期τ、無声音の場合その強度Auを音源
情報として抽出し、上記のLPC/PARCOR係数と
ともに記録または伝送する方式がよく知られている。
いまその分析(情報抽出)の過程を説明的に第1図に示
す。
す。
これらの情報から音声波形を再生するには、第2図に説
明的に示すような方法による。
明的に示すような方法による。
この方式では、残差波形として抽出された音源波形を、
第1図もしくは第2図に示すV/Uの区別(Vは有声音
を、Uは無声音を意味する)、■のときはAvとτ、U
のときはAuという情報要素に分解して記録もしくは伝
送する。
第1図もしくは第2図に示すV/Uの区別(Vは有声音
を、Uは無声音を意味する)、■のときはAvとτ、U
のときはAuという情報要素に分解して記録もしくは伝
送する。
そのため大幅な情報圧縮が可能であり、約1.Okビッ
ト/秒から5kピット/秒に情報圧縮が可能である(情
報量の大小は再生音声に要求される音質の程度に左右さ
れる)。
ト/秒から5kピット/秒に情報圧縮が可能である(情
報量の大小は再生音声に要求される音質の程度に左右さ
れる)。
しかし一方この簡略化のため再生音声の品質には限度が
あり、電話機を使用する用途には十分実用できると思わ
れるが、画伶応答用の説明音声のようにTVの音声なみ
の音質が要求される用途にはなお音質の改善が必要であ
る。
あり、電話機を使用する用途には十分実用できると思わ
れるが、画伶応答用の説明音声のようにTVの音声なみ
の音質が要求される用途にはなお音質の改善が必要であ
る。
この改善の1つの可能性は残差波形として抽出される音
源波形を有効に利用することである。
源波形を有効に利用することである。
たしかに抽出された残差波形を合戒(再生)時の音源と
して直接そのまま使用すれば、原音声とほとんど変らな
い波形の音声を合成することができる。
して直接そのまま使用すれば、原音声とほとんど変らな
い波形の音声を合成することができる。
しかしこのためじ“は残差波形の符号化による記録/伝
送が必要であり、実験的な検討結果によれば、このため
には原音声波形の符号化とほとんど同じ情報量(ビソト
/秒)が必要である。
送が必要であり、実験的な検討結果によれば、このため
には原音声波形の符号化とほとんど同じ情報量(ビソト
/秒)が必要である。
残差音源波形の符号化を有効に行L・、その情報圧縮を
行うには2つの方向が考えられる。
行うには2つの方向が考えられる。
1つは、残差波形の波形の特徴からいって非線形量子化
によってビット数を有効に使用することであり、他の1
つは低域沢波器( LPF )によって周波数帯域を制
限してサンプリング周波数をさげ1秒当りの必要情報量
を低減することである。
によってビット数を有効に使用することであり、他の1
つは低域沢波器( LPF )によって周波数帯域を制
限してサンプリング周波数をさげ1秒当りの必要情報量
を低減することである。
前者については本質的な情報の損失はないが、後者につ
いては、第2図に説明的に示した音声再生(合成)系が
線形なシステムである限り音源に含まれない周波数成分
は合成によって生じることはない。
いては、第2図に説明的に示した音声再生(合成)系が
線形なシステムである限り音源に含まれない周波数成分
は合成によって生じることはない。
したがって音源としての残差波形を遮断周波数f。
HzでLPFすることは合成(再生)音声をfcでLP
FLたことと同じであり、当然情報の損失になる。
FLたことと同じであり、当然情報の損失になる。
本発明はこの後者の欠点を基底帯域(ベース・バンド)
の伝送とその非直線処理による高調波帯域の発生とによ
っておぎなおうとするものである。
の伝送とその非直線処理による高調波帯域の発生とによ
っておぎなおうとするものである。
以下その実施例を第3図のブロック図によって具体的に
説明する。
説明する。
音声波形1は前置増幅器2、低域沢波器3によって適当
に増幅、帯域制限されたのち、A/D変換器4によって
ディジタル信号に変換され、パラメータ分析装置5に加
えられる。
に増幅、帯域制限されたのち、A/D変換器4によって
ディジタル信号に変換され、パラメータ分析装置5に加
えられる。
A/D変換に当って音声信号の帯域制限周波数、S/N
比、ダイナミックレンジなどにより適切なサンプリング
周波数、ビツ}・数がえらばれることはいうまでもなL
)。
比、ダイナミックレンジなどにより適切なサンプリング
周波数、ビツ}・数がえらばれることはいうまでもなL
)。
たとえば画偉応答用の音声としてはサンプリング周波数
10〜20kHz, ビット数11〜14ビットにと
るのが普通である。
10〜20kHz, ビット数11〜14ビットにと
るのが普通である。
パラメータ分析装置はすでにのべたLPCまたはPAR
COR係数を抽出するものであり、PARCOR係数の
場合についてその1例を第4図に示す。
COR係数を抽出するものであり、PARCOR係数の
場合についてその1例を第4図に示す。
その結果、所望のパラメータが抽出され情報6として記
憶用のメモリー10に書きこまれる。
憶用のメモリー10に書きこまれる。
通常パラメータの抽出は30ミリ秒区間について行なわ
れ10ミリ秒毎にそのパラメータ値が情報として抽出さ
れる。
れ10ミリ秒毎にそのパラメータ値が情報として抽出さ
れる。
パラメータ抽出装置のもう1つの出力は残差波形7であ
り、これは低域p波器8によって帯域制限されたのち、
非線形符号化回路9によって、たとえば第5図にその特
性を示すような非線形符号化が行なわれるとともに、低
域沢波器8の遮断周波数に応じたサンプリング周波数で
間引きされる。
り、これは低域p波器8によって帯域制限されたのち、
非線形符号化回路9によって、たとえば第5図にその特
性を示すような非線形符号化が行なわれるとともに、低
域沢波器8の遮断周波数に応じたサンプリング周波数で
間引きされる。
そのためには入力の低域沢波器3の遮断周波数foと8
の遮断周波数f1との関係をf。
の遮断周波数f1との関係をf。
/ f 1 = n :正整数となるようにえらんでお
くと便利である。
くと便利である。
非線形量子化とサンプリング(間引き)ニヨって情報圧
縮された残差波形情報は、記憶用のメモリー10に書き
こまれる。
縮された残差波形情報は、記憶用のメモリー10に書き
こまれる。
結局記憶(または伝送)される情報は、たとえば10ミ
リ秒毎のパラメータ情報(ki)(i=i、〜p)と低
域沢波された残差波形{Z・}である。
リ秒毎のパラメータ情報(ki)(i=i、〜p)と低
域沢波された残差波形{Z・}である。
音声を再生(合成)するに当っては、まず11の残差波
形{Z・}がよみ出され、13から16の非線形処理回
路に力目えられる。
形{Z・}がよみ出され、13から16の非線形処理回
路に力目えられる。
この非線形処理回路はたとえば第k番目(k−2、・・
・・・・、n)のものが k {yj}k−{Zj }というk乗波形を作り出すよう
なものを考えればよい。
・・・・、n)のものが k {yj}k−{Zj }というk乗波形を作り出すよう
なものを考えればよい。
そp出力{yi}kは17から20の帯域沢波回路に加
えられる。
えられる。
この帯域沢波器の過渡帯域は、第k番目のもの(k−2
、・・・・・・、n)が この帯域沢波器群の出力は増幅と各チャネル間の時間お
くれ(位相差)を調整するためのちえん増幅回路21か
ら25をへて、加算回路26で加算され、音源波形を合
成する。
、・・・・・・、n)が この帯域沢波器群の出力は増幅と各チャネル間の時間お
くれ(位相差)を調整するためのちえん増幅回路21か
ら25をへて、加算回路26で加算され、音源波形を合
成する。
合成された音源は、合成装置27に加えられる。
一方、記憶メモリーから合成のためのパラメータ情報2
8が所定の時間間隔(分析時に設定された値、通常10
ミリ秒毎に)でこの装置に与えられ、波形合成が行なわ
れる。
8が所定の時間間隔(分析時に設定された値、通常10
ミリ秒毎に)でこの装置に与えられ、波形合成が行なわ
れる。
この合戒装置の1例をPARCOR係数の場合に第6図
に示す。
に示す。
合成された波形はD/A変換器29、低域沢波器30、
出力増幅器31をへてアナログ音声波形32として出力
される。
出力増幅器31をへてアナログ音声波形32として出力
される。
本方式による情報量の低減率を評価してみる。
原音声を、14ビツ}20 kHzサンプリングで直接
記憶もしくは伝送するとすれば その情報量は14X2
0X10”=280kビット/秒である。
記憶もしくは伝送するとすれば その情報量は14X2
0X10”=280kビット/秒である。
パラメータとして12次のPARCOR係数をとり、各
パラメータを8ビットで10ミリ秒毎に記憶するとすれ
ば 残差波形を7ビットの非線形量子化、 サンプリングで記憶するとすれは、 4 kHz 計 約38kビット/秒となる。
パラメータを8ビットで10ミリ秒毎に記憶するとすれ
ば 残差波形を7ビットの非線形量子化、 サンプリングで記憶するとすれは、 4 kHz 計 約38kビット/秒となる。
これは当初の280kビット/秒の約十になる。
また本方式によれば、音源波形は低域沢波されているが
、その成分を基本にして非直線処理によって高調波を発
生しているから、再生音声には高周波成分も含まれてお
り、また音源波形の低周波成分を直接伝送することによ
りピッチ抽出の必要もなく、しかもピッチ周期は正しく
伝送、再生される。
、その成分を基本にして非直線処理によって高調波を発
生しているから、再生音声には高周波成分も含まれてお
り、また音源波形の低周波成分を直接伝送することによ
りピッチ抽出の必要もなく、しかもピッチ周期は正しく
伝送、再生される。
その結果、情報圧縮にがかわらず高い音質の音声を再生
(合成)することができると期待される。
(合成)することができると期待される。
以上のべたように、本発明によれば音声波形の情報を情
報圧縮しながらかつ高い品質の音声を再生または伝送す
ることができる。
報圧縮しながらかつ高い品質の音声を再生または伝送す
ることができる。
第1図、第2図はパラメータ抽出方式による音声の分析
・合成方式の原理.図、第3図は本発明の実施例を示す
ブロック図、第4図はPARCOR係数分析装置、第5
図は音源波形符号化用の非線形量子化特性の1例、第6
図はPARCOR係数による音声合戒装置である。
・合成方式の原理.図、第3図は本発明の実施例を示す
ブロック図、第4図はPARCOR係数分析装置、第5
図は音源波形符号化用の非線形量子化特性の1例、第6
図はPARCOR係数による音声合戒装置である。
Claims (1)
- 1 音声波形情報をそのスペクトル特性を記述するパラ
メータと音源情報とに分離して情報圧縮して記録・再生
する方式において、音源波形を低域沢波によって情報低
減して直接記録し、再生に当ってはその低周波音源波形
より非直線処理によって高周波域音源成分を近似的に再
生し、低周波音源波形とともに合成音源として使用する
ことを特徴とする音声の情報圧縮記録再生方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP53075382A JPS5849879B2 (ja) | 1978-06-23 | 1978-06-23 | 音声の情報圧縮記録再生方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP53075382A JPS5849879B2 (ja) | 1978-06-23 | 1978-06-23 | 音声の情報圧縮記録再生方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS554004A JPS554004A (en) | 1980-01-12 |
JPS5849879B2 true JPS5849879B2 (ja) | 1983-11-07 |
Family
ID=13574577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP53075382A Expired JPS5849879B2 (ja) | 1978-06-23 | 1978-06-23 | 音声の情報圧縮記録再生方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5849879B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56106175A (en) * | 1980-01-28 | 1981-08-24 | Casio Comput Co Ltd | Miniature electronic apparatus with recording function |
-
1978
- 1978-06-23 JP JP53075382A patent/JPS5849879B2/ja not_active Expired
Also Published As
Publication number | Publication date |
---|---|
JPS554004A (en) | 1980-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2976860B2 (ja) | 再生装置 | |
JP2001142498A (ja) | ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体 | |
JPH06230800A (ja) | 音声データ圧縮及び再生の方法及び装置 | |
JP3630609B2 (ja) | 音声情報再生方法ならびに装置 | |
JPWO2005057550A1 (ja) | 音声圧縮伸張装置 | |
US5642463A (en) | Stereophonic voice recording and playback device | |
JPS5849879B2 (ja) | 音声の情報圧縮記録再生方式 | |
JPS642960B2 (ja) | ||
US20060069565A1 (en) | Compressed data processing apparatus and method and compressed data processing program | |
JP3424936B2 (ja) | 音声信号圧縮方法及び装置、並びにそれを用いた録音方法及び装置、並びに倍速再生装置 | |
JP2864508B2 (ja) | 波形データ圧縮符号化方法及び装置 | |
JPH0690638B2 (ja) | 音声分析方式 | |
JPH10285046A (ja) | 情報信号処理装置、情報信号記録装置及び情報信号再生装置 | |
KR100264389B1 (ko) | 키변환 기능을 갖는 컴퓨터 음악반주기 | |
KR0130875B1 (ko) | 펄스 코드 변조(pcm) 파형 오디오 및 엠팩(mpeg) 오디오 신호 재생장치 | |
JP2004029377A (ja) | 圧縮データ処理装置、方法および圧縮データ処理プログラム | |
JPH0344319B2 (ja) | ||
JPH0465398B2 (ja) | ||
JPS62159198A (ja) | 音声合成方式 | |
JPS5849878B2 (ja) | 音声の分析・合成方法 | |
JPH08163056A (ja) | 音声信号帯域圧縮伝送方式 | |
JPH04293100A (ja) | 固体記録素子を用いたデジタル録音再生装置 | |
JPS6098497A (ja) | 音響装置 | |
JPH1131000A (ja) | ボイスレコーダ | |
JPS5918718B2 (ja) | 音声分析・合成システム |