JPS5935040B2 - 音声デ−タの処理方法 - Google Patents

音声デ−タの処理方法

Info

Publication number
JPS5935040B2
JPS5935040B2 JP55093670A JP9367080A JPS5935040B2 JP S5935040 B2 JPS5935040 B2 JP S5935040B2 JP 55093670 A JP55093670 A JP 55093670A JP 9367080 A JP9367080 A JP 9367080A JP S5935040 B2 JPS5935040 B2 JP S5935040B2
Authority
JP
Japan
Prior art keywords
waveform
pitch
data
waveforms
envelope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55093670A
Other languages
English (en)
Other versions
JPS5717999A (en
Inventor
和勇 井上
建二 佐野
征二 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP55093670A priority Critical patent/JPS5935040B2/ja
Publication of JPS5717999A publication Critical patent/JPS5717999A/ja
Publication of JPS5935040B2 publication Critical patent/JPS5935040B2/ja
Expired legal-status Critical Current

Links

Landscapes

  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

【発明の詳細な説明】 本発明は音声データの圧縮及び該圧縮された信号から音
声信号を再生する音声データの処理方法に関するもので
ある。
近年音声合成技術が著しい発達をとげ、LSI技術の進
歩と相俟つて1チップの音声合成LSIが開発され各分
野にて利用されるようになつてきた。
このような1チップ音声合成LSIにおいてはメモリ容
量が限定され、この限定されたメモリ内にどれだけの語
を収納させることができるかが製品の優劣を左右する大
きな要因になつている。従つて音声合成技術においては
、音声波形を符号化し、この符号データをメモリに蓄え
、これをもとに音声を合成するに際して、符号化の過程
で、音声を再生したとき原音声の品質を損わず、できる
だけ少ないデータ量に符号化する技術、即ち圧縮技術が
必要となる。本発明は上記のような必要性に応え得る音
声データの処理方法、即ち音声波形を符号化して効率的
に圧縮する方法及び圧縮されたデータから音声を再生(
合成)する方法を提供する、以下に従来から提案されて
いる方法と比較しながら本発明を具体的に説明する。
第1図に音声「いつ」の波形の1部を示す。
この波形は18個のピッチ波形より構成されている。同
図より相隣り合うピッチ波形、例えばNO4とNO5、
NO9とNOIO、NO12とNO13等はその振巾の
大きさ、および周期等において若干の差はあるが、お互
いに良く似ている。従つてNO4とNO5において、N
O5はNO4の波形にておきかえ、同様NOIO、NO
13の波形はNO9とNO12の波形におきかえて再生
してもさほど音質が悪くならない。このときメモリーに
保有するデータ量はNO4とNO9とNO12の波形に
関するデータでよく、再生時はこれを2回くり返せばよ
い。従つてこの部分のデータ量は1/2に圧縮される。
以上の方法は「ピッチ周期の反復]と呼ばれ、従来技術
として特開昭52一122004号公報に公表されてい
る。しかしながらこの方法にて圧縮を行なうと、第1図
の波形図からも判るように各ピツチ波形の振巾が順次変
化していること及びピツチ周期も少しづつ変化している
ことより、繰り返し回数を多くとると、極端な品質の劣
化につながり、適用範囲に限度がある。本発明は、圧縮
率を高めると共に品質の劣化を少なくし、しかも多くの
くり返し回数が得られるよう考案されたものである。
上記第1図に示した音声波形を今一度観察すると、振巾
が増加するピツチ波形群NOl〜NO7、振巾が減少す
るピツチ波形群NO8〜NOl4に分けることができさ
らに増加する波形群の中で波形の類似性よりNOl〜2
,N03〜NO7の2群に区分することができる。
今NO3〜NO7の波形群において、この群で代表的と
思われるピツチ波形NO6を経験的或いは類似度の演算
処理等によつて選択する。次に波形群NO3〜NO7に
て、各ピツチ波形の最大値(又は最小値)を計算してこ
の最大値のエンベロープを直線にて近似する。この直線
の傾きをAとする。上記選択された代表的なピツチ波形
NO6の振巾値に上記傾きAの直線に沿つた定数をかけ
、即ち代表的ピツチ波形NO6を比例縮少して形成した
波形NO3の相当波形も作る。この近似波形をNO3/
とする。次にNO4,NO5,NO6,NO7の各波形
に対する近似波形NO4′,NO5/,NO6lNO7
′は上記NO3lの波形振巾をもとにし、その最大振巾
値が上記傾きAの直線に沿うよう算出された定数A4,
a5,a6,a7を乗算することにより形成することが
できる。従つて波形群NO3〜NO7の各波形は先頭の
ピツチ波形(ここでは、NO6の波形を比例縮少した近
似波形NO3l)を形成するための情報、及びNO4/
〜NOUを作るための係数値A4,a5,a6,a7に
より音声データとして形成することができる。その他の
波形群NOl〜2,N08〜NOl4についても同様の
過程によつて圧縮されたデータが形成される。以上の力
法によると、第1図の音声波形は下表の情報により現わ
すことができ、単なる従来技術の「ピツチ周期の反復」
と比べ、よりすぐれたデータ圧縮を行うことができる。
ただし同じ波形群内では同じ傾きをもつた包絡線で近似
しているため、上記係数の間には、例えば係数A4,a
5,a6,a7については、A5=a!,A6=At,
a7=A2というような関係があり、情報として係数A
4及び係数A4を何乗するかの情報にかえることもでき
る。
また先頭ピツチ波の情報を与える代りに、係数値を考慮
することによつて各群内で求められた代表的なピツチ波
形、例えば波形NO6をそのまま情報として利用するこ
ともできる。上記処理方法はミニコン等を利用してデー
タ処理、演算処理を行うことで容易に実行することがで
き、その際置き換えの程度に関し、その都度再生し、品
質の劣化の度合を判断しながら演算処理等を進めること
が望ましい。
次に上述の方法により圧縮されたデータをもとに原音声
を再生する方法について述べる。
ここで再生するために必要なデータは上記表に示したも
のと同等であるが、ピツチ波形「,3′,1「のアナロ
グ波形はサンプリング(音声の場合、サンプリング周波
数fは8kHz)され、PCM等により符号化されデイ
ジタル量に変換されメモリーに貯えられる。係数Aiは
デイジタル量でメモリリ蓄えて、再生する際にピツチ波
形のデータにデイジタル量のAiを乗算して再生する方
法がある。この力法をとる場合、乗算のために複雑な回
路及び時間を要して余り適当ではない。従つて本発明で
はメモリ内に予め定数テーブルを設けて、このテーブル
に係数Aiに関連させて入力値に対応する出力値を書込
んで与えることにより、合成のためのデータ処理を簡単
にする。この種の音声合成において、上記係数Aiの係
り得る値は余り高い精度を必要とせず、従つて有限の値
、例えば0.5,0.6,0.7・・・・・・1.0,
1.1,1.2・・・・・・2.0等の数値を予め用意
し、上記に示した各係数データをこのどれかに近似する
ことで可能である。
このとき、この有限の係数値毎に次の方法にて入力値に
対するとり得る出力値がテーブル状に作成される。第3
図は上記テーブルの作成を模型的に示すグラフで、図中
の各直線Al,A2・・・Ai+1は夫々傾斜が上記圧
縮処理の過程で求められた係数Al,a2・・・Ai+
1に対応させて描かれ、横軸が入力値、縦軸が出力値で
、入力値のデイジタル量との交点が出力値として求めら
れ、メモリにテーブルとして格納される。
即ち入力がとり得る各デイジタル量毎に、上記直線Al
,A2・・・Ai+1との交点が求められてテーブルと
して準備される。例ればピツチ波形群NO3〜NO7の
波形を再生するにあたつて、まず情報の内の波形データ
3/に基いてピツチ波形NO3が再生される。
次にメモリに収納された上記テーブルを参照して、係数
A4に相当する第3図中の例えば直線A4が選択され、
波形データ3′の1サイクル分の入力値に対応する直線
A4上の縦軸情報が読み取られてデータ列が出力として
形成される。これが次のピツチ波形NO4′となる。以
下同様に波形NO5,NO6及びNO7に対し、波形デ
ータ3′の1サイクル分を入力として、各ピツチ波形の
ための係数に相当する第3図の直線から、出力データ列
が求められてピツチ波形が再生される。該復調のための
処理においては、予め書込まれた定数テーブルの値を読
み取ることによつて出力情報を得ることができ、従来方
法のように乗算処理を必要としない。第2図は第1図の
入力波形に対する再生波形を示す。復調の説明において
各ピツチ波形群の先頭ピツチ波形を基に同一群内の波形
を求める方法を説明したが、先頭ピツチ波形の代りに群
内の代表ピツチ波形を利用することもできる。
再生された波形はD/A変換器によりアナログ量に変換
されて用いられる。
.上記の再生方法は乗算演算を必要とせず、メモリ内に
簡単なテーブルを持たせることにより比較的容易に再生
可能である。
音声波形を少ないデータに圧縮する技術を提案し、また
比較的容易に再生する方法を述べたが、この過程にて、
振巾の包絡線を直線にて近似する方法について述べた。
上記直線近似法を発展させ、曲線(双曲線、n乗曲線)
等にて近似、再生する方法も本発明に含まれる。この場
合につき、すでに実験し、データ圧縮、再生にて良い結
果が得られている。以上本発明によれば音声波形のデー
タ圧縮が極めて高い圧縮率でなされ、また再生時に必要
とされるデータ量も少なくて済むため、LSI化に適し
た音声合成技術を提供することができる。
【図面の簡単な説明】
第1図は本発明を説明するための入力波形成、第2図は
同波形に対応した合成波形、第3図は本発明による係数
Aiの設定を説明するためのグラフである。

Claims (1)

  1. 【特許請求の範囲】 1 音声波形を比較的形状が類似するピッチ波形毎を単
    位に区分して各群について包絡線を直線又は簡単な曲線
    によつて近似すると共に、上記区分された各群から1サ
    イクルのピッチ波形を抽出して波形データを形成し、入
    力音声波形を包絡線情報と1サイクルのピッチ波形情報
    に圧縮することを特徴とする音声データの処理方法。 2 音声波形を比較的形状が類似するピッチ波形毎を単
    位に区分して各群について包絡線を直線又は簡単な曲線
    によつて近似し、上記区分された各群から1サイクルピ
    ッチ波形を抽出して波形データを形成し、上記包絡線の
    曲線毎にとり得る入力値に対応させて出力値を予めテー
    ブル状にメモリさせ、包絡線の曲線情報を与えて入力値
    に対応するテーブルの内容を読み出して、乗算すること
    なく音声波形を再生することを特徴とする音声データの
    処理方法。
JP55093670A 1980-07-08 1980-07-08 音声デ−タの処理方法 Expired JPS5935040B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55093670A JPS5935040B2 (ja) 1980-07-08 1980-07-08 音声デ−タの処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55093670A JPS5935040B2 (ja) 1980-07-08 1980-07-08 音声デ−タの処理方法

Publications (2)

Publication Number Publication Date
JPS5717999A JPS5717999A (en) 1982-01-29
JPS5935040B2 true JPS5935040B2 (ja) 1984-08-25

Family

ID=14088832

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55093670A Expired JPS5935040B2 (ja) 1980-07-08 1980-07-08 音声デ−タの処理方法

Country Status (1)

Country Link
JP (1) JPS5935040B2 (ja)

Also Published As

Publication number Publication date
JPS5717999A (en) 1982-01-29

Similar Documents

Publication Publication Date Title
EP0380572B1 (en) Generating speech from digitally stored coarticulated speech segments
US4214125A (en) Method and apparatus for speech synthesizing
US5774843A (en) Methods of efficiently recording an audio signal in semiconductor memory
EP0561454A2 (en) Method and apparatus for editing an audio signal
CN100336100C (zh) 乐音产生装置、方法、提供媒体及数据记录媒体
JPS5935040B2 (ja) 音声デ−タの処理方法
Modegi et al. Proposals of MIDI coding and its application for audio authoring
US4075424A (en) Speech synthesizing apparatus
JPH05342769A (ja) クロスインターリーブ回路
JPS60258600A (ja) 音声データの処理方法
JPS5968793A (ja) 音声合成装置
Modegi et al. Application of MIDI technique for medical audio signal coding
JPH0235320B2 (ja)
JP2860991B2 (ja) 音声蓄積再生装置
JPS5858596A (ja) Adpcm再生器
JP2861005B2 (ja) 音声蓄積再生装置
JP3393608B2 (ja) 音声処理装置
JP2560277B2 (ja) 音声合成方式
JPS58105197A (ja) 音声分析合成方法
JPS58105199A (ja) 音声分析合成方法
JPS59125798A (ja) 音声合成装置
JPS6143797A (ja) 音声編集出力方式
JPS58105198A (ja) 音声分析合成方法
JPS597996A (ja) 音素片編集型音声合成方法
JPS6022195A (ja) 音声合成方法