JP4007628B2 - 音声ピッチの周期の正規化を行う音声合成装置 - Google Patents
音声ピッチの周期の正規化を行う音声合成装置 Download PDFInfo
- Publication number
- JP4007628B2 JP4007628B2 JP08662796A JP8662796A JP4007628B2 JP 4007628 B2 JP4007628 B2 JP 4007628B2 JP 08662796 A JP08662796 A JP 08662796A JP 8662796 A JP8662796 A JP 8662796A JP 4007628 B2 JP4007628 B2 JP 4007628B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- voice
- speech
- waveform
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Description
【発明の属する技術分野】
本発明は録音編集方式による音声合成装置に関し、特に音声ピッチの周期を所望の音声ピッチの周期に正規化することに関する。
【0002】
【従来の技術】
従来の録音編集方式の音声合成装置では、アナログの録音編集方式としてのテープレコーダの場合には再生スピードを変化させ、ディジタルの録音編集方式の場合には、サンプリング周期を変えて、所望の音声ピッチ周期の正規化を実現している。
【0003】
【発明が解決しようとする課題】
しかしながら、従来のディジタルの録音編集方式の場合には、サンプリング周期を変化させなければならず、装置が大型化するという問題がある。
したがって、本発明は、上記問題点に鑑み、サンプリング周期を変化せずに、所望の音声ピッチ周期の正規化を実現することを目的とする。
【0004】
【課題を解決するための手段】
本発明は、前記問題点を解決するために、入力音声波形の音声ピッチの周期の正規化を行う音声合成装置において、前記入力音声波形から音声ピッチを抽出し、抽出音声ピッチの一周期にサンプリングされるサンプル数を正規化音声ピッチの一周期にサンプリングされるサンプル数に変更し、前記抽出音声ピッチの一周期を前記変更したサンプル数で分割した分割点での前記入力音声波形の振幅とする正規化音声波形を形成する音声ピッチ正規化部を備え、前記音声ピッチ正規化部は、前記正規化音声波形の音声ピッチの一周期が前記抽出音声ピッチの一周期よりも短くし、前記抽出音声ピッチの周期を前もって調べる処理のタイミングと正規化音声波形を形成するタイミングとの時間差が所定時間になったとき、一つ前の処理結果を繰り返し出力することで処理を継続する繰返処理部を備え、音声ピッチ周期の正規化を行う。
【0006】
前記繰返処理部は前記正規化音声波形の音声ピッチの一周期が前記抽出音声ピッチの一周期よりも短くした場合、前記抽出音声ピッチの周期を前もって調べる処理が行えなくなるとき、一つ前の処理結果を繰り返し出力することで処理を継続する。音声ピッチの抽出、調査の処理を待つと処理が遅れるためである。
【0007】
【発明の実施の形態】
以下本発明の実施の形態について図面を参照して説明する。
図1は本発明に係る音声ピッチ周期の正規化を行う音声合成装置を説明する図である。本図に示すように、音声合成装置は、音声を入力して電気信号に変換するマイクロフォン1と、アナログの電気信号を所定のサンプリング周期でディジタルの音声データに変換するA/D変換器2(Analog to Digital Converter)と、入力音声波形を所望の音声ピッチの音声波形に正規化する音声ピッチ正規化部3と、正規化された音声データをアナログ信号に変換するD/A変換器4
(Digital to Analog Conerter)と、アナログ信号を音声に変換するスピーカ5とを具備する。
【0008】
ここに、音声ピッチ正規化部3は、入力音声波形から抽出した音声ピッチの周期を基にして、入力音声波形から所望の新たな音声ピッチの周期に正規化された音声波形を、以下のように、計算により求める。
図2は音声ピッチ正規化部3の基本原理処理を説明する図である。本図(a)に示すように、音声ピッチ正規化部3は、サンプリング周期Δt を音声ピッチとして、時刻 n(×Δt ) 時に入力音声波形データvin(n)を入力する。そして、音声ピッチの一周期が N(×Δt )である入力音声波形データvin(i+0),vin(i+1),…vin(i+j), … vin(N-1) が求められる。
【0009】
本図(b)に示すように、音声ピッチ正規化部3は、上記サンプリング周期を固定し、さらに、所望の音声ピッチの一周期をM (×Δt )にするために、j=0 からN までの区間を新たに0 からM-1 までのM 個に分割し直す。j'(j'=0,1,2 …M-1)番目の音声波形データvin(i+N/M ×j') は図2(a)の前後の音声データvin(i+j)から計算で求められ、本図(c)に示すように、一周期分の音声ピッチがi'+0, i'+1, … i'+j', …i'+(M-1)のM 個に変更される。このようにして、音声ピッチ正規化部3により入力音声波形vin(n)は所望の音声波形se(n) に、以下のように、正規化される。
【0010】
se(i'+j')=vin(i+N/M ×j') …(1)
なお、入力音声波形の周期が目標になる周期よりも短ければ上記計算で求める音声波形のデータ数を入力音声波形のデータ数よりも増やすことで、音声ピッチの周期を目標とする周期に合わせる。逆に、音声ピッチの周期が目標とする周期よりも長ければ計算で求める音声波形のデータ数を減らして音声ピッチの周期を目標とする周期に合わせる。
【0011】
図3は入力音声波形の一周期 Nを具体的に求めるための音韻/あ/の入力音声波形の一例を示す図である。本図に示す入力音声波形vin(n)は平滑処理された波形であり、以下のように、微分処理が行われる。
pul(n)=[vin(n)-vin(n-1)]/ Δt …(2)
図4は入力音声波形の微分波形pul(n)を示す図である。本図に示すように、微分波形pul(n)はパルスが発生したときだけ負の値になる。そこで、pul(n)<0のときのサンプル点 nをn(k)とし、一つ前のパルスが発生したときのサンプル点n(k-1)との差Δn(k)を
Δn(k)=n(k)-n(k-1) …(3)
として記憶する。この差Δn(k)が入力音声波形の音声ピッチの一周期 Nとなる。
【0012】
図5は正規化の音声波形se(n) の導出の詳細を説明する図である。まず、i は音声ピッチの周期を変更する区間の初めのサンプル点(図1、図5(a)参照)、N は音声ピッチの周期を変更する前の一周期当たりのサンプルデータ数、M は音声ピッチの周期変更後の一周期当たりのサンプルデータ数である。
i1=i+N/M×j' …実数 …(4)
i2=i+N+M×j' …整数 …(5)
(少数点以下は切り捨てる)
se(i'+j')=[vin(i2+1)-vin(i2)](i1-i2)+vin(i2) …(6)
上記式(4)、(5)からi1, i2を計算し、その値から式(6)を用いてse(n) を計算する(図5(c)参照)。ここで、i1はピッチ変更後の値を計算する位置で、図5(b)の中の白丸で表される。また、i2はi1での振幅vin(i1) を計算するために用いるi1の直前のサンプル点である。
【0013】
音声ピッチ変更後の M個の正規化された音声波形データse(i'+j',j'=0 …M-1)をすべて計算し終われば、つまり、j'=M-1という条件が成立すれば、次の区間を正規化するため、i,i',j'Nを下記式を用いて計算する。
i=i+N …(7)
i'=i'+M …(8)
j'=0 …(9)
N=Δn(l) …(10)
ただし、k=l の場合には正規化する区間がまだ検出されていないので、後述のように、一つ前のデータを繰り返して時間を稼ぎ、その間に正規化する区間を検出する。そのため式(8)、(9)の処理だけを行い、式(7)、(10)の処理は行わない。
【0014】
元のサンプルデータ数 Nから周期 Tを計算し、T が下記式を満たした場合
T>TL U T<TH …(11)
Tは音声ピッチの周期でないと判断し、M=N とし、正規化を行わない。 Tが条件式(10)を満たさなければ Mに目標とする正規化後のデータ数を代入する。ただし、TL=20[msec], TH=3.3[msec] としている。
【0015】
さらに、音声ピッチ正規化部3は、入力音声波形を処理する際に、上記音声ピッチの周期の変更処理に先立ち、あらかじめ処理する区間の音声ピッチを抽出する音声ピッチ抽出部6と、今回の信号の入力開始から数十ミリ秒遅らせて処理を始め、音声ピッチの周期を変更する区間の音声ピッチを前もって調べるための遅延部7を有する。変更処理と音声ピッチの抽出、調査を並行処理とすると、処理が複雑となるためである。
【0016】
また、音声ピッチ正規化部3は繰返処理部8を有する。目標とする音声ピッチの周期を入力音声波形の音声ピッチの周期よりも短くした場合に、次第に入力音声波形と正規化音声波形の間の時間差が短くなり、入力音声波形から音声ピッチを抽出していないのに、その区間の音声ピッチを変更しなければならない場合が生じてしまう。このため、以下の処理を行う。
【0017】
図6は図1の繰返処理部8を説明する図である。正規化音声波形se(n) は、入力音声波形vin(n)に対して遅延して処理される。入力音声波形から音声ピッチを抽出していないのに、その区間の音声ピッチを変更しなければならない場合には、繰返処理部8では、本図(a)の矢印で示される直前の区間を本図(b)の点線で示される波形のようにもう一度繰り返し、その間に次の区間の音声ピッチの周期を抽出するようにする。このようにして、音声ピッチの抽出、調査を待つことなく、上記のような不都合な音声ピッチの変更を回避することが可能になる。
【0018】
図7及び8は音声ピッチ正規化部3の一連の動作を説明するフローチャートである。
ステップS1において、音声ピッチ抽出処理を行う。
ステップS2において、pul(n)<0の成否を判断する。この判断「NO」ならステップS6に進み、「YES」ならステップS3でn(k)=nと設定する。
【0019】
ステップS4において、
Δn(k)=n(k)-n(k-1)
と設定し、ステップS5でk=k+1 と設定しステップS6に進む。
ステップS6において、以下の処理を行う。
i1=i+N/M×j' …実数
i2=i+N+M×j' …整数
se(i'+j')=[vin(i2+1)-vin(i2)](i1-i2)+vin(i2)
ステップS7で、j'=M-1の成否を判断する。この判断が「NO」ならステップS8でj'=j'+1 と設定しステップS1に戻る。「YES」ならステップS9で、i'=i'+M と設定し、ステップS10でj'=0と設定する。
【0020】
ステップS11において、k ≠l の成否を判断し、この判断が「NO」ならステップS1に戻る。「YES」ならステップS12に進む。
ステップS12でi=i+N と設定し、ステップS13でN=Δn(l)と設定し、ステップS14でl=l+1 と設定し、ステップS15でT=N ×Δt と設定する。
ステップS16において、 T>TL U T<TH の成否を判断し、この判断が「YES」ならステップS17でM=N と設定しステップS1に戻る。
【0021】
ステップS18において、ステップS16での判断が「NO」ならM=目標とするデータ数に設定してステップS1に戻る。
図9は50〔Hz〕から700〔Hz〕の正弦波を入力した場合の振幅特性と入力−出力周波数を示す図である。本図に示すように、入力周波数400〔Hz〕以下までの出力周波数を100〔Hz〕とすることができる。
【0022】
図10は男性音韻/あ/の入力波形に対する音声ピッチ周期の正規化後の波形を示す図であり、図11は女性音韻/あ/の入力波形に対する音声ピッチ周期の正規化後の波形を示す図である。図10(a)には音声ピッチ周波数が200〔Hz〕以下の場合の入力音声波形が示され、これに対して、図10(b)には音声ピッチ周波数200〔Hz〕に正規化した結果が示される。同様に、図11(a)には音声ピッチ周波数が200〔Hz〕以上の場合の入力音声波形が示され、これに対して、図10(b)には音声ピッチ周波数200〔Hz〕に正規化した結果が示される。
【0023】
したがって、本発明によれば、サンプリング周期を固定して、音声ピッチの周期を所望の周期に変更することが可能になる。
【図面の簡単な説明】
【図1】本発明に係る音声ピッチ周期の正規化を行う音声合成装置を説明する図である。
【図2】音声ピッチ正規化部3の基本原理処理を説明する図である。
【図3】入力音声波形の一周期 Nを具体的に求めるための音韻/あ/の入力音声波形の一例を示す図である。
【図4】入力音声波形の微分波形pul(n)を示す図である。
【図5】正規化の音声波形se(n) の導出の詳細を説明する図である。
【図6】図1の繰返処理部8を説明する図である。
【図7】音声ピッチ正規化部3の一連の動作を説明するフローチャートである。
【図8】音声ピッチ正規化部3の一連の動作を説明するフローチャートである。
【図9】50〔Hz〕から700〔Hz〕の正弦波を入力した場合の振幅特性と入力−出力周波数を示す図である。
【図10】男性音韻/あ/の入力波形に対する音声ピッチ周期の正規化後の波形を示す図である。
【図11】女性音韻/あ/の入力波形に対する音声ピッチ周期の正規化後の波形を示す図である。
【符号の説明】
3…音声ピッチ正規化部
6…音声ピッチ抽出部
7…遅延部
8…繰返処理部
Claims (1)
- 入力音声波形の音声ピッチの周期の正規化を行う音声合成装置において、
前記入力音声波形から音声ピッチを抽出し、抽出音声ピッチの一周期にサンプリングされるサンプル数を正規化すべき音声ピッチの一周期にサンプリングされるサンプル数に変更し、前記抽出音声ピッチの一周期を前記変更したサンプル数で分割した分割点での前記入力音声波形の振幅とする正規化音声波形を形成する音声ピッチ正規化部を備え、
前記音声ピッチ正規化部は、前記正規化音声波形の音声ピッチの一周期が前記抽出音声ピッチの一周期よりも短くし、前記抽出音声ピッチの周期を前もって調べる処理のタイミングと正規化音声波形を形成するタイミングとの時間差が所定時間になったとき、一つ前の処理結果を繰り返して出力することで処理を継続する繰返処理部を備えることを特徴とする音声ピッチ周期の正規化を行う音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08662796A JP4007628B2 (ja) | 1996-04-09 | 1996-04-09 | 音声ピッチの周期の正規化を行う音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08662796A JP4007628B2 (ja) | 1996-04-09 | 1996-04-09 | 音声ピッチの周期の正規化を行う音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09281992A JPH09281992A (ja) | 1997-10-31 |
JP4007628B2 true JP4007628B2 (ja) | 2007-11-14 |
Family
ID=13892272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP08662796A Expired - Lifetime JP4007628B2 (ja) | 1996-04-09 | 1996-04-09 | 音声ピッチの周期の正規化を行う音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4007628B2 (ja) |
-
1996
- 1996-04-09 JP JP08662796A patent/JP4007628B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH09281992A (ja) | 1997-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5054085A (en) | Preprocessing system for speech recognition | |
US9646592B2 (en) | Audio signal analysis | |
JPS5844500A (ja) | 音声認識方式 | |
US5452398A (en) | Speech analysis method and device for suppyling data to synthesize speech with diminished spectral distortion at the time of pitch change | |
EP0248593A1 (en) | Preprocessing system for speech recognition | |
Cosi et al. | Lyon's auditory model inversion: a tool for sound separation and speech enhancement | |
JP4007628B2 (ja) | 音声ピッチの周期の正規化を行う音声合成装置 | |
JPH0777979A (ja) | 音声制御音響変調装置 | |
JPH05307395A (ja) | 音声合成装置 | |
Miller et al. | Investigation of the glottal waveshape by automatic inverse filtering | |
CN103035237B (zh) | 一种中文语音信号处理方法、装置和助听设备 | |
JP2806048B2 (ja) | 自動採譜装置 | |
JPH0193799A (ja) | 音声ピッチ変換方法 | |
JP3083830B2 (ja) | 音声の発声時間長制御方法および装置 | |
JP4882152B2 (ja) | 話速検出方法および音声信号処理装置 | |
JPH0318720B2 (ja) | ||
KR100359988B1 (ko) | 실시간 화속 변환 장치 | |
JPH0461359B2 (ja) | ||
Jyotishi et al. | A novel feature for nasalised vowels and characteristic analysis of nasal filter | |
JPH09146587A (ja) | 話速変換装置 | |
JPS60166993A (ja) | 単語音声認識装置 | |
JP2569472B2 (ja) | 音声分析装置 | |
JP2956938B2 (ja) | 音声分析装置 | |
US9264818B2 (en) | Digital signal processor with search function | |
KR100322704B1 (ko) | 음성신호의지속시간변경방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040506 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040518 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040716 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041018 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20041028 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20041217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070828 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100907 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110907 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110907 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120907 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120907 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130907 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140907 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |