JPH08202395A - ピッチ変換方法およびその装置 - Google Patents

ピッチ変換方法およびその装置

Info

Publication number
JPH08202395A
JPH08202395A JP7014509A JP1450995A JPH08202395A JP H08202395 A JPH08202395 A JP H08202395A JP 7014509 A JP7014509 A JP 7014509A JP 1450995 A JP1450995 A JP 1450995A JP H08202395 A JPH08202395 A JP H08202395A
Authority
JP
Japan
Prior art keywords
pitch
waveform
window
voice
phase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7014509A
Other languages
English (en)
Inventor
Hiroko Yoshida
田 博 子 吉
Yasuhiko Arai
居 康 彦 新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7014509A priority Critical patent/JPH08202395A/ja
Publication of JPH08202395A publication Critical patent/JPH08202395A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【目的】 PSOLA法において、より音質の良いピッ
チ変換音声を得る。 【構成】 ディジタル信号に変換された音声信号の線形
予測残差信号を得る線形予測分析手段11と、線形予測
残差信号の短時間位相特性をマッチドフィルタで等化し
て、ピッチパルス付近にパワーを集中させた位相等化信
号からピッチ位置(声帯の励振点)を正確に求め、その
パルス位置をピッチ位置とする位相等化処理手段12
と、隣合うピッチ位置の差からピッチ周期を求めるピッ
チ周期決定手段13と、ピッチ位置を中心にハニング窓
の場合は求めたピッチ周期の2倍程度、ブラックマン・
ハリス窓の場合は3倍程度の窓長の窓関数を用いて1ピ
ッチ分の波形を切り出すピッチ波形切り出し手段14
と、ピッチ波形切り出し手段で切り出したピッチ波形を
所望のピッチ周期に並べ直して重ね合わせるピッチ波形
重ね合わせ手段15を備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル信号処理技
術を利用した音声合成装置や音声編集装置等において、
音声のピッチ周期毎にピッチ周期の2倍程度の長さの窓
関数を用いて音声を切り出し、切り出したピッチ波形を
所望のピッチ周期間隔で並べ直し、これらを重ね合わせ
て音声のピッチ周期を変換するPSOLA法(Pitch-Sy
nchronous Overlap-add :波形の加算重畳によるピッチ
変換方法)を用いたピッチ変換方法およびその装置に関
する。
【0002】
【従来の技術】従来、この種のピッチ変換方法は、図8
に示すように、原音声の音声信号からピッチ位置決定手
段1によりピッチ位置を決定するとともに、ピッチ周期
決定手段2によりピッチ周期を決定し、これらピッチ位
置とピッチ周期を基に原音声からピッチ波形切り出し手
段3がピッチ波形を切り出し、切り出したピッチ波形を
ピッチ波形重ね合わせ手段4が並べ直して重ね合わせる
ことによりピッチを変更している。具体的には、原音声
のピッチ周波数ごとに、ピッチを低くする場合には、原
音声のピッチ周波数の2倍程度の窓長の窓関数で、ピッ
チを高くする場合には、所望のピッチ周波数の2倍程度
の窓長の窓関数で、それぞれ原音声からピッチ波形を切
り出し、切り出したピッチ波形を所望のピッチ間隔に並
べ変えて足し合わせることによって、ピッチを変換して
いる("Diphone Synthesis Using an Overlap-add Thec
hnique for Speech Wavefoms Concatenation" ICASSP '
86,pp.2015-2018,1986. 参照)。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来のピッチ変換方法では、ピッチ波形を切り出すための
ピッチ位置の求め方が明確でなく、通常はピッチ周期内
の音声信号の振幅が最大値になる点、あるいはその点か
ら時間的に前向きに戻って零クロスした点等をピッチ位
置として用いているため、ピッチ位置を正確に求めるこ
とができないという問題があった。音声を切り出す窓の
位置(ピッチ位置)は、ピッチ変換後の音声の振幅の減
少や音質の劣化が生じてしまうため、声帯の励振点(ピ
ッチ位置)を正確に求めることが要求される。
【0004】また、ピッチ周波数の変化が大きい箇所で
は、ピッチ周期の2倍程度の窓を掛けて音声を切り出し
た場合、隣合う波形の間でのピッチ周期が異なるため、
図4のに示すように、正確に1ピッチ分の波形を切り
出すことができず、切り出した音声波形に前後のピッチ
波形の情報が入ってしまったり、ピッチ波形の情報が欠
落してしまったりして、音質の劣化が生じてしまうとい
う問題があった。
【0005】また、鼻韻や弾音など、切り出す音声の音
韻の種類によっては、ピッチ位置が必ずしも声帯振動に
よるピッチパルス位置に対応しているとは限らず、従来
のピッチ位置でピッチ波形をピッチ周期の2倍の窓長で
切り出した場合、音質が劣化してしまうという問題があ
った。
【0006】また、ピッチ周波数を高くする場合、所望
の目標とするピッチ周期の2倍程度の窓長の窓で音声を
切り出すため、図4のに示すように、音声情報を欠落
させることになり、音質が劣化するという問題があっ
た。
【0007】また、音質の劣化を抑えるため、原音声の
ピッチ周波数の2倍で切り出して重ね合わせ、ピッチ周
波数を高くした場合、少ない変更ではあまり問題はない
が、大幅にピッチ周波数を変更した場合、波形が重なり
合う箇所が増えるため、ピッチ変換後、重なり合った箇
所の音声の振幅が増大してしまうという問題があった。
【0008】本発明は、このような従来の問題を解決す
るもので、音声のピッチ位置を正確に求め、さらに音声
のピッチ波形を正確に切り出し、音質の劣化の少ないピ
ッチ変換方法およびその装置を提供することを目的とす
るものである。
【0009】
【課題を解決するための手段】請求項1の発明に係わる
ピッチ変換方法は、音声のピッチ周期毎にピッチ周期の
2倍程度の長さの窓関数を用いて音声を切り出し、切り
出したピッチ波形を所望のピッチ周期間隔で並べ直し、
これらを重ね合わせて音声のピッチ周期を変換するPS
OLA法(Pitch-Synchronous Overlap-add :波形の加
算重畳によるピッチ変換方法)において、音声の線形予
測残差信号の短時間位相特性をマッチドフィルタで等化
して、ピッチパルス付近にパワーを集中させた位相等化
残差信号を求め、そのパルスの位置をピッチ位置として
定めるとともに、隣合うパルスの間隔をピッチ周期とし
て定めてPSOLA処理を行うようにしたものである。
【0010】請求項2の発明に係わるピッチ変換方法
は、位相等化残差信号を用いて、LPC合成フィルタで
合成した音声位相等化音声に対してPSOLA法を適応
するようにしたものである。
【0011】請求項3に係わるピッチ変換方法は、従来
のPSOLA法または請求項1ないし請求項2のピッチ
変換方法において、ピッチ位置を中心として左右のピッ
チ周期が異なる場合は、ピッチ周期に応じて窓長を変
え、左右非対称な窓長の窓を用いてピッチ波形を切り出
すようにしたものである。
【0012】請求項4に係わるピッチ変換方法は、従来
のPSOLA法または請求項1ないし請求項2のピッチ
変換方法において、ピッチ波形を切り出す窓関数を音声
のピッチ周期の3倍程度のブラックマン・ハリス窓を用
いて音声を切り出すようにしたものである。
【0013】請求項5に係わるピッチ変換方法は、従来
のPSOLA法または請求項1ないし請求項2のピッチ
変換方法において、ピッチ波形を切り出す際、切り出す
音声の音韻の種類によって、最適な窓長を設定するよう
にしたものである。
【0014】請求項6に係わるピッチ変換方法は、従来
のPSOLA法または、請求項1ないし請求項2のピッ
チ変換方法において、ピッチ周波数を高くする際(基本
周波数の増加)においても、音声を切り出す窓の窓長を
ハニング窓の場合は原波形の2倍程度、ブラックマンハ
リス窓を用いる場合は原波形の3倍程度に設定するよう
にしたものである。
【0015】請求項7に係わるピッチ変換装置は、請求
項6でピッチ周波数を高くする際、ピッチ波形が重なり
合った箇所の音声の振幅を抑制するようにしたものであ
る。
【0016】請求項8に係わるピッチ変換装置は、ディ
ジタル信号に変換された音声波形の線形予測残差波形を
生成する線形予測処理手段と、線形予測残差信号にマッ
チドフィルタを掛けて短時間位相特性を等化して位相等
化処理を行い、位相が等化されてエネルギが集中した箇
所(パルス位置)をピッチ位置と決定する位相等化処理
手段と、隣合うピッチ位置の間隔をピッチ周期と決定す
る手段と、決定されたピッチ位置を中心に窓関数でピッ
チ波形を切り出す手段と、切り出したピッチ波形を所望
のピッチ間隔で並べ直す手段とを備えたものである。
【0017】請求項9に係わるピッチ変換装置は、請求
項8の発明に、さらに位相等化処理手段で算出された位
相等化残差信号と、線形予測処理手段から算出された線
形予測係数を用いて位相等化音声信号を生成するLPC
合成フィルタを備え、この生成された位相等化音声から
ピッチ波形を切り出し、切り出した位相等化ピッチ波形
を所望のピッチ周期で並べ直すようにしたものである。
【0018】
【作用】本発明は、上記のような構成により次のような
作用を有する。すなわち、請求項1の発明に係わるピッ
チ変換方法は、音声の線形予測残差信号に位相等化フィ
ルタを施して位相等化残差信号を求め、この位相等化残
差信号の振幅に対する閾値判定に基づいてピッチ位置を
逐次的に決定し、決定したピッチ位置での位相等化フィ
ルタの係数を計算する(誉田、守谷 ”位相等化処理を
用いた音声符号化”日本音響学会音声研究会資料 S8
4−05(April 23,1984)pp.33-40 を参照)。位相等化
残差信号は、残差信号エネルギが時間的に集中化した疑
似的なパルス列に変換されるため、より正確に励振点が
近似され、このパルス位置をピッチ位置とし、その点を
中心としてピッチ波形を切り出すことにより、正確なピ
ッチ波形を抽出することができ、さらに、切り出したピ
ッチ波形を所望のピッチ周期で並べ直すことにより、音
質の劣化の少ないピッチ変換音声を得ることができる。
【0019】請求項2の発明に係わるピッチ変換方法で
は、請求項1で求めた位相等化残差信号を、線形予測残
差信号を生成した時に得られた線形予測係数による、L
PC合成フィルタに通して位相等化音声信号を得る。位
相等化音声は、原音声と比べても、その音質の劣化はほ
とんど知覚されないということが確認されている(上記
論文を参照)。また、位相等化音声は、音声信号に比べ
ると、位相成分がピッチパルス位置に集中しているため
(図3の参照)、原音声信号からピッチ波形を切り出
す代わりに位相等化音声信号からピッチ波形を切り出せ
ば、前後のピッチ波形の影響が少ないピッチ波形を切り
出すことができ、より音質の劣化が少ないピッチ変換音
声を得ることができる。
【0020】請求項3の発明に係わるピッチ変換方法
は、ピッチ位置を中心として左右のピッチ周期が異なる
場合は、そのピッチ周期に応じて左右非対称な窓長の窓
を用いて音声を切り出すことにより、音声情報が欠落し
たり(図4の参照)、隣のピッチ情報を含むというこ
とが少なくなり、切り出す音声のピッチ周期の変化が激
しい箇所でも正確にピッチ情報を切り出すことができ、
より劣化の少ないピッチ変換音声を得ることができる。
【0021】請求項4の発明に係わるピッチ変換方法
は、ピッチ波形を切り出す際、ハニング窓で切り出した
場合よりも、ブラックマン・ハリス窓で切り出した場合
の方が窓長の微少変化による音質の劣化が少ないため
(図5参照)、ピッチ周期の3倍程度のブラックマン・
ハリス窓を用れば、ピッチ周期を誤った場合でも窓長に
よる音質の劣化が少なく、安定した音質のピッチ変換音
声を得ることができる。う効果を有する。
【0022】請求項5の発明に係わるピッチ変換方法
は、切り出す音韻の種類に応じて切り出す窓長を最適に
設定することによって、鼻音や、弾音等、ピッチ位置が
励振点に対応していない音韻でも、音韻毎に歪を最小化
することができ、より音質の良いピッチ変換音声を得る
ことができる。
【0023】請求項6の発明に係わるピッチ変換方法
は、ピッチ周波数を高くする場合でも、ハニング窓で切
り出す場合は原音声のピッチ周期の2倍程度、ブラック
マン・ハリス窓で切り出す場合は3倍程度の窓でピッチ
波形を切り出し、所望のピッチ周期に重ね合わせること
により、音声情報の欠落が防止できて、より音質の良い
ピッチ変換音声を得ることができる。
【0024】請求項7の発明に係わるピッチ変換方法
は、請求項6の方法でピッチ周波数を高くした場合、ピ
ッチ波形を重ね合わせることにより振幅が原音声よりも
大きくなる部分が発生するため、振幅が増大する部分に
重み付けを施して振幅を元の値に戻すことにより、より
音質の良いピッチ変換音声を得ることができる。
【0025】請求項8および9の発明に係わるピッチ変
換装置は、上記各ピッチ変換方法を確実に実現すること
ができる。
【0026】
【実施例】
(実施例1)図1は請求項1記載のピッチ変換方法を実
現するための装置の構成例を示すブロック図である。以
下、図1および図3の波形図を参照しながら、本実施例
を詳細に説明する。図1において、11はディジタル信
号に変換された音声波形の線形予測残差波形を生成する
線形予測処理手段であり、自己相関係数算出11−1、
線形予測係数算出手段11−2、LPC逆フィルタ11
−3を有する。12は線形予測残差信号にマッチドフィ
ルタを掛けて短時間位相特性を等化して位相等化処理を
行ない、位相が等化されてエネルギが集中した箇所をピ
ッチ位置と決定する位相等化処理手段であり、ピッチ位
置決定手段12−1、位相等化フィルタ係数算出手段1
2−2、位相等化フィルタ12−3を有する。13は隣
合うピッチ位置の間隔をピッチ周期と決定するピッチ周
期決定手段であり、14は決定されたピッチ位置を中心
に窓関数でピッチ波形を切り出すピッチ波形切り出し手
段であり、15は切り出したピッチ間隔で並べ直して重
ね合わせるピッチ波形重ね合わせ手段である。
【0027】上記構成において、線形予測分析手段11
は、ディジタル信号に変換された音声信号(図3の参
照)の線形予測残差信号(図3の参照)を生成し、位
相等化処理手段12で線形予測残差信号に位相等化処理
を施して位相等化残差信号(図3の参照)を生成し、
位相等化残差信号からピッチ位置を決定する。そして、
ピッチ周期決定手段13で隣合うピッチ位置の差からピ
ッチ周期を求め、ピッチ波形切り出し手段14で適当な
窓関数(ハニング窓、ブラックマン・ハリス窓等)でピ
ッチ波形を切り出して、ピッチ波形重ね合わせ手段15
で所望のピッチ周期間隔でピッチ波形を重ね合わせてピ
ッチ変換音声を得る。
【0028】以下、各処理手段における処理内容につい
てさらに詳しく説明する。まず、線形予測手段11にお
いて、フレーム単位で区切られた音声信号の線形予測係
数を自己相関係数算出手段11−1および線形予測係数
算出手段11−2で求め、次いでLPC逆フィルタ11
−3で残差信号を求める。次に、位相等化処理手段12
のピッチ位置決定手段12−1では、変形相関法等で求
めたピッチ周期を単位に、最初は残差信号振幅の最大値
をピッチ位置として、次のピッチ位置は、位相等化され
た残差信号の振幅に対する閾値判定に基づいて、次式に
より決定する。
【0029】
【数1】
【0030】そして、位相等化フィルタ係数算出手段1
2−2では、そのピッチ位置n1 での位相等化フィルタ
の係数を次式で求める。
【0031】
【数2】
【0032】次に、位相等化フィルタ12−3におい
て、ピッチ位置n1 で求めたフィルタの係数で、その位
置での位相等化残差信号eP (n)を次式で求める。
【0033】
【数3】 求めた位相等化残差信号は、次のピッチ位置を求めるた
めに用いる。
【0034】このようにして求めたピッチ位置から、ピ
ッチ周期決定手段13により、隣合うピッチ位置との差
からピッチ周期T1 を求める。
【0035】T1 = n1 −n1-1
【0036】次に、ピッチ波形切り出し手段14によ
り、ピッチ周期決定手段13で求めたピッチ周期から切
り出し窓長を決定し、位相等化処理手段12で求めたピ
ッチ位置を中心として、ハニング窓等の窓関数を用いて
ピッチ波形を切り出す。そして、ピッチ波形重ね合わせ
手段15で、切り出したピッチ波形を所望のピッチ周期
に並べ直してそれを重ね合わせることによりピッチを変
換させた音声を得る。
【0037】このように、上記実施例によれば、線形予
測残差信号を位相等化することにより、エネルギがピッ
チパルス位置付近に時間的に集中するので、このエネル
ギが集中した点をピッチ位置とすることにより、声帯の
振動に対する励振点がより正確に近似されるため、この
点を中心に窓関数で音声波形を切り出せば、正確に1ピ
ッチ波形を抽出することができ、抽出したピッチ波形を
所望のピッチ周期に並べ直すことにより、より音質のよ
いピッチ変更音声を合成することができる。
【0038】(実施例2)図2は請求項2記載のピッチ
変換方法を実現するための装置の構成例を示すブロック
図である。本実施例は、上記した実施例1の構成にLP
C合成フィルタ16を追加したものである。以下、図2
および図3を参照しながら、本実施例を詳細に説明す
る。
【0039】本実施例では、上記した実施例1と同様
に、ディジタル信号に変換された音声信号(図3の)
から、線形予測分析手段11の線形予測係数算出手段1
1−2で線形予測係数をもとめ、LPC逆フィルタ11
−3で線形予測残差信号(図3の)を求める。求めた
残差信号は、実施例1と同じ方法で、位相等化処理手段
12のピッチ位置決定手段12−1でピッチ位置を求
め、その位置での位相等化フィルタの係数を位相等化フ
ィルタ係数算出手段12−2で求め、線形予測残差信号
を位相等化フィルタ12−3に通して位相等化残差信号
(図3の)を求める。
【0040】位相等化フィルタ12−4で求めた線形予
測残差信号は、線形予測係数算出手段11−2で求めた
線形予測係数を用いてLPC合成フィルタ16で位相等
化音声信号に変換する。そして、その変換された位相等
化音声信号を用いて、実施例1と同ように、ピッチ波形
切り出し手段14でピッチ位置を中心に位相等化音声信
号に窓関数を掛けてピッチ波形を切り出し、ピッチ波形
重ね合わせ手段15でピッチを変更した位相等化音声信
号を得る。
【0041】図3のに示す位相等化音声信号は、図3
のに示す音声信号に比べてピッチ位置にパワーが集中
している。このため、位相等化された音声信号の方が前
後のピッチ波形の影響が少ないピッチ波形の切り出しが
容易となり、より正確にピッチ波形を切り出すことがで
きるという効果を有する。また、位相等化による音質の
劣化はほとんど知覚されないため、位相等化音声を用い
ることによる音質の劣化はほとんどない。
【0042】(実施例3)次に、請求項3記載のピッチ
変換方法における実施例を図4を用いて説明する。実施
例1および実施例2のピッチ波形切り出し手段14また
は図8の従来例に示したピッチ変換方式のピッチ波形切
り出し手段3において、図4のに示すように、ピッチ
位置を境に以下のような式により窓関数を計算する。な
お、ハニング窓を用いる場合はピッチ周期の2倍、ブラ
ックマン・ハリス窓を用いる場合は、ピッチ周期の3倍
程度の窓長を用いる。以下はハニング窓の例である。
【0043】n<T1 の時 WT1(n) = 0.5 −0.5cos{πn/T1 } n=0..T
1-11+1 +T1 ≧n≧T1 の時 WT1+1(n)= 0.5 −0.5cos{π+π(n−T1 )/T
1+1 } n=T1..T1+T1+11 :ピッチ位置 W(n) :窓関数 T1= P1 −P1-1 :窓関数を掛ける位置のピッチ周期 T1+1=P1+1 −P1 :窓関数を掛ける位置のピッチ周期
【0044】このように、切り出す位置のピッチ周期に
よって左右の窓長が非対称の窓関数を用いることによ
り、図4ののように、ピッチ波形情報が欠落したり、
隣のピッチ情報を含んでしまうことが少ないため、より
正確にピッチ波形を切り出すことができる。
【0045】(実施例4)次に請求項4記載のピッチ変
換方法における実施例を図5(西村、新居他 電子情報
通信学会 信学技報 SP93-141(1994-02) pp.23-30 を
参照)の音声信号モデルの周波数特性と切り出し波形の
周波数スペクトルとのレベル偏差を示す図を参照して説
明する。
【0046】実施例1および実施例2のピッチ波形切り
出し手段14または従来例に示したピッチ変換方式のピ
ッチ切り出し手段3において、通常はピッチ周期の2倍
程度の窓長のハニング窓を用いてピッチ波形を切り出す
が、図5に示すようにブラックマン・ハリス窓を用いて
ピッチ波形を切り出した場合のほうが、窓長の微少変化
による音質の劣化は緩やかである。このため、以下に示
すピッチ周期の3倍程度のブラックマン・ハリス窓によ
る窓関数を用いて音声を切り出したほうがピッチ周期の
誤抽出に対しても、音質の劣化が少ない安定した音質の
ピッチ変換音声が得られる。 W(n)=0.42-0.5cos(2 πn/N-1)+0.08cos(2π*2n/N-1) 0<
n<N-1 N=ピッチ周期*3.0
【0047】(実施例5)次に、請求項5記載のピッチ
変換方法における実施例を図6を参照して説明する。図
6は請求項5の発明を実現するための装置の構成例を示
すブロック図である。21は入力音声音韻認識手段、2
2はピッチ位置決定手段、23はピッチ周期決定手段、
24は波形切り出し手段、25はピッチ波形重ね合わせ
手段である。まず、音声信号を入力し、ピッチ位置決定
手段22で、入力した音声のピッチ位置を実施例1等の
方法で求める。そして、ピッチ周期決定手段23でピッ
チ周期を求める。また、入力音声音韻認識手段21で
は、入力して処理を行う音声信号を認識等の技術を用い
て音韻を認識するか、もしくはラベリングされているラ
ベルデータを入力して処理を行う音声信号の音韻を認識
する。次いで、認識した音韻の種類によって、ピッチ波
形を切り出すのに最適な窓長を窓長決定手段26で決定
する。
【0048】そして、これらのパラメータを用いてピッ
チ波形切り出し手段24で、ピッチ波形を切り出して、
ピッチ波形重ね合わせ手段25で切り出したピッチ波形
を所望のピッチ周期で並べ直し、ピッチ変更音声信号を
得る。
【0049】このようにして、切り出す音韻の種類毎に
窓長を設定することにより、より正確にピッチ波形を切
り出すことができる。
【0050】(実施例6)次に、請求項6記載のピッチ
変換方法における実施例を図4のを参照しながら説明
する。実施例1および実施例2のピッチ波形切り出し手
段14または従来例に示したピッチ変換方式のピッチ波
形切り出し手段3において、従来は、ピッチ周波数を高
くする場合は、所望のピッチ周期の2倍程度の窓関数を
用いてピッチ波形を切り出していたが、ピッチ周期を高
くする場合においても、ハニング窓を用いる時は原波形
のピッチ周期の2倍程度、ブラックマン・ハリス窓を用
いる時はピッチ周期の3倍程度の窓長の窓関数を用いて
音声波形を切り出すことにより、図4ののように音声
情報が欠落しないため、より音質の良いピッチ変換音声
を得ることができる。
【0051】(実施例7)次に、請求項7記載のピッチ
変換方法における実施例を図7を参照しながら説明す
る。実施例6のピッチ波形切り出し手段24において、
ピッチ周波数を高くする場合でも、ハニング窓を用いる
場合は原音声のピッチ周波数の2倍程度、ブラックマン
・ハリス窓を用いる場合はピッチ周波数の3倍程度の窓
長の窓関数を用いてピッチ波形を切り出して重ね合わせ
ると、図7ののように原波形のピッチ波形に対して振
幅が大きくなってしまい、音質劣化の原因となる。(図
7はピッチの2倍のハニング窓を掛けて処理を行った場
合を示す。)そこで、図7ののように、足し合わせた
窓関数の係数が1を越えた場合、その係数の逆数で重み
付けを行うような振幅制御手段を設けることにより、図
7ののように、振幅を原波形に合わせることができ、
より音質の良いピッチ変換方式を得ることができる。
【0052】
【発明の効果】本発明は、上記実施例から明らかなよう
に、請求項1の発明は、音声の線形予測残差に位相等化
フィルタを掛けることによりピッチパルス付近にパワー
を集中させ、パワーが集中した点をピッチ位置としてそ
の位置を中心にピッチ波形を切り出すとピッチ波形が正
確に切り出せるため、切り出したピッチ波形を所望のピ
ッチ周期で並べ変えることにより、より音質のよいピッ
チ変換音声を得ることができるという効果を有する。
【0053】請求項2の発明は、位相等化残差信号をL
PC合成した位相等化音声信号は、ピッチ位置にパワー
が集中しているため、位相等化音声信号を用いると、ピ
ッチ波形がより正確に切り出せるため、より音質のよい
ピッチ変換音声を得ることができるという効果を有す
る。
【0054】請求項3の発明は、ピッチ波形を切り出す
窓関数をピッチ位置を中心に、左右のピッチ周波数に合
わせて窓長を設定することにより、ピッチ波形の情報を
欠落あるいは隣のピッチ情報を含むことが少なく、ピッ
チ波形を正確に切り出せるため、より音質の良いピッチ
変換音声を得ることができるという効果を有する。
【0055】請求項4の発明は、ピッチ波形を切り出す
窓関数をピッチ周期の3倍程度の窓長のブラックマン・
ハリス窓を用いることにより、ピッチ周期の誤抽出にも
安定した音質のピッチ変換音声を得ることができるとい
う効果を有する。
【0056】請求項5の発明は、ピッチ波形を切り出す
窓長を、ピッチを切り出す部分の音韻によって最適な窓
長に設定することにより、より音質の良いピッチ変換音
声を得ることができるという効果を有する。
【0057】請求項6の発明は、ピッチ周波数を高くす
る場合でも、ハニング窓の場合は原音声のピッチ周期の
2倍程度、ブラックマン・ハリス窓を用いる場合は原波
形のピッチ周期の3倍程度の窓長の窓関数を用いること
により、音声のピッチ情報を欠落させることが無いた
め、より音質の良いピッチ変換音声を得ることができる
という効果を有する。
【0058】請求項7の発明は、請求項6の発明で、ピ
ッチ周波数を高くする場合に、ハニング窓の場合は原音
声のピッチ周期の2倍程度、ブラックマン・ハリス窓を
用いる場合は原波形のピッチ周期の3倍程度の窓長の窓
関数を用いることにより増大した振幅を抑制するような
重み付けを施すことにより、より音質の良いピッチ変換
音声を得ることができるという効果を有する。
【0059】請求項8および請求項9の発明は、上記し
た各ピッチ変換方法を確実に実現することができるとい
う効果を有する。
【図面の簡単な説明】
【図1】請求項1の発明を実施するためのピッチ変換装
置の構成例を示す概略ブロック図
【図2】請求項2の発明を実施するためのピッチ変換装
置の構成例を示す概略ブロック図
【図3】本発明を説明するための波形図 入力音声信号を示す波形図 位相等化された残差をLPC合成した位相等化音声波
形を示す波形図 線形予測残差信号を示す波形図 位相等化された残差信号を示す波形図 位相等化された残差信号から決定したピッチ位置示す
【図4】請求項3および請求項6の発明を説明するため
の概念図 ピッチ周期の2倍の窓長の窓を施してピッチ波形を切
り出す場合の窓の概念図 隣合うピッチ周期に合わせた窓長の窓を施してピッチ
波形を切り出す場合の窓の概念図 所望のピッチ周期の窓長の窓を施してピッチ波形を切
り出す場合の窓の概念図
【図5】請求項4および請求項5の発明を説明するため
の音声信号モデルの周波数特性と切り出し波形の周波数
スペクトルとのレベル偏差を示す特性図
【図6】請求項5の発明を実施するためのピッチ変換装
置の構成例を示す概略ブロック図
【図7】請求項7の発明を説明するための概念図および
波形図 ピッチ周期の2倍の窓長のハニング窓でピッチ波形を
切り出してピッチを変更しないで重ね合わせた場合の窓
の概念図 ピッチ周期の2倍の窓長のハニング窓でピッチ波形を
切り出してピッチを変更しないで重ね合わせた場合の波
形の振幅を表す波形図 ピッチ周期の2倍の窓長のハニング窓でピッチ波形を
切り出してピッチを高くして重ね合わせた場合の窓の概
念図 ピッチ周期の2倍の窓長のハニング窓でピッチ波形を
切り出してピッチを高くして重ね合わせた場合の波形の
振幅を表す波形図 重ね合わせにより高くなった波形の振幅を補正する重
み付け関数を表す波形図 重ね合わせにより高くなった波形の振幅を補正する重
み付け関数を施した波形の振幅を表す波形図
【図8】従来のピッチ変換装置の構成を示す概略ブロッ
ク図
【符号の説明】
1 ピッチ位置決定手段 2 ピッチ周期決定手段 3 ピッチ波形切り出し手段 4 ピッチ波形重ね合わせ手段 11 線形予測処理手段 11−1 自己相関係数算出手段 11−2 線形予測係数算出手段 11−3 LPC逆フィルタ 12 位相等化処理手段 12−1 ピッチ位置決定手段 12−2 位相等化フィルタ係数算出手段 12−3 位相等化フィルタ 13 ピッチ周期決定手段 14 ピッチ波形切り出し手段 15 ピッチ波形重ね合わせ手段 16 LPC合成フィルタ 21 入力音声音韻認識手段 22 ピッチ位置決定手段 23 ピッチ周期決定手段 24 ピッチ波形切り出し手段 25 ピッチ波形重ね合わせ手段 26 窓長決定手段

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 音声のピッチ周期毎にピッチ周期の2倍
    程度の長さの窓関数を用いて音声を切り出し、切り出し
    たピッチ波形を所望のピッチ周期間隔で並べ直し、これ
    らを重ね合わせて音声のピッチ周期を変換するPSOL
    A法(Pitch-Synchronous Overlap-add :波形の加算重
    畳によるピッチ変換方法)において、音声の線形予測残
    差信号の短時間位相特性をマッチドフィルタで等化し
    て、ピッチパルス付近にパワーを集中させた位相等化残
    差信号を求め、そのパルスの位置をピッチ位置と定める
    とともに、隣合うパルスの間隔をピッチ周期として定め
    てPSOLA処理を行うことを特徴とするピッチ変換方
    法。
  2. 【請求項2】 位相等化残差信号を用いて、LPC合成
    フィルタで合成した音声位相等化音声に対してPSOL
    A法を適応することを特徴とする請求項1記載のピッチ
    変換方法。
  3. 【請求項3】 PSOLA法または請求項1ないし請求
    項2のピッチ変換方法において、隣合うピッチ周期が異
    なる場合、ピッチ位置を中心として左右非対称の窓を用
    いることを特徴とするピッチ変換方法。
  4. 【請求項4】 PSOLA法または請求項1ないし請求
    項2のピッチ変換方法において、音声のピッチ波形を切
    り出す際、ブラックマン・ハリス窓を用いることを特徴
    とするピッチ変換方法。
  5. 【請求項5】 PSOLA法または請求項1ないしは請
    求項2のピッチ変換方法において、音声のピッチ波形を
    切り出す際、音韻毎に最適な窓長を設定することを特徴
    とするピッチ変換方法。
  6. 【請求項6】 PSOLA法または請求項1ないし請求
    項2のピッチ変換方法において、ピッチ周波数を高くす
    る際においても、ピッチ波形を切り出す窓の窓長を、ハ
    ニング窓を用いる場合は原波形の2倍程度、ブラックマ
    ン・ハリス窓を用いる場合は原波形の3倍程度に設定し
    たことを特徴とするピッチ変換方法。
  7. 【請求項7】 ピッチ周波数を高くする際、ピッチ波形
    が重なり合う箇所の音声の振幅を抑制することを特徴と
    する請求項6記載のピッチ変換方法。
  8. 【請求項8】 ディジタル信号に変換された音声波形の
    線形予測残差波形を生成する線形予測処理手段と、線形
    予測残差信号にマッチドフィルタを掛けて短時間位相特
    性を等化して位相等化処理を行い、位相が等化されてエ
    ネルギが集中したパルス位置をピッチ位置と決定する位
    相等化処理手段と、隣合うピッチ位置の間隔をピッチ周
    期と決定する手段と、決定されたピッチ位置を中心に窓
    関数でピッチ波形を切り出す手段と、切り出したピッチ
    波形を所望のピッチ間隔で並べ直す手段を備えたピッチ
    変換装置。
  9. 【請求項9】 位相等化処理手段で算出された位相等化
    残差信号と、線形予測処理手段から算出された線形予測
    係数を用いて位相等化音声信号を生成するLPC合成フ
    ィルタを備え、この生成された位相等化音声からピッチ
    波形を切り出し、切り出した位相等化ピッチ波形を所望
    のピッチ周期で並べ直すことを特徴とする請求項8記載
    のピッチ変換装置。
JP7014509A 1995-01-31 1995-01-31 ピッチ変換方法およびその装置 Pending JPH08202395A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7014509A JPH08202395A (ja) 1995-01-31 1995-01-31 ピッチ変換方法およびその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7014509A JPH08202395A (ja) 1995-01-31 1995-01-31 ピッチ変換方法およびその装置

Publications (1)

Publication Number Publication Date
JPH08202395A true JPH08202395A (ja) 1996-08-09

Family

ID=11863050

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7014509A Pending JPH08202395A (ja) 1995-01-31 1995-01-31 ピッチ変換方法およびその装置

Country Status (1)

Country Link
JP (1) JPH08202395A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000276196A (ja) * 1999-03-29 2000-10-06 Victor Co Of Japan Ltd オーディオ符号化ストリーム復号化方法
WO2004072951A1 (en) * 2003-02-13 2004-08-26 Kwangwoon Foundation Multiple speech synthesizer using pitch alteration method
JP2005274721A (ja) * 2004-03-23 2005-10-06 Yamaha Corp 音響効果装置及びプログラム
JP2006301464A (ja) * 2005-04-22 2006-11-02 Kyushu Institute Of Technology ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法
US8271284B2 (en) 2006-07-21 2012-09-18 Nec Corporation Speech synthesis device, method, and program
US9257131B2 (en) 2012-11-15 2016-02-09 Fujitsu Limited Speech signal processing apparatus and method

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000276196A (ja) * 1999-03-29 2000-10-06 Victor Co Of Japan Ltd オーディオ符号化ストリーム復号化方法
WO2004072951A1 (en) * 2003-02-13 2004-08-26 Kwangwoon Foundation Multiple speech synthesizer using pitch alteration method
JP2005274721A (ja) * 2004-03-23 2005-10-06 Yamaha Corp 音響効果装置及びプログラム
JP2006301464A (ja) * 2005-04-22 2006-11-02 Kyushu Institute Of Technology ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法
JP4599558B2 (ja) * 2005-04-22 2010-12-15 国立大学法人九州工業大学 ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法
US8271284B2 (en) 2006-07-21 2012-09-18 Nec Corporation Speech synthesis device, method, and program
US9257131B2 (en) 2012-11-15 2016-02-09 Fujitsu Limited Speech signal processing apparatus and method

Similar Documents

Publication Publication Date Title
EP1308928B1 (en) System and method for speech synthesis using a smoothing filter
US8195464B2 (en) Speech processing apparatus and program
JP2007316254A (ja) オーディオ信号補間方法及びオーディオ信号補間装置
JPH08202395A (ja) ピッチ変換方法およびその装置
JP3559485B2 (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP3515215B2 (ja) 音声符号化装置
JP3515216B2 (ja) 音声符号化装置
JP3552201B2 (ja) 音声符号化方法および装置
JP4447546B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3748081B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3770901B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2615856B2 (ja) 音声合成方法とその装置
JP3676801B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2005024794A (ja) 音声合成方法と装置および音声合成プログラム
JP3576794B2 (ja) 音声符号化/復号化方法
JP3748082B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3773509B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法
JPS63127299A (ja) 音声信号符号化・復号化方式およびその装置
JP3636327B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3748080B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP4087823B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JPS5965895A (ja) 音声合成方法
JP2007505346A (ja) 遷移のオーディオ信号成分の符号化
JP3770899B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3770900B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置