WO2006046761A1

WO2006046761A1 - ピッチ変換装置

Info

Publication number: WO2006046761A1
Application number: PCT/JP2005/020156
Authority: WO
Inventors: Takuya Fujishima; Jordi Bonada
Original assignee: Yamaha Corporation
Priority date: 2004-10-27
Filing date: 2005-10-27
Publication date: 2006-05-04
Also published as: EP1806740B1; EP1806740A1; US20070282602A1; ATE515021T1; US7490035B2; JPWO2006046761A1; EP1806740A4; JP4840141B2

Abstract

ピッチ変換装置は、入力音の振幅スペクトルからピークスペクトルP1及びP2を検出する。ピッチ変換装置は、ピークスペクトルP1の第1周波数f1を含む第1周波数領域A1の振幅スペクトル分布AM1を、その形状を維持するピッチ変換比を用いて圧縮又は伸長し、ピッチ変換後第1周波数領域A10の振幅スペクトル分布AM10を得る。ピッチ変換装置は、ピークスペクトルP2近傍の振幅スペクトル分布AM2を同様に圧縮又は伸長し振幅スペクトル分布AM20を得る。ピッチ変換装置は、ピークスペクトルP1とP2の間の中間周波数領域A3の振幅スペクトルを各振幅スペクトルの周波数に応じた所定のピッチ変換比で圧縮又は伸長することによりピッチ変換を行う。

Description

明細書

ピッチ変換装置技術分野

本発明は、音データのピッチを変換するピッチ変換装置に関する背景技術

従来から、曰声や楽音などの立

曰丁夕のピッチを変換する種々のピッチ変換置が知られているのうちのつのピッチ亦は、所定の立

曰丁一夕を時間領域の表現 (時間領域表現 ) から周波数領域の表現 (周波数領域表現 ) へと変換し、変換後の立

曰丁一夕に基づいて振幅スぺク卜ノレのピクスぺクトルを含む周波数領域を特定し、その特定された周波数領域の振幅スぺク卜ルだけを律に所定シフ卜だけ周波数軸上でシフトするよ Ό になつている（例 7Lば、米国特許第 6 5 4 9 8 8 4号明細書（図 3 、図 4 A乃至図 4 C ) を参照。 )

ところで、一般に、音データの中には異なる周波数を有するピクスぺクトルが二つ以上存在し、当然、その二つのピークスぺクル間（各ピ一クスぺクトルに対応する周波数の間の中間周波数領域

) にも振幅スぺクトルは存在する。しかしながら、上記従来の技術によれば、中間周波数領域内の振幅スぺクトルは切り捨てられ、ピッチ変後の振幅スぺクトルに反映されない。この結果、ピッチ変換後の曰が不自然な音を含む場合があり得るという問題があた発明の開示

従つて、本発明の目的の一つは、振幅スぺクトルを不均一な変換比をもつて実質的に圧縮又は伸長することにより、入力音（原立曰 ) の特徴を残しながら不自然な音を発生する音デ一夕が生成されてしまうことを回避できるピッチ変換装置を提供するとにある

この百的を達成するための本発明によるピッチ変装置は、入力された時間領域表現の音データを周波数領域表現への立

曰丁夕へと変換する時間周波数変換手段と、

刖 pd周波数領域表現に変換された音デ夕のピッチを変換してピッチ変換後の音デー夕を生成するピッチ変換手段と、

刖 dピツチ変換後の音データを周波数領域表現から時間領域表現へと変換する周波数時間変換手段と

前記時間領域表現に変換された音つ—夕を出力する出力手段とを備えている

更に、前記ピ Vチ変換手段は、

前記周波数領域表現に変換された音デ一夕の振幅スぺク卜ルに基づいて同音デ夕の特徴を表す振幅スぺクトルを選択振幅スぺクルとして少な < とも一つ選択し、同選択振幅スぺク卜ルに対する周波数である選択周波数を含む所定の周波数領域である選択周波数領域の振幅スぺクル分布の形状を実質的に維持しながら同音デ夕の振幅スぺク卜ルを周波数軸上で圧縮又は伸長するように構成されている。

これによれば、入力音（原音）の特徴を適切に表す選択周波数領域 A 1 の振幅スぺクトル分布 A M I の形状が維持されながら音テ夕のピッチ変換が行われるので、入力音の特徴がピ Vチ変換後にいても維持される。更に、選択周波数領域 A 1 以外の領域の振幅スぺクトルは切り捨てられることなくピッチ変換後の振幅スぺク卜ルに反映される。従って、ピツチ変換後の音データに不自然な立曰を発生してしまうような音デ一夕が含まれてしまうことを回避するとができる。

本発明によるピッチ変換装置の目様は、

入力された時間領域表現の音データを周波数領域表現への音テ夕へと変換する時間周波数変換手段と

前記周波数領域表現に変換された立

曰デ一夕の振幅スベクトルを周波数軸上にて圧縮又は伸長することによりピッチ変換後の音デ夕を生成するピッチ変換手段と

前記ピツチ変換後の音データを周波数領域表現から時間領域表現へと変換する周波数時間変換手段と

前記時間領域表現に変換された音丁一夕を出力する出力手段とを備えている。

更に、前記ピッチ変換手段は、

前記周波数領域表現に変換された立

曰データの振幅スベクトルに基づいて同音データの特徴を表す振幅スぺクトルを選択振幅スぺク卜ルとして少なくとも一つ選択し、

同選択振幅スぺクトルが、同選択振幅スぺクトルに対する周波数である選択周波数に所定のピツチ変換比 kを乗じて得られる周波数であるピッチ変換後選択周波数に対する振幅スぺク卜ルとなるよつに、同選択振幅スぺク卜ルを周波数軸上で移動し

1口 J 択周波数を今む所定の周波数領域である選択周波数領域の各振幅スベクトルが同各振幅スぺク卜ルに対する周波数から、^B着択周波数を減じた値に同ピッチ変換比 kよりも 1 に近い局所変換比 m を乗じた値を同ピヅチ変換後選択周波数に加えるとにより得られる周波数の振幅スぺク卜ルとなるように、同選択周波数領域の各振幅スぺクトルを周波数軸上で圧縮又は伸長し

刖記選択周波数領域以外の各振幅スぺク卜ルが、「同各振幅スぺク卜ルに対する周波数」に「同各振幅スぺクトルに応じた他のヒッチ変換比」を乗じて得られる周波数に対する振幅スぺクトルとなるよに、同選択周波数領域以外の各振幅スぺクトルを周波数軸上で圧縮又は伸長するように構成されている。

れによれば、入力音の特徴を適切に表す選択振幅スぺクトル P

1 が同選択振幅スぺク卜 Jレに対する周波数 (選択周波数） f 1 に所定のピツチ変換比 kを乗じて得られるピッチ変換後選択周波数 f

1 0 ( = k · f 1 ) に対する振幅スベクトル P 1 0 となるように、周波数軸上で移動せしめられる

更に、選択周波数 f 1 を含む周波数領域である選択周波数領域 A

1 の各振幅スぺクトルが、同各振幅スぺク卜ルに対する周波数 f n から同選択周波数 f 1 を減じた値（ = f n ― f 1 ) にピッチ変換比 kよりも 1 に近い局所変換比 mを乗じた値 ( = m - ( f n - f 1 )

) をピッチ変換後選択周波数 f 1 0 に加えることにより得られ周波数 ( m • ( f n - f 1 ) + k · f 1 ) の振幅スぺク卜リレとなるよ Όに周波数軸上で圧縮又は伸長せしめら 0

の結果入力音の特徴を表す選択周波数領域 A 1 のスぺクトル分布 A M 1 が分布形状を維持しながらピッチ変換後のデータに移行されるので入力音の特徴がピッチ変換後において維持されるれに対し m記選択周波数領域 A 1以外の各振幅スぺクトルは

1口]各振幅スぺクトルに対する周波数 f nに同各幅スぺク卜ルに応じたピ Vチ変換比を乗じて得られる周波数に対する振幅スぺク卜ルとなるように、周波数軸上で圧縮又は伸長せしめられ。

れにより、選択周波数領域 A 1以外の振幅スぺク卜ルは切り捨てられるとなく、ピッチ変換後の振幅スぺクトルに反映される従てピ Vチ変換後の音データに不自然な音を発生してしまうような音う夕が含まれてしまうことを回避することができる本発明によるピヅチ変換装置の他の態様は、上記ピッチ亦換装置と同様、時間周波数変換手段と、ピッチ変換手段と、周波数時間変換手段と、出力手段と、を備える。

そして、このピチ変換装置のピッチ変換手段によれば、

、 t

刖周波数領域表現に変換された立

曰デ一夕の振幅スぺク卜ルの中から少なくとも 2 のピークスぺク卜ルである第 1 ピ一クスぺク卜ル P 1 及び同第 1 ピ一クスぺクトル P 1 に対する周波数である第 1 周波数 f 1 よりち高い第 2周波数 f 2 を有する第 2 ピ ―クスぺクトル P 2が選択される

更に、第 1 ピ ―クスぺク卜ル P 1 は、第 1 周波数 f 1 に所定のピツチ変換比 kを乗じて得られる周波数であるピッチ変換後第 1周波数 f 1 0 ( = k • f 1 ) に対する振幅スぺクトル P 1 0 となるように周波数軸上で移動しせしめられる

また、第 1 周波数 f 1 を含む周波数領域である第 1 周波数領域 A

1 の各振幅スぺク卜ルは、同各振幅スぺクトルに対する周波数 f n から同第 1 周波数 f 1 を減じた値（ ^: f n - f 1 ) に同ピッチ変換比 kよりも 1 に近い局所変換比 mを乗じた値（ = m · ( f n一 f 1

) ) を同ピッチ変換後第 1周波数 f 1 0 に加えることにより得られる周波数 ( = m • ( f n - f 1 ) + k • f 1 ) の振幅スぺクトルとなるように、周波数軸上で圧縮又は伸長せしめられる

同様に第 2 ピ一クスぺク卜ル P 2 は、第 2周波数 ί 2 に、

刖記所定のピッチ変換比 kを乗じて得られる周波数であるピッチ変換後第 2 周波数 f 2 0 ( = k • f 2 ) に対する振幅スぺクトル P 2 0 となるように周波数軸上で移動せしめられる。

また、第 2.周波数 f 2 を含む周波数領域である第 2周波数領域 A 2 の各振幅スぺクトルは、同各振幅スぺクトルに対する周波数 f n から同第 2周波数 f 2 を減じた値（= f n— f 2 ) に前記局所変換比 mを乗じた値（ = πι · ( f n - f 2 ) ) を同ピッチ変換後第 2周波数 f 2 0 に加えることにより得られる周波数（ = ηι · ( f n - f 2 ) + k - f 2 ) の振幅スペクトルとなるように、周波数軸上で圧縮又は伸長せしめられる。

この結果、ピッチ変換後の信号に入力音の特徴を表す第 1 ピークスぺクトル P 1近傍のスぺクトル分布 A M I と第 2 ピークスぺクトル P 2近傍のスぺクトル分布 A M 2が各分布形状を維持しながらピツチ変換後のデータに移行されるので、入力音の特徴がピッチ変換後においても維持される。

一方、第 1 周波数領域 A 1 と第 2周波数領域 A 2 との間の中間周波数領域 A 3 の各振幅スぺクトルは、同各振幅スぺクトルに対する周波数 f nに同各振幅スぺクトルに応じたピッチ変換比を乗じて得られる周波数に対する振幅スぺクトルとなるように周波数軸上で圧縮又は伸長せしめられる。

これにより、中間周波数領域 A 3 内の振幅スペクトルは切り捨てられることなく、ピッチ変換後の振幅スペクトルに反映される。従つて、ピッチ変換後の音デ一夕に不自然な音を発生してしまうような音データが含まれてしまうことを回避することができる。

この場合、

前記ピッチ変換手段は、

横軸の X軸にピッチ変換前の周波数、縦軸の Y軸にピッチ変換後の周波数をとつたグラフを想定し、 kを前記所定のピッチ変換比、 mを前記局所変換比、 a 1及び a 2 を所定の定数、前記第 1周波数を f l 、前記第 2周波数を f 2、前記第 1 周波数領域の最大周波数を f 1 max, 前記第 2周波数領域の最小周波数を f 2 minとするとき前記第 1 周波数領域においては Y = m · X + a 1 なる関数に基づいて同第 1 周波数領域内の各振幅スぺクトルを周波数軸上で圧縮又は伸長し、

前記第 2周波数領域においては Y ==m · X + a 2なる関数に基づいて同第 2周波数領域内の各振幅スぺクトルを周波数軸上で圧縮又は伸長し、

¾:は ¾: = ( (m - f 2 + a 2 ) 一 ( m - f 1 + a 1 ) ) / ( f 2 一 f 1 ) の関係を満たし、

前記中間周波数領域においては点（ f 1 max, ί 1 max + a 1 ) と点（ f 2 min、 f 2 rain+ a 2 ) とを結ぶ所定の関数 Y = T f ( X ) に基づいて同中間周波数領域内の各振幅スペクトルを周波数軸上で圧縮又は伸長するように構成されることが好ましい。関数 T f ( X ) は、直線であってもよいし、曲線であってもよい。

更に、前記ピッチ変換手段は、

前記中間周波数領域内の各振幅スぺクトルを周波数軸上で圧縮又は伸長するとき、各振幅スぺクトルを同各振幅スぺクトルよりも小さい値とした上で圧縮又は伸長するように構成されることが好適である。

これによれば、入力音の特徴を表す部分以外の振幅スぺクトルが小さくなるので、結果として、より入力音の特徴が反映されたピッチ変換後の音データが得られる。

加えて、前記ピツチ変換手段は、 BU B己 £h縮又は伸長後の周波数が所定の高側閾値以上の周波数となつた領域についての振幅スぺク卜

、ルを実質的に 0 にするように構成されてもよく、或いは、刖記圧縮又は伸長後の周波数が所定の低側閾値以下の周波数となつた領域についての振幅スぺク卜ルを実質的に 0 にするょラに成されてもよい。

これによれば、周波数軸上での圧縮又は伸長にり、通常の演奏などにおいてはあり得ない |¾周波数又は低周波数に対する振幅スぺクトルが発生した場合であつても、そのような周波数の振幅スぺクルが削除されるのし、 6果として、良好な立

曰を得るしとが可能な立

曰丁一タ ^:生成することができる図面の簡単な説明

図 1 は、本発明の実施形態に係るピッチ変換装置の構成を示したブロック図である。

図 2は、図 1 に示したピッチ変換装置によるピッチ変換方法の概要を説明するためのグラフである。

図 3 は、図 1 に示したピッチ変換装置によるピッチ変換方法の概要を説明するためのグラフである。

図 4は、図 1 に示したピッチ変換装置によるピッチ変換方法の具体例を説明するためのグラフである。

図 5 は、図 1 に示したピッチ変換装置によるピッチ変換方法の具体例を説明するためのグラフである。

図 6 は、図 1 に示したピッチ変換装置によるピッチ変換方法の変形例を説明するためのグラフである。。

図 7 は、図 1 に示したピッチ変換装置によるピッチ変換方法の他の変形例を説明するためのグラフである。発明を実施するための最良の形態

以下、本発明によるピッチ変換装置の実施形態について図面を参照しながら説明する。

(構成）

図 1 に示したように、このピッチ変換装置 1 0 は、入力部 1 1 、時間—周波数変換部 1 2、ピッチ変換処理部 1 3 、周波数—時間変換部 1 4、出力部 1 5及び制御部 1 6 を備えている。なお、各部の機能は、実際には制御部 1 6 を含んでなるコンピュータとして構成されたピッチ変換装置 1 0 の C P U (図示省略）が所定のプロダラムを実行することにより達成される。

入力部 1 1 は、入力されるアナログの信号をデジタルの信号に変換してから出力する AZDコンバータを含んでいて、入力されたァナログの音信号をデジタル信号（データ） S 1 に変換するようになつている。このようにして得られるデータは、時間領域で表現された音データ（時間領域表現の音データ） S 1 である。入力部 1 1 に入力される信号は、マイクロフォンを介して入力部 1 1 に入力されてもよく、或いは、他の装置から直接入力されてもよい。他の装置から入力部 1 1 にデジタル信号が入力される場合、入力部 1 1 はその入力デジタル信号をピッチ変換装置 1 0 に適合したデジタル信号に変換する。

時間一周波数変換部 1 2 は入力部 1 1 と接続されていて、入力部 1 1 からの音データ S 1 を受信するようになっている。時間一周波数変換部 1 2 は、音データ S 1 を時間領域の表現から周波数領域の表現へと変換するようになっている。即ち、時間—周波数変換部 1 2 は、時間領域で表現された入力音デ一タ S 1 を一連の時間フレームに区分し、各フレーム毎に F F T (Fast Fourier Transform) 等により周波数分析を実行して周波数スペクトル（振幅スペクトル及び位相スペクトル）を取得する。この周波数スペクトルが、周波数領域で表現されたデータ（周波数領域表現の音データ） S 2であるピッチ変換処理部 1 3 は、時間一周波数変換部 1 2 と接続されていて、時間一周波数変換部 1 2からのデータ S 2 を受信するようになっている。ピッチ変換処理部 1 3 は、後に詳述するピッチ変換処理をデータ S 2 に対して実行してピッチ変換後のデータ S 3 を生成するようになつている。データ S 3 は、周波数領域のフレームデー夕（振幅スペクトルデータ及び位相スペクトルデ一夕）である。ピツチ変換処理部 1 3 は、図示しない設定器から入力される信号に基づいて、後述するヒツナ変換比（ k ) 等のピッチ変換処理に必要なパラメ一タを変更することができるよ Ό になつている

周波数時間換部 1 4は、ピッチ久換処理部 1 3 と接続されていて、ピクチ変換処理部 1 3力 ^らのァ. タ S 3 を受信するようになている周波数一時間変換部 1 4は、つ夕 S 3 に逆 F F T処理を施して周波数領域で表現されている丁一夕 S 3 を時間領域で表現されたデ ―タ S 4 に変換し、その変換したデ一夕 S 4 を出力するよ

Όになつている

出力部 1 5 は D / A 3ンバータを含んで構成されていて、周波数一時間変換部 1 4 と接 zされている出力部 1 5 は、周波数一時間変換部 1 4から入力したデータ S 4 を所定の夕ィングにて D A 変換レ、換したアナ口グ信号を曰として出力するようになっているなお、出力部 1 5 は、前記変換したァナ口グ信を電気信号のまま外部に出力したり、丁 —夕 S 4を丁ジ夕ルデ夕のまま出力したり、或いは、テ一夕 S 4 を他の記憶手段に Pし ί するようにしてもよい。

制御部 1 6 は、 C P U 、 R O M及び R A Μ等を含む周知のンピュ一夕であ Ό 、上記各部の処理を行うとともに、入力部 1 1 の A /

Dコンパ一夕及び出力部 1 5 の D Z Aコンバ一夕等のデバィスに対して必要な夕ィミングで A D変換及び D A変換などの各処理を行わせる指示を出力するようになつている。

なお、ピッチ変換処理部 1 3 の本願に関する処理内容を除さ、上記各部の詳細については、例えば、本願の出願人により先に出願された特開 2 0 0 3一 2 5 5 9 9 8号公報に記載されている

(ピッチ変換処理の概要）

次に、上記ピッチ変換処理部 1 3 により達成されるピッチ換の概要について図 2及び図 3 を参照しながら説明する。以下の説明において参照される図面中の周波数は総てリニアプロッ卜によ Ό表されているまた、図 2及び図 3 はピッチを高音側にシフ卜する例を示している

図 2 ( A ) は、あるフレムのピッチ変換前の振幅スぺク卜ル（上記のデ ―タ S 2 に含まれる振幅スぺクトル）を示したグラフである。この例においては、第 1 周波数 ί 1 に振幅スぺクトルの所的ピーク（第 1 ピ一クスぺク卜ル） Ρ 1 が存在し、第 1 周波数よりも大きい第 2周波数 f 2 に他の振幅スぺクトルの局所的ピーク (第 2 ピークスぺク卜ル） P 2が存在している先ず、ピッチ変換処理部

1 3 は、デー夕 S 2 に基づいて、の局所的ピークを検出する。局所的ピ一クは近隣の複数のピ一クについて振幅値が最大のピークを検知する方法等により検出される

以上の処理により、周波数領域の表現に変換された音データの振幅スぺクトルに基づいて同音デー夕の特徴を表す振幅スベクトルが選択振幅スぺクトル (第 1 ピークスぺク卜ル Ρ 1 及び第 2 ピークスぺクトル P 2 ) として少な < とち一つ (ここではつ ) 選択されたことになる

次に、ピッチ変換処理部 1 3 は検出した各局所的ピークに対する周波数（この - ¾m口、第 1 周波数 f 1及び第 2周波数 f 2 ) を含む所定の周波数領域（スぺクトル分領域）を特定 (指定 ) する。図

2 ( A ) の例においては、ピッチ亦換処理部 1 3 は、第 1 ピークスぺクトル P 1 に対する第 1 周波数 f 1 を含む所定周波数領域を第 1 周波数領域 A 1 として特定する。のような周波数領域の特定は、種々の方法により成され得る。例えば、ピツチ変換処理部 1 3 は、第 1周波数： f 1 と第 2周波数 f 2 との差の半分に Γ 1 J 以下の正の値を乗じて得られる周波数 Δ f を第 1周波数 f 1 に加えて得られた周波数（ = f l + A f ) を第 1 周波数領域 A 1 の最大周波数 f l maxとする。同様に、ピッチ変換処理部 1 3 は、第 1 周波数 f 1 から前記周波数 Δ ί を減じて得られた周波数（= f l — A f ) を第 1 周波数領域 A 1 の最小周波数 f l rainとする。第 1 周波数領域 A 1 の各周波数に対する振幅スぺクトルは振幅スぺクトル分布 AM 1 を有する。

同様に、ピッチ変換処理部 1 3 は、第 2 ピークスペクトル P 2 に対する第 2周波数 f 2 を含む所定周波数領域を第 2周波数領域 A 2 として特定する。第 2周波数領域 A 2 の最大周波数及び最小周波数はそれぞれ f 2 iax (例えば、 f 2 max= f 2 + Δ f ) 及び f 2 min (例えば、 f 2 min= f 2 — Δ ί ) である。第 2周波数領域 A 2 の各周波数に対する振幅スぺクトルは振幅スぺクトル分布 ΑΜ 2 を有する。

以上の処理により、選択周波数（第 1 周波数 f 1 又は第 2周波数 f 2 ) を含む周波数領域である選択周波数領域（第 1 周波数領域 A 1 又は第 2周波数領域 A 2 ) の各振幅スペクトルが決定される。次いで、ピッチ変換処理部 1 3 は、以下のように振幅スペクトルを周波数軸上で圧縮又は伸長することにより、ピッチ変換を行う。なお、図 2及び図 3 の例においては、振幅スペクトルは周波数軸上で伸長される。即ち、ピッチ変換比 kは「 1」より大きい値である

( A ) ピッチ変換処理部 1 3 は第 1 ピークスぺクトル P 1 が、第

1 周波数 f 1 に所定のピッチ変換比 kを乗じて得られる周波数であるピッチ変換後第 1周波数 f 1 0 ( k · f 1 ) に対する振幅スぺクトルとなるように、第 1 ピ ―クスぺク卜ル P 1 を周波数軸上で移動するれにり得られる変換第 1 ピークスぺク卜ル P 1 0 の大きさは第 1 ピークスぺク卜ル P 1 の大きさと等しい

( B ) ピッチ亦换処理部 1 3 は第 1周波数領域 A 1 の各振幅スぺクトル P nが 1口 J各振幅スぺク hル P n に対する周波数 f nから第

1周波数 f 1 を減じた値 ( f n ― f 1 ) にピッチ変換比 kよりも

1 に近い局所変換比 mを乗じた値 ( m · ( f n - f 1 ) ) を上記ピッチ変換後第 1 周波数 f 1 0 ( = k • f 1 ) に加えるとにより得られる周波数 ( = m * ( f n 一 f 1 ) + k · f 1 ) の振幅スぺクトルとなるよ Ό に、第 1周波数領域 A 1 の各振幅スぺク卜ルを周波数軸上で圧縮又は伸長するの例において、局所変換比 mの値は

Γ 1 J に定されている

以上の処理にり、第 1周波数領域 A 1 の振幅スぺクトル分布 A

M 1 は形状 (分布状態 ) を変えるとなくピッチだけが変換され

、ピッチ換後第 1周波数域 A 1 0 の振幅スぺクトル分布 A M 1

0 となる

( C ) 様にピッナ変換処理部 1 3 は第 2 ピクスぺク卜ル P

2が、第 2周波数 f 2 に所定のピッチ変換比 kを乗じて得られる周波数であるピチ変換後第 2周波数 f 2 0 ( = k • f 2 ) に対する振幅スぺクルとなるように、第 2 ピ ―クスぺクトル P 2 を周波数軸上で移動するこれにより得られる変換後第 2 ピークスベクトル

P 2 0 の大きさは、第 2 ピ ―クスぺク卜ル P 2 の大きさと等しい。

( D ) 更にピッチ変換処理部 1 3 は第 2周波数 τ¾域 A 2 の各振幅スぺク卜ル P nが、同各振幅スぺク卜ル P n に対する周波数 f n から第 2周波数 f 2 を減じた値 ( f n 一 f 2 ) にピ Vチ変換比 k よりも 1 に近い局所変換比 m ¾乗じた値 ( = m • ( f n ― f 2 ) ) を上記ピッチ変換後第 2周波数 f 2 0 ( = k • f 2 ) に加えることにより得られる周波数 ( m · ( f n ― f 2 ) + k · f 2 ) の振幅スペクトルとなるように、第 2周波数領域 A 2 の各振幅スペクトルを周波数軸上で圧縮又は伸長する。

以上の処理により、第 2周波数領域 A 2 の振幅スペクトル分布 A M 2 は、形状（分布状態）を変えることなくピッチだけが変換され、ピッチ変換後第 2周波数領域 A 2 0 の振幅スペクトル分布 AM 2 0 となる。

( E ) ピッチ変換処理部 1 3 は、更に、第 1周波数領域 A 1 と第 2 周波数領域 A 2 との間の中間周波数領域 A 3 の振幅スぺクトルについてピッチ変換を行う。このピッチ変換について、特に、図 3 を参照しながら説明する。

図 3 は、横軸の X軸にピッチ変換前の周波数 f a、縦軸の Y軸にピッチ変換後の周波数 f b をとつたグラフである。以下において、第 1周波数 f l の変換関数 T f ( X ) 上の点を点 Q 1 とし、第 2周波数 f 2 の変換関数 T f ( X ) 上の点を点 Q 2 とする。同様に、第 1 周波数領域 A 1 の最大周波数 f l maxの変換関数 T f ( x ) 上の点を点 Q 1 Uとし、第 2周波数領域 A 2 の最小周波数 f 2 ininの変換関数 T f ( X ) 上の点を点 Q 2 L とする。

この場合、第 1周波数領域 A 1 に対しては、下記の（ 1 ) 式により示される変換関数 T f ( X ) の変数 Xにピッチ変換前の周波数' f a を代入することにより、ピッチ変換後の周波数 f b ( = y ) が決定されていることになる。

y = T f ( x ) =m - x + a l = x + a l = x + A S l -- ( 1 ) 同様に、第 2周波数領域 A 2 に対しては、下記の（ 2 ) 式により示される変換関数 T f ( X ) の変数 Xにピッチ変換前の周波数 ί a を代入することにより、ピッチ変換後の周波数 ί b (= y ) が決定されていることになる。

y = T f ( x ) =m - x + a 2 = x + a 2 = x + A S 2 -- ( 2 ) 一方、ピッチ変換処理部 1 3 は、中間周波数領域 A 3 に対し、点 Q 1 Uと点 Q 2 L とを直線で結ぶ変換関数 T f ( X ) = T 1 f ( x ) に従ってピッチ変換を行う。即ち、点 Q 1 Uの座標は（ f 1 max , f 1 0 max) = ( f 1 max, f 1 max + a 1 ) であり、点 Q 2 Lの座標は（ f 2 min, f 2 0 min) = ( f 2 min, f 2 min+ a 2 ) であるから、中間周波数領域 A 3 に対する変換関数 T f ( X ) = T 1 f ( x ) は下記の（ 3 ) 式により表される。、 f2min - f 1 max + a2 -a1 a1 "f2min - a2-f1 max y=Tf(x) =—— - ~~：一 x + 一 ■臃■ (3)

f2min一 f1 max f2min一 f1 max ヒッチ変換処理部 1 3 は、上記（ 3 ) 変換前の周波数 aに対する振幅スぺク卜ルがピッチ変換後数 f b =

、

T f ( f a ) の振幅スぺク卜ルとなるよに、ピッ刖の周波数 f aに対する振幅スぺク卜ルをピッチ変換する。、上記

( 3 ) 式を満たす点 ( f a , T f ( f a ) ) と原点 oとを結んだ直線の傾きが、周波数 f a の振幅スぺクトル対するピッチ変換比 P f a ということになる。即ち、中間周波数領域 A に対するピッチ変換比 P f aは、各振幅スぺクトルに対して各振

スぺクトルの周波数に応じて一に定められる

なお、ピッチ変換比 kは点 Q 1 と点 Q 2 とを直線で結んだ場合の傾きであるか、局所変換比 mとの間に下記（ 4 ) 式により表される関係を満たしている

k = ( ( m • f 2 + a 2 ) ― ( m · f 1 + a 1 ) ) / ( f 2 - f

1 ) … ( 4 )

換言すると、、ヒッチ変換処理部 1 3 はピッチ変前の各音タをピッチ変換比 kにより周波数軸上で律に圧縮 ( k < 1 ) 又は伸長（ k > 1 ) する代わりに、ピークスぺクル P 1及びークスぺクトル P 2 の近傍の in .„

曰ァタ (第 1周波数領 A 1 の音換縮づデのピ k一夕及び第 2周波数領域 A 2 の音デ一タ）については質的に圧及び伸長をすることなく、そのピッチだけがピ Vチ変比 k く量だけ変換されるような圧縮又は伸長を行うにピッチ処理部

1 3 は、中間周波数領域 A 3 の音データをピクチ変換比とは異なる変換比であって各振幅スぺクトル（各幅スぺクドル波.数

) に応じた変換比により周波数軸上で圧縮又は伸長する

このように、ピッチ変換処理部 1 3 は振幅スぺク卜ルを周波数に関して非線形に圧縮又は伸長してピッチ変換を行うの、入力音（原立、

曰 J の特徴をよく表している第 1 周波数領域 A 11 のスぺク卜ル分布 A M 1 及び第 2周波数領域 A 2 のスぺクル分布布 A M 2 は

、その分布を維持した状態でピツチ変換される。従つて、ピッチ変換後の音夕に基づいて発立

曰される音は入力音の特徴を維持した音となるた、中間周波数領域 A 3内の振幅スぺクトルは切り捨てられることなく、ピツチ変換後の振幅スぺク卜ルに反映される。従つて、ピッチ変換後の音デ一夕に基づいて発音される音は違和感の少ない音となる。

なお、中間周波数領域 A 3 に対する変換関数 T f ( X ) は、種々の関数とすることがでさる例えば、この変換関数 T f ( X ) は、図 3 に破線の曲線 T 2 f ( X ) にて示したように、点 Q 1 Uから点

Q 2 Lに向うにつれて傾さが局所変換比 mから次第に変化（ k > 1 のときは増大、 k < l のとさは減少 ) し、その後再び局所変換比 m に近づくような関数であつてもよい

更に、第 1周波数領域 A 1及び第 2周波数領域 A 2 に対する変換関数 T f ( X ) は、各周波数領域のスぺクトル分をほぼ維持した状態にて同各周波数領域のピッチ変換がなされる関数であればよい

。従って、例えば、上記局所変換比 mは必ずしも一定である必要はなく、また、変換関数 T f ( X ) は n次式や任意に定めた関数であつてもよい。また、ピッチ変換処理部 1 3 は、振幅スぺクト Jレのピツチ変換に応じて当然に位相スぺクルを修正する

(ピッチ変換処理の実際の作動）

次に、ピッチ変換処理部 1 3 の実ポの作動例について図 4及び図

5 を参照しながら説明する図 4は立

曰テ一夕 S 2 を伸長するピッチ変換の例であり、（A ) はピッチ変換刖の振幅スぺクトル、 ( B ) はピッチ変換後の振幅スぺクトルを示している図 5 は音丁一夕 S

2 を圧縮するピッチ変換の例であり、 ( A ) はピ Vチ変換前の振幅スペクトル、（ B ) はピッチ変換後の振幅スぺクル示している

。これらにおいて、第 1 ピクスぺク bル P 1 の周波数は第 1周波数 g l であり、第 2 ピ一クスぺクル P 2の周波数は第 2周波数 g nである。また、第 1 周波数 1 と第 2周波数 g n との中間の周波数を中間周波数 g c とし ( g c = ( g 1 + g n ) / 2 ) 、第 1周波数 g 1 から中間周波数 g c までの差を y 2又は X c とおく

1 . 入力音データの伸長

先ず、入力音データを伸長するピッチ亦 ½.の場合について説明すると、ピッチ変換処理部 1 3 は、図 4にしたように、第 1周波数 g l の第 1 ピークスぺク hル P 1 をピッチ変換後第 1周波数 h 1 のスペクトル（ピークスぺク卜ル P 1 0 ) としてそのまま移動する。前述したとおり、 h i = k 1である。 kは 1 より大きい

次に、ピッチ変換処理部 1 3 は、第 1 周波数 g 1 より X 1 だけ大きい周波数 g 2 に対応するピッチ亦

久換後周波数 h 2 ( = k • g 2 )

、の振幅スぺクトルとしてゝ周波数 g 2 に対するピ Vチ変換刖の音デ一夕の振幅スぺク卜ルの値 Q! 2ではな < 、第 1周波数 1 より y 1 だけ大きい周波数 g 2 ' に対応するピッチ変換刖の立

曰つ—タの振幅スぺクルの値 ^ 2 を採用する。この +曰合、 y 1 は X 1 にピツチ変換比 kを乗じた値でめり（即ち、 y 1 = k X 1 ) 、 y 1 は X 1 よりも大さい

この Ό にして、ピツチ変換処理部 1 3 は、第 1 周波数 g 1 カゝらの周波数 X 1 を次第に大きくしながらピヅチ亦久換刖の振幅スぺク卜レを j噴次ピッチ変換して行く。その結果、ピッチ変換の対象となつている振幅スぺク卜ルの周波数が所定の周波数 g 3 ( g 3 = g 1 +

X 2 ) より大きくなると、第 1 周波数 g 1 からの周波数の差 X 1 は差 X 2 Ό大きくなる 2 fa 2 をピ Vチ変換比 k倍した値が y 2 (第 1 周波数 g 1 と中間周波数 g c との差 ) となる値である（

X 2 · k y 2 ) ピツチ変換処理部 1 3 は、第 1周波数 g 1力、らの周波数 0)差 X 1 が X 2 より大きく y 2 小さい領域（即ち、周波数 g 3 〜 g c ) に対して、ピッチ変換後の振幅スぺク卜ルをピッチ変換刖の中間周波数 g c に対する振幅スぺク卜ルの値 Cに e 疋する。

同様に、ピッナ変換処理部 1 3 は、第 2周波数 g nの第 2 ピークスぺクトル P 2 をピッチ変換後第 2周波数 h nのスぺクトル (ピ— クスぺク卜ル P 2 0 ) としてそのまま移動する。刖述したとおり、 h n = k · g nである。

次に、ピッチ変換処理部 1 3 は、第 1周波数 g nより X 1 0 だけ小さい周波数 g n - ίに対応するピッチ変換後周波数 h n - 1 ( = k ·

( g n - 1 ) ) の振幅スぺクトルとして、周波数 g n - 1に対するピッチ変換前の音丁一夕の振幅スぺク卜ルの値 α π - 1ではなく、第 2周波数 g nより y 1 0 だけ小さい周波数 g η - 1 ，に対するピッチ変換前の音デ一夕の振幅スぺク卜ルの値 β η - 1を採用する。この場合、 y

1 0 は X 1 0 にピツチ変換比 kを乗じた値であり（即ち、 y 1 0 = k · X 1 0 ) 、 y 1 0 は X 1 0 より大きい。

このようにして、ピッチ変換処理部 1 3 は、第 2周波数 g riカゝらの周波数 X 1 0 を次第に大きくしながらピッチ変換前の振幅スぺク卜ルを順次ピッチ変換して行くその変換対象の振幅スぺクトルの周波数が所定の周波数 g n - 2より小さくなると、第 2周波数 g nからの周波数の差 X 1 0が X 2 0 より大きくなる。 X 2 0 は、

X 2 0 をピッチ変換比 k倍した値が y 2 となる値である（ X 2 0 · k = y 2 ) 。ピッチ変換処理部 1 3 は、第 2周波数 g nからの周波数の差が x 2 0 より大きく y 2 より小さい領域（即ち、周波数 g c 〜 g n - 2) に対して、ピッチ変換後の振幅スペクトルをピッチ変換前の中間周波数 g c に対する振幅スぺクトルの値 a Cに設定する。

以上のようにして、あるピークスぺクトル P 1 とピークスぺクトル P 1 に隣接するピークスぺクトル P 2 との間の伸長によるピッチ変換が実行される。この場合、第 1 周波数領域 A 1 の最大周波数 f 1 maxは周波数 g 3 であり、第 2周波数領域 A 2 の最小周波数 f 2 ffiinは g n - 2である。実際の音データには、一般にピークスぺクトルが 2以上存在している。従って、ピッチ変換処理部 1 3 は、隣接する二つのピークスペクトルに対して、上述したピッチ変換を実行して行く。

これによれば、ピッチ変換処理の概要にて説明したように、ピ一クスぺクトル P 1 の近傍のスぺクトル分布 AM I はそのままの形状を維持してピッチだけが変換されたスぺクトル分布 A M 1 0 に移行される。同様に、ピ一クスペクトル P 2 の近傍のスペクトル分布 A M 2 はそのままの形状を維持してピッチだけが変換されたスぺクトル分布 A M 2 0 に移行される。また、中間周波数領域 ( f ] L max ~ f 2 min) の振 Iスペクトルは、結果的に所定のピッチ変換比 p k にてピッチ変換される。つまり、周波数 f aの振幅スぺク卜周波数 aを周波数 f aの関数であるピッチ変換比 Ρ k ( f a ) 倍した周波数の振幅スペクトルへと移行される。従て、入力音の特徵を維持し、且つ、ピッチ変換後のスペクトル分布 A M 1 0 と A M

、

2 0 との間にも振幅スぺクトルが存在するので、 7¾和感が生じる音を含まないピ Vチ変換後の音データが生成される

2. 入力音デ ~タの圧縮

次に、入力曰ァ一夕を圧縮するピッチ変換の場合について説明すると、ピッチ変換処理部 1 3 は、図 5 に示したよに、第 1 周波数 1 の第 1 ピクスぺクトル P 1 をピッチ変換後第 1 周波数 h 1 のスぺクトル（ピ一クスペクトル P 1 0 ) としてそのまま移動する。前述したとおり、 h l = k ' g l である。 kは 1 より小さい

次に、ピッチ変換処理部 1 3 は、第 1 周波数 g 1 よ Ό X 1 だけ大きい周波数 g 2 に対応するピッチ変換後周波数 h 2 ( = k · g 2 ) の振幅スぺク卜ルとして、周波数 g 2 に対するピ Vチ目' jの音デ一夕の振幅スぺクトルの値 α 2ではなく、ピッチ変換刖の音データの第 1 周波数 g 1 より y 1 だけ大きい周波数 g 2 ' に対するヒッチ変換前の立

曰タの振幅スぺクトルの値ァ 2 を採用するしの場合 j ，

、 y 1 は X 1 にピッチ変換比 kを乗じた値であり（即ち、 y 1 = k

• X 1 ) 、 y 1 は X 1 よりも小さい。

このようにして、ヒッチ変換処理部 1 3 は、第 1周波数 g 1 からの周波数 X 1 を次第に大きくしながらピッチ亦刖の振幅スぺク卜ルを順次ピッチ変換して行く。その結果、第 1 周波数 g 1 からの周波数の差 X 1 が第 1 周波数 g 1から中間周波数じまでの差 X c と等しくなるしの場合も上記と同様に、ピッチ変換処理部 1 3 は、周波数 g C に対応するピッチ変換後周波数 h c ( = k · g c ) の振幅スぺク卜ルとして、周波数 g c に対するピチ変換前の立

曰データの振幅スぺク卜ルの値 a Cではなく、第 1 周波数 g 1 より y c ( = k · c ) だけ大さい周波数 g 4に対するピッチ変換前の立

曰データの振幅スぺク卜ルの値 Ύ C 1 を採用する。

同様に、ピッチ換処理部 1 3 は、第 2周波数 g nの第 2 ピークスぺクル P 2 をピッチ変換後第 2周波数 h nのスぺク卜ル (ピークスぺク卜ル P 2 0 ) としてそのまま移動する。刖述したとおり、 n = k •

g nである

次に、ピ Vチ変換処理部 1 3は、第 2周波数 g nより X 1 0 だけ小さい周波数 g n - 1に対応するピッチ変換後周波数 h n - 1 ( = k ·

( g n - 0 ) の振幅スぺク卜ルとして、周波数 g n - 1に対するピッチ変換前の曰丁夕の振幅スベクトルの値 α n - 1ではなく、第 2周波数 g nより y 1 0 だけ小さい周波数 g n - 1 ' に対するピッチ変換前の音デ一夕の振幅スぺクルの値ァ n - 1を採用する。この場合、 y

1 0 は X 1 0 にピッチ変換比 kを乗じた値であり（即ち、 y 1 0 = k · X 1 0 ) 、 y 1 0 は X 1 0 より小さい。

このよ Όにして、ピッチ変換処理部 1 3 は、第 2周波数 s πカゝらの周波数 X 1 0 を次第に大きくしながらピッチ変換前の振幅スぺクトルを順次ピッチ変換して行く。その結果、第 2周波数 g nからの周波数の差 X 1 0が S X c と等しくなる。この場合も上記と同様に

、ピッチ変換処理部 1 3 は、周波数 g c に対するピッチ変換後周波数 h c ( = k g c ) の振幅スぺクトルとして、周波数 g c に対

、

するピッチ換の音デ一夕の振幅スぺクトルの値ひ Cではなく、第 2周波数 g nより y 1 C ( = k · X c ) だけ小さい周波数 g n _3 に対するピ Vチ変換前の音データの振幅スぺクトルの値 r C 2 を採用する。

以上のようにして、あるピークスぺクトル P 1 とピークスぺク卜ル P 1 に隣接するピークスぺクトル P 2 との間の圧縮によるピッチ変換が実行される。この場合、第 1周波数領域 A 1 の最大周波数 f l max及び第 2周波数領域 A 2 の最小周波数 f 2 m i iiは共に g c である。実際の音データの中にはピクスぺクトルは 2以上存在している。従つて、ピッチ変換処理部 3 は、隣接する二つのピークスぺクトルに対して、上述したピッ変換を実行して行 <

これによつても、ピッチ変換理の概要にて説明したよラに、ピ

―クスぺクトル P 1 の近傍のスク卜ル分布 A M 1 はそのままの形状を維持してピッチだけが変換換処、チぺ。クさるさピしれたスぺクトル分布 A M 1 0 に移行される。 |ロ]様に、ピークスぺトル P 2 の近傍のスぺク卜ル分布

A M 2 はそのままの形状を維持てピッチだけが変換されたスぺク卜ル分布 A M 2 0 に移行される従つて、入力音の特徴を維持し、且つ、違和感が生じる音を発生せることがないピッチ変換後の音テ一夕が生成される。以上が、ッチ変換処理部 1 3 によるピッチ換処理の実際の作動である。

以上、本発明によるピッチ変の施形態について説明したこのピッチチ変換装置によれば入力の特徴を残し且違和感の

—

ないピツチ変換後の音を発生すための ~タを得るとができるなお、本発明は上記各実施形態に限定されることはな < 、本明の範囲内にいて種々の変形例を採用することができる

例えば、

ッナ変換処理部 1 3 は 6 ( B ) のピッチ変換後の中間周波数域に対する実線 L 1 にて示したよ Ό 、図 6 ( A ) の中間周波数域 A 3 内の各振幅スぺク卜ルを周波軸上で圧縮又は伸長すると、各振幅スぺク卜ルを上述した手法てピッチ変換した場合の各幅スベクトル (図 6 ( B ) の破線 L にて示した曲線 ) よりも小さい値とした上で（即ち 1 より小さゲインをピッチ変換した幅スぺクトルに乗じた値を最終的なピチ変換後の振幅スぺクトルとすることにより）圧縮又は伸長してよい。

更に、ピ Vチ変換処理部 1 3 は、図 7 ( A ) 示した音データを上述した手法に従つて伸長することによりピッチ変換した結果、所定の高側閾値以上の周波数に対する振幅スぺク卜ルが生じた場合、図 7 ( B ) に示したように、その高側閾値以上の領域についての振幅スぺクトルを実質的に 0 にしてもよい。この合、高側閾値は、通常の楽音では現れることのない高音の周波数に又定されている同様に、ピッチ変換処理部 1 3 は、図 7 ( A ) に示した音デ一夕を上述した手法に従つて圧縮することによりヒッチ変換した結果、所定の低側閾値以下の周波数に対する振幅スぺク卜ルが生じた場合図 7 ( C ) に示したように、その低側閾値以下の領域についての振幅スぺクトルを実質的に 0 にしてもよいこの場合、低側閾値は通常の楽音では現れることのない低音の周波数に設定されているれらによれば、周波数軸上での振幅スぺク卜ルの圧縮又は伸長にり、通常の演奏などにおいてはあり得ない高周波数又は低周波数に対する振幅スぺク卜ルが発生した場合であつても、そのような周波数の振幅スぺクルが削除されるので、 m采として、良好な音を得ることが可能な立

曰デ一夕を生成することがでさる。

また、ピッチ変換処理部 1 3 はピッチ変 ¾¾刖の各ピ一クスぺク卜ルの包絡線を作成しておき、振幅スぺク卜ルの圧縮又は伸長によるピツチ変換後のスぺクトル分布が、作成しておいた包絡線よりも大さくなるような振幅スぺクトルを有するとさには、その振幅スぺクルが包絡線に沿ようにピッチ変換後の振幅スペクトル（スぺク卜ル分布）を修正してもよい。れによれば、より入力音の特徴を維持することがでさる

更に、第 1周波数域 A 1及び第 2周波数領域 A 2 を特定（指定

) する方法としては隣り合う 2つの局所的ピク（第 1 ピクスぺクトル P 1及び第 2 ピークスぺク卜ル P 2 ) 間で周波数軸を半分に切り、各半分を近い方の局所的ピ —クを含む領域に割当てる方法あるいは隣り合う 2 つの局所的ピ —ク間で振幅値が最低の谷を見出し、最低の振幅値に対応する周波数を隣り □ Ό領域間の境界とする方法等を採用するとができる。

また、周波数領域表現に変換された音デー夕には、通常、振幅スぺクトルの局所的ピ一ク（ピークスぺクトル）が多数存在しているそこで、このような場合、周波数領域を、ピクスぺク卜ルを N 個 (複数であって、 Nは、例えば、 2或いは 3 ) ずつ含む複数の領域に区分し、各区分された領域内のスぺクトルに対して本発明によるピッチ変換手法を適用してもよい

即ち、例えば、伸張によりピッチを増加する場合において複数のピークスぺクトルに対応する周波数が f 0 f 1 f 2 f 3 f 4 、 f 5及び f 6 ( f 0 < f l < f 2 < f 3 < f 4 < f 5 < f 6

；) であるとき、上記 Nの値を 3 に設定し、 f 0 、 f 1及び f 2 の 3 個（N個）の周波数を含む周波数領域（低側周波数領域）と、 f 4

、 f 5及び f 6 の 3個（ N個）の周波数を含む周波数領域（高側周波数領域）と、に周波数領域を区分する。

そして、各領域（各区間）に本発明を適用するしとにより、記低側周波数領域に対応するピツチ変換後の周波数領域に対するスぺクトル（ f 0 に対する f 0 ' 、 f 1 に対する f 1 、 f 2 に対する f 2 ' にそれぞれピークスぺクトルを有するスぺクトル）を得るとともに、前記高側周波数領域に対応するピッチ変換後の周波数領域に対するスベクトル（ f 4 に対する ί 4 ' 、 f 5 に対する f 5 、 f 6 に対する f 6 ' にそれぞれピークスペクトルを有するスぺク卜ル）を得てもよい。

また、例えば、上記例において圧縮によりピッチを減少する場合

、： f 0 、 f 1 及び f 2 の 3個（N個）の周波数を含む周波数領域 ( 第 1 セクシヨン）と、 f 2 、 f 3及び f 4 の 3個 ( N個）の周波数を含む周波数領域（第 2セクション）と、 f 4 、 f 5及び f 6 の 3 個（N個）の周波数を含む周波数領域（第 3セクシヨン）と、に周波数領域を区分する。

そして、各領域に本発明を適用することにより、第 1 セクシヨンに対応するピ Vチ変換後の周波数領域に対するスぺク卜ル ( f 0 に

，

対する f 0 ，、 f 1 に対する f 1 ' 、 f 2 に対する f 2 にそれぞれピークスぺクトルを有するスぺクトル）を得、第 2セクシヨンに対応するピッチ変換後の周波数領域に対するスぺク卜ル ( f 2 に対する f 2 、 f 3 に対する f 3 ' 、 f 4 に対する f 4 にそれぞれピークスぺク卜ルを有するスぺク卜ル）を得、更に、第 3セクションに対応するピツチ変換後の周波数領域に対するスぺク卜ル（ f 4 に対する f 4 、 f 5 に対する f 5 ' 、 f 6 に対する f 6 ' にそれぞれピ一クスぺクトルを有するスぺクトル）を得てもい。但し、このよな処理を行うと、各領域ごとの圧縮又は伸張に伴つて周波数軸上に重複領域又は欠損領域が発生するので、これらの領域に対しては適当な方法により、違和感の少ない音を生成するスベクトルを得るようにするとよい。

Claims

1 入力された時間領域表現の音デ夕を周波数領域表現への立曰デ ―夕へと変換する時間周波数変換手段と、

刖記周波数領域表現に変換された音丁一夕の振幅スぺク卜ルのピッチを変換してピッチ変換後の音デー夕を生成するピッチ変換手段と、

記ピッチ変換後の音 α 一夕を

青テ周波 i 領域表現から時間領域表現へと変換する周波数時間換手段と、

刖記時間領域表現に変換された音デ夕を出力する出力手段と、を備えたピツチ変換装置においのて、

前記ピッチ変換手段は、

刖記周波数領域表現に変換された音ァ一夕の振幅スベクトルに基づいて同音ァ一夕の特徴を表す振幅スぺク囲卜ルを選択振幅スぺク卜ルとして少くとも、

な一つ m択し、同選択振幅スぺク卜ルに対する周波数である択周波数を含む所定の周波数領域である選択周波数領域の振幅スぺク卜ル分布の形状を実質的に維持しながら同音デ夕の振幅スぺクトルを周波数軸上で圧縮又は伸長するように構成されたピツチ変装置。

2 入力された時間領域表現の音デ一タを周波数領域表現への立曰テ一夕へと変換する時間周波数変換手段と、

前記周波数領域表現に変換された音テ一夕の振幅スぺクルを周波数軸上にて圧縮又は伸長することにりピツチ変換後の立

曰丁夕を生成するピッチ変換手段と、

ーヽム

刖記ピッチ変換後の音デー夕を周波数領域表現から時間領域表現へと変換する周波数時間変換手段と、

記時間領域表現に変換された音デ一タを出力する出力手段と、を備えたピッチ変換装置において、

、

刖記ピッチ変換手段は、

前記周波数領域表現に変換された音ァ一夕の振幅スぺク卜ルに基づいて同音データの特徴を表す振幅スぺクルを選択振幅スぺク卜ルとして少なくとも一つ選択し、

選択振幅スぺクトルが、同選択振幅スぺクトルに対する周波数である選択周波数に所定のピツチ変換比 kを乗じて得られる周波であるピッチ変換後選択周波数に対する振幅スぺク卜ルとなるよつに、同選択振幅スぺクトルを周波数軸上で移動し、

同選択周波数を含む所定の周波数領域である選択周波数領域の各振幅スベクトルが、同各振幅スぺク卜ルに対する周波数から同選択周波数を減じた値に同ピッチ変換比 kよりち 1 に近い局所変換比 m を乗じた値を同ピツチ変換後選択周波数に加えるとにより得られる周波数の振幅スぺク卜レとなるように、同選択周波数領域の各振幅スぺクトルを周波数軸上で圧縮又は伸長し、

—ヽムつ

刖 PB選択周波数領域以外の各振幅スぺク卜ルが、各振幅スぺクトルに対する周波数に同各振幅スぺクトルに応じたピッチ亦換比を乗じて得られる周波数に対する振幅スぺク卜ルとなるよに、同選択周波数領域以外の各振幅スぺクトルを周波数軸上で圧縮又は伸長するように構成されたピッチ変換装置

3 . 入力された時間領域表現の音デ —夕を周波数領域表現への立曰データへと変換する時間周波数変換手段と、

前記周波数領域表現に変換された音デ一タの振幅スぺクトルを周波数軸上にて圧縮又は伸長することによりピヅチ変換後の音データを生成するピッチ変換手段と、

刖 ύピッチ変換後の音デ一タを周波数領域表現から時間領域表現へと変換する周波数時間変換手段と、

前記時間領域表現に変換された音デ —タを立

曰として出力する出力手段と、

を備えたピッチ変換装置において、

iu sdヒッチ変換手段は、

前記周波数領域表現に変換された音データの振幅スぺクトルの中から少なくとも 2つのピークスぺク卜ルである第 1 ピークスぺクル及び同第 1 ピークスぺクトルに対する周波数である第 1 周波数よりも高い第 2周波数を有する第 2 ピークスぺク卜ルを選択し、同第 1 ピ —クスぺクトルが、同第 1 周波数に所定のピッチ変換比 kを乗じて得られる周波数であるピッチ変換後第 1 周波数に対する振幅スぺクトルとなるように、同第 1 ピークスぺクトルを周波数軸上で移動し、

同第 1 周波数を含む所定の周波数領域である第 1周波数領域の各振幅スぺクトルが、同各振幅スぺクトルに対する周波数から同第 1 周波数を減じた値に同ピツチ変換比より 1 に近い局所変換比 m を乗じた値を同ピチ変換後 1周波数に加えることにより得られる周波数の振幅スぺク卜ルとなるように、第 1周波数 vM.域の各振幅スぺク卜ルを周波数軸上で圧縮又は伸長し、

同第 2 ピ一クスぺク卜ルが、第 2周波数に同所定のピッチ変換比 kを乗じてィ守られる周波数であるピッチ換後第 2周波数に対する振幅スぺク卜ルとなるよに、同第 2 ピ一クスぺク卜ルを周波数軸上で移動し、

同第 2周波数を含む所定の周波数領域である第 2周波数領域の各振幅スぺク卜ルが、同各振幅スぺクルに対する周波数から同第 2 周波数を減じた値に同局所変換比 mを乗じた値を同ピッチ変換後

2周波数に加えるしとにより得られる周波数の振幅スぺクルとなるように、第 2周波数領域の各振幅スぺクトルを周波数軸上で圧縮又は伸長し、

| 1第 1 周波数領域と同第 2周波数域との間の中間周波数領域の各振幅スぺクトルが、同各振幅スぺク卜ルに対する周波数に同各振幅スぺク卜ルに応じたヒッチ変換比を乗じて得られる周波数に対する振幅スぺクトルとなるように、中間周波数領域の各振幅スぺク卜ルを周波数軸上で圧縮又は伸長するように構成されたピッチ変換装置

4 . 求の範囲 3 に記載のピッチ変換装において、

記ピチ変換手段は、

横軸の X軸にピッチ変換前の周波数、縦軸の Y軸にピツチ変換後の周波数をとつたクラフを想定し、 kを前記所定のピッチ変換比、 mを HU記局所変換比、 a 1 及び a 2 を所定の定数、前記第 1周波数を f 1 、 m記第 2周波数を f 2 、刖記第 1周波数領域の最大周波数を f 1 max、前記第 2周波数領域の最小周波数を〕 f 2 m i nとするとき

、

L第 1 周波数領域においては Y = m • X + a 1 なる関数に基づいて同第 1周波数領域内の各振幅スぺクルを周波数軸上で圧縮又は伸長し、

刖記第 2周波数領域においては Y ： m • X + a 2なる関数に基づいて第 2周波数領域内の各振幅スぺク卜ルを周波数軸上で圧縮又は伸長し、 kは k = ( (m - f 2 + a 2 ) 一 ( m - f 1 + a 1 ) ) / ( f 2 一 f 1 ) の関係を満たし、

前記中間周波数領域においては点（ f 1 max, f 1 max+ a 1 ) と点（ f 2 min、 f 2 min+ a 2 ) とを結ぶ所定の関数 Y = T f (X) に基づいて同中間周波数領域内の各振幅スぺクトルを周波数軸上で圧縮又は伸長するように構成されたピッチ変換装置。

5. 請求の範囲 3又は請求の範囲 4 に記載のピッチ変換装置において、

前記ピッチ変換手段は、

前記中間周波数領域内の各振幅スぺクトルを周波数軸上で圧縮又は伸長するとき、各振幅スぺクトルを同各振幅スぺクトルよりも小さい値とした上で圧縮又は伸長するように構成されたピッチ変換装置。

6. 請求の範囲 2乃至請求の範囲 5 の何れか一項に記載のピッチ変換装置であって、

前記ピッチ変換手段は、

前記圧縮又は伸長後の周波数が所定の高側閾値以上の周波数となつた領域についての振幅スぺクトルを実質的に 0 にするように構成されたピッチ変換装置。

7. 請求の範囲 2乃至請求の範囲 6 の何れか一項に記載のピッチ変換装置であつて、

前記ピッチ変換手段は、

前記圧縮又は伸長後の周波数が所定の低側閾値以下の周波数となつた領域についての振幅スぺクトルを実質的に 0 にするように構成されたピッチ変換装置。