明 細 書
ピッチ変換装置 技 術 分 野
本発明は、 音データのピッチを変換するピッチ変換装置に関する 背 景 技 術
従来から 、 曰声や楽音などの立
曰 丁 夕のピッチを変換する種々の ピッチ変換 置が知られている のうちの つのピッチ亦 は 、 所定の立
曰 丁一夕を時間領域の表現 (時間領域表現 ) から周波数 領域の表現 (周波数領域表現 ) へと変換し、 変換後の立
曰 丁一夕に基 づいて振幅スぺク 卜ノレのピ クスぺク トルを含む周波数領域を特定 し 、 その特定された周波数領域の振幅スぺク 卜ルだけを 律に所定 シフ 卜 だけ周波数軸上でシフ トするよ Ό になつている (例 7Lば 、 米国特許第 6 5 4 9 8 8 4号明細書 (図 3 、 図 4 A乃至図 4 C ) を 参照。 )
ところで、 一般に 、 音データの中には異なる周波数を有するピ クスぺク トルが二つ以上存在し、 当然、 その二つのピークスぺク ル間 (各ピ一クスぺク トルに対応する周波数の間の中間周波数領域
) にも振幅スぺク トルは存在する。 しかしながら、 上記従来の技術 によれば 、 中間周波数領域内の振幅スぺク トルは切り捨てられ 、 ピ ッチ変 後の振幅スぺク トルに反映されない。 この結果、 ピッチ変 換後の曰が不自然な音を含む場合があ り得るという問題があ た 発 明 の 開 示
従つて 、 本発明の目的の一つは、 振幅スぺク トルを不均一な変換 比をもつて実質的に圧縮又は伸長することによ り、 入力音 (原立 曰 ) の特徴を残しながら不自然な音を発生する音デ一夕が生成されてし まう ことを回避できるピッチ変換装置を提供する とにある
この百的を達成するための本発明による ピッチ変 装置は 、 入力された時間領域表現の音データを周波数領域表現への立
曰 丁 夕へと変換する時間周波数変換手段と、
刖 pd周波数領域表現に変換された音デ 夕のピッチを変換してピ ッチ変換後の音デー夕を生成するピッチ変換手段と 、
刖 dピツチ変換後の音データを周波数領域表現から時間領域表現
へと変換する周波数時間変換手段と
前記時間領域表現に変換された音つ—夕を出力する出力手段と を備えている
更に、 前記ピ Vチ変換手段は、
前記周波数領域表現に変換された音デ一夕の振幅スぺク 卜ルに基 づいて同音デ 夕の特徴を表す振幅スぺク トルを選択振幅スぺク ルとして少な < とも一 つ選択し、 同選択振幅スぺク 卜ルに対する周 波数である選択周波数を含む所定の周波数領域である選択周波数領 域の振幅スぺク ル分布の形状を実質的に維持しながら同音デ 夕 の振幅スぺク 卜ルを周波数軸上で圧縮又は伸長するように構成され ている。
これによれば、 入力音 (原音) の特徴を適切に表す選択周波数領 域 A 1 の振幅スぺク トル分布 A M I の形状が維持されながら音テ 夕のピッチ変換が行われるので、 入力音の特徴がピ Vチ変換後に いても維持される。 更に、 選択周波数領域 A 1 以外の領域の振幅ス ぺク トルは切り捨てられることなく ピッチ変換後の振幅スぺク 卜 ルに反映される。 従って、 ピツチ変換後の音データに不自然な立 曰 を 発生してしまうような音デ一夕が含まれてしまう ことを回避する とができる。
本発明によるピッチ変換装置の 目 様は、
入力された時間領域表現の音データを周波数領域表現への音テ 夕へと変換する時間周波数変換手段と
前記周波数領域表現に変換された立
曰デ一夕の振幅スベク トルを周 波数軸上にて圧縮又は伸長することによ り ピッチ変換後の音デ 夕 を生成するピッチ変換手段と
前記ピツチ変換後の音データを周波数領域表現から時間領域表現 へと変換する周波数時間変換手段と
前記時間領域表現に変換された音丁一夕を出力する出力手段と を備えている。
更に、 前記ピッチ変換手段は、
前記周波数領域表現に変換された立
曰データの振幅スベク トルに基 づいて同音データの特徴を表す振幅スぺク トルを選択振幅スぺク 卜 ルとして少なく とも一 つ選択し、
同選択振幅スぺク トルが、 同選択振幅スぺク トルに対する周波数 である選択周波数に所定のピツチ変換比 kを乗じて得られる周波数
であるピッチ変換後選択周波数に対する振幅スぺク 卜ルとなるよつ に、 同選択振幅スぺク 卜ルを周波数軸上で移動し
1口 J 択周波数を今む所定の周波数領域である選択周波数領域の各 振幅スベク トルが 同各振幅スぺク 卜ルに対する周波数から 、B着択 周波数を減じた値に同ピッチ変換比 kよ り も 1 に近い局所変換比 m を乗じた値を同ピヅチ変換後選択周波数に加える とにより得られ る周波数の振幅スぺク 卜ルとなるように、 同選択周波数領域の各振 幅スぺク トルを周波数軸上で圧縮又は伸長し
刖記選択周波数領域以外の各振幅スぺク 卜ルが、 「同各振幅スぺ ク 卜ルに対する周波数 」 に 「同各振幅スぺク トルに応じた他のヒッ チ変換比」 を乗じて得られる周波数に対する振幅スぺク トルとなる よ に 、 同選択周波数領域以外の各振幅スぺク トルを周波数軸上で 圧縮又は伸長するよう に構成されている。
れによれば、 入力音の特徴を適切に表す選択振幅スぺク トル P
1 が 同選択振幅スぺク 卜 Jレに対する周波数 (選択周波数) f 1 に 所定のピツチ変換比 kを乗じて得られるピッチ変換後選択周波数 f
1 0 ( = k · f 1 ) に対する振幅スベク トル P 1 0 となるように、 周波数軸上で移動せしめられる
更に 、 選択周波数 f 1 を含む周波数領域である選択周波数領域 A
1 の各振幅スぺク トルが、 同各振幅スぺク 卜ルに対する周波数 f n から同選択周波数 f 1 を減じた値 ( = f n ― f 1 ) にピッチ変換比 kより も 1 に近い局所変換比 mを乗じた値 ( = m - ( f n - f 1 )
) をピッチ変換後選択周波数 f 1 0 に加えることにより得られ 周 波数 ( m • ( f n - f 1 ) + k · f 1 ) の振幅スぺク 卜リレとなる よ Όに 周波数軸上で圧縮又は伸長せしめら 0
の結果 入力音の特徴を表す選択周波数領域 A 1 のスぺク トル 分布 A M 1 が分布形状を維持しながらピッチ変換後のデータに移行 されるので 入力音の特徴がピッチ変換後において 維持される れに対し m記選択周波数領域 A 1以外の各振幅スぺク トルは
1口]各振幅スぺク トルに対する周波数 f nに同各 幅スぺク 卜ルに 応じたピ Vチ変換比を乗じて得られる周波数に対する振幅スぺク 卜 ルとなるように、 周波数軸上で圧縮又は伸長せしめられ 。
れにより 、 選択周波数領域 A 1以外の振幅スぺク 卜ルは切り捨 てられる となく 、 ピッチ変換後の振幅スぺク トルに反映される 従 て ピ Vチ変換後の音データに不自然な音を発生してしまうよ
うな音う 夕が含まれてしまう ことを回避することができる 本発明によるピヅチ変換装置の他の態様は、 上記ピッチ亦換装置 と同様 、 時間周波数変換手段と、 ピッチ変換手段と、 周波数時間変 換手段と、 出力手段と、 を備える。
そして、 こ のピ チ変換装置のピッチ変換手段によれば 、
、 t
刖 周波数領域表現に変換された立
曰デ一夕の振幅スぺク 卜ルの中 から少なく とも 2 のピークスぺク 卜ルである第 1 ピ一クスぺク 卜 ル P 1 及び同第 1 ピ一クスぺク トル P 1 に対する周波数である第 1 周波数 f 1 よ り ち高い第 2周波数 f 2 を有する第 2 ピ ―クスぺク ト ル P 2が選択される
更に 、 第 1 ピ ―クスぺク 卜ル P 1 は 、 第 1 周波数 f 1 に所定のピ ツチ変換比 kを乗じて得られる周波数であるピッチ変換後第 1周波 数 f 1 0 ( = k • f 1 ) に対する振幅スぺク トル P 1 0 となるよう に周波数軸上で移動しせしめられる
また 、 第 1 周波数 f 1 を含む周波数領域である第 1 周波数領域 A
1 の各振幅スぺク 卜ルは 、 同各振幅スぺク トルに対する周波数 f n から同第 1 周波数 f 1 を減じた値 ( : f n - f 1 ) に同ピッチ変換 比 kより も 1 に近い局所変換比 mを乗じた値 ( = m · ( f n一 f 1
) ) を同ピッチ変換後第 1周波数 f 1 0 に加えることによ り得られ る周波数 ( = m • ( f n - f 1 ) + k • f 1 ) の振幅スぺク トルと なるように、 周波数軸上で圧縮又は伸長せしめられる
同様に第 2 ピ一クスぺク 卜ル P 2 は 、 第 2周波数 ί 2 に 、
刖記所定 のピッチ変換比 kを乗じて得られる周波数である ピッチ変換後第 2 周波数 f 2 0 ( = k • f 2 ) に対する振幅スぺク トル P 2 0 となる ように周波数軸上で移動せしめられる。
また、 第 2.周波数 f 2 を含む周波数領域である第 2周波数領域 A 2 の各振幅スぺク トルは、 同各振幅スぺク トルに対する周波数 f n から同第 2周波数 f 2 を減じた値 (= f n— f 2 ) に前記局所変換 比 mを乗じた値 ( = πι · ( f n - f 2 ) ) を同ピッチ変換後第 2周 波数 f 2 0 に加えることによ り得られる周波数 ( = ηι · ( f n - f 2 ) + k - f 2 ) の振幅スペク トルとなるように、 周波数軸上で圧 縮又は伸長せしめられる。
この結果、 ピッチ変換後の信号に入力音の特徴を表す第 1 ピーク スぺク トル P 1近傍のスぺク トル分布 A M I と第 2 ピークスぺク ト ル P 2近傍のスぺク トル分布 A M 2が各分布形状を維持しながらピ
ツチ変換後のデータに移行されるので、 入力音の特徴がピッチ変換 後においても維持される。
一方、 第 1 周波数領域 A 1 と第 2周波数領域 A 2 との間の中間周 波数領域 A 3 の各振幅スぺク トルは、 同各振幅スぺク トルに対する 周波数 f nに同各振幅スぺク トルに応じたピッチ変換比を乗じて得 られる周波数に対する振幅スぺク トルとなるように周波数軸上で圧 縮又は伸長せしめられる。
これによ り、 中間周波数領域 A 3 内の振幅スペク トルは切り捨て られることなく、 ピッチ変換後の振幅スペク トルに反映される。 従 つて、 ピッチ変換後の音デ一夕に不自然な音を発生してしまうよう な音データが含まれてしまう ことを回避することができる。
この場合、
前記ピッチ変換手段は、
横軸の X軸にピッチ変換前の周波数、 縦軸の Y軸にピッチ変換後 の周波数をとつたグラフを想定し、 kを前記所定のピッチ変換比、 mを前記局所変換比、 a 1及び a 2 を所定の定数、 前記第 1周波数 を f l 、 前記第 2周波数を f 2、 前記第 1 周波数領域の最大周波数 を f 1 max, 前記第 2周波数領域の最小周波数を f 2 minとするとき 前記第 1 周波数領域においては Y = m · X + a 1 なる関数に基づ いて同第 1 周波数領域内の各振幅スぺク トルを周波数軸上で圧縮又 は伸長し、
前記第 2周波数領域においては Y ==m · X + a 2なる関数に基づ いて同第 2周波数領域内の各振幅スぺク トルを周波数軸上で圧縮又 は伸長し、
¾:は ¾: = ( (m - f 2 + a 2 ) 一 ( m - f 1 + a 1 ) ) / ( f 2 一 f 1 ) の関係を満たし、
前記中間周波数領域においては点 ( f 1 max, ί 1 max + a 1 ) と 点 ( f 2 min、 f 2 rain+ a 2 ) とを結ぶ所定の関数 Y = T f ( X ) に基づいて同中間周波数領域内の各振幅スペク トルを周波数軸上で 圧縮又は伸長するように構成されるこ とが好ましい。 関数 T f ( X ) は、 直線であってもよいし、 曲線であってもよい。
更に、 前記ピッチ変換手段は、
前記中間周波数領域内の各振幅スぺク トルを周波数軸上で圧縮又 は伸長するとき、 各振幅スぺク トルを同各振幅スぺク トルより も小
さい値とした上で圧縮又は伸長するよう に構成されることが好適で ある。
これによれば、 入力音の特徴を表す部分以外の振幅スぺク トルが 小さくなるので、 結果として、 より入力音の特徴が反映されたピッ チ変換後の音データが得られる。
加えて、 前記ピツチ変換手段は、 BU B己 £h縮又は伸長後の周波数が 所定の高側閾値以上の周波数となつた領域についての振幅スぺク 卜
、 ルを実質的に 0 にするよう に構成されてもよく、 或いは、 刖記圧縮 又は伸長後の周波数が所定の低側閾値以下の周波数となつた領域に ついての振幅スぺク 卜ルを実質的に 0 にするょラ に 成されてもよ い。
これによれば 、 周波数軸上での圧縮又は伸長に り、 通常の演奏 などにおいてはあり得ない |¾周波数又は低周波数に対する振幅スぺ ク トルが発生した場合であつても 、 そのような周波数の振幅スぺク ルが削除されるの し 、 6果として 、 良好な立
曰 を得るしとが可能な 立
曰 丁一タ ^:生成することができる 図 面 の 簡 単 な 説 明
図 1 は、 本発明の実施形態に係るピッチ変換装置の構成を示した ブロック図である。
図 2は、 図 1 に示したピッチ変換装置によるピッチ変換方法の概 要を説明するためのグラフである。
図 3 は、 図 1 に示したピッチ変換装置による ピッチ変換方法の概 要を説明するためのグラフである。
図 4は、 図 1 に示したピッチ変換装置によるピッチ変換方法の具 体例を説明するためのグラフである。
図 5 は、 図 1 に示したピッチ変換装置によるピッチ変換方法の具 体例を説明するためのグラフである。
図 6 は、 図 1 に示したピッチ変換装置によるピッチ変換方法の変 形例を説明するためのグラフである。 。
図 7 は、 図 1 に示したピッチ変換装置によるピッチ変換方法の他 の変形例を説明するためのグラフである。 発明を実施するための最良の形態
以下、 本発明によるピッチ変換装置の実施形態について図面を参
照しながら説明する。
(構成)
図 1 に示したよう に、 このピッチ変換装置 1 0 は、 入力部 1 1 、 時間—周波数変換部 1 2、 ピッチ変換処理部 1 3 、 周波数—時間変 換部 1 4、 出力部 1 5及び制御部 1 6 を備えている。 なお、 各部の 機能は、 実際には制御部 1 6 を含んでなるコンピュータとして構成 されたピッチ変換装置 1 0 の C P U (図示省略) が所定のプロダラ ムを実行する ことによ り達成される。
入力部 1 1 は、 入力されるアナログの信号をデジタルの信号に変 換してから出力する AZDコンバータを含んでいて、 入力されたァ ナログの音信号をデジタル信号 (データ) S 1 に変換するよう にな つている。 このようにして得られるデータは、 時間領域で表現され た音データ (時間領域表現の音データ) S 1 である。 入力部 1 1 に 入力される信号は、 マイクロフォンを介して入力部 1 1 に入力され てもよく、 或いは、 他の装置から直接入力されてもよい。 他の装置 から入力部 1 1 にデジタル信号が入力される場合、 入力部 1 1 はそ の入力デジタル信号をピッチ変換装置 1 0 に適合したデジタル信号 に変換する。
時間一周波数変換部 1 2 は入力部 1 1 と接続されていて、 入力部 1 1 からの音データ S 1 を受信するよう になっている。 時間一周波 数変換部 1 2 は、 音データ S 1 を時間領域の表現から周波数領域の 表現へと変換するよう になっている。 即ち、 時間—周波数変換部 1 2 は、 時間領域で表現された入力音デ一タ S 1 を一連の時間フレー ムに区分し、 各フレーム毎に F F T (Fast Fourier Transform) 等 により周波数分析を実行して周波数スペク トル (振幅スペク トル及 び位相スペク トル) を取得する。 この周波数スペク トルが、 周波数 領域で表現されたデータ (周波数領域表現の音データ) S 2である ピッチ変換処理部 1 3 は、 時間一周波数変換部 1 2 と接続されて いて、 時間一周波数変換部 1 2からのデータ S 2 を受信するように なっている。 ピッチ変換処理部 1 3 は、 後に詳述するピッチ変換処 理をデータ S 2 に対して実行してピッチ変換後のデータ S 3 を生成 するようになつている。 データ S 3 は、 周波数領域のフレームデー 夕 (振幅スペク トルデータ及び位相スペク トルデ一夕) である。 ピ ツチ変換処理部 1 3 は、 図示しない設定器から入力される信号に基
づいて、 後述するヒツナ変換比 ( k ) 等のピッチ変換処理に必要な パラメ一タを変更する ことができるよ Ό になつている
周波数 時間 換部 1 4は、 ピッチ久換処理部 1 3 と接続されて いて、 ピクチ変換処理部 1 3力 ^らのァ. タ S 3 を受信するよう にな ている 周波数一時間変換部 1 4は 、 つ 夕 S 3 に逆 F F T処理 を施して周波数領域で表現されている丁一夕 S 3 を時間領域で表現 されたデ ―タ S 4 に変換し 、 その変換したデ一夕 S 4 を出力するよ
Όになつている
出力部 1 5 は D / A 3ンバータを含んで構成されていて、 周波 数一時間変換部 1 4 と接 zされている 出力部 1 5 は 、 周波数一時 間変換部 1 4から入力したデータ S 4 を所定の夕ィ ングにて D A 変換レ 、 換したアナ口グ信号を曰 として出力するようになってい る なお 、 出力部 1 5 は 、 前記変換したァナ口グ信 を電気信号の まま外部に出力したり、 丁 —夕 S 4を丁ジ夕ルデ 夕のまま出力し たり、 或いは、 テ一夕 S 4 を他の記憶手段に Pし ί するよう にしても よい。
制御部 1 6 は、 C P U 、 R O M及び R A Μ等を含む周知の ンピ ュ一夕であ Ό 、 上記各部の処理を行う とともに、 入力部 1 1 の A /
Dコンパ一夕及び出力部 1 5 の D Z Aコンバ一夕等のデバィスに対 して必要な夕ィミ ングで A D変換及び D A変換などの各処理を行わ せる指示を出力するようになつている。
なお、 ピッチ変換処理部 1 3 の本願に関する処理内容を除さ 、 上 記各部の詳細については、 例えば 、 本願の出願人により先に出願さ れた特開 2 0 0 3一 2 5 5 9 9 8号公報に記載されている
(ピッチ変換処理の概要)
次に、 上記ピッチ変換処理部 1 3 によ り達成されるピッチ 換の 概要について図 2及び図 3 を参照しながら説明する。 以下の説明に おいて参照される図面中の周波数は総てリニアプロッ 卜によ Ό表さ れている また、 図 2及び図 3 はピッチを高音側にシフ 卜する例を 示している
図 2 ( A ) は、 あるフレ ムのピッチ変換前の振幅スぺク 卜ル ( 上記のデ ―タ S 2 に含まれる振幅スぺク トル) を示したグラフであ る。 この例においては 、 第 1 周波数 ί 1 に振幅スぺク トルの 所的 ピーク (第 1 ピ一クスぺク 卜ル) Ρ 1 が存在し、 第 1 周波数よ り も 大きい第 2周波数 f 2 に他の振幅スぺク トルの局所的ピーク (第 2
ピークスぺク 卜ル) P 2が存在している 先ず、 ピッチ変換処理部
1 3 は、 デー夕 S 2 に基づいて、 の局所的ピークを検出する。 局 所的ピ一クは 近隣の複数のピ一クについて振幅値が最大のピーク を検知する方法等によ り検出される
以上の処理によ り 、 周波数領域の表現に変換された音データの振 幅スぺク トルに基づいて同音デー夕の特徴を表す振幅スベク トルが 選択振幅スぺク トル (第 1 ピークスぺク 卜ル Ρ 1 及び第 2 ピークス ぺク トル P 2 ) として少な < とち一つ (ここでは つ ) 選択され たことになる
次に、 ピッチ変換処理部 1 3 は 検出した各局所的ピークに対す る周波数 (この - ¾m口 、 第 1 周波数 f 1及び第 2周波数 f 2 ) を含む 所定の周波数領域 (スぺク トル分 領域) を特定 (指定 ) する。 図
2 ( A ) の例においては、 ピッチ亦換処理部 1 3 は、 第 1 ピークス ぺク トル P 1 に対する第 1 周波数 f 1 を含む所定周波数領域を第 1 周波数領域 A 1 として特定する。 のような周波数領域の特定は、 種々の方法によ り成され得る。 例えば 、 ピツチ変換処理部 1 3 は、 第 1周波数: f 1 と第 2周波数 f 2 との差の半分に Γ 1 J 以下の正の 値を乗じて得られる周波数 Δ f を第 1周波数 f 1 に加えて得られた 周波数 ( = f l + A f ) を第 1 周波数領域 A 1 の最大周波数 f l maxとする。 同様に、 ピッチ変換処理部 1 3 は、 第 1 周波数 f 1 か ら前記周波数 Δ ί を減じて得られた周波数 (= f l — A f ) を第 1 周波数領域 A 1 の最小周波数 f l rainとする。 第 1 周波数領域 A 1 の各周波数に対する振幅スぺク トルは振幅スぺク トル分布 AM 1 を 有する。
同様に、 ピッチ変換処理部 1 3 は、 第 2 ピークスペク トル P 2 に 対する第 2周波数 f 2 を含む所定周波数領域を第 2周波数領域 A 2 として特定する。 第 2周波数領域 A 2 の最大周波数及び最小周波数 はそれぞれ f 2 iax (例えば、 f 2 max= f 2 + Δ f ) 及び f 2 min (例えば、 f 2 min= f 2 — Δ ί ) である。 第 2周波数領域 A 2 の 各周波数に対する振幅スぺク トルは振幅スぺク トル分布 ΑΜ 2 を有 する。
以上の処理により、 選択周波数 (第 1 周波数 f 1 又は第 2周波数 f 2 ) を含む周波数領域である選択周波数領域 (第 1 周波数領域 A 1 又は第 2周波数領域 A 2 ) の各振幅スペク トルが決定される。 次いで、 ピッチ変換処理部 1 3 は、 以下のように振幅スペク トル
を周波数軸上で圧縮又は伸長することによ り、 ピッチ変換を行う。 なお、 図 2及び図 3 の例においては、 振幅スペク トルは周波数軸上 で伸長される。 即ち、 ピッチ変換比 kは 「 1」 よ り大きい値である
( A ) ピッチ変換処理部 1 3 は 第 1 ピークスぺク トル P 1 が、 第
1 周波数 f 1 に所定のピッチ変換比 kを乗じて得られる周波数であ るピッチ変換後第 1周波数 f 1 0 ( k · f 1 ) に対する振幅スぺ ク トルとなるよう に、 第 1 ピ ―クスぺク 卜ル P 1 を周波数軸上で移 動する れに り得られる変換 第 1 ピークスぺク 卜ル P 1 0 の 大きさは 第 1 ピークスぺク 卜ル P 1 の大きさ と等しい
( B ) ピッチ亦换処理部 1 3 は 第 1周波数領域 A 1 の各振幅スぺ ク トル P nが 1口 J各振幅スぺク hル P n に対する周波数 f nから第
1周波数 f 1 を減じた値 ( f n ― f 1 ) にピッチ変換比 kよ り も
1 に近い局所変換比 mを乗じた値 ( m · ( f n - f 1 ) ) を上記 ピッチ変換後第 1 周波数 f 1 0 ( = k • f 1 ) に加える とにより 得られる周波数 ( = m * ( f n 一 f 1 ) + k · f 1 ) の振幅スぺク トルとなるよ Ό に 、 第 1周波数領域 A 1 の各振幅スぺク 卜ルを周波 数軸上で圧縮又は伸長する の例において、 局所変換比 mの値は
Γ 1 J に 定されている
以上の処理に り、 第 1周波数領域 A 1 の振幅スぺク トル分布 A
M 1 は 形状 (分布状態 ) を変える となく ピッチだけが変換され
、 ピッチ 換後第 1周波数 域 A 1 0 の振幅スぺク トル分布 A M 1
0 となる
( C ) 様に ピッナ変換処理部 1 3 は 第 2 ピ クスぺク 卜ル P
2が、 第 2周波数 f 2 に所定のピッチ変換比 kを乗じて得られる周 波数であるピ チ変換後第 2周波数 f 2 0 ( = k • f 2 ) に対する 振幅スぺク ルとなるように、 第 2 ピ ―クスぺク トル P 2 を周波数 軸上で移動する これによ り得られる変換後第 2 ピークスベク トル
P 2 0 の大きさは 、 第 2 ピ ―クスぺク 卜ル P 2 の大きさと等しい。
( D ) 更に ピッチ変換処理部 1 3 は 第 2周波数 τ¾域 A 2 の各振 幅スぺク 卜ル P nが、 同各振幅スぺク 卜ル P n に対する周波数 f n から第 2周波数 f 2 を減じた値 ( f n 一 f 2 ) にピ Vチ変換比 k より も 1 に近い局所変換比 m ¾乗じた値 ( = m • ( f n ― f 2 ) ) を上記ピッチ変換後第 2周波数 f 2 0 ( = k • f 2 ) に加えること によ り得られる周波数 ( m · ( f n ― f 2 ) + k · f 2 ) の振幅
スペク トルとなるように、 第 2周波数領域 A 2 の各振幅スペク トル を周波数軸上で圧縮又は伸長する。
以上の処理により、 第 2周波数領域 A 2 の振幅スペク トル分布 A M 2 は、 形状 (分布状態) を変える ことなく ピッチだけが変換され 、 ピッチ変換後第 2周波数領域 A 2 0 の振幅スペク トル分布 AM 2 0 となる。
( E ) ピッチ変換処理部 1 3 は、 更に、 第 1周波数領域 A 1 と第 2 周波数領域 A 2 との間の中間周波数領域 A 3 の振幅スぺク トルにつ いてピッチ変換を行う。 このピッチ変換について、 特に、 図 3 を参 照しながら説明する。
図 3 は、 横軸の X軸にピッチ変換前の周波数 f a、 縦軸の Y軸に ピッチ変換後の周波数 f b をとつたグラフである。 以下において、 第 1周波数 f l の変換関数 T f ( X ) 上の点を点 Q 1 とし、 第 2周 波数 f 2 の変換関数 T f ( X ) 上の点を点 Q 2 とする。 同様に、 第 1 周波数領域 A 1 の最大周波数 f l maxの変換関数 T f ( x ) 上の 点を点 Q 1 Uと し、 第 2周波数領域 A 2 の最小周波数 f 2 ininの変 換関数 T f ( X ) 上の点を点 Q 2 L とする。
この場合、 第 1周波数領域 A 1 に対しては、 下記の ( 1 ) 式によ り示される変換関数 T f ( X ) の変数 Xにピッチ変換前の周波数' f a を代入することにより、 ピッチ変換後の周波数 f b ( = y ) が決 定されていることになる。
y = T f ( x ) =m - x + a l = x + a l = x + A S l -- ( 1 ) 同様に、 第 2周波数領域 A 2 に対しては、 下記の ( 2 ) 式によ り 示される変換関数 T f ( X ) の変数 Xにピッチ変換前の周波数 ί a を代入することによ り、 ピッチ変換後の周波数 ί b (= y ) が決定 されていることになる。
y = T f ( x ) =m - x + a 2 = x + a 2 = x + A S 2 -- ( 2 ) 一方、 ピッチ変換処理部 1 3 は、 中間周波数領域 A 3 に対し、 点 Q 1 Uと点 Q 2 L とを直線で結ぶ変換関数 T f ( X ) = T 1 f ( x ) に従ってピッチ変換を行う。 即ち、 点 Q 1 Uの座標は ( f 1 max , f 1 0 max) = ( f 1 max, f 1 max + a 1 ) であ り、 点 Q 2 Lの 座標は ( f 2 min, f 2 0 min) = ( f 2 min, f 2 min+ a 2 ) であ るから、 中間周波数領域 A 3 に対する変換関数 T f ( X ) = T 1 f ( x ) は下記の ( 3 ) 式により表される。
、 f2min - f 1 max + a2 -a1 a1 "f2min - a2-f1 max y=Tf(x) =—— - ~~: 一 x + 一 ■臃■ (3)
f2min一 f1 max f2min一 f1 max ヒッチ変換処理部 1 3 は、 上記 ( 3 ) 変換前の 周波数 aに対する振幅スぺク 卜ルがピッチ変換後 数 f b =
、
T f ( f a ) の振幅スぺク 卜ルとなるよ に、 ピッ 刖の周波 数 f aに対する振幅スぺク 卜ルをピッチ変換する。 、 上記
( 3 ) 式を満たす点 ( f a , T f ( f a ) ) と原点 oとを結んだ直 線の傾きが、 周波数 f a の振幅スぺク トル 対するピッチ変換比 P f a という ことになる 。 即ち 、 中間周波数領域 A に対するピッチ 変換比 P f aは、 各振幅スぺク トルに対して各振
スぺク トルの周 波数に応じて一 に定められる
なお、 ピッチ変換比 kは点 Q 1 と点 Q 2 とを直線で結んだ場合の 傾きであるか 、 局所変換比 mとの間に下記 ( 4 ) 式によ り表され る関係を満たしている
k = ( ( m • f 2 + a 2 ) ― ( m · f 1 + a 1 ) ) / ( f 2 - f
1 ) … ( 4 )
換言すると 、 、ヒッチ変換処理部 1 3 は ピッチ変 前の各音 タをピッチ変換比 kにより周波数軸上で 律に圧縮 ( k < 1 ) 又は 伸長 ( k > 1 ) する代わり に 、 ピークスぺク ル P 1及び ークス ぺク トル P 2 の近傍の in .„
曰 ァ タ (第 1周波数領 A 1 の音換縮づデのピ k一夕及 び第 2周波数領域 A 2 の音デ一タ) については 質的に圧 及び伸 長をすることなく 、 そのピッチだけがピ Vチ変 比 k く量だ け変換されるような圧縮又は伸長を行う に ピッチ 処理部
1 3 は、 中間周波数領域 A 3 の音データを ピクチ変換比 とは異 なる変換比であって各振幅スぺク トル (各 幅スぺク ドル 波.数
) に応じた変換比によ り周波数軸上で圧縮又は伸長する
このように 、 ピッチ変換処理部 1 3 は振幅スぺク 卜ルを周波数に 関して非線形に圧縮又は伸長してピッチ変換を行う の 、 入 力音 (原立 、
曰 J の特徴をよく表している第 1 周波数領域 A 11 のスぺク 卜ル分布 A M 1 及び第 2周波数領域 A 2 のスぺク ル分布布 A M 2 は
、 その分布を維持した状態でピツチ変換される。 従つて、 ピッチ変 換後の音 夕に基づいて発立
曰 される音は入力音の特徴を維持した 音となる た、 中間周波数領域 A 3内の振幅スぺク トルは切り捨 てられることなく、 ピツチ変換後の振幅スぺク 卜ルに反映される。 従つて、 ピッチ変換後の音デ一夕に基づいて発音される音は違和感
の少ない音となる。
なお、 中間周波数領域 A 3 に対する変換関数 T f ( X ) は、 種々 の関数とすることがでさる 例えば 、 この変換関数 T f ( X ) は、 図 3 に破線の曲線 T 2 f ( X ) にて示したように 、 点 Q 1 Uから点
Q 2 Lに向うにつれて傾さが局所変換比 mから次第に変化 ( k > 1 のときは増大、 k < l のとさは減少 ) し、 その後再び局所変換比 m に近づく ような関数であつてもよい
更に、 第 1周波数領域 A 1及び第 2周波数領域 A 2 に対する変換 関数 T f ( X ) は、 各周波数領域のスぺク トル分 をほぼ維持した 状態にて同各周波数領域のピッチ変換がなされる関数であればよい
。 従って、 例えば、 上記局所変換比 mは必ずしも一定である必要は なく、 また、 変換関数 T f ( X ) は n次式や任意に定めた関数であ つてもよい。 また、 ピッチ変換処理部 1 3 は、 振幅スぺク ト Jレのピ ツチ変換に応じて当然に位相スぺク ルを修正する
(ピッチ変換処理の実際の作動)
次に、 ピッチ変換処理部 1 3 の実ポの作動例について図 4及び図
5 を参照しながら説明する 図 4は立
曰テ一夕 S 2 を伸長するピッチ 変換の例であり、 (A ) はピッチ変換刖の振幅スぺク トル 、 ( B ) はピッチ変換後の振幅スぺク トルを示している 図 5 は音丁一夕 S
2 を圧縮するピッチ変換の例であり 、 ( A ) はピ Vチ変換前の振幅 スペク トル、 ( B ) はピッチ変換後の振幅スぺク ル 示している
。 これらにおいて、 第 1 ピ クスぺク bル P 1 の周波数は第 1周波 数 g l であり、 第 2 ピ一クスぺク ル P 2の周波数は第 2周波数 g nである。 また、 第 1 周波数 1 と第 2周波数 g n との中間の周波 数を中間周波数 g c とし ( g c = ( g 1 + g n ) / 2 ) 、 第 1周波 数 g 1 から中間周波数 g c までの差を y 2又は X c とおく
1 . 入力音データの伸長
先ず、 入力音データを伸長するピッチ亦 ½.の場合について説明す ると、 ピッチ変換処理部 1 3 は、 図 4に したよう に 、 第 1周波数 g l の第 1 ピークスぺク hル P 1 をピッチ変換後第 1周波数 h 1 の スペク トル (ピークスぺク 卜ル P 1 0 ) としてそのまま移動する。 前述したとおり、 h i = k 1である 。 kは 1 よ り大きい
次に、 ピッチ変換処理部 1 3 は 、 第 1 周波数 g 1 より X 1 だけ大 き い周波数 g 2 に対応する ピッチ亦
久換後周波数 h 2 ( = k • g 2 )
、 の振幅スぺク トルとしてゝ 周波数 g 2 に対するピ Vチ変換刖の音デ
一夕の振幅スぺク 卜ルの値 Q! 2ではな < 、 第 1周波数 1 より y 1 だけ大きい周波数 g 2 ' に対応するピッチ変換刖の立
曰つ—タの振幅 スぺク ルの値 ^ 2 を採用する。 この +曰合 、 y 1 は X 1 にピツチ変 換比 kを乗じた値でめり (即ち、 y 1 = k X 1 ) 、 y 1 は X 1 よ り も大さい
この Ό にして、 ピツチ変換処理部 1 3 は 、 第 1 周波数 g 1 カゝら の周波数 X 1 を次第に大きく しながらピヅチ亦久換刖の振幅スぺク 卜 レを j噴次ピッチ変換して行く 。 その結果 、 ピッチ変換の対象となつ ている振幅スぺク 卜ルの周波数が所定の周波数 g 3 ( g 3 = g 1 +
X 2 ) より大きく なると、 第 1 周波数 g 1 からの周波数の差 X 1 は 差 X 2 Ό大きくなる 2 fa 2 をピ Vチ変換比 k倍した値が y 2 (第 1 周波数 g 1 と中間周波数 g c との差 ) となる値である (
X 2 · k y 2 ) ピツチ変換処理部 1 3 は 、 第 1周波数 g 1力、ら の周波数 0)差 X 1 が X 2 よ り大きく y 2 小さい領域 (即ち、 周 波数 g 3 〜 g c ) に対して、 ピッチ変換後の振幅スぺク 卜ルをピッ チ変換刖の中間周波数 g c に対する振幅スぺク 卜ルの値 Cに e 疋 する。
同様に、 ピッナ変換処理部 1 3 は、 第 2周波数 g nの第 2 ピーク スぺク トル P 2 をピッチ変換後第 2周波数 h nのスぺク トル (ピ— クスぺク 卜ル P 2 0 ) としてそのまま移動する。 刖述したとおり、 h n = k · g nである。
次に、 ピッチ変換処理部 1 3 は 、 第 1周波数 g nよ り X 1 0 だけ 小さい周波数 g n - ίに対応する ピッチ変換後周波数 h n - 1 ( = k ·
( g n - 1 ) ) の振幅スぺク トルとして、 周波数 g n - 1に対するピッチ 変換前の音丁一夕の振幅スぺク 卜ルの値 α π - 1ではなく、 第 2周波 数 g nより y 1 0 だけ小さい周波数 g η - 1 , に対するピッチ変換前 の音デ一夕の振幅スぺク 卜ルの値 β η - 1を採用する。 この場合、 y
1 0 は X 1 0 にピツチ変換比 kを乗じた値であり (即ち、 y 1 0 = k · X 1 0 ) 、 y 1 0 は X 1 0 より大きい。
このよう にして 、 ピッチ変換処理部 1 3 は 、 第 2周波数 g riカゝら の周波数 X 1 0 を次第に大きく しながらピッチ変換前の振幅スぺク 卜ルを順次ピッチ変換して行く その 変換対象の振幅スぺク トルの周波数が所定の周波数 g n - 2より小さ くなると、 第 2周波数 g nからの周波数の差 X 1 0が X 2 0 よ り大きくなる。 X 2 0 は、
X 2 0 をピッチ変換比 k倍した値が y 2 となる値である ( X 2 0 ·
k = y 2 ) 。 ピッチ変換処理部 1 3 は、 第 2周波数 g nからの周波 数の差が x 2 0 よ り大きく y 2 より小さい領域 (即ち、 周波数 g c 〜 g n - 2) に対して、 ピッチ変換後の振幅スペク トルをピッチ変換 前の中間周波数 g c に対する振幅スぺク トルの値 a Cに設定する。
以上のようにして、 あるピークスぺク トル P 1 とピークスぺク ト ル P 1 に隣接するピークスぺク トル P 2 との間の伸長によるピッチ 変換が実行される。 この場合、 第 1 周波数領域 A 1 の最大周波数 f 1 maxは周波数 g 3 であ り、 第 2周波数領域 A 2 の最小周波数 f 2 ffiinは g n - 2である。 実際の音データには、 一般にピークスぺク ト ルが 2以上存在している。 従って、 ピッチ変換処理部 1 3 は、 隣接 する二つのピークスペク トルに対して、 上述したピッチ変換を実行 して行く。
これによれば、 ピッチ変換処理の概要にて説明したよう に、 ピ一 クスぺク トル P 1 の近傍のスぺク トル分布 AM I はそのままの形状 を維持してピッチだけが変換されたスぺク トル分布 A M 1 0 に移行 される。 同様に、 ピ一クスペク トル P 2 の近傍のスペク トル分布 A M 2 はそのままの形状を維持してピッチだけが変換されたスぺク ト ル分布 A M 2 0 に移行される。 また、 中間周波数領域 ( f ] L max ~ f 2 min) の振 Iスペク トルは、 結果的に所定のピッチ変換比 p k にてピッチ変換される。 つまり、 周波数 f aの振幅スぺク 卜 周波数 aを周波数 f aの関数であるピッチ変換比 Ρ k ( f a ) 倍 した周波数の振幅スペク トルへと移行される。 従 て 、 入力音の特 徵を維持し、 且つ 、 ピッチ変換後のスペク トル分布 A M 1 0 と A M
、
2 0 との間にも振幅スぺク トルが存在するので、 7¾和感が生じる音 を含まないピ Vチ変換後の音データが生成される
2. 入力音デ ~タの圧縮
次に、 入力曰 ァ一夕を圧縮するピッチ変換の場合について説明す ると、 ピッチ変換処理部 1 3 は、 図 5 に示したよ に 、 第 1 周波数 1 の第 1 ピ クスぺク トル P 1 をピッチ変換後第 1 周波数 h 1 の スぺク トル (ピ一クスペク トル P 1 0 ) としてそのまま移動する。 前述したとおり 、 h l = k ' g l である。 kは 1 よ り小さい
次に、 ピッチ変換処理部 1 3 は、 第 1 周波数 g 1 よ Ό X 1 だけ大 きい周波数 g 2 に対応するピッチ変換後周波数 h 2 ( = k · g 2 ) の振幅スぺク 卜ルとして、 周波数 g 2 に対するピ Vチ 目' jの音デ 一夕の振幅スぺク トルの値 α 2ではなく、 ピッチ変換刖の音データ
の第 1 周波数 g 1 よ り y 1 だけ大きい周波数 g 2 ' に対するヒッチ 変換前の立
曰 タの振幅スぺク トルの値ァ 2 を採用する しの場合 j ,
、 y 1 は X 1 にピッチ変換比 kを乗じた値であり (即ち 、 y 1 = k
• X 1 ) 、 y 1 は X 1 より も小さい。
このようにして 、 ヒッチ変換処理部 1 3 は 、 第 1周波数 g 1 から の周波数 X 1 を次第に大きく しながらピッチ亦 刖の振幅スぺク 卜 ルを順次ピッチ変換して行く。 その結果、 第 1 周波数 g 1 からの周 波数の差 X 1 が第 1 周波数 g 1から中間周波数 じ までの差 X c と 等しくなる しの場合も上記と同様に、 ピッチ変換処理部 1 3 は、 周波数 g C に対応するピッチ変換後周波数 h c ( = k · g c ) の振 幅スぺク 卜ルとして 、 周波数 g c に対するピ チ変換前の立
曰データ の振幅スぺク 卜ルの値 a Cではなく、 第 1 周波数 g 1 よ り y c ( = k · c ) だけ大さい周波数 g 4に対するピッチ変換前の立
曰データ の振幅スぺク 卜ルの値 Ύ C 1 を採用する。
同様に 、 ピッチ 換処理部 1 3 は、 第 2周波数 g nの第 2 ピーク スぺク ル P 2 をピッチ変換後第 2周波数 h nのスぺク 卜ル (ピー クスぺク 卜ル P 2 0 ) としてそのまま移動する 。 刖述したとおり、 n = k •
g nである
次に 、 ピ Vチ変換処理部 1 3は、 第 2周波数 g nよ り X 1 0 だけ 小さい周波数 g n - 1に対応するピッチ変換後周波数 h n - 1 ( = k ·
( g n - 0 ) の振幅スぺク 卜ルとして、 周波数 g n - 1に対するピッチ 変換前の曰丁 夕の振幅スベク トルの値 α n - 1ではなく 、 第 2周波 数 g nよ り y 1 0 だけ小さい周波数 g n - 1 ' に対する ピッチ変換前 の音デ一夕の振幅スぺク ルの値ァ n - 1を採用する。 この場合、 y
1 0 は X 1 0 にピッチ変換比 kを乗じた値であり (即ち 、 y 1 0 = k · X 1 0 ) 、 y 1 0 は X 1 0 より小さい。
このよ Όにして 、 ピッチ変換処理部 1 3 は 、 第 2周波数 s πカゝら の周波数 X 1 0 を次第に大きく しながら ピッチ変換前の振幅スぺク トルを順次ピッチ変換して行く。 その結果、 第 2周波数 g nからの 周波数の差 X 1 0が S X c と等しく なる。 この場合も上記と同様に
、 ピッチ変換処理部 1 3 は 、 周波数 g c に対 するピッチ変換後周 波数 h c ( = k g c ) の振幅スぺク トルとして、 周波数 g c に対
、
するピッチ 換 の音デ一夕の振幅スぺク トルの値ひ Cではなく、 第 2周波数 g nよ り y 1 C ( = k · X c ) だけ小さい周波数 g n _3 に対するピ Vチ変換前の音データの振幅スぺク トルの値 r C 2 を採
用する。
以上のよう にして、 あるピークスぺク トル P 1 とピークスぺク 卜 ル P 1 に隣接するピークスぺク トル P 2 との間の圧縮によるピッチ 変換が実行される。 この場合、 第 1周波数領域 A 1 の最大周波数 f l max及び第 2周波数領域 A 2 の最小周波数 f 2 m i iiは共に g c であ る 。 実際の音データの中にはピ クスぺク トルは 2以上存在してい る 。 従つて、 ピッチ変換処理部 3 は、 隣接する二つのピークスぺ ク トルに対して、 上述したピッ 変換を実行して行 <
これによつても、 ピッチ変換 理の概要にて説明したよラに、 ピ
―クスぺク トル P 1 の近傍のス ク 卜ル分布 A M 1 はそのままの形 状を維持してピッチだけが変換換処、チぺ。クさるさピしれたスぺク トル分布 A M 1 0 に移 行される。 |ロ]様に、 ピークスぺ トル P 2 の近傍のスぺク 卜ル分布
A M 2 はそのままの形状を維持 てピッチだけが変換されたスぺク 卜ル分布 A M 2 0 に移行される 従つて、 入力音の特徴を維持し、 且つ、 違和感が生じる音を発生 せることがないピッチ変換後の音 テ一夕が生成される。 以上が、 ッチ変換処理部 1 3 によるピッチ 換処理の実際の作動である。
以上 、 本発明によるピッチ変 の 施形態について説明した このピッチチ変換装置によれば 入力 の特徴を残し且 違和感の
—
ないピツチ変換後の音を発生す ための ~タを得る とができる なお 、 本発明は上記各実施形態に限定されることはな < 、 本 明 の範囲内に いて種々の変形例を採用することができる
例えば、
ッナ変換処理部 1 3 は 6 ( B ) のピッチ変換後の 中間周波数 域に対する実線 L 1 にて示したよ Ό 、 図 6 ( A ) の 中間周波数 域 A 3 内の各振幅スぺク 卜ルを周波 軸上で圧縮又は 伸長すると 、 各振幅スぺク 卜ルを上述した手法 てピッチ変換し た場合の各 幅スベク トル (図 6 ( B ) の破線 L にて示した曲線 ) よ り も小さい値とした上で (即ち 1 より小さ ゲイ ンをピッチ 変換した 幅スぺク トルに乗じた値を最終的なピ チ変換後の振幅 スぺク トルとする ことによ り) 圧縮又は伸長して よい。
更に、 ピ Vチ変換処理部 1 3 は、 図 7 ( A ) 示した音データを 上述した手法に従つて伸長することによ り ピッチ変換した結果、 所 定の高側閾値以上の周波数に対する振幅スぺク 卜ルが生じた場合、 図 7 ( B ) に示したように、 その高側閾値以上の領域についての振 幅スぺク トルを実質的に 0 にしてもよい。 この 合、 高側閾値は、
通常の楽音では現れる ことのない高音の周波数に 又定されている 同様に、 ピッチ変換処理部 1 3 は 、 図 7 ( A ) に示した音デ一夕 を上述した手法に従つて圧縮することにより ヒッチ変換した結果、 所定の低側閾値以下の周波数に対する振幅スぺク 卜ルが生じた場合 図 7 ( C ) に示したよう に 、 その低側閾値以下の領域についての 振幅スぺク トルを実質的に 0 にしてもよい この場合、 低側閾値は 通常の楽音では現れることのない低音の周波数に設定されている れらによれば、 周波数軸上での振幅スぺク 卜ルの圧縮又は伸長 に り、 通常の演奏などにおいてはあり得ない高周波数又は低周波 数に対する振幅スぺク 卜ルが発生した場合であつても、 そのような 周波数の振幅スぺク ルが削除されるので、 m采として、 良好な音 を得ることが可能な立
曰デ一夕を生成する ことがでさる。
また、 ピッチ変換処理部 1 3 は ピッチ変 ¾¾刖の各ピ一クスぺク 卜ルの包絡線を作成しておき、 振幅スぺク 卜ルの圧縮又は伸長によ る ピツチ変換後のスぺク トル分布が 、 作成しておいた包絡線より も 大さくなるような振幅スぺク トルを有するとさには、 その振幅スぺ ク ルが包絡線に沿 よう にピッチ変換後の振幅スペク トル (スぺ ク 卜ル分布) を修正してもよい。 れによれば、 より入力音の特徴 を維持することがでさる
更に、 第 1周波数 域 A 1及び第 2周波数領域 A 2 を特定 (指定
) する方法としては 隣り合う 2つの局所的ピ ク (第 1 ピ クス ぺク トル P 1及び第 2 ピークスぺク 卜ル P 2 ) 間で周波数軸を半分 に切り、 各半分を近い方の局所的ピ —クを含む領域に割当てる方法 あるいは隣り合う 2 つの局所的ピ —ク間で振幅値が最低の谷を見 出し、 最低の振幅値に対応する周波数を隣り □ Ό領域間の境界とす る方法等を採用する とができる。
また、 周波数領域表現に変換された音デー夕には、 通常、 振幅ス ぺク トルの局所的ピ一ク (ピークスぺク トル) が多数存在している そこで、 このような場合、 周波数領域を、 ピ クスぺク 卜ルを N 個 (複数であって、 Nは、 例えば、 2或いは 3 ) ずつ含む複数の領 域に区分し、 各区分された領域内のスぺク トルに対して本発明によ るピッチ変換手法を適用してもよい
即ち、 例えば、 伸張によ り ピッチを増加する場合において 複数 のピークスぺク トルに対応する周波数が f 0 f 1 f 2 f 3
f 4 、 f 5及び f 6 ( f 0 < f l < f 2 < f 3 < f 4 < f 5 < f 6
;) であるとき、 上記 Nの値を 3 に設定し、 f 0 、 f 1及び f 2 の 3 個 (N個) の周波数を含む周波数領域 (低側周波数領域) と 、 f 4
、 f 5及び f 6 の 3個 ( N個) の周波数を含む周波数領域 (高側周 波数領域) と、 に周波数領域を区分する。
そして、 各領域 (各区間) に本発明を適用するしとによ り 、 記 低側周波数領域に対応するピツチ変換後の周波数領域に対するスぺ ク トル ( f 0 に対する f 0 ' 、 f 1 に対する f 1 、 f 2 に対する f 2 ' にそれぞれピークスぺク トルを有するスぺク トル) を得ると ともに、 前記高側周波数領域に対応するピッチ変換後の周波数領域 に対するスベク トル ( f 4 に対する ί 4 ' 、 f 5 に対する f 5 、 f 6 に対する f 6 ' にそれぞれピークスペク トルを有するスぺク 卜 ル) を得てもよい。
また、 例えば、 上記例において圧縮により ピッチを減少する場合
、 : f 0 、 f 1 及び f 2 の 3個 (N個) の周波数を含む周波数領域 ( 第 1 セクシヨ ン) と、 f 2 、 f 3及び f 4 の 3個 ( N個) の周波数 を含む周波数領域 (第 2セクショ ン) と、 f 4 、 f 5及び f 6 の 3 個 (N個) の周波数を含む周波数領域 (第 3セクシヨ ン) と 、 に周 波数領域を区分する。
そして 、 各領域に本発明を適用することによ り、 第 1 セクシヨ ン に対応するピ Vチ変換後の周波数領域に対するスぺク 卜ル ( f 0 に
,
対する f 0 , 、 f 1 に対する f 1 ' 、 f 2 に対する f 2 にそれぞ れピークスぺク トルを有するスぺク トル) を得、 第 2セクシヨ ンに 対応するピッチ変換後の周波数領域に対するスぺク 卜ル ( f 2 に対 する f 2 、 f 3 に対する f 3 ' 、 f 4 に対する f 4 にそれぞれ ピークスぺク 卜ルを有するスぺク 卜ル) を得、 更に、 第 3セクショ ンに対応する ピツチ変換後の周波数領域に対するスぺク 卜ル ( f 4 に対する f 4 、 f 5 に対する f 5 ' 、 f 6 に対する f 6 ' にそれ ぞれピ一クスぺク トルを有するスぺク トル) を得ても い 。 但し、 このよ な処理を行う と、 各領域ごとの圧縮又は伸張に伴つて周波 数軸上に重複領域又は欠損領域が発生するので、 これらの領域に対 しては適当な方法により、 違和感の少ない音を生成するスベク トル を得るようにするとよい。