JP4509273B2 - 音声変換装置及び音声変換方法 - Google Patents

音声変換装置及び音声変換方法 Download PDF

Info

Publication number
JP4509273B2
JP4509273B2 JP36527199A JP36527199A JP4509273B2 JP 4509273 B2 JP4509273 B2 JP 4509273B2 JP 36527199 A JP36527199 A JP 36527199A JP 36527199 A JP36527199 A JP 36527199A JP 4509273 B2 JP4509273 B2 JP 4509273B2
Authority
JP
Japan
Prior art keywords
pitch
spectrum shape
feature information
spectrum
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP36527199A
Other languages
English (en)
Other versions
JP2001184099A (ja
Inventor
隆宏 川嶋
シーメンツ マーク
ボナダ ジョルディ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP36527199A priority Critical patent/JP4509273B2/ja
Publication of JP2001184099A publication Critical patent/JP2001184099A/ja
Application granted granted Critical
Publication of JP4509273B2 publication Critical patent/JP4509273B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、入力音声のピッチをシフトした出力音声を得る音声変換装置及び音声変換方法に係り、特にカラオケ装置に用いて好適な音声変換装置及び音声変換方法に関する。
【0002】
【従来の技術】
従来より、入力された音声のピッチをシフトして出力する音声変換装置は種々開発されており、例えば、カラオケ装置の中には、歌い手の歌った歌声のピッチを変換して、男性の声(男声)を女性の声(女声)に、あるいはその逆に変換して出力するものもある(例えば、特表平8−508581号)。
【0003】
この種の音声変換装置が採用しているピッチシフトの方法としては、時間領域での方法と周波数領域での方法が挙げられる。前者は歌い手の歌った歌声を表す入力信号のサンプリング結果からサンプルを間引いたり所定の補間を行ったりすることでピッチをシフトする方法であり、後者は入力信号から得られた正弦波成分(倍音列)を周波数領域でシフトすることでピッチをシフトする方法である。
【0004】
【発明が解決しようとする課題】
しかしながら、従来のいずれの方法を採用してもピッチシフト後の音声の声質が不自然な声質となるのを避けることはできなかった。
本発明は上述した事情に鑑みて為されたものであり、ピッチシフト後の音声の声質を自然な声質とすることができる音声変換装置及び音声変換方法を提供することを目的としている。
【0005】
【課題を解決するための手段】
上述した課題を解決するために、請求項1に係る音声変換装置は、入力音声を表す入力信号から入力音声と異なるピッチの音声を表す出力信号を得る音声変換装置において、前記入力信号に基づいて前記入力音声のピッチをフレーム毎に分析して出力し、当該入力信号の周波数分析をフレーム毎に行う分析手段と、前記入力信号の平均ゲインを分析する平均ゲイン分析手段と、前記分析手段により分析されたピッチと与えられたピッチシフト量とに基づいて変換後ピッチを算出する変換後ピッチ算出手段と、スペクトルシェイプを生成するための特徴情報を音素に対応付けて格納した特徴情報データベースと、前記入力信号から音素を認識する音素認識手段と、前記音素認識手段により認識された音素に対応した特徴情報を前記特徴情報データベースから取得し、該特徴情報と前記変換後ピッチと前記平均ゲイン分析手段により分析された前記平均ゲインとに基づいて第1のスペクトルシェイプを生成すると共に、前記分析手段による周波数分析結果と前記ピッチシフト量とに基づいて得られるスペクトルシェイプと、前記第1のスペクトルシェイプとを所定の関数に従って補間することにより第2のスペクトルシェイプを生成し、前記第のスペクトルシェイプに応じた信号を前記出力信号として出力する出力手段とを具備することを特徴としている。
【0006】
また、上述した課題を解決するために、請求項2に係る音声変換装置は、入力音声を表す入力信号から入力音声と異なるピッチの音声を表す出力信号を得る音声変換装置において、前記入力信号に基づいて前記入力音声のピッチをフレーム毎に分析して出力し、当該入力信号の周波数分析をフレーム毎に行う分析手段と、前記入力信号の平均ゲインを分析する平均ゲイン分析手段と、前記分析手段により分析されたピッチと与えられた変換後ピッチとに基づいてピッチシフト量を算出するピッチシフト量算出手段と、スペクトルシェイプを生成するための特徴情報を音素に対応付けて格納した特徴情報データベースと、前記入力信号から音素を認識する音素認識手段と、前記音素認識手段により認識された音素に対応した特徴情報を前記特徴情報データベースから取得し、該特徴情報と前記ピッチシフト量算出手段により算出された前記ピッチシフト量と前記平均ゲイン分析手段により分析された前記平均ゲインとに基づいて第1のスペクトルシェイプを生成すると共に、前記分析手段による周波数分析結果と前記ピッチシフト量とに基づいて得られるスペクトルシェイプと、前記第1のスペクトルシェイプとを所定の関数に従って補間することにより第2のスペクトルシェイプを生成し、前記のスペクトルシェイプに応じた信号を前記出力信号として出力する出力手段とを具備することを特徴としている。上記各構成によれば、入力音声の音素に応じたスペクトルシェイプと入力信号の平均ゲインとに基づいた出力信号が出力される。
【0008】
請求項1又は2に記載の音声変換装置において、前記周波数分析は、前記フレーム毎の前記入力信号を正弦波成分と残差成分とに分離することにより行われ、前記出力手段は、前記第1のスペクトルシェイプと、前記正弦波成分と前記ピッチシフト量とに基づくスペクトルシェイプとを前記所定の関数に従って補間することにより前記第2のスペクトルシェイプを生成し、当該第2のスペクトルシェイプと前記残差成分とに応じた信号を前記出力信号として出力することとしてもよい(請求項)。この構成によれば、音素に応じたスペクトルシェイプ及び入力信号の正弦波成分に基づいた第のスペクトルシェイプ(ピッチシフト後)と入力信号の残差成分(ピッチシフト前)とに応じた出力信号が出力される。
【0010】
請求項1または2に記載の音声変換装置において、前記特徴情報データベースは複数のパラメータセットの各々について、スペクトルシェイプを生成するための特徴情報を音素に対応付けて格納し、前記出力手段は、指定されたパラメータセットと前記音素認識手段により認識された音素とに対応した特徴情報を前記特徴情報データベースから取得するようにしてもよい(請求項)。
【0011】
請求項1に記載の音声変換装置において、前記出力手段は、前記特徴情報と前記変換後ピッチに基づくスペクトルシェイプの傾きを前記平均ゲインに応じて補正するスペクトル傾き補正手段を具備し、前記スペクトル傾き補正手段により補正されたスペクトルシェイプを前記第1のスペクトルシェイプとして生成し、当該第1のスペクトルシェイプに応じた信号を前記出力信号として出力するようにしてもよい(請求項また、請求項2に記載の音声変換装置において、前記出力手段は、前記特徴情報と前記ピッチシフト量に基づくスペクトルシェイプの傾きを前記平均ゲインに応じて補正するスペクトル傾き補正手段を具備し、前記スペクトル傾き補正手段により補正されたスペクトルシェイプを前記第1のスペクトルシェイプとして生成し、当該第1のスペクトルシェイプに応じた信号を前記出力信号として出力するようにしてもよい(請求項6)。これらの構成によれば、入力音声の音素に応じたスペクトルシェイプの傾きを入力信号の平均ゲインに応じて補正して得られたスペクトルシェイプに応じた出力信号が出力される。
【0012】
請求項1または2に記載の音声変換装置において、直前のスペクトルシェイプを記憶する前フレーム情報記憶手段を具備し、前記出力手段は、前記第1のスペクトルシェイプと前記前フレーム情報記憶手段に記憶された前記直前のスペクトルシェイプとに基づいて第のスペクトルシェイプを生成し、該第のスペクトルシェイプに応じた信号を前記出力信号として出力するとともに、該第のスペクトルシェイプを前記直前のスペクトルシェイプとして前記前フレーム情報記憶手段に記憶させるようにしてもよい(請求項)。この構成によれば、入力音声の音素及びピッチシフト量に応じたスペクトルシェイプと直前のスペクトルシェイプとに基づいた出力信号が出力される。
【0013】
また、上述の課題を解決するために、請求項に記載の音声変換方法は、入力音声を表す入力信号から入力音声と異なるピッチの音声を表す出力信号を得る音声変換方法において、前記入力信号に基づいて前記入力音声のピッチをフレーム毎に分析して出力し、当該入力信号の周波数分析をフレーム毎に行う分析ステップと、前記入力信号の平均ゲインを分析する平均ゲイン分析ステップと、前記分析ステップにより分析されたピッチと与えられた変換後ピッチとに基づいてピッチシフト量を算出するピッチシフト量算出ステップと、前記入力信号から音素を認識する音素認識ステップと、スペクトルシェイプを生成するための特徴情報であって、前記音素認識ステップにより認識された音素に対応した特徴情報を取得する取得ステップと前記取得ステップにより取得された前記特徴情報と前記変換後ピッチと前記平均ゲイン分析ステップにより分析された前記平均ゲインとに基づいて第1のスペクトルシェイプを生成すると共に、前記分析ステップによる周波数分析結果と、前記ピッチシフト量とに基づいて得られるスペクトルシェイプと、前記第1のスペクトルシェイプとを所定の関数に従って補間することにより第2のスペクトルシェイプを生成し、前記第のスペクトルシェイプに応じた信号を前記出力信号として出力する出力ステップとを有することを特徴としている。また、上述の課題を解決するために、請求項9に記載の音声変換方法は、入力音声を表す入力信号から入力音声と異なるピッチの音声を表す出力信号を得る音声変換方法において、前記入力信号に基づいて前記入力音声のピッチをフレーム毎に分析して出力し、当該入力信号の周波数分析をフレーム毎に行う分析ステップと、前記入力信号の平均ゲインを分析する平均ゲイン分析ステップと、前記分析ステップにより分析されたピッチと与えられた変換後ピッチとに基づいてピッチシフト量を算出するピッチシフト量算出ステップと、前記入力信号から音素を認識する音素認識ステップと、スペクトルシェイプを生成するための特徴情報であって、前記音素認識ステップにより認識された音素に対応した特徴情報を取得する取得ステップと、前記取得ステップにより取得された前記特徴情報と前記ピッチシフト量算出手段により算出された前記ピッチシフト量と前記平均ゲイン分析ステップにより分析された前記平均ゲインとに基づいて第1のスペクトルシェイプを生成すると共に、前記分析ステップによる周波数分析結果と前記ピッチシフト量とに基づいて得られるスペクトルシェイプと、前記第1のスペクトルシェイプとを所定の関数に従って補間することにより第2のスペクトルシェイプを生成し、前記第2のスペクトルシェイプに応じた信号を前記出力信号として出力する出力ステップとを有することを特徴としている。これらの方法によれば、入力音声の音素に応じたスペクトルシェイプと入力信号の平均ゲインに基づいた出力信号が出力される。
【0014】
【発明の実施の形態】
以下、図面を参照して本発明の実施形態に係る音声変換装置について説明する。なお、ここでは、入力信号を変換して得られる出力信号に含まれる正弦波成分のピッチを相対的に指定する第1実施形態と、絶対的に指定する第2実施形態について順に説明する。
【0015】
[A−1.第1実施形態の構成]
図1は本発明の第1実施形態に係る音声変換装置の全体構成を示すブロック図であり、この図に示すように、本音声変換装置はピッチシフト前の音声を表す入力信号からピッチシフト後の音声を表す出力信号を得るものである。
【0016】
図1において、11は入力信号に対して音素認識処理を行う音素認識部である。音素認識処理は入力信号に対応する音素を特定する処理であり、音素認識部11は特定した音素を表す情報を出力する。また、音素認識部11は、特定した音素が複数である場合には、音素を表す情報と当該音素との相関を表す相関値(例えば、0より大で1未満の実数値)とを複数の音素の各々について出力する。この音素認識部11が採用する音素認識方法は音素を認識できる方法であればよく、例えば、帯域フィルタ群による方法であってもいし、FFT(高速フーリエ変換)による方法、相関関数による方法、LPC(Linear Predictive Coding)分析による方法、あるいはΔケプストラム法であってもよい。
【0017】
12は音素毎の特徴情報を格納した特徴情報データベースである。この特徴情報データベース12は図2に示すような特徴情報テーブルTBLを有し、音素認識部11から出力された情報を入力し、当該情報で表された音素に対応した特徴情報を特徴情報テーブルTBLから抽出し、当該特徴情報を当該音素に対応した相関値とともに出力する。
【0018】
図2に示すように、特徴情報テーブルTBLにおける各音素“a”,“i”,…にはデフォルトセットの特徴情報がピッチバンク毎に対応付けられており、特徴情報データベース12は音素認識部11からの情報で表された音素とピッチシフト後のピッチである変換後ピッチを包含したピッチバンクとに対応した特徴情報をデフォルトセットから抽出することができる。上記ピッチバンクは特定の音域幅を示しており、各パラメータセットに対して全音域をカバーするように複数のピッチバンクが設けられている。なお、デフォルトセットの特徴情報は変更不能に予め設定されたものであるが、特徴情報テーブルTBLは、特徴情報を変更可能なパラメータセットとして、男声セット、女声セット、及び個人別セットを有する。
【0019】
男声セット/女声セットは男声/女声の別を示す指定情報が外部から入力された場合に使用されるべき特徴情報のセットであり、特徴情報データベース12は外部から男声/女声の別を示す指定情報が入力されると、音素及びピッチバンクに対応した特徴情報を男声セット/女声セットから抽出する。なお、男声セット/女声セットの特徴情報は予め設定されているが、使用者により任意に変更可能である。
【0020】
図2における鈴木太郎セットは個人別セットの一例であり、個人名(例えば、鈴木太郎)を示す指定情報が入力された場合に使用されるべき特徴情報のセットである。例えば、特徴情報データベース12は外部から鈴木太郎を示す指定情報が入力されると、音素及びピッチバンクに対応した特徴情報を鈴木太郎セットから抽出する。なお、個人別セットは予め設定されておらず、使用者により任意に追加可能である。また、個人別セットの特徴情報は使用者により任意に変更可能である。
【0021】
特徴情報データベース12における特徴情報の抽出の優先順位は個人別セット、男声セット/女声セット、デフォルトセットとなっており、個人名を示す指定情報が入力された場合には当該指定情報に対応した個人別セットが、個人名を示す指定情報が入力されずに男声/女声の別を示す指定情報が入力された場合には当該指定情報に対応した男声セット/女声セットが、個人名を示す指定情報及び男声/女声の別を示す指定情報のいずれも入力されなかった場合にはデフォルトセットが、特徴情報の抽出対象のパラメータセットとなる。
【0022】
なお、特徴情報テーブルTBLが音素及びパラメータセット毎に有する特徴情報はピッチシフト後の音声が不自然とならない程度のスペクトルシェイプ(第1のスペクトルシェイプ)を生成可能なパラメータを含んでいる。「スペクトルシェイプ」は波形の特徴を示しており、本実施形態では、以下のパラメータを含む特徴情報によって定義付けられている。
・フォルマント周波数
・フォルマントバンド幅
・スペクトル傾き
・スペクトルエンベロープ
【0023】
13は入力信号に対してフレーム単位で周波数分析を行う分析部であり、フレーム単位で入力信号を正弦波成分と残差成分とに分離し、両成分を出力する。また、分析部13は分析対象フレームの基本周波数(ピッチ)を分析し、これを入力信号のフレームピッチとして出力する。なお、本実施形態において「フレーム」は所定の時間単位で区切られた波形信号を意味しており、本実施形態では入力信号のフレームに対応した出力信号のフレームを生成することで出力信号を生成している。
【0024】
分析部13における周波数分析はSMS(Spectral Modeling Synthesis)分析である。ここで、本実施形態におけるSMS分析の処理内容について図3を参照して説明する。この図に示すように、分析部13は、まず、標本化された入力信号に窓関数を乗じてフレームを切り出し、このフレームに高速フーリエ変換(FFT)を施して得られる周波数スペクトルから正弦波成分と残差成分を抽出する。正弦波成分とは、基本周波数及び基本周波数の倍数にあたる周波数(倍音)の成分をいう。
【0025】
14は分析部13から出力された正弦波成分の平均ゲインを算出する平均ゲイン算出部であり、算出した平均ゲインを出力する。
15は分析部13から出力されたフレームピッチを外部から与えられたピッチシフト量だけシフトさせて得られるピッチを求める変換後ピッチ算出部であり、このピッチを変換後ピッチとして出力する。
【0026】
16はスペクトルシェイプ生成部、17はスペクトル傾き補正部、18は前フレーム情報記憶部であり、これらの各部は連携して作動し、特徴情報データベース12から出力された情報に基づいたスペクトルシェイプを、新ピッチと入力信号の正弦波成分の平均ゲインと直前のフレームに対する音素スペクトルシェイプ(直前のスペクトルシェイプ)とに基づいて変形し、現在のフレームに対する音素スペクトルシェイプを生成する。なお、本実施形態における「音素スペクトルシェイプ」は、音素に応じて生成され、スペクトル傾き補正部17から出力されるスペクトルシェイプを意味する。
【0027】
ここで、図4を参照して上記各部16,17及び18が行う音素スペクトルシェイプ生成処理についてより具体的に説明する。
スペクトルシェイプ生成部16は、まず、特徴情報データベース12から出力された特徴情報に従ってスペクトルシェイプを生成する(ステップS1)。ここで生成されるスペクトルシェイプが1つの場合(音素が1つの場合)には当該スペクトルシェイプを処理対象のスペクトルシェイプとし、複数の場合(音素が複数の場合)には複数のスペクトルシェイプに対してスペクトル補間(音素間補間)を行うことで1つのスペクトルシェイプを生成し、このスペクトルシェイプを処理対象のスペクトルシェイプとする(ステップS2,S3)。
【0028】
次に、スペクトルシェイプ生成部16は処理対象のスペクトルシェイプの正弦波成分を変換後ピッチ算出部15により算出された変換後ピッチに一致するようにシフトしたスペクトルシェイプを生成し(ステップS4)、前フレーム情報記憶部18に記憶された直前の音素スペクトルシェイプから当該シフト後のスペクトルシェイプへ滑らかに変化させるために必要となる中間的な補間スペクトルシェイプをスペクトル補間(フレーム間補間)により生成する(ステップS5)。
【0029】
以下、図5(a)及び(b)を参照してスペクトル補間について説明する。スペクトル補間では、まず、図5(a)に示すように、補間の元となる2つのスペクトルシェイプ(以後、第1スペクトルシェイプSS11及び第2スペクトルシェイプSS12とする)をそれぞれ、複数の周波数領域Z1、Z2、…に分割する。ここで、第1スペクトルシェイプSS11における各領域の境界の周波数(以後、アンカーポイント)をRB1,1、RB2,1、…、RBN,1とし、第2スペクトルシェイプSS12におけるアンカーポイントをRB1,2、RB2,2、…、RBM,2とする。
【0030】
次に、図5(b)に示す処理が行われる。
図5(b)において、補間位置xは第1スペクトルシェイプSS11及び第2スペクトルシェイプSS12と補間により生成されるスペクトルシェイプとの位置関係を示すパラメータであり、0より大で1未満の実数値をとる。補間により生成されるスペクトルシェイプは、x=0の場合には第1スペクトルシェイプSS1そのもの、x=1の場合には第2スペクトルシェイプそのものに一致する。この図においては、x=0.35の例が示されている。また、図中の縦軸上の白丸(○)はスペクトルシェイプを構成する周波数及びマグニチュードの組の各々を示している。
【0031】
図5(b)において、縦軸は周波数を表しており、マグニチュードの軸は紙面垂直方向に立ち上がっているものとする。また、第1スペクトルシェイプSS11(x=0)の対象領域Ziに対応するアンカーポイントがRBi,1及びRBi+1,1であり、当該領域Ziに属する具体的な周波数及びマグニチュードの組のうちの何れかの組の周波数がfi1であり、そのマグニチュードがS1(fi1)であるものとする。
【0032】
さらに、第2スペクトルシェイプSS12(x=1)の対象領域Ziに対応するアンカーポイントがRBi,2及びRBi+1,2であり、当該領域Ziに属する具体的な周波数及びマグニチュードの組のうちの何れかの組の周波数がfi2であり、そのマグニチュードがS2(fi2)であるものとする。
【0033】
本実施形態では、第1スペクトルシェイプSS11上の実在の組に対応したスペクトル遷移関数ftrans1(x)と、第2スペクトルシェイプSS12上の実在の組に対応したスペクトル遷移関数ftrans2(x)を最も簡単な線形関数としており、これらの遷移関数は次式(1),(2)で表される。
trans1(x)=m1・x+b1 …(1)
trans2(x)=m2・x+b2 …(2)
ただし、
1=RBi,2-RBi,1
1=RBi,1
2=RBi+1,2-RBi+1,1
2=RBi+1,2
である。
【0034】
上記前提に基づいて、まず、第1スペクトルシェイプSS11上の組に基づいて補間スペクトルシェイプ上の組を求める処理について説明する。
第1スペクトルシェイプSS11上に実在する周波数fi1及びマグニチュードS1(fi1)の組に対応した第2スペクトルシェイプSS12上の周波数fi1,2は下式(3)で表される。
【数1】
Figure 0004509273
ただし、
1=RBi+1,1-RBi,1
2=RBi+1,2-RBi,2
である。
【0035】
この周波数fi1,2を挟むように最も近接して実在する第2スペクトルシェイプSS12上の2つの組を用いると、S2(fi1,2)は下式(4)で表される。ただし、下式では、上記2つの組の低い方の周波数に“−”、高い方の周波数に“+”のサフィックスを付している。
【数2】
Figure 0004509273
【0036】
式(3),(4)から容易に推測されるように、第1スペクトルシェイプSS11上に実在する周波数及びマグニチュードの組に対応する補間スペクトルシェイプ上の周波数fi1,x及びマグニチュードSx(fi1,x)は下式(5),(6)で表される。
【数3】
Figure 0004509273
x(fi1,x)=S1(fi1)+{S2(fi1,2)-S1(fi1)}・x …(6)
上式(5),(6)を用いることにより、第1スペクトルシェイプSS11上の実在する全ての組に対応した補間スペクトルシェイプ上の組を求めることができる。
【0037】
次に、第2スペクトルシェイプSS12上の組に基づいて補間スペクトルシェイプ上の組を求める処理について説明する。
第2スペクトルシェイプSS12上に実在する周波数fi2及びマグニチュードS2(fi2)の組に対応した第1スペクトルシェイプSS11上の周波数fi2,1は下式(7)で表される。
【数4】
Figure 0004509273
ただし、
1=RBi+1,1-RBi,1
2=RBi+1,2-RBi,2
である。
【0038】
この周波数fi2,1を挟むように最も近接して実在する第1スペクトルシェイプSS11上の2つの組を用いると、S1(fi2,1)は下式(8)で表される。ただし、下式では、上記2つの組の低い方の周波数に“−”、高い方の周波数に“+”のサフィックスを付している。
【数5】
Figure 0004509273
【0039】
式(7),(8)から容易に推測されるように、第2スペクトルシェイプSS12上に実在する周波数及びマグニチュードの組に対応する補間スペクトルシェイプ上の周波数fi2,x及びマグニチュードSx(fi2,x)は下式(9),(10)で表される。
【数6】
Figure 0004509273
x(fi2,x)=S2(fi2)+{S1(fi2,1)-S2(fi2)}・(x-1) …(10)
上式(9),(10)を用いることにより、第2スペクトルシェイプSS12上の実在する全ての組に対応した補間スペクトルシェイプ上の組を求めることができる。
【0040】
こうして得られた補間スペクトルシェイプ上の全ての組を周波数順に並べることにより領域Ziに対する補間スペクトルシェイプが得られる。本実施形態では、全ての領域Z1、Z2、…について上述の処理を行うことで、複数のスペクトルシェイプに対する補間スペクトルシェイプを得ている。なお、本実施形態における補間位置xは、音素間補間においては特徴情報データベース12からの相関値となり、フレーム間補正においては予め設定された値となる。
【0041】
再び図4において、スペクトル傾き補正部17は生成された補間スペクトルシェイプに対して傾き補正等を行う(ステップS6)。一般に、出力音量が大の場合にはスペクトルシェイプの高域が豊か(リッチ)となり、小の場合にはスペクトルシェイプの高域が乏しくなる。この現象を再現するために、スペクトル傾き補正部17は平均ゲイン算出部14から出力された平均ゲインに応じて、補正スペクトルシェイプの平均ゲインや高域の形状(ここでは「傾き」)を補正し、補正後のスペクトルシェイプを音素スペクトルシェイプとして出力する。
【0042】
そして、前フレーム情報記憶部18はスペクトル傾き補正部17から出力された音素スペクトルシェイプを記憶し、スペクトルシェイプ生成部16の使用に供する(ステップS7)。以後、処理はステップS1に戻る。
【0043】
再び図1において、19はピッチシフトシェイプ生成部であり、分析部13からフレーム単位で出力された入力信号の正弦波成分を外部から与えられたピッチシフト量だけピッチシフトし、ピッチシフト後の正弦波成分を表すスペクトルシェイプとスペクトル傾き補正部17から出力された音素スペクトルシェイプとの間でスペクトル補間を行うことで新たなスペクトルシェイプを生成し、出力する。ここで行われるスペクトル補間の詳細は前述の通りである。
【0044】
20は合成部であり、分析部13から出力された入力信号の残差成分とピッチシフトシェイプ生成部19から出力されたスペクトルシェイプとに応じた出力信号を生成し、これを出力する。
【0045】
[A−2.第1実施形態の動作]
次に、上記構成の音声変換装置の動作について図1を参照して説明する。
入力信号が音声変換装置に入力されると、分析部13において当該入力信号に対してフレーム単位の周波数分析が行われる。これにより、入力信号は正弦波成分と残差成分とに分けられ、正弦波成分が平均ゲイン算出部14及びピッチシフトシェイプ生成部19へ、残差成分が合成部20へ供給される。また、分析部13により、入力信号のフレームピッチが求められ、このフレームピッチが変換後ピッチ算出部15へ供給される。
【0046】
正弦波成分が供給された平均ゲイン算出部14では平均ゲインが求められる。この平均ゲインはスペクトル傾き補正部17へ供給される。また、フレームピッチが供給された変換後ピッチ算出部15には外部からピッチシフト量が与えられており、変換後ピッチ算出部15では、これらのフレームピッチ及びピッチシフト量とに基づいて変換後ピッチが算出される。この変換後ピッチは特徴情報データベース12、スペクトルシェイプ生成部16及びピッチシフトシェイプ生成部19へ供給される。変換後ピッチが供給されたピッチシフトシェイプ生成部19では、入力信号の正弦波成分に対し、外部から与えられたピッチシフト量に従ったピッチシフトが行われる。
【0047】
一方、音素認識部11においては入力信号から音素が認識され、当該音素を表す情報が特徴情報データベース12へ供給される。なお、認識された音素が複数である場合には、各音素に対する相関値も特徴情報データベース12へ供給される。特徴情報データベース12においては、当該音素に対応した特徴情報が抽出され、当該音素を表す情報(及び当該音素との相関値)とともにスペクトルシェイプ生成部16へ供給される。前述のように、特徴情報データベース12がパラメータセットの抽出における優先順位は個人別セット、男声/女声セット、デフォルトセットとなっているため、特徴情報データベース12に個人名を示す情報が入力されている場合には個人別セットが、個人名ではなく男声/女声の別を示す情報が入力されている場合には男声/女声セットが、いずれも入力されていない場合にはデフォルトセットが、抽出対象のパラメータセットとなる。特徴情報データベース12では、このパラメータセットから、音素認識部11により認識された音素と変換後ピッチ算出部15により算出された変換後ピッチを包含したピッチバンクとに対応した特徴情報が抽出される。
【0048】
スペクトルシェイプ生成部16では、特徴情報データベース12から供給された特徴情報に従ってスペクトルシェイプが生成される。ここで生成されたスペクトルシェイプが複数の場合には、スペクトルシェイプ生成部16において前述の音素間補間が行われて1つのスペクトルシェイプが生成される。1つだけ生成されたスペクトルシェイプは、その正弦波成分のピッチが変換後ピッチ算出部15から供給された変換後ピッチに一致するようにシフトされた後に、前フレーム情報記憶部18に記憶された直前のスペクトルシェイプから滑らかにつながるように前述のフレーム間補間で利用される。この結果として得られたスペクトルシェイプはスペクトル傾き補正部17へ供給される。
【0049】
スペクトル傾き補正部17ではスペクトルシェイプに対して、入力信号の正弦波成分の平均ゲインに応じた傾き補正等が施され、この結果として得られたスペクトルシェイプが音素スペクトルシェイプとしてピッチシフトシェイプ生成部19へ供給される。この際、当該音素スペクトルシェイプはスペクトル傾き補正部17に記憶される。音素スペクトルシェイプが供給されたピッチシフトシェイプ生成部19では、このスペクトルシェイプと入力信号の正弦波成分に基づいたスペクトルシェイプとの間でスペクトル補間が行われ、新しいスペクトルシェイプが生成される。
【0050】
ピッチシフトシェイプ生成部19により生成されたスペクトルシェイプは合成部20へ供給される。合成部20ではこのスペクトルシェイプと入力信号の残差成分とに応じた信号が生成され、本音声変換装置の出力信号として出力される。なお、この出力信号のピッチは変換後ピッチとなっている。
【0051】
上述した第1実施形態によれば、入力信号から、自然な声質のピッチシフト後の出力信号を得ることができる。特に、ピッチシフト後の変換後ピッチを相対的に指定することができるため、例えば、カラオケ装置において、ユーザによるキーの制御の際や、ボーカルに対してハーモニーを生成する際、男声と女声との変換の際に用いて好適である。
【0052】
[B−1.第2実施形態の構成]
図6は本発明の第2実施形態に係る音声変換装置の全体構成を示すブロック図であり、この図において、図1と共通する部分には同一の符号を付し、その説明を省略する。
【0053】
第2実施形態に係る音声変換装置が第1実施形態に係る音声変換装置と大きく相違する点は、外部から与えられるパラメータがピッチシフト量ではなく、変換後ピッチである点である。このため、第2実施形態に係る音声変換装置においては、外部から与えられた変換後ピッチがそのまま特徴情報データベース12及びスペクトルシェイプ生成部16へ供給されている。
【0054】
また、上記相違点に起因して、図6では、変換後ピッチ算出部15(図1参照)に代えてピッチシフト量算出部21が設けられている。このピッチシフト量算出部21は、分析部13から出力されたフレームピッチと外部から与えられた変換後ピッチとの差を求め、この差をシフトすべき量(以後、ピッチシフト量)として出力する。このピッチシフト量がピッチシフトシェイプ生成部19へ供給されるように第2実施形態に係る本音声変換装置は構成されている。
【0055】
[B−2.第2実施形態の動作]
次に、上記構成の音声変換装置の動作について説明する。ただし、第1実施形態に係る音声変換装置の動作と同様の動作については、その説明を省略する。
入力信号が音声変換装置に入力されると、分析部13において入力信号のフレームピッチが求められ、このフレームピッチがピッチシフト量算出部21へ供給される。ピッチシフト量算出部21では、外部から与えられた変換後ピッチに対するフレームピッチの差であるピッチシフト量が算出され、ピッチシフトシェイプ生成部19へ供給される。シフト量が供給されたピッチシフトシェイプ生成部19では、入力信号の正弦波成分に対し、シフト量に従ったピッチシフトが行われる。
【0056】
また、特徴情報データベース12及びスペクトルシェイプ生成部16には、外部から与えられた変換後ピッチが供給され、最終的に、スペクトル傾き補正部17から音素スペクトルシェイプが出力される。以降の動作は第1実施形態における動作と同一であることから、その説明を省略する。
【0057】
上述した第2実施形態によれば、入力信号から、自然な声質のピッチシフト後の出力信号を得ることができる。特に、変換後ピッチを絶対的に指定することから、例えば、カラオケ装置において、強制的に正しいピッチの出力音声を得る際や、曲の進行に応じてボーカルとの度数差が変わる変則的なハーモニーを付加する際に用いて好適である。
【0058】
[C.補足]
上述した各実施形態は例に過ぎず、本発明は上記構成に限定されるものではなく、以下に例示するような様々な態様を包含する。
【0059】
本実施形態ではパラメータセット毎に複数のピッチバンクを設けるようにしたが、図7に示すように、ピッチバンクと他のパラメータセットとを独立して設けてもよい。この場合には、特徴情報データベース12における特徴情報の抽出の優先順位は、例えば、個人別セット、男声セット/女声セット、ピッチバンク、デフォルトセットとなり、個人名を示す指定情報が入力された場合には当該指定情報に対応した個人別セットが、個人名を示す指定情報が入力されずに男声/女声の別を示す指定情報が入力された場合には当該指定情報に対応した男声セット/女声セットが、個人名を示す指定情報及び男声/女声の別を示す指定情報のいずれも入力されずにピッチを示す指定情報が入力された場合には当該ピッチを包含するピッチバンクが、上記のいずれでもない場合にはデフォルトセットが、特徴情報の抽出対象のパラメータセットとなる。
【0060】
また、特徴情報テーブルTBLに複数種のパラメータセットを格納した例を示したが、これらのパラメータセットとは異なる種類のパラメータセットを追加してもよいし、逆にパラメータセットの種類を削減してもよい。
【0061】
また、本実施形態では、分析部13が入力信号のフレームピッチを特徴情報データベース12へ供給するようにしたが、特徴情報データベース12がピッチバンク毎の特徴情報を持たない場合には、この供給を省略してもよい。
さらに、本実施形態では各種のスペクトル補間を行うようにしたが、スペクトル補間を行わない態様も実現可能である。例えば、認識される音素を必ず1つとして音素間補間を省略し、さらにフレーム間補間を省略し、加えて入力信号の正弦波成分のスペクトルシェイプを考慮せずに出力信号を生成・出力するようにしてもよい。
【0062】
また、本実施形態では入力信号の残差成分をも考慮に入れて出力信号を生成するようにしたが、残差成分を考慮しない態様も実現可能である。この場合、分析部13が残差成分を破棄し、合成部20がピッチシフトシェイプ生成部19からのスペクトルシェイプのみを用いて出力信号を得ることになる。
【0063】
さらに、スペクトル補間において用いられるスペクトル遷移関数は線形関数に限定されない。2次関数、指数関数などの非線形関数であってもよいし、離散的な関数であってもよい。さらに言えば、変数に対応した変化をテーブルとして用意し、このテーブルを関数のように用いてもよい。
また、スペクトル補間において、アンカーポイント毎に遷移関数を変更するようにしてもよい。さらに、遷移元と遷移先の音素を比較し、音素の遷移状態に応じて遷移関数及び補間位置の少なくとも一方を変更するようにしてもよい。
【0064】
【発明の効果】
以上説明したように、本発明によれば、音声のピッチシフトにおいて、入力音声の音素毎の特徴情報と変換後ピッチと入力音声を表す入力信号の平均ゲインとに基づいてピッチシフト後の音声を表す出力信号が出力されるため、ピッチシフト後の音声を、各音素に適合した、より自然な声質の音声とすることができる。
【0065】
さらに、入力信号の周波数分析結果を考慮して出力信号を生成するようにすれば、入力音声に近い声質の音声を得ることができる。
また、入力信号の正弦波成分及び残差成分を分離し、両者の取り扱いを分ければ、より入力音声に近い声質の音声を得ることができる。
さらに、入力信号の平均ゲインを考慮してスペクトルシェイプの傾きを補正したり、直前のスペクトルシェイプとの滑らかなつながりを実現する処理を行ったりすることにより、ピッチシフト後の音声をより自然な声質の音声とすることもできる。
【図面の簡単な説明】
【図1】 本発明の第1実施形態に係る音声変換装置の全体構成を示すブロック図である。
【図2】 同音声変換装置の特徴情報データベース12が有する特徴情報テーブルTBLの構成を示す概念図である。
【図3】 同音声変換装置において行われるSMS分析を説明するための図である。
【図4】 同音声変換装置において行われる音素スペクトルシェイプ生成処理の流れを示すフローチャートである。
【図5】 (a)及び(b)はそれぞれ同音声変換装置において行われるスペクトル補間について説明するための図である。
【図6】 本発明の第2実施形態に係る音声変換装置の全体構成を示すブロック図である。
【図7】 各音声変換装置の特徴情報データベース12が有する特徴情報テーブルTBLの他の構成例を示す概念図である。
【符号の説明】
11……音素認識部、
12……特徴情報データベース、
13……分析部、
14……平均ゲイン算出部、
15……変換後ピッチ算出部、
16……スペクトルシェイプ生成部(出力手段)、
17……スペクトル傾き補正部(出力手段)、
18……前フレーム情報記憶部、
19……ピッチシフトシェイプ生成部(出力手段)、
20……合成部(出力手段)、
TBL……特徴情報テーブル。

Claims (9)

  1. 入力音声を表す入力信号から入力音声と異なるピッチの音声を表す出力信号を得る音声変換装置において、
    前記入力信号に基づいて前記入力音声のピッチをフレーム毎に分析して出力し、当該入力信号の周波数分析をフレーム毎に行う分析手段と、
    前記入力信号の平均ゲインを分析する平均ゲイン分析手段と、
    記分析手段により分析されたピッチと与えられたピッチシフト量とに基づいて変換後ピッチを算出する変換後ピッチ算出手段と、
    スペクトルシェイプを生成するための特徴情報を音素に対応付けて格納した特徴情報データベースと、
    前記入力信号から音素を認識する音素認識手段と、
    前記音素認識手段により認識された音素に対応した特徴情報を前記特徴情報データベースから取得し、該特徴情報と前記変換後ピッチと前記平均ゲイン分析手段により分析された前記平均ゲインとに基づいて第1のスペクトルシェイプを生成すると共に、前記分析手段による周波数分析結果と前記ピッチシフト量とに基づいて得られるスペクトルシェイプと、前記第1のスペクトルシェイプとを所定の関数に従って補間することにより第2のスペクトルシェイプを生成し、前記第のスペクトルシェイプに応じた信号を前記出力信号として出力する出力手段と
    を具備することを特徴とする音声変換装置。
  2. 入力音声を表す入力信号から入力音声と異なるピッチの音声を表す出力信号を得る音声変換装置において、
    前記入力信号に基づいて前記入力音声のピッチをフレーム毎に分析して出力し、当該入力信号の周波数分析をフレーム毎に行う分析手段と、
    前記入力信号の平均ゲインを分析する平均ゲイン分析手段と、
    記分析手段により分析されたピッチと与えられた変換後ピッチとに基づいてピッチシフト量を算出するピッチシフト量算出手段と、
    スペクトルシェイプを生成するための特徴情報を音素に対応付けて格納した特徴情報データベースと、
    前記入力信号から音素を認識する音素認識手段と、
    前記音素認識手段により認識された音素に対応した特徴情報を前記特徴情報データベースから取得し、該特徴情報と前記ピッチシフト量算出手段により算出された前記ピッチシフト量と前記平均ゲイン分析手段により分析された前記平均ゲインとに基づいて第1のスペクトルシェイプを生成すると共に、前記分析手段による周波数分析結果と前記ピッチシフト量とに基づいて得られるスペクトルシェイプと、前記第1のスペクトルシェイプとを所定の関数に従って補間することにより第2のスペクトルシェイプを生成し、前記のスペクトルシェイプに応じた信号を前記出力信号として出力する出力手段と
    を具備することを特徴とする音声変換装置。
  3. 前記周波数分析は、前記フレーム毎の前記入力信号を正弦波成分と残差成分とに分離することにより行われ、
    前記出力手段は、前記第1のスペクトルシェイプと、前記正弦波成分と前記ピッチシフト量とに基づくスペクトルシェイプとを前記所定の関数に従って補間することにより前記第2のスペクトルシェイプを生成し、当該第2のスペクトルシェイプと前記残差成分とに応じた信号を前記出力信号として出力することを特徴とする請求項1又は2に記載の音声変換装置。
  4. 前記特徴情報データベースは複数のパラメータセットの各々について、スペクトルシェイプを生成するための特徴情報を音素に対応付けて格納し、
    前記出力手段は、指定されたパラメータセットと前記音素認識手段により認識された音素とに対応した特徴情報を前記特徴情報データベースから取得することを特徴とする請求項1または2に記載の音声変換装置。
  5. 前記出力手段は、前記特徴情報と前記変換後ピッチに基づくスペクトルシェイプの傾きを前記平均ゲインに応じて補正するスペクトル傾き補正手段を具備し、前記スペクトル傾き補正手段により補正されたスペクトルシェイプを前記第1のスペクトルシェイプとして生成し、当該第1のスペクトルシェイプに応じた信号を前記出力信号として出力することを特徴とする請求項1に記載の音声変換装置。
  6. 前記出力手段は、前記特徴情報と前記ピッチシフト量に基づくスペクトルシェイプの傾きを前記平均ゲインに応じて補正するスペクトル傾き補正手段を具備し、前記スペクトル傾き補正手段により補正されたスペクトルシェイプを前記第1のスペクトルシェイプとして生成し、当該第1のスペクトルシェイプに応じた信号を前記出力信号として出力することを特徴とする請求項2に記載の音声変換装置。
  7. 直前のスペクトルシェイプを記憶する前フレーム情報記憶手段を具備し、
    前記出力手段は、前記第1のスペクトルシェイプと前記前フレーム情報記憶手段に記憶された前記直前のスペクトルシェイプとに基づいて第のスペクトルシェイプを生成し、該第のスペクトルシェイプに応じた信号を前記出力信号として出力するとともに、該第のスペクトルシェイプを前記直前のスペクトルシェイプとして前記前フレーム情報記憶手段に記憶させることを特徴とする請求項1または2に記載の音声変換装置。
  8. 入力音声を表す入力信号から入力音声と異なるピッチの音声を表す出力信号を得る音声変換方法において、
    前記入力信号に基づいて前記入力音声のピッチをフレーム毎に分析して出力し、当該入力信号の周波数分析をフレーム毎に行う分析ステップと、
    前記入力信号の平均ゲインを分析する平均ゲイン分析ステップと、
    前記分析ステップにより分析されたピッチと与えられた変換後ピッチとに基づいてピッチシフト量を算出するピッチシフト量算出ステップと、
    前記入力信号から音素を認識する音素認識ステップと、
    スペクトルシェイプを生成するための特徴情報であって、前記音素認識ステップにより認識された音素に対応した特徴情報を取得する取得ステップと
    前記取得ステップにより取得された前記特徴情報と前記変換後ピッチと前記平均ゲイン分析ステップにより分析された前記平均ゲインとに基づいて第1のスペクトルシェイプを生成すると共に、前記分析ステップによる周波数分析結果と、前記ピッチシフト量とに基づいて得られるスペクトルシェイプと、前記第1のスペクトルシェイプとを所定の関数に従って補間することにより第2のスペクトルシェイプを生成し、前記第のスペクトルシェイプに応じた信号を前記出力信号として出力する出力ステップと
    を有することを特徴とする音声変換方法。
  9. 入力音声を表す入力信号から入力音声と異なるピッチの音声を表す出力信号を得る音声変換方法において、
    前記入力信号に基づいて前記入力音声のピッチをフレーム毎に分析して出力し、当該入力信号の周波数分析をフレーム毎に行う分析ステップと、
    前記入力信号の平均ゲインを分析する平均ゲイン分析ステップと、
    前記分析ステップにより分析されたピッチと与えられた変換後ピッチとに基づいてピッチシフト量を算出するピッチシフト量算出ステップと、
    前記入力信号から音素を認識する音素認識ステップと、
    スペクトルシェイプを生成するための特徴情報であって、前記音素認識ステップにより認識された音素に対応した特徴情報を取得する取得ステップと、
    前記取得ステップにより取得された前記特徴情報と前記ピッチシフト量算出手段により算出された前記ピッチシフト量と前記平均ゲイン分析ステップにより分析された前記平均ゲインとに基づいて第1のスペクトルシェイプを生成すると共に、前記分析ステップによる周波数分析結果と前記ピッチシフト量とに基づいて得られるスペクトルシェイプと、前記第1のスペクトルシェイプとを所定の関数に従って補間することにより第2のスペクトルシェイプを生成し、前記第2のスペクトルシェイプに応じた信号を前記出力信号として出力する出力ステップと
    を有することを特徴とする音声変換方法。
JP36527199A 1999-12-22 1999-12-22 音声変換装置及び音声変換方法 Expired - Fee Related JP4509273B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36527199A JP4509273B2 (ja) 1999-12-22 1999-12-22 音声変換装置及び音声変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36527199A JP4509273B2 (ja) 1999-12-22 1999-12-22 音声変換装置及び音声変換方法

Publications (2)

Publication Number Publication Date
JP2001184099A JP2001184099A (ja) 2001-07-06
JP4509273B2 true JP4509273B2 (ja) 2010-07-21

Family

ID=18483855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36527199A Expired - Fee Related JP4509273B2 (ja) 1999-12-22 1999-12-22 音声変換装置及び音声変換方法

Country Status (1)

Country Link
JP (1) JP4509273B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8768701B2 (en) * 2003-01-24 2014-07-01 Nuance Communications, Inc. Prosodic mimic method and apparatus
AT507091B1 (de) 2008-09-22 2010-02-15 Walter Enthammer Strömungsmaschine

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0247700A (ja) * 1988-08-10 1990-02-16 Nippon Hoso Kyokai <Nhk> 音声合成方法および装置
JPH0863197A (ja) * 1994-08-23 1996-03-08 Sony Corp 符号化音声信号の復号化方法
JPH10149199A (ja) * 1996-11-19 1998-06-02 Sony Corp 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
JPH11282483A (ja) * 1999-02-08 1999-10-15 Yamaha Corp カラオケ装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3444396B2 (ja) * 1996-09-11 2003-09-08 日本電信電話株式会社 音声合成方法、その装置及びプログラム記録媒体
JP3317181B2 (ja) * 1997-03-25 2002-08-26 ヤマハ株式会社 カラオケ装置
JPH10268895A (ja) * 1997-03-28 1998-10-09 Yamaha Corp 音声信号処理装置
JPH11175082A (ja) * 1997-12-10 1999-07-02 Toshiba Corp 音声対話装置及び音声対話用音声合成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0247700A (ja) * 1988-08-10 1990-02-16 Nippon Hoso Kyokai <Nhk> 音声合成方法および装置
JPH0863197A (ja) * 1994-08-23 1996-03-08 Sony Corp 符号化音声信号の復号化方法
JPH10149199A (ja) * 1996-11-19 1998-06-02 Sony Corp 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
JPH11282483A (ja) * 1999-02-08 1999-10-15 Yamaha Corp カラオケ装置

Also Published As

Publication number Publication date
JP2001184099A (ja) 2001-07-06

Similar Documents

Publication Publication Date Title
JP3941611B2 (ja) 歌唱合成装置、歌唱合成方法及び歌唱合成用プログラム
JP4705203B2 (ja) 声質変換装置、音高変換装置および声質変換方法
JP4153220B2 (ja) 歌唱合成装置、歌唱合成方法及び歌唱合成用プログラム
JP2001522471A (ja) 特定の声を目標とする音声変換
Bonada et al. Sample-based singing voice synthesizer by spectral concatenation
US20020184006A1 (en) Voice analyzing and synthesizing apparatus and method, and program
JPH09244694A (ja) 声質変換方法
JPH03136100A (ja) 音声処理方法及び装置
JP4509273B2 (ja) 音声変換装置及び音声変換方法
JP6737320B2 (ja) 音響処理方法、音響処理システムおよびプログラム
JP4757971B2 (ja) ハーモニー音付加装置
CN102231275A (zh) 一种基于加权混合激励的嵌入式语音合成方法
JP3540159B2 (ja) 音声変換装置及び音声変換方法
JP2007226174A (ja) 歌唱合成装置、歌唱合成方法及び歌唱合成用プログラム
JP4430174B2 (ja) 音声変換装置及び音声変換方法
JP3706249B2 (ja) 音声変換装置、音声変換方法、および音声変換プログラムを記録した記録媒体
JP3785892B2 (ja) 音声合成装置及び記録媒体
JP2000003200A (ja) 音声信号処理装置及び音声信号処理方法
JP3979213B2 (ja) 歌唱合成装置、歌唱合成方法並びに歌唱合成用プログラム
JPH07261798A (ja) 音声分析合成装置
JP3967571B2 (ja) 音源波形生成装置、音声合成装置、音源波形生成方法およびプログラム
JPH10254500A (ja) 補間音色合成方法
JP3294192B2 (ja) 音声変換装置及び音声変換方法
Molina et al. Dissonance reduction in polyphonic audio using harmonic reorganization
JP3802293B2 (ja) 楽音処理装置および楽音処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100428

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140514

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees