JPH1115488A - 合成音声評価・合成装置 - Google Patents
合成音声評価・合成装置Info
- Publication number
- JPH1115488A JPH1115488A JP9166848A JP16684897A JPH1115488A JP H1115488 A JPH1115488 A JP H1115488A JP 9166848 A JP9166848 A JP 9166848A JP 16684897 A JP16684897 A JP 16684897A JP H1115488 A JPH1115488 A JP H1115488A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- voice
- evaluation
- function
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【課題】使用環境に適合した合成音声あるいは合成音を
自動生成する。 【解決手段】使用環境における環境音を生成された合成
音声に重畳する手段と、上記環境音重畳再生音について
評価実験を行う手段から、ユーザの求める使用環境に適
合した合成音声あるいは合成音を自動生成する。
自動生成する。 【解決手段】使用環境における環境音を生成された合成
音声に重畳する手段と、上記環境音重畳再生音について
評価実験を行う手段から、ユーザの求める使用環境に適
合した合成音声あるいは合成音を自動生成する。
Description
【0001】
【発明の属する技術分野】本発明は、合成音声の生成お
よび評価を行う装置に関する。
よび評価を行う装置に関する。
【0002】
【従来の技術】近年、マルチメディア化が進み、音の利
用という場合、電話のような通信ばかりではなく、音声
や警告音で情報を伝達する機会が急増してきている。例
えば、昨今、音声合成装置は、さまざまな市場で製品化
されてきており、カーナビゲーションの音声出力用など
に用いられるようになってきている。また、視覚障害者
用などに文章読み上げ機能として製品化されている。し
かしながら、録音再生方式を用いた場合、出力される可
能性のある単語あるいは文章等をあらかじめ同一の話者
によって録音しておく必要がある。また、カーナビゲー
ションに搭載されている音声認識技術において、音声認
識を行う時間帯を設定すると、設定された時間内ではス
テレオの音量を小さくするという技術は存在するが、現
状のテキスト音声合成装置においては、出力される環境
に適合した合成音声を生成する機能はなく、ユーザが音
量やピッチ等の音声の特徴量を調整する必要があった。
用という場合、電話のような通信ばかりではなく、音声
や警告音で情報を伝達する機会が急増してきている。例
えば、昨今、音声合成装置は、さまざまな市場で製品化
されてきており、カーナビゲーションの音声出力用など
に用いられるようになってきている。また、視覚障害者
用などに文章読み上げ機能として製品化されている。し
かしながら、録音再生方式を用いた場合、出力される可
能性のある単語あるいは文章等をあらかじめ同一の話者
によって録音しておく必要がある。また、カーナビゲー
ションに搭載されている音声認識技術において、音声認
識を行う時間帯を設定すると、設定された時間内ではス
テレオの音量を小さくするという技術は存在するが、現
状のテキスト音声合成装置においては、出力される環境
に適合した合成音声を生成する機能はなく、ユーザが音
量やピッチ等の音声の特徴量を調整する必要があった。
【0003】
【発明が解決しようとする課題】前述した製品に搭載さ
れている音声合成装置を利用すれば、ある程度簡便に音
声合成を行うことができるが、現状、ユーザが必要とす
る音声を生成しようとする場合、音の高さ,音圧などを
入力し、再合成して、さらに試聴して調整するというこ
とが必要であった。従って、使用環境で騒音があったり
する場合などには、上記環境に適合するようにユーザが
微調整することが必須であったため、上記環境で利用で
きるようにするまでに時間を要した。
れている音声合成装置を利用すれば、ある程度簡便に音
声合成を行うことができるが、現状、ユーザが必要とす
る音声を生成しようとする場合、音の高さ,音圧などを
入力し、再合成して、さらに試聴して調整するというこ
とが必要であった。従って、使用環境で騒音があったり
する場合などには、上記環境に適合するようにユーザが
微調整することが必須であったため、上記環境で利用で
きるようにするまでに時間を要した。
【0004】本発明では、ユーザがすべての合成変数を
調整するといった必要がなく、合成音声を使用する場所
の環境音等を入力することで、使用環境に適合した合成
音声を自動生成する機能を提供することを目的としてい
る。また、本発明では、合成音声の生成だけでなく、環
境音や画像等に対しても利用が可能である。
調整するといった必要がなく、合成音声を使用する場所
の環境音等を入力することで、使用環境に適合した合成
音声を自動生成する機能を提供することを目的としてい
る。また、本発明では、合成音声の生成だけでなく、環
境音や画像等に対しても利用が可能である。
【0005】
【課題を解決するための手段】上記目的を達成するため
の本発明の一態様によれば、少なくとも音声等を出力す
る音響出力手段,文字列や画像及び図形等を表示する情
報表示手段,データ等を蓄積するデータ蓄積手段等を持
つ情報処理装置において、評価すべき音声に上記合成音
声を利用する環境にて生じる環境音等を重畳させた再生
音を作成し、ユーザが上記音響出力手段により出力され
た上記再生音を聴取し、聴取した上記再生音を評価する
ことを可能にした聴取評価機能と、上記評価結果を用い
てデータを集計し、統計処理を行い、さらに上記処理結
果を画面表示する機能と、上記処理結果を用いて発声速
度,発声音圧,発声基本周波数等を変更し、上記変更さ
れた変数によって再合成された音声等を出力する機能が
提供される。
の本発明の一態様によれば、少なくとも音声等を出力す
る音響出力手段,文字列や画像及び図形等を表示する情
報表示手段,データ等を蓄積するデータ蓄積手段等を持
つ情報処理装置において、評価すべき音声に上記合成音
声を利用する環境にて生じる環境音等を重畳させた再生
音を作成し、ユーザが上記音響出力手段により出力され
た上記再生音を聴取し、聴取した上記再生音を評価する
ことを可能にした聴取評価機能と、上記評価結果を用い
てデータを集計し、統計処理を行い、さらに上記処理結
果を画面表示する機能と、上記処理結果を用いて発声速
度,発声音圧,発声基本周波数等を変更し、上記変更さ
れた変数によって再合成された音声等を出力する機能が
提供される。
【0006】また、合成音声等の時間長に応じて環境音
を上記音声に重畳する機能が提供される。また、ユーザ
が重畳すべき環境音の音圧等を複数段階変更し、音声等
に重畳する機能が提供される。また、評価項目名をキー
ボード等を用いて入力し、ユーザの評価項目を簡便に登
録する機能が提供される。
を上記音声に重畳する機能が提供される。また、ユーザ
が重畳すべき環境音の音圧等を複数段階変更し、音声等
に重畳する機能が提供される。また、評価項目名をキー
ボード等を用いて入力し、ユーザの評価項目を簡便に登
録する機能が提供される。
【0007】また、前記データ蓄積手段によって蓄積さ
れた評価結果値等を、評価項目別あるいは評価者別に編
集する機能が提供される。また、前記評価結果値を統計
解析し、上記解析結果から、例えば発声速度等のパラメ
ータを評価値の最適値に変更し、上記最適値を用いて合
成音声を再合成し、出力する機能が提供される。
れた評価結果値等を、評価項目別あるいは評価者別に編
集する機能が提供される。また、前記評価結果値を統計
解析し、上記解析結果から、例えば発声速度等のパラメ
ータを評価値の最適値に変更し、上記最適値を用いて合
成音声を再合成し、出力する機能が提供される。
【0008】また、音声波形表示及び文字列表示を発声
時間長に合わせて行い、さらに上記表示の時間軸に合わ
せて現状のピッチを0として直線を表示し、ユーザがマ
ウス等で音声波形表示位置上あるいは文字列表示位置上
で、ピッチの変更個所を指定し、さらに上記直線をピッ
クして直線の形状を変化させることによって上記指定個
所のピッチを変更する機能が提供される。
時間長に合わせて行い、さらに上記表示の時間軸に合わ
せて現状のピッチを0として直線を表示し、ユーザがマ
ウス等で音声波形表示位置上あるいは文字列表示位置上
で、ピッチの変更個所を指定し、さらに上記直線をピッ
クして直線の形状を変化させることによって上記指定個
所のピッチを変更する機能が提供される。
【0009】また、変更された値と元の値との差分を数
値表示あるいは図形表示する機能が提供される。また、
音声波形表示及び文字列表示を発声時間長に合わせて行
い、さらに上記表示の時間軸に合わせて現状のピッチ幅
を例えば3cmとして表示し、ユーザがマウス等で音声波
形表示位置上あるいは文字列表示位置上でピッチ幅の変
更個所を指定し、さらに上記ピッチ幅を変更することに
よって上記指定個所のピッチ幅を変更する機能が提供さ
れる。
値表示あるいは図形表示する機能が提供される。また、
音声波形表示及び文字列表示を発声時間長に合わせて行
い、さらに上記表示の時間軸に合わせて現状のピッチ幅
を例えば3cmとして表示し、ユーザがマウス等で音声波
形表示位置上あるいは文字列表示位置上でピッチ幅の変
更個所を指定し、さらに上記ピッチ幅を変更することに
よって上記指定個所のピッチ幅を変更する機能が提供さ
れる。
【0010】また、音声波形表示及び文字列表示を発声
時間長に合わせて行い、ユーザがマウス等で音声波形表
示位置上あるいは文字列表示位置上で変更個所を指定
し、さらに、例えば変更個所に下部に表示されている文
字列入力ボックスに、「ささやき声」などの音声表現語
を入力することにより、上記指定個所の声質を変更する
機能が提供される。また、例えば、自動車内等に設置
し、車内の環境音を前記音声及び音響入力手段により入
力し、入力された音情報を分析して、上記環境音下でも
明瞭に聴取できる音声を再生する機能が提供される。
時間長に合わせて行い、ユーザがマウス等で音声波形表
示位置上あるいは文字列表示位置上で変更個所を指定
し、さらに、例えば変更個所に下部に表示されている文
字列入力ボックスに、「ささやき声」などの音声表現語
を入力することにより、上記指定個所の声質を変更する
機能が提供される。また、例えば、自動車内等に設置
し、車内の環境音を前記音声及び音響入力手段により入
力し、入力された音情報を分析して、上記環境音下でも
明瞭に聴取できる音声を再生する機能が提供される。
【0011】そして、評価すべき音声に環境音等を重畳
させた再生音を作成し、ユーザが、上記音響出力手段に
より出力された上記再生音を聴取し、聴取した上記再生
音を評価することを可能にした聴取評価機能と、上記評
価結果を用いてデータを集計し、統計処理を行い、さら
に上記処理結果を画面表示する機能と、上記処理結果を
用いて発声速度,発声音圧,発声基本周波数等を変更
し、上記変更された変数によって再合成された音声等を
出力する機能が提供される。
させた再生音を作成し、ユーザが、上記音響出力手段に
より出力された上記再生音を聴取し、聴取した上記再生
音を評価することを可能にした聴取評価機能と、上記評
価結果を用いてデータを集計し、統計処理を行い、さら
に上記処理結果を画面表示する機能と、上記処理結果を
用いて発声速度,発声音圧,発声基本周波数等を変更
し、上記変更された変数によって再合成された音声等を
出力する機能が提供される。
【0012】
【発明の実施の形態】以下、本発明の一実施形態につい
て図面を参照しながら説明する。本システムは、合成音
声を取り扱うシステムであり、ユーザが用いる環境に適
合した合成音声を生成するシステムである。
て図面を参照しながら説明する。本システムは、合成音
声を取り扱うシステムであり、ユーザが用いる環境に適
合した合成音声を生成するシステムである。
【0013】図9及び図10において、本発明における
システムの動作フローを示している。
システムの動作フローを示している。
【0014】本システムは、図1に示すように、後述す
る各種プログラムを記憶する記憶ディスク100と、前
記各種プログラムを読み出して実行するための情報処理
装置1及び主記憶装置2と、編集に当たってユーザが取
得あるいは入力する情報を表示するためのディスプレイ
3及び表示制御装置4と、ユーザが情報を入力するため
のキーボード5及びマウス6と、生成された楽曲等を音
響で伝える音響出力制御装置7及びスピーカ8、及び環
境音を入力するマイクロフォン9を有する。
る各種プログラムを記憶する記憶ディスク100と、前
記各種プログラムを読み出して実行するための情報処理
装置1及び主記憶装置2と、編集に当たってユーザが取
得あるいは入力する情報を表示するためのディスプレイ
3及び表示制御装置4と、ユーザが情報を入力するため
のキーボード5及びマウス6と、生成された楽曲等を音
響で伝える音響出力制御装置7及びスピーカ8、及び環
境音を入力するマイクロフォン9を有する。
【0015】ディスク100には、システムプログラム
1001,音響出力プログラム1002,画像表示プログラ
ム1003,合成音声制御プログラム1004,音声評
価プログラム1005,統計処理プログラム1006,
評価用再生音生成プログラム1007,合成音声編集プ
ログラム1008,音響入力プログラム1009,入力
音響分析プログラム1010が格納されている。これら
のプログラムやデータは、システムの立ち上げ時に、あ
るいは、必要に応じて主記憶装置2等にロードされ、以
下の機能を実現すべく情報処理装置1等のCPUで実行
される。
1001,音響出力プログラム1002,画像表示プログラ
ム1003,合成音声制御プログラム1004,音声評
価プログラム1005,統計処理プログラム1006,
評価用再生音生成プログラム1007,合成音声編集プ
ログラム1008,音響入力プログラム1009,入力
音響分析プログラム1010が格納されている。これら
のプログラムやデータは、システムの立ち上げ時に、あ
るいは、必要に応じて主記憶装置2等にロードされ、以
下の機能を実現すべく情報処理装置1等のCPUで実行
される。
【0016】システムプログラム1001は、システム
を構成するハードウエアと、この上で稼働する前述した
各種プログラムとの間に介在して動作する、いわゆるオ
ペレーティングシステムとして機能する。音響出力プロ
グラム1002は、生成された合成音声や環境音等を出
力するプログラムである。画像表示プログラム1003は、
ユーザの入力用画面表示や評価結果表示,音声編集画面
表示を行うプログラムである。合成音声制御プログラム
1004は、生成した合成音声の速度,ピッチ,音圧等
を変更するプログラムである。
を構成するハードウエアと、この上で稼働する前述した
各種プログラムとの間に介在して動作する、いわゆるオ
ペレーティングシステムとして機能する。音響出力プロ
グラム1002は、生成された合成音声や環境音等を出
力するプログラムである。画像表示プログラム1003は、
ユーザの入力用画面表示や評価結果表示,音声編集画面
表示を行うプログラムである。合成音声制御プログラム
1004は、生成した合成音声の速度,ピッチ,音圧等
を変更するプログラムである。
【0017】音声評価プログラム1005は、ユーザ
(被験者)が、提示された評価用合成音声を評価する
際、評価を対話的に行うプログラムである。統計処理プ
ログラム1006は、評価結果の平均値等を、被験者ご
とに或いは各種合成音声ごとに算出するプログラムであ
る。評価用再生音生成プログラム1007は、生成され
た合成音声と環境音の特徴量(パラメータ)、例えば音
圧やピッチ幅(周波数帯域)等を比較し、比較結果から候
補として挙げられた特徴量に元の合成音声の特徴量を変
換した合成音声を生成し、生成された上記音声に環境音
を重畳するプログラムである。
(被験者)が、提示された評価用合成音声を評価する
際、評価を対話的に行うプログラムである。統計処理プ
ログラム1006は、評価結果の平均値等を、被験者ご
とに或いは各種合成音声ごとに算出するプログラムであ
る。評価用再生音生成プログラム1007は、生成され
た合成音声と環境音の特徴量(パラメータ)、例えば音
圧やピッチ幅(周波数帯域)等を比較し、比較結果から候
補として挙げられた特徴量に元の合成音声の特徴量を変
換した合成音声を生成し、生成された上記音声に環境音
を重畳するプログラムである。
【0018】合成音声編集プログラム1008は、ユー
ザが直接、音声の出力速度,ピッチ,周波数帯域(ピッ
チ幅)等を変更するためのエディタを提供するプログラ
ムである。音響入力プログラム1009は、或る環境に
おける環境音を収集し、A/D変換によりデジタル信号
に変換するプログラムである。音響分析プログラム10
10は、入力された環境音等の特徴量を抽出するプログ
ラムである。
ザが直接、音声の出力速度,ピッチ,周波数帯域(ピッ
チ幅)等を変更するためのエディタを提供するプログラ
ムである。音響入力プログラム1009は、或る環境に
おける環境音を収集し、A/D変換によりデジタル信号
に変換するプログラムである。音響分析プログラム10
10は、入力された環境音等の特徴量を抽出するプログ
ラムである。
【0019】以上の構成を有する合成音声評価及び合成
装置では、ユーザは、提示された再生音を設定された評
価項目に準拠して評価する。上記評価結果が上記装置に
入力された後、上記評価結果として最適値を得た合成音
声を生成,出力する。
装置では、ユーザは、提示された再生音を設定された評
価項目に準拠して評価する。上記評価結果が上記装置に
入力された後、上記評価結果として最適値を得た合成音
声を生成,出力する。
【0020】以下、本システムの動作の詳細を具体的に
説明する。最初に、評価用データを作成する。図2に評
価用データ作成画面の一例を示す。本画面においては、
評価すべき合成音声と環境音を選択し、さらに環境音の
音圧(ボリューム)を選択する(s100)。音圧は、
音量調節スケール203で変更が可能であるが、変更し
なければ環境音録音時のデフォルト値となる。
説明する。最初に、評価用データを作成する。図2に評
価用データ作成画面の一例を示す。本画面においては、
評価すべき合成音声と環境音を選択し、さらに環境音の
音圧(ボリューム)を選択する(s100)。音圧は、
音量調節スケール203で変更が可能であるが、変更し
なければ環境音録音時のデフォルト値となる。
【0021】評価用合成音声ボタン201を押すと、上
記ボタンの下で選択した音声ファイルの音が音響出力プ
ログラム1002を通じてスピーカ8より出力される。
同様に、環境音ボタン202を押すと、上記ボタンの下
で選択した環境音ファイルの音がスピーカ8より出力さ
れる。合成音声及び環境音を選択した後、確定ボタン2
04を押すと、選択された上記合成音声のファイル名、
ここではSpeech1が選択合成音声名格納メモリSFに格
納され、さらに選択された環境音名、ここではCir1 が
選択環境音名格納メモリCFに格納され、音量値である
音圧値が、環境音音圧メモリSVに格納される。
記ボタンの下で選択した音声ファイルの音が音響出力プ
ログラム1002を通じてスピーカ8より出力される。
同様に、環境音ボタン202を押すと、上記ボタンの下
で選択した環境音ファイルの音がスピーカ8より出力さ
れる。合成音声及び環境音を選択した後、確定ボタン2
04を押すと、選択された上記合成音声のファイル名、
ここではSpeech1が選択合成音声名格納メモリSFに格
納され、さらに選択された環境音名、ここではCir1 が
選択環境音名格納メモリCFに格納され、音量値である
音圧値が、環境音音圧メモリSVに格納される。
【0022】その後、画面は図3に切り替わる。本画面
は、評価項目を選択する画面である(s101)。評価
項目選択ボックス301から、マウス6で、例えば評価
項目「明瞭度」を選択し、確定ボタン302を押すと、
選択した上記評価項目名が、選択評価項目名格納メモリ
EVに格納される。また、EVは配列になっており、複
数の評価項目を選択することが可能である。さらに、評
価用再生音生成プログラム1007及び音響分析プログ
ラム1010,合成音声制御プログラム1004が起動され
る。音響分析プログラム1010により、SF,CFに
格納されているファイル名の合成音声及び環境音の波形
から、例えば、合成音声では、平均ピッチ(周波数),
平均ピッチ幅,平均速度,平均音圧を抽出し、図4に示
すような合成音声特徴量記憶テーブルに記憶する(s1
02)。
は、評価項目を選択する画面である(s101)。評価
項目選択ボックス301から、マウス6で、例えば評価
項目「明瞭度」を選択し、確定ボタン302を押すと、
選択した上記評価項目名が、選択評価項目名格納メモリ
EVに格納される。また、EVは配列になっており、複
数の評価項目を選択することが可能である。さらに、評
価用再生音生成プログラム1007及び音響分析プログ
ラム1010,合成音声制御プログラム1004が起動され
る。音響分析プログラム1010により、SF,CFに
格納されているファイル名の合成音声及び環境音の波形
から、例えば、合成音声では、平均ピッチ(周波数),
平均ピッチ幅,平均速度,平均音圧を抽出し、図4に示
すような合成音声特徴量記憶テーブルに記憶する(s1
02)。
【0023】また、環境音では、平均ピッチ,平均ピッ
チ幅,平均音圧等を抽出し、図5に示すような環境音認
識結果記憶テーブルに記憶する(s103)。
チ幅,平均音圧等を抽出し、図5に示すような環境音認
識結果記憶テーブルに記憶する(s103)。
【0024】次に上記2種のテーブルの各項目を比較す
る。例えば、平均ピッチ及び平均ピッチ幅を比較する
(s104)。その結果、上記環境音における平均ピッ
チと上記合成音声の平均ピッチの差異が小さく、上記合
成音声の平均ピッチが上記環境音における平均ピッチを
中心とした平均ピッチ幅内に含まれる場合には、上記平
均ピッチ幅内に含まれない平均ピッチ値を複数個設定す
る。ここでは、2種の平均ピッチ値を設定することにす
る。また、音圧を比較し、上記合成音声の平均音圧が、
上記環境音の平均音圧よりも低い場合には、評価用とし
て生成する複数の合成音声における音圧は、環境音の平
均音圧より高く設定する。ここでは、3種の平均音圧を
設定することにする。また、発声速度も複数個設定す
る。ここでは、デフォルト値も含め、2種の速度を設定
する。
る。例えば、平均ピッチ及び平均ピッチ幅を比較する
(s104)。その結果、上記環境音における平均ピッ
チと上記合成音声の平均ピッチの差異が小さく、上記合
成音声の平均ピッチが上記環境音における平均ピッチを
中心とした平均ピッチ幅内に含まれる場合には、上記平
均ピッチ幅内に含まれない平均ピッチ値を複数個設定す
る。ここでは、2種の平均ピッチ値を設定することにす
る。また、音圧を比較し、上記合成音声の平均音圧が、
上記環境音の平均音圧よりも低い場合には、評価用とし
て生成する複数の合成音声における音圧は、環境音の平
均音圧より高く設定する。ここでは、3種の平均音圧を
設定することにする。また、発声速度も複数個設定す
る。ここでは、デフォルト値も含め、2種の速度を設定
する。
【0025】次に、上記合成音声における平均ピッチ
値,平均音圧,平均速度を、前記設定種:平均ピッチ値
3種×平均音圧値2種×平均速度値2種=12種の組み
合わせとして交換する。例えば、音声ファイルSpeech
1.wavの平均ピッチを36.2 から44.5に変更し、
平均速度を16.5mora/sに変更した値で、前記合成
音声制御プログラムにより、音声を再合成し、例えば、
Speech1_1というファイルに上記再合成音声の波形を
格納する。
値,平均音圧,平均速度を、前記設定種:平均ピッチ値
3種×平均音圧値2種×平均速度値2種=12種の組み
合わせとして交換する。例えば、音声ファイルSpeech
1.wavの平均ピッチを36.2 から44.5に変更し、
平均速度を16.5mora/sに変更した値で、前記合成
音声制御プログラムにより、音声を再合成し、例えば、
Speech1_1というファイルに上記再合成音声の波形を
格納する。
【0026】このような方法で評価用合成音声を生成す
る。ここでは、Speech1_1, Speech1_2,Speech
1_3,Speech1_4,Speech1_5,Speech1_6, Sp
eech1_7,Speech1_8,Speech1_9,Speech1_1
0,Speech1_11,Speech1_12が生成されたとす
る。上記生成ファイル名を評価用音声ファイル名格納フ
ァイルに書き込む。画面は、図3から図6の評価画面に
切り替わる(s105)。
る。ここでは、Speech1_1, Speech1_2,Speech
1_3,Speech1_4,Speech1_5,Speech1_6, Sp
eech1_7,Speech1_8,Speech1_9,Speech1_1
0,Speech1_11,Speech1_12が生成されたとす
る。上記生成ファイル名を評価用音声ファイル名格納フ
ァイルに書き込む。画面は、図3から図6の評価画面に
切り替わる(s105)。
【0027】次に、上記評価用合成音声に、前記環境音
を重畳させる(s106)。前記環境音圧SVを環境音
認識結果記憶テーブルの平均値に書き込み、各フレーム
における音圧は、環境音選択時の音圧とSVの差分値を
プラスする。さらに、前記合成音声の時間長分の環境音
を波形上で足しあわせることによって、前記合成音声に
環境音を重畳し、生成された再生音ファイルをSpeech1
_1_n,Speech1_2_nといった名称とし、上記再
生音ファイルを評価用再生音とする。
を重畳させる(s106)。前記環境音圧SVを環境音
認識結果記憶テーブルの平均値に書き込み、各フレーム
における音圧は、環境音選択時の音圧とSVの差分値を
プラスする。さらに、前記合成音声の時間長分の環境音
を波形上で足しあわせることによって、前記合成音声に
環境音を重畳し、生成された再生音ファイルをSpeech1
_1_n,Speech1_2_nといった名称とし、上記再
生音ファイルを評価用再生音とする。
【0028】次に、音声評価プログラム1005が起動
され、上記プログラムによって再生音評価画面が表示さ
れる。ユーザ(被験者)は、図6の再生音評価画面にお
いて、出力される評価用再生音を評価する(s10
7)。図6では、選択評価項目名格納メモリEVに格納
されている評価項目名、ここでは「明瞭度」が評価用ス
ケールの上に表示される。ユーザは、音声出力ボタン6
01を押すことによって評価用音声を聴取することがで
きる。評価結果は、表示されているスケールで、例えば
5段階評価を行う。入力された評価値は、評価順に評価
値格納ファイルに書き込まれる。「次へ」ボタンを押す
と、次の評価用音声が準備され、「音声出力」ボタンを押
すと、上記音声が出力される。全ての評価が終了する
と、次に、統計処理プログラムが起動され、評価値が最
も高い評価用音声を、ユーザ数(被験者数)による平均
値として抽出し(s108)、評価最高音声名格納メモ
リHestに格納される(s109)。
され、上記プログラムによって再生音評価画面が表示さ
れる。ユーザ(被験者)は、図6の再生音評価画面にお
いて、出力される評価用再生音を評価する(s10
7)。図6では、選択評価項目名格納メモリEVに格納
されている評価項目名、ここでは「明瞭度」が評価用ス
ケールの上に表示される。ユーザは、音声出力ボタン6
01を押すことによって評価用音声を聴取することがで
きる。評価結果は、表示されているスケールで、例えば
5段階評価を行う。入力された評価値は、評価順に評価
値格納ファイルに書き込まれる。「次へ」ボタンを押す
と、次の評価用音声が準備され、「音声出力」ボタンを押
すと、上記音声が出力される。全ての評価が終了する
と、次に、統計処理プログラムが起動され、評価値が最
も高い評価用音声を、ユーザ数(被験者数)による平均
値として抽出し(s108)、評価最高音声名格納メモ
リHestに格納される(s109)。
【0029】上記音声は、合成音声編集プログラム10
08によって、図7のような編集画面上に、音声波形7
02,発声文字列703の形で表示され、再合成音声出
力ボタン701を押すことによって出力される(s11
0)。また、ピッチ編集用としてピッチライン704,
速度編集として、速度入力ボックス705が表示され
る。ピッチラインは、マウス等でまず、編集個所の始点
から終点を発声文字列表示画面で指定し、さらに上記ラ
インを上記文字列に合わせて上下させ、再合成音声出力
ボタン701を押すことによって、指定された個所のピ
ッチ値を用いて前記音声が再合成され、再合成音声が出
力される。速度入力ボックスにおいては、マウスで編集
個所の始点から終点を発声文字列表示画面で指定し、上
記ボックス内に表示されている速度ラインの上下の高さ
をマウスで調整することにより、指定個所の速度を上下
させることができる。また、ピッチ幅入力スケール70
7のスケール幅を変動させることにより、全体のピッチ
幅を変更することが可能である。
08によって、図7のような編集画面上に、音声波形7
02,発声文字列703の形で表示され、再合成音声出
力ボタン701を押すことによって出力される(s11
0)。また、ピッチ編集用としてピッチライン704,
速度編集として、速度入力ボックス705が表示され
る。ピッチラインは、マウス等でまず、編集個所の始点
から終点を発声文字列表示画面で指定し、さらに上記ラ
インを上記文字列に合わせて上下させ、再合成音声出力
ボタン701を押すことによって、指定された個所のピ
ッチ値を用いて前記音声が再合成され、再合成音声が出
力される。速度入力ボックスにおいては、マウスで編集
個所の始点から終点を発声文字列表示画面で指定し、上
記ボックス内に表示されている速度ラインの上下の高さ
をマウスで調整することにより、指定個所の速度を上下
させることができる。また、ピッチ幅入力スケール70
7のスケール幅を変動させることにより、全体のピッチ
幅を変更することが可能である。
【0030】また、平均ピッチ入力表示ボックス70
8,平均速度入力表示ボックス709に、現在表示され
ている音声の平均ピッチ,平均速度が表示されている
が、上記ボックス内の数値を変え、さらに再合成音声出
力ボタンを押すことによって、上記数値に書き換えられ
た値による音声が再合成され、出力される(s11
1)。また、マウスで編集個所の始点から終点を発声文
字列表示画面で指定し、表現語選択ボタン710を押す
ことにより表示される表現語メニューから「ささやき
声」,「怒った声」などの表現語を選択し、再合成音声
出力ボタン701を押すことにより、指定個所の音声が
表現語として選択された音声に再合成され出力される。
また、詳細設定ボタン706を押すことにより、画面は
図8の画面に切り替わる。
8,平均速度入力表示ボックス709に、現在表示され
ている音声の平均ピッチ,平均速度が表示されている
が、上記ボックス内の数値を変え、さらに再合成音声出
力ボタンを押すことによって、上記数値に書き換えられ
た値による音声が再合成され、出力される(s11
1)。また、マウスで編集個所の始点から終点を発声文
字列表示画面で指定し、表現語選択ボタン710を押す
ことにより表示される表現語メニューから「ささやき
声」,「怒った声」などの表現語を選択し、再合成音声
出力ボタン701を押すことにより、指定個所の音声が
表現語として選択された音声に再合成され出力される。
また、詳細設定ボタン706を押すことにより、画面は
図8の画面に切り替わる。
【0031】図8の表示画面では、編集中の合成音声と
最適音声として抽出されたHest中に登録されている音声
が表示される。再合成音声出力ボタンを押すと、編集中
の音声が出力される。最適音声出力ボタンを押すと、He
stに登録されている音声が出力される。さらに、波形表
示ボックスには、編集中の合成音声の波形が表示され、
さらにWav ファイル名表示ボックス805には、編集中
の合成音声の名称が表示される。また、文字列表示ボッ
クス807には、編集中の合成音声の文字列が、発声速
度に合わせて表示されている。つまり、横軸長が、発声
長に対応している。また、809には平均ピッチ幅が表
示されている。
最適音声として抽出されたHest中に登録されている音声
が表示される。再合成音声出力ボタンを押すと、編集中
の音声が出力される。最適音声出力ボタンを押すと、He
stに登録されている音声が出力される。さらに、波形表
示ボックスには、編集中の合成音声の波形が表示され、
さらにWav ファイル名表示ボックス805には、編集中
の合成音声の名称が表示される。また、文字列表示ボッ
クス807には、編集中の合成音声の文字列が、発声速
度に合わせて表示されている。つまり、横軸長が、発声
長に対応している。また、809には平均ピッチ幅が表
示されている。
【0032】また、文字列表示ボックス808には、図
7で編集する以前のHest中に登録されている音声が表示
され、本表示も、編集中の合成音声の文字列が、発声速
度に合わせて表示されている。Wav ファイル名806に
は、Hest中に登録されている音声名称が表示される。さ
らに、平均ピッチ差分値表示ボックス810には、2種
の表示音声の平均ピッチ差分値が表示され、平均速度差
分値表示ボックス813には、2種の表示音声の平均速度
差分値が表示される。ピッチ入力表示ボックス812に
表示されている平均ピッチ値を変動させると、前記ボッ
クス810の値が連動し、速度入力表示ボックス815
に表示されている平均速度値を変動させると、前記ボッ
クス813の値が連動する。設定が終了したら、再合成
音声出力ボタン801を押すと、設定内容に書き換えら
れたパラメータによって、音声が再合成され、出力され
る。
7で編集する以前のHest中に登録されている音声が表示
され、本表示も、編集中の合成音声の文字列が、発声速
度に合わせて表示されている。Wav ファイル名806に
は、Hest中に登録されている音声名称が表示される。さ
らに、平均ピッチ差分値表示ボックス810には、2種
の表示音声の平均ピッチ差分値が表示され、平均速度差
分値表示ボックス813には、2種の表示音声の平均速度
差分値が表示される。ピッチ入力表示ボックス812に
表示されている平均ピッチ値を変動させると、前記ボッ
クス810の値が連動し、速度入力表示ボックス815
に表示されている平均速度値を変動させると、前記ボッ
クス813の値が連動する。設定が終了したら、再合成
音声出力ボタン801を押すと、設定内容に書き換えら
れたパラメータによって、音声が再合成され、出力され
る。
【0033】さらに、波形表示画面804の表示内容も
設定内容に書き換えられたパラメータによって書き換え
られる。また、任意音声出力ボタンを押すことによっ
て、複数の音声ファイルが、例えばメニュー形式で表示
され、上記メニューからユーザがマウスで音声ファイル
を選択すると、選択された音声が出力され、Wav ファイ
ル名806には、上記音声の名称が表示され、文字列表
示ボックス808には、上記音声が表示される。
設定内容に書き換えられたパラメータによって書き換え
られる。また、任意音声出力ボタンを押すことによっ
て、複数の音声ファイルが、例えばメニュー形式で表示
され、上記メニューからユーザがマウスで音声ファイル
を選択すると、選択された音声が出力され、Wav ファイ
ル名806には、上記音声の名称が表示され、文字列表
示ボックス808には、上記音声が表示される。
【0034】また、評価結果がすでに存在する場合に
は、図9におけるフローのS107から操作が始まる。
さらに、実環境に適合させる場合、例えば、自動車内
に、上記装置を設置して、上記自動車内の環境音に適合
した合成音声を即出力させる場合には、音響入力プログ
ラム1009によってマイクロフォン9から環境音を入
力及びA/D変換し(s201)、上記変換されたデジ
タル波形を、前記音響分析プログラムにより、平均ピッ
チ,平均ピッチ幅,平均音圧等を抽出し、図5に示すよ
うな環境音認識結果記憶テーブルに記憶する。
は、図9におけるフローのS107から操作が始まる。
さらに、実環境に適合させる場合、例えば、自動車内
に、上記装置を設置して、上記自動車内の環境音に適合
した合成音声を即出力させる場合には、音響入力プログ
ラム1009によってマイクロフォン9から環境音を入
力及びA/D変換し(s201)、上記変換されたデジ
タル波形を、前記音響分析プログラムにより、平均ピッ
チ,平均ピッチ幅,平均音圧等を抽出し、図5に示すよ
うな環境音認識結果記憶テーブルに記憶する。
【0035】さらに、登録されている複数の合成音声生
成用パラメータセットにおける平均ピッチ及び平均ピッ
チ幅と、上記環境音における抽出された平均ピッチ及び
平均ピッチ幅とを比較する。その結果として、上記環境
音における平均ピッチと上記合成音声の平均ピッチの差
異が最も大きく、上記合成音声の平均ピッチが上記環境
音における平均ピッチを中心とした平均ピッチ幅内に含
まれないパラメータセットを選択し、上記パラメータセ
ットを最適パラメータセットとして、最適パラメータセ
ット名称格納メモリSPに登録する。
成用パラメータセットにおける平均ピッチ及び平均ピッ
チ幅と、上記環境音における抽出された平均ピッチ及び
平均ピッチ幅とを比較する。その結果として、上記環境
音における平均ピッチと上記合成音声の平均ピッチの差
異が最も大きく、上記合成音声の平均ピッチが上記環境
音における平均ピッチを中心とした平均ピッチ幅内に含
まれないパラメータセットを選択し、上記パラメータセ
ットを最適パラメータセットとして、最適パラメータセ
ット名称格納メモリSPに登録する。
【0036】ただし、前述した登録されている複数の合
成音声生成用パラメータセットにおいて、上記合成音声
の平均ピッチが上記環境音における平均ピッチを中心と
した平均ピッチ幅内に含まれる場合には、上記平均ピッ
チ幅内に含まれない平均ピッチ値を複数設定し、上記平
均ピッチ値を前述した合成音声生成用パラメータセット
の平均ピッチ値とし、再合成した音声を出力する。この
場合、複数の平均ピッチを設定しているため、選択ボタ
ン等を表示画面に設定し、ユーザが選択可能にしてお
く。
成音声生成用パラメータセットにおいて、上記合成音声
の平均ピッチが上記環境音における平均ピッチを中心と
した平均ピッチ幅内に含まれる場合には、上記平均ピッ
チ幅内に含まれない平均ピッチ値を複数設定し、上記平
均ピッチ値を前述した合成音声生成用パラメータセット
の平均ピッチ値とし、再合成した音声を出力する。この
場合、複数の平均ピッチを設定しているため、選択ボタ
ン等を表示画面に設定し、ユーザが選択可能にしてお
く。
【0037】
【発明の効果】このように本発明によれば、使用する場
所や状況における環境音を入力することで、ユーザが合
成音声生成変数を個別に調整することがなくとも、ユー
ザが希望する使用環境に適合した合成音声あるいは合成
音を生成することが可能になる。
所や状況における環境音を入力することで、ユーザが合
成音声生成変数を個別に調整することがなくとも、ユー
ザが希望する使用環境に適合した合成音声あるいは合成
音を生成することが可能になる。
【図1】本発明の一実施形態のシステム構成を示すブロ
ック図。
ック図。
【図2】図1に示したシステムの画面表示の一例を示し
た説明図。
た説明図。
【図3】図1に示したシステムの画面表示の一例を示し
た説明図。
た説明図。
【図4】選択された評価用合成音声の特徴量を登録した
テーブル構造の一例を示した説明図。
テーブル構造の一例を示した説明図。
【図5】環境音認識結果を登録したテーブル構造の一例
を示した説明図。
を示した説明図。
【図6】図1に示したシステムの画面表示の一例を示し
た説明図。
た説明図。
【図7】図1に示したシステムの画面表示の一例を示し
た説明図。
た説明図。
【図8】図1に示したシステムの画面表示の一例を示し
た説明図。
た説明図。
【図9】図1に示したプログラムの動作の一部を示した
フローチャート。
フローチャート。
【図10】図1に示したプログラムの動作の一部を示し
たフローチャート。
たフローチャート。
1…情報処理装置、2…主記憶装置、3…ディスプレ
イ、4…表示制御装置、5…キーボード、6…マウス、
7…音響出力制御装置、8…スピーカ、9…マイクロフ
ォン、100…ディスク、1001…システムプログラ
ム、1002…音響出力プログラム、1003…画像表
示プログラム、1004…合成音声制御プログラム、1
005…音声評価プログラム、1006…統計処理プロ
グラム、1007…評価用再生音生成プログラム、10
08…合成音声編集プログラム、1009…音響入力プ
ログラム、1010…音響分析プログラム。
イ、4…表示制御装置、5…キーボード、6…マウス、
7…音響出力制御装置、8…スピーカ、9…マイクロフ
ォン、100…ディスク、1001…システムプログラ
ム、1002…音響出力プログラム、1003…画像表
示プログラム、1004…合成音声制御プログラム、1
005…音声評価プログラム、1006…統計処理プロ
グラム、1007…評価用再生音生成プログラム、10
08…合成音声編集プログラム、1009…音響入力プ
ログラム、1010…音響分析プログラム。
Claims (12)
- 【請求項1】少なくとも音声等を出力する音響出力手
段,文字列や画像及び図形等を表示する情報表示手段,
データ等を蓄積するデータ蓄積手段等を持つ情報処理装
置において、評価すべき音声に上記合成音声を利用する
環境にて生じる環境音等を重畳させた再生音を作成し、
ユーザが上記音響出力手段により出力された上記再生音
を聴取し、聴取した上記再生音を評価することを可能に
した聴取評価機能と、上記評価結果を集計し、さらに上
記評価結果を画面表示する機能と、上記評価結果を用い
て発声速度,発声音圧,発声基本周波数等を変更し、上
記変更された変数によって再合成された音声等を出力す
る機能を有する音声評価・合成装置。 - 【請求項2】請求項1に記載されている装置において、
合成音声等の時間長に対して環境音を上記音声に重畳す
る機能を有する音声評価・合成装置。 - 【請求項3】請求項1に記載されている装置において、
ユーザが重畳すべき環境音の音圧等を複数段階変更し、
音声等に重畳する機能を有する合成音声評価・合成装
置。 - 【請求項4】請求項1に記載されている装置において、
評価項目名をキーボード等を用いて入力し、ユーザの評
価項目を簡便に登録する機能を有する音声評価・合成装
置。 - 【請求項5】請求項1に記載されている装置において、
前記データ蓄積手段によって蓄積された評価結果値等
を、評価項目別あるいは評価者別に編集する機能を有す
る音声評価・合成装置。 - 【請求項6】請求項1に記載されている装置において、
前記評価結果値を統計解析し、上記解析結果から、発声
速度等のパラメータを評価値の最適値に変更し、上記最
適値を用いて合成音声を再合成し、出力する機能を有す
る合成音声評価・合成装置。 - 【請求項7】音声等を出力する音響出力手段,文字列や
画像及び図形等を表示する情報表示手段,データ等を蓄
積するデータ蓄積手段を持つ情報処理装置において、音
声波形表示及び文字列表示を発声時間長に合わせて行
い、さらに上記表示の時間軸に合わせて現状のピッチ値
を0として直線を表示し、ユーザがマウス等で音声波形
表示位置上あるいは文字列表示位置上で、ピッチの変更
個所を指定し、さらに前記直線の形状を変化させること
によって上記指定個所のピッチを変更する機能を有する
音声評価・合成装置。 - 【請求項8】請求項7に記載されている装置において、
変更された値と変更前の値との差分を表示する機能を有
する音声評価・合成装置。 - 【請求項9】請求項7に記載されている装置において、
音声波形表示及び文字列表示を発声時間長に合わせて行
い、さらに上記表示の時間軸に合わせて現状のピッチ幅
を表示し、ユーザがマウス等で音声波形表示位置上ある
いは文字列表示位置上でピッチ幅の変更個所を指定し、
さらに上記ピッチ幅を変更することによって上記指定個
所のピッチ幅を変更する機能を有する音声評価・合成装
置。 - 【請求項10】請求項7に記載されている装置におい
て、音声波形表示及び文字列表示を発声時間長に合わせ
て行い、ユーザがマウス等で音声波形表示位置上あるい
は文字列表示位置上で変更個所を指定し、さらに、変更
個所の下部等に表示されている文字列入力ボックスに、
「ささやき声」などの音声表現語を入力することによ
り、上記指定個所の声質を変更する機能を有する音声評
価・合成装置。 - 【請求項11】音声等を出力する音響出力手段,文字列
や画像及び図形等を表示する表示手段,データ等を蓄積
するデータ蓄積手段,音声や環境音等を入力する音声及
び音響入力手段,上記音声及び音響入力手段によって入
力された音声あるいは音響情報を蓄積する音情報蓄積手
段を持つ情報処理装置において、自動車内等に設置し
て、車内の環境音を前記音声及び音響入力手段により入
力し、入力された音情報を分析して、上記環境音下でも
明瞭に聴取できる音声を再生する機能を有する音声評価
・合成装置。 - 【請求項12】音声等を出力する音響出力手段,文字列
や画像及び図形等を表示する情報表示手段,データ等を
蓄積するデータ蓄積手段を持つ情報処理装置において、
評価すべき音声に環境音等を重畳させた再生音を作成
し、ユーザが、上記音響出力手段により出力された上記
再生音を聴取し、聴取した上記再生音を評価することを
可能にした聴取評価機能と、上記評価結果を用いてデー
タを集計し、統計処理を行い、さらに上記処理結果を画
面表示する機能と、上記処理結果を用いて発声速度,発
声音圧,発声基本周波数等を変更し、上記変更された変
数によって再合成された音声等を出力する機能を有する
音声評価・合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9166848A JPH1115488A (ja) | 1997-06-24 | 1997-06-24 | 合成音声評価・合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9166848A JPH1115488A (ja) | 1997-06-24 | 1997-06-24 | 合成音声評価・合成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1115488A true JPH1115488A (ja) | 1999-01-22 |
Family
ID=15838781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9166848A Pending JPH1115488A (ja) | 1997-06-24 | 1997-06-24 | 合成音声評価・合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH1115488A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003034724A1 (fr) * | 2001-10-16 | 2003-04-24 | Seiko Epson Corporation | Dispositif de creation de fichier et dispositif de sortie de donnees |
JP2007093925A (ja) * | 2005-09-28 | 2007-04-12 | Univ Of Electro-Communications | 再生装置、再生方法、及び記憶媒体 |
JPWO2007091475A1 (ja) * | 2006-02-08 | 2009-07-02 | 日本電気株式会社 | 音声合成装置、音声合成方法及びプログラム |
JP2010032816A (ja) * | 2008-07-29 | 2010-02-12 | Yamaha Corp | 話速変換装置およびプログラム |
US10535335B2 (en) | 2015-09-14 | 2020-01-14 | Kabushiki Kaisha Toshiba | Voice synthesizing device, voice synthesizing method, and computer program product |
-
1997
- 1997-06-24 JP JP9166848A patent/JPH1115488A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003034724A1 (fr) * | 2001-10-16 | 2003-04-24 | Seiko Epson Corporation | Dispositif de creation de fichier et dispositif de sortie de donnees |
CN1327705C (zh) * | 2001-10-16 | 2007-07-18 | 精工爱普生株式会社 | 文件生成装置及数据输出装置 |
JP2007093925A (ja) * | 2005-09-28 | 2007-04-12 | Univ Of Electro-Communications | 再生装置、再生方法、及び記憶媒体 |
JP4543261B2 (ja) * | 2005-09-28 | 2010-09-15 | 国立大学法人電気通信大学 | 再生装置 |
JPWO2007091475A1 (ja) * | 2006-02-08 | 2009-07-02 | 日本電気株式会社 | 音声合成装置、音声合成方法及びプログラム |
US8209180B2 (en) | 2006-02-08 | 2012-06-26 | Nec Corporation | Speech synthesizing device, speech synthesizing method, and program |
JP5277634B2 (ja) * | 2006-02-08 | 2013-08-28 | 日本電気株式会社 | 音声合成装置、音声合成方法及びプログラム |
JP2010032816A (ja) * | 2008-07-29 | 2010-02-12 | Yamaha Corp | 話速変換装置およびプログラム |
US10535335B2 (en) | 2015-09-14 | 2020-01-14 | Kabushiki Kaisha Toshiba | Voice synthesizing device, voice synthesizing method, and computer program product |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1736961B1 (en) | System and method for automatic creation of digitally enhanced ringtones for cellphones | |
US7031924B2 (en) | Voice synthesizing apparatus, voice synthesizing system, voice synthesizing method and storage medium | |
JP3287230B2 (ja) | コーラス効果付与装置 | |
CN101379549B (zh) | 声音合成装置、声音合成方法 | |
KR20060073502A (ko) | 어학 학습 시스템 및 어학 학습용의 음성 데이터 제공 방법 | |
JP2011186143A (ja) | ユーザ挙動を学習する音声合成装置、音声合成方法およびそのためのプログラム | |
US6756532B2 (en) | Waveform signal generation method with pseudo low tone synthesis | |
JPH1115488A (ja) | 合成音声評価・合成装置 | |
JP4564416B2 (ja) | 音声合成装置および音声合成プログラム | |
AU769036B2 (en) | Device and method for digital voice processing | |
JP2009157220A (ja) | 音声編集合成システム、音声編集合成プログラム及び音声編集合成方法 | |
JP2005208394A (ja) | 歌声生成装置、そのプログラム並びに歌声生成機能を有する携帯通信端末 | |
JP4720974B2 (ja) | 音声発生装置およびそのためのコンピュータプログラム | |
JP2005037846A (ja) | 音楽再生装置の情報設定装置及び情報設定方法 | |
JPH0549998B2 (ja) | ||
JP3503268B2 (ja) | 音色パラメータ編集装置 | |
KR20050111701A (ko) | 컴퓨터를 이용한 편곡 시스템 및 그 방법과 그 실행프로그램을 기록한 기록매체 | |
JP4758931B2 (ja) | 音声合成装置、方法、プログラム及びその記録媒体 | |
JP3241582B2 (ja) | 韻律制御装置及び方法 | |
JP3426957B2 (ja) | 映像中への音声録音支援表示方法及び装置及びこの方法を記録した記録媒体 | |
JP4366918B2 (ja) | 携帯端末 | |
JP3133347B2 (ja) | 韻律制御装置 | |
JP4775236B2 (ja) | 音声合成装置 | |
JP3494095B2 (ja) | 楽音要素抽出装置及び方法並びに記憶媒体 | |
CN114550690A (zh) | 歌曲合成方法及装置 |