JP4720974B2 - 音声発生装置およびそのためのコンピュータプログラム - Google Patents
音声発生装置およびそのためのコンピュータプログラム Download PDFInfo
- Publication number
- JP4720974B2 JP4720974B2 JP2004369108A JP2004369108A JP4720974B2 JP 4720974 B2 JP4720974 B2 JP 4720974B2 JP 2004369108 A JP2004369108 A JP 2004369108A JP 2004369108 A JP2004369108 A JP 2004369108A JP 4720974 B2 JP4720974 B2 JP 4720974B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- morphing
- audio
- sound
- voices
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Description
カワハラ、H.およびマツイ、H.、「無干渉時間−周波数表現における弾性的知覚的距離尺度に基づく聴覚的モーフィング」、ICASSP’2003予稿集、第1巻、pp.256−259、2003年(Kawahara, H., and Matsui, H., "AUDITORY MORPHING BASED ON AN ELASTIC PERCEPTUAL DISTANCE METRIC IN AN INTERFERENCE-FREE TIME-FREQUENCY REPRESENTATION," Proc. ICASSP'2003, vol.I, pp.256-259, 2003.) http://www.wakayama-u.ac.jp/~kawahara/STRAIGHTadv/(高品質音声分析変換合成システム STRAIGHT)
図1〜図8を参照して、上記した音声モーフィングシステム20は以下のように動作する。動作は大きく3つのフェーズに分けられる。第1のフェーズでは、予め準備された、互いの声質の異なる第1の音声38と第2の音声40とから9個の中間段階のモーフィング後音声28を作成する。なお、これに先立ち、同じ話者により、声質(音声の表情)を変えて同一の文章を読んだり同一の歌を歌ったりすることによって二つの音声を収録しておき、これらをそれぞれ第1の音声38および第2の音声40として保存しておく。また、第1の音声38および第2の音声40の音声ファイルには、付属情報として声質を示すラベルを付しておく。
図4を参照して、パラメータ入力部100は、入出力インタフェース24を用いてユーザから、中間段階の数と、シグモイド関数決定のためのパラメータとを受取る。パラメータ入力部100は、このパラメータをシグモイド関数決定部102に与える。
図7を参照して、第2のフェーズにおいてはモーフィング音声選択・再生装置32は以下のように動作する。モーフィング音声選択・再生装置32の各機能ブロックは、予めプログラム160の形で準備されている。
上記した実施の形態では、2種類の音声の間で音声モーフィングを行なって得た中間音声を用いた。しかし本発明はそのように2種類の音声の間でのモーフィングには限定されない。例えば3種類以上の音声の間でのモーフィングを行なうことも可能である。モーフィング自体はSTRAIGHTを使用して行なうことができる。問題は、3種類以上の音声の間でのモーフィング率を定める方法である。
22 音声モーフィング装置
24 入出力インタフェース
26 基準音声記憶装置
28 モーフィング後音声
30 音声データ記憶装置
32 モーフィング音声選択・再生装置
34 ユーザインタフェース
38 第1の音声
40 第2の音声
50 コンピュータシステム
100 パラメータ入力部
102 シグモイド関数決定部
104 モーフィング率決定部
106 繰返し制御部
108 モーフィング実行部
110 保存処理部
120 音声記憶装置
Claims (4)
- 同じ内容の複数種類の音声に基づいて、声質を変化させながら音声を発生させるための音声発生装置であって、
複数の中間段階の数、及び、シグモイド関数決定のためのパラメータを受付ける受付手段と、
前記受付手段が受付けた前記パラメータにしたがってシグモイド関数を決定するシグモイド関数決定手段と、
前記シグモイド関数決定手段が決定した前記シグモイド関数を用いて、前記受付手段が受付けた数の複数の中間段階におけるモーフィング率をそれぞれ決定する第1のモーフィング率決定手段と、
前記複数種類の音声に対して、前記第1のモーフィング率決定手段が決定した前記複数種類のモーフィング率で音声モーフィングを行なうことによって複数の中間音声を作成するモーフィング実行手段と、
前記複数種類の音声と、前記モーフィング実行手段が作成した前記複数の中間音声とを記憶する音声記憶装置と、
前記複数種類の音声のモーフィング率を指定するためのモーフィング率指定手段と、
前記モーフィング率指定手段によりモーフィング率が指定されたことに応答して、前記音声記憶装置から与えられる、前記複数種類の音声と前記複数の中間音声との中で、指定されたモーフィング率に最も近いモーフィング率の音声を選択する音声選択手段と、
前記音声選択手段から与えられる前記選択された音声を音声信号に変換する音声信号変換手段とを含み、
前記複数種類の音声には、予めそれぞれの声質を特定するラベルが付されており、
前記モーフィング率指定手段は、
前記複数種類の音声の各々について、対応するラベルを表示するラベル表示手段と、
前記複数種類の音声をそれぞれ表す複数の基準点をそれぞれ対応するラベルと関連付けて所定の位置に表示する基準点表示手段と、
前記基準点と所定の関係にある、予め定める領域内にユーザにより配置されたポインタの位置と、前記複数の基準点との間の距離にしたがって、前記複数種類の音声のモーフィング率を決定する第2のモーフィング率決定手段と、を含む、音声発生装置。 - 前記モーフィング率指定手段はさらに、
所定空間内における、前記複数種類の音声の各々にそれぞれ対応する前記複数の基準点の位置を決定する基準点決定手段を含む、請求項1に記載の音声発生装置。 - 前記音声選択手段による音声発生の基準時刻を定めるタイマと、
前記モーフィング率指定手段によりモーフィング率の指定がされたことに応答して、前記タイマを参照して音声再生の時刻を得て、前記音声選択手段により選択された音声を示す情報とともに音声再生シーケンスとして記録する選択音声記録手段と、
音声再生シーケンスの再生を指示する信号に応答して、当該信号により示される音声再生シーケンスを読出して、当該音声再生シーケンスにより指定される時刻に、当該時刻に指定された音声を選択して前記音声信号変換手段に与える音声再生制御処理手段とをさらに含む、請求項1又は請求項2に記載の音声発生装置。 - コンピュータにより実行されると、請求項1〜請求項3のいずれかに記載の音声発生装置として当該コンピュータを動作させる、コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004369108A JP4720974B2 (ja) | 2004-12-21 | 2004-12-21 | 音声発生装置およびそのためのコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004369108A JP4720974B2 (ja) | 2004-12-21 | 2004-12-21 | 音声発生装置およびそのためのコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006178052A JP2006178052A (ja) | 2006-07-06 |
JP4720974B2 true JP4720974B2 (ja) | 2011-07-13 |
Family
ID=36732233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004369108A Expired - Fee Related JP4720974B2 (ja) | 2004-12-21 | 2004-12-21 | 音声発生装置およびそのためのコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4720974B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4677543B2 (ja) * | 2005-05-24 | 2011-04-27 | 株式会社国際電気通信基礎技術研究所 | 表情付け音声発生装置 |
JP2008116551A (ja) * | 2006-11-01 | 2008-05-22 | Advanced Telecommunication Research Institute International | 表情付け音声発生装置 |
JP6152753B2 (ja) * | 2013-08-29 | 2017-06-28 | ヤマハ株式会社 | 音声合成管理装置 |
JP6299141B2 (ja) * | 2013-10-17 | 2018-03-28 | ヤマハ株式会社 | 楽音情報生成装置および楽音情報生成方法 |
JP7339512B2 (ja) * | 2019-08-27 | 2023-09-06 | 株式会社カプコン | 音声再生プログラム、および音声再生装置 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0950295A (ja) * | 1995-08-09 | 1997-02-18 | Fujitsu Ltd | 音声合成方法およびそのための装置 |
JPH09146597A (ja) * | 1995-11-28 | 1997-06-06 | Sanyo Electric Co Ltd | 音声変換装置 |
JPH09152892A (ja) * | 1995-09-26 | 1997-06-10 | Nippon Telegr & Teleph Corp <Ntt> | 音声信号変形接続方法 |
JPH09244693A (ja) * | 1996-03-07 | 1997-09-19 | N T T Data Tsushin Kk | 音声合成方法及び装置 |
JPH10254500A (ja) * | 1997-01-07 | 1998-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 補間音色合成方法 |
JP2001109901A (ja) * | 1999-10-05 | 2001-04-20 | Sharp Corp | アニメーション作成装置および方法、ならびにアニメーション作成プログラムを記録したコンピュータで読取可能な記録媒体 |
JP2001117564A (ja) * | 1999-10-21 | 2001-04-27 | Yamaha Corp | 楽音処理装置および楽音処理方法 |
JP2002094881A (ja) * | 2000-09-14 | 2002-03-29 | Megafusion Corp | 画像および音の補間処理装置並びにそれらの補間処理方法 |
JP2002333897A (ja) * | 2001-03-08 | 2002-11-22 | Matsushita Electric Ind Co Ltd | 韻律生成装置および韻律生成方法並びにプログラム |
JP2003219262A (ja) * | 2002-01-17 | 2003-07-31 | Sony Corp | デジタルカメラ装置及び画像処理方法 |
JP2003283613A (ja) * | 2002-03-25 | 2003-10-03 | Hitachi Ltd | 携帯通信端末装置 |
JP2003295882A (ja) * | 2002-04-02 | 2003-10-15 | Canon Inc | 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム |
JP2004005265A (ja) * | 2002-05-31 | 2004-01-08 | Omron Corp | 画像合成方法、画像合成装置、画像合成システム |
JP2004102118A (ja) * | 2002-09-12 | 2004-04-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声接続方法、音声接続装置、そのプログラムおよびその記録媒体 |
-
2004
- 2004-12-21 JP JP2004369108A patent/JP4720974B2/ja not_active Expired - Fee Related
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0950295A (ja) * | 1995-08-09 | 1997-02-18 | Fujitsu Ltd | 音声合成方法およびそのための装置 |
JPH09152892A (ja) * | 1995-09-26 | 1997-06-10 | Nippon Telegr & Teleph Corp <Ntt> | 音声信号変形接続方法 |
JPH09146597A (ja) * | 1995-11-28 | 1997-06-06 | Sanyo Electric Co Ltd | 音声変換装置 |
JPH09244693A (ja) * | 1996-03-07 | 1997-09-19 | N T T Data Tsushin Kk | 音声合成方法及び装置 |
JPH10254500A (ja) * | 1997-01-07 | 1998-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 補間音色合成方法 |
JP2001109901A (ja) * | 1999-10-05 | 2001-04-20 | Sharp Corp | アニメーション作成装置および方法、ならびにアニメーション作成プログラムを記録したコンピュータで読取可能な記録媒体 |
JP2001117564A (ja) * | 1999-10-21 | 2001-04-27 | Yamaha Corp | 楽音処理装置および楽音処理方法 |
JP2002094881A (ja) * | 2000-09-14 | 2002-03-29 | Megafusion Corp | 画像および音の補間処理装置並びにそれらの補間処理方法 |
JP2002333897A (ja) * | 2001-03-08 | 2002-11-22 | Matsushita Electric Ind Co Ltd | 韻律生成装置および韻律生成方法並びにプログラム |
JP2003219262A (ja) * | 2002-01-17 | 2003-07-31 | Sony Corp | デジタルカメラ装置及び画像処理方法 |
JP2003283613A (ja) * | 2002-03-25 | 2003-10-03 | Hitachi Ltd | 携帯通信端末装置 |
JP2003295882A (ja) * | 2002-04-02 | 2003-10-15 | Canon Inc | 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム |
JP2004005265A (ja) * | 2002-05-31 | 2004-01-08 | Omron Corp | 画像合成方法、画像合成装置、画像合成システム |
JP2004102118A (ja) * | 2002-09-12 | 2004-04-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声接続方法、音声接続装置、そのプログラムおよびその記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2006178052A (ja) | 2006-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5895740B2 (ja) | 歌唱合成を行うための装置およびプログラム | |
JP5007563B2 (ja) | 音楽編集装置および方法、並びに、プログラム | |
JP3365354B2 (ja) | 音声信号または楽音信号の処理装置 | |
JP3823928B2 (ja) | スコアデータ表示装置およびプログラム | |
US20050190199A1 (en) | Apparatus and method for identifying and simultaneously displaying images of musical notes in music and producing the music | |
JP6236765B2 (ja) | 音楽データ編集装置および音楽データ編集方法 | |
US9355634B2 (en) | Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program stored thereon | |
US9601029B2 (en) | Method of presenting a piece of music to a user of an electronic device | |
JP6665446B2 (ja) | 情報処理装置、プログラム及び音声合成方法 | |
AU2009295348A1 (en) | Video and audio content system | |
JP2001249668A (ja) | 音声信号または楽音信号の処理装置およびその処理プログラムが記録された記録媒体 | |
JP7000782B2 (ja) | 歌唱音声の編集支援方法、および歌唱音声の編集支援装置 | |
JP2017111372A (ja) | 音声合成方法、音声合成制御方法、音声合成装置および音声合成制御装置 | |
CN108140402A (zh) | 音频内容的动态修改 | |
JP5625321B2 (ja) | 音声合成装置およびプログラム | |
JP5110706B2 (ja) | 絵本画像再生装置、絵本画像再生方法、絵本画像再生プログラム及び記録媒体 | |
JP4720974B2 (ja) | 音声発生装置およびそのためのコンピュータプログラム | |
JP2013231872A (ja) | 歌唱合成を行うための装置およびプログラム | |
JP3603599B2 (ja) | 演奏システムの視覚的表示方法および演奏システムの視覚的表示プログラムが記録されたコンピュータ読み取り可能な記録媒体 | |
JP4456088B2 (ja) | スコアデータ表示装置およびプログラム | |
JP6583756B1 (ja) | 音声合成装置、および音声合成方法 | |
JP2001013964A (ja) | 演奏装置及びその記録媒体 | |
JP2005249872A (ja) | 音楽再生パラメータ設定装置および音楽再生パラメータ設定方法 | |
KR102135117B1 (ko) | 가상환경 내의 사용자 행동에 따른 가청음의 사용자 인식 구조의 생성 방법 및 시스템 | |
JP4033146B2 (ja) | カラオケ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100506 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100601 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101115 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110301 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110322 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140415 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |