JP2009217141A - 音声合成装置 - Google Patents
音声合成装置 Download PDFInfo
- Publication number
- JP2009217141A JP2009217141A JP2008062706A JP2008062706A JP2009217141A JP 2009217141 A JP2009217141 A JP 2009217141A JP 2008062706 A JP2008062706 A JP 2008062706A JP 2008062706 A JP2008062706 A JP 2008062706A JP 2009217141 A JP2009217141 A JP 2009217141A
- Authority
- JP
- Japan
- Prior art keywords
- data
- voice
- singing
- feature
- singing score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Abstract
【解決手段】音声合成装置1のCPU11は、メロディと歌詞を表す歌唱スコアデータから、データベースを参照して音声波形を表す合成音声データを生成する。CPU11は、生成した合成音声データと予め記憶された模範音声データとを比較し、両者の差分に応じて、歌唱スコアデータのピッチデータや発音タイミングデータを修正する。CPU11は、修正した歌唱スコアデータから、データベースを参照して合成音声データを生成し、生成した合成音声データの表す音声を放音する。
【選択図】図1
Description
本発明は上述した背景の下になされたものであり、歌唱合成音をユーザが所望する態様に容易に修正することのできる技術を提供することを目的とする。
図1は、この発明の一実施形態である音声合成装置1のハードウェア構成を例示したブロック図である。この音声合成装置1は、メロディと歌詞を表すデータ(以下「歌唱スコアデータ」)から、予め作成されたデータベースを用いて歌唱合成(音声合成)を行う装置である。図において、CPU(Central Processing Unit)11は、ROM(Read Only Memory)12又は記憶部14に記憶されているコンピュータプログラムを読み出してRAM(Random Access Memory)13にロードし、これを実行することにより、音声合成装置1の各部を制御する。記憶部14は、CPU11によって実行されるコンピュータプログラムや各種のデータを記憶する記憶手段であり、例えばハードディスク装置である。なお、記憶部14は、CD−ROM装置、光磁気ディスク(MO)装置、デジタル多目的ディスク(DVD)装置等であってもよい。表示部15は、液晶ディスプレイ等を備え、CPU11の制御の下で、音声合成装置1を操作するためのメニュー画面等の各種の画面を表示する。操作部16は、マウスやキーボードを備え、ユーザによって操作された内容に応じた信号を出力する。マイクロホン17は、収音し、収音した音声を表す音声信号(アナログ信号)を出力する。音声処理部18は、DACやADCを備え、マイクロホン17が出力する音声信号(アナログ信号)をA/D変換によりデジタルデータに変換してCPU11に出力する。また、音声処理部18は、CPU11から供給されるデジタルデータをD/A変換によりアナログ信号に変換してスピーカ19に供給する。スピーカ19は、音声処理部18から出力されるアナログ信号に応じた強度で放音する。
[数1]
Template = [P(t),Pitch(t),T] …(A)
図2(b)は、CPU11が歌唱スコアデータ生成処理を行う場合において、表示部15に表示される画面の一例を示す図である。CPU11は、図2(b)に例示するような画面を表示して、ユーザに歌唱スコアデータの入力を促す。図において、歌唱スコアデータ編集画面600は、ノートデータをピアノロール形式で表示するイベント表示領域601を備えている。イベント表示領域601の右側には、イベント表示領域601の表示画面を上下にスクロールするためのスクロールバー606が設けられている。イベント表示領域601の下側には、イベント表示領域601の表示画面を左右にスクロールするためのスクロールバー607が設けられている。
図6は、修正された歌唱スコアデータの内容の一例を示す図である。図示のように、ピッチや各音韻の発音開始タイミング、発音終了タイミングが、模範音声に応じて修正される。
歌唱スコアデータ修正部114は、各特徴データを修正した歌唱スコアデータを、修正後歌唱スコアデータとして、修正後歌唱スコアデータ記憶領域144に記憶する。
次に、この実施形態の動作について説明する。ユーザが操作部16を用いて歌唱スコアデータの修正を行う旨の操作を行うと、CPU11は、まず、操作部16から出力される信号に応じて、上述の歌唱合成部111の処理を行う。すなわち、CPU11は、歌唱スコアデータ記憶領域143に記憶された歌唱スコアデータから、Timbreデータベース141及び音韻テンプレートデータベース142を参照して、合成音声データを生成する。
CPU11は、生成した合成音声データを音声処理部18に供給してスピーカ19から音として放音させる。これにより、スピーカ19からは、模範音声に基づいて修正された歌唱スコアデータの表す音声が放音される。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。以下にその一例を示す。なお、以下の各態様を適宜に組み合わせてもよい。
(1)上述の実施形態では、CPU11は、歌唱スコアデータを修正し、修正した歌唱スコアデータを修正後歌唱スコアデータとして、修正後歌唱スコアデータ記憶領域144に記憶するようにしたが、これに限らず、図7に例示するように、CPU11が、歌唱スコアデータ記憶領域143に上書きするようにしてもよい。この場合、CPU11が、修正した歌唱スコアデータを用いて再度修正を行うようにしてもよい。
図7に示す例において、CPU11は、修正した歌唱スコアデータを歌唱スコアデータ記憶領域143に記憶する。そして、CPU11は、修正された歌唱スコアデータを歌唱スコアデータ記憶領域143から読み出し(すなわち、修正された歌唱スコアデータを取得し)、修正された歌唱スコアデータを用いて合成音声データを生成し、生成した合成音声データを用いて再度模範音声データとの比較を行い、比較結果を用いて歌唱スコアデータの修正を再度実行する。
このように、歌唱合成パラメータの修正を繰り返し行うようにすれば、歌唱スコアデータをより模範音声に近づけることができ、歌唱品質を高めることができる。
例えば、模範音声としてユーザの歌唱音声を記憶させておけば、繰り返し修正することにより、ユーザの歌唱音声に歌唱合成音を近づけることができる。
146から読み出して再生し、音声混合部119は、伴奏再生部118から供給される伴奏音を表す信号とマイクロホン17から供給される音声信号とを混合してスピーカ19に出力する。これにより、スピーカ19からは、伴奏音と収音されたユーザの歌唱音声とが放音される。なお、伴奏再生と歌唱合成はタイミングを合わせて行う必要があり、そのための制御機構が必要であるが、図面が煩雑になるのを防ぐためそれらの図示を省略している。
このように、歌唱音声を収音する際に、伴奏音を再生することで、ユーザが、歌唱スコアデータの表す歌唱合成音にタイミングを合わせて歌唱することができる。
このようにすることで、例えば、楽曲の1番を修正し終えた段階で、2番、3番の歌唱スコアデータの修正を終わらせることができるので、修正に係る処理時間を短くすることができる。
このようにすることで、予め歌唱スコアデータを用意する必要がなく、マイクロホン17から入力された音声を分析して、歌唱スコアデータを自動生成することができる。
また、この態様において、マイクロホン17に入力された音声を音声認識してフォルマントを検出し、音質データや声質データを生成するようにしてもよい。
Claims (7)
- 音素の列で構成されるメロディを表す歌唱スコアデータであって、各音素の特徴を表す特徴データを含む歌唱スコアデータを取得する歌唱スコアデータ取得手段と、
音声波形を表す第1の音声波形データを取得する第1の音声波形データ取得手段と、
前記歌唱スコアデータ取得手段により取得された歌唱スコアデータから、該歌唱スコアデータに対応する音声波形を表す第2の音声波形データを生成する第2の音声波形データ生成手段と、
前記第1の音声波形データと前記第2の音声波形データとを、時間軸方向に対応付ける対応付手段と、
前記第1の音声波形データを解析し、解析結果に応じて前記特徴を検出する第1の特徴検出手段と、
前記第2の音声波形データを解析し、解析結果に応じて前記特徴を検出する第2の特徴検出手段と、
前記対応付手段の対応付結果に応じて、前記歌唱スコアデータ取得手段により取得された歌唱スコアデータに含まれる特徴データを、前記第1の特徴検出手段によって検出された前記第1の音声波形データの特徴と前記第2の特徴検出手段によって検出された前記第2の音声波形データの特徴との対応箇所における差分が小さくなるように修正する特徴データ修正手段と、
前記特徴データ修正手段により修正された歌唱スコアデータから、該歌唱スコアデータに対応する音声波形を表す第3の音声波形データを生成する第3の音声波形データ生成手段と、
前記第3の音声波形データ生成手段により生成された第3の音声波形データを出力する出力手段と
を具備することを特徴とする音声合成装置。 - 前記特徴は、前記メロディを構成する各音素の発音タイミング、ピッチの時間的な変化、前記メロディを構成する各音素の音韻及び音声スペクトルの少なくともいずれか一つを含む
ことを特徴とする請求項1に記載の音声合成装置。 - 前記特徴データ修正手段により修正された歌唱スコアデータが予め定められた条件を満たす場合に、該歌唱スコアデータを前記歌唱スコアデータ取得手段に供給する歌唱スコアデータ取得制御手段
を具備することを特徴とする請求項1又は2に記載の音声合成装置。 - 前記歌唱スコアデータは、複数の時間区間に区分されるとともに、複数の時間区間の対応関係を示す区間対応データを含み、
前記特徴データ修正手段は、前記複数の時間区間のうちの少なくともいずれかひとつの時間区間について、前記対応付手段の対応付結果に応じて、前記歌唱スコアデータ取得手段により取得された歌唱スコアデータに含まれる特徴データを、前記第1の特徴検出手段によって検出された前記第1の音声波形データの特徴と前記第2の特徴検出手段によって検出された前記第2の音声波形データの特徴との対応箇所における差分が小さくなるように修正するとともに、
前記区間対応データに基づいて、該時間区間に対応する他の時間区間について、前記歌唱スコアデータに含まれる特徴データを、該時間区間における修正態様で修正する
ことを特徴とする請求項1乃至3のいずれか1項に記載の音声合成装置。 - 前記第1の音声波形データ取得手段は、収音手段によって収音された音声を表す音声データを、前記第1の音声データとして取得する
ことを特徴とする請求項1乃至4のいずれか1項に記載の音声合成装置。 - 音声波形を表す第1の音声波形データを取得する第1の音声波形データ取得手段と、
前記第1の音声波形データから音声の特徴を検出し、検出した特徴を示す特徴データを生成する特徴データ生成手段と、
音素の列で構成されるメロディを表す歌唱スコアデータであって前記特徴データ生成手段により生成された特徴データを含む歌唱スコアデータを生成する歌唱スコアデータ生成手段と、
前記歌唱スコアデータ生成手段により生成された歌唱スコアデータから、該歌唱スコアデータに対応する音声波形を表す第2の音声波形データを生成する第2の音声波形データ生成手段と、
前記第2の音声波形データを出力する出力手段と
を具備することを特徴とする音声合成装置。 - 前記特徴は、前記メロディを構成する各音素の発音タイミング、ピッチの時間的な変化、前記メロディを構成する各音素の音韻及び音声スペクトルのうちの少なくともいずれか一つを含む
ことを特徴とする請求項6に記載の音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008062706A JP5136128B2 (ja) | 2008-03-12 | 2008-03-12 | 音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008062706A JP5136128B2 (ja) | 2008-03-12 | 2008-03-12 | 音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009217141A true JP2009217141A (ja) | 2009-09-24 |
JP5136128B2 JP5136128B2 (ja) | 2013-02-06 |
Family
ID=41189032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008062706A Expired - Fee Related JP5136128B2 (ja) | 2008-03-12 | 2008-03-12 | 音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5136128B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010009034A (ja) * | 2008-05-28 | 2010-01-14 | National Institute Of Advanced Industrial & Technology | 歌声合成パラメータデータ推定システム |
JP2012022121A (ja) * | 2010-07-14 | 2012-02-02 | Yamaha Corp | 音声合成装置 |
JP2013134476A (ja) * | 2011-12-27 | 2013-07-08 | Yamaha Corp | 音声合成装置及びプログラム |
JP2013156544A (ja) * | 2012-01-31 | 2013-08-15 | Brother Ind Ltd | 発声区間特定装置、音声パラメータ生成装置、及びプログラム |
JP2013213874A (ja) * | 2012-03-30 | 2013-10-17 | Fujitsu Ltd | 音声合成プログラム、音声合成方法および音声合成装置 |
JP2015087617A (ja) * | 2013-10-31 | 2015-05-07 | 株式会社第一興商 | カラオケのガイドボーカル生成装置及びガイドボーカル生成方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH037996A (ja) * | 1989-06-05 | 1991-01-16 | Matsushita Electric Works Ltd | 歌音声合成データの作成装置 |
JPH0543199U (ja) * | 1991-11-06 | 1993-06-11 | 株式会社東芝 | 音響再生装置 |
JP2001125582A (ja) * | 1999-10-26 | 2001-05-11 | Victor Co Of Japan Ltd | 音声データ変換装置、音声データ変換方法、及び音声データ記録媒体 |
JP2003108176A (ja) * | 2001-10-01 | 2003-04-11 | Nippon Telegr & Teleph Corp <Ntt> | 歌唱音声合成における韻律生成方法及び韻律生成プログラム、そのプログラムを記録した記録媒体 |
JP2004004440A (ja) * | 2002-03-22 | 2004-01-08 | Yamaha Corp | 歌唱合成装置、歌唱合成用プログラム及び歌唱合成用プログラムを記録したコンピュータで読み取り可能な記録媒体 |
JP2007316261A (ja) * | 2006-05-24 | 2007-12-06 | Casio Comput Co Ltd | カラオケ装置 |
JP2007322933A (ja) * | 2006-06-02 | 2007-12-13 | Yamaha Corp | 指導装置、指導用データ製作装置及びプログラム |
JP2008015195A (ja) * | 2006-07-05 | 2008-01-24 | Yamaha Corp | 楽曲練習支援装置 |
-
2008
- 2008-03-12 JP JP2008062706A patent/JP5136128B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH037996A (ja) * | 1989-06-05 | 1991-01-16 | Matsushita Electric Works Ltd | 歌音声合成データの作成装置 |
JPH0543199U (ja) * | 1991-11-06 | 1993-06-11 | 株式会社東芝 | 音響再生装置 |
JP2001125582A (ja) * | 1999-10-26 | 2001-05-11 | Victor Co Of Japan Ltd | 音声データ変換装置、音声データ変換方法、及び音声データ記録媒体 |
JP2003108176A (ja) * | 2001-10-01 | 2003-04-11 | Nippon Telegr & Teleph Corp <Ntt> | 歌唱音声合成における韻律生成方法及び韻律生成プログラム、そのプログラムを記録した記録媒体 |
JP2004004440A (ja) * | 2002-03-22 | 2004-01-08 | Yamaha Corp | 歌唱合成装置、歌唱合成用プログラム及び歌唱合成用プログラムを記録したコンピュータで読み取り可能な記録媒体 |
JP2007316261A (ja) * | 2006-05-24 | 2007-12-06 | Casio Comput Co Ltd | カラオケ装置 |
JP2007322933A (ja) * | 2006-06-02 | 2007-12-13 | Yamaha Corp | 指導装置、指導用データ製作装置及びプログラム |
JP2008015195A (ja) * | 2006-07-05 | 2008-01-24 | Yamaha Corp | 楽曲練習支援装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010009034A (ja) * | 2008-05-28 | 2010-01-14 | National Institute Of Advanced Industrial & Technology | 歌声合成パラメータデータ推定システム |
US8244546B2 (en) | 2008-05-28 | 2012-08-14 | National Institute Of Advanced Industrial Science And Technology | Singing synthesis parameter data estimation system |
JP2012022121A (ja) * | 2010-07-14 | 2012-02-02 | Yamaha Corp | 音声合成装置 |
JP2013134476A (ja) * | 2011-12-27 | 2013-07-08 | Yamaha Corp | 音声合成装置及びプログラム |
JP2013156544A (ja) * | 2012-01-31 | 2013-08-15 | Brother Ind Ltd | 発声区間特定装置、音声パラメータ生成装置、及びプログラム |
JP2013213874A (ja) * | 2012-03-30 | 2013-10-17 | Fujitsu Ltd | 音声合成プログラム、音声合成方法および音声合成装置 |
JP2015087617A (ja) * | 2013-10-31 | 2015-05-07 | 株式会社第一興商 | カラオケのガイドボーカル生成装置及びガイドボーカル生成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5136128B2 (ja) | 2013-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3823930B2 (ja) | 歌唱合成装置、歌唱合成プログラム | |
KR100949872B1 (ko) | 악곡 연습 지원 장치, 악곡 연습 지원 장치의 제어 방법, 악곡 연습 지원 장치를 제어하는 제어 방법을 컴퓨터로 실행시키는 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체 | |
JP5605066B2 (ja) | 音合成用データ生成装置およびプログラム | |
US9595256B2 (en) | System and method for singing synthesis | |
JP5024711B2 (ja) | 歌声合成パラメータデータ推定システム | |
JP5136128B2 (ja) | 音声合成装置 | |
JP2008026622A (ja) | 評価装置 | |
JP2016177276A (ja) | 発音装置、発音方法および発音プログラム | |
JP6756151B2 (ja) | 歌唱合成データ編集の方法および装置、ならびに歌唱解析方法 | |
JP2007233077A (ja) | 評価装置、制御方法及びプログラム | |
JP6737320B2 (ja) | 音響処理方法、音響処理システムおよびプログラム | |
JP2009169103A (ja) | 練習支援装置 | |
JP2008039833A (ja) | 音声評価装置 | |
JP2009157220A (ja) | 音声編集合成システム、音声編集合成プログラム及び音声編集合成方法 | |
JP6252420B2 (ja) | 音声合成装置、及び音声合成システム | |
JP5810947B2 (ja) | 発声区間特定装置、音声パラメータ生成装置、及びプログラム | |
JP2022065554A (ja) | 音声合成方法およびプログラム | |
JP5953743B2 (ja) | 音声合成装置及びプログラム | |
JP3785892B2 (ja) | 音声合成装置及び記録媒体 | |
JP2000010597A (ja) | 音声変換装置及び音声変換方法 | |
JP6191094B2 (ja) | 音声素片切出装置 | |
JP3540609B2 (ja) | 音声変換装置及び音声変換方法 | |
JP2010181769A (ja) | カラオケ装置及びその制御方法並びにその制御プログラム | |
JP3447220B2 (ja) | 音声変換装置及び音声変換方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120731 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120927 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121016 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121029 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151122 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |