JP4265501B2 - 音声合成装置およびプログラム - Google Patents
音声合成装置およびプログラム Download PDFInfo
- Publication number
- JP4265501B2 JP4265501B2 JP2004209033A JP2004209033A JP4265501B2 JP 4265501 B2 JP4265501 B2 JP 4265501B2 JP 2004209033 A JP2004209033 A JP 2004209033A JP 2004209033 A JP2004209033 A JP 2004209033A JP 4265501 B2 JP4265501 B2 JP 4265501B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- unit
- phoneme
- boundary
- vowel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 38
- 238000003786 synthesis reaction Methods 0.000 title claims description 38
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims description 46
- 238000012545 processing Methods 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 21
- 230000011218 segmentation Effects 0.000 description 85
- 238000001228 spectrum Methods 0.000 description 25
- 239000011295 pitch Substances 0.000 description 12
- 239000003550 marker Substances 0.000 description 8
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Processing Or Creating Images (AREA)
- User Interface Of Digital Computer (AREA)
Description
まず、図1を参照して、本発明の第1実施形態に係る音声合成装置の構成を説明する。同図に示されるように、音声合成装置Dは、データ取得手段10と、記憶手段20と、音声処理手段30と、出力処理手段41と、出力手段43とを具備する。このうちデータ取得手段10、音声処理手段30および出力処理手段41は、例えばCPU(Central Processing Unit)などの演算処理装置がプログラムを実行することによって実現されてもよいし、DSPなど音声処理に専用されるハードウェアによって実現されてもよい(後述する第2実施形態についても同様)。
次に、本実施形態に係る音声合成装置Dの動作を説明する。
次に、図7を参照して、本発明の第2実施形態に係る音声合成装置Dについて説明する。上記第1実施形態においては、楽曲を構成する各楽音の音符長に応じて音素セグメンテーション境界Bsegの位置が制御される構成を例示した。これに対し、本実施形態に係る音声合成装置Dにおいては、利用者が入力したパラメータに応じて音素セグメンテーション境界Bsegの位置が選定されるようになっている。なお、本実施形態に係る音声合成装置Dのうち上記第1実施形態と同様の要素については共通の符号を付してその説明を適宜に省略する。
上記各実施形態には種々の変形が加えられる。具体的な変形の態様を例示すれば以下の通りである。以下に示す各態様を適宜に組み合わせてもよい。
Claims (4)
- 母音の音素を含む音声素片を取得する素片取得手段と、
音声を継続する時間長を指定する時間データを取得する時間データ取得手段と、
前記素片取得手段が取得した音声素片の後音素が母音である場合に、当該母音の音素のうち始点から終点までの途中の時点であって当該音素の始点から前記時間データに応じた時間長経過した時点に境界を指定し、前記素片取得手段が取得した音声素片の前音素が母音である場合に、当該母音の音素のうち始点から終点までの途中の時点であって当該音素の終点から前記時間データに応じた時間長遡った時点に境界を指定する境界指定手段と、
前記素片取得手段が取得した音声素片の後音素が母音である場合に、当該音声素片に含まれる母音の音素のうち前記境界指定手段が指定した境界よりも前の区間であって当該音声素片の始点を含む区間に基づいて音声を合成し、または、前記素片取得手段が取得した音声素片の前音素が母音である場合に、当該母音の音素のうち前記境界指定手段が指定した境界よりも後の区間であって当該音声素片の終点を含む区間に基づいて音声を合成する音声合成手段と
を具備する音声合成装置。 - 前記境界指定手段は、終点を含む区間が母音の音素である音声素片を前記素片取得手段が取得した場合に、前記時間データによって指定される時間長が長いほど、当該音声素片に含まれる母音の音素のうち前記終点に近い時点を境界に指定し、
前記音声合成手段は、この音声素片に含まれる母音の音素のうち前記境界指定手段が指定した境界よりも前の区間に基づいて音声を合成する
請求項1に記載の音声合成装置。 - 前記境界指定手段は、始点を含む区間が母音の音素である音声素片を前記素片取得手段が取得した場合に、前記時間データによって指定される時間長が長いほど、当該音声素片に含まれる母音の音素のうち前記始点に近い時点を境界に指定し、
前記音声合成手段は、この音声素片に含まれる母音の音素のうち前記境界指定手段が指定した境界よりも後の区間に基づいて音声を合成する
請求項1または2に記載の音声合成装置。 - コンピュータに、
母音の音素を含む音声素片を取得する素片取得処理と、
音声を継続する時間長を指定する時間データを取得する時間データ取得処理と、
前記素片取得処理によって取得した音声素片の後音素が母音である場合に、当該母音の音素のうち始点から終点までの途中の時点であって当該音素の始点から前記時間データに応じた時間長経過した時点に境界を指定し、前記素片取得処理によって取得した音声素片の前音素が母音である場合に、当該母音の音素のうち始点から終点までの途中の時点であって当該音素の終点から前記時間データに応じた時間長遡った時点に境界を指定する境界指定処理と、
前記素片取得処理によって取得した音声素片の後音素が母音である場合に、当該音声素片に含まれる母音の音素のうち前記境界指定処理にて指定した境界よりも前の区間であって当該音声素片の始点を含む区間に基づいて音声を合成し、または、前記素片取得処理によって取得した音声素片の前音素が母音である場合に、当該音声素片に含まれる母音の音素のうち前記境界指定処理にて指定した境界よりも後の区間であって当該音声素片の終点を含む区間に基づいて音声を合成する音声合成処理と
を実行させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004209033A JP4265501B2 (ja) | 2004-07-15 | 2004-07-15 | 音声合成装置およびプログラム |
EP05106399A EP1617408A3 (en) | 2004-07-15 | 2005-07-13 | Voice synthesis apparatus and method |
US11/180,108 US7552052B2 (en) | 2004-07-15 | 2005-07-13 | Voice synthesis apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004209033A JP4265501B2 (ja) | 2004-07-15 | 2004-07-15 | 音声合成装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006030575A JP2006030575A (ja) | 2006-02-02 |
JP4265501B2 true JP4265501B2 (ja) | 2009-05-20 |
Family
ID=34940296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004209033A Expired - Fee Related JP4265501B2 (ja) | 2004-07-15 | 2004-07-15 | 音声合成装置およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US7552052B2 (ja) |
EP (1) | EP1617408A3 (ja) |
JP (1) | JP4265501B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2645363A1 (en) | 2012-03-28 | 2013-10-02 | Yamaha Corporation | Sound synthesizing apparatus |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4548424B2 (ja) * | 2007-01-09 | 2010-09-22 | ヤマハ株式会社 | 楽音処理装置およびプログラム |
JP5119700B2 (ja) * | 2007-03-20 | 2013-01-16 | 富士通株式会社 | 韻律修正装置、韻律修正方法、および、韻律修正プログラム |
US8244546B2 (en) * | 2008-05-28 | 2012-08-14 | National Institute Of Advanced Industrial Science And Technology | Singing synthesis parameter data estimation system |
US7977562B2 (en) * | 2008-06-20 | 2011-07-12 | Microsoft Corporation | Synthesized singing voice waveform generator |
JP5233737B2 (ja) * | 2009-02-24 | 2013-07-10 | 大日本印刷株式会社 | 音素符号補正装置、音素符号データベース、および音声合成装置 |
JP5471858B2 (ja) * | 2009-07-02 | 2014-04-16 | ヤマハ株式会社 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
TWI394142B (zh) * | 2009-08-25 | 2013-04-21 | Inst Information Industry | 歌聲合成系統、方法、以及裝置 |
JP2011215358A (ja) * | 2010-03-31 | 2011-10-27 | Sony Corp | 情報処理装置、情報処理方法及びプログラム |
WO2011151956A1 (ja) * | 2010-06-04 | 2011-12-08 | パナソニック株式会社 | 声質変換装置及びその方法、母音情報作成装置並びに声質変換システム |
JP5728913B2 (ja) * | 2010-12-02 | 2015-06-03 | ヤマハ株式会社 | 音声合成情報編集装置およびプログラム |
JP5914996B2 (ja) * | 2011-06-07 | 2016-05-11 | ヤマハ株式会社 | 音声合成装置およびプログラム |
JP6047952B2 (ja) * | 2011-07-29 | 2016-12-21 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
JP5935545B2 (ja) * | 2011-07-29 | 2016-06-15 | ヤマハ株式会社 | 音声合成装置 |
CN103403797A (zh) * | 2011-08-01 | 2013-11-20 | 松下电器产业株式会社 | 语音合成装置以及语音合成方法 |
JP5817854B2 (ja) * | 2013-02-22 | 2015-11-18 | ヤマハ株式会社 | 音声合成装置およびプログラム |
JP6507579B2 (ja) * | 2014-11-10 | 2019-05-08 | ヤマハ株式会社 | 音声合成方法 |
US10769210B2 (en) | 2017-09-29 | 2020-09-08 | Rovi Guides, Inc. | Recommending results in multiple languages for search queries based on user profile |
US10747817B2 (en) * | 2017-09-29 | 2020-08-18 | Rovi Guides, Inc. | Recommending language models for search queries based on user profile |
JP6547878B1 (ja) * | 2018-06-21 | 2019-07-24 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
JP6610714B1 (ja) * | 2018-06-21 | 2019-11-27 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
JP6610715B1 (ja) * | 2018-06-21 | 2019-11-27 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
JP7059972B2 (ja) | 2019-03-14 | 2022-04-26 | カシオ計算機株式会社 | 電子楽器、鍵盤楽器、方法、プログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BG24190A1 (en) * | 1976-09-08 | 1978-01-10 | Antonov | Method of synthesis of speech and device for effecting same |
JPH0642158B2 (ja) | 1983-11-01 | 1994-06-01 | 日本電気株式会社 | 音声合成装置 |
US6332123B1 (en) * | 1989-03-08 | 2001-12-18 | Kokusai Denshin Denwa Kabushiki Kaisha | Mouth shape synthesizing |
DE19610019C2 (de) | 1996-03-14 | 1999-10-28 | Data Software Gmbh G | Digitales Sprachsyntheseverfahren |
US6029131A (en) * | 1996-06-28 | 2000-02-22 | Digital Equipment Corporation | Post processing timing of rhythm in synthetic speech |
US6064960A (en) * | 1997-12-18 | 2000-05-16 | Apple Computer, Inc. | Method and apparatus for improved duration modeling of phonemes |
US6836761B1 (en) * | 1999-10-21 | 2004-12-28 | Yamaha Corporation | Voice converter for assimilation by frame synthesis with temporal alignment |
JP2001282278A (ja) * | 2000-03-31 | 2001-10-12 | Canon Inc | 音声情報処理装置及びその方法と記憶媒体 |
JP3718116B2 (ja) | 2000-08-31 | 2005-11-16 | コナミ株式会社 | 音声合成装置、音声合成方法及び情報記憶媒体 |
JP3879402B2 (ja) | 2000-12-28 | 2007-02-14 | ヤマハ株式会社 | 歌唱合成方法と装置及び記録媒体 |
JP4067762B2 (ja) | 2000-12-28 | 2008-03-26 | ヤマハ株式会社 | 歌唱合成装置 |
JP3711880B2 (ja) | 2001-03-09 | 2005-11-02 | ヤマハ株式会社 | 音声分析及び合成装置、方法、プログラム |
US20030093280A1 (en) * | 2001-07-13 | 2003-05-15 | Pierre-Yves Oudeyer | Method and apparatus for synthesising an emotion conveyed on a sound |
JP3815347B2 (ja) | 2002-02-27 | 2006-08-30 | ヤマハ株式会社 | 歌唱合成方法と装置及び記録媒体 |
JP4153220B2 (ja) | 2002-02-28 | 2008-09-24 | ヤマハ株式会社 | 歌唱合成装置、歌唱合成方法及び歌唱合成用プログラム |
FR2861491B1 (fr) * | 2003-10-24 | 2006-01-06 | Thales Sa | Procede de selection d'unites de synthese |
-
2004
- 2004-07-15 JP JP2004209033A patent/JP4265501B2/ja not_active Expired - Fee Related
-
2005
- 2005-07-13 EP EP05106399A patent/EP1617408A3/en not_active Ceased
- 2005-07-13 US US11/180,108 patent/US7552052B2/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2645363A1 (en) | 2012-03-28 | 2013-10-02 | Yamaha Corporation | Sound synthesizing apparatus |
US9552806B2 (en) | 2012-03-28 | 2017-01-24 | Yamaha Corporation | Sound synthesizing apparatus |
Also Published As
Publication number | Publication date |
---|---|
US20060015344A1 (en) | 2006-01-19 |
EP1617408A3 (en) | 2007-06-20 |
US7552052B2 (en) | 2009-06-23 |
JP2006030575A (ja) | 2006-02-02 |
EP1617408A2 (en) | 2006-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4265501B2 (ja) | 音声合成装置およびプログラム | |
JP3985814B2 (ja) | 歌唱合成装置 | |
JP6171711B2 (ja) | 音声解析装置および音声解析方法 | |
JP4839891B2 (ja) | 歌唱合成装置および歌唱合成プログラム | |
EP0979503B1 (en) | Targeted vocal transformation | |
JP4207902B2 (ja) | 音声合成装置およびプログラム | |
Cano et al. | Voice Morphing System for Impersonating in Karaoke Applications. | |
JP6561499B2 (ja) | 音声合成装置および音声合成方法 | |
JP2012083722A (ja) | 音声処理装置 | |
CN109416911B (zh) | 声音合成装置及声音合成方法 | |
JP6390690B2 (ja) | 音声合成方法および音声合成装置 | |
JP6756151B2 (ja) | 歌唱合成データ編集の方法および装置、ならびに歌唱解析方法 | |
JP2013238662A (ja) | 音声合成装置 | |
JP2904279B2 (ja) | 音声合成方法および装置 | |
JP2009075611A (ja) | 合唱合成装置、合唱合成方法およびプログラム | |
JP4430174B2 (ja) | 音声変換装置及び音声変換方法 | |
Bonada et al. | Spectral approach to the modeling of the singing voice | |
JP5573529B2 (ja) | 音声処理装置およびプログラム | |
JP6191094B2 (ja) | 音声素片切出装置 | |
Bonada et al. | Sample-based singing voice synthesizer using spectral models and source-filter decomposition | |
JP2004061753A (ja) | 歌唱音声を合成する方法および装置 | |
Bonada et al. | Improvements to a sample-concatenation based singing voice synthesizer | |
Masuda-Katsuse | < PAPERS and REPORTS> KARAOKE SYSTEM AUTOMATICALLY MANIPULATING A SINGING VOICE | |
JP6056190B2 (ja) | 音声合成装置 | |
JPH11352997A (ja) | 音声合成装置およびその制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080908 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081021 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090127 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4265501 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120227 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140227 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |