JP4664194B2 - 声質制御装置および方法およびプログラム記憶媒体 - Google Patents
声質制御装置および方法およびプログラム記憶媒体 Download PDFInfo
- Publication number
- JP4664194B2 JP4664194B2 JP2005344737A JP2005344737A JP4664194B2 JP 4664194 B2 JP4664194 B2 JP 4664194B2 JP 2005344737 A JP2005344737 A JP 2005344737A JP 2005344737 A JP2005344737 A JP 2005344737A JP 4664194 B2 JP4664194 B2 JP 4664194B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- unit
- priority
- user
- units
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Description
図1は、本発明の実施の形態1における声質制御装置の構成を示すブロック図である。
実施の形態1では、ユーザが所望する音声素片を時間的に違うタイミングで入力を行っている。しかし、例えば、ユーザが選択する音声素片同士が時間的に近い関係にある場合には次のようなことが発生する場合がある。
変更のタイミングにより優先度が変化するようにする。優先度の変化の方法としては例えば、式4に示す優先度関数を用いる。
入力部106で、優先する音声素片の情報を入力する際に、詳細モードと概略モードの2つのモードを設定する。例えば、一例として、詳細モードでは、ユーザはより微妙なニュアンスまで考慮して音声素片を指定し、概略モードでは、より全体的な大づかみな感覚で音声素片を指定するものとする。これに対し、詳細モードで指定された音声素片は、概略モードで指定された音声素片よりも高いpreferenceを設定する。これにより、詳細モードで入力された音声素片をより優先させることが可能となる。
ステップS07において、入力部106による音声素片の指定の際に優先度をユーザにより入力している場合は、次の方法により優先度を調整することが可能である。
入力部106により指定された素片が、編集開始時点から何度指定されたかを記憶しておき、対立する音声素片同士の変更回数の大小により、優先度を調整する。つまり、変更回数の多い音声素片はユーザの指定の度合いが強いと判断することができるため、変更回数の少ない方の音声素片の優先度を低減する。これにより、変更回数の多い音声素片の優先度を保ち、且つ音声素片間の連続性を保った音声素片系列が選択される。
ステップS03〜ステップS11までをユーザが所望する声質の音声が合成できるまで繰り返す。
実施の形態2では、優先度の調整は入力部106によりユーザが指定した音声素片のみに対して行った。本実施の形態では、ステップS11において、優先度調整部109により調整される音声素片の範囲を入力部106によりユーザが指定した音声素片に類似した音声素片にまで広げる点が実施の形態2と異なる点である。
102 素片選択部
103 合成部
104 ラティス取得部
105 表示部
106 入力部
107 優先度決定部
108 接続歪み検出部
109 優先度調整部
201 素片選択部により選択された音声素片
202 選択の候補となった素片
301 入力部により選択された素片
401 素片選択部による再選択により新しく選択された素片
402 素片選択部による再選択により新しく選択された素片
403 素片選択部による再選択により新しく選択された素片
601 音声素片
602 音声素片
603 閾値
604 音声素片
605 音声素片
801 音声素片
802 音声素片
A01 データ入力部
A02 合成素片保存部
A03 素片選択部
A04 音声合成・再生部
A05 韻律情報変形部
A06 デジタル信号入力部
A07 デジタル信号量監視部
A08 音声合成・再生制御部
Claims (8)
- 音声素片の系列から音声を合成し、合成される音声に含まれる音声素片を、ユーザの指定に従って、異なる声質の音声素片に変更する声質制御装置であって、
少なくとも音韻情報と韻律情報とを含む入力に対して選択の候補となる複数の音声素片を格納する素片記憶手段と、
前記各入力に対して、候補となる複数の音声素片からなる前記各素片群のうちから音声素片系列を、隣接する音声素片間で予め定められた連続性を保って選択する素片選択手段と、
前記素片選択手段によって選択された音声素片の系列から音声を合成してユーザに提示する合成手段と、
前記素片群の中から、前記音声合成された系列に含まれる音声素片よりも優先的に選択されるべき音声素片を指定するためのユーザからの入力を受け付ける入力手段と、
前記ユーザにより指定された音声素片に対して、前記素片選択手段によって選択された音声素片よりも高い優先度を決定する優先度決定手段とを備え、
前記素片選択手段は、前記ユーザにより指定された前記音声素片を、前記優先度決定手段により決定された優先度に基づいて前記素片群の中から再選択し、さらに、その前後の音声素片を前記再選択前と同一の選択を許容して再選択し、
前記声質制御装置は、さらに、
前記ユーザにより順次、指定された複数の音声素片を含む音声素片の系列において、音声素片間の接続歪みを、予め定められた方法で前記音声素片間の連続性を計測することにより検出する接続歪み検出手段と、
前記素片選択手段により音声素片を再選択した後に、前記接続歪み検出手段により、所定の閾値以上の歪みを検出した場合に、前記優先度決定手段により決定された音声素片の優先度を調整する優先度調整手段とを備え、
前記素片選択手段は、調整された優先度に基づいて音声素片をさらに再選択する
ことを特徴とする声質制御装置。 - 前記優先度調整手段は、前記音声素片の系列において、近接して指定された前記各音声素片に対して決定された優先度の大小、前記各音声素片の指定の時間的関係、指定された前記各音声素片の指定回数の少なくとも1つに基づいて、前記優先度を調整する
ことを特徴とする請求項1に記載の声質制御装置。 - 前記優先度調整手段は、時間を変数として優先度を表す関数に基づいて、前記指定の時間的前後に応じた前記各音声素片間の優先度の大小を判定し、優先度が小さいと判定された前記音声素片については、前後の音声素片を含め、優先度が大きいと判定された前記音声素片との接続歪みがより小さくなる音声素片が前記素片群から再選択されるよう前記優先度を調整する
ことを特徴とする請求項2に記載の声質制御装置。 - 前記関数は、正の値を取り、前記変数の一次係数の正負によって単調増加又は単調減少する関数であって、前記一次係数は、前記ユーザの指定が時間的に遅い方を重要視する場合には正の値に、時間的に早い方を重要視する場合には負の値に設定される
ことを特徴とする請求項3に記載の声質制御装置。 - 前記素片記憶手段は、類似度に基づきクラスタリングされた複数の音声素片を格納し、
前記優先度調整手段により調整された優先度が所定の閾値よりも小さい場合には、調整された音声素片が属するクラスタの優先度を、前記優先度調整手段により調整された優先
度とする
ことを特徴とする請求項2に記載の声質制御装置。 - 前記声質制御装置は、さらに、
前記音声合成によりユーザに提示された音声素片の前記系列と、前記系列に含まれる音声素片の選択の候補となった素片群とを表示する表示手段を備え、
前記入力手段は、表示された前記素片群の中から、優先的に選択されるべき音声素片を指定するための入力を受け付ける
ことを特徴とする請求項1に記載の声質制御装置。 - 音声素片の系列から音声を合成し、合成される音声に含まれる音声素片を、ユーザの指定に従って、異なる声質の音声素片に変更する声質制御方法であって、
少なくとも音韻情報と韻律情報とを含む入力に対して選択の候補となる複数の音声素片を格納する素片記憶ステップと、
前記各入力に対して、候補となる複数の音声素片からなる前記各素片群のうちから音声素片系列を、隣接する音声素片間で予め定められた連続性を保って選択する素片選択ステップと、
前記素片選択ステップによって選択された音声素片の系列から音声を合成してユーザに提示する合成ステップと、
前記素片群の中から、前記音声合成された系列に含まれる音声素片よりも優先的に選択されるべき音声素片を指定するためのユーザからの入力を受け付ける入力ステップと、
前記ユーザにより指定された音声素片に対して、前記素片選択手段によって選択された音声素片よりも高い優先度を決定する優先度決定ステップとを含み、
前記素片選択ステップでは、前記ユーザにより指定された前記音声素片を、前記優先度決定ステップにより決定された優先度に基づいて前記素片群の中から再選択し、さらに、その前後の音声素片を前記再選択前と同一の選択を許容して再選択し、
前記声質制御方法は、さらに、
前記ユーザにより順次、指定された複数の音声素片を含む音声素片の系列において、音声素片間の接続歪みを、予め定められた方法で前記音声素片間の連続性を計測することにより検出する接続歪み検出ステップと、
前記素片選択ステップにより音声素片を再選択した後に、前記接続歪み検出ステップにより、所定の閾値以上の歪みを検出した場合に、前記優先度決定ステップにより決定された音声素片の優先度を調整する優先度調整ステップとを含み、
前記素片選択ステップでは、調整された優先度に基づいて音声素片をさらに再選択する
ことを特徴とする声質制御方法。 - 音声素片の系列から音声を合成し、合成される音声に含まれる音声素片を、ユーザの指定に従って、異なる声質の音声素片に変更する声質制御装置のためのプログラムであって、
コンピュータに、少なくとも音韻情報と韻律情報とを含む入力に対して選択の候補となる複数の音声素片を格納する素片記憶ステップと、前記各入力に対して、候補となる複数の音声素片からなる前記各素片群のうちから音声素片系列を、隣接する音声素片間で予め定められた連続性を保って選択する素片選択ステップと、前記素片選択ステップによって選択された音声素片の系列から音声を合成してユーザに提示する合成ステップと、前記素片群の中から、前記音声合成された系列に含まれる音声素片よりも優先的に選択されるべき音声素片を指定するためのユーザからの入力を受け付ける入力ステップと、前記ユーザにより指定された音声素片に対して、前記素片選択手段によって選択された音声素片よりも高い優先度を決定する優先度決定ステップとを含み、前記素片選択ステップでは、前記ユーザにより指定された前記音声素片を、前記優先度決定ステップにより決定された優先度に基づいて前記素片群の中から再選択し、さらに、その前後の音声素片を前記再選択前と同一の選択を許容して再選択し、さらに、
前記ユーザにより順次、指定された複数の音声素片を含む音声素片の系列において、音声素片間の接続歪みを、予め定められた方法で前記音声素片間の連続性を計測することにより検出する接続歪み検出ステップと、前記素片選択ステップにより音声素片を再選択した後に、前記接続歪み検出ステップにより、所定の閾値以上の歪みを検出した場合に、前記優先度決定ステップにより決定された音声素片の優先度を調整する優先度調整ステップとを含み、前記素片選択ステップでは、調整された優先度に基づいて音声素片をさらに再選択することを実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005344737A JP4664194B2 (ja) | 2005-11-29 | 2005-11-29 | 声質制御装置および方法およびプログラム記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005344737A JP4664194B2 (ja) | 2005-11-29 | 2005-11-29 | 声質制御装置および方法およびプログラム記憶媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2007148172A JP2007148172A (ja) | 2007-06-14 |
JP2007148172A5 JP2007148172A5 (ja) | 2008-12-25 |
JP4664194B2 true JP4664194B2 (ja) | 2011-04-06 |
Family
ID=38209625
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005344737A Expired - Fee Related JP4664194B2 (ja) | 2005-11-29 | 2005-11-29 | 声質制御装置および方法およびプログラム記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4664194B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5198200B2 (ja) * | 2008-09-25 | 2013-05-15 | 株式会社東芝 | 音声合成装置及び方法 |
JP2011180368A (ja) * | 2010-03-01 | 2011-09-15 | Fujitsu Ltd | 合成音声修正装置および合成音声修正方法 |
JP5123347B2 (ja) | 2010-03-31 | 2013-01-23 | 株式会社東芝 | 音声合成装置 |
JP5648347B2 (ja) * | 2010-07-14 | 2015-01-07 | ヤマハ株式会社 | 音声合成装置 |
KR101201913B1 (ko) * | 2010-11-08 | 2012-11-15 | 주식회사 보이스웨어 | 사용자의 후보 합성단위 선택에 의한 음성 합성 방법 및 시스템 |
JP5712818B2 (ja) * | 2011-06-30 | 2015-05-07 | 富士通株式会社 | 音声合成装置、音質修正方法およびプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09319394A (ja) * | 1996-03-12 | 1997-12-12 | Toshiba Corp | 音声合成方法 |
JP2002055693A (ja) * | 2000-08-10 | 2002-02-20 | Sanyo Electric Co Ltd | 音声合成方法 |
JP2004145015A (ja) * | 2002-10-24 | 2004-05-20 | Fujitsu Ltd | テキスト音声合成システム及び方法 |
JP2004246129A (ja) * | 2003-02-14 | 2004-09-02 | Arcadia:Kk | 音声合成制御装置 |
JP2005181998A (ja) * | 2003-11-28 | 2005-07-07 | Matsushita Electric Ind Co Ltd | 音声合成装置および音声合成方法 |
-
2005
- 2005-11-29 JP JP2005344737A patent/JP4664194B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09319394A (ja) * | 1996-03-12 | 1997-12-12 | Toshiba Corp | 音声合成方法 |
JP2002055693A (ja) * | 2000-08-10 | 2002-02-20 | Sanyo Electric Co Ltd | 音声合成方法 |
JP2004145015A (ja) * | 2002-10-24 | 2004-05-20 | Fujitsu Ltd | テキスト音声合成システム及び方法 |
JP2004246129A (ja) * | 2003-02-14 | 2004-09-02 | Arcadia:Kk | 音声合成制御装置 |
JP2005181998A (ja) * | 2003-11-28 | 2005-07-07 | Matsushita Electric Ind Co Ltd | 音声合成装置および音声合成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2007148172A (ja) | 2007-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3913770B2 (ja) | 音声合成装置および方法 | |
JP4664194B2 (ja) | 声質制御装置および方法およびプログラム記憶媒体 | |
EP1455340A1 (en) | Singing voice synthesizing apparatus with selective use of templates for attack and non-attack notes | |
JP4783608B2 (ja) | 対話方法、対話装置、対話プログラムおよび記録媒体 | |
WO2017033612A1 (ja) | 表示制御方法および合成音声編集装置 | |
JP2008107454A (ja) | 音声合成装置 | |
JP2008249808A (ja) | 音声合成装置、音声合成方法及びプログラム | |
US20160133246A1 (en) | Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program recorded thereon | |
JP4639932B2 (ja) | 音声合成装置 | |
JP2011186143A (ja) | ユーザ挙動を学習する音声合成装置、音声合成方法およびそのためのプログラム | |
US9020821B2 (en) | Apparatus and method for editing speech synthesis, and computer readable medium | |
JP2001109500A (ja) | 音声合成装置および方法 | |
JP2007148172A5 (ja) | ||
US20080177548A1 (en) | Speech Synthesis Method and Apparatus | |
JP2001272991A (ja) | 音声対話方法及び音声対話装置 | |
JP5712818B2 (ja) | 音声合成装置、音質修正方法およびプログラム | |
JP5106274B2 (ja) | 音声処理装置、音声処理方法及びプログラム | |
JP5275470B2 (ja) | 音声合成装置およびプログラム | |
JP4846548B2 (ja) | 音声情報選択装置及び音声情報選択方法 | |
JP2006106334A (ja) | 歌詞表示方法および装置 | |
WO2013011634A1 (ja) | 波形処理装置、波形処理方法および波形処理プログラム | |
JP3892691B2 (ja) | 音声合成方法及びその装置並びに音声合成プログラム | |
JP2013195928A (ja) | 音声素片切出装置 | |
JP2007025338A (ja) | 音声合成方法,音声合成装置,およびコンピュータプログラム | |
US20230419929A1 (en) | Signal processing system, signal processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081110 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4664194 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140114 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |