JP4586386B2 - 素片接続型音声合成装置及び方法 - Google Patents
素片接続型音声合成装置及び方法 Download PDFInfo
- Publication number
- JP4586386B2 JP4586386B2 JP2004073977A JP2004073977A JP4586386B2 JP 4586386 B2 JP4586386 B2 JP 4586386B2 JP 2004073977 A JP2004073977 A JP 2004073977A JP 2004073977 A JP2004073977 A JP 2004073977A JP 4586386 B2 JP4586386 B2 JP 4586386B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- sub
- cost
- unit
- preliminary selection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title description 6
- 238000004364 calculation method Methods 0.000 claims description 49
- 230000015572 biosynthetic process Effects 0.000 claims description 24
- 238000003786 synthesis reaction Methods 0.000 claims description 24
- 238000001308 synthesis method Methods 0.000 claims description 8
- 241000282412 Homo Species 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Description
図1に、本発明の第1の実施の形態に係る音声合成システム20のブロック図を示す。図1を参照して、この音声合成システム20は、従来と同様の音声素片DB34と、合成目標となるテキストを分析した結果得られる合成器指令36を入力として受け、音声素片DB34に含まれる拡張された音声素片から適切な音声素片を選択し接続して合成音声波形40を出力するための音声合成装置38とを含む。
Claims (12)
- 合成音声の目標と音声素片候補との間で、複数のサブコストを含むコストを算出し、当該コストに基づいて音声素片データベースから音声素片を選択し接続することにより音声合成を行なう素片接続型音声合成装置であって、
前記音声素片データベースに含まれる音声素片候補から、前記複数のサブコストのうちの一部のみを用い、2以上の段階に分けて複数の音声素片候補列を選択するための多段予備選択手段と、
前記合成音声の目標との間で、前記複数のサブコストを全て含んで算出されるコストが所定の条件を充足する一つの音声素片候補列を、前記多段予備選択手段により予備的に選択された前記複数の音声素片候補列から選択するための選択手段と、
前記選択手段により選択された音声素片候補列の音声波形を前記合成器指令に従って接続し合成音声波形を出力するための接続手段とを含む、素片接続型音声合成装置。 - 前記多段予備選択手段は、前記音声素片データベースに含まれる音声素片候補から、前記複数のサブコストのうちの一部のみを用い、2以上の段階に分けて、かつ後段の予備選択では前段の予備選択で用いられたサブコストより多数種類のサブコストを用いて予備選択を行なって、複数の音声素片候補列を選択するための手段を含む、請求項1に記載の素片接続型音声合成装置。
- 前記多段予備選択手段は、前記音声素片データベースに含まれる音声素片候補から、前記複数のサブコストのうちの一部のみを用い、2以上の段階に分けて、かつ後段の予備選択では、前段の予備選択で用いられたサブコストより多数種類のサブコストであって、かつ前段の予備選択で用いられたサブコストを含むサブコストを用いて予備選択を行なって、複数の音声素片候補列を選択するための手段を含む、請求項2に記載の素片接続型音声合成装置。
- 前記多段予備選択手段は、
前記合成音声の目標と前記音声素片データベース中の各音声素片候補との間で、第1のサブコストを算出し、算出された第1のサブコストを用いて複数の音声素片候補列を選択するための第1段の予備選択手段と、
前記第1のサブコストと、前記第1のサブコストと異なる第2のサブコストとの双方を用いて、前記第1段の予備選択手段により選択された複数の音声素片候補列の中から複数の音声素片候補列を選択するための第2段の予備選択手段とを含む、請求項1に記載の素片接続型音声合成装置。 - 前記第1段の予備選択手段は、
前記合成音声の目標と前記音声素片データベース中の音声素片候補からなる各音声素片候補列との間で、第1のサブコストを算出するための第1のサブコスト算出手段と、
前記第1のサブコスト算出手段により算出された第1のサブコストを記憶するための第1のサブコスト記憶手段と、
前記第1のサブコスト算出手段により算出された第1のサブコストが所定のしきい値よりも小さな音声素片候補列を選択するための手段とを含む、請求項4に記載の素片接続型音声合成装置。 - 前記多段予備選択手段は、
前記合成音声の目標と前記音声素片データベース中の音声素片候補からなる各音声素片候補列との間で、ターゲットコストのみからなる第1のサブコストを算出し、算出された第1のサブコストを用いて複数の音声素片候補列を選択するための第1段の予備選択手段と、
前記第1のサブコストと、接続コストを含む第2のサブコストとの双方を用いて、前記第1段の予備選択手段により選択された複数の音声素片候補列の中から複数の音声素片候補列を選択するための第2段の予備選択手段とを含む、請求項1に記載の素片接続型音声合成装置。 - 合成音声の目標と音声素片候補との間で、複数のサブコストを含むコストを算出し、当該コストに基づいて音声素片データベースから音声素片を選択し接続することにより音声合成を行なう素片接続型音声合成方法であって、
前記音声素片データベースに含まれる音声素片候補から、前記複数のサブコストのうちの一部のみを用い、2以上の段階に分けて複数の音声素片候補列を選択する多段予備選択ステップと、
前記合成音声の目標との間で、前記複数のサブコストを全て含んで算出されるコストが所定の条件を充足する一つの音声素片候補列を、前記多段予備選択ステップにおいて予備的に選択された前記複数の音声素片候補列から選択する選択ステップと、
前記選択ステップにおいて選択された音声素片候補列の音声波形を前記合成器指令に従って接続し合成音声波形を出力する接続ステップとを含む、素片接続型音声合成方法。 - 前記多段予備選択ステップは、前記音声素片データベースに含まれる音声素片候補から、前記複数のサブコストのうちの一部のみを用い、2以上の段階に分けて、かつ後段の予備選択では前段の予備選択で用いられたサブコストより多数種類のサブコストを用いて予備選択を行なって、複数の音声素片候補列を選択するステップを含む、請求項7に記載の素片接続型音声合成方法。
- 前記多段予備選択ステップは、前記音声素片データベースに含まれる音声素片候補から、前記複数のサブコストのうちの一部のみを用い、2以上の段階に分けて、かつ後段の予備選択では、前段の予備選択で用いられたサブコストより多数種類のサブコストであって、かつ前段の予備選択で用いられたサブコストを含むサブコストを用いて予備選択を行なって、複数の音声素片候補列を選択するステップを含む、請求項8に記載の素片接続型音声合成方法。
- 前記多段予備選択ステップは、
前記合成音声の目標と前記音声素片データベース中の各音声素片候補との間で、第1のサブコストを算出し、算出された第1のサブコストを用いて複数の音声素候補列を選択する第1段の予備選択ステップと、
前記第1のサブコストと、前記第1のサブコストと異なる第2のサブコストとの双方を用いて、前記第1段の予備選択ステップにおいて選択された複数の音声素片候補列の中から複数の音声素片候補列を選択する第2段の予備選択ステップとを含む、請求項7に記載の素片接続型音声合成方法。 - 前記第1段の予備選択ステップは、
前記合成音声の目標と前記音声素片データベース中の音声素片からなる各音声素片候補列との間で、第1のサブコストを算出する第1のサブコスト算出ステップと、
前記第1のサブコスト算出ステップにおいて算出された第1のサブコストを、第1のサブコスト記憶手段に記憶させるステップと、
前記第1のサブコスト算出ステップにおいて算出された第1のサブコストが所定のしきい値よりも小さな音声素片候補列を選択するステップとを含む、請求項10に記載の素片接続型音声合成方法。 - 前記多段予備選択ステップは、
前記合成音声の目標と前記音声素片データベース中の音声素片からなる各音声素片候補列との間で、ターゲットコストのみからなる第1のサブコストを算出し、算出された第1のサブコストを用いて複数の音声素片候補列を選択する第1段の予備選択ステップと、
前記第1のサブコストと、接続コストを含む第2のサブコストとの双方を用いて、前記第1段の予備選択ステップにおいて選択された複数の音声素片候補列の中から複数の音声素片候補列を選択する第2段の予備選択ステップとを含む、請求項7に記載の素片接続型音声合成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004073977A JP4586386B2 (ja) | 2004-03-16 | 2004-03-16 | 素片接続型音声合成装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004073977A JP4586386B2 (ja) | 2004-03-16 | 2004-03-16 | 素片接続型音声合成装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005265895A JP2005265895A (ja) | 2005-09-29 |
JP4586386B2 true JP4586386B2 (ja) | 2010-11-24 |
Family
ID=35090557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004073977A Expired - Lifetime JP4586386B2 (ja) | 2004-03-16 | 2004-03-16 | 素片接続型音声合成装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4586386B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100811226B1 (ko) * | 2006-08-14 | 2008-03-07 | 주식회사 보이스웨어 | 악센트구 매칭 사전선택을 이용한 일본어음성합성방법 및시스템 |
JP4975589B2 (ja) * | 2007-11-07 | 2012-07-11 | 独立行政法人鉄道建設・運輸施設整備支援機構 | 無絶縁軌道回路用保安器 |
KR101227716B1 (ko) * | 2007-11-28 | 2013-01-29 | 닛본 덴끼 가부시끼가이샤 | 음성 합성 장치, 음성 합성 방법 및 음성 합성 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 |
JP5782751B2 (ja) * | 2011-03-07 | 2015-09-24 | ヤマハ株式会社 | 音声合成装置 |
JP6291887B2 (ja) * | 2014-02-14 | 2018-03-14 | カシオ計算機株式会社 | 音声合成装置、方法、およびプログラム |
JP6519097B2 (ja) * | 2014-02-14 | 2019-05-29 | カシオ計算機株式会社 | 音声合成装置、方法、およびプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08248972A (ja) * | 1995-03-10 | 1996-09-27 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 規則音声合成装置 |
JPH08263095A (ja) * | 1995-03-20 | 1996-10-11 | N T T Data Tsushin Kk | 音声素片選択方法および音声合成装置 |
JP2003208188A (ja) * | 2002-01-15 | 2003-07-25 | Advanced Telecommunication Research Institute International | 日本語テキスト音声合成方法 |
-
2004
- 2004-03-16 JP JP2004073977A patent/JP4586386B2/ja not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08248972A (ja) * | 1995-03-10 | 1996-09-27 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 規則音声合成装置 |
JPH08263095A (ja) * | 1995-03-20 | 1996-10-11 | N T T Data Tsushin Kk | 音声素片選択方法および音声合成装置 |
JP2003208188A (ja) * | 2002-01-15 | 2003-07-25 | Advanced Telecommunication Research Institute International | 日本語テキスト音声合成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2005265895A (ja) | 2005-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017213055A1 (ja) | 音声認識装置及びコンピュータプログラム | |
US7869999B2 (en) | Systems and methods for selecting from multiple phonectic transcriptions for text-to-speech synthesis | |
US7454343B2 (en) | Speech synthesizer, speech synthesizing method, and program | |
JP6614639B2 (ja) | 音声認識装置及びコンピュータプログラム | |
US8301445B2 (en) | Speech recognition based on a multilingual acoustic model | |
US6988069B2 (en) | Reduced unit database generation based on cost information | |
US20200410981A1 (en) | Text-to-speech (tts) processing | |
KR100845428B1 (ko) | 휴대용 단말기의 음성 인식 시스템 | |
JPH0772840B2 (ja) | 音声モデルの構成方法、音声認識方法、音声認識装置及び音声モデルの訓練方法 | |
US11763797B2 (en) | Text-to-speech (TTS) processing | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
US20050119883A1 (en) | Speech recognition device and speech recognition method | |
JP2006084715A (ja) | 素片セット作成方法および装置 | |
Nocera et al. | Phoneme lattice based A* search algorithm for speech recognition | |
JP4586386B2 (ja) | 素片接続型音声合成装置及び方法 | |
US20050075876A1 (en) | Continuous speech recognition apparatus, continuous speech recognition method, continuous speech recognition program, and program recording medium | |
JP4533255B2 (ja) | 音声合成装置、音声合成方法、音声合成プログラムおよびその記録媒体 | |
US20090070116A1 (en) | Fundamental frequency pattern generation apparatus and fundamental frequency pattern generation method | |
GB2465383A (en) | A speech recognition system using a plurality of acoustic models which share probability distributions | |
US20050119889A1 (en) | Rule based speech synthesis method and apparatus | |
Shen et al. | Automatic selection of phonetically distributed sentence sets for speaker adaptation with application to large vocabulary Mandarin speech recognition | |
JP2004139033A (ja) | 音声合成方法、音声合成装置および音声合成プログラム | |
KR100259777B1 (ko) | 텍스트/음성변환기에서의최적합성단위열선정방법 | |
JP2008026721A (ja) | 音声認識装置、音声認識方法、および音声認識用プログラム | |
KR100811226B1 (ko) | 악센트구 매칭 사전선택을 이용한 일본어음성합성방법 및시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091028 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100803 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100823 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4586386 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130917 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |