JP2000075878A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2000075878A5 JP2000075878A5 JP1998245951A JP24595198A JP2000075878A5 JP 2000075878 A5 JP2000075878 A5 JP 2000075878A5 JP 1998245951 A JP1998245951 A JP 1998245951A JP 24595198 A JP24595198 A JP 24595198A JP 2000075878 A5 JP2000075878 A5 JP 2000075878A5
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- piece data
- phoneme piece
- penalty
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002194 synthesizing Effects 0.000 claims description 12
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 238000003786 synthesis reaction Methods 0.000 claims description 6
- 238000000034 method Methods 0.000 claims description 2
- 238000001308 synthesis method Methods 0.000 claims description 2
Description
【0007】
【課題を解決するための手段】
上記の目的を達成するための本発明の一態様である音声合成装置は、たとえば以下の構成を備える。すなわち、
音素片データを格納する格納手段と、
与えられた検索条件に基づいて前記格納手段から音素片データを検索する検索手段と、
前記検索手段で検索された音素片データに対して、該音素片データの属性情報の少なくとも一部に基づくペナルティを付加する付加手段と、
前記付加手段で付加されたペナルティに基づいて、前記検索手段で検索された音素片データから音声波形の合成に採用する音素片データを選択する選択手段とを備える。
【課題を解決するための手段】
上記の目的を達成するための本発明の一態様である音声合成装置は、たとえば以下の構成を備える。すなわち、
音素片データを格納する格納手段と、
与えられた検索条件に基づいて前記格納手段から音素片データを検索する検索手段と、
前記検索手段で検索された音素片データに対して、該音素片データの属性情報の少なくとも一部に基づくペナルティを付加する付加手段と、
前記付加手段で付加されたペナルティに基づいて、前記検索手段で検索された音素片データから音声波形の合成に採用する音素片データを選択する選択手段とを備える。
また、上記の目的を達成するための本発明の他の態様による音声合成方法は、たとえば以下の工程を備える。すなわち、
与えられた検索条件に基づいて、音素片データを格納する格納手段から音素片データを検索する検索工程と、
前記検索工程で検索された音素片データに対して、該音素片データの属性情報の少なくとも一部に基づくペナルティを付加する付加工程と、
前記付加工程で付加されたペナルティに基づいて、前記検索工程で検索された音素片データから音声波形の合成に採用する音素片データを選択する選択工程とを備える。
与えられた検索条件に基づいて、音素片データを格納する格納手段から音素片データを検索する検索工程と、
前記検索工程で検索された音素片データに対して、該音素片データの属性情報の少なくとも一部に基づくペナルティを付加する付加工程と、
前記付加工程で付加されたペナルティに基づいて、前記検索工程で検索された音素片データから音声波形の合成に採用する音素片データを選択する選択工程とを備える。
また、上記の目的を達成するための本発明の他の態様による記憶媒体は、
コンピュータに、格納手段に格納された属性情報が付加された音素片データを用いて音声波形を合成させるための制御プログラムを格納した記憶媒体であって、
与えられた検索条件に基づいて、前記格納手段から音素片データを検索する検索工程のコードと、
前記検索工程で検索された音素片データに対して、該音素片データの属性情報の少なくとも一部に基づくペナルティを付加する付加工程のコードと、
前記付加工程で付加されたペナルティに基づいて、前記検索工程で検索された音素片データから音声波形の合成に採用する音素片データを選択する選択工程のコードとを備える。
コンピュータに、格納手段に格納された属性情報が付加された音素片データを用いて音声波形を合成させるための制御プログラムを格納した記憶媒体であって、
与えられた検索条件に基づいて、前記格納手段から音素片データを検索する検索工程のコードと、
前記検索工程で検索された音素片データに対して、該音素片データの属性情報の少なくとも一部に基づくペナルティを付加する付加工程のコードと、
前記付加工程で付加されたペナルティに基づいて、前記検索工程で検索された音素片データから音声波形の合成に採用する音素片データを選択する選択工程のコードとを備える。
Claims (9)
- 音素片データを格納する格納手段と、
与えられた検索条件に基づいて前記格納手段から音素片データを検索する検索手段と、
前記検索手段で検索された音素片データに対して、該音素片データの属性情報の少なくとも一部に基づくペナルティを付加する付加手段と、
前記付加手段で付加されたペナルティに基づいて、前記検索手段で検索された音素片データから音声波形の合成に採用する音素片データを選択する選択手段とを備えることを特徴とする音声合成装置。 - 前記属性情報は、音素ラベル、音素境界、基本周波数、パワー、音素時間長情報を含むことを特徴とする請求項1記載の音声合成装置。
- 前記検索手段は、特定の音素環境を満足する音素片データを検索することを特徴とする請求項1記載の音声合成装置。
- 前記検索手段は、特定の音素環境と基本周波数を満足する音素片データを検索することを特徴とする請求項2記載の音声合成装置。
- 前記付加手段は、各音素片データのパワー及び音素時間長に関してペナルティを付加することを特徴とする請求項2に記載の音声合成装置。
- 前記付加手段は、各音素片データを、パワーの大きさの順にソーティングし、平均値に近いものに小さいペナルティが付加されるように、ソーティングされた順位に基づいてパワーに関するペナルティを付加し、
各音素片データを、音素時間長の長さの順にソーティングし、平均値に近いものに小さいペナルティが付加されるように、ソーティングされた順位に基づいて音素時間長に関するペナルティを付加することを特徴とする請求項5に記載の音声合成装置。 - 前記検索手段における特定の音素環境を満足する音素片データが存在しない場合に、該音素環境の一部を満足する音素片データを検索する代替検索手段と、
前記代替検索手段によって検索された音素片データの音素環境毎に、音素片データの数を計数する計数手段とさらに備え、
前記付加手段は、代替検索手段で検索された音素片データに、前記属性情報の少なくとも一部に基づいてペナルティを付加するとともに、前記計数手段で得られた数値に基づいてペナルティを付加することを特徴とする請求項1に記載の音声合成装置。 - 与えられた検索条件に基づいて、音素片データを格納する格納手段から音素片データを検索する検索工程と、
前記検索工程で検索された音素片データに対して、該音素片データの属性情報の少なくとも一部に基づくペナルティを付加する付加工程と、
前記付加工程で付加されたペナルティに基づいて、前記検索工程で検索された音素片データから音声波形の合成に採用する音素片データを選択する選択工程とを備えることを特徴とする音声合成方法。 - コンピュータに、格納手段に格納された属性情報が付加された音素片データを用いて音声波形を合成させるための制御プログラムを格納した記憶媒体であって、
与えられた検索条件に基づいて、前記格納手段から音素片データを検索する検索工程のコードと、
前記検索工程で検索された音素片データに対して、該音素片データの属性情報の少なくとも一部に基づくペナルティを付加する付加工程のコードと、
前記付加工程で付加されたペナルティに基づいて、前記検索工程で検索された音素片データから音声波形の合成に採用する音素片データを選択する選択工程のコードとを備えることを特徴とする記憶媒体。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10245951A JP2000075878A (ja) | 1998-08-31 | 1998-08-31 | 音声合成装置およびその方法ならびに記憶媒体 |
US09/386,052 US7031919B2 (en) | 1998-08-31 | 1999-08-30 | Speech synthesizing apparatus and method, and storage medium therefor |
DE69908723T DE69908723T2 (de) | 1998-08-31 | 1999-08-31 | Verfahren und Vorrichtung zur Sprachsynthese, sowie Speichermedium |
EP99306925A EP0984426B1 (en) | 1998-08-31 | 1999-08-31 | Speech synthesizing apparatus and method, and storage medium therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10245951A JP2000075878A (ja) | 1998-08-31 | 1998-08-31 | 音声合成装置およびその方法ならびに記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000075878A JP2000075878A (ja) | 2000-03-14 |
JP2000075878A5 true JP2000075878A5 (ja) | 2005-04-07 |
Family
ID=17141289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10245951A Pending JP2000075878A (ja) | 1998-08-31 | 1998-08-31 | 音声合成装置およびその方法ならびに記憶媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7031919B2 (ja) |
EP (1) | EP0984426B1 (ja) |
JP (1) | JP2000075878A (ja) |
DE (1) | DE69908723T2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7369994B1 (en) | 1999-04-30 | 2008-05-06 | At&T Corp. | Methods and apparatus for rapid acoustic unit selection from a large speech corpus |
US6684187B1 (en) | 2000-06-30 | 2004-01-27 | At&T Corp. | Method and system for preselection of suitable units for concatenative speech |
US6505158B1 (en) * | 2000-07-05 | 2003-01-07 | At&T Corp. | Synthesis-based pre-selection of suitable units for concatenative speech |
US7263488B2 (en) | 2000-12-04 | 2007-08-28 | Microsoft Corporation | Method and apparatus for identifying prosodic word boundaries |
US6978239B2 (en) * | 2000-12-04 | 2005-12-20 | Microsoft Corporation | Method and apparatus for speech synthesis without prosody modification |
EP1777697B1 (en) * | 2000-12-04 | 2013-03-20 | Microsoft Corporation | Method for speech synthesis without prosody modification |
US7209882B1 (en) | 2002-05-10 | 2007-04-24 | At&T Corp. | System and method for triphone-based unit selection for visual speech synthesis |
US7496498B2 (en) | 2003-03-24 | 2009-02-24 | Microsoft Corporation | Front-end architecture for a multi-lingual text-to-speech system |
FR2861491B1 (fr) * | 2003-10-24 | 2006-01-06 | Thales Sa | Procede de selection d'unites de synthese |
JP4829605B2 (ja) * | 2005-12-12 | 2011-12-07 | 日本放送協会 | 音声合成装置および音声合成プログラム |
JP4241762B2 (ja) | 2006-05-18 | 2009-03-18 | 株式会社東芝 | 音声合成装置、その方法、及びプログラム |
JP5449022B2 (ja) * | 2010-05-14 | 2014-03-19 | 日本電信電話株式会社 | 音声素片データベース作成装置、代替音声モデル作成装置、音声素片データベース作成方法、代替音声モデル作成方法、プログラム |
WO2016200391A1 (en) * | 2015-06-11 | 2016-12-15 | Interactive Intelligence Group, Inc. | System and method for outlier identification to remove poor alignments in speech synthesis |
US9972300B2 (en) | 2015-06-11 | 2018-05-15 | Genesys Telecommunications Laboratories, Inc. | System and method for outlier identification to remove poor alignments in speech synthesis |
US11636850B2 (en) * | 2020-05-12 | 2023-04-25 | Wipro Limited | Method, system, and device for performing real-time sentiment modulation in conversation systems |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4979216A (en) | 1989-02-17 | 1990-12-18 | Malsheen Bathsheba J | Text to speech synthesis system and method using context dependent vowel allophones |
JP2782147B2 (ja) * | 1993-03-10 | 1998-07-30 | 日本電信電話株式会社 | 波形編集型音声合成装置 |
US5751907A (en) * | 1995-08-16 | 1998-05-12 | Lucent Technologies Inc. | Speech synthesizer having an acoustic element database |
GB2313530B (en) | 1996-05-15 | 1998-03-25 | Atr Interpreting Telecommunica | Speech synthesizer apparatus |
US6188984B1 (en) * | 1998-11-17 | 2001-02-13 | Fonix Corporation | Method and system for syllable parsing |
-
1998
- 1998-08-31 JP JP10245951A patent/JP2000075878A/ja active Pending
-
1999
- 1999-08-30 US US09/386,052 patent/US7031919B2/en not_active Expired - Fee Related
- 1999-08-31 DE DE69908723T patent/DE69908723T2/de not_active Expired - Lifetime
- 1999-08-31 EP EP99306925A patent/EP0984426B1/en not_active Expired - Lifetime
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000075878A5 (ja) | ||
CN102549652B (zh) | 信息检索装置 | |
US5963957A (en) | Bibliographic music data base with normalized musical themes | |
KR970029146A (ko) | 래티스를 키로 하여 검색을 행하는 사전 검색 장치 및 방법 | |
CA2007285A1 (en) | Method for use of morphological information to cross reference keywords used for information retrieval | |
JPH10274997A (ja) | 文書読み上げ装置 | |
CA2321112A1 (en) | Information retrieval and speech recognition based on language models | |
KR970017169A (ko) | 음악데이터처리시스템 및 방법 | |
US7139712B1 (en) | Speech synthesis apparatus, control method therefor and computer-readable memory | |
US7031919B2 (en) | Speech synthesizing apparatus and method, and storage medium therefor | |
JP3770919B2 (ja) | ファイル処理方法、データ処理装置及び記憶媒体 | |
Cassidy | Compiling multi-tiered speech databases into the relational model: Experiments with the EMU system | |
JPH0675994A (ja) | 文字列照合装置 | |
EP1062656B1 (en) | Method for automatically controlling electronic musical devices by means of real-time construction and search of a multi-level data structure | |
EP1315096B1 (en) | Method and apparatus for retrieving relevant information | |
JP3489331B2 (ja) | 情報選択音声出力装置 | |
JP2003337825A (ja) | オンラインデータベースによる情報供給方法 | |
JP2001134584A (ja) | 類似データの検索方法,検索装置および類似データ検索プログラム記録媒体 | |
JPH09245045A (ja) | 鍵検索方法および装置 | |
JP4430960B2 (ja) | 音声素片探索用データベース構成方法およびこれを実施する装置、音声素片探索方法、音声素片探索プログラムおよびこれを記憶する記憶媒体 | |
JPH07210565A (ja) | 情報検索方法及び装置 | |
JP2002108844A (ja) | Xmlデータ分割編集装置 | |
KR20030006638A (ko) | 셀 기반의 고차원 데이터 색인 장치 및 그 방법 | |
JPS59100939A (ja) | 日本語入力装置 | |
JPH09330322A (ja) | データ検索装置 |