JP2009020264A - 音声合成装置及び音声合成方法並びにプログラム - Google Patents
音声合成装置及び音声合成方法並びにプログラム Download PDFInfo
- Publication number
- JP2009020264A JP2009020264A JP2007182081A JP2007182081A JP2009020264A JP 2009020264 A JP2009020264 A JP 2009020264A JP 2007182081 A JP2007182081 A JP 2007182081A JP 2007182081 A JP2007182081 A JP 2007182081A JP 2009020264 A JP2009020264 A JP 2009020264A
- Authority
- JP
- Japan
- Prior art keywords
- prosody
- voice
- section
- speech
- real voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】録音音声格納手段、入力テキスト解析手段、録音音声選択手段、接続境界算出手段、規則合成手段、接続合成手段に加えて、合成音声区間のうちで録音済みの肉声と部分的に一致する区間を決定する肉声韻律区間決定手段と、その一致部分の肉声韻律を抽出する肉声韻律抽出手段と、抽出された肉声韻律を使って合成音声区間全体の韻律情報を生成するハイブリッド韻律生成手段を備える。
【選択図】図2
Description
次に本発明を、カーナビゲーションシステムに特化した場合の実施形態について説明する。
次に、図19を用いて、本発明をユーザインタフェースを備えたハイブリッド合成音声の編集ツールとして実施した場合の実施形態について説明する。
30 録音音声格納部
40 録音音声選択部
50 接続境界算出部
60 肉声韻律区間決定部
70 肉声韻律抽出部
80 ハイブリッド韻律生成部
90 接続合成部
100 規則合成部
110 音声素片データベース
120 韻律モデル
130 ハイブリッド合成音声
200 録音音声ID
210 録音音声テキスト
220 録音音声ファイル
230 録音音声発音テキスト
Claims (17)
- 音声に変換するテキストを受け付けて発音テキストに変換する入力テキスト解析部と、
予め設定された文書を肉声により記録した肉声データと前記文章を予め格納する録音音声格納部と、
前記録音音声格納部に格納された文章と前記発音テキストを比較して、音声合成に使用する肉声データ及び文章を録音音声格納部から選択する録音音声選択部と、
前記発音テキストと前記選択された文章から音声合成により音声を生成する合成音声区間と前記肉声データから音声を生成する肉声区間との境目を決定する接続境界算出部と、
前記決定された合成音声区間に基づいて、予め設定された音声素片と韻律モデルにより音声合成データを生成する規則合成部と、
前記肉声区間に対応する肉声データと、前記生成された音声合成データとを接続して入力されたテキストに対応する合成音声文章を生成する接続合成部と、を備えたハイブリッド音声合成装置において、
前記接続境界算出部で決定された合成音声を使用する合成音声区間において前記肉声データの韻律を使用する肉声韻律区間を決定する肉声韻律区間決定部と、
前記肉声韻律区間決定部で決定された前記区間の韻律を前記選択した肉声データから抽出する肉声韻律抽出部と、
前記抽出された肉声による韻律と、前記韻律モデルから合成音声区間全体の韻律情報を生成するハイブリッド韻律生成部と、を備え、
前記規則合成部は、
前記合成音声区間ついて、前記音声素片と前記韻律情報により音声合成データを生成することを特徴とするハイブリッド音声合成装置。 - 前記肉声韻律区間決定部は、
前記発音テキストと前記選択された文章の比較を行う際に、音節単位での最長一致に基づいて前記肉声データの韻律を使用する箇所を決定することを特徴とする請求項1に記載のハイブリッド音声合成装置。 - 前記肉声韻律区間決定部は、
前記発音テキストと前記選択された文章の比較を行う際に、音素単位での最長一致に基づいて前記肉声データの韻律を使用する箇所を決定することを特徴とする請求項1に記載のハイブリッド音声合成装置。 - 前記肉声韻律区間決定部は、
前記音節または音素に付随する言語情報の一致に基づいて肉声データの韻律を用いる区間を決定することを特徴とする請求項2または請求項3に記載のハイブリッド音声合成装置。 - 前記言語情報は、アクセント核の位置情報であることを特徴とする請求項4に記載のハイブリッド音声合成装置。
- 前記接続境界算出部は、
前記合成音声区間と肉声区間との境目に関する情報を受け付けて、当該情報に基づいて前記境目を決定することを特徴とする請求項1ないし請求項5のいずれかひとつに記載のハイブリッド音声合成装置。 - 前記接続境界算出部は、
前記合成音声区間と肉声区間との境目に関する情報を受け付けて、当該情報に基づいて前記境目を決定し、
前記肉声韻律区間決定部は、
前記合成音声区間において前記肉声データの韻律を使用する肉声韻律区間に関する情報を受け付けて当該情報に基づいて前記肉声韻律区間を決定することを特徴とする請求項1ないし請求項5のいずれかひとつに記載のハイブリッド音声合成装置。 - 前記ハイブリッド韻律生成部は、
前記合成音声区間のうち、前記肉声韻律区間については前記音声素片と前記抽出された肉声による韻律を設定し、前記肉声韻律区間を除く合成音声区間については前記韻律モデルの韻律を設定して、当該合成音声区間全体の韻律情報を生成することを特徴とする請求項1に記載のハイブリッド音声合成装置。 - 音声に変換するテキストを受け付けて発音テキストに変換する入力テキスト解析処理と、
予め設定された文書を肉声により記録した肉声データと前記文章を予め格納した録音音声格納部の前記文章と前記発音テキストを比較して、音声合成に使用する肉声データ及び文章を前記録音音声格納部から選択する録音音声選択処理と、
前記発音テキストと前記選択された文章から音声合成により音声を生成する合成音声区間と前記肉声データから音声を生成する肉声区間との境目を決定する接続境界算出処理と、
前記決定された合成音声区間に基づいて、予め設定された音声素片と韻律モデルにより音声合成データを生成する規則合成処理と、
前記肉声区間に対応する肉声データと、前記生成された音声合成データとを接続して入力されたテキストに対応する合成音声文章を生成する接続合成処理と、を計算機で実行すことにより合成音声文章を生成するハイブリッド音声合成方法において、
前記接続境界算出処理で決定された合成音声を使用する合成音声区間において前記肉声データの韻律を使用する肉声韻律区間を決定する肉声韻律区間決定処理と、
前記肉声韻律区間決定処理で決定された前記区間の韻律を前記選択した肉声データから抽出する肉声韻律抽出処理と、
前記抽出された肉声による韻律と、前記韻律モデルから合成音声区間全体の韻律情報を生成するハイブリッド韻律生成処理と、を備え、
前記規則合成処理は、
前記合成音声区間ついて、前記音声素片と前記韻律情報により音声合成データを生成する処理を含むことを特徴とするハイブリッド音声合成方法。 - 前記肉声韻律区間決定処理は、
前記発音テキストと前記選択された文章の比較を行う際に、音節単位での最長一致に基づいて前記肉声データの韻律を使用する箇所を決定することを特徴とする請求項9に記載のハイブリッド音声合成方法。 - 前記肉声韻律区間決定処理は、
前記発音テキストと前記選択された文章の比較を行う際に、音素単位での最長一致に基づいて前記肉声データの韻律を使用する箇所を決定することを特徴とする請求項9に記載のハイブリッド音声合成方法。 - 前記肉声韻律区間決定処理は、
前記音節または音素に付随する言語情報の一致に基づいて肉声データの韻律を用いる区間を決定することを特徴とする請求項10または請求項11に記載のハイブリッド音声合成方法。 - 前記言語情報は、アクセント核の位置情報であることを特徴とする請求項12に記載のハイブリッド音声合成方法。
- 前記接続境界算出処理は、
前記合成音声区間と肉声区間との境目に関する情報を受け付けて、当該情報に基づいて前記境目を決定することを特徴とする請求項9ないし請求項13のいずれかひとつに記載のハイブリッド音声合成方法。 - 前記接続境界算出処理は、
前記合成音声区間と肉声区間との境目に関する情報を受け付けて、当該情報に基づいて前記境目を決定し、
前記肉声韻律区間決定処理は、
前記合成音声区間において前記肉声データの韻律を使用する肉声韻律区間に関する情報を受け付けて当該情報に基づいて前記肉声韻律区間を決定することを特徴とする請求項9ないし請求項13のいずれかひとつに記載のハイブリッド音声合成方法。 - 前記ハイブリッド韻律生成処理は、
前記合成音声区間のうち、前記肉声韻律区間については前記音声素片と前記抽出された肉声による韻律を設定し、前記肉声韻律区間を除く合成音声区間については前記韻律モデルの韻律を設定して、当該合成音声区間全体の韻律情報を生成することを特徴とする請求項9に記載のハイブリッド音声合成方法。 - 受け付けたテキストを合成音声に変換するプログラムであって、
音声に変換するテキストを受け付けて発音テキストに変換する入力テキスト解析処理と、
予め設定された文書を肉声により記録した肉声データと前記文章を予め格納した録音音声格納部の前記文章と前記発音テキストを比較して、音声合成に使用する肉声データ及び文章を前記録音音声格納部から選択する録音音声選択処理と、
前記発音テキストと前記選択された文章から音声合成により音声を生成する合成音声区間と前記肉声データから音声を生成する肉声区間との境目を決定する接続境界算出処理と、
前記接続境界算出処理で決定された合成音声を使用する合成音声区間において前記肉声データの韻律を使用する肉声韻律区間を決定する肉声韻律区間決定処理と、
前記肉声韻律区間決定処理で決定された前記区間の韻律を前記選択した肉声データから抽出する肉声韻律抽出処理と、
前記抽出された肉声による韻律と、前記韻律モデルから合成音声区間全体の韻律情報を生成するハイブリッド韻律生成処理と、
前記決定された合成音声区間に基づいて、予め設定された音声素片と前記韻律情報により音声合成データを生成する規則合成処理と、
前記肉声区間に対応する肉声データと、前記生成された音声合成データとを接続して入力されたテキストに対応する合成音声文章を生成する接続合成処理と、を計算機に機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007182081A JP4964695B2 (ja) | 2007-07-11 | 2007-07-11 | 音声合成装置及び音声合成方法並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007182081A JP4964695B2 (ja) | 2007-07-11 | 2007-07-11 | 音声合成装置及び音声合成方法並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009020264A true JP2009020264A (ja) | 2009-01-29 |
JP4964695B2 JP4964695B2 (ja) | 2012-07-04 |
Family
ID=40359959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007182081A Expired - Fee Related JP4964695B2 (ja) | 2007-07-11 | 2007-07-11 | 音声合成装置及び音声合成方法並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4964695B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013054839A1 (ja) | 2011-10-14 | 2013-04-18 | サイバーアイ・エンタテインメント株式会社 | 画像認識システムを備えた知識情報処理サーバシステム |
WO2016103652A1 (ja) * | 2014-12-24 | 2016-06-30 | 日本電気株式会社 | 音声処理装置、音声処理方法、および記録媒体 |
CN111583901A (zh) * | 2020-04-02 | 2020-08-25 | 湖南声广信息科技有限公司 | 一种广播电台智能天气预报系统及天气预报语音切分方法 |
CN112185417A (zh) * | 2020-10-21 | 2021-01-05 | 平安科技(深圳)有限公司 | 人工合成语音检测方法、装置、计算机设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0527789A (ja) * | 1991-07-24 | 1993-02-05 | Matsushita Electric Ind Co Ltd | 音声合成装置 |
JPH1138989A (ja) * | 1997-07-14 | 1999-02-12 | Toshiba Corp | 音声合成装置及び方法 |
JPH11249677A (ja) * | 1998-03-02 | 1999-09-17 | Hitachi Ltd | 音声合成装置の韻律制御方法 |
JPH11338488A (ja) * | 1998-05-26 | 1999-12-10 | Ricoh Co Ltd | 音声合成装置及び音声合成方法 |
JP2002169581A (ja) * | 2000-11-29 | 2002-06-14 | Matsushita Electric Ind Co Ltd | 音声合成方法およびその装置 |
JP2004233774A (ja) * | 2003-01-31 | 2004-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法及び装置、並びに音声合成プログラム |
JP2005018037A (ja) * | 2003-06-05 | 2005-01-20 | Kenwood Corp | 音声合成装置、音声合成方法及びプログラム |
JP2005321520A (ja) * | 2004-05-07 | 2005-11-17 | Mitsubishi Electric Corp | 音声合成装置及びそのプログラム |
JP2007212884A (ja) * | 2006-02-10 | 2007-08-23 | Fujitsu Ltd | 音声合成装置、音声合成方法、及びコンピュータプログラム |
-
2007
- 2007-07-11 JP JP2007182081A patent/JP4964695B2/ja not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0527789A (ja) * | 1991-07-24 | 1993-02-05 | Matsushita Electric Ind Co Ltd | 音声合成装置 |
JPH1138989A (ja) * | 1997-07-14 | 1999-02-12 | Toshiba Corp | 音声合成装置及び方法 |
JPH11249677A (ja) * | 1998-03-02 | 1999-09-17 | Hitachi Ltd | 音声合成装置の韻律制御方法 |
JPH11338488A (ja) * | 1998-05-26 | 1999-12-10 | Ricoh Co Ltd | 音声合成装置及び音声合成方法 |
JP2002169581A (ja) * | 2000-11-29 | 2002-06-14 | Matsushita Electric Ind Co Ltd | 音声合成方法およびその装置 |
JP2004233774A (ja) * | 2003-01-31 | 2004-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法及び装置、並びに音声合成プログラム |
JP2005018037A (ja) * | 2003-06-05 | 2005-01-20 | Kenwood Corp | 音声合成装置、音声合成方法及びプログラム |
JP2005321520A (ja) * | 2004-05-07 | 2005-11-17 | Mitsubishi Electric Corp | 音声合成装置及びそのプログラム |
JP2007212884A (ja) * | 2006-02-10 | 2007-08-23 | Fujitsu Ltd | 音声合成装置、音声合成方法、及びコンピュータプログラム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013054839A1 (ja) | 2011-10-14 | 2013-04-18 | サイバーアイ・エンタテインメント株式会社 | 画像認識システムを備えた知識情報処理サーバシステム |
WO2016103652A1 (ja) * | 2014-12-24 | 2016-06-30 | 日本電気株式会社 | 音声処理装置、音声処理方法、および記録媒体 |
CN111583901A (zh) * | 2020-04-02 | 2020-08-25 | 湖南声广信息科技有限公司 | 一种广播电台智能天气预报系统及天气预报语音切分方法 |
CN111583901B (zh) * | 2020-04-02 | 2023-07-11 | 湖南声广科技有限公司 | 一种广播电台智能天气预报系统及天气预报语音切分方法 |
CN112185417A (zh) * | 2020-10-21 | 2021-01-05 | 平安科技(深圳)有限公司 | 人工合成语音检测方法、装置、计算机设备及存储介质 |
CN112185417B (zh) * | 2020-10-21 | 2024-05-10 | 平安科技(深圳)有限公司 | 人工合成语音检测方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4964695B2 (ja) | 2012-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7178028B2 (ja) | 多言語テキスト音声合成モデルを利用した音声翻訳方法およびシステム | |
US11443733B2 (en) | Contextual text-to-speech processing | |
US9424833B2 (en) | Method and apparatus for providing speech output for speech-enabled applications | |
US8825486B2 (en) | Method and apparatus for generating synthetic speech with contrastive stress | |
US7809572B2 (en) | Voice quality change portion locating apparatus | |
US8219398B2 (en) | Computerized speech synthesizer for synthesizing speech from text | |
US9978359B1 (en) | Iterative text-to-speech with user feedback | |
JP2003295882A (ja) | 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム | |
JP4038211B2 (ja) | 音声合成装置,音声合成方法および音声合成システム | |
US8914291B2 (en) | Method and apparatus for generating synthetic speech with contrastive stress | |
US20100066742A1 (en) | Stylized prosody for speech synthesis-based applications | |
US8155963B2 (en) | Autonomous system and method for creating readable scripts for concatenative text-to-speech synthesis (TTS) corpora | |
KR20170057623A (ko) | 언어장애인을 위한 다언어 어휘의 발음 합성 및 문자화 장치 | |
JP4964695B2 (ja) | 音声合成装置及び音声合成方法並びにプログラム | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
US9484014B1 (en) | Hybrid unit selection / parametric TTS system | |
Toman et al. | Unsupervised and phonologically controlled interpolation of Austrian German language varieties for speech synthesis | |
JP5819147B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JPH08335096A (ja) | テキスト音声合成装置 | |
JP2006349787A (ja) | 音声合成方法および装置 | |
Kaveri et al. | A novel approach for hindi text description to speech and expressive speech synthesis | |
Ananthi et al. | Syllable based concatenative synthesis for text to speech conversion | |
Wisetpaitoon et al. | End-to-End Thai Text-to-Speech with Linguistic Unit | |
JP2016122033A (ja) | 記号列生成装置、音声合成装置、音声合成システム、記号列生成方法、及びプログラム | |
JP6197362B2 (ja) | 音声合成方法、プログラム、及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100113 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111101 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120228 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4964695 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150406 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |