JP2016109832A - 音声合成装置および音声合成方法 - Google Patents
音声合成装置および音声合成方法 Download PDFInfo
- Publication number
- JP2016109832A JP2016109832A JP2014246460A JP2014246460A JP2016109832A JP 2016109832 A JP2016109832 A JP 2016109832A JP 2014246460 A JP2014246460 A JP 2014246460A JP 2014246460 A JP2014246460 A JP 2014246460A JP 2016109832 A JP2016109832 A JP 2016109832A
- Authority
- JP
- Japan
- Prior art keywords
- emphasis
- degree
- words
- word
- enhancement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001308 synthesis method Methods 0.000 title claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 28
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 28
- 238000012937 correction Methods 0.000 claims description 46
- 238000000034 method Methods 0.000 claims description 42
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 230000001944 accentuation Effects 0.000 abstract 6
- 238000010586 diagram Methods 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- MQJKPEGWNLWLTK-UHFFFAOYSA-N Dapsone Chemical compound C1=CC(N)=CC=C1S(=O)(=O)C1=CC=C(N)C=C1 MQJKPEGWNLWLTK-UHFFFAOYSA-N 0.000 description 1
- 241000219793 Trifolium Species 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
この発明の音声合成方法は、言語情報を構成する複数の語句の入力を受けて、言語情報の定められた第1の範囲にある語句の強調の度合いを、第1の範囲における他の語句よりも強調の度合いが高い語句または低い語句の割合について定められた第1の基準に応じて決定する強調度決定ステップと、それぞれの語句に対して強調度決定ステップで決定された当該語句の強調の度合いに応じた強調を行って、言語情報の音声信号を合成する音声合成ステップと、を備えるものである。
図1はこの発明の実施の形態1に係る音声合成装置の機能構成の一例を示すブロック図である。図1において、音声合成装置1は、入力されたテキストなどの言語情報に基づいて音声信号を合成し、合成した音声信号を出力するものである。なお、出力された音声信号はスピーカなどの音声再生装置に入力されて音声に変換される。図1に示すように、音声合成装置1は強調度決定部110と音声合成部120を備えている。また、強調度決定部110は強調度付与部111と強調度修正部112を、音声合成部120は言語辞書121と言語解析部122と韻律制御部123と信号合成部124を備えている。なお、以降の説明では、言語情報の一例として日本語のテキストを例に説明するが、この発明は言語情報をテキストに限定するものではなく、音声合成の元になる言語情報であればテキスト以外の情報であってもよい。また、言語情報は日本語に限定されるものではなく任意の言語であってよい。
また、ここではn個の単語中で強調度の高い単語の強調度は修正せずにより低い単語の強調度を修正するようにしたが(例えば図6(b)の「鎌倉ドーム」と「初」では「鎌倉ドーム」の強調度を修正)、n個の単語中で後出する単語の強調度を修正するようにするなどしてもよい。
実施の形態1では言語情報の語句の強調度を言語情報における当該語句の近傍の語句の強調度に応じて修正する音声合成装置を説明したが、実施の形態2では言語情報内の強調箇所の頻度があらかじめ決められた頻度となるように強調度を修正する音声合成装置を説明する。
実施の形態2では、周辺単語の強調度および強調頻度に応じた強調度の修正を行う形態を説明したが、実施の形態3では強調度を修正する単語を決める際に単語の重要度を用いる形態を説明する。図7はこの発明の実施の形態3に係る音声合成装置1cの機能構成の一例を示すブロック図である。図7においてこの実施の形態の音声合成装置1cは、図4の実施の形態2の音声合成装置1bに対して、言語解析部122での言語解析結果である中間言語が入力され、入力された中間言語に基づいてテキストを細分化した語句の重要度を決定する重要度決定部114を備え、強調度修正部112cが重要度決定部114で決定された語句の重要度に応じて強調度の修正を行う点が異なっている。
Claims (8)
- 複数の語句で構成される言語情報の定められた第1の範囲にある前記語句のそれぞれの強調の度合いを、前記第1の範囲における他の語句よりも強調の度合いが高い語句または低い語句の割合について定められた第1の基準に応じて決定する強調度決定部と、
前記語句に対して前記強調度決定部が決定した当該語句の強調の度合いに応じた強調を行って、前記言語情報の音声信号を合成する音声合成部と、
を備えることを特徴とする音声合成装置。 - 前記強調度決定部は、前記第1の範囲にある前記語句のそれぞれに付与された強調の度合いに基づいて、当該第1の範囲にある前記語句に付与された強調の度合いを修正する第1の修正処理を行う強調度修正部を備えることを特徴とする請求項1に記載の音声合成装置。
- 前記強調度修正部は、前記第1の範囲を含む定められた第2の範囲における他の語句よりも強調の度合いが高い語句または低い語句の割合について定められた第2の基準に応じて、前記第1の修正処理後の前記語句の強調の度合いを修正する第2の修正処理を行うことを特徴とする請求項2に記載の音声合成装置。
- 前記語句の重要度を決定する重要度決定部を備え、
前記強調度修正部は、前記重要度決定部で決定された前記重要度に基づいて強調の度合いを修正する前記語句を選択することを特徴とする請求項2または請求項3に記載の音声合成装置。 - 言語情報を構成する複数の語句の入力を受けて、前記言語情報の定められた第1の範囲にある前記語句の強調の度合いを、前記第1の範囲における他の語句よりも強調の度合いが高い語句または低い語句の割合について定められた第1の基準に応じて決定する強調度決定ステップと、
前記語句に対して前記強調度決定ステップで決定された当該語句の強調の度合いに応じた強調を行って、前記言語情報の音声信号を合成する音声合成ステップと、
を備えることを特徴とする音声合成方法。 - 前記強調度決定ステップは、前記第1の範囲にある前記語句のそれぞれに付与された強調の度合いに基づいて、当該第1の範囲にある前記語句に付与された強調の度合いを修正する第1の強調度修正ステップを備えることを特徴とする請求項5に記載の音声合成方法。
- 前記強調度決定ステップは、前記第1の範囲を含む定められた第2の範囲における他の語句よりも強調の度合いが高い語句または低い語句の割合について定められた第2の基準に応じて、前記第1の強調度修正ステップで処理された前記語句の強調の度合いを修正する第2の強調度修正ステップを含むことを特徴とする請求項6に記載の音声合成方法。
- 前記語句の重要度を決定する重要度決定ステップを備え、
前記第1の強調度修正ステップまたは前記第2の強調度ステップは、前記重要度決定ステップで決定された前記重要度に基づいて強調の度合いを修正する前記語句を選択することを特徴とする請求項6または請求項7に記載の音声合成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014246460A JP6369311B2 (ja) | 2014-12-05 | 2014-12-05 | 音声合成装置および音声合成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014246460A JP6369311B2 (ja) | 2014-12-05 | 2014-12-05 | 音声合成装置および音声合成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016109832A true JP2016109832A (ja) | 2016-06-20 |
JP6369311B2 JP6369311B2 (ja) | 2018-08-08 |
Family
ID=56124087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014246460A Active JP6369311B2 (ja) | 2014-12-05 | 2014-12-05 | 音声合成装置および音声合成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6369311B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019087646A1 (ja) * | 2017-11-01 | 2019-05-09 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
WO2024090309A1 (ja) * | 2022-10-27 | 2024-05-02 | 京セラ株式会社 | 音出力装置、音出力方法及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040107102A1 (en) * | 2002-11-15 | 2004-06-03 | Samsung Electronics Co., Ltd. | Text-to-speech conversion system and method having function of providing additional information |
WO2004066271A1 (ja) * | 2003-01-20 | 2004-08-05 | Fujitsu Limited | 音声合成装置,音声合成方法および音声合成システム |
JP2007079019A (ja) * | 2005-09-13 | 2007-03-29 | Oki Electric Ind Co Ltd | 音声合成方法,音声合成装置,およびコンピュータプログラム |
-
2014
- 2014-12-05 JP JP2014246460A patent/JP6369311B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040107102A1 (en) * | 2002-11-15 | 2004-06-03 | Samsung Electronics Co., Ltd. | Text-to-speech conversion system and method having function of providing additional information |
WO2004066271A1 (ja) * | 2003-01-20 | 2004-08-05 | Fujitsu Limited | 音声合成装置,音声合成方法および音声合成システム |
JP2007079019A (ja) * | 2005-09-13 | 2007-03-29 | Oki Electric Ind Co Ltd | 音声合成方法,音声合成装置,およびコンピュータプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019087646A1 (ja) * | 2017-11-01 | 2019-05-09 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
JPWO2019087646A1 (ja) * | 2017-11-01 | 2020-12-17 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7226330B2 (ja) | 2017-11-01 | 2023-02-21 | ソニーグループ株式会社 | 情報処理装置、情報処理方法及びプログラム |
WO2024090309A1 (ja) * | 2022-10-27 | 2024-05-02 | 京セラ株式会社 | 音出力装置、音出力方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6369311B2 (ja) | 2018-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110797006B (zh) | 端到端的语音合成方法、装置及存储介质 | |
US7809572B2 (en) | Voice quality change portion locating apparatus | |
CN113724686B (zh) | 编辑音频的方法、装置、电子设备及存储介质 | |
US8103505B1 (en) | Method and apparatus for speech synthesis using paralinguistic variation | |
CN113808571B (zh) | 语音合成方法、装置、电子设备以及存储介质 | |
JP5320363B2 (ja) | 音声編集方法、装置及び音声合成方法 | |
KR20110131768A (ko) | 발음기관 애니메이션 생성 장치 및 방법 | |
JP2007264284A (ja) | 感情付加装置、感情付加方法及び感情付加プログラム | |
JP6369311B2 (ja) | 音声合成装置および音声合成方法 | |
EP3166104A1 (en) | Voice synthesis device, voice synthesis method, and program | |
JP4964695B2 (ja) | 音声合成装置及び音声合成方法並びにプログラム | |
CN113409761B (zh) | 语音合成方法、装置、电子设备以及计算机可读存储介质 | |
AU769036B2 (en) | Device and method for digital voice processing | |
JP2011154061A (ja) | 辞書作成装置、そのコンピュータプログラムおよびデータ処理方法 | |
JP4841339B2 (ja) | 韻律補正装置、音声合成装置、韻律補正方法、音声合成方法、韻律補正プログラム、および、音声合成プログラム | |
US9570067B2 (en) | Text-to-speech system, text-to-speech method, and computer program product for synthesis modification based upon peculiar expressions | |
JP6411015B2 (ja) | 音声合成装置、音声合成方法、およびプログラム | |
JP5975033B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2008058379A (ja) | 音声合成システム及びフィルタ装置 | |
JP2703253B2 (ja) | 音声合成装置 | |
Van Niekerk | Syllabification for Afrikaans speech synthesis | |
JPH05134691A (ja) | 音声合成方法および装置 | |
JP3722136B2 (ja) | 音声合成装置 | |
JP2016122033A (ja) | 記号列生成装置、音声合成装置、音声合成システム、記号列生成方法、及びプログラム | |
JP2809769B2 (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180612 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180625 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6369311 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |