JP5029884B2 - 韻律生成装置、韻律生成方法、および、韻律生成プログラム - Google Patents
韻律生成装置、韻律生成方法、および、韻律生成プログラム Download PDFInfo
- Publication number
- JP5029884B2 JP5029884B2 JP2007135847A JP2007135847A JP5029884B2 JP 5029884 B2 JP5029884 B2 JP 5029884B2 JP 2007135847 A JP2007135847 A JP 2007135847A JP 2007135847 A JP2007135847 A JP 2007135847A JP 5029884 B2 JP5029884 B2 JP 5029884B2
- Authority
- JP
- Japan
- Prior art keywords
- prosody
- pattern
- speech
- extraction
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
図1は、本実施形態に係る音声合成システム1の概略構成を示すブロック図である。すなわち、本実施形態に係る音声合成システム1は、韻律生成装置2、および、音声合成装置3を備えている。韻律生成装置2と音声合成装置3とは有線または無線により互いに接続されている。韻律生成装置2は、任意のテキストと、このテキストを読み上げた人間の音声とを受け付け、受け付けた任意のテキストおよび人間の音声に基づいて、修正韻律パターンを生成する装置である。音声合成装置3は、韻律生成装置2により生成された修正韻律パターンを受け付け、受け付けた修正韻律パターンに基づいて、合成音声を生成し出力する装置である。韻律生成装置2および音声合成装置3は、例えば、パーソナルコンピュータ、サーバマシンなどの汎用コンピュータによって構成される。なお、韻律生成装置2および音声合成装置3は、例えば、車載情報端末、携帯電話、家電製品などの電子機器に組み込まれたコンピュータによって構成されていてもよい。また、韻律生成装置2および音声合成装置3は、同一のハードウェア内にそれぞれ存在していてもよいし、異なるハードウェア内にそれぞれ存在していてもよい。
韻律生成装置2は、テキスト入力部21、単語辞書22、言語処理部23、規則韻律生成部24、音声入力部25、音声韻律抽出部26、および、修正韻律生成部27を備えている。
音声合成装置3は、波形辞書31、波形生成部32、および、合成音声出力部33を備えている。
次に、上記の構成に係る音声合成システム1の動作について、図14を参照しながら説明する。
図15は、本実施形態に係る音声合成システム10の概略構成を示すブロック図である。すなわち、本実施形態に係る音声合成システム10は、図1に示す韻律生成装置2の代わりに、韻律生成装置4を備えている。なお、図15において、図1と同様の機能を有する構成については、同じ参照符号を付記し、その詳細な説明を省略する。
図19は、本実施形態に係る音声合成システム(韻律編集システム)11の概略構成を示すブロック図である。すなわち、本実施形態に係る音声合成システム11は、図1に示す音声合成システム1に加えて、GUI(Graphical User Interface)装置5を備えている。GUI装置5と韻律生成装置2とは有線または無線により互いに接続されている。また、GUI装置5と音声合成装置3とは有線または無線により互いに接続されている。なお、図19において、図1と同様の機能を有する構成については、同じ参照符号を付記し、その詳細な説明を省略する。また、図19において、韻律生成装置2の各構成部材21〜27、および、音声合成装置3の各構成部材31〜33の図示を省略している。さらに、上記のGUI装置5は、図13に示す音声合成システム1a、および、図15に示す音声合成システム10に備えられていてもよい。
任意のテキストが入力されるテキスト入力部と、
前記テキストを言語解析することにより、前記テキストの読みを示す表音文字列データを生成する言語処理部と、
前記表音文字列データ、および、韻律生成規則に基づいて、前記テキストの韻律を示す規則韻律パターンを生成する規則韻律生成部と、
前記テキストを読み上げた人間の音声を音声データに変換する音声入力部と、
前記音声データから前記人間の音声の韻律を示す音声韻律パターンを抽出する音声韻律抽出部と、
前記音声韻律抽出部が前記音声データから前記音声韻律パターンを抽出する際における、当該抽出の信頼度を取得し、前記音声韻律パターンのうち前記信頼度が閾値以上のパターンを前記音声韻律抽出部による抽出の信頼性が高いパターンと判定し、前記音声韻律パターンのうち前記信頼度が閾値未満のパターンを前記音声韻律抽出部による抽出の信頼性が低いパターンと判定する信頼度判定部と、
前記音声韻律パターンのうち前記音声韻律抽出部による抽出の信頼性が低いパターンの代わりに、前記音声韻律パターンのうち前記音声韻律抽出部による抽出の信頼性が高いパターン、および、前記規則韻律パターンに基づいて修正韻律パターンを生成する修正韻律生成部とを備えたことを特徴とする韻律生成装置。
前記修正韻律生成部は、
前記音声韻律パターンのうち前記音声韻律抽出部による抽出の信頼性が高いパターンに近似するように前記規則韻律パターンを変形し、変形した規則韻律パターンと、前記音声韻律パターンのうち前記音声韻律抽出部による抽出の信頼性が高いパターンとを接続することにより、修正韻律パターンを生成する韻律補完部を含む、請求項1に記載の韻律生成装置。
前記修正韻律生成部は、
前記音声韻律パターンのうち前記音声韻律抽出部による抽出の信頼性が高いパターンに近似するように前記規則韻律パターンを変形し、前記音声韻律パターンのうち前記音声韻律抽出部による抽出の信頼性が高いパターンを用いることなく、変形した規則韻律パターンを用いることにより、修正韻律パターンを生成する韻律修正部を含む、請求項1に記載の韻律生成装置。
前記規則韻律パターン、前記音声韻律パターン、および、前記修正韻律パターンは、声の高さの変化パターンを表すピッチパターンである、付記1〜3のいずれか一項に記載の韻律生成装置。
付記1〜4のいずれか一項に記載の韻律生成装置と、
前記韻律生成装置により生成された表音文字列データおよび修正韻律パターンの少なくとも1つを編集させるGUI装置とを備えたことを特徴とする韻律編集システム。
付記1〜4のいずれか一項に記載の韻律生成装置と、
前記韻律生成装置により生成された修正韻律パターンに基づいて、合成音声を生成し出力する音声合成装置とを備えたことを特徴とする音声合成システム。
付記1〜4のいずれか一項に記載の韻律生成装置と、
前記韻律生成装置により生成された表音文字列データおよび修正韻律パターンの少なくとも1つを編集させるGUI装置と、
前記韻律生成装置により生成された修正韻律パターン、および、前記GUI装置により編集された修正韻律パターンの少なくとも1つに基づいて、合成音声を生成し出力する音声合成装置とを備えたことを特徴とする音声合成システム。
コンピュータが備えるテキスト入力部が、任意のテキストが入力されるテキスト入力工程と、
前記コンピュータが備える言語処理部が、前記テキストを言語解析することにより、前記テキストの読みを示す表音文字列データを生成する言語処理工程と、
前記コンピュータが備える規則韻律生成部が、前記表音文字列データ、および、韻律生成規則に基づいて、前記テキストの韻律を示す規則韻律パターンを生成する規則韻律生成工程と、
前記コンピュータが備える音声入力部が、前記テキストを読み上げた人間の音声を音声データに変換する音声入力工程と、
前記コンピュータが備える音声韻律抽出部が、前記音声データから前記人間の音声の韻律を示す音声韻律パターンを抽出する音声韻律抽出工程と、
前記コンピュータが備える信頼度判定部が、前記音声韻律抽出工程にて前記音声データから前記音声韻律パターンが抽出された際における、当該抽出の信頼度を取得し、前記音声韻律パターンのうち前記信頼度が閾値以上のパターンを前記音声韻律抽出工程による抽出の信頼性が高いパターンと判定し、前記音声韻律パターンのうち前記信頼度が閾値未満のパターンを前記音声韻律抽出工程による抽出の信頼性が低いパターンと判定する信頼度判定工程と、
前記コンピュータが備える修正韻律生成部が、前記音声韻律パターンのうち前記音声韻律抽出工程による抽出の信頼性が低いパターンの代わりに、前記音声韻律パターンのうち前記音声韻律抽出工程による抽出の信頼性が高いパターン、および、前記規則韻律パターンに基づいて修正韻律パターンを生成する修正韻律生成工程とを含むことを特徴とする韻律生成方法。
任意のテキストが入力されるテキスト入力処理と、
前記テキストを言語解析することにより、前記テキストの読みを示す表音文字列データを生成する言語処理と、
前記表音文字列データ、および、韻律生成規則に基づいて、前記テキストの韻律を示す規則韻律パターンを生成する規則韻律生成処理と、
前記テキストを読み上げた人間の音声を音声データに変換する音声入力処理と、
前記音声データから前記人間の音声の韻律を示す音声韻律パターンを抽出する音声韻律抽出処理と、
前記音声韻律抽出処理にて前記音声データから前記音声韻律パターンが抽出された際における、当該抽出の信頼度を取得し、前記音声韻律パターンのうち前記信頼度が閾値以上のパターンを前記音声韻律抽出処理による抽出の信頼性が高いパターンと判定し、前記音声韻律パターンのうち前記信頼度が閾値未満のパターンを前記音声韻律抽出処理による抽出の信頼性が低いパターンと判定する信頼性判定処理と、
前記音声韻律パターンのうち前記音声韻律抽出処理による抽出の信頼性が低いパターンの代わりに、前記音声韻律パターンのうち前記音声韻律抽出処理による抽出の信頼性が高いパターン、および、前記規則韻律パターンに基づいて修正韻律パターンを生成する修正韻律生成処理とをコンピュータに実行させることを特徴とする韻律生成プログラム。
2、4 韻律生成装置
3 音声合成装置
5 GUI装置
21 テキスト入力部
23 言語処理部
24 規則韻律生成部
24a 音素時間長生成部
24b ピッチパターン生成部
24c パワー生成部
25 音声入力部
26 音声韻律抽出部
26a 音素時間長抽出部
26b ピッチパターン抽出部
26c 信頼度判定部
26d パワー抽出部
27、41 修正韻律生成部
27a 韻律補完部
41a 韻律修正部
Claims (7)
- 任意のテキストが入力されるテキスト入力部と、
前記テキストを言語解析することにより、前記テキストの読みを示す表音文字列データを生成する言語処理部と、
前記表音文字列データ、および、韻律生成規則に基づいて、前記テキストの韻律を示す規則韻律パターンを生成する規則韻律生成部と、
前記テキストを読み上げた人間の音声を音声データに変換する音声入力部と、
前記音声データから前記人間の音声の韻律を示す音声韻律パターンを抽出する音声韻律抽出部と、
前記音声韻律抽出部が前記音声データから前記音声韻律パターンを抽出する際における、当該抽出の信頼度を取得し、前記音声韻律パターンのうち前記信頼度が閾値以上のパターンを前記音声韻律抽出部による抽出の信頼性が高いパターンと判定し、前記音声韻律パターンのうち前記信頼度が閾値未満のパターンを前記音声韻律抽出部による抽出の信頼性が低いパターンと判定する信頼度判定部と、
前記規則韻律パターンを、前記音声韻律抽出部による抽出の信頼性が高いパターンに近似して変形させることにより、前記音声韻律抽出部による抽出の信頼性が低いパターンを補完して、修正韻律パターンを生成する修正韻律生成部とを備えたことを特徴とする韻律生成装置。 - 前記修正韻律生成部は、
前記音声韻律パターンのうち前記音声韻律抽出部による抽出の信頼性が高いパターンに近似するように前記規則韻律パターンを変形し、変形した規則韻律パターンと、前記音声韻律パターンのうち前記音声韻律抽出部による抽出の信頼性が高いパターンとを接続することにより、修正韻律パターンを生成する韻律補完部を含む、請求項1に記載の韻律生成装置。 - 前記修正韻律生成部は、
前記音声韻律パターンのうち前記音声韻律抽出部による抽出の信頼性が高いパターンに近似するように前記規則韻律パターンを変形し、前記音声韻律パターンのうち前記音声韻律抽出部による抽出の信頼性が高いパターンを用いることなく、変形した規則韻律パターンを用いることにより、修正韻律パターンを生成する韻律修正部を含む、請求項1に記載の韻律生成装置。 - 前記規則韻律パターン、前記音声韻律パターン、および、前記修正韻律パターンは、声の高さの変化パターンを表すピッチパターンである、請求項1〜3のいずれか一項に記載の韻律生成装置。
- 請求項1〜4のいずれか一項に記載の韻律生成装置と、
前記韻律生成装置により生成された表音文字列データおよび修正韻律パターンの少なくとも1つを編集させるGUI装置とを備えたことを特徴とする韻律編集システム。 - コンピュータが備えるテキスト入力部が、任意のテキストが入力されるテキスト入力工程と、
前記コンピュータが備える言語処理部が、前記テキストを言語解析することにより、前記テキストの読みを示す表音文字列データを生成する言語処理工程と、
前記コンピュータが備える規則韻律生成部が、前記表音文字列データ、および、韻律生成規則に基づいて、前記テキストの韻律を示す規則韻律パターンを生成する規則韻律生成工程と、
前記コンピュータが備える音声入力部が、前記テキストを読み上げた人間の音声を音声
データに変換する音声入力工程と、
前記コンピュータが備える音声韻律抽出部が、前記音声データから前記人間の音声の韻律を示す音声韻律パターンを抽出する音声韻律抽出工程と、
前記コンピュータが備える信頼度判定部が、前記音声韻律抽出工程にて前記音声データから前記音声韻律パターンが抽出された際における、当該抽出の信頼度を取得し、前記音声韻律パターンのうち前記信頼度が閾値以上のパターンを前記音声韻律抽出工程による抽出の信頼性が高いパターンと判定し、前記音声韻律パターンのうち前記信頼度が閾値未満のパターンを前記音声韻律抽出工程による抽出の信頼性が低いパターンと判定する信頼度判定工程と、
前記コンピュータが備える修正韻律生成部が、前記規則韻律パターンを、前記音声韻律抽出工程による抽出の信頼性が高いパターンに近似して変形させることにより、前記音声韻律抽出工程による抽出の信頼性が低いパターンを補完して、修正韻律パターンを生成する修正韻律生成工程とを含むことを特徴とする韻律生成方法。 - 任意のテキストが入力されるテキスト入力処理と、
前記テキストを言語解析することにより、前記テキストの読みを示す表音文字列データを生成する言語処理と、
前記表音文字列データ、および、韻律生成規則に基づいて、前記テキストの韻律を示す規則韻律パターンを生成する規則韻律生成処理と、
前記テキストを読み上げた人間の音声を音声データに変換する音声入力処理と、
前記音声データから前記人間の音声の韻律を示す音声韻律パターンを抽出する音声韻律抽出処理と、
前記音声韻律抽出処理にて前記音声データから前記音声韻律パターンが抽出された際における、当該抽出の信頼度を取得し、前記音声韻律パターンのうち前記信頼度が閾値以上のパターンを前記音声韻律抽出処理による抽出の信頼性が高いパターンと判定し、前記音声韻律パターンのうち前記信頼度が閾値未満のパターンを前記音声韻律抽出処理による抽出の信頼性が低いパターンと判定する信頼性判定処理と、
前記規則韻律パターンを、前記音声韻律抽出処理による抽出の信頼性が高いパターンに近似して変形させることにより、前記音声韻律抽出処理による抽出の信頼性が低いパターンを補完して、修正韻律パターンを生成する修正韻律生成処理とをコンピュータに実行させることを特徴とする韻律生成プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007135847A JP5029884B2 (ja) | 2007-05-22 | 2007-05-22 | 韻律生成装置、韻律生成方法、および、韻律生成プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007135847A JP5029884B2 (ja) | 2007-05-22 | 2007-05-22 | 韻律生成装置、韻律生成方法、および、韻律生成プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2008292587A JP2008292587A (ja) | 2008-12-04 |
| JP5029884B2 true JP5029884B2 (ja) | 2012-09-19 |
Family
ID=40167393
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007135847A Expired - Fee Related JP5029884B2 (ja) | 2007-05-22 | 2007-05-22 | 韻律生成装置、韻律生成方法、および、韻律生成プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5029884B2 (ja) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5576817B2 (ja) * | 2011-03-15 | 2014-08-20 | 富士通フロンテック株式会社 | 自動取引装置、音声読み上げ方法及び音声読み上げプログラム |
| WO2016043322A1 (ja) * | 2014-09-19 | 2016-03-24 | 株式会社コティレドン・テクノロジー | 音声合成方法、プログラム及び装置 |
| JP6004358B1 (ja) * | 2015-11-25 | 2016-10-05 | 株式会社テクノスピーチ | 音声合成装置および音声合成方法 |
| JP6553584B2 (ja) * | 2016-12-12 | 2019-07-31 | 日本電信電話株式会社 | 基本周波数モデルパラメータ推定装置、方法、及びプログラム |
| JP6729539B2 (ja) | 2017-11-29 | 2020-07-22 | ヤマハ株式会社 | 音声合成方法、音声合成システムおよびプログラム |
| JP7180642B2 (ja) * | 2020-07-01 | 2022-11-30 | ヤマハ株式会社 | 音声合成方法、音声合成システムおよびプログラム |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09292897A (ja) * | 1996-04-26 | 1997-11-11 | Sanyo Electric Co Ltd | 音声合成装置 |
| JPH10153998A (ja) * | 1996-09-24 | 1998-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置 |
| JP2002258885A (ja) * | 2001-02-27 | 2002-09-11 | Sharp Corp | テキスト音声合成装置およびプログラム記録媒体 |
| JP2006337476A (ja) * | 2005-05-31 | 2006-12-14 | Canon Inc | 音声合成方法および装置 |
-
2007
- 2007-05-22 JP JP2007135847A patent/JP5029884B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2008292587A (ja) | 2008-12-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5119700B2 (ja) | 韻律修正装置、韻律修正方法、および、韻律修正プログラム | |
| US8219398B2 (en) | Computerized speech synthesizer for synthesizing speech from text | |
| US6751592B1 (en) | Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically | |
| JP4054507B2 (ja) | 音声情報処理方法および装置および記憶媒体 | |
| US20100066742A1 (en) | Stylized prosody for speech synthesis-based applications | |
| JP6127422B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
| JP5029884B2 (ja) | 韻律生成装置、韻律生成方法、および、韻律生成プログラム | |
| CN104008752A (zh) | 语音识别装置及方法、以及半导体集成电路装置 | |
| JP5398295B2 (ja) | 音声処理装置、音声処理方法及び音声処理プログラム | |
| JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
| JP5807921B2 (ja) | 定量的f0パターン生成装置及び方法、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム | |
| O'Shaughnessy | Modern methods of speech synthesis | |
| JP2003186489A (ja) | 音声情報データベース作成システム,録音原稿作成装置および方法,録音管理装置および方法,ならびにラベリング装置および方法 | |
| JP6436806B2 (ja) | 音声合成用データ作成方法、及び音声合成用データ作成装置 | |
| KR20010018064A (ko) | 음운환경과 묵음구간 길이를 이용한 텍스트/음성변환 장치 및그 방법 | |
| JP2013195928A (ja) | 音声素片切出装置 | |
| Chettri et al. | Nepali text to speech synthesis system using esnola method of concatenation | |
| JP2021148942A (ja) | 声質変換システムおよび声質変換方法 | |
| WO2008056604A1 (en) | Sound collection system, sound collection method, and collection processing program | |
| JP4841339B2 (ja) | 韻律補正装置、音声合成装置、韻律補正方法、音声合成方法、韻律補正プログラム、および、音声合成プログラム | |
| JPH07140996A (ja) | 音声規則合成装置 | |
| US20070055524A1 (en) | Speech dialog method and device | |
| Ademi et al. | Natural language processing and text-to-speech technology | |
| JP6191094B2 (ja) | 音声素片切出装置 | |
| JP5012444B2 (ja) | 韻律生成装置、韻律生成方法、および、韻律生成プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100204 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110707 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110719 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110915 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120531 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120613 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150706 Year of fee payment: 3 |
|
| LAPS | Cancellation because of no payment of annual fees |
