JP2018169434A - 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム - Google Patents
音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム Download PDFInfo
- Publication number
- JP2018169434A JP2018169434A JP2017064652A JP2017064652A JP2018169434A JP 2018169434 A JP2018169434 A JP 2018169434A JP 2017064652 A JP2017064652 A JP 2017064652A JP 2017064652 A JP2017064652 A JP 2017064652A JP 2018169434 A JP2018169434 A JP 2018169434A
- Authority
- JP
- Japan
- Prior art keywords
- morpheme
- ruby
- accent
- compound word
- text data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
この音声合成装置は、入力された、ルビが振られた語句を含むテキストデータに対して形態素解析を行って、ルビが振られた形態素を抽出する。そしてこの音声合成装置は、抽出した、ルビが振られた形態素と、その前後の形態素とで複合語が形成されるか否かを判定し、複合語が形成される場合、言語辞書から、その複合語のアクセントを検索して利用する。また、この音声合成装置は、ルビが振られた形態素を含む複合語が形成されない場合には、そのルビが振られた形態素に対応するアクセントを、言語辞書から検索する。これにより、この音声合成装置は、ルビが振られた語句を含むテキストデータについて生成される合成音声信号に適切なアクセントを付与することができる。
記憶部5は、音声合成処理に用いられるデータとして、例えば、各形態素及び各複合語の読み、アクセント及び品詞情報を表す言語辞書、形態素間の接続コストを表す接続規則、及び、複合語の生成規則などを記憶する。
処理部6が有するこれらの各部は、例えば、処理部6が有するプロセッサ上で動作するコンピュータプログラムにより実現される機能モジュールである。あるいは、処理部6が有するこれらの各部は、その各部の機能を実現する一つまたは複数の集積回路として、処理部6が有するプロセッサとは別個に、音声合成装置1に実装されてもよい。
抽出部12は、ルビに対応する形態素のそれぞれを、結合判定部13へ通知する。
結合様式C1は、先行語のアクセントが無くなることを表す。例えば、形態素「転居(テ‘ンキョ)」と形態素「手続(テツ‘ヅキ)」を結合することにより複合語「転居手続」が形成される場合、その複合語の読み及びアクセントは「テンキョテツ‘ヅキ」となる。
音声合成部15は、様々な音声合成方式の何れに従ってテキストデータの合成音声信号を生成してもよい。例えば、音声合成部15は、表音文字列に基づいて、合成音声信号を生成する際の目標韻律を生成する。そのために、音声合成部15は、記憶部5から複数の韻律モデルを読み込む。この韻律モデルは、声を高くする位置及び声を低くする位置などを時間順に表したものである。そして音声合成部15は、複数の韻律モデルのうち、表音文字列に示されたアクセントの位置などに最も一致する韻律モデルを選択する。そして音声合成部15は、選択した韻律モデル及び合成音声信号を生成するために参照される各種のパラメータに従って、表音文字列に対して声が高くなる位置あるいは声が低くなる位置、声の抑揚、ピッチなどを設定することにより、目標韻律を作成する。目標韻律は、音声波形を決定する単位となる音素ごとに、音素の長さ及びピッチ周波数を含む。なお、音素は、例えば、一つの母音あるいは一つの子音とすることができる。
例えば、音声合成部15は、音素ごとに、目標韻律の音素長及びピッチ周波数に最も近い音声波形を、例えばパターンマッチングにより音声波形辞書に登録されている複数の音声波形の中から選択する。そのために、音声合成部15は、記憶部5から音声波形辞書を読み込む。音声波形辞書は、複数の音声波形及び各音声波形の識別番号を記録する。また音声波形は、例えば、音素単位の波形信号である。
さらに、音声合成部15は、音素ごとに選択された音声波形を目標韻律に沿って接続できるようにするため、それら選択された音声波形と目標韻律に示された対応する音素の波形パターンとのずれ量を、波形変換情報として算出してもよい。
音声合成部15は、音素ごとに選択された音声波形の識別番号を含む波形生成情報を作成する。波形生成情報は、波形変換情報をさらに含んでもよい。
テキスト解析部11は、操作部2を介して指定された、ルビが振られた語句を含むテキストデータに対して形態素解析を行って、そのテキストデータを形態素の組み合わせに分割する(ステップS201)。そして抽出部12は、形態素の組み合わせに含まれる形態素のうち、ルビが振られた語句に含まれる形態素を抽出する(ステップS202)。
記憶部112は、例えば、不揮発性の半導体メモリ及び揮発性の半導体メモリを有する。そして記憶部112は、端末110を制御するためのコンピュータプログラム、端末110の識別情報などを記憶する。
さらに、通信部113は、サーバ120からテキストデータに対応する合成音声信号を受信して、制御部114に渡す。
また制御部114は、サーバ120から通信ネットワーク130及び通信部113を介して受信した合成音声信号を、音声出力部115を介して合成音声として出力する。
2 操作部
3 表示部
4 通信インターフェース部
5 記憶部
6 処理部
7 音声出力部
11 テキスト解析部
12 抽出部
13 結合判定部
14 アクセント付与部
15 音声合成部
100 クライアントサーバシステム
110 端末
120 サーバ
130 通信ネットワーク
111 入力部
112 記憶部
113 通信部
114 制御部
115 音声出力部
121 通信部
122 記憶部
123 処理部
Claims (7)
- ルビが振られた語句を含むテキストデータに対して形態素解析を実行することで、当該テキストデータを形態素の組み合わせに分割するテキスト解析部と、
前記形態素の組み合わせに含まれる形態素のうち、前記ルビが振られた語句に含まれる形態素を抽出する抽出部と、
前記ルビが振られた語句に含まれる形態素について、当該形態素の前側または後ろ側に連続する形態素とともに複合語を形成するか否かを判定する結合判定部と、
前記ルビが振られた語句に含まれる形態素が前記複合語を形成する場合、当該複合語全体としてアクセントを付与するアクセント付与部と、
を有する音声合成装置。 - 前記アクセント付与部は、前記形態素の組み合わせに含まれる各形態素にアクセントを付与することで前記テキストデータ全体の読み及びアクセントの位置を表す表音文字列を生成し、
前記表音文字列に基づいて前記テキストデータの音声波形を表す合成音声信号を生成する音声合成部をさらに有する、請求項1に記載の音声合成装置。 - 形態素ごと、及び、複合語ごとの読み及びアクセントを表す言語辞書を記憶する記憶部をさらに有し、
前記アクセント付与部は、前記ルビが振られた語句に含まれる形態素が前記複合語を形成し、かつ、当該複合語が前記言語辞書に登録されている場合、当該複合語に前記言語辞書に登録されている当該複合語のアクセントを付与し、一方、前記ルビが振られた語句に含まれる形態素が前記複合語を形成せず、かつ、当該形態素が前記言語辞書に登録されている場合、当該形態素に前記言語辞書に登録されている当該形態素のアクセントを付与する、請求項1または2に記載の音声合成装置。 - 前記アクセント付与部は、前記ルビが振られた語句に含まれる形態素が前記複合語を形成し、かつ、当該複合語が前記言語辞書に登録されていない場合、前記言語辞書に登録されている、当該複合語の読み及び品詞と一致する読み及び品詞を持つ他の語のアクセントを当該複合語に付与する、請求項3に記載の音声合成装置。
- 端末とサーバとを有する音声合成システムであって、
前記端末は、
ルビが振られた語句を含むテキストデータを取得する入力部と、
前記テキストデータを前記サーバへ送信し、かつ、前記サーバから前記テキストデータの音声波形を表す合成音声信号を受信する通信部と、
前記合成音声信号を音声として出力する音声出力部と、
を有し、
前記サーバは、
前記テキストデータを前記端末から受信し、かつ、前記合成音声信号を前記端末へ送信する通信部と、
前記テキストデータに対して形態素解析を実行することで、当該テキストデータを形態素の組み合わせに分割し、
前記形態素の組み合わせに含まれる形態素のうち、前記ルビが振られた語句に含まれる形態素を抽出し、
前記ルビが振られた語句に含まれる形態素について、当該形態素の前側または後ろ側に連続する形態素とともに複合語を形成するか否かを判定し、
前記ルビが振られた語句に含まれる形態素が前記複合語を形成する場合、当該複合語全体としてアクセントを付与することで、前記テキストデータ全体の読み及びアクセントの位置を表す表音文字列を生成し、
前記表音文字列に基づいて前記合成音声信号を生成する処理部と、
を有する音声合成システム。 - ルビが振られた語句を含むテキストデータに対して形態素解析を実行することで、当該テキストデータを形態素の組み合わせに分割し、
前記形態素の組み合わせに含まれる形態素のうち、前記ルビが振られた語句に含まれる形態素を抽出し、
前記ルビが振られた語句に含まれる形態素について、当該形態素の前側または後ろ側に連続する形態素とともに複合語を形成するか否かを判定し、
前記ルビが振られた語句に含まれる形態素が前記複合語を形成する場合、当該複合語全体としてアクセントを付与する、
ことを含む音声合成方法。 - ルビが振られた語句を含むテキストデータに対して形態素解析を実行することで、当該テキストデータを形態素の組み合わせに分割し、
前記形態素の組み合わせに含まれる形態素のうち、前記ルビが振られた語句に含まれる形態素を抽出し、
前記ルビが振られた語句に含まれる形態素について、当該形態素の前側または後ろ側に連続する形態素とともに複合語を形成するか否かを判定し、
前記ルビが振られた語句に含まれる形態素が前記複合語を形成する場合、当該複合語全体としてアクセントを付与する、
ことをコンピュータに実行させるための音声合成用コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017064652A JP6790959B2 (ja) | 2017-03-29 | 2017-03-29 | 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017064652A JP6790959B2 (ja) | 2017-03-29 | 2017-03-29 | 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018169434A true JP2018169434A (ja) | 2018-11-01 |
JP6790959B2 JP6790959B2 (ja) | 2020-11-25 |
Family
ID=64018700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017064652A Active JP6790959B2 (ja) | 2017-03-29 | 2017-03-29 | 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6790959B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111564153A (zh) * | 2020-04-02 | 2020-08-21 | 湖南声广信息科技有限公司 | 广播电台智能主播音乐节目系统 |
CN112233382A (zh) * | 2020-10-27 | 2021-01-15 | 成都市美幻科技有限公司 | 地震预警播报方法、装置、存储介质以及电子设备 |
CN113345409A (zh) * | 2021-08-05 | 2021-09-03 | 北京世纪好未来教育科技有限公司 | 语音合成方法、装置、电子设备及计算机可读存储介质 |
WO2022095754A1 (zh) * | 2020-11-03 | 2022-05-12 | 北京有竹居网络技术有限公司 | 语音合成方法、装置、存储介质及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002258884A (ja) * | 2001-02-27 | 2002-09-11 | Mitsubishi Electric Corp | 音声合成方法および装置並びにプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2005309327A (ja) * | 2004-04-26 | 2005-11-04 | Mitsubishi Electric Corp | 音声合成装置 |
JP2015060038A (ja) * | 2013-09-18 | 2015-03-30 | 富士通株式会社 | 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム |
-
2017
- 2017-03-29 JP JP2017064652A patent/JP6790959B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002258884A (ja) * | 2001-02-27 | 2002-09-11 | Mitsubishi Electric Corp | 音声合成方法および装置並びにプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2005309327A (ja) * | 2004-04-26 | 2005-11-04 | Mitsubishi Electric Corp | 音声合成装置 |
JP2015060038A (ja) * | 2013-09-18 | 2015-03-30 | 富士通株式会社 | 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111564153A (zh) * | 2020-04-02 | 2020-08-21 | 湖南声广信息科技有限公司 | 广播电台智能主播音乐节目系统 |
CN111564153B (zh) * | 2020-04-02 | 2021-10-01 | 湖南声广科技有限公司 | 广播电台智能主播音乐节目系统 |
CN112233382A (zh) * | 2020-10-27 | 2021-01-15 | 成都市美幻科技有限公司 | 地震预警播报方法、装置、存储介质以及电子设备 |
WO2022095754A1 (zh) * | 2020-11-03 | 2022-05-12 | 北京有竹居网络技术有限公司 | 语音合成方法、装置、存储介质及电子设备 |
CN113345409A (zh) * | 2021-08-05 | 2021-09-03 | 北京世纪好未来教育科技有限公司 | 语音合成方法、装置、电子设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6790959B2 (ja) | 2020-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11514886B2 (en) | Emotion classification information-based text-to-speech (TTS) method and apparatus | |
CN106920547B (zh) | 语音转换方法和装置 | |
US9761219B2 (en) | System and method for distributed text-to-speech synthesis and intelligibility | |
WO2017067206A1 (zh) | 个性化多声学模型的训练方法、语音合成方法及装置 | |
CN108831437B (zh) | 一种歌声生成方法、装置、终端和存储介质 | |
CN112309366B (zh) | 语音合成方法、装置、存储介质及电子设备 | |
JP2008185805A (ja) | 高品質の合成音声を生成する技術 | |
JP2008134475A (ja) | 入力された音声のアクセントを認識する技術 | |
JP6790959B2 (ja) | 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム | |
KR20160058470A (ko) | 음성 합성 장치 및 그 제어 방법 | |
CN104899192B (zh) | 用于自动通译的设备和方法 | |
JP5106608B2 (ja) | 読み上げ支援装置、方法、およびプログラム | |
JP5079718B2 (ja) | 外国語学習支援システム、及びプログラム | |
JP2006018133A (ja) | 分散型音声合成システム、端末装置及びコンピュータ・プログラム | |
JP2009122381A (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP6197523B2 (ja) | 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム | |
Kamble et al. | Audio Visual Speech Synthesis and Speech Recognition for Hindi Language | |
JP6142632B2 (ja) | 単語辞書登録用コンピュータプログラム、音声合成装置及び単語辞書登録登録方法 | |
JP2014197117A (ja) | 音声合成装置及び言語辞書登録方法 | |
JP2001296878A (ja) | 音声合成用辞書作成装置及び方法 | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
KR20180103273A (ko) | 음성 합성 장치 및 음성 합성 방법 | |
JP2023006055A (ja) | プログラム、情報処理装置、方法 | |
JP6340839B2 (ja) | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム | |
JP6197362B2 (ja) | 音声合成方法、プログラム、及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200925 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201006 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201019 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6790959 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |