JP2016065900A5 - - Google Patents

Download PDF

Info

Publication number
JP2016065900A5
JP2016065900A5 JP2014193112A JP2014193112A JP2016065900A5 JP 2016065900 A5 JP2016065900 A5 JP 2016065900A5 JP 2014193112 A JP2014193112 A JP 2014193112A JP 2014193112 A JP2014193112 A JP 2014193112A JP 2016065900 A5 JP2016065900 A5 JP 2016065900A5
Authority
JP
Japan
Prior art keywords
segment
prosody
sequence
cost
segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014193112A
Other languages
English (en)
Other versions
JP2016065900A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2014193112A priority Critical patent/JP2016065900A/ja
Priority claimed from JP2014193112A external-priority patent/JP2016065900A/ja
Publication of JP2016065900A publication Critical patent/JP2016065900A/ja
Publication of JP2016065900A5 publication Critical patent/JP2016065900A5/ja
Pending legal-status Critical Current

Links

Description

態様の一例では、入力テキストデータから音素及び目標韻律が対応付けられたセグメントデータの列を抽出するセグメントデータ列抽出手段と、前記目標韻律を、予め設定された範囲内でかつ予め設定された間隔で順次移動させる目標韻律移動手段と、前記目標韻律移動手段により目標韻律が移動される毎に、音素及び韻律が対応付けられた素片の集合である音声コーパスから、前記抽出されたセグメントデータの列に対応する素片の列であって、音素および韻律に関するコストが最良となる素片の列を選定する素片列選択手段と、前記素片列選択手段により、前記目標韻律が移動される毎に選定された素片列のうち、前記コストが最良となる音声素片の列を決定する素片列決定手段と、当該決定された素片の列に基づいて合成音声を出力する波形合成手段と、を備える。
図3は、図1の音声合成装置100をソフトウェア処理として実現できるコンピュータのハードウェア構成例を示す図である。図3に示されるコンピュータは、CPU301、ROM(リードオンリーメモリ:読出し専用メモリ)302、RAM(ランダムアクセスメモリ)303、入力装置304、出力装置305、外部記憶装置306、可搬記録媒体310が挿入される可搬記録媒体駆動装置307、及び通信インタフェース308を有し、これらがバス309によって相互に接続された構成を有する。同図に示される構成は上記システムを実現できるコンピュータの一例であり、そのようなコンピュータはこの構成に限定されるものではない。
可搬記録媒体駆動装置307は、光ディスクやSDRAM、コンパクトフラッシュ等の可搬記録媒体310を収容するもので、外部記憶装置306の補助の役割を有する。
本実施形態によるシステムは、図1および図2の各処理部の機能を搭載した音声合成プログラムを、ROM302からRAM303に読み出してCPU301が実行することで実現される。そのプログラムは、例えば外部記憶装置306や可搬記録媒体310に記録して配布してもよく、或いはネットワーク接続装置308によりネットワークから取得できるようにしてもよい。
以上の実施形態に関して、更に以下の付記を開示する。
(付記1)
入力テキストデータから音素及び目標韻律が対応付けられたセグメントデータの列を抽出するセグメントデータ列抽出手段と、
前記目標韻律を、予め設定された範囲内でかつ予め設定された間隔で順次移動させる目標韻律移動手段と、
前記目標韻律移動手段により目標韻律が移動される毎に、音素及び韻律が対応付けられた素片の集合である音声コーパスから、前記抽出されたセグメントデータの列に対応する素片の列であって、音素および韻律に関するコストが最良となる素片の列を選定する素片列選択手段と、
前記素片列選択手段により、前記目標韻律が移動される毎に選定された素片列のうち、前記コストが最良となる音声素片の列を決定する素片列決定手段と、
当該決定された素片の列に基づいて合成音声を出力する波形合成手段と、
を備える音声合成装置。
(付記2)
前記目標韻律移動手段は、前記目標韻律に含まれる基本周波数を、予め設定された範囲内で予め設定された間隔で順次移動させる、付記1に記載の音声合成装置。
(付記3)
前記素片列選択手段は、
前記音声コーパスから、前記抽出されたセグメントデータに含まれる音素と一致する音素を有する素片全てを選択する素片選択手段と、
前記選択された素片毎に、当該素片に対応付けられた音素及び韻律に基づいた素片コストを算出する素片コスト算出手段と、
前記選択された素片夫々を、前記抽出されたセグメントデータに対応して並べて素片列を生成した場合の接続コストを算出する接続コスト算出手段と、
前記算出された素片コスト及び接続コストを含む総合コストが最良となる素片列を生成する素片列生成手段と、
を有する、付記1又は2に記載の音声合成装置。
(付記4)
前記素片コスト算出手段は、
前記選択された素片毎に、当該素片及びその前後の素片夫々に対応付けられた音素からなる音素列と、前記抽出されたセグメントデータに含まれる音素とその前後の音素とからなる音素列とを比較して音素列コストを算出する音素列コスト算出手段と、
前記選択された素片毎に、当該選択された素片に対応付けられた韻律と前記目標韻律との差に基づく韻律コストを算出する韻律コスト算出手段と、
を有する付記3に記載の音声合成装置。
(付記5)
音声合成装置が、
入力テキストデータから音素及び目標韻律が対応付けられたセグメントデータの列を抽出し、
前記目標韻律を、予め設定された範囲内でかつ予め設定された間隔で順次移動させ、
前記目標韻律が移動される毎に、音素及び韻律が対応付けられた素片の集合である音声コーパスから、前記抽出されたセグメントデータの列に対応する素片の列であって、音素および韻律に関するコストが最良となる素片の列を選定し、
前記目標韻律が移動される毎に選定された素片列のうち、前記コストが最良となる音声素片の列を決定し、
当該決定された素片の列に基づいて合成音声を出力する、音声合成方法。
(付記6)
音声合成装置として用いられるコンピュータに、
入力テキストデータから音素及び目標韻律が対応付けられたセグメントデータの列を抽出するステップと、
前記目標韻律を、予め設定された範囲内でかつ予め設定された間隔で順次移動させるステップと、
前記目標韻律が移動される毎に、音素及び韻律が対応付けられた素片の集合である音声コーパスから、前記抽出されたセグメントデータの列に対応する素片の列であって、音素および韻律に関するコストが最良となる素片の列を選定するステップと、
前記目標韻律が移動される毎に選定された素片列のうち、前記コストが最良となる音声素片の列を決定するステップと、
当該決定された素片の列に基づいて合成音声を出力するステップと、
を実行させるプログラム。
100 音声合成装置
101 テキスト入力部
102 形態素解析部
103 韻律予測部
104 韻律辞書
105 波形選択部
106 音声辞書
107 波形合成部
201 目標韻律データ
202 韻律入力部
203 韻律倍率変更部
204 コスト算出用韻律データ
205 素片選定部
205a 素片リストアップ部
205b 音声素片列選定部
206 評価部
206a 素片評価部
206b 接続評価部
206c 最良コスト判定部
207 素片候補データ
301 CPU
302 ROM(リードオンリーメモリ)
303 RAM(ランダムアクセスメモリ)
304 入力装置
305 出力装置
306 外部記憶装置
307 可搬記録媒体駆動装置
308 通信インタフェース
309 バス
310 可搬記録媒体

Claims (6)

  1. 入力テキストデータから音素及び目標韻律が対応付けられたセグメントデータの列を抽出するセグメントデータ列抽出手段と、
    前記目標韻律を、予め設定された範囲内でかつ予め設定された間隔で順次移動させる目標韻律移動手段と、
    前記目標韻律移動手段により目標韻律が移動される毎に、音素及び韻律が対応付けられた素片の集合である音声コーパスから、前記抽出されたセグメントデータの列に対応する素片の列であって、音素および韻律に関するコストが最良となる素片の列を選定する素片列選択手段と、
    前記素片列選択手段により、前記目標韻律が移動される毎に選定された素片列のうち、前記コストが最良となる音声素片の列を決定する素片列決定手段と、
    当該決定された素片の列に基づいて合成音声を出力する波形合成手段と、
    を備える音声合成装置。
  2. 前記目標韻律移動手段は、前記目標韻律に含まれる基本周波数を、予め設定された範囲内で予め設定された間隔で順次移動させる、請求項1に記載の音声合成装置。
  3. 前記素片列選択手段は、
    前記音声コーパスから、前記抽出されたセグメントデータに含まれる音素と一致する音素を有する素片全てを選択する素片選択手段と、
    前記選択された素片毎に、当該素片に対応付けられた音素及び韻律に基づいた素片コストを算出する素片コスト算出手段と、
    前記選択された素片夫々を、前記抽出されたセグメントデータに対応して並べて素片列を生成した場合の接続コストを算出する接続コスト算出手段と、
    前記算出された素片コスト及び接続コストを含む総合コストが最良となる素片列を生成する素片列生成手段と、
    を有する、請求項1又は2に記載の音声合成装置。
  4. 前記素片コスト算出手段は、
    前記選択された素片毎に、当該素片及びその前後の素片夫々に対応付けられた音素からなる音素列と、前記抽出されたセグメントデータに含まれる音素とその前後の音素とからなる音素列とを比較して音素列コストを算出する音素列コスト算出手段と、
    前記選択された素片毎に、当該選択された素片に対応付けられた韻律と前記目標韻律との差に基づく韻律コストを算出する韻律コスト算出手段と、
    を有する請求項3に記載の音声合成装置。
  5. 音声合成装置が、
    入力テキストデータから音素及び目標韻律が対応付けられたセグメントデータの列を抽出し、
    前記目標韻律を、予め設定された範囲内でかつ予め設定された間隔で順次移動させ、
    前記目標韻律が移動される毎に、音素及び韻律が対応付けられた素片の集合である音声コーパスから、前記抽出されたセグメントデータの列に対応する素片の列であって、音素および韻律に関するコストが最良となる素片の列を選定し、
    前記目標韻律が移動される毎に選定された素片列のうち、前記コストが最良となる音声素片の列を決定し、
    当該決定された素片の列に基づいて合成音声を出力する、音声合成方法。
  6. 音声合成装置として用いられるコンピュータに、
    入力テキストデータから音素及び目標韻律が対応付けられたセグメントデータの列を抽出するステップと、
    前記目標韻律を、予め設定された範囲内でかつ予め設定された間隔で順次移動させるステップと、
    前記目標韻律が移動される毎に、音素及び韻律が対応付けられた素片の集合である音声コーパスから、前記抽出されたセグメントデータの列に対応する素片の列であって、音素および韻律に関するコストが最良となる素片の列を選定するステップと、
    前記目標韻律が移動される毎に選定された素片列のうち、前記コストが最良となる音声素片の列を決定するステップと、
    当該決定された素片の列に基づいて合成音声を出力するステップと、
    を実行させるプログラム。
JP2014193112A 2014-09-22 2014-09-22 音声合成装置、方法、およびプログラム Pending JP2016065900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014193112A JP2016065900A (ja) 2014-09-22 2014-09-22 音声合成装置、方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014193112A JP2016065900A (ja) 2014-09-22 2014-09-22 音声合成装置、方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2016065900A JP2016065900A (ja) 2016-04-28
JP2016065900A5 true JP2016065900A5 (ja) 2017-11-09

Family

ID=55804135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014193112A Pending JP2016065900A (ja) 2014-09-22 2014-09-22 音声合成装置、方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP2016065900A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110415716B (zh) * 2019-07-05 2021-11-26 达闼机器人有限公司 音频混合方法、装置、存储介质及电子设备
CN112420017A (zh) * 2020-11-13 2021-02-26 北京沃东天骏信息技术有限公司 语音合成方法及装置
CN113345417B (zh) * 2021-05-31 2024-03-01 平安科技(深圳)有限公司 语音合成方法、装置、设备以及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005091747A (ja) * 2003-09-17 2005-04-07 Mitsubishi Electric Corp 音声合成装置
JP5512597B2 (ja) * 2011-05-13 2014-06-04 日本電信電話株式会社 音声合成装置とその方法とプログラム
US9401138B2 (en) * 2011-05-25 2016-07-26 Nec Corporation Segment information generation device, speech synthesis device, speech synthesis method, and speech synthesis program

Similar Documents

Publication Publication Date Title
CN106816148B (zh) 语音识别设备和方法
US10319373B2 (en) Information processing device, information processing method, computer program product, and recognition system
KR20210144789A (ko) 텍스트-음성 변환 분석을 위한 듀레이션 정보 기반 어텐션 네트워크
EP3021318A1 (en) Speech synthesis apparatus and control method thereof
JP6400936B2 (ja) 音声検索方法、音声検索装置、並びに、音声検索装置用のプログラム
JP2017032839A (ja) 音響モデル学習装置、音声合成装置、音響モデル学習方法、音声合成方法、プログラム
CN105390049A (zh) 电子装置和发音学习支援方法
JP2008216756A (ja) 語句として新たに認識するべき文字列等を取得する技術
KR20140028174A (ko) 음성 인식 방법 및 이를 적용한 전자 장치
JP6585022B2 (ja) 音声認識装置、音声認識方法およびプログラム
CN106528706B (zh) 音乐检索方法及装置
KR20100130263A (ko) 음성 인식용 발음사전 확장 장치 및 방법
US9390709B2 (en) Voice recognition device and method, and semiconductor integrated circuit device
JP2015014665A (ja) 音声認識装置及び方法、並びに、半導体集積回路装置
JP2016065900A5 (ja)
JP2014066779A5 (ja)
JP6073540B2 (ja) 情報提供システム
Mukherjee et al. A Bengali speech synthesizer on Android OS
JP2015084047A (ja) 文集合作成装置、文集合作成方法および文集合作成プログラム
JP2016065900A (ja) 音声合成装置、方法、およびプログラム
JP7180132B2 (ja) 処理プログラム、処理方法および情報処理装置
JP2016142936A5 (ja)
JP6009396B2 (ja) 発音付与方法とその装置とプログラム
JP2009058548A (ja) 音声検索装置
KR20160036995A (ko) 음성 신호 전처리 방법 및 장치