JP5269668B2 - 音声合成装置、プログラム、及び方法 - Google Patents

音声合成装置、プログラム、及び方法 Download PDF

Info

Publication number
JP5269668B2
JP5269668B2 JP2009074849A JP2009074849A JP5269668B2 JP 5269668 B2 JP5269668 B2 JP 5269668B2 JP 2009074849 A JP2009074849 A JP 2009074849A JP 2009074849 A JP2009074849 A JP 2009074849A JP 5269668 B2 JP5269668 B2 JP 5269668B2
Authority
JP
Japan
Prior art keywords
sentence
synthesized sound
target sentence
target
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009074849A
Other languages
English (en)
Other versions
JP2010230699A (ja
Inventor
伸晃 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2009074849A priority Critical patent/JP5269668B2/ja
Priority to US12/559,844 priority patent/US8626510B2/en
Publication of JP2010230699A publication Critical patent/JP2010230699A/ja
Application granted granted Critical
Publication of JP5269668B2 publication Critical patent/JP5269668B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Description

本発明は、音声合成装置、プログラム、及び方法に関する。
従来から、交通情報や天気概況の音声サービス、銀行の振り込み照会サービス、又はロボット等の擬人化される装置のインタフェースなどに音声合成装置が使用されている。このため、音声合成装置は聞取りやすく、自然な合成音声を提供する必要がある。
このような技術として、例えば特許文献1では、固定情報である定型部と可変情報である非定型部から構成される文の音声合成を行う場合に、定型部に関しては、同文を人間が発声した音声から基本周波数の時間変化パターン(以下、「F0パターン」と称する)を抽出し蓄積しておく。また、非定型部に関しては、入力が期待される単語あるいは分節などの音節数とアクセント型のすべての組合せのF0パターンを蓄積しておく。そして、定型部および非定型部それぞれのF0パターンを選択又は生成して接続することにより、文として自然な合成音声を作成する方法が開示されている。
特開平8−63187号公報
しかしながら、上記したような従来の音声合成装置では、単一の文章の合成音声しか生成されないため、合成音の接続に伴う不自然さが目立つ合成音声が生成されてしまう場合がある。
本発明は、上記事情に鑑みてなされたものであり、合成音の接続に伴う不自然さを軽減した合成音声を生成することができる音声合成装置、プログラム、及び方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明の一態様にかかる音声合成装置は、他の語句に置換されない定型部分と他の語句に置換される非定型部分とを含む意味的に等価な複数の雛形文章と、前記非定型部分を置換する置換語句とを取得する取得部と、前記雛形文章それぞれに対し、前記非定型部分を前記置換語句で置換して複数の目標文章を生成する文章生成部と、前記目標文章それぞれに対し、前記定型部分の合成音である第1合成音を生成する第1合成音生成部と、前記目標文章それぞれに対し、前記置換語句の合成音である第2合成音を生成する第2合成音生成部と、前記目標文章それぞれに対し、前記第1合成音と前記第2合成音との接続境界の不連続値を演算する演算部と、複数の前記目標文章の中から、前記不連続値が最小となる前記目標文章を選択する選択部と、選択された前記目標文章の前記第1合成音及び前記第2合成音を接続する接続部と、を備えることを特徴とする。
また、本発明の別の態様にかかる音声合成装置は、他の語句に置換されない定型部分と他の語句に置換される非定型部分とを含む雛形文章と、前記非定型部分を置換する置換語句とを取得する取得部と、前記非定型部分を前記置換語句で置換して目標文章を生成する第1文章生成部と、前記目標文章との類似度が閾値を超える代替目標文章を生成する第2文章生成部と、前記目標文章及び前記代替目標文章に対し、前記定型部分の合成音である第1合成音を生成する第1合成音生成部と、前記目標文章及び前記代替目標文章に対し、前記置換語句の合成音である第2合成音を生成する第2合成音生成部と、前記目標文章及び前記代替目標文章に対し、前記第1合成音と前記第2合成音との接続境界の不連続値を演算する演算部と、前記目標文章及び前記代替目標文章の中から、前記不連続値が最小となる前記目標文章又は前記代替目標文章を選択する選択部と、選択された前記目標文章又は前記代替目標文章の前記第1合成音及び前記第2合成音を接続する接続部と、を備えることを特徴とする。
本発明によれば、合成音の接続に伴う不自然さを軽減した合成音声を生成することができるという効果を奏する。
第1の実施の形態の音声合成装置の構成の一例を示すブロック図である。 第1の実施の形態の取得部により取得される複数の雛型文章の一例を示す図である。 第1の実施の形態の取得部により取得される置換語句の一例を示す図である。 第1の実施の形態の文章生成部により生成される複数の目標文章の一例を示す図である。 第1の実施の形態の演算部による不連続値の演算手法の一例の説明図である。 第1の実施の形態の接続部により各合成音が接続されることで生成される合成音声の一例を示す図である。 第1の実施の形態の音声合成装置で行われる音声合成処理の手順の流れの一例を示すフローチャートを示す図である。 第2の実施の形態の音声合成装置の構成の一例を示すブロック図である。 第2の実施の形態の代替目標文章生成部が用語の語順を入れ替えることにより代替目標文章を生成する例の説明図である。 第2の実施の形態の代替目標文章生成部が用語を同義語と入れ換えることにより代替目標文章を生成する例の説明図である。 第2の実施の形態の代替目標文章生成部が表現を別表現と入れ替えるにより代替目標文章を生成する例の説明図である。 第2の実施の形態の代替目標文章生成部が表現を別表現と入れ替えるにより代替目標文章を生成する例の説明図である。 第2の実施の形態の代替目標文章生成部が表現を別表現と入れ替えるにより代替目標文章を生成する例の説明図である。 第2の実施の形態の音声合成装置で行われる音声合成処理の手順の流れの一例を示すフローチャートを示す図である。
以下、添付図面を参照しながら、本発明にかかる音声合成装置、プログラム、及び方法の最良な実施の形態を詳細に説明する。
(第1の実施の形態)
第1の実施の形態では、それぞれの文章が類似する複数の雛形文章の非定型部分を置換語句に置換して複数の目標文章を生成し、生成した複数の目標文章の中から定型合成音と規則合成音との接続境界の不連続値が最小となる目標文章を選択し、選択した目標文章の定型合成音と規則合成音とを接続して合成音声を出力する例について説明する。
まず、第1の実施の形態の音声合成装置の構成について説明する。
図1は、第1の実施の形態の音声合成装置1の構成の一例を示すブロック図である。図1に示すように、音声合成装置1は、入力部10と、出力部20と、記憶部30と、取得部40と、文章生成部45と、定型合成音生成部50と、規則合成音生成部55と、演算部60と、選択部65と、接続部70と、出力制御部75とを備える。
入力部10は、音声合成の対象となる文章や語句などの入力を行うものであり、例えば、キーボード、マウス、又はタッチパネルなどの既存の入力装置により実現できる。
出力部20は、後述する出力制御部75の指示により、音声合成結果を音声出力するものであり、例えば、スピーカなどの既存の音声出力装置により実現できる。
記憶部30は、音声合成装置1で行われる各種処理に使用される情報を記憶するものであり、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカード、光ディスク、又はRAM(Random Access Memory)などの磁気的、電気的、又は光学的に記憶可能な既存の記憶媒体により実現できる。そして記憶部30は、音声記憶部32と、辞書記憶部34とを含む。なお、音声記憶部32及び辞書記憶部34の詳細については後述する。
取得部40は、他の語句に置換されない定型部分と他の語句に置換される非定型部分とを含み、それぞれの文章が類似する複数の雛形文章と、非定型部分を置換する置換語句とを取得する。具体的には、取得部40は、入力部10から入力される複数の雛形文章及び置換語句を取得する。「類似する」とは、複数の雛形文章それぞれが意味的に等価であることを意味するものであり、ユーザが決定したものでもよいし、雛形文章間の類似度が閾値を超えるものでもよい。「語句」とは、1文字でもよいし、1単語でもよく、これらの組合せであってもよい。
図2は、取得部40により取得される複数の雛型文章の一例を示す図である。図2に示す雛形文章群は、いずれの文章もある地方の今夜の天気情報を伝えることを意図したものであり、意味的に等価である。各雛形文章とも、Aには特定の地方名(例えば、東京、神奈川県、千葉など)が入り、Bには特定の天候状況(例えば、晴れ、曇り、雨など)が入ることを想定している。
なお本実施の形態では、雛型文章中において、記号‘[’及び‘]’で囲まれた部分を非定型部分とし、それ以外の部分を定型部分として説明している。従って、例えば図2に示す雛形文章101では、語句102、103、及び104が定型部分となり、A及びBが非定型部分となる。
図3は、取得部40により取得される置換語句の一例を示す図である。図3に示す置換語句111、112は、それぞれ図2に示す雛形文章群の非定型部分であるA、Bを置換するものである。
図1に戻り、文章生成部45は、取得部40により取得された雛形文章それぞれに対し、非定型部分を取得部40により取得された置換語句で置換して複数の目標文章を生成する。
図4は、文章生成部45により生成される複数の目標文章の一例を示す図である。図4に示す目標文章群は、図2に示す各雛形文章の非定型部分であるA、Bをそれぞれ置換語句111、112で置換して生成されたものである。例えば図4に示す目標文章121は、図2に示す雛形文章101の非定型部分であるA、Bをそれぞれ置換語句111、112で置換して生成されたものである。
図1に戻り、音声記憶部32には、後述の定型合成音生成部50が音声合成の際に用いる音声データが記憶されている。なお、「音声データ」とは、予め録音された音声の音声波形や、当該音声を変換した音声パラメータなどである。「音声パラメータ」とは、データ容量を圧縮するために音声生成モデルを用いて音声を数値化したものであり、ホルマント、PARCOR、LSP、LPC、ケプストラムなどの種類がある。また、音声パラメータは、表音文字ごと、あるいは先行・後続の表音文字などの環境により細分化した単位で記憶されている。
定型合成音生成部50(第1合成音生成部の一例)は、文章生成部45により生成された目標文章それぞれに対し、定型部分の合成音である定型合成音(第1合成音の一例)を生成する。具体的には、定型合成音生成部50は、音声記憶部32に記憶されている音声データを用いて、文章生成部45により生成された目標文章それぞれに対し、定型合成音を生成する。
なお、定型合成音の生成には、予め録音された音声を再生する録音編集方式や、録音しておいた音声を変換した音声パラメータから音声を合成する分析合成方式などを用いることができる。分析合成方式としては、例えば、ホルマント合成、PARCOR合成、LSP合成、LPC合成、ケプストラム合成、又は波形を直接編集する波形編集方式などが挙げられる。そして、分析合成方式では、表音文字などから定型部分の音声パラメータ列を生成し、定型部分の持続時間長、F0パターン、音声パラメータ列から定型合成音を生成する。
辞書記憶部34には、後述の規則合成音生成部55が音声合成の際に用いる辞書データや自然音声から抽出した音声パラメータ列などが記憶されている。なお、「辞書データ」とは、語句の形態素解析や構文解析などの言語解析を行うためのデータや、アクセントやイントネーションの処理に用いられるデータなどである。また辞書記憶部34には、音声パラメータ列をモデルにより近似したモデルパラメータを記憶しておいてもよい。
規則合成音生成部55(第2合成音生成部の一例)は、文章生成部45により生成された目標文章それぞれに対し、置換語句の合成音である規則合成音(第2合成音の一例)を生成する。具体的には、規則合成音生成部55は、辞書記憶部34に記憶されている辞書データを参照して、文章生成部45により生成された目標文章それぞれに対し、規則合成音を生成する。
なお、規則合成音の生成には、辞書データなどの規則を用いて、語句から音声を生成する規則音声合成方式などを用いることができる。規則音声合成方式としては、例えば、自然音声から抽出した音声パラメータ列を読み込む方式、モデルパラメータを音声パラメータ列の時系列に変換し生成する方式、又は語句解析結果からモデルパラメータを規則的に生成し、該モデルパラメータを音声パラメータ列の時系列に変換し生成する方式などを用いてもよい。
演算部60は、文章生成部45により生成された目標文章それぞれに対し、定型合成音生成部50により生成された定型合成音と規則合成音生成部55により生成された規則合成音との境界の不連続値を演算する。
図5は、演算部60による不連続値の演算手法の一例の説明図である。図5に示す音声波形群は、図4に示す各目標文章に対して生成された合成音を示しており、演算部60は、目標文章毎に音声波形の接続境界の不連続値を歪み値εとして演算する。
例えば図5に示す音声波形132、133、及び134は、それぞれ目標文章121の定型部分である語句102、103、及び104の定型合成音を示している。同様に、音声波形141、及び142は、それぞれ目標文章121の置換語句111、及び112の規則合成音を示している。このように、図5に示す例では、目標文章121に対して5つの合成音が生成されており、目標文章121の接続境界は、接続境界151〜154の4つとなる。そして、演算部60は、目標文章121の接続境界151〜154の不連続値を歪み値ε81として演算する。
なお、図5に示す目標文章121のように、接続境界が複数存在する場合には、各接続境界の不連続値のうち最も不連続度合が高いものを歪み値εとしてもよいし、各接続境界の不連続値の加算値や平均値を歪み値εとしてもよい。
図1に戻り、選択部65は、文章生成部45により生成された複数の目標文章の中から、演算部60により演算された不連続値が最小となる目標文章を選択する。具体的には、選択部65は、数式(1)を用いて、複数の目標文章の不連続値の中から最小の不連続値であるε_bestを特定し、このε_bestを有する目標文章を選択する。
数式(1)において、「ε_n」は、複数の目標文章それぞれの歪み値εを示す値であり、例えば図5に示す例では、ε_n={ε81...ε90}となる。つまり、数式(1)では、ε_nの中から最小のεを特定している。
なお、図5に示す例では、ε_best=ε81と仮定し、選択部65は、図5に示す目標文章の中から、目標文章121を選択するものとする。
接続部70は、選択部65により選択された目標文章の定型合成音及び規則合成音を接続する。なお、接続部70は、各合成音の接続境界が滑らかにつながるように、スムージング等の後処理を行うようにしてもよい。
図6は、接続部70により各合成音が接続されることで生成される合成音声の一例を示す図であり、目標文章121の合成音声を示している。図5に示す例では、選択部65により目標文章121が選択されるため、接続部70は、図6に示すように、音声波形132、141、133、142、及び134を接続して、目標文章121の合成音声を生成する。
出力制御部75は、接続部70により接続された合成音声を出力部20に音声出力させる。具体的には、出力制御部75は、接続部70により接続された合成音声をD/A変換などによりアナログ信号に変換して出力部20に音声出力させる。
なお、取得部40、文章生成部45、定型合成音生成部50、規則合成音生成部55、演算部60、選択部65、接続部70、及び出力制御部75については、例えば、CPU(Central Processing Unit)やASIC(Application Specific Integrated Circuit)などの既存の制御装置により実現できる。
次に、第1の実施の形態の音声合成装置の動作について説明する。
図7は、第1の実施の形態の音声合成装置1で行われる音声合成処理の手順の流れの一例を示すフローチャートである。
ステップS10では、取得部40は、入力部10から入力される複数の雛形文章と、置換語句を取得する。
ステップS12では、文章生成部45は、取得部40により取得された雛形文章それぞれに対し、取得部40により取得された非定型部分を置換語句で置換して複数の目標文章を生成する。
ステップS14では、定型合成音生成部50は、音声記憶部32に記憶されている音声データを用いて、文章生成部45により生成された目標文章それぞれに対し、定型合成音を生成する。
ステップS16では、規則合成音生成部55は、辞書記憶部34に記憶されている辞書データを参照して、文章生成部45により生成された目標文章それぞれに対し、規則合成音を生成する。
ステップS18では、演算部60は、文章生成部45により生成された目標文章それぞれに対し、定型合成音生成部50により生成された定型合成音と規則合成音生成部55により生成された規則合成音との境界の不連続値を演算する。
ステップS20では、選択部65は、文章生成部45により生成された複数の目標文章の中から、演算部60により演算された不連続値が最小となる目標文章を選択する。
ステップS22では、接続部70は、選択部65により選択された目標文章の定型合成音及び規則合成音を接続する。
ステップS24では、出力制御部75は、接続部70により接続された合成音声を出力部20に音声出力させる。
このように第1の実施形態では、意味的に等価な複数の雛形文章の非定型部分を置換語句に置換して複数の目標文章を生成し、複数の目標文章の中から定型合成音と規則合成音との接続境界の不連続値が最小となる目標文章を選択し、選択した目標文章の定型合成音と規則合成音とを接続して合成音声を出力する。
従って、第1の実施形態によれば、意味的に等価な複数の目標文章の中から、不連続値が最小の目標文章の合成音声が出力されるため、合成音の接続に伴う不自然さを軽減した合成音声を生成することができる。
(第2の実施の形態)
次に、第2の実施の形態では、単一の雛型文章から目標文章、及び目標文章と意味的に等価な代替目標文章を生成し、生成した目標文章及び代替目標文章の中から定型合成音と規則合成音との接続境界の不連続値が最小となる文章を選択し、選択した文章の定型合成音と規則合成音とを接続して合成音声を出力する例について説明する。
なお、以下では、第1の実施の形態との相違点の説明を主に行い、第1の実施の形態と同様の機能を有する構成要素については、第1の実施の形態と同様の名称・符号を付し、その説明を省略する。
まず、第2の実施の形態の音声合成装置の構成について説明する。
図8は、第2の実施の形態の音声合成装置1001の構成の一例を示すブロック図である。図8に示す音声合成装置1001は、取得部1040が単一の雛型文章を取得する点で、第1の実施の形態の音声合成装置1と相違する。
また、音声合成装置1001は、文章生成部45に代えて目標文章生成部1045及び代替目標文章生成部1046を備える点で、音声合成装置1と相違する。
また、音声合成装置1001は、目標文章及び代替目標文章に対して、定型合成音生成部1050、規則合成音生成部1055、演算部1060が、それぞれ定型合成音の生成、規則合成音の生成、不連続値の演算を行う点で、第1の実施の形態の音声合成装置1と相違する。
また、音声合成装置1001は、選択部1065、接続部1070が、それぞれ不連続値が最小の目標文章又は代替目標文章の選択、選択された目標文章又は代替目標文章の各合成音の接続を行う点で、第1の実施の形態の音声合成装置1と相違する。
従って、以下では、第1の実施の形態と第2の実施の形態の主要な相違点である目標文章生成部1045及び代替目標文章生成部1046について説明する。
目標文章生成部1045(第1文章生成部の一例)は、取得部1040により取得された雛形文章の非定型部分を、取得部1040により取得された置換語句で置換して目標文章を生成する。なお、目標文章生成部1045は、生成する目標文章が単一である点を除き、第1の実施の形態の文章生成部45と同様であるため、詳細な説明は省略する。
代替目標文章生成部1046(第2文章生成部の一例)は、目標文章生成部1045により生成された目標文章との類似度が閾値を超える代替目標文章を生成する。具体的には、代替目標文章生成部1046は、雛形文章中の語句の語順の入れ替え、雛形文章中の語句の同義語との入れ換え、及び雛形文章中の表現の別表現との入れ替えの少なくともいずれかを行うとともに、非定型部分を置換語句で置換して、代替目標文章を生成する。
なお、代替目標文章生成部1046は、目標文章と代替目標文章との相違度合いを表す編集距離を用いて類似度を演算しており、この類似度が閾値を超える代替目標文章を生成する。具体的には、代替目標文章生成部1046は、以下の数式(2)により目標文章と代替目標文章との類似度を演算している。
数式(2)において、類似度Φは0〜1の値をとり、1に近いほど互いの文章の意味が近いこと(等価であること)を表す。編集距離γは、以下の操作を何回行うことにより目標文章から代替目標文章を生成できるかを表したものである。「操作」とは、(1)目標文章のある箇所に語句を挿入する、(2)目標文章のある箇所から語句を削除する、(3)目標文章のある箇所の前後を入れ換えるというものである。
以下では、類似度の閾値を0.3に設定した場合を例にとり、代替目標文章の生成手法を具体的に説明する。
図9は、代替目標文章生成部1046が用語の語順を入れ替えることにより代替目標文章を生成する例の説明図である。図9に示す例では、代替目標文章生成部1046は、雛形文章101に対して言語解析、構文解析などの自然言語処理を行うことにより、語句102及び語句1105は語句1106に係っており、語句102と語句1105の語順の入れ替えが可能であると判別する。
また、語句102と語句1105の語順を入れ替え、非定型部分A、Bをそれぞれ置換語句111、112で置換した文章1121は、雛形文章101の非定型部分A、Bをそれぞれ置換語句111、112で置換した目標文章から、語句102と語句1105の語順を入れ替えることより生成できると、代替目標文章生成部1046は判別する。
このため、文章1121と、雛形文章101から生成された目標文章とでは、置換距離γ=1、類似度Φ=0.5となり、類似度が閾値を超えるため、代替目標文章生成部1046は、文章1121を代替目標文章として生成する。
図10は、代替目標文章生成部1046が用語を同義語と入れ換えることにより代替目標文章を生成する例の説明図である。図10に示す例では、代替目標文章生成部1046は、同義語が定義された同義語表(図示省略)を参照することにより、雛形文章1201の語句1202は、同義語1203との入れ換え可能であると判別する。なお、同義語表は記憶部30などに予め記憶しておけば、代替目標文章生成部1046は参照できる。
また、語句1202を同義語1203に入れ替え、非定型部分C、Dをそれぞれ置換語句1211、1212で置換した文章1221は、雛形文章1201の非定型部分C、Dをそれぞれ置換語句1211、1212で置換した目標文章から、語句1202を同義語1203に入れ替えることより生成できると、代替目標文章生成部1046は判別する。
このため、文章1221と、雛形文章1201から生成された目標文章とでは、置換距離γ=1、類似度Φ=0.5となり、類似度が閾値を超えるため、代替目標文章生成部1046は、文章1221を代替目標文章として生成する。
図11は、代替目標文章生成部1046が表現を別表現と入れ替えることにより代替目標文章を生成する例の説明図である。図11に示す例では、代替目標文章生成部1046は、シソーラス又はフレーザル・シソーラスなどを用いることにより、雛形文章1301の表現1302は、表現1303との入れ換え可能であると判別する。なお、シソーラスなどは記憶部30などに予め記憶しておけば、代替目標文章生成部1046は参照できる。
また、表現1302を表現1303に入れ替え、非定型部分Eを置換語句1311で置換した文章1321は、雛形文章1301の非定型部分Eを置換語句1311で置換した目標文章から、表現1302を表現1303に入れ替えることより生成できると、代替目標文章生成部1046は判別する。
このため、文章1321と、雛形文章1301から生成された目標文章とでは、置換距離γ=1、類似度Φ=0.5となり、類似度が閾値を超えるため、代替目標文章生成部1046は、文章1321を代替目標文章として生成する。
図12は、代替目標文章生成部1046が表現を別表現と入れ替えることにより代替目標文章を生成する例の説明図である。図12に示す例においても、代替目標文章生成部1046は、シソーラス又はフレーザル・シソーラスなどを用いることにより、雛形文章1401の表現1402は、表現1403との入れ換え可能であると判別する。なお、表現1402及び表現1403はいずれも動詞が続く表現である。
また、表現1402を表現1403に入れ替え、非定型部分Fを置換語句1411で置換した文章1421は、雛形文章1401の非定型部分Fを置換語句1411で置換した目標文章から、表現1402を表現1403に入れ替えることより生成できると、代替目標文章生成部1046は判別する。
このため、文章1421と、雛形文章1401から生成された目標文章とでは、置換距離γ=1、類似度Φ=0.5となり、類似度が閾値を超えるため、代替目標文章生成部1046は、文章1421を代替目標文章として生成する。
図13は、代替目標文章生成部1046が表現を別表現と入れ替えることにより代替目標文章を生成する例の説明図である。図13に示す例では、代替目標文章生成部1046は、シソーラス又はフレーザル・シソーラスなどを用いることにより、雛形文章1501の表現1502、1503を、それぞれ表現1504、表現1505に入れ替えることが可能であると判別する。
また、表現1502、1503を、それぞれ表現1504、表現1505に入れ替え、非定型部分G、Hをそれぞれ置換語句1511、1512で置換した文章1521は、雛形文章1501の非定型部分G、Hをそれぞれ置換語句1511、1512で置換した目標文章を、表現1504、表現1505に入れ替えることにより生成できると、代替目標文章生成部1046は判別する。
このため、文章1521と、雛形文章1501から生成された目標文章とでは、置換距離γ=1、類似度Φ=0.5となり、類似度が閾値を超えるため、代替目標文章生成部1046は、文章1521を代替目標文章として生成する。
なお、第2の実施形態では、編集距離を用いて類似度を演算したが、シソーラス及びフレーザル・シソーラスなどでは語句や表現が階層的に分類されているため、この階層構造を利用して類似度を演算するようにしてもよい。この場合、代替目標文章生成部1046は、以下の数式(3)により目標文章と代替目文章との類似度を演算できる。
数式(3)において、「Lc」は階層構造上の共通上位階層の深さであり、「La」は目標文章中の語句であり、「Lb」は目標文章中の語句に対応する代替目標文章中の語句である。階層類似度ξは0〜1の値をとり、1に近いほど同一言語情報に近いことを表す。
また、代替目標文章を作成する手法は、上述した手法以外にも、例えば、乾健太郎,藤田篤,「言い換え技術に関する研究動向」,自然言語処理,Vol.11,No.5,pp.151−198,2004.10.などに開示された既存の手法を用いることができる。
以下、定型合成音生成部1050、規則合成音生成部1055、演算部1060が行う処理は、目標文章及び代替目標文章に行う点を除き、それぞれ第1の実施の形態の定型合成音生成部50、規則合成音生成部55、演算部60と同様であるため、詳細な説明は省略する。
また、選択部1065、接続部1070が行う処理も、目標文章又は代替目標文章に行う点を除き、それぞれ第1の実施の形態の選択部65、接続部70と同様であるため、詳細な説明は省略する。
次に、第2の実施の形態の音声合成装置の動作について説明する。
図14は、第2の実施の形態の音声合成装置1001で行われる音声合成処理の手順の流れの一例を示すフローチャートである。
ステップS100では、取得部1040は、入力部10から入力される雛形文章と、置換語句を取得する。
ステップS102では、目標文章生成部1045は、取得部1040により取得された雛形文章の非定型部分を、取得部1040により取得された置換語句で置換して目標文章を生成する。
ステップS104では、代替目標文章生成部1046は、目標文章生成部1045により生成された目標文章との類似度が閾値を超える代替目標文章を生成する。
ステップS106では、定型合成音生成部1050は、音声記憶部32に記憶されている音声データを用いて、目標文章生成部1045により生成された目標文章及び代替目標文章生成部1046により生成された代替目標文章に対し、定型合成音を生成する。
ステップS108では、規則合成音生成部1055は、辞書記憶部34に記憶されている辞書データを参照して、目標文章生成部1045により生成された目標文章及び代替目標文章生成部1046により生成された代替目標文章に対し、規則合成音を生成する。
ステップS110では、演算部1060は、目標文章生成部1045により生成された目標文章及び代替目標文章生成部1046により生成された代替目標文章に対し、定型合成音生成部1050により生成された定型合成音と規則合成音生成部1055により生成された規則合成音との境界の不連続値を演算する。
ステップS112では、選択部1065は、目標文章生成部1045により生成された目標文章及び代替目標文章生成部1046により生成された代替目標文章の中から、演算部1060により演算された不連続値が最小となる目標文章又は代替目標文章を選択する。
ステップS114では、接続部1070は、選択部1065により選択された目標文章又は代替目標文章の定型合成音及び規則合成音を接続する。
ステップS116の処理は、図7に示すフローチャートのステップS24の処理と同様であるため、説明を省略する。
このように第2の実施形態では、単一の雛型文章から目標文章、及び目標文章と意味的に等価な代替目標文章を生成し、生成した目標文章及び代替目標文章の中から定型合成音と規則合成音との接続境界の不連続値が最小となる文章を選択し、選択した文章の定型合成音と規則合成音とを接続して合成音声を出力する。
従って第2の実施形態では、意味的に等価な複数の雛形文章を予めユーザが準備しておかなくても目標文章と意味的に等価な代替目標文章が自動的に生成され、目標文章及び代替目標文章の中から、不連続値が最小の目標文章の合成音声が出力される。このため第2の実施形態によれば、開発者等による人手による負荷を抑えつつ、合成音の接続に伴う不自然さを軽減した合成音声を生成することができる。
なお、上記実施の形態の音声合成装置1、1001は、CPUなどの制御装置と、ROM(Read Only Memory)やRAMなどの記憶装置と、HDD、SSD、リムーバブルドライブ装置などの外部記憶装置と、スピーカなどの音声出力装置と、キーボードやマウスなどの入力装置を備えており、通常のコンピュータを利用したハードウェア構成となっている。
上記実施の形態の音声合成装置1、1001で実行される音声合成プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
また、上記実施の形態の音声合成装置1、1001で実行される音声合成プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、上記実施の形態の音声合成装置1、1001で実行される音声合成プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
また、上記実施の形態の音声合成装置1、1001で実行される音声合成プログラムを、ROM等に予め組み込んで提供するように構成してもよい。
上記実施の形態の音声合成装置1、1001で実行される音声合成プログラムは、上述した各部(取得部、文章生成部、定型合成音生成部、規則合成音生成部、演算部、選択部、接続部、出力制御部等)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体から音声合成プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、取得部、文章生成部、定型合成音生成部、規則合成音生成部、演算部、選択部、接続部、出力制御部等が主記憶装置上に生成されるようになっている。
(変形例)
なお、本発明は、上記実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施の形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施の形態にわたる構成要素を適宜組み合わせても良い。
(変形例1)
例えば、上記実施の形態の演算部60、1060は、音響的特徴を表すスペクトルの時間変化が接続境界において不連続であると自然性劣化の原因となることから、スペクトルパラメータに関する不連続度合いを表すスペクトル距離の総和をスペクトル歪みとして考慮して、不連続値を演算してもよい。
(変形例2)
また、上記実施の形態の演算部60、1060は、抑揚特徴を表す基本周波数の時間変化が接続境界において不連続であると自然性劣化の原因となることから、基本周波数に関する不連続度合を表す基本周波数距離の総和を基本周波数歪みとして考慮して、不連続値を演算してもよい。
(変形例3)
また、上記実施の形態の演算部60、1060は、規則音声合成方式では規則作成時の低頻度の共起音韻は高頻度の共起音韻と比べ自然性に劣る場合が多いことから、音韻環境に関する共起確率の逆数を音韻共起歪みとして考慮して、不連続値を演算してもよい。
(変形例4)
また、上記実施の形態の演算部60、1060は、同一の目標文章が頻繁に用いられると自然性に欠けることから、過去に高頻度で用いられた目標文章があまり用いられないよう、演算済みの不連続値である演算済不連続値に選択部65、1065による目標文書の選択頻度に伴う重み付けを行い、この重み付けされた演算済不連続値を考慮して不連続値を演算してもよい。なお、重み付けされた演算済不連続値としては、例えば、目標文書の演算済不連続値に当該目標文書の選択頻度を乗じたものなどが挙げられる。
このようにすると、同一の目標文章の合成音声が連続して出力されるのではなく、意味的に等価な他の目標文章の合成音声が出力されることになるため、ロボット等の擬人化される装置のインタフェースに適した音声合成を実現できる。
(変形例5)
また、上記実施の形態では、入力部10から入力された雛形文章と置換語句を取得する例について説明したが、雛形文章及び置換語句を予め記憶部30に記憶しておき、取得部40、1040が記憶部30から雛形文章及び置換語句を取得するようにしてもよい。
(変形例6)
また第2の実施の形態では、単一の雛型文章から目標文章、及び代替目標文章を生成する例について説明したが、第2の実施の形態においても複数の雛型文章から複数の目標文章、及び複数の代替目標文章を生成するようにしてもよい。
(変形例7)
また第2の実施の形態では、雛型文章中の語句の入れ替え等を行った後に非定型部分を置換して代替目標文章を生成する例について説明したが、雛型文章の非定型部分を置換して目標文章を生成した後に、目標文章の語句の入れ替え等を行って代替目標文章を生成するようにしてもよい。
40、1040 取得部
45 文章生成部
50、1050 定型合成音生成部
55、1055 規則合成音生成部
60、1060 演算部
65、1065 選択部
70、1070 接続部

Claims (9)

  1. 他の語句に置換されない定型部分と他の語句に置換される非定型部分とを含む意味的に等価な複数の雛形文章と、前記非定型部分を置換する置換語句とを取得する取得部と、
    前記雛形文章それぞれに対し、前記非定型部分を前記置換語句で置換して複数の目標文章を生成する文章生成部と、
    前記目標文章それぞれに対し、前記定型部分の合成音である第1合成音を生成する第1合成音生成部と、
    前記目標文章それぞれに対し、前記置換語句の合成音である第2合成音を生成する第2合成音生成部と、
    前記目標文章それぞれに対し、前記第1合成音と前記第2合成音との接続境界の不連続値を演算する演算部と、
    複数の前記目標文章の中から、前記不連続値が最小となる前記目標文章を選択する選択部と、
    選択された前記目標文章の前記第1合成音及び前記第2合成音を接続する接続部と、
    を備えることを特徴とする音声合成装置。
  2. 他の語句に置換されない定型部分と他の語句に置換される非定型部分とを含む雛形文章と、前記非定型部分を置換する置換語句とを取得する取得部と、
    前記非定型部分を前記置換語句で置換して目標文章を生成する第1文章生成部と、
    前記目標文章との類似度が閾値を超える代替目標文章を生成する第2文章生成部と、
    前記目標文章及び前記代替目標文章に対し、前記定型部分の合成音である第1合成音を生成する第1合成音生成部と、
    前記目標文章及び前記代替目標文章に対し、前記置換語句の合成音である第2合成音を生成する第2合成音生成部と、
    前記目標文章及び前記代替目標文章に対し、前記第1合成音と前記第2合成音との接続境界の不連続値を演算する演算部と、
    前記目標文章及び前記代替目標文章の中から、前記不連続値が最小となる前記目標文章又は前記代替目標文章を選択する選択部と、
    選択された前記目標文章又は前記代替目標文章の前記第1合成音及び前記第2合成音を接続する接続部と、
    を備えることを特徴とする音声合成装置。
  3. 前記第2文章生成部は、前記雛形文章中の語句の語順の入れ替え、前記雛形文章中の語句の同義語との入れ換え、及び前記雛形文章中の表現の別表現との入れ替えの少なくともいずれかを行うとともに、前記非定型部分を前記置換語句で置換して、前記代替目標文章を生成することを特徴とする請求項2に記載の音声合成装置。
  4. 前記演算部は、前記第1合成音と前記第2合成音との接続境界のスペクトル歪み、基本周波数歪み、音韻共起歪みの少なくともいずれかを考慮して前記不連続値を演算することを特徴とする請求項1乃至請求項3のいずれか1項に記載の音声合成装置。
  5. 前記演算部は、演算済みの前記不連続値である演算済不連続値に、前記選択部による前記目標文書の選択頻度に伴う重み付けを行い、重み付けが行われた前記演算済不連続値を考慮して前記不連続値を演算することを特徴とする請求項1乃至請求項4のいずれか1項に記載の音声合成装置。
  6. 取得部が、他の語句に置換されない定型部分と他の語句に置換される非定型部分とを含む意味的に等価な複数の雛形文章と、前記非定型部分を置換する置換語句とを取得する取得ステップと、
    文章生成部が、前記雛形文章それぞれに対し、前記非定型部分を前記置換語句で置換して複数の目標文章を生成する文章生成ステップと、
    第1合成音生成部が、前記目標文章それぞれに対し、前記定型部分の合成音である第1合成音を生成する第1合成音生成ステップと、
    第2合成音生成部が、前記目標文章それぞれに対し、前記置換語句の合成音である第2合成音を生成する第2合成音生成ステップと、
    演算部が、前記目標文章それぞれに対し、前記第1合成音と前記第2合成音との接続境界の不連続値を演算する演算ステップと、
    選択部が、複数の前記目標文章の中から、前記不連続値が最小となる前記目標文章を選択する選択ステップと、
    接続部が、選択された前記目標文章の前記第1合成音及び前記第2合成音を接続する接続ステップと、
    をコンピュータに実行させるための音声合成プログラム。
  7. 取得部が、他の語句に置換されない定型部分と他の語句に置換される非定型部分とを含む雛形文章と、前記非定型部分を置換する置換語句とを取得する取得ステップと、
    第1文章生成部が、前記非定型部分を前記置換語句で置換して目標文章を生成する第1文章生成ステップと、
    第2文章生成部が、前記目標文章との類似度が閾値を超える代替目標文章を生成する第2文章生成ステップと、
    第1合成音生成部が、前記目標文章及び前記代替目標文章に対し、前記定型部分の合成音である第1合成音を生成する第1合成音生成ステップと、
    第2合成音生成部が、前記目標文章及び前記代替目標文章に対し、前記置換語句の合成音である第2合成音を生成する第2合成音生成ステップと、
    演算部が、前記目標文章及び前記代替目標文章に対し、前記第1合成音と前記第2合成音との接続境界の不連続値を演算する演算ステップと、
    選択部が、前記目標文章及び前記代替目標文章の中から、前記不連続値が最小となる前記目標文章又は前記代替目標文章を選択する選択ステップと、
    接続部が、選択された前記目標文章又は前記代替目標文章の前記第1合成音及び前記第2合成音を接続する接続ステップと、
    をコンピュータに実行させるための音声合成プログラム。
  8. 取得部が、他の語句に置換されない定型部分と他の語句に置換される非定型部分とを含む意味的に等価な複数の雛形文章と、前記非定型部分を置換する置換語句とを取得する取得ステップと、
    文章生成部が、前記雛形文章それぞれに対し、前記非定型部分を前記置換語句で置換して複数の目標文章を生成する文章生成ステップと、
    第1合成音生成部が、前記目標文章それぞれに対し、前記定型部分の合成音である第1合成音を生成する第1合成音生成ステップと、
    第2合成音生成部が、前記目標文章それぞれに対し、前記置換語句の合成音である第2合成音を生成する第2合成音生成ステップと、
    演算部が、前記目標文章それぞれに対し、前記第1合成音と前記第2合成音との接続境界の不連続値を演算する演算ステップと、
    選択部が、複数の前記目標文章の中から、前記不連続値が最小となる前記目標文章を選択する選択ステップと、
    接続部が、選択された前記目標文章の前記第1合成音及び前記第2合成音を接続する接続ステップと、
    を含むことを特徴とする音声合成方法。
  9. 取得部が、他の語句に置換されない定型部分と他の語句に置換される非定型部分とを含む雛形文章と、前記非定型部分を置換する置換語句とを取得する取得ステップと、
    第1文章生成部が、前記非定型部分を前記置換語句で置換して目標文章を生成する第1文章生成ステップと、
    第2文章生成部が、前記目標文章との類似度が閾値を超える代替目標文章を生成する第2文章生成ステップと、
    第1合成音生成部が、前記目標文章及び前記代替目標文章に対し、前記定型部分の合成音である第1合成音を生成する第1合成音生成ステップと、
    第2合成音生成部が、前記目標文章及び前記代替目標文章に対し、前記置換語句の合成音である第2合成音を生成する第2合成音生成ステップと、
    演算部が、前記目標文章及び前記代替目標文章に対し、前記第1合成音と前記第2合成音との接続境界の不連続値を演算する演算ステップと、
    選択部が、前記目標文章及び前記代替目標文章の中から、前記不連続値が最小となる前記目標文章又は前記代替目標文章を選択する選択ステップと、
    接続部が、選択された前記目標文章又は前記代替目標文章の前記第1合成音及び前記第2合成音を接続する接続ステップと、
    を含むことを特徴とする音声合成方法。
JP2009074849A 2009-03-25 2009-03-25 音声合成装置、プログラム、及び方法 Active JP5269668B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009074849A JP5269668B2 (ja) 2009-03-25 2009-03-25 音声合成装置、プログラム、及び方法
US12/559,844 US8626510B2 (en) 2009-03-25 2009-09-15 Speech synthesizing device, computer program product, and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009074849A JP5269668B2 (ja) 2009-03-25 2009-03-25 音声合成装置、プログラム、及び方法

Publications (2)

Publication Number Publication Date
JP2010230699A JP2010230699A (ja) 2010-10-14
JP5269668B2 true JP5269668B2 (ja) 2013-08-21

Family

ID=42785347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009074849A Active JP5269668B2 (ja) 2009-03-25 2009-03-25 音声合成装置、プログラム、及び方法

Country Status (2)

Country Link
US (1) US8626510B2 (ja)
JP (1) JP5269668B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5398295B2 (ja) * 2009-02-16 2014-01-29 株式会社東芝 音声処理装置、音声処理方法及び音声処理プログラム
US9031834B2 (en) * 2009-09-04 2015-05-12 Nuance Communications, Inc. Speech enhancement techniques on the power spectrum
GB2492753A (en) * 2011-07-06 2013-01-16 Tomtom Int Bv Reducing driver workload in relation to operation of a portable navigation device
US9135237B2 (en) * 2011-07-13 2015-09-15 Nuance Communications, Inc. System and a method for generating semantically similar sentences for building a robust SLM
US8996377B2 (en) * 2012-07-12 2015-03-31 Microsoft Technology Licensing, Llc Blending recorded speech with text-to-speech output for specific domains
JP6063218B2 (ja) * 2012-11-20 2017-01-18 日本放送協会 音声合成装置およびそのプログラム
JP5949607B2 (ja) * 2013-03-15 2016-07-13 ヤマハ株式会社 音声合成装置
JP6234134B2 (ja) * 2013-09-25 2017-11-22 三菱電機株式会社 音声合成装置
CN105096934B (zh) * 2015-06-30 2019-02-12 百度在线网络技术(北京)有限公司 构建语音特征库的方法、语音合成方法、装置及设备
US10235989B2 (en) * 2016-03-24 2019-03-19 Oracle International Corporation Sonification of words and phrases by text mining based on frequency of occurrence
JPWO2023276347A1 (ja) * 2021-06-29 2023-01-05

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0360276A (ja) 1989-07-28 1991-03-15 Fuji Xerox Co Ltd 画情報読取り装置
CA2119397C (en) * 1993-03-19 2007-10-02 Kim E.A. Silverman Improved automated voice synthesis employing enhanced prosodic treatment of text, spelling of text and rate of annunciation
JPH07210194A (ja) * 1994-01-18 1995-08-11 Hitachi Ltd 音声出力装置
JPH07253987A (ja) * 1994-03-16 1995-10-03 Toshiba Corp 文書検索システムと文書検索方法
JP3060276B2 (ja) 1994-08-19 2000-07-10 富士通株式会社 音声合成装置
CN1328321A (zh) * 2000-05-31 2001-12-26 松下电器产业株式会社 通过语音提供信息的装置和方法
JP2007212884A (ja) * 2006-02-10 2007-08-23 Fujitsu Ltd 音声合成装置、音声合成方法、及びコンピュータプログラム
JP2008185805A (ja) * 2007-01-30 2008-08-14 Internatl Business Mach Corp <Ibm> 高品質の合成音声を生成する技術
JP2008225254A (ja) * 2007-03-14 2008-09-25 Canon Inc 音声合成装置及び方法並びにプログラム
JP5097007B2 (ja) * 2007-07-11 2012-12-12 キヤノン株式会社 音声処理装置及び方法

Also Published As

Publication number Publication date
US8626510B2 (en) 2014-01-07
JP2010230699A (ja) 2010-10-14
US20100250254A1 (en) 2010-09-30

Similar Documents

Publication Publication Date Title
JP5269668B2 (ja) 音声合成装置、プログラム、及び方法
JP5038995B2 (ja) 声質変換装置及び方法、音声合成装置及び方法
JP2007249212A (ja) テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ
WO2013018294A1 (ja) 音声合成装置および音声合成方法
JP5929909B2 (ja) 韻律生成装置、音声合成装置、韻律生成方法および韻律生成プログラム
Ekpenyong et al. Statistical parametric speech synthesis for Ibibio
Bellegarda et al. Statistical prosodic modeling: from corpus design to parameter estimation
JP4533255B2 (ja) 音声合成装置、音声合成方法、音声合成プログラムおよびその記録媒体
JP4247289B1 (ja) 音声合成装置、音声合成方法およびそのプログラム
JP2011059146A (ja) 音声変換装置および音声変換方法
JP5874639B2 (ja) 音声合成装置、音声合成方法及び音声合成プログラム
JP4829605B2 (ja) 音声合成装置および音声合成プログラム
Ni et al. Quantitative and structural modeling of voice fundamental frequency contours of speech in Mandarin
WO2008056604A1 (fr) Système de collecte de son, procédé de collecte de son et programme de traitement de collecte
JP5294700B2 (ja) 音声認識及び合成システム、プログラム及び方法
JP4640063B2 (ja) 音声合成方法,音声合成装置,およびコンピュータプログラム
JP2008015424A (ja) 様式指定型音声合成方法、及び様式指定型音声合成装置とそのプログラムと、その記憶媒体
JP2004226505A (ja) ピッチパタン生成方法、音声合成方法とシステム及びプログラム
JP4787769B2 (ja) F0値時系列生成装置、その方法、そのプログラム、及びその記録媒体
JP3737788B2 (ja) 基本周波数パターン生成方法、基本周波数パターン生成装置、音声合成装置、基本周波数パターン生成プログラムおよび音声合成プログラム
JP2006084854A (ja) 音声合成装置、音声合成方法および音声合成プログラム
Dong et al. A Unit Selection-based Speech Synthesis Approach for Mandarin Chinese.
JP3821131B2 (ja) 音声合成装置および音声合成方法
JP2003330482A (ja) 基本周波数パターン生成方法、基本周波数パターン生成装置、音声合成方法、音声合成装置、基本周波数パターン生成プログラムおよび音声合成プログラム
JPH1185193A (ja) 音声データベースにおける音素片情報最適化方法、及び音素片情報最適化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121005

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130508

R151 Written notification of patent or utility model registration

Ref document number: 5269668

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350