JP3085631B2 - 音声合成方法及びシステム - Google Patents

音声合成方法及びシステム

Info

Publication number
JP3085631B2
JP3085631B2 JP06253190A JP25319094A JP3085631B2 JP 3085631 B2 JP3085631 B2 JP 3085631B2 JP 06253190 A JP06253190 A JP 06253190A JP 25319094 A JP25319094 A JP 25319094A JP 3085631 B2 JP3085631 B2 JP 3085631B2
Authority
JP
Japan
Prior art keywords
word
speech
synthesis
unit
synthesis unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06253190A
Other languages
English (en)
Other versions
JPH08123455A (ja
Inventor
隆 斉藤
正明 大河内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IBM Japan Ltd
Original Assignee
IBM Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IBM Japan Ltd filed Critical IBM Japan Ltd
Priority to JP06253190A priority Critical patent/JP3085631B2/ja
Priority to US08/495,155 priority patent/US5715368A/en
Publication of JPH08123455A publication Critical patent/JPH08123455A/ja
Application granted granted Critical
Publication of JP3085631B2 publication Critical patent/JP3085631B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、予め用意された音声
波形データに基づき、テキスト・ファイルの形で提供さ
れたデータから音声を合成するための方法及びシステム
に関するものである。
【0002】
【従来の技術】近年、大量の音声データを利用すること
によって、合成音声の高品質化を行おうとする試みが盛
んに行われている。それらの中で用いられている音声合
成単位辞書(音声データベース)として、代表的には、
次のようなものが知られている。
【0003】(1) 6000語程度の重要単語を収録した
もの(匂坂、”種々の音韻連接単位を用いた日本語音声
合成”、信学技報SP87-136)
【0004】(2) アナウンサーが数時間朗読した文章を
そのまま収録したもの(広川、”波形辞書を用いた規則
合成法”、信学技報SP88-9)
【0005】これらを用いた合成単位の選択方法はいず
れも、豊富な音韻連鎖を含む音声データベースを想定し
た上で、最適な合成単位列を与えられたデータベースの
中から探索する方法に焦点が当てられており、合成単位
に自立語・付属語区分などの言語的な特徴を積極的に利
用することは言及していない。以下、簡単にそれぞれの
方式について説明する。(1)では、合成単位の長さに制
限を設けないとした上で、CV(子音・母音)連接の保
存(CとVの間は単位境界としない)、有声音連接部優
先(母音連続部での接続にはペナルティーを課す)、長
単位優先(接続部を減らすため長い単位を優先する)、
単位間重複度(接続する単位を含む単語同士の共通部分
が多いものを優先する)の4つの規準を、この順の優先
度で評価していくことによって、与えられた音韻系列に
対する最適な合成単位列を重要単語データベースから探
索する。(2)では、合成単位の長さは音素単位とし、選
択規準としては、音韻環境、ピッチ平均値、ピッチの傾
き、音韻時間長、音韻振幅の5つについて、使用される
環境とデータベース内での環境との一致度を数量化した
評価関数で表現している。与えられた音韻系列に対して
この評価関数を順次適用することによって、(2)の膨大
なデータベースの中から最適な合成単位列を求めてい
く。
【0006】以上のような従来技術においても、次の2
つの大きな課題が残されていると考えられる。
【0007】(a) 韻律情報再現性の向上 明瞭で自然性の高い音声を合成するには、音韻情報と韻
律情報の両者とも重要な要素である。上記のシステムで
は、データベースを利用して音韻情報の再現性を高める
ことによって、合成音声の品質向上をねらっているが、
韻律情報の再現性については検討されていない。音韻情
報のみならず、韻律情報の再現性をも高めることによっ
て、さらに、人間の発声に近い音声の合成が可能となる
と考えられる。
【0008】(b) データベースの最適化 上記のシステムでは、なんら語彙セットの最適化がなさ
れていないため、データベースの利用率は低いと予想さ
れる。実用面からみた場合には、利用率まで考慮した音
声データベースの構成と、それに基づいた合成単位選択
法の検討が重要と考えられる。
【0009】
【発明が解決しようとする課題】本発明の目的は、特に
日本語音声合成システムにおいて、音韻情報のみなら
ず、韻律情報の再現性をも高めることによって、明瞭で
自然性の高い音声を合成することを可能ならしめる方法
及びシステムを提供することにある。
【0010】
【課題を解決するための手段】日本語は、文法的にみる
と自立語部分と付属語連鎖部分から構成されている。そ
して、音声言語としてみた場合にも、日本語は、自立語
音声と付属語音声とから成り立っているとみることがで
きる。その自立語音声と付属語音声は、その音声特徴に
おいて、顕著な違いがある。両者の音声特徴の違いは、
特に、韻律的な要素(発声強度、速度、ピッチ)に明確
に観察される。その結果は、合成音声の明瞭性・自然性
に大きく影響してくる。例えば、自立語部の音声では、
個々の音韻の明瞭さが語の理解の基本的な条件となるこ
とが多いが、付属語音声では、個々の音韻の明瞭性より
も、まとまり単位の滑らかさ、言い替えれば、自然さ
が、文意の理解に対しては、優勢になることの方が多
い。
【0011】本発明は、これらの知見を踏まえ、付属語
連鎖単位を音声合成単位とした、自然性の高い音声を合
成し得る新たな規則合成法を提案するものである。
【0012】本発明は、自立語・付属語区分の言語的な
特徴をデータベース構成や合成単位選択に利用すること
によって、(a)の問題を解決する。特に、付属語部につ
いては、韻律面を含めた音声特徴を再現できる枠組みと
して、付属語連鎖からなる音声合成単位を提案する。こ
の付属語連鎖の合成単位辞書(音声データベース)への
導入は、合成単位辞書の階層化ともみなすことができ、
(b)の問題に対しても、相性のよい技法であると考えら
れる。本発明では、自立語・付属語の音声特徴の違いを
表現するために、合成単位として、付属語連鎖単位を用
いる規則合成方式を提案し、前述した従来技術の問題を
解決する。本発明によれば、次のような効果が期待でき
る。
【0013】・自然性の高い音声の合成が可能 自立語音声の合成は無限語彙の合成と仮定とすべきであ
るのに対して、付属語音声は有限語彙、しかも、100
0語程度の録音編集に近い規則合成とみなすことができ
るため、原音声の品質を過度に劣化させることがなく、
高品質な音声合成が可能となる。その結果として、従来
の韻律モデルでは実現がむずかしいような、人間の発声
に近いダイナミックなピッチや音韻時間長の変化を合成
することができる。
【0014】・強調表現への応用が容易 自立語・付属語の区分は、合成単位の区分との対応が良
いため、強調に関与する副詞や、副助詞などについて
は、あらかじめ普通音声と強調音声の2種類の合成単位
を用意しておけば、強調表現の音声を、合成単位の置き
換えだけで合成することもできる。
【0015】
【実施例】以下、図面を参照して、本発明の実施例につ
いて説明する。
【0016】A.ハードウェア構成 図1を参照すると、本発明を実施するためのハードウェ
ア構成が示されている。この構成は、演算及び入出力制
御を行うためのCPU1004、プログラム・ロード用
及び演算のバッファ領域を与えるランダム・アクセス・
メモリ(RAM)1006、文字やイメージ情報を画面
上に表示するためのCRT装置1008、CRT装置1
008を制御するためのビデオ・カード1010、オペ
レータによりコマンドや文字を入力するためのキーボー
ド1012、CRT装置1008の画面上の任意の点を
ポイントしてその位置情報をシステムに送るためのマウ
ス1014、プログラムやデータを読み書き可能に且つ
持久的に記憶する磁気ディスク装置1016、音声録音
用のマイク1020及び合成した音声を音として出力す
るためのスピーカ1022とを共通のバス1002に接
続したものである。
【0017】特に、磁気ディスク装置1016には、シ
ステムの立ち上げ時にRAMにロードされるオペレーテ
ィング・システムや、本発明に関する後述する処理プロ
グラムや、マイク1020から取り込まれA/D変換さ
れたディジタル形式の音声ファイルや、音声ファイルの
解析の結果得られた音素の合成単位の辞書や、テキスト
解析用単語辞書などが格納されている。
【0018】本発明の処理に適当なオペレーティング・
システムは、OS/2(IBMの商標)であるが、MS
−DOS(マイクロソフトの商標)、PC−DOS(I
BMの商標)、Windows(マイクロソフトの商
標)、AIX(IBMの商標)などの、オーディオ・カ
ードに対するインターフェースを与える任意のオペレー
ティング・システムを使用することが可能である。
【0019】オーディオ・カード1018は、マイク1
020を介して音声として入力された信号をPCMのよ
うなディジタル形式に変換し得るとともに、そのような
ディジタル形式のデータを音声としてスピーカ1022
から出力し得る任意のものでよい。オーディオ・カード
1018としては、ディジタル信号プロセッサ(DS
P)を装備したものが高性能であって好適であるが、本
発明において、DSPは必須ではない。
【0020】尚、マイク1020を介して音声として入
力され、PCMのようなディジタル形式に変換されたデ
ータに対しては、ウェーブレット変換などの処理が施さ
れ、その変換波形に基づきピッチ抽出されて、ピッチ・
マーキングされた波形が後述する合成単位辞書2012
に格納されることになる。
【0021】B.論理的な構成 次に図2を参照して、本発明の音声合成システムの論理
的な構成のブロック図について説明する。この音声合成
システムに入力されるデータは、典型的には、シフトJ
IS形式の漢字かな混じり文のテキスト・ファイル20
02である。テキスト解析用単語辞書2004には、テ
キスト解析用の複数の単語に、その読み、アクセント、
品詞が関連付けられて格納されている。
【0022】テキスト解析部2006は、かな漢字混じ
りのテキスト・ファイル2002が入力されると、テキ
スト解析用単語辞書2004を参照して、入力されたか
な漢字混じり文を、形態素解析処理によって品詞分解す
ると同時に、その分解した各々の要素に、読みとアクセ
ントを付与する。テキスト解析部2006はさらに、入
力されたかな漢字混じり文の係り受け解析処理も行い、
次の韻律制御部で必要とされる文構造に関する情報も生
成する。
【0023】韻律制御部2008は、テキスト解析部2
006から提供された文構造に関する情報に基づき、ピ
ッチ・パターンの生成、音韻時間長の設定、音韻パワー
の補正、及び休止期間長の設定を行う。
【0024】合成単位選択部2010は、合成単位の選
択を行う。より具体的には、合成単位選択部2010
は、音韻系列(読みの並び)を、本発明を利用可能とす
るように、自立語部と付属語部に区分化する。
【0025】この目的のため、合成単位辞書2012が
予め用意される。すなわち、合成単位辞書2012は、
自立語用合成単位辞書と、付属語用合成単位辞書の2つ
を含む。
【0026】合成単位選択部2010は、自立語部に関
しては自立語用合成単位辞書を検索して、単語列を構成
する。また、付属語部に関しては付属語連鎖用合成単位
辞書を検索し、付属語連鎖単位によって合成単位列を構
成する。また、万一、付属語部の音韻系列の一部に付属
語連鎖単位辞書のエントリで構成できない部分が出現し
た場合には、自立語用合成単位辞書を探索することによ
って単位列を補完する。自立語用合成単位辞書は無限語
彙の合成ができるように構成されているため、ここで補
完できない音韻列が存在することはない。こうして、入
力音韻系列に対する合成単位系列を得る。さらに、付属
語部については、付属語連鎖単位の韻律情報が韻律制御
部2008に送られ、合成環境に対する韻律情報の補正
処理が行われる。この補正処理は、付属語連鎖辞書から
送られた付属語連鎖部全体のピッチパターンと時間長
を、韻律モデルを用いて生成した自立語部の韻律情報と
滑らかに接続するために行われる。
【0027】音声生成部2014は、合成単位選択部2
010から与えられた合成単位系列を、韻律制御部20
08によって求められた韻律情報に基づいて接続するこ
とによって音声波形を生成し、図1のオーディオ・カー
ド1018を介してスピーカ1022から、合成した音
声波形を出力する。
【0028】C.合成単位辞書 上記合成単位辞書2012について、以下でさらに詳細
に説明する。
【0029】本発明の合成単位辞書2012は、既述の
ように、自立語用合成単位辞書と付属語連鎖合成単位辞
書の2つで構成される。自立語用合成単位辞書は、無限
語彙の合成を目的とする合成単位辞書であり、日本語の
文章において、主として自立語部分の合成に用いられ
る。一方、付属語連鎖単位辞書は、文章中の付属語部分
の音声合成に使用される辞書で、付属語部の韻律情報を
保持しているため、それを利用することによって自然性
の高い音声が合成可能となる。以下、これらについて説
明する。
【0030】C1.付属語連鎖合成単位辞書 付属語連鎖単位とは、その前後を自立語、あるいは、句
読点によって区切られた、付属語が1つ以上連続する部
分を指す。従って、付属語連鎖単位には、「音声こそ
が」における「こそが」のような、「こそ」と「が」と
いう2つの付属語の連鎖のみならず、「学校は、」にお
ける「は」のような単一の付属語の出現も含まれる。付
属語連鎖合成単位辞書を構成するためには、日本語テキ
ストのデータベースから、付属語連鎖の統計を求め、出
現頻度と連鎖長により、順位付けを行う、という処理が
行われる。300個程度ある付属語が作る連鎖の組み合
わせは、原理的には無限個の可能性があるが、実際に
は、出現頻度の上位1000個程度で90%以上をカバ
ーできる。したがって、この実施例では、その上位10
00個程度を付属語連鎖音声合成単位とする。
【0031】一般的な着想では、音声合成単位として、
「こそ」「が」などの品詞区分単位としての付属語単位
そのものをとるのが普通であるが、本発明は、付属語単
位そのものではなく、「こそが」「なのであろう」など
の付属語連鎖単位に着目する。その大きな理由は、この
合成単位では音韻情報の接続単位だけでなく、韻律情報
の接続単位も兼ねることによって、大きな効果を引き出
すことを目的としており、韻律的特徴(特にピッチパタ
ーンと振幅パターン)のまとまりの単位に近い付属語連
鎖単位のほうがより適していると考えられるためであ
る。
【0032】また、付属語連鎖単位辞書の拡張として、
音声合成単位区分が自立語・付属語等の言語区分と対応
していることから、この実施例では、強調に関与する副
詞や、副助詞などについては、あらかじめ普通音声と強
調音声の2種類の合成単位を用意し、それぞれについて
合成単位辞書2012に用意される。このようにしてお
くことにより、強調表現の音声を合成単位の置き換えだ
けで合成することもできる。
【0033】C2.自立語(無限語彙)用合成単位辞書 自立語音声の合成と、付属語連鎖単位に存在しない付属
語連鎖部の合成は、無限語彙の音声合成であるため、言
語区分を利用した単位は使用できない。したがって、蓄
積可能な容量に応じたサイズの単位辞書を構成する。基
本的には、従来のように、CV/VC単位、あるいは、
容量に余裕のある場合には、音韻環境の一致するより長
い単位(例えば、VCV、CVC、単語等)で構成す
る。ここで、Cは子音、Vは母音を表し、CVは子音か
ら母音への遷移部を含む合成単位、VCは母音から子音
への遷移部を含む合成単位で、CVとVCの併用単位系
は、日本語音声の合成に従来より広く用いられている。
この無限語彙用の合成単位辞書を用いた部分の音声の合
成では、韻律情報は保持されていないため、韻律制御規
則のみから韻律制御が施される。
【0034】D.付属語連鎖合成単位の韻律制御方法 本発明の1つの特徴によれば、付属語連鎖合成単位辞書
には、各付属語連鎖エントリについて、音声データとと
もに韻律パターンも保持される。ここで韻律パターンと
は、付属語連鎖部のピッチ・パターン(対数基本周波数
の時間変化を表すもの)からその傾斜(話調成分に対応
する)を除去したもの(アクセント成分に対応する)
を、各構成音韻のセグメント重心位置ごとに記録したも
のと定義する。
【0035】合成時に行う付属語連鎖単位の韻律制御の
処理フローチャートを図3に示す。図3において、付属
語連鎖合成単位辞書から引き出された合成単位辞書中の
韻律パターンに対して、ステップ3002で、付属語連
鎖部の時間長を線形伸縮して、韻律制御部2008で規
則により生成した時間長に合致させるように各音韻のセ
グメント位置を修正する処理が行われる。次に、ステッ
プ3004では、自立語部と付属語連鎖部の結合による
アクセントレベルの補正が行なわれる。付属語連鎖部が
前接する自立語部とアクセント結合する場合には、規則
によって得られた自立語部のアクセントレベルを、付属
語連鎖部の韻律パターンのそれに合わせる。尚、アクセ
ント結合しない場合にはこの補正は不要である。最後
に、ステップ3006で、付属語連鎖部の傾斜除去ピッ
チパターンを、修正された各音韻セグメント重心位置に
おいて、規則で生成した話調成分に重畳していくことに
よって、合成すべきピッチパターンが求められる。この
ようにして、付属語連鎖部分に対する、合成環境におけ
る韻律パターンを得ることができる。
【0036】尚、パワーについては、原音情報のままで
十分有効と考えられるため、この実施例では、前後単位
とのスムージングを行う程度とし、基本的には原音デー
タの変形は行わない。
【0037】E.付属語連鎖単位を用いた音声合成の具
体例 1つの例として、「音質 こそが、もっとも 大切 なの
であろう。」という、強調を含む文での、合成単位の連
結パターンの例について、本発明の技法が適用される様
子を示してみる。
【0038】この例文で、「音質」と「大切」は、従来
通り、CV/VCなどの自立語(無限語彙)用の合成単
位を用いて合成される。
【0039】一方、「こそが」と「なのであろう」は、
付属語連鎖単位によって合成され、その韻律情報も合成
単位辞書の情報が用いられる。これによって、人間の発
声に近いダイナミックな韻律を合成することができる。
【0040】さらに、「もっとも」の部分は、強調語の
合成単位辞書のエントリが用いられる。これについても
付属語連鎖単位と同様に、合成単位辞書の韻律情報が用
いられ、それによって強調時の抑揚を容易に合成するこ
とができる。
【0041】
【発明の効果】以上説明したように、この発明によれ
ば、音声合成技術において、比較的頻度が大きく現れる
付属語連鎖単位については、その合成単位を韻律情報も
含めて予め合成単位辞書中に用意しておくことにより、
テキスト・ファイルに基づく音声合成処理において、よ
り人間の発声に近い、自然でダイナミックな韻律を合成
することが可能となる。
【図面の簡単な説明】
【図1】 本発明を実現するためのハードウェア構成の
ブロック図である。
【図2】 音声合成処理を行うための処理要素のブロッ
ク図である。
【図3】 付属語連鎖単位の韻律制御のフローチャート
を示す図である。
フロントページの続き (56)参考文献 特開 平6−202686(JP,A) 特開 平1−61796(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 G06F 17/27 JICSTファイル(JOIS)

Claims (15)

    (57)【特許請求の範囲】
  1. 【請求項1】入力されたテキスト・データに基づき音声
    合成を行うシステムであって、 (a) 複数の単語と、該各々の単語に関連する、少なくと
    も読み、アクセント及び品詞を記憶するテキスト解析用
    単語辞書と、 (b) 上記入力された日本語テキスト・データに対して形
    態素解析処理することによって品詞分解を行い、上記テ
    キスト解析用単語辞書を参照することによって、各々の
    品詞分解された単語につき、読み、アクセント及び品詞
    に関する情報を与えるとともに、該テキストの文構造に
    関する情報を与えるテキスト解析手段と、 (c) 上記テキスト解析手段から提供される上記情報に基
    づき、ピッチ・パターンの生成、音韻パワー及び音韻時
    間長の設定を行う韻律制御手段と、 (d) 複数の自立語合成単位を含む自立語合成単位辞書
    と、複数の付属語連鎖合成単位を含む付属語連鎖合成単
    位辞書とを記憶する合成単位辞書と、 (e) 上記テキスト解析手段から提供される品詞に関する
    情報に基づき、該品詞が自立語であることに応答して上
    記自立語合成単位辞書から必要な自立語合成単位を取得
    し、付属語の連鎖が見出されたことに応答して、上記付
    属語連鎖合成単位辞書から対応する付属語連鎖合成単位
    を取得する合成単位選択手段と、 (f) 上記韻律制御手段から提供されるピッチ・パター
    ン、音韻パワー及び音韻時間長と、上記合成単位選択手
    段から提供される合成単位に基づき合成音声を出力する
    音声生成手段とを具備する、 音声合成システム。
  2. 【請求項2】上記付属語連鎖合成単位辞書中の各々の付
    属語連鎖合成単位には、予め韻律情報が関連づけられて
    記憶されている、請求項1に記載の音声合成システム。
  3. 【請求項3】上記韻律制御手段によって提供されるピッ
    チ・パターン及び音韻時間長を変更するように、上記付
    属語連鎖合成単位に含まれる韻律情報を上記韻律制御手
    段に提供する手段をさらに有する、請求項2に記載の音
    声合成システム。
  4. 【請求項4】上記テキスト・データが、漢字かな混じり
    日本語テキスト・データである、請求項1に記載の音声
    合成システム。
  5. 【請求項5】上記テキスト・データがシフトJISテキ
    スト・データである、請求項4に記載の音声合成システ
    ム。
  6. 【請求項6】上記自立語合成単位が、CV/VC単位で
    ある、請求項1に記載の音声合成システム。
  7. 【請求項7】上記付属語連鎖合成単位辞書において対応
    する付属語連鎖合成単位を見出すことができないことに
    応答して、該付属語連鎖合成単位を自立語合成単位であ
    らわす手段をさらに有する、請求項6に記載の音声合成
    システム。
  8. 【請求項8】上記合成単位辞書が強調語合成単位辞書を
    さらに含み、上記合成単位選択手段は、強調語が見出さ
    れたことに応答して、それに該当する強調語合成単位を
    選択する機能を有する、請求項7に記載の音声合成シス
    テム。
  9. 【請求項9】入力されたテキスト・データに基づき音声
    合成を行う方法であって、 (a) 複数の単語と、該各々の単語に関連する、少なくと
    も読み、アクセント及び品詞を記憶するテキスト解析用
    単語辞書を用意する段階と、 (b) 複数の自立語合成単位を含む自立語合成単位辞書
    と、複数の付属語連鎖合成単位を含む付属語連鎖合成単
    位辞書とを記憶する合成単位辞書を用意する段階と、 (c) 上記入力された日本語テキスト・データに対して形
    態素解析処理することによって品詞分解を行い、上記テ
    キスト解析用単語辞書を参照することによって、各々の
    品詞分解された単語につき、読み、アクセント及び品詞
    に関する情報を与えるとともに、該テキストの文構造に
    関する情報を与える段階と、 (d) 上記段階(c)で提供される文構造の情報に基づき、
    ピッチ・パターンの生成、音韻パワー及び音韻時間長の
    設定を行う段階と、 (e) 上記段階(c)で提供される品詞に関する情報に基づ
    き、該品詞が自立語であることに応答して上記自立語合
    成単位辞書から必要な自立語合成単位を取得し、付属語
    の連鎖が見出されたことに応答して、上記付属語連鎖合
    成単位辞書から対応する付属語連鎖合成単位を取得する
    段階と、 (f) 上記段階(d)で提供されるピッチ・パターン、音韻
    パワー及び音韻時間長と、上記合成単位選択手段から提
    供される合成単位に基づき合成音声を出力する段階を有
    する、 音声合成方法。
  10. 【請求項10】上記付属語連鎖合成単位辞書中の各々の
    付属語連鎖合成単位には、予め韻律情報が関連づけられ
    て記憶されている、請求項9に記載の音声合成方法。
  11. 【請求項11】上記段階(d)は、上記付属語連鎖合成単
    位に含まれる韻律情報を入力することによってピッチ・
    パターン及び音韻時間長を変更する段階をさらに有す
    る、請求項10に記載の音声合成方法。
  12. 【請求項12】上記テキスト・データが、漢字かな混じ
    り日本語テキスト・データである、請求項9に記載の音
    声合成方法。
  13. 【請求項13】上記テキスト・データがシフトJISテ
    キスト・データである、請求項12に記載の音声合成方
    法。
  14. 【請求項14】上記自立語合成単位が、CV/VC単位
    である、請求項9に記載の音声合成方法。
  15. 【請求項15】上記付属語連鎖合成単位辞書において対
    応する付属語連鎖合成単位を見出すことができないこと
    に応答して、該付属語連鎖合成単位を自立語合成単位で
    あらわす段階をさらに有する、請求項14に記載の音声
    合成方法。
JP06253190A 1994-10-19 1994-10-19 音声合成方法及びシステム Expired - Fee Related JP3085631B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP06253190A JP3085631B2 (ja) 1994-10-19 1994-10-19 音声合成方法及びシステム
US08/495,155 US5715368A (en) 1994-10-19 1995-06-27 Speech synthesis system and method utilizing phenome information and rhythm imformation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06253190A JP3085631B2 (ja) 1994-10-19 1994-10-19 音声合成方法及びシステム

Publications (2)

Publication Number Publication Date
JPH08123455A JPH08123455A (ja) 1996-05-17
JP3085631B2 true JP3085631B2 (ja) 2000-09-11

Family

ID=17247806

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06253190A Expired - Fee Related JP3085631B2 (ja) 1994-10-19 1994-10-19 音声合成方法及びシステム

Country Status (2)

Country Link
US (1) US5715368A (ja)
JP (1) JP3085631B2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19610019C2 (de) * 1996-03-14 1999-10-28 Data Software Gmbh G Digitales Sprachsyntheseverfahren
US6029131A (en) * 1996-06-28 2000-02-22 Digital Equipment Corporation Post processing timing of rhythm in synthetic speech
JPH1039895A (ja) * 1996-07-25 1998-02-13 Matsushita Electric Ind Co Ltd 音声合成方法および装置
JP3242331B2 (ja) * 1996-09-20 2001-12-25 松下電器産業株式会社 Vcv波形接続音声のピッチ変換方法及び音声合成装置
JP3349905B2 (ja) * 1996-12-10 2002-11-25 松下電器産業株式会社 音声合成方法および装置
US6490562B1 (en) 1997-04-09 2002-12-03 Matsushita Electric Industrial Co., Ltd. Method and system for analyzing voices
JP3361066B2 (ja) 1998-11-30 2003-01-07 松下電器産業株式会社 音声合成方法および装置
US6185533B1 (en) * 1999-03-15 2001-02-06 Matsushita Electric Industrial Co., Ltd. Generation and synthesis of prosody templates
JP2001100776A (ja) * 1999-09-30 2001-04-13 Arcadia:Kk 音声合成装置
JP4054507B2 (ja) * 2000-03-31 2008-02-27 キヤノン株式会社 音声情報処理方法および装置および記憶媒体
US6556973B1 (en) 2000-04-19 2003-04-29 Voxi Ab Conversion between data representation formats
JP2002169581A (ja) * 2000-11-29 2002-06-14 Matsushita Electric Ind Co Ltd 音声合成方法およびその装置
JP3673471B2 (ja) 2000-12-28 2005-07-20 シャープ株式会社 テキスト音声合成装置およびプログラム記録媒体
WO2002086757A1 (en) * 2001-04-20 2002-10-31 Voxi Ab Conversion between data representation formats
CN1234109C (zh) * 2001-08-22 2005-12-28 国际商业机器公司 语调生成方法、语音合成装置、语音合成方法及语音服务器
JP4407305B2 (ja) * 2003-02-17 2010-02-03 株式会社ケンウッド ピッチ波形信号分割装置、音声信号圧縮装置、音声合成装置、ピッチ波形信号分割方法、音声信号圧縮方法、音声合成方法、記録媒体及びプログラム
US8583439B1 (en) * 2004-01-12 2013-11-12 Verizon Services Corp. Enhanced interface for use with speech recognition
US8342183B2 (en) * 2006-04-19 2013-01-01 Vibrynt, Inc. Devices and methods for treatment of obesity
US9069757B2 (en) * 2010-10-31 2015-06-30 Speech Morphing, Inc. Speech morphing communication system

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5331323B2 (ja) * 1972-11-13 1978-09-01
JPH0833744B2 (ja) * 1986-01-09 1996-03-29 株式会社東芝 音声合成装置
JPH0690630B2 (ja) * 1987-08-31 1994-11-14 日本電気株式会社 アクセント決定装置
DE69028072T2 (de) * 1989-11-06 1997-01-09 Canon Kk Verfahren und Einrichtung zur Sprachsynthese
US5283833A (en) * 1991-09-19 1994-02-01 At&T Bell Laboratories Method and apparatus for speech processing using morphology and rhyming
JPH05181491A (ja) * 1991-12-30 1993-07-23 Sony Corp 音声合成装置
JPH06202686A (ja) * 1992-12-28 1994-07-22 Sony Corp 電子ブックプレーヤとその処理方法

Also Published As

Publication number Publication date
US5715368A (en) 1998-02-03
JPH08123455A (ja) 1996-05-17

Similar Documents

Publication Publication Date Title
JP3085631B2 (ja) 音声合成方法及びシステム
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
JP3854713B2 (ja) 音声合成方法および装置および記憶媒体
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
CN101236743B (zh) 生成高质量话音的系统和方法
US8219398B2 (en) Computerized speech synthesizer for synthesizing speech from text
US8886538B2 (en) Systems and methods for text-to-speech synthesis using spoken example
JP4302788B2 (ja) 音声合成用の基本周波数テンプレートを収容する韻律データベース
US6978239B2 (en) Method and apparatus for speech synthesis without prosody modification
US6477495B1 (en) Speech synthesis system and prosodic control method in the speech synthesis system
US8626510B2 (en) Speech synthesizing device, computer program product, and method
Hamza et al. The IBM expressive speech synthesis system.
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
JP2004139033A (ja) 音声合成方法、音声合成装置および音声合成プログラム
US6847932B1 (en) Speech synthesis device handling phoneme units of extended CV
JP2000172289A (ja) 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
JP3109778B2 (ja) 音声規則合成装置
JPH08335096A (ja) テキスト音声合成装置
Begum et al. Text-to-speech synthesis system for Mymensinghiya dialect of Bangla language
JPH05134691A (ja) 音声合成方法および装置
Sudhakar et al. Development of Concatenative Syllable-Based Text to Speech Synthesis System for Tamil
JP2005181998A (ja) 音声合成装置および音声合成方法
JPH0962286A (ja) 音声合成装置および音声合成方法
JP2001249678A (ja) 音声出力装置,音声出力方法および音声出力のためのプログラム記録媒体
JP3034911B2 (ja) テキスト音声合成装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees