JPS6050600A - 規則合成方式 - Google Patents

規則合成方式

Info

Publication number
JPS6050600A
JPS6050600A JP58157719A JP15771983A JPS6050600A JP S6050600 A JPS6050600 A JP S6050600A JP 58157719 A JP58157719 A JP 58157719A JP 15771983 A JP15771983 A JP 15771983A JP S6050600 A JPS6050600 A JP S6050600A
Authority
JP
Japan
Prior art keywords
phoneme
testing
length
mora
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58157719A
Other languages
English (en)
Inventor
渡辺 貞一
典正 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58157719A priority Critical patent/JPS6050600A/ja
Priority to EP84305918A priority patent/EP0139419B1/en
Priority to DE8484305918T priority patent/DE3472021D1/de
Publication of JPS6050600A publication Critical patent/JPS6050600A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
〔発明の技術分野〕 本発明は文字列を規則により音声に変換する音声合成方
式に関する。 〔発明の技術的背景〕 文字列を音声に変換するには、文字列を音韻系列に変換
し、つぎに音韻長、ピッチなどの韻律パラメータおよび
音韻結合規則を決め、さらに音韻系列を音声のスペクト
ル包絡を特徴づけるパラメ−タで表現される音声素片に
変換し、最後4二上記の韻律パラメータおよび音韻結合
規則を考慮しつつ素片の結合を行い、その結果得られる
ノ(ラメータ列を合成器に送ることによって合成音声を
得る。 従来、上記の韻律パラメータおよび音韻結合規則を決め
る場合、音韻系列はモーラ単位で構成されているため、
あるモーラについてその直前あるいは直後のモーラのみ
の影響を考慮して行うことが多かったが、自然性の高い
合成音声を得るためには、必ずしも十分でなかった。 〔背景技術の問題亦〕 しかしながら、自然に発声された音声は、直前あるいは
直後のモーラの影響を受けるだけでなく、いくつか前ま
たは後のモーラの影響を強く受ける場合があることを、
本発明者は観測した。従来はこのような点を考慮して、
韻律パラメータおよび音韻結合規則の決定を行っていな
かったために、かならずしも自然性の高い合成音声が得
られていない。 たとえば韻律パラメータの1つである音韻長について、
促音の長さは、促音の直後のモーラの影響よりも、1つ
おいて後のモーラつまり促音から2つ後のモーラの種類
が強く影響することを見い出した。具体的に、促音から
2つ後のモーラが、長音、撥音などの場合、そうでない
場合に比較して、促音の長さが数十ミJI秒前後、長く
なることを、自然音声の観測から確認した。 従来の方式では、このような点を考慮して、音韻長を決
めていないため、合成音声の自然性を高めることがむず
かしいという問題があった。 〔発明の目的〕 本発明の目的は、韻律パラメータおよび音韻結合規則の
決定を、その音韻が属するモーラのいくつか前または後
のモーラが、その音韻に及ぼす影響を考慮して行うこと
により、従来よりも自然性の高いすなわち高品質の合成
音声を得ることを可能とする規則合成方式を提供するこ
とである。 〔発明の概要〕 本発明では、文字列を音韻系列に変換し、その音韻系列
の中から、特定の音韻つまりその音韻が属するモーラの
いくつか前または後のモーラの影響によって韻律パラメ
ータもしくは音韻結合規則が変化する音韻を検定し、つ
ぎにその特定の音韻に強い影響を与えるいくつか前また
は後のモーラの音韻の種類を検定し、その結果にもとづ
いて、韻律パラメータもしくは音韻結合規則を決定し、
さらに、上記のようにして決定された韻律パラメータも
しくは音韻結合規則を考慮しつつ音声素片パラメータの
結合を行い、結合の結果として得られた素片パラメータ
を合成器に入力し、合成音声を得る。 〔発明の効果〕 本発明によって、日本語文において出現頻度が高く、か
ついくつか前または後にくるモーラの影響によって、韻
律パラメータもしくは音韻結合規則が変化する音韻につ
いて、適切な韻律パラメータもしくは音韻結合規則を与
えることが可能となり、従来より自然性が高くかつ了解
度又は明瞭度もすぐれた合成音声を得ることができる。 〔発明の実施例〕 以下図面を参照して、本発明の実施例につき説明する。 第1図は本発明の一実施例を示す。 文字列入力回路1によって人力された文字列が、辞書照
合回路2に送られる。辞書照合回路2は、文字列の先頭
から単語記憶装置3との照合を行い、文字列を単語単位
に分割する。単語辞書記憶装置3には、単語ごとに単語
の音韻情報とアクセント情報等が登録される。文字音韻
変換回路4は照合できた単語について、上記音韻情報を
読み出し、単語の文字列を音韻系列に変換する。このよ
うにして、単語の集りである文字列が、音韻系列に変換
できる。 つぎに、特定音部検定回路6は、上記のようにして得ら
れた音韻系列の中から、特定の音韻、つまりその音韻が
属するモーラのいくつか前または後のモーラの影響によ
って韻律パラメータもしくは音韻結合規則が変化する音
韻を検定する。 たとえば、韻律パラメータの1つである皆韻長について
音韻系列の中に促音〔っ〕があるとき、促音の直後のモ
ーラでなく、1つおいて次のモーラが長音、撥音などの
場合、促音の長さが著しく変化する。特定音韻検定回路
5は、予め記憶装置5aに記憶されたこの場合の促音の
ような特定の音韻と入力音韻系列と照合することにより
特定の音韻を検定する。 前方音韻列検定回路6は、上記特定の音韻に影響を与え
る前方の音韻の種類を検定する。同様に後方音韻列検定
回路7は、上記の特定の音韻(二影響を与える後方の音
韻の種類を検定する。上列の促音の場合、促音に続く1
つおいて次のモーラが長音、撥音などあるか否かを検定
する。韻律パラメータ及び音韻結合規則決定回路8は、
上記の特定の音Mの検定および前方と後方の音韻列の検
定結果にもとづいて、特定の音韻の韻律パラメータもし
くは音韻結合規則を決める。素片結合回路9は音韻系列
に基いて音声素片ファイル10から対応する音声素片を
選択的にとり出し、音声素片パラメータの結合を行う。 この結合は回路7又は8により決定された韻律パラメー
タおよび音韻結合規則にもとづいて行う。このようにし
て結合されたパラメータが合成器11に送られて合成出
方される。 例えば、単語〔いつかん〕なる文字列が入力されると、
文字音韻変換回路4により音韻系列(IQKAN)に変
換される。ここで。は促音rつ〕に、Nは撥音〔ん〕に
対応する。第2図に示すように、この単語は4モーラが
らなっている。特定音韻検定回路5は、この音韻系列か
ら促音(Q)を検出すると、この音韻系列は後方音韻列
系窓回路7に送られ、促音〔Q〕(いま第2モーラにあ
る)の後方2つ目のモーラすなわち第4モーラが長音、
撥音などであるがを調べる。いま、音韻系列(IQKA
N)の第4モーラは撥音(N)であるから、この音韻系
列の第2モーラの音韻長を変更すべき情報を付加する。 韻律パラメータ決定回路8は、この情報を用いて第2モ
ーラの促音長tQを tq w tM十 転 と決定する。ここで1Mは通常の1モーラ長であり、日
本語音声の場合通常各モーラ長は一定である。 を人は促音長の増加分であり例えば50m5前後に選ば
れる。 一方、例えば、第2図に示すように、単語〔いつかつ〕
が入力した場合、回路5は第2モーラが促音(Q)であ
ることを検出するものの、回路7は2つ後方のモーラが
(TAU)であることから促音〔Q)の音韻長を変更す
べき情報を付加しないでそのまま出力する。したがって
、この場合の促音長tQは1Mのままとなる。 したがって、本実施例によれば特定音韻の後方の音韻系
列を考慮し自然性が高く了解度のすぐれた合成音声が得
られる。なお、本実施例では韻律パラメータのうち音韻
長を長くするようにしたが、その他の音韻パラメータも
しくは音韻結合規則を変更するものであってもよい。 第3図は本発明の他の実施例を示すもので、文字列を音
韻列に変換し、その音韻列中の単独母音(:O)、(U
)あるいは〔I〕を検定し、それらの単独母音を、その
直前にくる音韻の種類が
〔0〕。 (U)あるいは(E)、CI)であるかに応じて、長音
に変換し、つぎに音韻列中の撥音あるいは長音を検定し
、さらにその撥音あるいは長音の長さに影響を与える前
方の音韻列の検定を行い、その結果にもとづいて上記の
撥音あるいは長音の長さを決定し、そのようにして決定
された音韻の長さを考慮しつつ音声素片パラメータの結
合を行い、結合結果として得られ素片パラメータを合成
器に入力し、合成音声を得るように構成されている。 たとえば、日本語の単語では、4モ一ラ単語が最も数が
多いが、この4モ一ラ単語のうちでも、末尾のモーラが
撥音〔ん〕であるものは、出現頻度が高い(例〔だんが
ん〕、〔けいさん〕などにおける末尾の〔ん〕)。この
場合、第4モーラ(末尾)の撥音の長さは、第2モーラ
にくる音韻の種類と関連が深い。すなわち、第2モーラ
に撥音あるいは長音がくるとき、第4モーラの撥音の長
さは、第2キーラの撥音あるいは長音の長さとほぼ等し
いことが、自然音声から観測される。 第3図4二おいて、文字列入力回路31により入力され
た文字列は、音韻列生成回路32によって音韻列に変換
される。 つぎに音韻列中に単独母音〔0)、(U)あるいはCI
)があるかどうかを、単独母音(0)、(U)あるいは
CI)検定回路33によって検定し、もし、それらの単
独母音がある場合、単独母音の直前の音韻が(o)、 
〔U)あるいはCB)、(、I)であるかどうかを、直
前音韻(0)、(U)あるいは〔B〕。 CI)検定回路34によって検定し、その結果にもとづ
いて、単独母音の長音変換口w!35により、上記の単
独母音を長音(=変換する。 すなわち、第4図の例1に示すように、単独母音〔U 
)の直前が母音(U)または(0)のとき。 単独母音を長音(記号(L)で示す)に置換する。 このよう(二する理由は、日本語の自然な発音の場合、
上記のような単独母音は長音として発音されるためであ
る。同様に単独母音〔o〕の直前が母音(U)または母
〔0〕のとき、単独母音〔o〕を長音に変換しく第4
図の例2)、単独母音(I)の直前が母音(1)または
母音
〔0〕のとき、単独母音(I)を長音に変換する(
第2図の例2および例3)。 上記の変換をされた音韻例(二ついて、撥音あるいは長
音検定回路6が、音韻列中に撥音あるいは長音があるか
否かを検定する。もし撥音あるいは長音がある場合、前
方音韻列検定回路37は、撥音あるいは長音の前方に位
置する音韻の系列を検定する。音韻長決定回路38は、
上記の検定結果にもとづいて、撥音あるいは長音の長さ
を決定する。 すなわち、撥音が音韻列中に存在する場合、第5図に示
す撥音規則にしたがって、撥音の長さを決める。たとえ
ば、第5図の例1の文字列〔ダンガン〕の場合、第4モ
ーラの撥音は、その前方の音韻列における第2モーラの
撥音と関連をもち、両者の長さがほぼ等しくなる。この
点を考慮して、第4モーラの撥音の長さが第2モーラの
撥音の長さと等しくなるようにする。第4図の例2の文
字列〔ケイサン〕の場合のように第2モーラが長音の場
合についても、上記と同様に、第4モーラの撥音の長さ
を第2モーラの長音の長と等しくなるようにする。以上
が撥音の長さを前方の音韻列を考慮して決める撥音規則
である。 同様に長音が音韻列中に存在する場合も、第6図に示す
長音規則にしたがって、長音の長さを決める。 音声素片結合回路39は、音韻にもとづいて音声素片記
憶装置40から音声素片を選択してとり出し、音声素片
パラメータの結合を行う。この結合の際、撥音あるいは
長音については、上記のように音韻列を考慮して決めら
れた長さになるようにする。以上のよンにして結合され
た音声素片パラメータが合成器41に送られる。 合成器41は上述の音声素片パラメータにもとづいて、
合成音声を生成する。 かくして本実施例によれば、出現頻度の高い撥音あるい
は長音を含む音韻連続について、それらの前方にくる音
韻系列を考慮して自然性が高くかつ明瞭な合成音声が得
られる。
【図面の簡単な説明】
第1図は、本発明の一実施例の構成図、第2図は本発明
の一実施例の動作を説明するための図、第3図は本発明
の他の実施例の構成図、第4図は、単独母音の長音への
変換を示す図、第5図は、撥音の長さを決める撥音規則
を示す図、第6図は、長音の長さを決める長音規則を示
す図である。 1・・・文字列入力回路 2・・・辞書照合回路 3・・・単語辞書記憶装置 4・・・文字音韻変換回路 5・・・特定音韻変換回路 6・・・前方音韻列検定回路 7・・・後方音韻列検定回路 8・・・韻律パラメータ決定回路 9・・・素片結合回路 10・・・音声素片ファイル 11・・・合成器 代理人 弁理士 則 近 憲 佑 (ほか1名) (合成(F戸) 第4図

Claims (2)

    【特許請求の範囲】
  1. (1) 文字列を音韻系列に変換する文字音韻変換手段
    と、この手段により得られた音韻系列から音韻長、ピッ
    チなどの韻律パラメータもしくは音韻結合規則が、その
    音韻の属するモーラの前後に離れて位置するモーラの影
    響により変°化する特定の音韻を検定する特定音韻検定
    手段と、この手段により検定された特定の音韻に影響を
    与える前後に離れた位置の音韻を検定する音韻列検定手
    段と、これらの手段により得られた結果にもとづいて、
    前記音韻系列の韻律パラメータもしくは音韻結合規則を
    決定する韻律パラメータ又は音韻結合規則決定手段と、
    この手段により決定された韻律パラメータもしくは音韻
    結合規則にもとづいて音声素片を結合する素片結合手段
    とを備えたことを特徴′ とする規則合成方式。
  2. (2)文字列から音韻列を生成する音韻列生成手段と、
    音韻列中の特定の単独母音を検定する単独母音検定手段
    と、それら単独母音をその直前にくる母音の種類にした
    がって長音に変換する長音変換手段と、前記音韻列中の
    抄音あるいは長音を検定する撥音あるいは長音検定手段
    と、撥音あるいは長音の長さに影響を与える前方の音韻
    列を検定する前方音韻列検定手段と、この手段により得
    られた結果にもとづいて音韻の長さを決定する音韻列検
    定手段と、この手段により決定された音韻の長さを考慮
    して音声素片を結合する音声累片結合手段とを備えたこ
    とを特徴とする規則合成方式。
JP58157719A 1983-08-31 1983-08-31 規則合成方式 Pending JPS6050600A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP58157719A JPS6050600A (ja) 1983-08-31 1983-08-31 規則合成方式
EP84305918A EP0139419B1 (en) 1983-08-31 1984-08-30 Speech synthesis apparatus
DE8484305918T DE3472021D1 (en) 1983-08-31 1984-08-30 Speech synthesis apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58157719A JPS6050600A (ja) 1983-08-31 1983-08-31 規則合成方式

Publications (1)

Publication Number Publication Date
JPS6050600A true JPS6050600A (ja) 1985-03-20

Family

ID=15655874

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58157719A Pending JPS6050600A (ja) 1983-08-31 1983-08-31 規則合成方式

Country Status (3)

Country Link
EP (1) EP0139419B1 (ja)
JP (1) JPS6050600A (ja)
DE (1) DE3472021D1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61223800A (ja) * 1985-03-29 1986-10-04 株式会社東芝 音声合成装置
JPS6347799A (ja) * 1986-08-15 1988-02-29 株式会社リコー 韻律制御方式
JPH01146797A (ja) * 1987-12-02 1989-06-08 Teibow Co Ltd 無機質製ペン先の製造方法
US5094254A (en) * 1989-12-06 1992-03-10 Schwan Stabilo Schwanhausser Gmbh & Co. Mascara applicator device

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR940002854B1 (ko) * 1991-11-06 1994-04-04 한국전기통신공사 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치
SE9301596L (sv) * 1993-05-10 1994-05-24 Televerket Anordning för att öka talförståelsen vid översätttning av tal från ett första språk till ett andra språk
JP3548230B2 (ja) * 1994-05-30 2004-07-28 キヤノン株式会社 音声合成方法及び装置
JP5765874B2 (ja) * 2008-10-09 2015-08-19 アルパイン株式会社 音声合成装置、音声合成方法および音声合成プログラム
CN111177542B (zh) * 2019-12-20 2021-07-20 贝壳找房(北京)科技有限公司 介绍信息的生成方法和装置、电子设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BG24190A1 (en) * 1976-09-08 1978-01-10 Antonov Method of synthesis of speech and device for effecting same

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61223800A (ja) * 1985-03-29 1986-10-04 株式会社東芝 音声合成装置
JPH0631999B2 (ja) * 1985-03-29 1994-04-27 株式会社東芝 音声合成装置
JPS6347799A (ja) * 1986-08-15 1988-02-29 株式会社リコー 韻律制御方式
JPH01146797A (ja) * 1987-12-02 1989-06-08 Teibow Co Ltd 無機質製ペン先の製造方法
US5094254A (en) * 1989-12-06 1992-03-10 Schwan Stabilo Schwanhausser Gmbh & Co. Mascara applicator device

Also Published As

Publication number Publication date
DE3472021D1 (en) 1988-07-14
EP0139419B1 (en) 1988-06-08
EP0139419A1 (en) 1985-05-02

Similar Documents

Publication Publication Date Title
US8224645B2 (en) Method and system for preselection of suitable units for concatenative speech
US7565291B2 (en) Synthesis-based pre-selection of suitable units for concatenative speech
JP3361066B2 (ja) 音声合成方法および装置
US4685135A (en) Text-to-speech synthesis system
US6212501B1 (en) Speech synthesis apparatus and method
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
JPH08123455A (ja) 音声合成方法及びシステム
US6424937B1 (en) Fundamental frequency pattern generator, method and program
JPS6050600A (ja) 規則合成方式
US10643600B1 (en) Modifying syllable durations for personalizing Chinese Mandarin TTS using small corpus
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JPH0887297A (ja) 音声合成システム
JPH08335096A (ja) テキスト音声合成装置
JP3626398B2 (ja) テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体
JPH06318094A (ja) 音声規則合成装置
JP3060276B2 (ja) 音声合成装置
JPH0944191A (ja) 音声合成装置
Dessai et al. Development of Konkani TTS system using concatenative synthesis
KR920009961B1 (ko) 무제한 단어 한국어 합성 방법 및 회로
Dessai et al. Syllabification: An effective approach for a TTS system for Konkani
JPH0562356B2 (ja)
JP2737122B2 (ja) 音声辞書作成装置
JPS59155899A (ja) 音声合成方式
Yiourgalis et al. Text-to-speech system for Greek
JP2615649B2 (ja) 単語音声認識装置