JP3089715B2 - Speech synthesizer - Google Patents

Speech synthesizer

Info

Publication number
JP3089715B2
JP3089715B2 JP03184467A JP18446791A JP3089715B2 JP 3089715 B2 JP3089715 B2 JP 3089715B2 JP 03184467 A JP03184467 A JP 03184467A JP 18446791 A JP18446791 A JP 18446791A JP 3089715 B2 JP3089715 B2 JP 3089715B2
Authority
JP
Japan
Prior art keywords
synthesis
unit
synthesizing
sentence
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03184467A
Other languages
Japanese (ja)
Other versions
JPH0527789A (en
Inventor
由里子 駿河
紀代 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP03184467A priority Critical patent/JP3089715B2/en
Publication of JPH0527789A publication Critical patent/JPH0527789A/en
Application granted granted Critical
Publication of JP3089715B2 publication Critical patent/JP3089715B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は複数の異なる合成手段を
組合せた音声合成装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech synthesizing apparatus combining a plurality of different synthesizing means.

【0002】[0002]

【従来の技術】従来の規則合成と分析合成もしくは録音
再生を組合せて音声メッセージを提供する音声合成装置
の例を図11に示す。1は文章生成手段であり、合成す
る内容が入力される。2は合成手段選択手段であり、文
章の内容によって合成手段を選択する。3は規則合成手
段であり、言語処理手段2a・韻律制御手段2b・パラ
メータ作成手段2c・合成処理手段2dから構成されて
いる。4は録音再生手段であり、波形データ格納手段4
aと読みだし制御手段4bから構成されている。5はD
/A部であり、3や4で得られた音声波形から合成音声
をつくる。6は音声を出力する合成音出力端で、スピー
カ・ヘッドホン・受話器などを示す。
2. Description of the Related Art FIG. 11 shows an example of a conventional speech synthesizer for providing a voice message by combining rule synthesis and analysis synthesis or recording / reproduction. Reference numeral 1 denotes a sentence generation unit, to which contents to be combined are input. A synthesizing means selecting means 2 selects a synthesizing means according to the contents of the text. Reference numeral 3 denotes a rule synthesizing unit, which is composed of a language processing unit 2a, a prosody control unit 2b, a parameter creation unit 2c, and a synthesis processing unit 2d. Numeral 4 denotes a recording / reproducing means, and a waveform data storage means 4
a and read control means 4b. 5 is D
A / A section creates a synthesized voice from the voice waveform obtained in steps 3 and 4. Reference numeral 6 denotes a synthesized sound output terminal for outputting a voice, and indicates a speaker, headphones, a receiver, and the like.

【0003】[0003]

【発明が解決しようとする課題】規則合成と分析合成・
録音再生など異なる合成手段の合成音については、音質
にまだかなりの差がある。また録音再生についてはその
音声を使用する際、発音速度やアクセントなど全て録音
時のまま変更することはできない。この為、複数の合成
手段を用いて音声を合成する場合には、合成音をつなぐ
部分がよりなめらかになるよう何らかの処理が必要であ
る。従来の音声合成装置は、何の処理も行わずに音声を
つないで合成する為、つなぎの部分で音質に差があるた
めに違和感を感じやすく、音量が異なるために聞き取り
にくかったり、発音速度やイントネーションが異なるた
めに不自然な印象を与えるという問題点があった。
SUMMARY OF THE INVENTION Rule synthesis and analytical synthesis
There is still a considerable difference in sound quality for synthesized sounds of different synthesis means such as recording and playback. Also, when using the voice for recording and reproduction, it is not possible to change all of the pronunciation speed, accent, etc. as they were at the time of recording. For this reason, when synthesizing speech using a plurality of synthesizing means, some processing is required so that the portion connecting the synthesized sounds becomes smoother. Conventional speech synthesizers synthesize and connect voices without performing any processing.Therefore, there is a difference in sound quality at the joints, making it easy to feel uncomfortable. There is a problem that an unnatural impression is given due to different intonation.

【0004】本発明は、懸かる点に鑑みてなされたもの
で、合成音をつなぐ部分のオーバーラップを行ったり、
発音速度や音量・イントネーション等のパラメータの調
整を行うことにより、合成音のつなぎの部分のよりなめ
らかな品質の高い合成音を提供することを目的とする。
[0004] The present invention has been made in view of the points involved, and it is possible to overlap portions connecting synthetic sounds,
It is an object of the present invention to provide a synthesized sound having a smoother and higher quality at a portion where the synthesized sound is connected by adjusting parameters such as a pronunciation speed, a volume, and an intonation.

【0005】[0005]

【課題を解決するための手段】(1) 文章を生成する文章
生成手段と、音声波形を合成する複数の異なる合成手段
と、前記文章の内容によって前記合成手段を選択する合
成手段選択手段と、前記合成手段選択手段により選択さ
れた合成手段から出力される複数の合成音の波形を足し
合わせ処理するオーバーラップ手段とを備えた音声合成
装置を構成する。
Means for Solving the Problems (1) Sentence generating means for generating a sentence, a plurality of different synthesizing means for synthesizing a speech waveform, and synthesizing means selecting means for selecting the synthesizing means according to the contents of the sentence; A speech synthesizing apparatus comprising an overlap unit for adding and processing waveforms of a plurality of synthesized sounds output from the synthesis unit selected by the synthesis unit selection unit.

【0006】[0006]

【0007】(2) また、その複数の合成音のいずれかが
パラメトリックな合成手段であった場合に、その合成手
段で作成された合成パラメータを他の音声にあわせて調
整するパラメータ調整手段と、その複数の合成音の波形
を足し合わせ処理するオーバーラップ手段とを備える。
[0007] (2) If any of the plurality of synthesized speech is a parametric synthesis means, a parameter adjustment means for adjusting together synthesis parameters created by the combining means to the other voice, And overlapping means for adding and processing the waveforms of the plurality of synthesized sounds.

【0008】(3) 更に、重複する音声波形を足し合わせ
る際、それぞれのアンプを制御手段を用いて調節しなが
ら重ねて出力するオーバーラップ手段を備える。
( 3 ) Further, when adding overlapping audio waveforms, an overlap means is provided for overlapping and outputting each amplifier while adjusting each amplifier using the control means.

【0009】[0009]

【作用】本発明の上記構成によれば、 (1) 合成手段選択手段によって、入力された文章を合成
方法の切り替わる部分が重複するように文章を切り分け
て、それぞれ選択した合成手段によって音声を作成す
る。その後、音声の重複する部分をオーバーラップ処理
することによって、つなぎの部分のよりなめらかな合成
音を提供する。
According to the above configuration of the present invention, (1) a sentence is segmented by the synthesizing means selecting means so that the part where the synthesizing method is switched overlaps, and a speech is created by the respectively selected synthesizing means. I do. Thereafter, the overlapped portion of the speech is overlapped to provide a smoother synthesized sound of the connected portion.

【0010】(2) 合成手段選択手段によって、入力され
た文章を切り分けて、それぞれ選択した合成手段によっ
て音声を作成する。その際、パラメータ調整手段によっ
て、その複数の合成音のいづれかがパラメトリックな合
成手段であった場合にその合成手段で作成された合成パ
ラメータを他の音声にあわせて調整することによって、
つなぎの部分のよりなめらかな合成音を提供する。
(2) The input sentence is cut by the synthesizing means selecting means, and a voice is created by the selected synthesizing means. At this time, if any of the plurality of synthesized sounds is a parametric synthesis means, the parameter adjustment means adjusts the synthesis parameters created by the synthesis means in accordance with other voices.
Provides a smoother synthetic sound at the joint.

【0011】(2) 合成手段選択手段によって、入力され
た文章を合成方法の切り替わる部分が重複するように文
章を切り分けて、それぞれ選択した合成手段によって音
声を作成する。その際、パラメータ調整手段によって、
その複数の合成音のいづれかがパラメトリックな合成手
段であった場合にその合成手段で作成された合成パラメ
ータを他の音声にあわせて調整した後、さらに音声の重
複する部分をオーバーラップ処理することによって、つ
なぎの部分のよりなめらかな合成音を提供する。 (3) 第1の発明におけるオーバーラップ処理において、
その重複する音声波形を足し合わせる際、それぞれのア
ンプを制御手段を用いて調節しながら重ねて出力するこ
とにより、つなぎの部分のよりなめらかな合成音を提供
する。
( 2 ) Sentences are divided by the synthesizing means selecting means so that the portions where the synthesizing methods are switched overlap each other, and speech is created by the respectively selected synthesizing means. At that time, the parameter adjustment means
If any of the synthesized sounds is a parametric synthesis means, the synthesis parameters created by the synthesis means are adjusted according to the other voices, and then the overlapping parts of the voices are overlapped. Provides a smoother synthetic sound at the junction. ( 3 ) In the overlap processing in the first invention,
When adding the overlapping voice waveforms, the respective amplifiers are superimposed and output while being adjusted by using the control means, thereby providing a smoother synthesized sound at the connecting portion.

【0012】[0012]

【実施例】【Example】

(実施例1)図1は、請求項1記載の本発明の実施例の
ブロック図である。2つの合成方法の組合せによる、銀
行の振込み確認メッセージを例にとって説明する。な
お、この2つの合成方法の組合せによる銀行の振込み確
認メッセージは、以下全ての実施例について同様に用い
る。図において、1は文章生成部であり、キーボード等
を示す。2は文章内容によって合成方法を選択する合成
手段選択部であり、固有名詞とその後に続く2・3文字
分を規則合成に、そして固有名詞以外の部分を録音再生
に、一部重複するように文章を切り分ける。3は入力さ
れた文字列を単語や文節に分割し、読みやアクセント・
品詞等を決定する言語処理部3aと、ポーズの位置や長
さの決定・イントネーションの決定を行う韻律制御部3
bと、前記言語処理部と韻律制御部の結果に従って合成
パラメータを作成するパラメータ作成部3cと、前記パ
ラメータ作成部によって作成されたパラメータから合成
音を作成する合成処理部3dから構成される規則合成部
である。4は波形データ格納部4aと、読みだし制御部
4bからなる録音再生部である。5は規則合成用波形デ
ータと録音再生用波形データの重複する部分を足し合わ
せ処理するオーバーラップ部で、6はこれにより完成し
た波形データから合成音をつくるD/A部である。7は
音声を出力する合成音声出力端であり、スピーカ・ヘッ
ドホン・受話器などを示す。
(Embodiment 1) FIG. 1 is a block diagram of a first embodiment of the present invention. The following describes an example of a bank transfer confirmation message by a combination of the two combining methods. The transfer confirmation message of the bank by the combination of the two combining methods is used in the same manner in all the following embodiments. In the figure, reference numeral 1 denotes a text generation unit, such as a keyboard. Numeral 2 is a synthesizing means selecting section for selecting a synthesizing method according to the text content, so that the proper noun and the following two or three characters are used for rule synthesis, and the part other than the proper noun is used for recording / reproducing. Separate sentences. 3 divides the input character string into words and phrases, and
A language processing unit 3a for determining the part of speech and the like, and a prosody control unit 3 for determining the position and length of the pose and the intonation
b, a parameter creation unit 3c for creating a synthesis parameter according to the results of the language processing unit and the prosody control unit, and a synthesis processing unit 3d for creating a synthesized sound from the parameters created by the parameter creation unit. Department. Reference numeral 4 denotes a recording / playback unit including a waveform data storage unit 4a and a reading control unit 4b. Reference numeral 5 denotes an overlap section for adding overlapping portions of the rule-synthesizing waveform data and recording / reproducing waveform data, and 6 denotes a D / A section for producing a synthesized sound from the completed waveform data. Reference numeral 7 denotes a synthesized voice output terminal that outputs voice, and indicates a speaker, headphones, a receiver, and the like.

【0013】次に各処理の詳細について実例を用いて説
明する。「松下電器の伊藤様から振込がありました。」
という文章が入力された場合について考える。文章入力
部1により合成する文章が入ってくると、合成手段選択
部2により入力文章は固有名詞「松下電器の伊藤」とそ
れに続く「様から」の部分は規則合成、固有名詞以外の
部分「様から振込がありました。」は録音再生と分けら
れる。規則合成部3へ送られた文字列は、言語処理部3
a・韻律制御部3b・パラメータ作成部3cによって以
下のように分割され、アクセント型や品詞・読みなど合
成パラメータの情報を得たあと、合成処理部3dによっ
て合成音がつくられる。 (入力文章) 「松下電器の伊藤様から」 (単語分割) 松下電器 / の / 伊藤 / 様 / から (読み) マツシタテ゛ンキ ノ イトウ サマ カラ (アクセント型) 5 B 0 2 A (品詞) 固有名詞 格助 固有名詞 名詞 接助 ここで「の」に対して与えられているアクセント型Bと
「から」に対して与えられているアクセント型Aは、N
HKアクセント辞書・解説付録(日本放送協会1985年)
に記載されているもので、自立語と結合して文節を構成
する際の結合アクセント核のある音節位置を示したもの
である。
Next, the details of each processing will be described using actual examples. "There was a transfer from Mr. Ito of Matsushita Electric."
Consider the case where the sentence is input. When a sentence to be synthesized by the sentence input unit 1 enters, the input sentence by the synthesizing means selecting unit 2 is a proper noun "Matsushita Electric's Ito" followed by a rule synthesis, and a part other than a proper noun " There was a transfer from Mr .. "is separated from recording and playback. The character string sent to the rule synthesizing unit 3 is
a, the prosody control unit 3b, and the parameter creation unit 3c divide the data as follows, and obtain information on synthesis parameters such as accent type, part of speech, and reading, and then generate a synthesized sound by the synthesis processing unit 3d. (Input sentence) "From Matsushita Electric's Ito-sama" (word division) Matsushita Electric / no / Ito / sama / kara (reading) Matsushita Tenki No Ito Sama Kara (accent type) 5B02A (part of speech) Proper noun case Auxiliary proper nouns Nouns Auxiliary Here, the accent type B given to "no" and the accent type A given to "kara" are N
HK Accent Dictionary and Commentary Appendix (Japan Broadcasting Corporation, 1985)
This shows a syllable position with a connecting accent nucleus when combining with an independent word to form a phrase.

【0014】録音再生部4へ送られた文字列は、波形デ
ータ格納部4aからそれに合う音声を取り出し、読みだ
し制御部4bによって合成音を再生する。オーバーラッ
プ部5で、規則合成用波形データと録音再生用波形デー
タの重複する部分を足し合わせ処理した後、その波形か
らD/A部6によって合成音をつくり合成音出力端7よ
り音声が提供される。このように、2つの波形データの
重複する部分でオーバーラップ処理を行うことにより、
つなぎの部分がより自然で違和感の少ない音声を提供す
ることができる。尚、本実施例では一例として「固有名
詞」は規則合成と設定したが、これは本発明を何ら拘束
するものではない。
The character string sent to the recording / reproducing unit 4 is extracted from the waveform data storage unit 4a, and the read sound is reproduced by the reading control unit 4b. After the overlapping portion 5 adds the overlapping portions of the regular synthesis waveform data and the recording / reproduction waveform data, the D / A portion 6 creates a synthesized sound from the waveform and provides a sound from the synthesized sound output terminal 7. Is done. As described above, by performing the overlap processing on the overlapping portion of the two waveform data,
It is possible to provide a sound with a more natural connection and less discomfort. In the present embodiment, as an example, “proper noun” is set as rule composition, but this does not restrict the present invention at all.

【0015】(実施例2)図2は、請求項1記載の本発
明の実施例のブロック図である。実施例1の構成の録音
再生部4を分析合成部に代えたものである。図におい
て、1文章生成部・2合成手段選択部・3規則合成部・
5オーバーラップ部・6D/A部・7合成音声出力端
は、実施例1と同様の処理を行う。4は入力文章からパ
ラメータを作成するパラメータ格納部4aとパラメータ
制御部4bと、前記パラメータ格納部とパラメータ制御
部で作成されたパラメータから合成音を作成する合成処
理部4cからなる分析合成部である。
(Embodiment 2) FIG. 2 is a block diagram of a second embodiment of the present invention. In this embodiment, the recording / reproducing unit 4 having the configuration of the first embodiment is replaced with an analysis / synthesis unit. In the figure, 1 sentence generation section, 2 synthesis means selection section, 3 rule synthesis section,
The 5 overlap section, 6D / A section, and 7 synthesized voice output terminal perform the same processing as in the first embodiment. Reference numeral 4 denotes an analysis / synthesis unit including a parameter storage unit 4a and a parameter control unit 4b for generating parameters from input sentences, and a synthesis processing unit 4c for generating a synthesized sound from the parameters generated by the parameter storage unit and the parameter control unit. .

【0016】次に各処理の詳細について実例を用いて説
明する。「松下電器の伊藤様から振込がありました。」
という文章が入力された場合について考える。文章入力
部1により合成する文章が入ってくると、合成手段選択
部2により入力文章は固有名詞「松下電器の伊藤」とそ
れに続く「様から」の部分は規則合成、固有名詞以外の
部分「様から振込がありました。」は分析合成と分けら
れる。規則合成部3へ送られた文字列は、言語処理部3
a・韻律制御部3b・パラメータ作成部3cによって以
下のように分割され、アクセント型や品詞・読みなど合
成パラメータの情報を得たあと、合成処理部3dによっ
て合成音がつくられる。 (入力文章) 「松下電器の伊藤様から」 (単語分割) 松下電器 / の / 伊藤 / 様 / から (読み) マツシタテ゛ンキ ノ イトウ サマ カラ (アクセント型) 5 B 0 2 A (品詞) 固有名詞 格助 固有名詞 名詞 接助 ここで「の」に対して与えられているアクセント型Bと
「から」に対して与えられているアクセント型Aは、N
HKアクセント辞書・解説付録(日本放送協会1985年)
に記載されているもので、自立語と結合して文節を構成
する際の結合アクセント核のある音節位置を示したもの
である。
Next, the details of each processing will be described using actual examples. "There was a transfer from Mr. Ito of Matsushita Electric."
Consider the case where the sentence is input. When a sentence to be synthesized by the sentence input unit 1 enters, the input sentence by the synthesizing means selecting unit 2 is a proper noun "Matsushita Electric's Ito" followed by a rule synthesis, and a part other than a proper noun " There was a transfer from us. "Is separated from analytical synthesis. The character string sent to the rule synthesizing unit 3 is
a, the prosody control unit 3b, and the parameter creation unit 3c divide the data as follows, and obtain information on synthesis parameters such as accent type, part of speech, and reading, and then generate a synthesized sound by the synthesis processing unit 3d. (Input sentence) "From Matsushita Electric's Ito-sama" (word division) Matsushita Electric / no / Ito / sama / kara (reading) Matsushita Tenki No Ito Sama Kara (accent type) 5B02A (part of speech) Proper noun case Auxiliary proper nouns Nouns Auxiliary Here, the accent type B given to "no" and the accent type A given to "kara" are N
HK Accent Dictionary and Commentary Appendix (Japan Broadcasting Corporation, 1985)
This shows a syllable position with a connecting accent nucleus when combining with an independent word to form a phrase.

【0017】分析合成部4へ送られた文字列は、パラメ
ータ格納部4a、パラメータ制御部4b、合成処理部4
cによって合成音を再生する。オーバーラップ部5で、
規則合成用波形データと分析合成用波形データの重複す
る部分を足し合わせ処理した後、その波形からD/A部
6によって合成音をつくり合成音出力端7より音声が提
供される。このように、2つの波形データの重複する部
分でオーバーラップ処理を行うことにより、つなぎの部
分がより自然で違和感の少ない音声を提供することがで
きる。尚、本実施例では一例として「固有名詞」は規則
合成と設定したが、これは本発明を何ら拘束するもので
はない。
The character string sent to the analysis / synthesis unit 4 is stored in a parameter storage unit 4a, a parameter control unit 4b, and a synthesis processing unit 4
The synthesized sound is reproduced by c. In the overlap part 5,
After the overlapping portion of the rule-synthesizing waveform data and the analysis-synthesis waveform data are added together, a synthetic sound is formed by the D / A section 6 from the waveform, and a sound is provided from the synthetic sound output terminal 7. As described above, by performing the overlapping process on the overlapping portion of the two waveform data, it is possible to provide a sound with a more natural connection portion and less discomfort. In the present embodiment, as an example, “proper noun” is set as rule composition, but this does not restrict the present invention at all.

【0018】(実施例3)図3は、請求項1記載の本発
明の実施例のブロック図である。実施例2の構成の規則
合成部3を録音再生部に代えたものである。図におい
て、1文章生成部・2合成手段選択部・4分析合成部・
5オーバーラップ部・6D/A部・7合成音声出力端
は、実施例2と同様の処理を行う。3は波形データ格納
部3aと、読みだし制御部3bからなる録音再生部であ
る。
(Embodiment 3) FIG. 3 is a block diagram showing an embodiment 3 of the present invention. The rule synthesizing unit 3 of the second embodiment is replaced with a recording / reproducing unit. In the figure, 1 sentence generation section, 2 synthesis means selection section, 4 analysis synthesis section,
The 5 overlap section, 6D / A section, and 7 synthesized voice output terminal perform the same processing as in the second embodiment. Reference numeral 3 denotes a recording / reproducing unit including a waveform data storage unit 3a and a reading control unit 3b.

【0019】次に各処理の詳細について実例を用いて説
明する。「松下電器の伊藤様から振込がありました。」
という文章が入力された場合について考える。文章入力
部1により合成する文章が入ってくると、合成手段選択
部2により入力文章は固有名詞「松下電器の伊藤」とそ
れに続く「様から」の部分は分析合成、固有名詞以外の
部分「様から振込がありました。」は録音再生と分けら
れる。録音再生部3へ送られた文字列は、波形データ格
納部3aからそれに合う音声を取り出し、読みだし制御
部3bによって合成音を再生する。分析合成部4へ送ら
れた文字列は、パラメータ格納部4a、パラメータ制御
部4b、合成処理部4cによって合成音を再生する。オ
ーバーラップ部5で、録音再生用波形データと分析合成
用波形データの重複する部分を足し合わせ処理した後、
その波形からD/A部6によって合成音をつくり合成音
出力端7より音声が提供される。このように、録音再生
用波形データと分析合成用波形データの重複する部分で
オーバーラップ処理を行うことにより、つなぎの部分が
より自然で違和感の少ない音声を提供することができ
る。尚、本実施例では一例として「固有名詞」は分析合
成と設定したが、これは本発明を何ら拘束するものでは
ない。
Next, the details of each process will be described using actual examples. "There was a transfer from Mr. Ito of Matsushita Electric."
Consider the case where the sentence is input. When a sentence to be synthesized by the sentence input unit 1 comes in, the input sentence is input by the synthesizing means selection unit 2 into the proper noun “Ito Matsushita Electric” and the subsequent “samakara” are analyzed and synthesized. There was a transfer from Mr .. "is separated from recording and playback. The character string sent to the recording / reproducing unit 3 is extracted from the waveform data storage unit 3a, and the read control unit 3b reproduces the synthesized sound. The character string sent to the analysis / synthesis unit 4 is reproduced as a synthesized sound by the parameter storage unit 4a, the parameter control unit 4b, and the synthesis processing unit 4c. After the overlapping portion 5 adds together the overlapping portions of the recording / playback waveform data and the analysis / synthesis waveform data,
A synthetic sound is formed from the waveform by the D / A unit 6, and a sound is provided from a synthetic sound output terminal 7. As described above, by performing the overlap processing on the overlapping portion of the recording / reproducing waveform data and the analysis / synthesis waveform data, it is possible to provide a sound with a more natural connection portion and less discomfort. In this embodiment, as an example, “proper noun” is set to analysis synthesis, but this does not restrict the present invention at all.

【0020】(参考例1) 図4は、本発明の参考例1のブロック図である。請求項
1記載の実施例のオーバーラップ処理に代わり、パラメ
トリックな合成手段においてパラメータの調整を行うも
のである。「松下電器の伊藤様から振込がありまし
た。」という文章が入力された場合について考える。こ
こでは、2つの音声について差のあるパラメータはピッ
チのみであったとする。文章入力部1により合成する文
章が入ってくると、合成手段選択部2により入力文章
は、固有名詞の「松下電器の伊藤」は規則合成、固有名
詞以外の「様から振込がありました。」は録音再生へと
分けられる。規則合成部へ送られた文章は言語処理部3
a・韻律制御部3b・パラメータ作成部3cによって以
下のように分割され、アクセント型や品詞・読みなど合
成パラメータの情報を得る。 (入力文章) 「松下電器の伊藤」 (単語分割) 松下電器 / の / 伊藤 (読み) マツシタテ゛ンキ ノ イトウ (アクセント型) 5 B 0 (品詞) 固有名詞 格助 固有名詞 ここで「の」に対して与えられているアクセント型B
は、NHKアクセント辞書・解説付録(日本放送協会
1985年)に記載されているもので、自立語と結合して文
節を構成する際の結合アクセント核のある音節位置を示
したものである。
(Embodiment 1 ) FIG. 4 is a block diagram of Embodiment 1 of the present invention. Instead of the overlap processing of the first embodiment, the parameter is adjusted by a parametric synthesis means. Consider the case where the sentence "There was a transfer from Mr. Ito of Matsushita Electric" was input. Here, it is assumed that the only parameter having a difference between the two sounds is the pitch. When a sentence to be synthesized by the sentence input unit 1 enters, the input sentence by the synthesizing means selection unit 2 is a proper noun, "Matsushita Electric's Ito" is rule-synthesized, and "other than a proper noun, there was a transfer from the state." Is divided into recording and playback. The sentence sent to the rule synthesis unit is the language processing unit 3
a, the prosody control unit 3b, and the parameter creation unit 3c divide the data as follows, and obtain information on the synthesis parameters such as accent type, part of speech, and reading. (Input sentence) "Ito of Matsushita Electric" (word division) Matsushita Electric / no / Ito (reading) Matsushita Nokito Ito (accent type) 5B0 (part of speech) proper noun Gasuke proper noun Here for "no" Accent type B given
Is an NHK accent dictionary and commentary appendix (Japan Broadcasting Corporation)
1985), and shows the syllable position with the connecting accent nucleus when combining with independent words to form a phrase.

【0021】録音再生部4へ送られた文字列は、波形デ
ータ格納部4aからそれに合う音声を取り出し、読みだ
し制御部4bによって合成音を再生する。パラメータ調
整部5は、録音再生用波形データを参照して、規則合成
用パラメータと差のあったピッチのパラメータを少し下
げて調整し、調整されたパラメータから合成処理部6に
よって合成音を作成する。規則合成用波形データと録音
再生用波形データをD/A部7によって合成音をつくり
合成音出力端8より音声が提供される。このように、規
則合成用音響パラメータを録音再生用波形データに合わ
せて調整することにより、つなぎの部分がより自然で違
和感の少ない音声を提供することができる。尚、本実施
例では一例として「固有名詞」は規則合成と設定した
が、これは本発明を何ら拘束するものではない。また、
パラメータ調整部では「ピッチ」のみを調整するパラメ
ータと設定したが、これも本発明を何ら拘束するもので
はなく、合成に用いられる全てのパラメータを調整でき
るものとする。
The character string sent to the recording / reproducing unit 4 is extracted from the waveform data storage unit 4a, and the read sound is reproduced by the reading control unit 4b. The parameter adjuster 5 refers to the recording / reproducing waveform data and slightly lowers and adjusts the parameter of the pitch different from the rule synthesizing parameter, and creates a synthesized sound from the adjusted parameter by the synthesizing processor 6. . A synthetic sound is created by the D / A unit 7 from the regular synthesizing waveform data and the recording / reproducing waveform data, and a sound is provided from a synthetic sound output terminal 8. In this way, by adjusting the rule-synthesizing acoustic parameters in accordance with the recording / reproducing waveform data, it is possible to provide a sound with a more natural connection portion and less discomfort. In the present embodiment, as an example, “proper noun” is set as rule composition, but this does not restrict the present invention at all. Also,
Although the parameter adjustment unit sets the parameter to adjust only the “pitch”, this is not intended to restrict the present invention in any way, and all parameters used for synthesis can be adjusted.

【0022】(参考例2) 図5は、本発明の参考例2のブロック図である。参考例
の録音再生に代わり、分析合成を用いたものである。
図において、1文章生成部・2合成手段選択部・3規則
合成部は参考例1と同様の処理を行う。4はパラメータ
格納部4aと、パラメータ制御部4bからなる分析合成
部である。5は前記規則合成部3と分析合成部4で作成
されたパラメータを比較して、差のあるパラメータを調
整するパラメータ調整部である。6は調整されたパラメ
ータから合成音を作る合成処理部で、7はD/A部であ
る。8は音声を出力する合成音声出力端であり、スピー
カ・ヘッドホン・受話器などを示す。
(Embodiment 2 ) FIG. 5 is a block diagram of Embodiment 2 of the present invention. Reference example
In this example , analysis and synthesis are used in place of recording / reproducing of No. 1 .
In the figure, 1 sentence generating section, 2 synthesizing means selecting section, and 3 rule synthesizing section perform the same processing as in the first embodiment . Reference numeral 4 denotes an analysis / synthesis unit including a parameter storage unit 4a and a parameter control unit 4b. Reference numeral 5 denotes a parameter adjustment unit that compares parameters created by the rule synthesis unit 3 and the analysis synthesis unit 4 and adjusts parameters having differences. Reference numeral 6 denotes a synthesis processing unit for generating a synthesized sound from the adjusted parameters, and reference numeral 7 denotes a D / A unit. Reference numeral 8 denotes a synthesized voice output terminal that outputs voice, and indicates a speaker, headphones, a receiver, and the like.

【0023】次に各処理の詳細について実例を用いて説
明する。「松下電器の伊藤様から振込がありました。」
という文章が入力された場合について考える。ここで
は、2つの音声について差のあるパラメータはピッチの
みであったとする。文章入力部1により合成する文章が
入ってくると、合成手段選択部2により入力文章は固有
名詞「松下電器の伊藤」は規則合成、固有名詞以外の部
分「様から振込がありました。」は分析合成と分けられ
る。規則合成部へ送られた文章は言語処理部3a・韻律
制御部3b・パラメータ作成部3cによって以下のよう
に分割され、アクセント型や品詞・読みなど合成パラメ
ータの情報を得る。 (入力文章) 「松下電器の伊藤」 (単語分割) 松下電器 / の / 伊藤 (読み) マツシタテ゛ンキ ノ イトウ (アクセント型) 5 B 0 (品詞) 固有名詞 格助 固有名詞 ここで「の」に対して与えられているアクセント型B
は、NHKアクセント辞書・解説付録(日本放送協会
1985年)に記載されているもので、自立語と結合して文
節を構成する際の結合アクセント核のある音節位置を示
したものである。
Next, the details of each process will be described using actual examples. "There was a transfer from Mr. Ito of Matsushita Electric."
Consider the case where the sentence is input. Here, it is assumed that the only parameter having a difference between the two sounds is the pitch. When a sentence to be synthesized by the sentence input unit 1 comes in, the input sentence by the synthesizing means selection unit 2 is a proper noun "Matsushita Electric's Ito" is rule-synthesized, and the part other than the proper noun "There was a transfer from Sama." Separated from analytical synthesis. The sentence sent to the rule synthesizing unit is divided as follows by the language processing unit 3a, the prosody control unit 3b, and the parameter creation unit 3c, and information on synthesis parameters such as accent type, part of speech, and reading is obtained. (Input sentence) "Ito of Matsushita Electric" (word division) Matsushita Electric / no / Ito (reading) Matsushita Nokito Ito (accent type) 5B0 (part of speech) proper noun Gasuke proper noun Here for "no" Accent type B given
Is an NHK accent dictionary and commentary appendix (Japan Broadcasting Corporation)
1985), and shows the syllable position with the connecting accent nucleus when combining with independent words to form a phrase.

【0024】分析合成部4へ送られた文字列は、パラメ
ータ格納部4a・パラメータ制御部4bによってパラメ
ータを作成する。パラメータ調整部5で、規則合成用パ
ラメータと分析合成用パラメータを比較し、両方のパラ
メータを調整してピッチを合わせた後、その合成パラメ
ータから合成処理部6・D/A部7によって合成音をつ
くり合成音出力端8より音声が提供される。このよう
に、規則合成と分析合成の2つの合成手段を用いる際に
パラメータ調整を行うことにより、違和感の少ない音声
を提供することができる。尚、本実施例では一例として
「固有名詞」は規則合成と設定したが、これは本発明を
何ら拘束するものではない。また、パラメータ調整部で
は「ピッチ」のみを調整するパラメータと設定したが、
これも本発明を何ら拘束するものではなく、合成に用い
られる全てのパラメータを調整できるものとする。
The character string sent to the analysis / synthesis unit 4 is used to create parameters by a parameter storage unit 4a and a parameter control unit 4b. The parameter adjusting unit 5 compares the parameters for rule synthesis and the parameters for analysis and synthesis, adjusts both parameters to adjust the pitch, and then synthesizes the synthesized sound from the synthesized parameters by the synthesis processing unit 6 / D / A unit 7. A sound is provided from the structure synthesis sound output terminal 8. As described above, by adjusting the parameters when using the two synthesis means of the rule synthesis and the analysis synthesis, it is possible to provide a voice with less discomfort. In the present embodiment, as an example, “proper noun” is set as rule composition, but this does not restrict the present invention at all. In the parameter adjustment section, the parameter was set to adjust only "pitch".
This does not restrict the present invention in any way, and all parameters used for the synthesis can be adjusted.

【0025】(参考例3) 図6は、発明の参考例3のブロック図である。参考例
の規則合成に代わり、録音再生を用いたものである。
図において、1文章生成部・2合成手段選択部・4分析
合成部は参考例2と同様の処理を行う。3は波形データ
格納部3aと、読みだし制御部3bからなる録音再生部
である。5は前記録音再生部3によって得た波形データ
を参照して、分析合成部4で作成されたパラメータと差
のあるパラメータを分析合成用パラメータにおいて調整
するパラメータ調整部である。6は調整されたパラメー
タから合成音を作る合成処理部で、7は録音再生用波形
データと分析合成波形データから合成音を作るD/A部
である。8は音声を出力する合成音声出力端であり、ス
ピーカ・ヘッドホン・受話器などを示す。
(Embodiment 3 ) FIG. 6 is a block diagram of Embodiment 3 of the present invention. Reference example
The recording / playback is used instead of the rule synthesis of 2 .
In the figure, a one-sentence generation unit, a two-synthesis-means selection unit, and a four-analysis-synthesis unit perform the same processing as in the second embodiment . Reference numeral 3 denotes a recording / reproducing unit including a waveform data storage unit 3a and a reading control unit 3b. Reference numeral 5 denotes a parameter adjustment unit that adjusts a parameter having a difference from the parameter created by the analysis / synthesis unit 4 in the parameters for analysis / synthesis with reference to the waveform data obtained by the recording / reproduction unit 3. Reference numeral 6 denotes a synthesis processing unit that generates a synthesized sound from the adjusted parameters, and reference numeral 7 denotes a D / A unit that generates a synthesized sound from recording / reproducing waveform data and analysis / synthesis waveform data. Reference numeral 8 denotes a synthesized voice output terminal that outputs voice, and indicates a speaker, headphones, a receiver, and the like.

【0026】次に各処理の詳細について実例を用いて説
明する。「松下電器の伊藤様から振込がありました。」
という文章が入力された場合について考える。ここで
は、2つの音声について差のあるパラメータはピッチの
みであったとする。文章入力部1により合成する文章が
入ってくると、合成手段選択部2により入力文章は固有
名詞「松下電器の伊藤」は分析合成、固有名詞以外の部
分「様から振込がありました。」は録音再生と分けられ
る。録音再生部へ送られた文章は波形データ格納部3a
・読みだし制御部3bによって合成音を再生する。分析
合成部4へ送られた文字列は、パラメータ格納部4a・
パラメータ制御部4bによってパラメータを作成する。
パラメータ調整部5で、録音再生用波形データを参照し
て、そのピッチに合うように分析合成用パラメータを調
整した後、その合成パラメータから合成処理部6によっ
て分析合成用波形データが作られ、この分析合成用波形
データと録音再生用波形データはD/A部7を通り、合
成音出力端8より音声が提供される。このように、録音
再生用波形データに合うよう、パラメトリックな合成手
段の分析合成のパラメータを調整することによって、つ
なぎの部分がより自然で違和感の少ない音声を提供する
ことができる。尚、本実施例では一例として「固有名
詞」は分析合成と設定したが、これは本発明を何ら拘束
するものではない。また、パラメータ調整部では「ピッ
チ」のみを調整するパラメータと設定したが、これも本
発明を何ら拘束するものではなく、合成に用いられる全
てのパラメータを調整できるものとする。
Next, the details of each process will be described using actual examples. "There was a transfer from Mr. Ito of Matsushita Electric."
Consider the case where the sentence is input. Here, it is assumed that the only parameter having a difference between the two sounds is the pitch. When the sentence to be synthesized by the sentence input unit 1 comes in, the input sentence is analyzed and synthesized by the synthesizing means selection unit 2 for the proper noun "Matsushita Denki Ito", and the part other than the proper noun "There was a transfer from Sama." Separated from recording and playback. The sentence sent to the recording / playback unit is the waveform data storage unit 3a.
Reproducing the synthesized sound by the read control unit 3b. The character string sent to the analysis / synthesis unit 4 is stored in the parameter storage unit 4a.
The parameter is created by the parameter control unit 4b.
The parameter adjustment unit 5 refers to the recording / playback waveform data and adjusts the analysis / synthesis parameters so as to match the pitch. Then, the synthesis processing unit 6 generates the analysis / synthesis waveform data from the synthesis parameters. The analysis / synthesis waveform data and the recording / playback waveform data pass through the D / A unit 7, and a sound is provided from a synthesized sound output terminal 8. As described above, by adjusting the parameters of the analysis and synthesis of the parametric synthesis means so as to match the recording / reproducing waveform data, it is possible to provide a sound having a more natural connection portion and less discomfort. In this embodiment, as an example, “proper noun” is set to analysis synthesis, but this does not restrict the present invention at all. Further, although the parameter adjustment section sets only the parameter for adjusting the “pitch”, the parameter is not limited to the present invention at all, and all parameters used for the synthesis can be adjusted.

【0027】(実施例) 図7は、請求項3記載の本発明の実施例のブロック図で
ある。実施例の構成のD/A部に代わって、オーバー
ラップ処理を行うものである。図において、1文章生成
部・4録音再生部・5パラメータ調整部・6合成処理部
は実施例と同様の処理を行う。「松下電器の伊藤様か
ら振込がありました。」という文章が入力された場合に
ついて考える。ここでは、2つの音声について差のある
パラメータはピッチのみであったとする。図において、
合成手段選択部2により入力文章は固有名詞「松下電器
の伊藤」とそれに続く「様から」の部分は規則合成、固
有名詞以外の部分「様から振込がありました。」は録音
再生と分けられる。規則合成部3へ送られた文字列は、
言語処理部3a・韻律制御部3b・パラメータ作成部3
cによって以下のように分割され、アクセント型や品詞
・読みなど合成パラメータの情報を得たあと、合成処理
部3dによって合成音がつくられる。 (入力文章) 「松下電器の伊藤様から」 (単語分割) 松下電器 / の / 伊藤 / 様 / から (読み) マツシタテ゛ンキ ノ イトウ サマ カラ (アクセント型) 5 B 0 2 A (品詞) 固有名詞 格助 固有名詞 名詞 接助 ここで「の」に対して与えられているアクセント型Bと
「から」に対して与えられているアクセント型Aは、N
HKアクセント辞書・解説付録(日本放送協会1985年)
に記載されているもので、自立語と結合して文節を構成
する際の結合アクセント核のある音節位置を示したもの
である。
(Embodiment 4 ) FIG. 7 is a block diagram of a fourth embodiment of the present invention. The overlap processing is performed in place of the D / A unit having the configuration of the third embodiment. In the figure, one sentence generation unit, 4 recording and reproduction unit, 5 parameter adjustment unit, and 6 synthesis processing unit perform the same processing as in the third embodiment. Consider the case where the sentence "There was a transfer from Mr. Ito of Matsushita Electric" was input. Here, it is assumed that the only parameter having a difference between the two sounds is the pitch. In the figure,
According to the combining means selecting unit 2, the input sentence is divided into the proper noun "Matsushita Denki Ito" and the subsequent part of "Samakara" is rule-based synthesis, and the part other than the proper noun "Some transfer was made" is divided into recording and playback. . The character string sent to the rule synthesizing unit 3 is
Language processing unit 3a, prosody control unit 3b, parameter creation unit 3
After being divided by c as described below and obtaining information on synthesis parameters such as accent type, part of speech, and reading, a synthesis sound is created by the synthesis processing unit 3d. (Input sentence) "From Matsushita Electric's Ito-sama" (word division) Matsushita Electric / no / Ito / sama / kara (reading) Matsushita Tenki No Ito Sama Kara (accent type) 5B02A (part of speech) Proper noun case Auxiliary proper nouns Nouns Auxiliary Here, the accent type B given to "no" and the accent type A given to "kara" are N
HK Accent Dictionary and Commentary Appendix (Japan Broadcasting Corporation, 1985)
This shows a syllable position with a connecting accent nucleus when combining with an independent word to form a phrase.

【0028】録音再生部4へ送られた文字列は、波形デ
ータ格納部4aからそれに合う音声を取り出し、読みだ
し制御部4bによって合成音を再生する。パラメータ調
整部5は、録音再生用波形データを参照して、規則合成
用パラメータと差のあったピッチのパラメータを調整
し、調整されたパラメータから合成処理部6によって合
成音を作成する。さらにオーバーラップ部7で、規則合
成用波形データと録音再生用波形データの重複する部分
を足し合わせ処理して合成音をつくり合成音出力端8よ
り音声が提供される。このように、規則合成用音響パラ
メータを録音再生用波形データに合わせて調整し、さら
に規則合成用波形データと録音再生用波形データの重複
する部分をオーバーラップして出力することにより、つ
なぎの部分がより自然で違和感の少ない音声を提供する
ことができる。尚、本実施例では一例として「固有名
詞」は規則合成と設定したが、これは本発明を何ら拘束
するものではない。また、パラメータ調整部では「ピッ
チ」のみを調整するパラメータと設定したが、これも本
発明を何ら拘束するものではなく、合成に用いられる全
てのパラメータを調整できるものとする。
The character string sent to the recording / reproducing unit 4 is extracted from the waveform data storage unit 4a, and the read-out control unit 4b reproduces the synthesized sound. The parameter adjuster 5 refers to the recording / reproducing waveform data, adjusts the parameter of the pitch different from the rule synthesis parameter, and creates a synthesized sound from the adjusted parameter by the synthesis processing unit 6. Further, in the overlap section 7, the overlapped portion of the regular synthesis waveform data and the recording / playback waveform data is added to produce a synthetic sound, and the sound is provided from the synthetic sound output terminal 8. In this way, the acoustic parameters for rule synthesis are adjusted in accordance with the waveform data for recording / reproduction, and the overlapping portions of the waveform data for rule synthesis and the recording / reproduction waveform data are output in an overlapping manner, so that the connection portion is obtained. Can provide a more natural sound with less discomfort. In the present embodiment, as an example, “proper noun” is set as rule composition, but this does not restrict the present invention at all. Further, although the parameter adjustment section sets only the parameter for adjusting the “pitch”, the parameter is not limited to the present invention at all, and all parameters used for the synthesis can be adjusted.

【0029】(実施例) 図8は、請求項3記載の本発明の実施例のブロック図で
ある。実施例の構成のD/A部に代わって、オーバー
ラップ処理を行うものである。図において、1文章生成
部・4分析合成部・5パラメータ調整部・6合成処理部
は実施例と同様の処理を行う。「松下電器の伊藤様か
ら振込がありました。」という文章が入力された場合に
ついて考える。ここでは、2つの音声について差のある
パラメータはピッチのみであったとする。図において、
合成手段選択部2により入力文章は固有名詞「松下電器
の伊藤」とそれに続く「様から」の部分は規則合成、固
有名詞以外の部分「様から振込がありました。」は分析
合成と分けられる。規則合成部3へ送られた文字列は、
言語処理部3a・韻律制御部3b・パラメータ作成部3
cによって以下のように分割され、アクセント型や品詞
・読みなど合成パラメータの情報を得たあと、合成処理
部3dによって合成音がつくられる。 (入力文章) 「松下電器の伊藤様から」 (単語分割) 松下電器 / の / 伊藤 / 様 / から (読み) マツシタテ゛ンキ ノ イトウ サマ カラ (アクセント型) 5 B 0 2 A (品詞) 固有名詞 格助 固有名詞 名詞 接助 ここで「の」に対して与えられているアクセント型Bと
「から」に対して与えられているアクセント型Aは、N
HKアクセント辞書・解説付録(日本放送協会1985年)
に記載されているもので、自立語と結合して文節を構成
する際の結合アクセント核のある音節位置を示したもの
である。
(Embodiment 5 ) FIG. 8 is a block diagram of a fifth embodiment of the present invention. The overlap processing is performed in place of the D / A unit having the configuration of the third embodiment. In the figure, one sentence generation part, four analysis synthesis parts, five parameter adjustment parts, and six synthesis processing parts perform the same processing as in the fourth embodiment. Consider the case where the sentence "There was a transfer from Mr. Ito of Matsushita Electric" was input. Here, it is assumed that the only parameter having a difference between the two sounds is the pitch. In the figure,
According to the combining means selecting unit 2, the input sentence is divided into the proper noun "Matsushita Electric's Ito" and the subsequent part of "from the form" is rule composition, and the part other than the proper noun "there was a transfer from the form" is divided into analysis and composition. . The character string sent to the rule synthesizing unit 3 is
Language processing unit 3a, prosody control unit 3b, parameter creation unit 3
After being divided by c as described below and obtaining information on synthesis parameters such as accent type, part of speech, and reading, a synthesis sound is created by the synthesis processing unit 3d. (Input sentence) "From Matsushita Electric's Ito-sama" (word division) Matsushita Electric / no / Ito / sama / kara (reading) Matsushita Tenki No Ito Sama Kara (accent type) 5B02A (part of speech) Proper noun case Auxiliary proper nouns Nouns Auxiliary Here, the accent type B given to "no" and the accent type A given to "kara" are N
HK Accent Dictionary and Commentary Appendix (Japan Broadcasting Corporation, 1985)
This shows a syllable position with a connecting accent nucleus when combining with an independent word to form a phrase.

【0030】録音再生部4へ送られた文字列は、波形デ
ータ格納部4aからそれに合う音声を取り出し、読みだ
し制御部4bによって合成音を再生する。パラメータ調
整部5は、録音再生用波形データを参照して、規則合成
用パラメータと差のあったピッチのパラメータを調整
し、調整されたパラメータから合成処理部6によって合
成音を作成する。さらにオーバーラップ部7で、規則合
成用波形データと分析合成用波形データの重複する部分
を足し合わせ処理して合成音をつくり合成音出力端8よ
り音声が提供される。このように、規則合成用パラメー
タと分析合成用パラメータを比較・調整し、さらに規則
合成用波形データと分析合成用波形データの重複する部
分をオーバーラップして出力することにより、つなぎの
部分がより自然で違和感の少ない音声を提供することが
できる。尚、本実施例では一例として「固有名詞」は規
則合成と設定したが、これは本発明を何ら拘束するもの
ではない。また、パラメータ調整部では「ピッチ」のみ
を調整するパラメータと設定したが、これも本発明を何
ら拘束するものではなく、合成に用いられる全てのパラ
メータを調整できるものとする。
The character string sent to the recording / reproducing section 4 is extracted from the waveform data storage section 4a, and the synthesized voice is reproduced by the reading control section 4b. The parameter adjuster 5 refers to the recording / reproducing waveform data, adjusts the parameter of the pitch different from the rule synthesis parameter, and creates a synthesized sound from the adjusted parameter by the synthesis processing unit 6. Further, the overlapping section 7 adds the overlapped portions of the rule-synthesizing waveform data and the analysis-synthesizing waveform data to form a synthesized sound, and a sound is provided from the synthesized sound output terminal 8. In this way, by comparing and adjusting the rule synthesizing parameter and the analysis synthesizing parameter, and overlapping and outputting the overlapping portion of the rule synthesizing waveform data and the analysis synthesizing waveform data, the connection portion can be further improved. It is possible to provide natural and less uncomfortable voice. In the present embodiment, as an example, “proper noun” is set as rule composition, but this does not restrict the present invention at all. Further, although the parameter adjustment section sets only the parameter for adjusting the “pitch”, the parameter is not limited to the present invention at all, and all parameters used for the synthesis can be adjusted.

【0031】(実施例) 図9は、請求項記載の本発明の実施例のブロック図で
ある。実施例の構成のD/A部に代わって、オーバー
ラップ処理を行うものである。図において、1文章生成
部・4分析合成部・5パラメータ調整部・6合成処理部
は実施例と同様の処理を行う。3は波形データ格納部
3aと、読みだし制御部3bからなる録音再生部であ
る。7は録音再生用波形データと分析合成波形データの
重複する部分を足し合わせ処理するオーバーラップ部で
あり、8は音声を出力する合成音声出力端で、スピーカ
・ヘッドホン・受話器などを示す。
[0031] (Embodiment 6) FIG. 9 is a block diagram of an embodiment of the present invention of claim 2 wherein. The overlap processing is performed in place of the D / A unit having the configuration of the third embodiment. In the figure, one sentence generation unit, 4 analysis and synthesis unit, 5 parameter adjustment unit, and 6 synthesis processing unit perform the same processing as in the fifth embodiment. Reference numeral 3 denotes a recording / reproducing unit including a waveform data storage unit 3a and a reading control unit 3b. Reference numeral 7 denotes an overlap unit for adding overlapping portions of the recording / reproducing waveform data and the analysis / synthesis waveform data, and reference numeral 8 denotes a synthesized voice output terminal for outputting a voice, such as a speaker, a headphone, and a receiver.

【0032】次に各処理の詳細について実例を用いて説
明する。「松下電器の伊藤様から振込がありました。」
という文章が入力された場合について考える。ここで
は、2つの音声について差のあるパラメータはピッチの
みであったとする。合成手段選択部2により入力文章は
固有名詞「松下電器の伊藤」とそれに続く「様から」の
部分は録音再生、固有名詞以外の部分「様から振込があ
りました。」は分析合成と分けられる。録音再生部3へ
送られた文章は波形データ格納部3a・読みだし制御部
3bによって合成音を再生する。分析合成部4へ送られ
た文字列は、パラメータ格納部4a・パラメータ制御部
4bによってパラメータを作成する。パラメータ調整部
5で、録音再生用波形データを参照して、そのピッチに
合うように分析合成用パラメータを調整した後、その合
成パラメータから合成処理部6によって分析合成用波形
データが作られ、この分析合成用波形データと録音再生
用波形データはオーバーラップ部7によって、重複する
部分を足し合わせ処理されて合成音出力端8より音声が
提供される。このように、録音再生用波形データに合う
よう、パラメトリックな合成手段の分析合成のパラメー
タを調整し、さらに録音再生用波形データと分析合成用
波形データをオーバーラップして出力することによっ
て、つなぎの部分がより自然で違和感の少ない音声を提
供することができる。尚、本実施例では一例として「固
有名詞」は分析合成と設定したが、これは本発明を何ら
拘束するものではない。また、パラメータ調整部では
「ピッチ」のみを調整するパラメータと設定したが、こ
れも本発明を何ら拘束するものではなく、合成に用いら
れる全てのパラメータを調整できるものとする。
Next, the details of each processing will be described using actual examples. "There was a transfer from Mr. Ito of Matsushita Electric."
Consider the case where the sentence is input. Here, it is assumed that the only parameter having a difference between the two sounds is the pitch. According to the synthesizing means selection unit 2, the input sentence is divided into the proper noun "Matsushita Electric's Ito" and the part of "samakara" following it is recorded and played back, and the part other than the proper noun "there was a transfer from sama" is divided into analysis and synthesis. . The sentence sent to the recording / reproducing unit 3 is reproduced by the waveform data storage unit 3a and the reading control unit 3b. For the character string sent to the analysis / synthesis unit 4, parameters are created by the parameter storage unit 4a and the parameter control unit 4b. The parameter adjustment unit 5 refers to the recording / playback waveform data and adjusts the analysis / synthesis parameters so as to match the pitch. Then, the synthesis processing unit 6 generates the analysis / synthesis waveform data from the synthesis parameters. The analysis and synthesis waveform data and the recording / reproduction waveform data are added together by an overlap unit 7 to perform overlapping processing, and a sound is provided from a synthesized sound output terminal 8. In this way, the parameters of the analysis and synthesis of the parametric synthesis means are adjusted to match the recording and playback waveform data, and the recording and playback waveform data and the analysis and synthesis waveform data are overlapped and output, so that the connection It is possible to provide a sound with a more natural part and a less uncomfortable feeling. In this embodiment, as an example, “proper noun” is set to analysis synthesis, but this does not restrict the present invention at all. Further, although the parameter adjustment section sets only the parameter for adjusting the “pitch”, the parameter is not limited to the present invention at all, and all parameters used for the synthesis can be adjusted.

【0033】(実施例) 図10は、請求項記載の本発明の実施例のブロック図
である。請求項1記載のオーバーラップ部の詳細を示し
たものである。図において、1・2は合成音入力端A・
B、3は制御部3a・アンプA3b・アンプB3cから
なるオーバーラップ部である。4は音声を出力する合成
音声出力端で、スピーカ・ヘッドホン・受話器などを示
す。
[0033] (Embodiment 7) FIG. 10 is a block diagram of an embodiment of the present invention described in claim 3. 3 shows details of an overlap portion according to claim 1. In the figure, reference numerals 1 and 2 denote synthesized sound input terminals A and
Reference numerals B and 3 denote overlapping sections each including a control section 3a, an amplifier A3b, and an amplifier B3c. Reference numeral 4 denotes a synthesized voice output terminal for outputting voice, which indicates a speaker, headphones, a receiver, and the like.

【0034】次に各処理の詳細について実例を用いて説
明する。合成音入力端Aと合成音入力端Bは、重複する
部分を持っているものとする。2つの異なる合成手段に
よる音声をオーバーラップして出力する場合について述
べる。合成音入力端Aと合成音入力端Bより入力がある
と、それぞれアンプA・アンプBに入る。この際、3a
の制御部により重複して出力する部分について、音量が
その部分だけ大きくならないよう制御すると共に、先に
出力する音声をフェードアウトさせ、後に出力する音声
をフェードインさせて、2つの音声が徐々に切り替わる
よう2つのアンプが制御されて音声が送られ、合成音出
力端4から音声が提供される。このように、オーバーラ
ップ部において、重複する部分の2つの音声を出力する
際、それぞれのアンプを制御して音声を徐々に切り替え
ることによって、つなぎの部分がより自然で違和感の少
ない音声を提供することができる。
Next, the details of each process will be described using actual examples. It is assumed that the synthesized sound input terminal A and the synthesized sound input terminal B have overlapping portions. A case will be described in which sounds output by two different synthesizing means are output in an overlapping manner. When there is an input from the synthetic sound input terminal A and the synthetic sound input terminal B, the signals enter the amplifier A and the amplifier B, respectively. At this time, 3a
The control unit controls not to increase the volume of the overlapped output portion, fades out the audio output first, and fades in the audio output later, and gradually switches between the two audios. The two amplifiers are controlled so that the sound is transmitted, and the sound is provided from the synthetic sound output terminal 4. As described above, when two sounds in the overlapping portion are output in the overlap portion, the sound is gradually switched by controlling the respective amplifiers, thereby providing a sound with a more natural connection portion and less discomfort. be able to.

【0035】[0035]

【発明の効果】以上のように、本発明によれば、複数の
異なる合成方式を組合せて音声を提供する際、音声合成
方式のつなぎの部分にオーバーラップ処理やパラメータ
の調整などのオプション機能を備えたことにより、より
自然な音声を合成することが可能となる。
As described above, according to the present invention, when speech is provided by combining a plurality of different synthesizing methods, optional functions such as overlap processing and parameter adjustment are provided at the joint of the speech synthesizing methods. With this arrangement, a more natural speech can be synthesized.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施例における音声合成装置の
ブロック図
FIG. 1 is a block diagram of a speech synthesizer according to a first embodiment of the present invention.

【図2】本発明の第1の実施例における音声合成装置の
ブロック図
FIG. 2 is a block diagram of a speech synthesizer according to the first embodiment of the present invention.

【図3】本発明の第1の実施例における音声合成装置の
ブロック図
FIG. 3 is a block diagram of a speech synthesizer according to the first embodiment of the present invention.

【図4】本発明の理解を助けるための参考例の説明図 FIG. 4 is an explanatory diagram of a reference example to help understanding of the present invention .

【図5】本発明の理解を助けるための参考例の説明図 FIG. 5 is an explanatory diagram of a reference example to help understanding of the present invention .

【図6】本発明の理解を助けるための参考例の説明図 FIG. 6 is an explanatory view of a reference example to help understanding of the present invention .

【図7】本発明の第3の実施例における音声合成装置の
ブロック図
FIG. 7 is a block diagram of a speech synthesizer according to a third embodiment of the present invention.

【図8】本発明の第3の実施例における音声合成装置の
ブロック図
FIG. 8 is a block diagram of a speech synthesizer according to a third embodiment of the present invention.

【図9】本発明の第3の実施例における音声合成装置の
ブロック図
FIG. 9 is a block diagram of a speech synthesizer according to a third embodiment of the present invention.

【図10】本発明の第4の実施例における音声合成装置
のブロック図
FIG. 10 is a block diagram of a speech synthesizer according to a fourth embodiment of the present invention.

【図11】従来例の音声合成装置のブロック図FIG. 11 is a block diagram of a conventional speech synthesizer.

【符号の説明】[Explanation of symbols]

1 文章生成部 2 合成手段選択部 3 規則合成部 3a 言語処理部 3b 韻律制御部 3c パラメータ作成部 3d 合成処理部 4 録音再生部 4a 波形データ格納部 4b 読み出し制御部 5 オーバーラップ処理部 6 D/A部 7 合成音出力端 Reference Signs List 1 sentence generation unit 2 synthesis means selection unit 3 rule synthesis unit 3a language processing unit 3b prosody control unit 3c parameter creation unit 3d synthesis processing unit 4 recording / playback unit 4a waveform data storage unit 4b read control unit 5 overlap processing unit 6 D / Part A 7 Synthetic sound output terminal

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平3−7999(JP,A) 特開 昭62−215299(JP,A) 特開 平4−263299(JP,A) 特開 昭59−42598(JP,A) 特開 平4−367000(JP,A) 特開 昭60−63597(JP,A) 特開 平4−19799(JP,A) 特開 平1−191900(JP,A) 特公 平3−73000(JP,B2) 特公 平3−15759(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 13/08 G10L 19/00 - 21/06 JICSTファイル(JOIS)──────────────────────────────────────────────────続 き Continuation of the front page (56) References JP-A-3-7999 (JP, A) JP-A-62-215299 (JP, A) JP-A-4-263299 (JP, A) JP-A-59-1984 42598 (JP, A) JP-A-4-367000 (JP, A) JP-A-60-63597 (JP, A) JP-A-4-19799 (JP, A) JP-A-1-191900 (JP, A) JP 3-73000 (JP, B2) JP 3-15759 (JP, B2) (58) Fields investigated (Int. Cl. 7 , DB name) G10L 11/00-13/08 G10L 19/00 -21/06 JICST file (JOIS)

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】文章を生成する文章生成手段と、音声波形
を合成する複数の異なる合成手段と、前記文章の内容に
よって前記合成手段を選択する合成手段選択手段と、前
記合成手段選択手段により選択された合成手段から出力
される複数の合成音の波形を足し合わせ処理するオーバ
ーラップ手段とを備えたことを特徴とする音声合成装
置。
1. A text generating means for generating a text, a plurality of different synthesizing means for synthesizing a speech waveform, a synthesizing means selecting means for selecting the synthesizing means according to the contents of the text, and a selecting means by the synthesizing means selecting means. And an overlap means for adding waveforms of a plurality of synthesized sounds output from the synthesized means.
【請求項2】文章を生成する文章生成手段と、音声波形
を合成する複数の異なる合成手段と、前記文章の内容に
よって前記合成手段を選択する合成手段選択手段と、そ
の複数の合成音のいづれかがパラメトリックな合成手段
であった場合にその合成手段で作成された合成パラメー
タを他の音声にあわせて調整するパラメータ調整手段
と、その複数の合成音の波形を足し合わせ処理するオー
バーラップ手段とを備えたことを特徴とする音声合成装
置。
2. A sentence generating means for generating a sentence, a plurality of different synthesizing means for synthesizing a speech waveform, a synthesizing means selecting means for selecting the synthesizing means according to the contents of the sentence, and one of the plurality of synthesized sounds. Is a parametric synthesizing means, a parameter adjusting means for adjusting the synthesizing parameters created by the synthesizing means in accordance with another voice, and an overlapping means for adding and processing the waveforms of the plurality of synthesized sounds. A speech synthesizer comprising:
【請求項3】文章を生成する文章生成手段と、音声波形
を合成する複数の異なる合成手段と、前記文章の内容に
よって前記合成手段を選択する合成手段選択手段と、そ
の重複する音声波形を足し合わせる際、それぞれのアン
プを制御手段を用いて音量調節しながら重ねて出力する
オーバーラップ手段とを備えたことを特徴とする音声合
成装置。
3. A sentence generating means for generating a sentence, a plurality of different synthesizing means for synthesizing a speech waveform, a synthesizing means selecting means for selecting the synthesizing means according to the contents of the sentence, and an overlapping speech waveform. A voice synthesizing device comprising: overlap means for overlapping and outputting the respective amplifiers while adjusting the volume using control means when matching.
JP03184467A 1991-07-24 1991-07-24 Speech synthesizer Expired - Fee Related JP3089715B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03184467A JP3089715B2 (en) 1991-07-24 1991-07-24 Speech synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03184467A JP3089715B2 (en) 1991-07-24 1991-07-24 Speech synthesizer

Publications (2)

Publication Number Publication Date
JPH0527789A JPH0527789A (en) 1993-02-05
JP3089715B2 true JP3089715B2 (en) 2000-09-18

Family

ID=16153668

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03184467A Expired - Fee Related JP3089715B2 (en) 1991-07-24 1991-07-24 Speech synthesizer

Country Status (1)

Country Link
JP (1) JP3089715B2 (en)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11161298A (en) * 1997-11-28 1999-06-18 Toshiba Corp Method and device for voice synthesizer
US6628252B2 (en) 2000-05-12 2003-09-30 Rohm Co., Ltd. LED drive circuit
JP2002169581A (en) * 2000-11-29 2002-06-14 Matsushita Electric Ind Co Ltd Method and device for voice synthesis
AU2003255914A1 (en) * 2002-09-17 2004-04-08 Koninklijke Philips Electronics N.V. Speech synthesis using concatenation of speech waveforms
JP4525162B2 (en) * 2004-05-07 2010-08-18 三菱電機株式会社 Speech synthesizer and program thereof
JP4752516B2 (en) * 2006-01-12 2011-08-17 日産自動車株式会社 Voice dialogue apparatus and voice dialogue method
JP4751230B2 (en) * 2006-04-19 2011-08-17 旭化成株式会社 Prosodic segment dictionary creation method, speech synthesizer, and program
JP4878538B2 (en) * 2006-10-24 2012-02-15 株式会社日立製作所 Speech synthesizer
JP4964695B2 (en) * 2007-07-11 2012-07-04 日立オートモティブシステムズ株式会社 Speech synthesis apparatus, speech synthesis method, and program
JP5218971B2 (en) * 2008-07-31 2013-06-26 株式会社日立製作所 Voice message creation apparatus and method
JP2012042974A (en) * 2011-10-26 2012-03-01 Hitachi Ltd Voice synthesizer
JP5840075B2 (en) * 2012-06-01 2016-01-06 日本電信電話株式会社 Speech waveform database generation apparatus, method, and program

Also Published As

Publication number Publication date
JPH0527789A (en) 1993-02-05

Similar Documents

Publication Publication Date Title
JP2002169581A (en) Method and device for voice synthesis
US5561736A (en) Three dimensional speech synthesis
JP3089715B2 (en) Speech synthesizer
JPS62160495A (en) Voice synthesization system
JP3518898B2 (en) Speech synthesizer
JP3617603B2 (en) Audio information encoding method and generation method thereof
AU769036B2 (en) Device and method for digital voice processing
JP3465734B2 (en) Audio signal transformation connection method
US5433609A (en) Foreign lyric instructional device and method
JPH0549998B2 (en)
KR100383061B1 (en) A learning method using a digital audio with caption data
JP2577372B2 (en) Speech synthesis apparatus and method
US4920569A (en) Digital audio signal playback system delay
JPH10124082A (en) Singing voice synthesizing device
JP2008275836A (en) Document processing method and device for reading aloud
JPH11249679A (en) Voice synthesizer
JP2847699B2 (en) Speech synthesizer
JPH0642158B2 (en) Speech synthesizer
JP3310226B2 (en) Voice synthesis method and apparatus
JP2844588B2 (en) Waveform editing type speech synthesizer
JPH08328575A (en) Voice synthesizer
Uchida A practical method for generating whispers from singing voices: Application of improved phantom silhouette method
JP2001312291A (en) Method for generating numeral voice waveform and method and device for synthesizing numerical voice
JP2995774B2 (en) Voice synthesis method
JP2586040B2 (en) Voice editing and synthesis device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees