JPS5953560B2 - 音声の合成方法 - Google Patents
音声の合成方法Info
- Publication number
- JPS5953560B2 JPS5953560B2 JP52108323A JP10832377A JPS5953560B2 JP S5953560 B2 JPS5953560 B2 JP S5953560B2 JP 52108323 A JP52108323 A JP 52108323A JP 10832377 A JP10832377 A JP 10832377A JP S5953560 B2 JPS5953560 B2 JP S5953560B2
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- speech
- amplitude
- noise
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000009826 distribution Methods 0.000 claims abstract description 14
- 230000007704 transition Effects 0.000 claims abstract description 12
- 230000010355 oscillation Effects 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 8
- 230000002194 synthesizing effect Effects 0.000 claims description 8
- 238000001308 synthesis method Methods 0.000 claims description 7
- 230000003321 amplification Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000001788 irregular Effects 0.000 claims description 4
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 4
- 230000003595 spectral effect Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims 2
- 230000009466 transformation Effects 0.000 claims 1
- 230000006870 function Effects 0.000 abstract 1
- 230000037431 insertion Effects 0.000 abstract 1
- 238000003780 insertion Methods 0.000 abstract 1
- 230000015572 biosynthetic process Effects 0.000 description 13
- 238000003786 synthesis reaction Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 208000037656 Respiratory Sounds Diseases 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
- G10L13/07—Concatenation rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Analogue/Digital Conversion (AREA)
Description
【発明の詳細な説明】
この発明は音声の合成方法および装置に関し、特にコン
ピユータと人間とを結合させる手段としてコンピユータ
技術に適用できるようにした方法1に関する。
ピユータと人間とを結合させる手段としてコンピユータ
技術に適用できるようにした方法1に関する。
従来からワード又は音節全体をもとにして音声を合成す
る方法および装置が知られているが、この装置はメモリ
デスク上に大容量のメモリを必要とする。
る方法および装置が知られているが、この装置はメモリ
デスク上に大容量のメモリを必要とする。
このように大形のメモリを用いてもこのi従来装置の合
成できる語数はあまり多くなかつた。従来の他の合成方
法および装置として適当な振幅および周波数の正弦波発
振波を混合することにより異なる音素を得るものがある
が、この装置は非常に構成が複数となり、複雑な調整を
必要とする多くのアナログ発振器を必要とする。
成できる語数はあまり多くなかつた。従来の他の合成方
法および装置として適当な振幅および周波数の正弦波発
振波を混合することにより異なる音素を得るものがある
が、この装置は非常に構成が複数となり、複雑な調整を
必要とする多くのアナログ発振器を必要とする。
従つてこの発明の目的は、小形のメモリを用い、複雑な
構成および調整を必要としない音声の合成方法を得るこ
とを目的とする。
構成および調整を必要としない音声の合成方法を得るこ
とを目的とする。
この発明の目的は、デジタル電子回路で合成され次にデ
ジタル−アナログ変換器でアナログ信号に変換された音
素を基にして音声の合成を行なうことによつて達成され
る。
ジタル−アナログ変換器でアナログ信号に変換された音
素を基にして音声の合成を行なうことによつて達成され
る。
与えられたテキストの音素の合成は、異なつたフォーマ
ット分布の音素の音声周期、雑音音素の要素、アクセン
トの位置に関する情報、各音素特有の振幅特性、与えら
れた音素の合成に必要な音声および雑音要素の順序、音
素の或る程度不規則な変化の表、イントネーシヨンに関
するセンテンス解析から得られたデータ、休止の期間、
および音素の間の主な移行を行なうに必要な音の要素等
のメモリに記憶されたデータに基づいて行なわれる。合
成されるべきテキストのセンテンスはセンテンスの基本
的特性、即ち、周波数特性としての音声の高さの変化の
形式、振幅特性としての声の大きさの変化、および休止
期間等を順次決定するために文法的なプログラムによつ
て解析される。音素の順序は、近接音素間の相互の影響
を調べるため、およびこの順序における音素変化の位置
およびモードを決定するために解析される。センテンス
の基本的な特性を観察することによつて各音素には特性
フォーマット分布および各期間および振幅を有する音声
発振の期間の決定された形式および数が関連付けられ、
同時に対応する期間およびスペクトラム分布を有する雑
音音素の要素の決定された形式および数が関連付けられ
る。上述の与えられた言語に対して決定された音声発振
期間および雑音音素の要素は、各発振の振幅の大きさの
順序としてメモリにデジタル形式で記憶される。音素の
各周波数特性を得るために発振振幅の読み出しは期間の
終了以前に中断でき、又は期間終了後にゼロ値の状態で
継続できる。音声の自然さを出すために、読み出し中の
発振期間中の振幅と長さに或る程度の不規則性が与えら
れ、雑音および混合音素の合成時に均一なスペクトラム
分布を得るために、或る程度不規則な初期アドレス、期
間および読み出し方向で雑音要素部分の読み出しが行な
われる。同一記憶要素から異なる音素を得るために、記
憶された振幅の大きさの読み出し回数が変えられ、同一
記憶要素から異なる音素を得るために、音素の振幅特性
が変えられ、混合音素を得るために音声期間および雑音
部分の混合が行なわれる。音素間の移行を円滑に行なう
ために、音素間の移行に応じてフォーマット分布を有す
る期間が用いられ、音素の移行を円滑にするため各移行
時の振幅が減少せしめられる。音素定数の解析に基づい
て得られたデジタルデータおよび所望の言語に対するセ
ンテンスの基本特性はメモリに記憶された音声要素の再
生の制御のために用いられる。音素の振幅特性は、音素
の振幅特性のデジタル値に応じて、アナログ信号によつ
て、デジタル値を変換することによつて得られた合成音
素のアナログ信号の振幅″を変えることによつて形成さ
れる。上述のこの発明による音声の合成方法を実施する
ための装置はコンピユータを有し、この出力は定数メモ
リのアドレスレジスターカウンタに供給される。
ット分布の音素の音声周期、雑音音素の要素、アクセン
トの位置に関する情報、各音素特有の振幅特性、与えら
れた音素の合成に必要な音声および雑音要素の順序、音
素の或る程度不規則な変化の表、イントネーシヨンに関
するセンテンス解析から得られたデータ、休止の期間、
および音素の間の主な移行を行なうに必要な音の要素等
のメモリに記憶されたデータに基づいて行なわれる。合
成されるべきテキストのセンテンスはセンテンスの基本
的特性、即ち、周波数特性としての音声の高さの変化の
形式、振幅特性としての声の大きさの変化、および休止
期間等を順次決定するために文法的なプログラムによつ
て解析される。音素の順序は、近接音素間の相互の影響
を調べるため、およびこの順序における音素変化の位置
およびモードを決定するために解析される。センテンス
の基本的な特性を観察することによつて各音素には特性
フォーマット分布および各期間および振幅を有する音声
発振の期間の決定された形式および数が関連付けられ、
同時に対応する期間およびスペクトラム分布を有する雑
音音素の要素の決定された形式および数が関連付けられ
る。上述の与えられた言語に対して決定された音声発振
期間および雑音音素の要素は、各発振の振幅の大きさの
順序としてメモリにデジタル形式で記憶される。音素の
各周波数特性を得るために発振振幅の読み出しは期間の
終了以前に中断でき、又は期間終了後にゼロ値の状態で
継続できる。音声の自然さを出すために、読み出し中の
発振期間中の振幅と長さに或る程度の不規則性が与えら
れ、雑音および混合音素の合成時に均一なスペクトラム
分布を得るために、或る程度不規則な初期アドレス、期
間および読み出し方向で雑音要素部分の読み出しが行な
われる。同一記憶要素から異なる音素を得るために、記
憶された振幅の大きさの読み出し回数が変えられ、同一
記憶要素から異なる音素を得るために、音素の振幅特性
が変えられ、混合音素を得るために音声期間および雑音
部分の混合が行なわれる。音素間の移行を円滑に行なう
ために、音素間の移行に応じてフォーマット分布を有す
る期間が用いられ、音素の移行を円滑にするため各移行
時の振幅が減少せしめられる。音素定数の解析に基づい
て得られたデジタルデータおよび所望の言語に対するセ
ンテンスの基本特性はメモリに記憶された音声要素の再
生の制御のために用いられる。音素の振幅特性は、音素
の振幅特性のデジタル値に応じて、アナログ信号によつ
て、デジタル値を変換することによつて得られた合成音
素のアナログ信号の振幅″を変えることによつて形成さ
れる。上述のこの発明による音声の合成方法を実施する
ための装置はコンピユータを有し、この出力は定数メモ
リのアドレスレジスターカウンタに供給される。
他のコンピユータ出力が計数方向レジス夕に供給され、
その出力はアドレスレジスターカウンタに接続される。
更に他の2つのコンピユータ出力が計数回数決定レジス
タおよび読み出しアドレス番地レジスタに供給され、こ
れら2つのレジスタの出力はプリセツト数および゛周波
数パルス発生回路に供給される。パルス発生器の出力は
アドレスレジスターカウンタの計数入力に供給される。
コンピユータの他の出力がデジタル−アナログ変換器に
供給され、その出力は振幅変調器の増幅度変化入力に接
続される。定数メモリの出力がl他のデジタル−アナロ
グ変換器に供給され、その出力は振幅一変調器の入力に
接続される。振幅変調器の出力はスピーカおよび伝送ラ
インに接続される。制御装置の出力がコンピユータの入
力に供給され、コンピユータの更に他の出力が制御装置
,の入力に供給される。この発明の目的は、期間の長さ
の変動を±40%以内に制限し、期間の長さの変化およ
び読み出し中の発振振幅の変化の或る程度の不規則制を
±3%の範囲内に制限することによつて達成される。
その出力はアドレスレジスターカウンタに接続される。
更に他の2つのコンピユータ出力が計数回数決定レジス
タおよび読み出しアドレス番地レジスタに供給され、こ
れら2つのレジスタの出力はプリセツト数および゛周波
数パルス発生回路に供給される。パルス発生器の出力は
アドレスレジスターカウンタの計数入力に供給される。
コンピユータの他の出力がデジタル−アナログ変換器に
供給され、その出力は振幅変調器の増幅度変化入力に接
続される。定数メモリの出力がl他のデジタル−アナロ
グ変換器に供給され、その出力は振幅一変調器の入力に
接続される。振幅変調器の出力はスピーカおよび伝送ラ
インに接続される。制御装置の出力がコンピユータの入
力に供給され、コンピユータの更に他の出力が制御装置
,の入力に供給される。この発明の目的は、期間の長さ
の変動を±40%以内に制限し、期間の長さの変化およ
び読み出し中の発振振幅の変化の或る程度の不規則制を
±3%の範囲内に制限することによつて達成される。
,更に、音声の自然さを出すために、音声発振の期間と
その振幅、混合音素を得るための振幅一雑音発振の変調
期間、およびシリル字母゜゛P”の音素、即ちラテン文
字の゜“R”を得るために音声発振の振幅変調の期間が
或る程度不規則に変化される。この発明の特徴的な効果
としては、機械的可動部分のない比較的小形のメモリが
用いられること、複雑な調整を必要とする合成用アナロ
グ曲線発生器が不要なこと、センテンスの実際の要求に
応じて多くの種類の音素合成を行なえること、単にメモ
リの内容の変化によつて音素形態を変化させることがで
き、音声に著しい自然性を与えるように音声発振期間と
振幅の変化を或る程度不規則に変えることを模擬的に行
なうことができ、テキスト中の所望のイントネーシヨン
とアクセントを実現でき、コンピユータメモリの迅速な
応答を必要とせず、調整動作が不要なために製造が容易
になり、メモリ、マイクロコンピユータのような高集積
度の新しい電子要素の使用ができること等であり、小形
、軽量、高信頼度、低価格の装置を製造することができ
る。
その振幅、混合音素を得るための振幅一雑音発振の変調
期間、およびシリル字母゜゛P”の音素、即ちラテン文
字の゜“R”を得るために音声発振の振幅変調の期間が
或る程度不規則に変化される。この発明の特徴的な効果
としては、機械的可動部分のない比較的小形のメモリが
用いられること、複雑な調整を必要とする合成用アナロ
グ曲線発生器が不要なこと、センテンスの実際の要求に
応じて多くの種類の音素合成を行なえること、単にメモ
リの内容の変化によつて音素形態を変化させることがで
き、音声に著しい自然性を与えるように音声発振期間と
振幅の変化を或る程度不規則に変えることを模擬的に行
なうことができ、テキスト中の所望のイントネーシヨン
とアクセントを実現でき、コンピユータメモリの迅速な
応答を必要とせず、調整動作が不要なために製造が容易
になり、メモリ、マイクロコンピユータのような高集積
度の新しい電子要素の使用ができること等であり、小形
、軽量、高信頼度、低価格の装置を製造することができ
る。
以下図面を参照してこの発明の実施例を詳細に説明する
。
。
第1図において、この発明の実施例装置はコンピユータ
1を有し、その出力2は定数メモリ4のアドレスレジス
ターカウンタ3に供給される。コンピユータ1の出力5
は計数方向レジスタ6に供給され、この出力はアドレス
レジスターカウンタ3に供給される。コンピユータ1の
出力7, 8は夫々計数回数決定レジスタ9および読み
出しアドレス番地レジスタ10に供給され、これらのレ
ジスタ9,10の出力はパルス発生器11に供給される
。パルス発生器11の出力はアドレスレジスターカウン
タ3の計数入力に接続される。コンピユータ1の出力1
2は振幅制御レジスタ13を介してデジタル−アナログ
変換器14に供給され、その出力は振幅変調器15の増
幅度可変人力に接続される。定数メモリ4の出力はデジ
タル−アナログ変換器16に供給され、その出力は振幅
変調器15の入力に接続される。振幅変調器15の出力
はスピーカ17および伝送ライン18に接続される。制
御装置19の出力がコンピユータ1の入力21に供給さ
れ、コンピユータ1の出力20が制御装置19の入力に
接続される。この明細書を通して用いられている重要な
用語がいくつかあり、これらの用語の意味を以下に補足
的に説明しておく。音声の合成:これはいくつかの装置
からの音響出力の受入を意味し、この装置中ではブルガ
リア語に限らないある言語の人間の音声が認識できる。
1を有し、その出力2は定数メモリ4のアドレスレジス
ターカウンタ3に供給される。コンピユータ1の出力5
は計数方向レジスタ6に供給され、この出力はアドレス
レジスターカウンタ3に供給される。コンピユータ1の
出力7, 8は夫々計数回数決定レジスタ9および読み
出しアドレス番地レジスタ10に供給され、これらのレ
ジスタ9,10の出力はパルス発生器11に供給される
。パルス発生器11の出力はアドレスレジスターカウン
タ3の計数入力に接続される。コンピユータ1の出力1
2は振幅制御レジスタ13を介してデジタル−アナログ
変換器14に供給され、その出力は振幅変調器15の増
幅度可変人力に接続される。定数メモリ4の出力はデジ
タル−アナログ変換器16に供給され、その出力は振幅
変調器15の入力に接続される。振幅変調器15の出力
はスピーカ17および伝送ライン18に接続される。制
御装置19の出力がコンピユータ1の入力21に供給さ
れ、コンピユータ1の出力20が制御装置19の入力に
接続される。この明細書を通して用いられている重要な
用語がいくつかあり、これらの用語の意味を以下に補足
的に説明しておく。音声の合成:これはいくつかの装置
からの音響出力の受入を意味し、この装置中ではブルガ
リア語に限らないある言語の人間の音声が認識できる。
フォーマット分布:特定音素の対応要素の周波数分布。
音声の要素:音響作用としての音声を特徴付ける曲線部
分である。
分である。
音声に付属する音:例えば語句の最初又は最後又は句読
点における呼吸の音。
点における呼吸の音。
音声期間:音声音素を構成する期間。
いくつかの特性に応じて、更にこれらの合成方法に関し
て、次の音素群、即ち音声音素、雑音音素、混合音素が
試験された。
て、次の音素群、即ち音声音素、雑音音素、混合音素が
試験された。
これらの群の各々には短い期間および長い期間の音素が
存在する。音声音素は、所定のフォーマット分布を特徴
付ノけるところの実際の音声又は予め合成された音声か
ら記録されメモリに記憶された音声期間の順序を順番に
再生することによつて得られる。与えられた音声音素合
成のための期間の数と形式とは、各言語の音素の特徴、
近接音素の形式と特徴、アクセントの位置、センテンス
のイントネーシヨン等によつて決定される。即ち、言語
的な1つの音素は、合成方法の点からみて、異なる期間
の連続の重なりに対応している。音声期間、その数、長
さおよび振幅の実際に必要な組み合わせは実時間で特定
のアルゴリズムによつてプログラム演算され、次にこれ
ら音声を再生する装置に供給される。
存在する。音声音素は、所定のフォーマット分布を特徴
付ノけるところの実際の音声又は予め合成された音声か
ら記録されメモリに記憶された音声期間の順序を順番に
再生することによつて得られる。与えられた音声音素合
成のための期間の数と形式とは、各言語の音素の特徴、
近接音素の形式と特徴、アクセントの位置、センテンス
のイントネーシヨン等によつて決定される。即ち、言語
的な1つの音素は、合成方法の点からみて、異なる期間
の連続の重なりに対応している。音声期間、その数、長
さおよび振幅の実際に必要な組み合わせは実時間で特定
のアルゴリズムによつてプログラム演算され、次にこれ
ら音声を再生する装置に供給される。
合成音声に自然性を与えることは、振幅および異なる期
間の長さを或る.程度不規則に変えることによつて行な
われる。雑音音素は、偶発的な振幅変調によるメモリか
らの読み出し又は対応する雑音音素の記憶区域の或る程
度不規則に選択された部分の連続的再生によつて合成さ
れ、振幅変調および期間は合成用アルゴリズムに応じて
決定される。混合音素は部分的に音声音素として合成さ
れ、更に音声音素の期間を持つ雑音部分の付加的な振幅
変調を有した雑音音声として部分的に合成される。
間の長さを或る.程度不規則に変えることによつて行な
われる。雑音音素は、偶発的な振幅変調によるメモリか
らの読み出し又は対応する雑音音素の記憶区域の或る程
度不規則に選択された部分の連続的再生によつて合成さ
れ、振幅変調および期間は合成用アルゴリズムに応じて
決定される。混合音素は部分的に音声音素として合成さ
れ、更に音声音素の期間を持つ雑音部分の付加的な振幅
変調を有した雑音音声として部分的に合成される。
実施例
シリル字母“P”の音素(即ちラテン文字の1R″)の
場合には、合成音声は舌の振動数で振幅変調された合成
音声である。
場合には、合成音声は舌の振動数で振幅変調された合成
音声である。
ブルガリア言語(シリル式アルフアベツト)に対しては
、゜゜A”E”I”、“O″、゜“I− “Y”、 “
H”、 糖゛、 “M”、 “H”および゜゜P”は音
声音素として合成でき、“Φ”UC964― 赫X−
1L1― 赫q― 赫K―゜゜1゛および゜゜T゛は雑
音w素として決定でき、MB― 赫3− 66r9赫6
− −ビ T― 赫丹ョ3”゛および゜゜八氷゛は混合
音素として合成できる。
、゜゜A”E”I”、“O″、゜“I− “Y”、 “
H”、 糖゛、 “M”、 “H”および゜゜P”は音
声音素として合成でき、“Φ”UC964― 赫X−
1L1― 赫q― 赫K―゜゜1゛および゜゜T゛は雑
音w素として決定でき、MB― 赫3− 66r9赫6
− −ビ T― 赫丹ョ3”゛および゜゜八氷゛は混合
音素として合成できる。
音素間の接続は円滑移行フォーマット分布を得るために
必要な音声期間の偶発的な導入によつて実現される。
必要な音声期間の偶発的な導入によつて実現される。
音声の合成装置は基本的な要素として定数メモリ4を有
し、このメモリ4中には前述した音声合成方法において
用いられる情報が記録される。
し、このメモリ4中には前述した音声合成方法において
用いられる情報が記録される。
この情報は音声および雑音音素の部分の振幅および音声
に付属する音の振幅のデジタル値を表わして,いる。定
数メモリ4に記録された初期アドレスおよび音声の異な
る要素に対する振幅の連続的な値の長さはメモリ4から
の読み出し制御情報であつて、コンピユータ1のメモリ
中に記憶されている。特定の言語の音声の合成を行なう
ために定数メモリ4に記憶されるべき音声要素の選択は
、具体的な言語の音声学上の特徴に応じてなされ、この
結果選択された要素はその言語の音声学上の完全な体系
を表わすものとなる。コンピユータ1のメモリ中には前
述の方法が実施されるためのプログラムが記憶され、具
体的な言語のイントネーシヨンおよびアクセントに従つ
た音声が合成される。プログラムに対する入力情報はテ
キスト定数であつて、必要に応じて音声学的な記号も有
し、対応する言語中のセンテンスの記録を表わしている
。
に付属する音の振幅のデジタル値を表わして,いる。定
数メモリ4に記録された初期アドレスおよび音声の異な
る要素に対する振幅の連続的な値の長さはメモリ4から
の読み出し制御情報であつて、コンピユータ1のメモリ
中に記憶されている。特定の言語の音声の合成を行なう
ために定数メモリ4に記憶されるべき音声要素の選択は
、具体的な言語の音声学上の特徴に応じてなされ、この
結果選択された要素はその言語の音声学上の完全な体系
を表わすものとなる。コンピユータ1のメモリ中には前
述の方法が実施されるためのプログラムが記憶され、具
体的な言語のイントネーシヨンおよびアクセントに従つ
た音声が合成される。プログラムに対する入力情報はテ
キスト定数であつて、必要に応じて音声学的な記号も有
し、対応する言語中のセンテンスの記録を表わしている
。
コンピユータ1中でセンテンスは、実際の言語の規則に
応じてその周波数および振幅特性、休止の期間および位
置、音声に付属する音を決定するために、文法的、音声
学的に解析される。次に、これらの特性、およびセンテ
ンス中の近接した音素の相互の影響に従つて、各音素の
組成(構成期間の形式)、振幅特性、および期間が決定
される。更に、各音声要素に対して、合成されたセンテ
ンス中で関係する振幅、期間、定数メモリ4中の初期ア
ドレスおよび読み出しの方向が決定される。即ち、セン
テンスは音声要素および休止に順次分解される。これら
の要素は上述の振幅によつて特徴付けられている。音声
の順次要素を特徴付けるすべての振幅はプログラムによ
つて実時間状態でコンビユータ1に取り込まれ、所望の
音声の合成p制御のために装置の対応プロツタに順次送
り4れる。これらのデータによつてメモリ4からは、・
;アドレスレジスターカウンタ3により指示され、計数
方向レジスタ6で決定された読み出し方向に初期アドレ
スを持つ音声要素が読み出される。定数メモリ4からの
読み出しスピードは、読み出し回数決定レジスタ9の値
および読み出しアドレス番地レジスタ10中の値による
読み出しデータの数によつて決定される。レジスタ9,
10中の情報はパルス発生器11の動作を制御する。こ
のパルス発生器11はアドレスレジスターカウンタ3の
内容を順次変化させるように制御するためのものである
。このように決定された音声要素の振幅の大きさは、レ
ジスタ9からのプリセツトされた読み出しスピードによ
つてデジタル−アナログ変換器16に順次供給される。
応じてその周波数および振幅特性、休止の期間および位
置、音声に付属する音を決定するために、文法的、音声
学的に解析される。次に、これらの特性、およびセンテ
ンス中の近接した音素の相互の影響に従つて、各音素の
組成(構成期間の形式)、振幅特性、および期間が決定
される。更に、各音声要素に対して、合成されたセンテ
ンス中で関係する振幅、期間、定数メモリ4中の初期ア
ドレスおよび読み出しの方向が決定される。即ち、セン
テンスは音声要素および休止に順次分解される。これら
の要素は上述の振幅によつて特徴付けられている。音声
の順次要素を特徴付けるすべての振幅はプログラムによ
つて実時間状態でコンビユータ1に取り込まれ、所望の
音声の合成p制御のために装置の対応プロツタに順次送
り4れる。これらのデータによつてメモリ4からは、・
;アドレスレジスターカウンタ3により指示され、計数
方向レジスタ6で決定された読み出し方向に初期アドレ
スを持つ音声要素が読み出される。定数メモリ4からの
読み出しスピードは、読み出し回数決定レジスタ9の値
および読み出しアドレス番地レジスタ10中の値による
読み出しデータの数によつて決定される。レジスタ9,
10中の情報はパルス発生器11の動作を制御する。こ
のパルス発生器11はアドレスレジスターカウンタ3の
内容を順次変化させるように制御するためのものである
。このように決定された音声要素の振幅の大きさは、レ
ジスタ9からのプリセツトされた読み出しスピードによ
つてデジタル−アナログ変換器16に順次供給される。
このデジタル−アナログ変換器16の出力は振幅変調器
15の入力に接続され、その増幅度はデ.ジタルーアナ
ログ変換器14の出力により制御される。このデジタル
−アナログ変換器14は、デジタルデータをコンピユー
タ1で決定されたその時の合成音声部分の振幅制御レジ
スタ13を介して再生振幅に変換するのに用いられる。
振幅変調器15で増幅された信号は再生のためにスピー
カ17および伝送ライン18に供給される。音声要素の
順次再生の終了時に制御装置19はコンピユータ1に次
の合成に関する新しいデータを得るための命令を送る。
定数メモリ4からの読み出し期間中および順次音声要素
の再生が行なわれている間中、コンピユータ1は空いて
おり、合成制御用の新しいデータを用意するために解析
を行つている。
15の入力に接続され、その増幅度はデ.ジタルーアナ
ログ変換器14の出力により制御される。このデジタル
−アナログ変換器14は、デジタルデータをコンピユー
タ1で決定されたその時の合成音声部分の振幅制御レジ
スタ13を介して再生振幅に変換するのに用いられる。
振幅変調器15で増幅された信号は再生のためにスピー
カ17および伝送ライン18に供給される。音声要素の
順次再生の終了時に制御装置19はコンピユータ1に次
の合成に関する新しいデータを得るための命令を送る。
定数メモリ4からの読み出し期間中および順次音声要素
の再生が行なわれている間中、コンピユータ1は空いて
おり、合成制御用の新しいデータを用意するために解析
を行つている。
コンピユータ1として適当に応答の早いコンピユータを
用いると、1台のコンピユータで数個の合成装置の制御
が可能である。
用いると、1台のコンピユータで数個の合成装置の制御
が可能である。
コンピユータ1としては汎用コンピユータ、ミニコンピ
ユータ又はマイクロコンピユータが用いられる。第2図
の波形は音素“栴゛の短かい破裂音、次に少しの期間の
“H−および長く続く “A゛の振幅曲線を示す。
ユータ又はマイクロコンピユータが用いられる。第2図
の波形は音素“栴゛の短かい破裂音、次に少しの期間の
“H−および長く続く “A゛の振幅曲線を示す。
この記録された振幅特性は或る話し手が発声した語であ
つて、フォーマット移行の円滑さは自然の方法で行なわ
れる。第3図は合成語の波形を示し、順次、音素“.゛
、2期間の゜゜『゛、数期間の“E゛を示す。
つて、フォーマット移行の円滑さは自然の方法で行なわ
れる。第3図は合成語の波形を示し、順次、音素“.゛
、2期間の゜゜『゛、数期間の“E゛を示す。
ここでぱ“H゛と゜“A゛との間のフォーマット移行を
円滑にするために、音声音素“゜A”、“H゛および゜
“A゛の期間と長さは基本トーンの円滑な変化を得るた
めに適当に選択される。第4図と第5図の関係は相似形
であつて、最初の“゜M゛と最初の゜“ビとの間に音素
゜“責”の導入が見られ、これにより基本フオーマント
の円滑な移行が行なわれる。
円滑にするために、音声音素“゜A”、“H゛および゜
“A゛の期間と長さは基本トーンの円滑な変化を得るた
めに適当に選択される。第4図と第5図の関係は相似形
であつて、最初の“゜M゛と最初の゜“ビとの間に音素
゜“責”の導入が見られ、これにより基本フオーマント
の円滑な移行が行なわれる。
第4図、第5図の語のソノグラムが夫々第6図および第
7図に示されている。
7図に示されている。
自然音声(第6図)の語のソノグラムの方がフォーマッ
トがより豊富であるが、これにもかかわらず、耳には合
成語(第7図)の方がより正確に聞き取ることができた
。
トがより豊富であるが、これにもかかわらず、耳には合
成語(第7図)の方がより正確に聞き取ることができた
。
第]図はこの発明の一実施例装置のプロツクダイヤグラ
ム、第2図は或る話し手が発声しだ゜A只HN゛という
語の振幅曲線図、第3図はこの発明により合成されだJ
1只HN゛の振幅曲線図、第4図は或る話し手が発生し
た“゜MIMMドという語の振幅曲線図、第5図はこの
発明により合成された“MIMMドの振幅曲線図、第6
図は或る話し手の発音による語の“MIMMドのソノグ
ラム、第7図はこの発明により合成された語゜“MIM
Mドのソノグラムを示す。 1・・・・・・コンピユータ、2,5,7,8,12,
20・・・・・・コンピユータ1の出力、3・・・・・
・アドレスレジスターカウンタ、4・・・・・・メモリ
、6・・・・・・計数方向レジスタ、9・・・・・・計
数回数決定レジスタ、10・・・・・・読み出しアドレ
ス番地レジスタ、11・・・・・・パルス発生器、13
・・・・・・振幅制御レジスタ、14・・・・・・デジ
タル−アナログ変換器、15・・・・・・増幅変調器、
16・・・・・・デジタル−アナログ変換器、17・・
・・・・スピーカ、18・・・・・・伝送ライン、19
・・・・・・制御装置、21・・・・・・制御装置出力
。
ム、第2図は或る話し手が発声しだ゜A只HN゛という
語の振幅曲線図、第3図はこの発明により合成されだJ
1只HN゛の振幅曲線図、第4図は或る話し手が発生し
た“゜MIMMドという語の振幅曲線図、第5図はこの
発明により合成された“MIMMドの振幅曲線図、第6
図は或る話し手の発音による語の“MIMMドのソノグ
ラム、第7図はこの発明により合成された語゜“MIM
Mドのソノグラムを示す。 1・・・・・・コンピユータ、2,5,7,8,12,
20・・・・・・コンピユータ1の出力、3・・・・・
・アドレスレジスターカウンタ、4・・・・・・メモリ
、6・・・・・・計数方向レジスタ、9・・・・・・計
数回数決定レジスタ、10・・・・・・読み出しアドレ
ス番地レジスタ、11・・・・・・パルス発生器、13
・・・・・・振幅制御レジスタ、14・・・・・・デジ
タル−アナログ変換器、15・・・・・・増幅変調器、
16・・・・・・デジタル−アナログ変換器、17・・
・・・・スピーカ、18・・・・・・伝送ライン、19
・・・・・・制御装置、21・・・・・・制御装置出力
。
Claims (1)
- 【特許請求の範囲】 1 音声の合成方法において、人間の声から取り出され
た音声成分がメモリに記憶され、センテンスの特徴およ
び相近接した複数音素の形式に応じて各音素の形式と長
さに応じた順序、スピード、方向および数でメモリから
読み出され、一方、合成されるべきテキストは文法的お
よび発音通りにセンテンス毎に、センテンスの基本的特
徴を決定するために、言語のルールに応じて順次解析さ
れ、周波数特性として声の高さの変化、振幅特性として
声の大きさの変化、休止期間の如き音声学的な記号と共
に、テキスト定数として記録され近接音素の相互間の影
響を考えるために音素の順序が解析され、この順序の中
での音素変換の場所および変換状態が決定され、次に、
各音素に付いてセンテンスの基本的な特徴を観察するこ
とによつて、音声発振の期間の特別な形式および数が実
際の声又は人工的に合成されたものから抽出された特徴
フオルマント分布と比較され、同時に雑音音素時に段落
の特別な形式と数とが各々の期間、大きさ、スペクトル
分布と比較され、この言語のために決定された上述の音
声発振の期間および雑音音素の要素が各発振の振幅の大
きさの順序としてメモリ中にデジタル形式で記憶され、
音素の各々の周波数特性を得るために発振振幅の大きさ
の変化が周波数増加期間の終了以前に中断され、更に周
波数を減らすためにその期間の終了後にゼロの値で延長
され、音声の自然さを出すために読むときに発振の期間
と振幅にある程度の不規則な変化が与えられ、雑音と混
合音素とを合成する際に均一なスペクトル分布を得るた
めに或る程度不規則な初期アドレス、期間、読み出し方
向を有する雑音要素の部分が読み出され、同じ記憶され
た雑音要素から異なる音素を得るために要素の記憶値の
読み出し回数が変えられ、又は同じ目的で音素の振幅特
性が変化され、混合音素は音声期間と雑音部分とを適当
に結合させることにより得られ、音素変化は音素間の移
行の特性に応じてフオルマント分布を有する期間を用い
ることによつて滑らかに行なわれ、又、音素変化は各移
行時の発振振幅を減少させることによつても滑らかに行
なわれ、メモリに記憶された音声要素再生の制御は音素
構成およびセンテンスの基本特性の解析によつて用意さ
れたデジタルデータを基本にして行なわれ、音素の振幅
特性は、音素の振幅特性のデジタル的な大きさに応じて
アナログ信号によつてデジタル値の変換から得られた合
成された音素のアナログ信号の増幅を制御することによ
つて形成されることを特徴とする音声の合成方法。 2 期間の長さの変化が±40%の範囲内で行なわれる
ことを特徴とする特許請求の範囲第1項による音声の合
成方法。 3 期間の長さの変化および読み出し中の発振振幅の変
化の或る程度の不規則制が±3%の範囲内であることを
特徴とする特許請求の範囲第1項による音声の合成方法
。 4 音声の自然さを出すために、音声発振の期間とその
振幅、混合音素を得るための振幅−雑音発振の変調期間
、およびキリル字母“P”の音素、即ちラテン文字の“
R”を得るために音声発振の振幅変調期間が或る程度不
規則に変化されることを特徴とした特許請求の範囲第1
項による音声の合成方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
BG000000034160 | 1976-09-08 | ||
BG7600034160A BG24190A1 (en) | 1976-09-08 | 1976-09-08 | Method of synthesis of speech and device for effecting same |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5367301A JPS5367301A (en) | 1978-06-15 |
JPS5953560B2 true JPS5953560B2 (ja) | 1984-12-25 |
Family
ID=3902565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP52108323A Expired JPS5953560B2 (ja) | 1976-09-08 | 1977-09-08 | 音声の合成方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US4278838A (ja) |
JP (1) | JPS5953560B2 (ja) |
BG (1) | BG24190A1 (ja) |
DD (1) | DD143970A1 (ja) |
DE (1) | DE2740520A1 (ja) |
FR (1) | FR2364522A1 (ja) |
GB (1) | GB1592473A (ja) |
HU (1) | HU176776B (ja) |
SE (1) | SE7709773L (ja) |
SU (1) | SU691918A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61145356U (ja) * | 1985-02-27 | 1986-09-08 | ||
JPH0437314Y2 (ja) * | 1984-08-30 | 1992-09-02 |
Families Citing this family (195)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2020077B (en) * | 1978-04-28 | 1983-01-12 | Texas Instruments Inc | Learning aid or game having miniature electronic speech synthesizer chip |
JPS56161600A (en) * | 1980-05-16 | 1981-12-11 | Matsushita Electric Ind Co Ltd | Voice synthesizer |
DE3104551C2 (de) * | 1981-02-10 | 1982-10-21 | Neumann Elektronik GmbH, 4330 Mülheim | Elektronischer Textgeber zur Abgabe von Kurztexten |
US4398059A (en) * | 1981-03-05 | 1983-08-09 | Texas Instruments Incorporated | Speech producing system |
US4685135A (en) * | 1981-03-05 | 1987-08-04 | Texas Instruments Incorporated | Text-to-speech synthesis system |
US4470150A (en) * | 1982-03-18 | 1984-09-04 | Federal Screw Works | Voice synthesizer with automatic pitch and speech rate modulation |
JPS58168096A (ja) * | 1982-03-29 | 1983-10-04 | 日本電気株式会社 | 複数言語音声合成装置 |
JPS58175074A (ja) * | 1982-04-07 | 1983-10-14 | Toshiba Corp | 構文分析方式 |
US4579533A (en) * | 1982-04-26 | 1986-04-01 | Anderson Weston A | Method of teaching a subject including use of a dictionary and translator |
US4731847A (en) * | 1982-04-26 | 1988-03-15 | Texas Instruments Incorporated | Electronic apparatus for simulating singing of song |
WO1983003914A1 (en) * | 1982-04-26 | 1983-11-10 | Gerald Myer Fisher | Electronic dictionary with speech synthesis |
JPS6050600A (ja) * | 1983-08-31 | 1985-03-20 | 株式会社東芝 | 規則合成方式 |
US4527274A (en) * | 1983-09-26 | 1985-07-02 | Gaynor Ronald E | Voice synthesizer |
US4695975A (en) * | 1984-10-23 | 1987-09-22 | Profit Technology, Inc. | Multi-image communications system |
US4788649A (en) * | 1985-01-22 | 1988-11-29 | Shea Products, Inc. | Portable vocalizing device |
US4589138A (en) * | 1985-04-22 | 1986-05-13 | Axlon, Incorporated | Method and apparatus for voice emulation |
US5175803A (en) * | 1985-06-14 | 1992-12-29 | Yeh Victor C | Method and apparatus for data processing and word processing in Chinese using a phonetic Chinese language |
JP2595235B2 (ja) * | 1987-03-18 | 1997-04-02 | 富士通株式会社 | 音声合成装置 |
JPS63285598A (ja) * | 1987-05-18 | 1988-11-22 | ケイディディ株式会社 | 音素接続形パラメ−タ規則合成方式 |
ATE102731T1 (de) * | 1988-11-23 | 1994-03-15 | Digital Equipment Corp | Namenaussprache durch einen synthetisator. |
JPH02239292A (ja) * | 1989-03-13 | 1990-09-21 | Canon Inc | 音声合成装置 |
US5091931A (en) * | 1989-10-27 | 1992-02-25 | At&T Bell Laboratories | Facsimile-to-speech system |
AU632867B2 (en) * | 1989-11-20 | 1993-01-14 | Digital Equipment Corporation | Text-to-speech system having a lexicon residing on the host processor |
US5157759A (en) * | 1990-06-28 | 1992-10-20 | At&T Bell Laboratories | Written language parser system |
US5400434A (en) * | 1990-09-04 | 1995-03-21 | Matsushita Electric Industrial Co., Ltd. | Voice source for synthetic speech system |
JP3070127B2 (ja) * | 1991-05-07 | 2000-07-24 | 株式会社明電舎 | 音声合成装置のアクセント成分制御方式 |
US5475796A (en) * | 1991-12-20 | 1995-12-12 | Nec Corporation | Pitch pattern generation apparatus |
US6150011A (en) * | 1994-12-16 | 2000-11-21 | Cryovac, Inc. | Multi-layer heat-shrinkage film with reduced shrink force, process for the manufacture thereof and packages comprising it |
US5729741A (en) * | 1995-04-10 | 1998-03-17 | Golden Enterprises, Inc. | System for storage and retrieval of diverse types of information obtained from different media sources which includes video, audio, and text transcriptions |
US5832434A (en) * | 1995-05-26 | 1998-11-03 | Apple Computer, Inc. | Method and apparatus for automatic assignment of duration values for synthetic speech |
US5751907A (en) * | 1995-08-16 | 1998-05-12 | Lucent Technologies Inc. | Speech synthesizer having an acoustic element database |
DE19610019C2 (de) | 1996-03-14 | 1999-10-28 | Data Software Gmbh G | Digitales Sprachsyntheseverfahren |
US6064960A (en) | 1997-12-18 | 2000-05-16 | Apple Computer, Inc. | Method and apparatus for improved duration modeling of phonemes |
US6101470A (en) * | 1998-05-26 | 2000-08-08 | International Business Machines Corporation | Methods for generating pitch and duration contours in a text to speech system |
US6230135B1 (en) | 1999-02-02 | 2001-05-08 | Shannon A. Ramsay | Tactile communication apparatus and method |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
CN1398214A (zh) * | 2000-10-23 | 2003-02-19 | 索尼公司 | 有足机器人、用于有足机器人的动作控制方法、和存储介质 |
US7280969B2 (en) * | 2000-12-07 | 2007-10-09 | International Business Machines Corporation | Method and apparatus for producing natural sounding pitch contours in a speech synthesizer |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
US6988068B2 (en) * | 2003-03-25 | 2006-01-17 | International Business Machines Corporation | Compensating for ambient noise levels in text-to-speech applications |
JP4265501B2 (ja) * | 2004-07-15 | 2009-05-20 | ヤマハ株式会社 | 音声合成装置およびプログラム |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7633076B2 (en) | 2005-09-30 | 2009-12-15 | Apple Inc. | Automated response to and sensing of user activity in portable devices |
CN1831896A (zh) * | 2005-12-08 | 2006-09-13 | 曲平 | 一种语音发声装置 |
US8036894B2 (en) * | 2006-02-16 | 2011-10-11 | Apple Inc. | Multi-unit approach to text-to-speech synthesis |
KR100699050B1 (ko) | 2006-06-30 | 2007-03-28 | 삼성전자주식회사 | 문자정보를 음성정보로 출력하는 이동통신 단말기 및 그방법 |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8027837B2 (en) * | 2006-09-15 | 2011-09-27 | Apple Inc. | Using non-speech sounds during text-to-speech synthesis |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8620662B2 (en) | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US8600743B2 (en) | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US20120310642A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Automatically creating a mapping between text data and audio data |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
WO2013185109A2 (en) | 2012-06-08 | 2013-12-12 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
KR20150104615A (ko) | 2013-02-07 | 2015-09-15 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
CN105027197B (zh) | 2013-03-15 | 2018-12-14 | 苹果公司 | 训练至少部分语音命令系统 |
CN105144133B (zh) | 2013-03-15 | 2020-11-20 | 苹果公司 | 对中断进行上下文相关处理 |
CN110096712B (zh) | 2013-03-15 | 2023-06-20 | 苹果公司 | 通过智能数字助理的用户培训 |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3008641A1 (en) | 2013-06-09 | 2016-04-20 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
AU2014278595B2 (en) | 2013-06-13 | 2017-04-06 | Apple Inc. | System and method for emergency calls initiated by voice command |
CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
JP6728755B2 (ja) * | 2015-03-25 | 2020-07-22 | ヤマハ株式会社 | 歌唱音発音装置 |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
RU2591640C1 (ru) * | 2015-05-27 | 2016-07-20 | Александр Юрьевич Бредихин | Способ модификации голоса и устройство для его осуществления (варианты) |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
CN113593521B (zh) * | 2021-07-29 | 2022-09-20 | 北京三快在线科技有限公司 | 语音合成方法、装置、设备及可读存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3704345A (en) * | 1971-03-19 | 1972-11-28 | Bell Telephone Labor Inc | Conversion of printed text into synthetic speech |
US4130730A (en) * | 1977-09-26 | 1978-12-19 | Federal Screw Works | Voice synthesizer |
-
1976
- 1976-09-08 BG BG7600034160A patent/BG24190A1/xx unknown
-
1977
- 1977-08-31 SE SE7709773A patent/SE7709773L/xx not_active Application Discontinuation
- 1977-09-01 DD DD77200850A patent/DD143970A1/de not_active IP Right Cessation
- 1977-09-05 HU HU77EI760A patent/HU176776B/hu unknown
- 1977-09-05 GB GB37045/77A patent/GB1592473A/en not_active Expired
- 1977-09-07 FR FR7727129A patent/FR2364522A1/fr active Granted
- 1977-09-07 SU SU772520760A patent/SU691918A1/ru active
- 1977-09-08 DE DE19772740520 patent/DE2740520A1/de not_active Withdrawn
- 1977-09-08 JP JP52108323A patent/JPS5953560B2/ja not_active Expired
-
1979
- 1979-08-02 US US06/063,169 patent/US4278838A/en not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0437314Y2 (ja) * | 1984-08-30 | 1992-09-02 | ||
JPS61145356U (ja) * | 1985-02-27 | 1986-09-08 |
Also Published As
Publication number | Publication date |
---|---|
JPS5367301A (en) | 1978-06-15 |
HU176776B (en) | 1981-05-28 |
BG24190A1 (en) | 1978-01-10 |
FR2364522A1 (fr) | 1978-04-07 |
SE7709773L (sv) | 1978-03-09 |
SU691918A1 (ru) | 1979-10-15 |
DE2740520A1 (de) | 1978-04-20 |
GB1592473A (en) | 1981-07-08 |
DD143970A1 (de) | 1980-09-17 |
US4278838A (en) | 1981-07-14 |
FR2364522B3 (ja) | 1980-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS5953560B2 (ja) | 音声の合成方法 | |
US5704007A (en) | Utilization of multiple voice sources in a speech synthesizer | |
US5890115A (en) | Speech synthesizer utilizing wavetable synthesis | |
US6804649B2 (en) | Expressivity of voice synthesis by emphasizing source signal features | |
US5930755A (en) | Utilization of a recorded sound sample as a voice source in a speech synthesizer | |
US7047194B1 (en) | Method and device for co-articulated concatenation of audio segments | |
JP2564641B2 (ja) | 音声合成装置 | |
JP2001005450A (ja) | 音響信号の符号化方法 | |
JPH11249679A (ja) | 音声合成装置 | |
EP1505570B1 (en) | Singing voice synthesizing method | |
JP3233036B2 (ja) | 歌唱音合成装置 | |
JPH1195798A (ja) | 音声合成方法および音声合成装置 | |
JPH02153397A (ja) | 音声収録装置 | |
JPH0895588A (ja) | 音声合成装置 | |
JPH113096A (ja) | 音声合成方法及び音声合成システム | |
JPH02293900A (ja) | 音声合成装置 | |
JPS5991497A (ja) | 音声合成出力装置 | |
JP4305022B2 (ja) | データ作成装置、プログラム及び楽音合成装置 | |
JP2990693B2 (ja) | 音声合成装置 | |
JP2910587B2 (ja) | 音声合成装置 | |
KR940011871B1 (ko) | Midi와 pcm음원장치를 이용한 음성발생장치 | |
JPH06250685A (ja) | 音声合成方式および規則合成装置 | |
JPS63210900A (ja) | 音声合成装置 | |
JPS60113299A (ja) | 音声合成装置 | |
JP2989615B2 (ja) | 音声合成歌唱器 |