JPH0833744B2 - 音声合成装置 - Google Patents
音声合成装置Info
- Publication number
- JPH0833744B2 JPH0833744B2 JP61002481A JP248186A JPH0833744B2 JP H0833744 B2 JPH0833744 B2 JP H0833744B2 JP 61002481 A JP61002481 A JP 61002481A JP 248186 A JP248186 A JP 248186A JP H0833744 B2 JPH0833744 B2 JP H0833744B2
- Authority
- JP
- Japan
- Prior art keywords
- syllable
- parameter
- voice
- vowel
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- 238000000034 method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Electrophonic Musical Instruments (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
Description
【発明の詳細な説明】 〔発明の技術分野〕 本発明は滑らかさのある合成音声を効果的に生成し得
る音声合成装置に関する。
る音声合成装置に関する。
マン・マシン・インターフェースの重要な役割を担う
技術として音声の合成出力がある。
技術として音声の合成出力がある。
この合成音声は、従来より専ら、予め録音されている
音声を編集処理して作成されている。しかしこの録音編
集方式は、品質の高い合成音声を得ることができる反
面、合成出力可能な単語やフレーズの種類とその数に限
りがあると云う問題がある。
音声を編集処理して作成されている。しかしこの録音編
集方式は、品質の高い合成音声を得ることができる反
面、合成出力可能な単語やフレーズの種類とその数に限
りがあると云う問題がある。
そこで任意の入力文字列を解析してその音韻情報と韻
律情報とを求め、これらの情報から予め定められた規則
に基いて合成音声を生成する手法が開発されている。こ
の手法は規則合成方式と称され、任意の単語やフレーズ
の合成音声を比較的簡単に生成し得ると云う利点があ
る。
律情報とを求め、これらの情報から予め定められた規則
に基いて合成音声を生成する手法が開発されている。こ
の手法は規則合成方式と称され、任意の単語やフレーズ
の合成音声を比較的簡単に生成し得ると云う利点があ
る。
然し乍ら、その合成音声の品質が前述した録音編集方
式に比較して悪いと云う問題がある。例えば、了解度の
点ではかなり高い品質の合成音声を生成することができ
るが、その滑らかさに難点がある為、聞取り難いと云う
問題があった。
式に比較して悪いと云う問題がある。例えば、了解度の
点ではかなり高い品質の合成音声を生成することができ
るが、その滑らかさに難点がある為、聞取り難いと云う
問題があった。
本発明はこのような事情を考慮してなされたもので、
その目的とするところは、規則合成される音声の滑らか
さの向上を図り、その聞取り易さの向上を図ることので
きる音声合成装置を提供することにある。
その目的とするところは、規則合成される音声の滑らか
さの向上を図り、その聞取り易さの向上を図ることので
きる音声合成装置を提供することにある。
本発明は、入力文字列を解析して求められる音韻記号
列から音声パラメータ列を生成するに際し、音声合成の
単位となる音声素片が置かれている環境、例えば音声素
片としての音節の直前に存在する母音の種類に応じて、
その音節に対する音節パラメータを求め、この音節パラ
メータを結合して上記音声パラメータ列を求めて規則合
成に供するようにしたものである。
列から音声パラメータ列を生成するに際し、音声合成の
単位となる音声素片が置かれている環境、例えば音声素
片としての音節の直前に存在する母音の種類に応じて、
その音節に対する音節パラメータを求め、この音節パラ
メータを結合して上記音声パラメータ列を求めて規則合
成に供するようにしたものである。
具体的には音節に対する音節パラメータを、その音節
の直前に存在する母音の種別毎に予めそれぞれ求めてお
き、音韻記号列中の音節に対する音節パラメータを求め
るとき、その音節の直前に存在する母音に応じて上記複
数の音節パラメータの中の1つを選択するようにしたも
のである。
の直前に存在する母音の種別毎に予めそれぞれ求めてお
き、音韻記号列中の音節に対する音節パラメータを求め
るとき、その音節の直前に存在する母音に応じて上記複
数の音節パラメータの中の1つを選択するようにしたも
のである。
かくして本発明によれば、音声素片、例えば音節の繋
がりに応じた音声パラメータ列が生成されるので、規則
合成される音声の滑らかさの向上を図り得る。しかも、
合成音声の了解度の低下を招くことなく、その滑らかさ
を確保することが可能となる。これ故、自然性の高い、
高品質な合成音声を簡易に生成することができる等の実
用上多大なる効果が奏せられる。
がりに応じた音声パラメータ列が生成されるので、規則
合成される音声の滑らかさの向上を図り得る。しかも、
合成音声の了解度の低下を招くことなく、その滑らかさ
を確保することが可能となる。これ故、自然性の高い、
高品質な合成音声を簡易に生成することができる等の実
用上多大なる効果が奏せられる。
以下、図面を参照して本発明の一実施例につき説明す
る。
る。
第1図は実施例方式を適用して構成される音声合成装
置の要部概略構成図である。
置の要部概略構成図である。
音声合成に供される単語またはフレーズは、それを表
現する文字列として入力される。文字列解析装置1はこ
の入力文字列を解析し、入力文字列に対応する音韻記号
列および韻律記号列をそれぞれ生成している。
現する文字列として入力される。文字列解析装置1はこ
の入力文字列を解析し、入力文字列に対応する音韻記号
列および韻律記号列をそれぞれ生成している。
音声パラメータ列生成装置2は上記音韻記号列を入力
し、音声合成の単位となる音声素片についてパラメータ
ファイル3a,3b,3c,3dを参照してその音声素片パラメー
タを求め、これらの音声素片パラメータを結合して音声
の声道特性を表現する音声パラメータ列を生成してい
る。尚、上記音声素片パラメータの結合は、通常直線補
間法が用いられる。
し、音声合成の単位となる音声素片についてパラメータ
ファイル3a,3b,3c,3dを参照してその音声素片パラメー
タを求め、これらの音声素片パラメータを結合して音声
の声道特性を表現する音声パラメータ列を生成してい
る。尚、上記音声素片パラメータの結合は、通常直線補
間法が用いられる。
具体的には、例えば音声素片を音節とした場合、音韻
記号列から検出され音節毎にパラメータファイル3a,3b,
3c,3dを参照して音節パラメータを求め、これらの音節
パラメータを結合して音声パラメータ列を生成してい
る。
記号列から検出され音節毎にパラメータファイル3a,3b,
3c,3dを参照して音節パラメータを求め、これらの音節
パラメータを結合して音声パラメータ列を生成してい
る。
一方、韻律パラメータ列生成装置4は、上記韻律記号
列に従ってその韻律パラメータ列を生成している。
列に従ってその韻律パラメータ列を生成している。
音声合成器5は、このようにして生成された音声パラ
メータ列と韻律パラメータ列とに従って、所定の音声合
成規則を適用して前記入力文字列に対応した合成音声を
生成し、これを出力している。
メータ列と韻律パラメータ列とに従って、所定の音声合
成規則を適用して前記入力文字列に対応した合成音声を
生成し、これを出力している。
ここで、前記パラメータファイル3a,3b,3c,3dを参照
した音声パラメータ列生成装置2による音声パラメータ
列の生成について更に詳しく説明する。
した音声パラメータ列生成装置2による音声パラメータ
列の生成について更に詳しく説明する。
今、音声合成の単位である音声素片が、子音(C)と
母音(V)との組合せからなる音節(CV)として定義さ
れるものとする。この場合、文字列解析装置1で求めら
れた音韻記号列は、音節単位に分解することができる。
母音(V)との組合せからなる音節(CV)として定義さ
れるものとする。この場合、文字列解析装置1で求めら
れた音韻記号列は、音節単位に分解することができる。
例えば『適確;てきかく』なる文字列を入力した場
合、第2図に示すようにその音韻記号列は[tekikaku]
として求められる。
合、第2図に示すようにその音韻記号列は[tekikaku]
として求められる。
但し、/t/ ,/k/は子音の音韻記号であり、/e/,/i/,/
a/,/u/は母音の音韻記号である。
a/,/u/は母音の音韻記号である。
しかしてこの音韻記号列を音節単位に分割すると、音
節の区切りを[・]として [te・ki・ka・ku] なる4つの音節を得ることが可能となる。従来の一般的
な音声規則合成にあっては、このような各音節毎にその
音節パラメータを求め、これらの音節パラメータを結合
して音声パラメータ列を求めていた。
節の区切りを[・]として [te・ki・ka・ku] なる4つの音節を得ることが可能となる。従来の一般的
な音声規則合成にあっては、このような各音節毎にその
音節パラメータを求め、これらの音節パラメータを結合
して音声パラメータ列を求めていた。
これに対して本方式に係る音声パラメータ列生成装置
2では、音声素片(音節)が置かれている環境を考慮し
てその音声パラメータ列を生成するようにしている。即
ち、上述した如く求められた各音節に対して、各音節の
直前に存在する母音を配慮してその音節パラメータを求
めるようにしている。具体的には、音節の直前に存在す
る母音の種類に応じて、その音節パラメータを求めるよ
うにしている。
2では、音声素片(音節)が置かれている環境を考慮し
てその音声パラメータ列を生成するようにしている。即
ち、上述した如く求められた各音節に対して、各音節の
直前に存在する母音を配慮してその音節パラメータを求
めるようにしている。具体的には、音節の直前に存在す
る母音の種類に応じて、その音節パラメータを求めるよ
うにしている。
そこで本装置では、各音節の直前に存在する母音の種
類に応じて4つのパラメータファイル3a,3b,3c,3dを準
備し、音節の直前に存在する母音の種別に応じた音節パ
ラメータを得るようにしている。
類に応じて4つのパラメータファイル3a,3b,3c,3dを準
備し、音節の直前に存在する母音の種別に応じた音節パ
ラメータを得るようにしている。
ここで第1のパラメータファイル3aは、音節の直前に
母音が存在しない場合、つまり語頭を為す音節に対する
音節パラメータを格納している。また第2のパラメータ
ファイル3bは、直前の母音が/a/,/o/,/u/の場合に用い
る音節パラメータを格納したものである。また第3のパ
ラメータファイル3cはその直前母音が/i/の場合、更に
第4のパラメータファイル3dはその直前母音が/e/の場
合の音節パラメータをそれぞれ格納している。
母音が存在しない場合、つまり語頭を為す音節に対する
音節パラメータを格納している。また第2のパラメータ
ファイル3bは、直前の母音が/a/,/o/,/u/の場合に用い
る音節パラメータを格納したものである。また第3のパ
ラメータファイル3cはその直前母音が/i/の場合、更に
第4のパラメータファイル3dはその直前母音が/e/の場
合の音節パラメータをそれぞれ格納している。
尚、5つの母音毎にそれぞれパラメータファイルを準
備することも勿論可能であるが、ここではその声道近似
特性から、口の横方向への拡がりを伴う母音/i/,/e/に
ついてのみ独立なパラメータファイルを準備し、母音/a
/,/o/,/u/についてはこれをひとまとめにしたパラメー
タファイルとしている。
備することも勿論可能であるが、ここではその声道近似
特性から、口の横方向への拡がりを伴う母音/i/,/e/に
ついてのみ独立なパラメータファイルを準備し、母音/a
/,/o/,/u/についてはこれをひとまとめにしたパラメー
タファイルとしている。
この工夫によって、音節パラメータを記憶する為の回
路規模の不本意な増大が抑えられている。
路規模の不本意な増大が抑えられている。
尚、語頭用のパラメータファイル3aは、例えば単音節
単位に発生された自然音声を分析し、その分析結果をパ
ラメータ化して作成される。
単位に発生された自然音声を分析し、その分析結果をパ
ラメータ化して作成される。
つぎに直前母音が/i/であるときのパラメータファイ
ル3cは、直前母音が/i/となる2音節の自然音声を分析
し、その第2音節目のパラメータのみを切出して作成さ
れる。具体的には、例えば『池;いけ』等の自然音声を
分析し、[ike]なる音韻列中の第2音節/ke/の部分の
分析結果を抽出し、これをパラメータ化して直前母音が
/i/であるときのパラメータファイル3cが作成される。
ル3cは、直前母音が/i/となる2音節の自然音声を分析
し、その第2音節目のパラメータのみを切出して作成さ
れる。具体的には、例えば『池;いけ』等の自然音声を
分析し、[ike]なる音韻列中の第2音節/ke/の部分の
分析結果を抽出し、これをパラメータ化して直前母音が
/i/であるときのパラメータファイル3cが作成される。
直前母音が/e/である音節のパラメータも同様にして
作成され、前述したパラメータファイル3dが作成され
る。
作成され、前述したパラメータファイル3dが作成され
る。
更に直前母音が/a/,/o/,/u/の場合に用いる音節パラ
メータは、例えば直前母音が/a/となる2音節の自然音
声について分析し、その第2音節のみを切出して上述し
た例と同様にして作成すれば良い。この場合、直前母音
が/o/または/u/となる2音節の自然音声を分析し、そこ
から第2音節のみを切出す作業を省くことができる。
メータは、例えば直前母音が/a/となる2音節の自然音
声について分析し、その第2音節のみを切出して上述し
た例と同様にして作成すれば良い。この場合、直前母音
が/o/または/u/となる2音節の自然音声を分析し、そこ
から第2音節のみを切出す作業を省くことができる。
尚、直前母音が/o/となる2音節の自然音声を分析
し、その第2音節のみを切出して直前母音が/a/,/o/,/u
/の場合に用いる音節パラメータを作成する場合には、
直前母音が/a/または/u/となる2音節の自然音声を分析
し、そこから第2音節のみを切出す作業を行う必要はな
い。
し、その第2音節のみを切出して直前母音が/a/,/o/,/u
/の場合に用いる音節パラメータを作成する場合には、
直前母音が/a/または/u/となる2音節の自然音声を分析
し、そこから第2音節のみを切出す作業を行う必要はな
い。
しかして音声パラメータ列生成装置2は、前記音韻記
号列の各音節について、その直前に存在する母音の種別
を判定し、その判定結果に応じて該音節に対する音節パ
ラメータを求めるべきパラメータファイルを選択してい
る。そして各音節毎に選択されたパラメータファイルか
ら、その音節に対する音節パラメータを求め、それらの
音節パラメータを結合して音声パラメータ列を生成して
いる。
号列の各音節について、その直前に存在する母音の種別
を判定し、その判定結果に応じて該音節に対する音節パ
ラメータを求めるべきパラメータファイルを選択してい
る。そして各音節毎に選択されたパラメータファイルか
ら、その音節に対する音節パラメータを求め、それらの
音節パラメータを結合して音声パラメータ列を生成して
いる。
例えば前述した[te・ki・ka・ku]なる音韻列の音声
パラメータ列を求める場合には、先ず第1番目の音節
[te]について、語頭用のパラメータファイル3aを参照
してその音節パラメータを求める。
パラメータ列を求める場合には、先ず第1番目の音節
[te]について、語頭用のパラメータファイル3aを参照
してその音節パラメータを求める。
次に第2番目の音節[ki]については、その直前の第
1音節の母音が/e/であることから、パラメータファイ
ル3dを参照してその音節パラメータを求める。同様にし
て第3音節[ka]については、その直前の母音が/i/で
あることから、パラメータファイル3cを参照してその音
節パラメータを求め、更に第4音節[ku]については、
その直前の母音が/a/であることから、パラメータファ
イル3bを参照してその音節パラメータを求める。
1音節の母音が/e/であることから、パラメータファイ
ル3dを参照してその音節パラメータを求める。同様にし
て第3音節[ka]については、その直前の母音が/i/で
あることから、パラメータファイル3cを参照してその音
節パラメータを求め、更に第4音節[ku]については、
その直前の母音が/a/であることから、パラメータファ
イル3bを参照してその音節パラメータを求める。
このようにしてその直前母音に応じて4つのパラメー
タファイル3a,3b,3c,3dから選択的に求められる音節パ
ラメータを順次補間結合することにより、前記[te・ki
・ka・ku]なる音韻列の音声パラメータ列が求められ
る。
タファイル3a,3b,3c,3dから選択的に求められる音節パ
ラメータを順次補間結合することにより、前記[te・ki
・ka・ku]なる音韻列の音声パラメータ列が求められ
る。
かくしてこのようにして音声パラメータ列を生成する
本装置によれば、音声素片である音節に対してそれぞれ
求められる音節パラメータが、その直前の音節の母音に
よる変化の影響を考慮したものとなる為、これに基いて
規則合成される音声は自然性の高い非常に滑らかなもの
となる。しかも規則合成の利点を反映した了解度の高い
ものとなる。従って、音声了解度が高く、自然性の良好
な聞取り易い合成音声を効果的に得ることが可能とな
る。
本装置によれば、音声素片である音節に対してそれぞれ
求められる音節パラメータが、その直前の音節の母音に
よる変化の影響を考慮したものとなる為、これに基いて
規則合成される音声は自然性の高い非常に滑らかなもの
となる。しかも規則合成の利点を反映した了解度の高い
ものとなる。従って、音声了解度が高く、自然性の良好
な聞取り易い合成音声を効果的に得ることが可能とな
る。
また上述したように直前母音に応じたパラメータファ
イルを準備し、これをその直前母音に応じて選択的に用
いれば良いので、そのパラメータ列の生成を始めとする
音声合成処理が簡単である等の効果も奏せられる。
イルを準備し、これをその直前母音に応じて選択的に用
いれば良いので、そのパラメータ列の生成を始めとする
音声合成処理が簡単である等の効果も奏せられる。
尚、本発明は上述した実施例に限定さるものではな
い。ここでは規則合成の単位となる音声素片を音節とし
て説明したが、音素を音声素片とする場合にも同様に適
用することが可能である。その他、本発明はその要旨を
逸脱しない範囲で種々変形して実施することができる。
い。ここでは規則合成の単位となる音声素片を音節とし
て説明したが、音素を音声素片とする場合にも同様に適
用することが可能である。その他、本発明はその要旨を
逸脱しない範囲で種々変形して実施することができる。
第1図は本発明の一実施例方式を適用した音声合成装置
の概略構成図、第2図は実施例装置における音声パラメ
ータ列の生成過程を模式的に示す図である。 1……文字列解析装置、2……音声パラメータ列生成装
置、3a,3b,3c,3d……パラメータファイル、4……韻律
パラメータ列生成装置、5……音声合成器。
の概略構成図、第2図は実施例装置における音声パラメ
ータ列の生成過程を模式的に示す図である。 1……文字列解析装置、2……音声パラメータ列生成装
置、3a,3b,3c,3d……パラメータファイル、4……韻律
パラメータ列生成装置、5……音声合成器。
Claims (1)
- 【請求項1】入力文字列を解析してその音韻記号列と韻
律情報とを求める文字列解析手段と、 音節の直前に母音が存在しない語頭をなす音節パラメー
タを格納した語頭用のファイル及び音節の直前に存在す
る母音の種類に応じて分類された音節パラメータを格納
したファイルからなり、上記音節パラメータが子音
(C)と母音(V)との組み合わせ(CV)のみによって
定義されたパラメータファイルと、 上記文字列解析手段によって求められた音韻記号列に対
し、各音節の直前に存在する母音の有無及び母音の種類
に応じて上記パラメータファイルを参照して音声パラメ
ータ列を生成する音声パラメータ列生成手段と、 上記文字列解析手段によって求められた前記韻律情報に
基づいて韻律パラメータ列を生成する韻律パラメータ列
生成手段と、 上記音声パラメータ列生成手段により生成された音声パ
ラメータ列と上記韻律パラメータ列生成手段によって生
成された韻律パラメータ列とに従って音声を規則合成す
る音声合成手段とを具備したことを特徴とする音声合成
装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61002481A JPH0833744B2 (ja) | 1986-01-09 | 1986-01-09 | 音声合成装置 |
GB8631052A GB2185370B (en) | 1986-01-09 | 1986-12-31 | Speech synthesis system of rule-synthesis type |
US07/000,167 US4862504A (en) | 1986-01-09 | 1987-01-02 | Speech synthesis system of rule-synthesis type |
KR1019870000108A KR900009170B1 (ko) | 1986-01-09 | 1987-01-09 | 규칙합성형 음성합성시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61002481A JPH0833744B2 (ja) | 1986-01-09 | 1986-01-09 | 音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62160495A JPS62160495A (ja) | 1987-07-16 |
JPH0833744B2 true JPH0833744B2 (ja) | 1996-03-29 |
Family
ID=11530534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61002481A Expired - Lifetime JPH0833744B2 (ja) | 1986-01-09 | 1986-01-09 | 音声合成装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US4862504A (ja) |
JP (1) | JPH0833744B2 (ja) |
KR (1) | KR900009170B1 (ja) |
GB (1) | GB2185370B (ja) |
Families Citing this family (163)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3010630B2 (ja) * | 1988-05-10 | 2000-02-21 | セイコーエプソン株式会社 | 音声出力電子機器 |
JPH03150599A (ja) * | 1989-11-07 | 1991-06-26 | Canon Inc | 日本語音節の符号化方式 |
US5171930A (en) * | 1990-09-26 | 1992-12-15 | Synchro Voice Inc. | Electroglottograph-driven controller for a MIDI-compatible electronic music synthesizer device |
DE4138016A1 (de) * | 1991-11-19 | 1993-05-27 | Philips Patentverwaltung | Einrichtung zur erzeugung einer ansageinformation |
US6122616A (en) * | 1993-01-21 | 2000-09-19 | Apple Computer, Inc. | Method and apparatus for diphone aliasing |
US5987412A (en) * | 1993-08-04 | 1999-11-16 | British Telecommunications Public Limited Company | Synthesising speech by converting phonemes to digital waveforms |
US6502074B1 (en) * | 1993-08-04 | 2002-12-31 | British Telecommunications Public Limited Company | Synthesising speech by converting phonemes to digital waveforms |
JP3085631B2 (ja) * | 1994-10-19 | 2000-09-11 | 日本アイ・ビー・エム株式会社 | 音声合成方法及びシステム |
US5905972A (en) * | 1996-09-30 | 1999-05-18 | Microsoft Corporation | Prosodic databases holding fundamental frequency templates for use in speech synthesis |
JP2001100776A (ja) * | 1999-09-30 | 2001-04-13 | Arcadia:Kk | 音声合成装置 |
JP2001293247A (ja) * | 2000-02-07 | 2001-10-23 | Sony Computer Entertainment Inc | ゲーム制御方法 |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7633076B2 (en) | 2005-09-30 | 2009-12-15 | Apple Inc. | Automated response to and sensing of user activity in portable devices |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US20080154605A1 (en) * | 2006-12-21 | 2008-06-26 | International Business Machines Corporation | Adaptive quality adjustments for speech synthesis in a real-time speech processing system based upon load |
JP2008185805A (ja) * | 2007-01-30 | 2008-08-14 | Internatl Business Mach Corp <Ibm> | 高品質の合成音声を生成する技術 |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8620662B2 (en) | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US8600743B2 (en) | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10672399B2 (en) | 2011-06-03 | 2020-06-02 | Apple Inc. | Switching between text data and audio data based on a mapping |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
WO2013185109A2 (en) | 2012-06-08 | 2013-12-12 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
EP3809407A1 (en) | 2013-02-07 | 2021-04-21 | Apple Inc. | Voice trigger for a digital assistant |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
CN105190607B (zh) | 2013-03-15 | 2018-11-30 | 苹果公司 | 通过智能数字助理的用户培训 |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
KR102057795B1 (ko) | 2013-03-15 | 2019-12-19 | 애플 인크. | 콘텍스트-민감성 방해 처리 |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
KR101922663B1 (ko) | 2013-06-09 | 2018-11-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
JP2016521948A (ja) | 2013-06-13 | 2016-07-25 | アップル インコーポレイテッド | 音声コマンドによって開始される緊急電話のためのシステム及び方法 |
AU2014306221B2 (en) | 2013-08-06 | 2017-04-06 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
JP6728755B2 (ja) * | 2015-03-25 | 2020-07-22 | ヤマハ株式会社 | 歌唱音発音装置 |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB107945A (en) * | 1917-03-27 | 1917-07-19 | Fletcher Russell & Company Ltd | Improvements in or relating to Atmospheric Gas Burners. |
JPS50134311A (ja) * | 1974-04-10 | 1975-10-24 | ||
JPS5643700A (en) * | 1979-09-19 | 1981-04-22 | Nippon Telegraph & Telephone | Voice synthesizer |
DE3105518A1 (de) * | 1981-02-11 | 1982-08-19 | Heinrich-Hertz-Institut für Nachrichtentechnik Berlin GmbH, 1000 Berlin | Verfahren zur synthese von sprache mit unbegrenztem wortschatz und schaltungsanordnung zur durchfuehrung des verfahrens |
JPS5868099A (ja) * | 1981-10-19 | 1983-04-22 | 富士通株式会社 | 音声合成装置 |
NL8200726A (nl) * | 1982-02-24 | 1983-09-16 | Philips Nv | Inrichting voor het genereren van de auditieve informatie van een verzameling karakters. |
JPS5972494A (ja) * | 1982-10-19 | 1984-04-24 | 株式会社東芝 | 規則合成方式 |
-
1986
- 1986-01-09 JP JP61002481A patent/JPH0833744B2/ja not_active Expired - Lifetime
- 1986-12-31 GB GB8631052A patent/GB2185370B/en not_active Expired
-
1987
- 1987-01-02 US US07/000,167 patent/US4862504A/en not_active Expired - Fee Related
- 1987-01-09 KR KR1019870000108A patent/KR900009170B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
GB2185370B (en) | 1989-10-25 |
KR870007477A (ko) | 1987-08-19 |
KR900009170B1 (ko) | 1990-12-24 |
US4862504A (en) | 1989-08-29 |
GB2185370A (en) | 1987-07-15 |
JPS62160495A (ja) | 1987-07-16 |
GB8631052D0 (en) | 1987-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0833744B2 (ja) | 音声合成装置 | |
JPH031200A (ja) | 規則型音声合成装置 | |
JPH08335096A (ja) | テキスト音声合成装置 | |
JPS5972494A (ja) | 規則合成方式 | |
JP2008058379A (ja) | 音声合成システム及びフィルタ装置 | |
JP2577372B2 (ja) | 音声合成装置および方法 | |
JPH06318094A (ja) | 音声規則合成装置 | |
JP2740510B2 (ja) | テキスト音声合成方式 | |
JP2703253B2 (ja) | 音声合成装置 | |
JPH0642158B2 (ja) | 音声合成装置 | |
JPH05224688A (ja) | テキスト音声合成装置 | |
JP2987089B2 (ja) | 音声素片作成方法および音声合成方法とその装置 | |
JPS62229199A (ja) | 音声合成装置 | |
JPH09160582A (ja) | 音声合成装置 | |
JP2573586B2 (ja) | 規則型音声合成装置 | |
JP6159436B2 (ja) | 読み記号列編集装置および読み記号列編集方法 | |
JPS62284398A (ja) | 文・音声変換装置 | |
JP2573587B2 (ja) | ピッチパタン生成装置 | |
JP2573585B2 (ja) | 音声スペクトルパタン生成装置 | |
JP2586040B2 (ja) | 音声編集合成装置 | |
JP2809769B2 (ja) | 音声合成装置 | |
JPS63208099A (ja) | 音声合成装置 | |
JPH0258640B2 (ja) | ||
JPH06138894A (ja) | 音声合成装置及び音声合成方法 | |
JPS58168096A (ja) | 複数言語音声合成装置 |