JPS603699A - 適応性自動離散音声認識方法 - Google Patents
適応性自動離散音声認識方法Info
- Publication number
- JPS603699A JPS603699A JP59047322A JP4732284A JPS603699A JP S603699 A JPS603699 A JP S603699A JP 59047322 A JP59047322 A JP 59047322A JP 4732284 A JP4732284 A JP 4732284A JP S603699 A JPS603699 A JP S603699A
- Authority
- JP
- Japan
- Prior art keywords
- prototype
- utterance
- recognition
- speaker
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003044 adaptive effect Effects 0.000 title claims description 19
- 238000000034 method Methods 0.000 claims description 25
- 238000012549 training Methods 0.000 description 20
- 239000011159 matrix material Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000003909 pattern recognition Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 241001385733 Aesculus indica Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 208000030303 breathing problems Diseases 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は自動離散音声認識システムに関し、特に多重繰
返し技法によって原型の用語集のみを作成するだけでよ
く、その後話し手は適応モードで音声認識システムと対
話するだけでよい適応性自動離散音声認識システムに関
する。適応性モードでは、新らしい話し手は用語集のう
ちシステムが認識し得ない限られた部分集合に対してだ
けシステムを再訓練する事が要求される。
返し技法によって原型の用語集のみを作成するだけでよ
く、その後話し手は適応モードで音声認識システムと対
話するだけでよい適応性自動離散音声認識システムに関
する。適応性モードでは、新らしい話し手は用語集のう
ちシステムが認識し得ない限られた部分集合に対してだ
けシステムを再訓練する事が要求される。
現在の自動離散音声認識システムは各話し手から各用語
の項目全多数回繰返して入力する音声原型確立のための
分離した手順を含む。もし−回だけの繰返しだけならば
、不適切な原型の表示が生じた時に全用語の原型集を書
換えなければならない可能性が生ずる。
の項目全多数回繰返して入力する音声原型確立のための
分離した手順を含む。もし−回だけの繰返しだけならば
、不適切な原型の表示が生じた時に全用語の原型集を書
換えなければならない可能性が生ずる。
各話し手が原型の単語リストを繰返すこの様な手順の代
表的な文献には次のものがあげられる。
表的な文献には次のものがあげられる。
米国特許第3333248号:この特許は最初ノ訓練ノ
後に、動作モードにスイッチされ、棄却信号を生ずる文
字が提示される迄動作モードに保持される。棄却が生ず
ると、オペレータは棄却ノくターンに対応する位置に識
別スイッチを置き棄却パターンが最−初のサンプル・パ
ターンのわずかに変形されたものであるか、新らしいサ
ンプル・ノくターンであるかどうかを決定しなければな
らず、訓練モードを開拓するだめのスイッチを含む適切
なスイッチをセットしなければならない。自動適応性回
路を効果的に更新するためには、十分な数の初期サンプ
ル・パターンが記憶されなければならず、棄却パターン
が自動適応回路に提示されなければならない。
後に、動作モードにスイッチされ、棄却信号を生ずる文
字が提示される迄動作モードに保持される。棄却が生ず
ると、オペレータは棄却ノくターンに対応する位置に識
別スイッチを置き棄却パターンが最−初のサンプル・パ
ターンのわずかに変形されたものであるか、新らしいサ
ンプル・ノくターンであるかどうかを決定しなければな
らず、訓練モードを開拓するだめのスイッチを含む適切
なスイッチをセットしなければならない。自動適応性回
路を効果的に更新するためには、十分な数の初期サンプ
ル・パターンが記憶されなければならず、棄却パターン
が自動適応回路に提示されなければならない。
米国特許第3369077号:この特許は予定の時間基
準に従ってピッチ周期が調節される音声合成システムを
開示している。
準に従ってピッチ周期が調節される音声合成システムを
開示している。
米国特許第3440617号:この特許は信号を一連の
成分信号に分割する事によって、信号の振幅及び持続時
間に無関係な認識技法を開示している。このシステムは
これ迄に受取った事のない入力をこの信号に最も似た応
答になる様に外挿及び内挿している。このデータは新ら
しいデータによって置換された時には失われるにちがい
ない。
成分信号に分割する事によって、信号の振幅及び持続時
間に無関係な認識技法を開示している。このシステムは
これ迄に受取った事のない入力をこの信号に最も似た応
答になる様に外挿及び内挿している。このデータは新ら
しいデータによって置換された時には失われるにちがい
ない。
この特許は、転送バッファ部分が既に満員である時には
新らしく符号化されたサンプルは棄却されず、新らしい
サンプルを記憶するだめの余地を作るために古くて転送
されていない符号化サンプルが棄却される技法を開示し
ている。
新らしく符号化されたサンプルは棄却されず、新らしい
サンプルを記憶するだめの余地を作るために古くて転送
されていない符号化サンプルが棄却される技法を開示し
ている。
米国特許第6665’450号は表意文字を処理するた
めの技法を開示している。
めの技法を開示している。
米国特許第3718768号はそれ自身の識別信号を検
出し得それ自身のサンプリング率を有する複数の遠隔ス
テーションに通信を送る事が出来る技法を開示している
。
出し得それ自身のサンプリング率を有する複数の遠隔ス
テーションに通信を送る事が出来る技法を開示している
。
米国特許第4069393号は訓練用単語及び認識のだ
めの単語を時間規格化する技法を開示している。この特
許は音声入力訓練単語を使用し、相関0数を発’IEL
、特徴抽8を使JILrl、q6・訓 1練モード中、
装置は好しい場合°として後にこの装置を使用する人に
よって話された新らしい用語で訓練されている。信頼性
の高い平均サンプルを得るためには同じ訓練単語の多く
のサンプルを使用するのが望まれる。
めの単語を時間規格化する技法を開示している。この特
許は音声入力訓練単語を使用し、相関0数を発’IEL
、特徴抽8を使JILrl、q6・訓 1練モード中、
装置は好しい場合°として後にこの装置を使用する人に
よって話された新らしい用語で訓練されている。信頼性
の高い平均サンプルを得るためには同じ訓練単語の多く
のサンプルを使用するのが望まれる。
米国特許4092496号:この特許はあらかじめ発生
された音声間隔線形予測特性を有する、テスト信頼性が
各音声セグメントの繰返しの平均音声間隔に時間がそろ
えられた音声認識システムを開示している。
された音声間隔線形予測特性を有する、テスト信頼性が
各音声セグメントの繰返しの平均音声間隔に時間がそろ
えられた音声認識システムを開示している。
米国特許第42975.28号:この特許は組合わせの
ために受取られる各訓練パターンが国値量内で前もって
組合されたパターンに一致しなければならない訓練回路
技法を開示している。国値は予じめ組合された訓練パタ
ーンの数が増大すると自動的に変化している。
ために受取られる各訓練パターンが国値量内で前もって
組合されたパターンに一致しなければならない訓練回路
技法を開示している。国値は予じめ組合された訓練パタ
ーンの数が増大すると自動的に変化している。
I EEE Trans、on Systems、Ma
n。
n。
and CyberneticS、第SMC2号、第1
号、1972年1月号第6672頁のC,C。
号、1972年1月号第6672頁のC,C。
Tappert著A PRELIMINARYINVE
STIGATION 0F ADAPTIVE C0NTR0L、’INTHE I
NTERACTION 13ETWEEN SEGMENTATIONAND
SEGMEN、T CLASSIFICATION IN AtrToMATICRECOGNITIONOF C
0NTINUOUS 5PEECH:この論文は連続音
声認識のセグメンテーション及びセグメントの分類の相
互作用のための帰還制御を述べている。
STIGATION 0F ADAPTIVE C0NTR0L、’INTHE I
NTERACTION 13ETWEEN SEGMENTATIONAND
SEGMEN、T CLASSIFICATION IN AtrToMATICRECOGNITIONOF C
0NTINUOUS 5PEECH:この論文は連続音
声認識のセグメンテーション及びセグメントの分類の相
互作用のための帰還制御を述べている。
IEEE Trans、on Audio andEl
ectroacoustics第Au−21巻、第6号
1976年6月刊、第225228頁のC、C、Ta
ppert等著A、PPLICATIOWOF 5EQ
UEWTIAL DECODINGF、ORC0NVE
RTING PH0NETICTo GRAPHIC REPRESENTATION IN AUTOMATICRECOGWTIONOF C0N
TINUOUS 5PEECH(ARC8):この論文
は話し手の話の機械に汚染された音声的記述を標準の正
しい音声的記述に変換する技法を説明している。音声人
力連糸の話し手によるくずれ及び機械によるくずれの間
の区別がなされている。
ectroacoustics第Au−21巻、第6号
1976年6月刊、第225228頁のC、C、Ta
ppert等著A、PPLICATIOWOF 5EQ
UEWTIAL DECODINGF、ORC0NVE
RTING PH0NETICTo GRAPHIC REPRESENTATION IN AUTOMATICRECOGWTIONOF C0N
TINUOUS 5PEECH(ARC8):この論文
は話し手の話の機械に汚染された音声的記述を標準の正
しい音声的記述に変換する技法を説明している。音声人
力連糸の話し手によるくずれ及び機械によるくずれの間
の区別がなされている。
本発明は(最初の話し手もしくは電子的等価回路による
)単なる初期単一原型ステートメントを含む原型を確立
しそしてシステムが正しい認識の遂行に困難を感する用
語の項目を除き、最初のもしくはその後の話し手による
用語の項目の繰返しを必要としない最適の技法を与える
。この様な認識に失敗した用語の項目のだめの再訓練は
認識手順と一体にされている。
)単なる初期単一原型ステートメントを含む原型を確立
しそしてシステムが正しい認識の遂行に困難を感する用
語の項目を除き、最初のもしくはその後の話し手による
用語の項目の繰返しを必要としない最適の技法を与える
。この様な認識に失敗した用語の項目のだめの再訓練は
認識手順と一体にされている。
本発明の目的は各話し手の特定の要求に対して音声認識
システムの安価で、高速な、複雑でない音声認識システ
ムを与える事にある。
システムの安価で、高速な、複雑でない音声認識システ
ムを与える事にある。
本発明に従えば話し手はシステムが再訓練されつつある
事を明確に知っている必要がなくなる。
事を明確に知っている必要がなくなる。
本発明に従えば出来るだけ目立たない様に、且話し手の
文脈内で、用語の原型集の限られた部分集合を通して話
し手を導ぐための助言を与えるシステムが与えられる。
文脈内で、用語の原型集の限られた部分集合を通して話
し手を導ぐための助言を与えるシステムが与えられる。
本発明に従えば、次の2つの事が生じる用語の原型集の
うち制限された部分集合のだめだけに7ステム保持が与
えられる。
うち制限された部分集合のだめだけに7ステム保持が与
えられる。
1)話し手は原型集中の単語を発声する。
2)システムは話された単語の認識に困難を生ずる。
これによってシステムは使用されない単語のだめの再訓
練を避ける事が出来る。
練を避ける事が出来る。
第1図は本発明の適応性自動離散音声認識システムのブ
ロック図である。従来の音声認識システムはその後の認
識のために一般に新らしい話゛し手の各々が原型の用語
を多数回唱える事を要した事に注意されたい。もし何等
かの理由で原型の用語 1を変更しだい場合には(例え
ば、もし話し手が呼吸上の問題を生じた場合の如く)、
原手順は全体的に繰返される必要がある。本発明は最初
の話し手であっても原型用語の多数回唱える必要を除去
し、任意の話し手による全体的原型の用語の暗唱を全く
必要としない。システムが任意の個々の用語の項目の認
識に困難を感じた場合に、話し手はその個々の用語の項
目を発音する様に促される。
ロック図である。従来の音声認識システムはその後の認
識のために一般に新らしい話゛し手の各々が原型の用語
を多数回唱える事を要した事に注意されたい。もし何等
かの理由で原型の用語 1を変更しだい場合には(例え
ば、もし話し手が呼吸上の問題を生じた場合の如く)、
原手順は全体的に繰返される必要がある。本発明は最初
の話し手であっても原型用語の多数回唱える必要を除去
し、任意の話し手による全体的原型の用語の暗唱を全く
必要としない。システムが任意の個々の用語の項目の認
識に困難を感じた場合に、話し手はその個々の用語の項
目を発音する様に促される。
本発明の方法は次の動作モードを必要とする。
選択さ牡た原型の話し手は用語の項目の原型集の各々に
対して一つの原型の用語のキイワードを発声し、システ
ムは各原−型の用語のキイワードの発声を後の認識手順
に使用するだめの符号パターンに変換する。適当な場合
には、話し手は全く暗誦を必要とする事なく、原型集が
計算されて、符号形で導入される。
対して一つの原型の用語のキイワードを発声し、システ
ムは各原−型の用語のキイワードの発声を後の認識手順
に使用するだめの符号パターンに変換する。適当な場合
には、話し手は全く暗誦を必要とする事なく、原型集が
計算されて、符号形で導入される。
モード2 通常の動作モード
話し手(原型の話し手もしくはその後の話し手)は認識
が満足に進行するかぎシ、システムにょって認識される
だめの音声入力を与える(−貫した認識の誤シを含ま々
い条件のFでは、もはや用語の訓練は生じない)。
が満足に進行するかぎシ、システムにょって認識される
だめの音声入力を与える(−貫した認識の誤シを含ま々
い条件のFでは、もはや用語の訓練は生じない)。
モード6 適応性再訓練モード
一貫性のある認識誤シの条件の下では、システムは適応
性の再訓練に対して必要とされる事を話し手に助言する
。この方法の詳細は〔本発明の方法〕の見出しのところ
で説明される。
性の再訓練に対して必要とされる事を話し手に助言する
。この方法の詳細は〔本発明の方法〕の見出しのところ
で説明される。
第1図は本発明の適応性自動離散音声認識システムを示
している。上記計算書1はユーザ・インターフェイス2
に接続され、ユーザ・インターフェイス2は表示装置3
.マイクロホーン4及び拡声器5と接続されている。ユ
ーザ・インターフェイス2は多くの形を取シ得る、ユー
ザ及び認識システムのだめの適切なインターフェイスで
ある。第1図に示された型では、ユーザのデータは線6
を介して信号解析兼特徴抽出装置7に送られ、訓練モー
ド中は線8に沿って原訓練パターン(原型)が原型記憶
装置9に分散され、認識モード中は特徴パターンが線1
0に沿ってパターン認識装置11に通過される。制御情
報は線12を介してパターン認識装置11及び原型記憶
装置9間で授受され、認識のだめの原型パターンは線1
6に沿ってパターン認識装置11に供給される。音声識
別距離値の形をなす認識情報は紗14を介して決定機#
It15に与えられる。認識結果のデータは線16を介
してユーザ物インターフェイス2に戻される。
している。上記計算書1はユーザ・インターフェイス2
に接続され、ユーザ・インターフェイス2は表示装置3
.マイクロホーン4及び拡声器5と接続されている。ユ
ーザ・インターフェイス2は多くの形を取シ得る、ユー
ザ及び認識システムのだめの適切なインターフェイスで
ある。第1図に示された型では、ユーザのデータは線6
を介して信号解析兼特徴抽出装置7に送られ、訓練モー
ド中は線8に沿って原訓練パターン(原型)が原型記憶
装置9に分散され、認識モード中は特徴パターンが線1
0に沿ってパターン認識装置11に通過される。制御情
報は線12を介してパターン認識装置11及び原型記憶
装置9間で授受され、認識のだめの原型パターンは線1
6に沿ってパターン認識装置11に供給される。音声識
別距離値の形をなす認識情報は紗14を介して決定機#
It15に与えられる。認識結果のデータは線16を介
してユーザ物インターフェイス2に戻される。
決定情報は同様に線17及び18を介して決定機構15
と適応性W11練装置20間を転送され、線19を介し
て適応訓練装置2oがら原型記憶装置9に転送される。
と適応性W11練装置20間を転送され、線19を介し
て適応訓練装置2oがら原型記憶装置9に転送される。
前に指摘された如く、第1図中本発明にとって最も重要
な部分は適応性訓練と説明が記入されている(番号2o
で同定されている)サブシステムである。ノード(1)
、(2)及び(3)が第1図と第2図の関連を容易にす
るために第1図に示されている。
な部分は適応性訓練と説明が記入されている(番号2o
で同定されている)サブシステムである。ノード(1)
、(2)及び(3)が第1図と第2図の関連を容易にす
るために第1図に示されている。
第2図は第1図の適応性訓練装置2oの詳細な図である
。キイワード装置21は音声がキイワードであるかどう
かを決定する。もしキイワードでなければ(No)、注
意が線22を介してノード(2)に送られる。ノード(
2)は第1図及び第2図の両方のM2Sに接続されてい
る。もしYESならば線24を介して注意がインフレメ
ンタ26に送られ、一連の選択番号によるキイワードの
ユーザ識別が促される。インフレメンタ2bは現在のキ
イワード選択番号をインクレメントして、キイワード選
択番号が現在の選択番号と等しいかどうかを決定するた
めに次の選択番号を装置25に与える。
。キイワード装置21は音声がキイワードであるかどう
かを決定する。もしキイワードでなければ(No)、注
意が線22を介してノード(2)に送られる。ノード(
2)は第1図及び第2図の両方のM2Sに接続されてい
る。もしYESならば線24を介して注意がインフレメ
ンタ26に送られ、一連の選択番号によるキイワードの
ユーザ識別が促される。インフレメンタ2bは現在のキ
イワード選択番号をインクレメントして、キイワード選
択番号が現在の選択番号と等しいかどうかを決定するた
めに次の選択番号を装置25に与える。
もし選択番号が適切な選択番号でない時、、(、、No
)には、選択の促進は信号を最大識別装置26(選択番
号−選択MAX?)に与える事によって、選択番号のリ
ストを通して続けられる。もし選択番号が最大選択番号
以下ならば、No線28上の信号が次の選択番号の選択
が促がされる。最後の選択番号に到達すると、最大識別
装置26は線29を介してYESを信号し、新らしい選
択リストのため繰返し導入装置3oを励起する。 ′さ 一度音声選択番号が決定されると、これは選択催促装置
32に接続されたYES線31によって同定され、ユー
ザにはユーザが選択番号を発する事を要求する指示メツ
セージが与えられる。この発声は新しい原型の如き成る
状況において使用される発声である。
)には、選択の促進は信号を最大識別装置26(選択番
号−選択MAX?)に与える事によって、選択番号のリ
ストを通して続けられる。もし選択番号が最大選択番号
以下ならば、No線28上の信号が次の選択番号の選択
が促がされる。最後の選択番号に到達すると、最大識別
装置26は線29を介してYESを信号し、新らしい選
択リストのため繰返し導入装置3oを励起する。 ′さ 一度音声選択番号が決定されると、これは選択催促装置
32に接続されたYES線31によって同定され、ユー
ザにはユーザが選択番号を発する事を要求する指示メツ
セージが与えられる。この発声は新しい原型の如き成る
状況において使用される発声である。
この発声は音声認識システムのだめの処理技法に従って
処理され、発声符号「入力1」として符号化される。指
示メツセージは第2の発声を促し、第2の発声が処理さ
れ、発声符号「入力2」として符号化される。これ等の
発声符号入力は同様にして符号化された原型の発声を共
に3つの符号のための距離の比較を行う3つのマトリッ
クス比較回路6ろ、64及び35に与えられる。マトリ
ックス比較回路66は2つの新らしい入力発声を互に関
連ずける距離符号D1を与える。マトリックス比較回路
ろ4は原型及び第2の新らしい発声入力を互に関連させ
る距離符号D2を与える。マトリックス比較回路35は
原型及び第1の新しい入力を互に関連ずける距離符号D
5を与える。これ等の距離符号は比較回路36及び37
によって比較される。所望の機能は入力1及び入力2の
差がこれ等を原型と比較した場合よりも小さい事が決定
さnると原型発声を発声人力2によって置換する事であ
る。比較回路66が入力2が人力1に対するよシも原型
に近い事を決定すると(L)1がD2よりも大きいと)
、回路36がNo線68を介して第1図のノード(2)
に、決定機構が原型を変更する事なく先に進む事を信号
する。同様に、人力1、・が入力2よりも原型によシ近
い事を比較回路37が決定すると(I)1はD6よりも
小さくない)、装置37はNo線38を介して第1図の
ノード(2)に対して、決定機構が原型を変更する事な
く先に進む事を信号する。
処理され、発声符号「入力1」として符号化される。指
示メツセージは第2の発声を促し、第2の発声が処理さ
れ、発声符号「入力2」として符号化される。これ等の
発声符号入力は同様にして符号化された原型の発声を共
に3つの符号のための距離の比較を行う3つのマトリッ
クス比較回路6ろ、64及び35に与えられる。マトリ
ックス比較回路66は2つの新らしい入力発声を互に関
連ずける距離符号D1を与える。マトリックス比較回路
ろ4は原型及び第2の新らしい発声入力を互に関連させ
る距離符号D2を与える。マトリックス比較回路35は
原型及び第1の新しい入力を互に関連ずける距離符号D
5を与える。これ等の距離符号は比較回路36及び37
によって比較される。所望の機能は入力1及び入力2の
差がこれ等を原型と比較した場合よりも小さい事が決定
さnると原型発声を発声人力2によって置換する事であ
る。比較回路66が入力2が人力1に対するよシも原型
に近い事を決定すると(L)1がD2よりも大きいと)
、回路36がNo線68を介して第1図のノード(2)
に、決定機構が原型を変更する事なく先に進む事を信号
する。同様に、人力1、・が入力2よりも原型によシ近
い事を比較回路37が決定すると(I)1はD6よりも
小さくない)、装置37はNo線38を介して第1図の
ノード(2)に対して、決定機構が原型を変更する事な
く先に進む事を信号する。
望まれる機能はDlがD2未満で、同様にDlがD3未
満ならば原型を変更させる事である。比較回路37が線
69上にYES出力を与え、装置40による原型=入力
2動作を開拓する。第1図のノード(3)を含む信号線
19が原型用語の項目を入722によって置換する動作
を制御する。
満ならば原型を変更させる事である。比較回路37が線
69上にYES出力を与え、装置40による原型=入力
2動作を開拓する。第1図のノード(3)を含む信号線
19が原型用語の項目を入722によって置換する動作
を制御する。
新らしい発声が受容されたという決定に関連する原型用
語項目のこの様な適応性置換は、原型用語を一度確立し
た後、通常の動作の流れの中で用語の単語が現われる時
に、制限された数の用語のあいまいでない適応性の変更
を行いつつ、許される限りこれを使用し得る様にする。
語項目のこの様な適応性置換は、原型用語を一度確立し
た後、通常の動作の流れの中で用語の単語が現われる時
に、制限された数の用語のあいまいでない適応性の変更
を行いつつ、許される限りこれを使用し得る様にする。
何等かの理由(話し手間の方言、発音もしくは他の差も
しくは同じ話し手による話しぶ)の変化)によって原研
。
しくは同じ話し手による話しぶ)の変化)によって原研
。
の単語が認識されなくなると、このシステムはこの認識
不能を同定し、同じ発声の2回入力を促し、入力を互に
及び原型と比較し、入力が基準を満足している事が決定
されると、新らしい入力の一つによって原型が置換され
る。
不能を同定し、同じ発声の2回入力を促し、入力を互に
及び原型と比較し、入力が基準を満足している事が決定
されると、新らしい入力の一つによって原型が置換され
る。
第2図は原型用語の項目の適応性再訓練のための手1−
の詳細を示している。認識過程中、話し手がキイワード
の誤りを生ずると、適応性再訓練ルーチンが開始される
。計算機制御の下に、このルーチンに導入され、キイワ
ードの誤シ認識の直前の単語に関連する用語の項目の選
択番号のスタックが適応性訓練段階に送られ、このスタ
ックを使用して、システムはユーザに対し、認識されな
い発声として同定される直前にどのスタックの用語の項
目が発声されたかを示す様に促す(この催促は音声によ
る応答であるか、ガス・パネル、陰極線管等による文字
表示による)。もし認識不能な発声と同等な単語がスタ
ックに含まれていないと、ユーザはこの発声を再び唱え
る様に促され、認識手順が続けられる。スタックの用語
の項目がこの発声(入力1)に一致した事が話し手によ
って認識されると、ユーザはこの用語の項目に適した新
らしい原型のキイワードの候補(入力2)を与える様に
促される。システムはマトリックス距離〔入力1対入力
2=(DI ) 〕、〔原型対人力2−(D2))及び
〔原型対人力1=(D3) 〕が計算される。ここで入
力1は認識不能な発声及び入力2は同一のキイワードの
促がされた発声である。
の詳細を示している。認識過程中、話し手がキイワード
の誤りを生ずると、適応性再訓練ルーチンが開始される
。計算機制御の下に、このルーチンに導入され、キイワ
ードの誤シ認識の直前の単語に関連する用語の項目の選
択番号のスタックが適応性訓練段階に送られ、このスタ
ックを使用して、システムはユーザに対し、認識されな
い発声として同定される直前にどのスタックの用語の項
目が発声されたかを示す様に促す(この催促は音声によ
る応答であるか、ガス・パネル、陰極線管等による文字
表示による)。もし認識不能な発声と同等な単語がスタ
ックに含まれていないと、ユーザはこの発声を再び唱え
る様に促され、認識手順が続けられる。スタックの用語
の項目がこの発声(入力1)に一致した事が話し手によ
って認識されると、ユーザはこの用語の項目に適した新
らしい原型のキイワードの候補(入力2)を与える様に
促される。システムはマトリックス距離〔入力1対入力
2=(DI ) 〕、〔原型対人力2−(D2))及び
〔原型対人力1=(D3) 〕が計算される。ここで入
力1は認識不能な発声及び入力2は同一のキイワードの
促がされた発声である。
もしDlがD2よシも小さく、DlがD6よシも小さけ
れば、入力2は新らしい原型キイワードとなる。そうで
ない場合は古い原型が保持される。
れば、入力2は新らしい原型キイワードとなる。そうで
ない場合は古い原型が保持される。
j 0−T=jユゆ、ヶ。−ヶ。、−ヶ。工。11声特
性と関連ある、最良の現在利用可能な原型を与える事を
保証する。この手順はこの認識過程に使用される特定の
マトリックス距離を決定するモードとは無関係である。
性と関連ある、最良の現在利用可能な原型を与える事を
保証する。この手順はこの認識過程に使用される特定の
マトリックス距離を決定するモードとは無関係である。
本発明の認識は次の手順に従って行われる。
1、 原型となる話し手がキイワードの集合を発声し、
このキイワードの集合は原型の用語のキイワードの集合
として符号化されて記憶される。もしくは原型の用語の
キイワード集合は計算され、記憶される。
このキイワードの集合は原型の用語のキイワードの集合
として符号化されて記憶される。もしくは原型の用語の
キイワード集合は計算され、記憶される。
2、その後話し手は認識のだめのサンプル・キイワード
を発声する。
を発声する。
ろ 認識が生ずると、認識過程が進行する。
4、認識に失敗すると、適切な再訓練ルーチンに導入さ
れる。
れる。
5 認識不能なキイワードに関連する認識選択単語のス
タックによって適応性Ill練段階が設定される。
タックによって適応性Ill練段階が設定される。
6 ユーザに対しスタックのどの単語を意図しているか
を示す様に促す。
を示す様に促す。
Z 認識不能なキイワードがスタックにあるかどうかを
検査する。
検査する。
8、 もし段階7の答が否定であるならば、認識不能な
キイワードを繰返す様に話し手に促す。
キイワードを繰返す様に話し手に促す。
9 認識手順を続ける。
10、もし段階7の答が肯定であると、新らしい原型の
候補の発声を促す。
候補の発声を促す。
11、次のマトリックス距離を計算する。
入力1対入力2=(Dl、)
原型対入力2=(D2)
原型対人力1=(D3)
12、DI、D2.D3を比較する。
168 もしDI(D2及びD I (D 3ならば、
新らしい原型として入力2を選択し、進行する。
新らしい原型として入力2を選択し、進行する。
第1図は本発明の適応性自動離散音声認識システムのブ
ロック図である。第2図は適応性訓練サブシステムの詳
細な図である。 1・・・・上位計算機、2・・・ユーザ・インターフエ
イ諌、6・・・・表示装置、4・・・マイクロホーン9
、5・・・・拡声器、7・・・・信号解析兼特徴抽出装
置、9・・・・原型記憶装置、11.・・・・ノくター
ン認識装置、′!5・・・・決定機構、20・・・・適
応性訓練装置。 出願人 イ/外ヅルeナル・ビly<−マシーンズQコ
づ艙々→旧ン代理人 弁理士 山 本 仁 朗 (外1名)
ロック図である。第2図は適応性訓練サブシステムの詳
細な図である。 1・・・・上位計算機、2・・・ユーザ・インターフエ
イ諌、6・・・・表示装置、4・・・マイクロホーン9
、5・・・・拡声器、7・・・・信号解析兼特徴抽出装
置、9・・・・原型記憶装置、11.・・・・ノくター
ン認識装置、′!5・・・・決定機構、20・・・・適
応性訓練装置。 出願人 イ/外ヅルeナル・ビly<−マシーンズQコ
づ艙々→旧ン代理人 弁理士 山 本 仁 朗 (外1名)
Claims (1)
- 【特許請求の範囲】 次の段階より成る適応性自動離散音声認識方法。 (a)システムに原型の用語キイワードの組であって単
一発声からなるものを与える段階。 (b) 認識不能な発声が検出される迄システムを動作
させる段階。 (c)原型の用語キイワードのうち上記段階(b)によ
り指示されたものにつき候補となる発声を促す段階。 (d) 認識不能の発声、促された原型の用語キイワー
ドの候補の発声及び原型の用語キイーワードの夫々の間
の認識距離を計算する段階。 (e)上記計算された認識距離を比較する段階。 (f) 上記計算された認識距離を比較する段階に関連
し7て原型の用語キイワードとして上記原型の用語キイ
ワードの候補の発声を選択的に受容する段階。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US06/502,415 US4618984A (en) | 1983-06-08 | 1983-06-08 | Adaptive automatic discrete utterance recognition |
US502415 | 1995-07-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS603699A true JPS603699A (ja) | 1985-01-10 |
JPH0423799B2 JPH0423799B2 (ja) | 1992-04-23 |
Family
ID=23997720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59047322A Granted JPS603699A (ja) | 1983-06-08 | 1984-03-14 | 適応性自動離散音声認識方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US4618984A (ja) |
EP (1) | EP0128288B1 (ja) |
JP (1) | JPS603699A (ja) |
CA (1) | CA1204865A (ja) |
DE (1) | DE3467057D1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6598139B2 (en) | 1995-02-15 | 2003-07-22 | Hitachi, Ltd. | Information processing apparatus |
Families Citing this family (164)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5131043A (en) * | 1983-09-05 | 1992-07-14 | Matsushita Electric Industrial Co., Ltd. | Method of and apparatus for speech recognition wherein decisions are made based on phonemes |
US4991216A (en) * | 1983-09-22 | 1991-02-05 | Matsushita Electric Industrial Co., Ltd. | Method for speech recognition |
JPH0792673B2 (ja) * | 1984-10-02 | 1995-10-09 | 株式会社東芝 | 認識用辞書学習方法 |
US4797927A (en) * | 1985-10-30 | 1989-01-10 | Grumman Aerospace Corporation | Voice recognition process utilizing content addressable memory |
GB2187586B (en) * | 1986-02-06 | 1990-01-17 | Reginald Alfred King | Improvements in or relating to acoustic recognition |
CA1311059C (en) * | 1986-03-25 | 1992-12-01 | Bruce Allen Dautrich | Speaker-trained speech recognizer having the capability of detecting confusingly similar vocabulary words |
EP0241170B1 (en) * | 1986-03-28 | 1992-05-27 | AT&T Corp. | Adaptive speech feature signal generation arrangement |
US4908864A (en) * | 1986-04-05 | 1990-03-13 | Sharp Kabushiki Kaisha | Voice recognition method and apparatus by updating reference patterns |
US5146503A (en) * | 1987-08-28 | 1992-09-08 | British Telecommunications Public Limited Company | Speech recognition |
US5072452A (en) * | 1987-10-30 | 1991-12-10 | International Business Machines Corporation | Automatic determination of labels and Markov word models in a speech recognition system |
JP2733955B2 (ja) * | 1988-05-18 | 1998-03-30 | 日本電気株式会社 | 適応型音声認識装置 |
US5315689A (en) * | 1988-05-27 | 1994-05-24 | Kabushiki Kaisha Toshiba | Speech recognition system having word-based and phoneme-based recognition means |
US5033088A (en) * | 1988-06-06 | 1991-07-16 | Voice Processing Corp. | Method and apparatus for effectively receiving voice input to a voice recognition system |
AT391035B (de) * | 1988-12-07 | 1990-08-10 | Philips Nv | System zur spracherkennung |
US5127055A (en) * | 1988-12-30 | 1992-06-30 | Kurzweil Applied Intelligence, Inc. | Speech recognition apparatus & method having dynamic reference pattern adaptation |
JPH067348B2 (ja) * | 1989-04-13 | 1994-01-26 | 株式会社東芝 | パタン認識装置 |
GB2237135A (en) * | 1989-10-16 | 1991-04-24 | Logica Uk Ltd | Speaker recognition |
JP2570448B2 (ja) * | 1989-12-28 | 1997-01-08 | 日本電気株式会社 | 標準パターン学習方法 |
US5146502A (en) * | 1990-02-26 | 1992-09-08 | Davis, Van Nortwick & Company | Speech pattern correction device for deaf and voice-impaired |
JPH07109560B2 (ja) * | 1990-11-30 | 1995-11-22 | 富士通テン株式会社 | 音声認識装置 |
JPH04268811A (ja) * | 1991-02-22 | 1992-09-24 | Yokogawa Hewlett Packard Ltd | タイミングジェネレータ |
US5212821A (en) * | 1991-03-29 | 1993-05-18 | At&T Bell Laboratories | Machine-based learning system |
EP0559349B1 (en) * | 1992-03-02 | 1999-01-07 | AT&T Corp. | Training method and apparatus for speech recognition |
US5613036A (en) * | 1992-12-31 | 1997-03-18 | Apple Computer, Inc. | Dynamic categories for a speech recognition system |
US6311157B1 (en) | 1992-12-31 | 2001-10-30 | Apple Computer, Inc. | Assigning meanings to utterances in a speech recognition system |
JP3397372B2 (ja) * | 1993-06-16 | 2003-04-14 | キヤノン株式会社 | 音声認識方法及び装置 |
TW323364B (ja) * | 1993-11-24 | 1997-12-21 | At & T Corp | |
US5758322A (en) * | 1994-12-09 | 1998-05-26 | International Voice Register, Inc. | Method and apparatus for conducting point-of-sale transactions using voice recognition |
US5903864A (en) * | 1995-08-30 | 1999-05-11 | Dragon Systems | Speech recognition |
US5852801A (en) * | 1995-10-04 | 1998-12-22 | Apple Computer, Inc. | Method and apparatus for automatically invoking a new word module for unrecognized user input |
US5799279A (en) * | 1995-11-13 | 1998-08-25 | Dragon Systems, Inc. | Continuous speech recognition of text and commands |
US5960395A (en) * | 1996-02-09 | 1999-09-28 | Canon Kabushiki Kaisha | Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming |
US5915238A (en) * | 1996-07-16 | 1999-06-22 | Tjaden; Gary S. | Personalized audio information delivery system |
US5884258A (en) * | 1996-10-31 | 1999-03-16 | Microsoft Corporation | Method and system for editing phrases during continuous speech recognition |
US5829000A (en) * | 1996-10-31 | 1998-10-27 | Microsoft Corporation | Method and system for correcting misrecognized spoken words or phrases |
US5899976A (en) * | 1996-10-31 | 1999-05-04 | Microsoft Corporation | Method and system for buffering recognized words during speech recognition |
US5950160A (en) * | 1996-10-31 | 1999-09-07 | Microsoft Corporation | Method and system for displaying a variable number of alternative words during speech recognition |
US6212498B1 (en) | 1997-03-28 | 2001-04-03 | Dragon Systems, Inc. | Enrollment in speech recognition |
US7630895B2 (en) * | 2000-01-21 | 2009-12-08 | At&T Intellectual Property I, L.P. | Speaker verification method |
US6012027A (en) * | 1997-05-27 | 2000-01-04 | Ameritech Corporation | Criteria for usable repetitions of an utterance during speech reference enrollment |
US6278771B1 (en) * | 1998-03-19 | 2001-08-21 | Ameritech Corporation | Method and system for providing enhanced call waiting with verification and name change service |
US6163768A (en) | 1998-06-15 | 2000-12-19 | Dragon Systems, Inc. | Non-interactive enrollment in speech recognition |
JP2000099546A (ja) * | 1998-09-25 | 2000-04-07 | Canon Inc | 音声によるデータ検索装置、データ検索方法、及び記憶媒体 |
DE69829187T2 (de) * | 1998-12-17 | 2005-12-29 | Sony International (Europe) Gmbh | Halbüberwachte Sprecheradaptation |
JP2000221990A (ja) * | 1999-01-28 | 2000-08-11 | Ricoh Co Ltd | 音声認識装置 |
US6487530B1 (en) * | 1999-03-30 | 2002-11-26 | Nortel Networks Limited | Method for recognizing non-standard and standard speech by speaker independent and speaker dependent word models |
DE19933323C2 (de) * | 1999-07-16 | 2003-05-22 | Bayerische Motoren Werke Ag | Spracherkennungssystem und Verfahren zur Spracherkennung vorgegebener Sprachmuster, insbesondere zur Sprachsteuerung von Kraftfahrzeugsystemen |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US7003465B2 (en) * | 2000-10-12 | 2006-02-21 | Matsushita Electric Industrial Co., Ltd. | Method for speech recognition, apparatus for the same, and voice controller |
EP1239461A1 (de) * | 2001-03-06 | 2002-09-11 | Siemens Aktiengesellschaft | Verfahren zur Sprachenerkennung |
JP4947861B2 (ja) * | 2001-09-25 | 2012-06-06 | キヤノン株式会社 | 自然言語処理装置およびその制御方法ならびにプログラム |
US20040148169A1 (en) * | 2003-01-23 | 2004-07-29 | Aurilab, Llc | Speech recognition with shadow modeling |
US7580837B2 (en) | 2004-08-12 | 2009-08-25 | At&T Intellectual Property I, L.P. | System and method for targeted tuning module of a speech recognition system |
US7242751B2 (en) | 2004-12-06 | 2007-07-10 | Sbc Knowledge Ventures, L.P. | System and method for speech recognition-enabled automatic call routing |
US7751551B2 (en) | 2005-01-10 | 2010-07-06 | At&T Intellectual Property I, L.P. | System and method for speech-enabled call routing |
US7627096B2 (en) * | 2005-01-14 | 2009-12-01 | At&T Intellectual Property I, L.P. | System and method for independently recognizing and selecting actions and objects in a speech recognition system |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR20150104615A (ko) | 2013-02-07 | 2015-09-15 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
CN105027197B (zh) | 2013-03-15 | 2018-12-14 | 苹果公司 | 训练至少部分语音命令系统 |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN105264524B (zh) | 2013-06-09 | 2019-08-02 | 苹果公司 | 用于实现跨数字助理的两个或更多个实例的会话持续性的设备、方法、和图形用户界面 |
KR101809808B1 (ko) | 2013-06-13 | 2017-12-15 | 애플 인크. | 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법 |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
EP3149728B1 (en) | 2014-05-30 | 2019-01-16 | Apple Inc. | Multi-command single utterance input method |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US11597519B2 (en) | 2017-10-17 | 2023-03-07 | The Boeing Company | Artificially intelligent flight crew systems and methods |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57133494A (en) * | 1981-02-12 | 1982-08-18 | Oki Electric Ind Co Ltd | Registered pattern study method for voice typewriter |
JPS584198A (ja) * | 1981-06-30 | 1983-01-11 | 株式会社日立製作所 | 音声認識装置における標準パタ−ン登録方式 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3333248A (en) * | 1963-12-20 | 1967-07-25 | Ibm | Self-adaptive systems |
US3369077A (en) * | 1964-06-09 | 1968-02-13 | Ibm | Pitch modification of audio waveforms |
US3440617A (en) * | 1967-03-31 | 1969-04-22 | Andromeda Inc | Signal responsive systems |
US3665450A (en) * | 1968-07-02 | 1972-05-23 | Leo Stanger | Method and means for encoding and decoding ideographic characters |
US3718768A (en) * | 1971-08-09 | 1973-02-27 | Adaptive Tech | Voice or analog communication system employing adaptive encoding techniques |
GB1435779A (en) * | 1972-09-21 | 1976-05-12 | Threshold Tech | Word recognition |
US4092493A (en) * | 1976-11-30 | 1978-05-30 | Bell Telephone Laboratories, Incorporated | Speech recognition system |
JPS5819109B2 (ja) * | 1978-11-10 | 1983-04-16 | 肇産業株式会社 | パタ−ン判別方法 |
US4297528A (en) * | 1979-09-10 | 1981-10-27 | Interstate Electronics Corp. | Training circuit for audio signal recognition computer |
CH644246B (fr) * | 1981-05-15 | 1900-01-01 | Asulab Sa | Dispositif d'introduction de mots a commande par la parole. |
-
1983
- 1983-06-08 US US06/502,415 patent/US4618984A/en not_active Expired - Lifetime
-
1984
- 1984-03-14 JP JP59047322A patent/JPS603699A/ja active Granted
- 1984-04-05 DE DE8484103715T patent/DE3467057D1/de not_active Expired
- 1984-04-05 EP EP84103715A patent/EP0128288B1/en not_active Expired
- 1984-05-14 CA CA000454280A patent/CA1204865A/en not_active Expired
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57133494A (en) * | 1981-02-12 | 1982-08-18 | Oki Electric Ind Co Ltd | Registered pattern study method for voice typewriter |
JPS584198A (ja) * | 1981-06-30 | 1983-01-11 | 株式会社日立製作所 | 音声認識装置における標準パタ−ン登録方式 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6598139B2 (en) | 1995-02-15 | 2003-07-22 | Hitachi, Ltd. | Information processing apparatus |
Also Published As
Publication number | Publication date |
---|---|
US4618984A (en) | 1986-10-21 |
JPH0423799B2 (ja) | 1992-04-23 |
CA1204865A (en) | 1986-05-20 |
DE3467057D1 (en) | 1987-12-03 |
EP0128288A1 (en) | 1984-12-19 |
EP0128288B1 (en) | 1987-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS603699A (ja) | 適応性自動離散音声認識方法 | |
EP0376501B1 (en) | Speech recognition system | |
US5995928A (en) | Method and apparatus for continuous spelling speech recognition with early identification | |
EP0533491B1 (en) | Wordspotting using two hidden Markov models (HMM) | |
US5832063A (en) | Methods and apparatus for performing speaker independent recognition of commands in parallel with speaker dependent recognition of names, words or phrases | |
US6839670B1 (en) | Process for automatic control of one or more devices by voice commands or by real-time voice dialog and apparatus for carrying out this process | |
EP0387602B1 (en) | Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system | |
EP0840288B1 (en) | Method and system for editing phrases during continuous speech recognition | |
EP0965978A1 (en) | Non-interactive enrollment in speech recognition | |
US20050033575A1 (en) | Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer | |
US20020178004A1 (en) | Method and apparatus for voice recognition | |
JP2000122691A (ja) | 綴り字読み式音声発話の自動認識方法 | |
JPS6147440B2 (ja) | ||
KR19980070329A (ko) | 사용자 정의 문구의 화자 독립 인식을 위한 방법 및 시스템 | |
JP2000214880A (ja) | 音声認識方法及び音声認識装置 | |
JPH06110494A (ja) | 発音学習装置 | |
EP0177854B1 (en) | Keyword recognition system using template-concatenation model | |
JP3254977B2 (ja) | 音声認識方法及び音声認識装置 | |
JP2003044085A (ja) | コマンド入力機能つきディクテーション装置 | |
CN101304457A (zh) | 一种基于语音电话实现自动口语训练的方法与装置 | |
JPH08190470A (ja) | 情報提供端末 | |
JPH06161488A (ja) | 音声認識装置 | |
JP2001175279A (ja) | 音声認識方法 | |
JP3231365B2 (ja) | 音声認識装置 | |
JP3357752B2 (ja) | パターンマッチング装置 |