JP4816409B2 - 認識辞書システムおよびその更新方法 - Google Patents
認識辞書システムおよびその更新方法 Download PDFInfo
- Publication number
- JP4816409B2 JP4816409B2 JP2006293098A JP2006293098A JP4816409B2 JP 4816409 B2 JP4816409 B2 JP 4816409B2 JP 2006293098 A JP2006293098 A JP 2006293098A JP 2006293098 A JP2006293098 A JP 2006293098A JP 4816409 B2 JP4816409 B2 JP 4816409B2
- Authority
- JP
- Japan
- Prior art keywords
- vocabulary
- paraphrase
- recognition dictionary
- user
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title description 59
- 238000004458 analytical method Methods 0.000 claims abstract description 57
- 238000001514 detection method Methods 0.000 claims description 45
- 230000004044 response Effects 0.000 claims description 25
- 238000003860 storage Methods 0.000 claims description 25
- 238000004891 communication Methods 0.000 claims description 17
- 238000012217 deletion Methods 0.000 claims description 17
- 230000037430 deletion Effects 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 6
- 238000012790 confirmation Methods 0.000 claims description 5
- 230000014509 gene expression Effects 0.000 claims description 3
- 238000009825 accumulation Methods 0.000 abstract description 29
- 230000006870 function Effects 0.000 description 32
- 230000008569 process Effects 0.000 description 32
- 238000012545 processing Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 18
- 238000000605 extraction Methods 0.000 description 13
- 230000001186 cumulative effect Effects 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 10
- 241000531207 Oxera splendida Species 0.000 description 5
- 238000012937 correction Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000012731 temporal analysis Methods 0.000 description 2
- 238000000700 time series analysis Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 241000963790 Beilschmiedia tawa Species 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/197—Probabilistic grammars, e.g. word n-grams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Navigation (AREA)
Description
F.Wessel他,"Using Posterior wordprobabilities for improved speech recognition",Proc. ICASSP2000,pp.536−566 F.Wessel, R. Schluter, and H. Ney, "Using posterior probabilities forimproved speech recognition," In Proc. IEEE International Conference onAcoustics, Speech and Signal Processing (ICASSP), Istanbul, Turkey, June 2000,pp. 1587-1590.
(1)削除 「中部空港」←略称
(2)置換 「セントレア」←愛称、旧称等
(3)挿入 「中部新国際空港」 ←別称等
が挙げられる。
第1の実施形態では、ユーザの言い換え語彙を大量に累積記憶した言い換え語彙累積データを認識辞書140(図1参照)と別個に保持することを前提とし、言い換え語彙累積データに基づく発生頻度解析から主要な言い換え語彙を抽出して認識辞書140を更新する。
<基本機能と実現手段>
ここで、各部の基本的な機能および具体的な実現手段について、図2を用いて説明する。図2は、第1の実施形態の実現手段を示すブロック図である。なお、第1の実施形態では、クライアントサーバ型のナビゲーション用音声認識装置を示し、認識辞書140は更新が生じた場合に辞書更新システム(サーバA)300から更新データをダウンロードすることにより行うものとする。以降の説明では、音声認識処理の全てを音声認識システム(クライアントA)100側で完遂し、認識辞書140の更新データのみを辞書更新システム(サーバA)300から受け取る構成としているが、音声認識システム(クライアントA)100は音声信号そのもの、あるいは発話音声の特徴量を辞書更新システム(サーバA)300に送信し、音声認識部130以降の全ての音声認識処理を辞書更新システム(サーバA)300にて行う構成としてもよい。ただし、この場合は音声認識処理の都度、辞書更新システム(サーバA)300への通信が必要である。また、例えば、認識辞書140の更新をCD−ROM等の記憶媒体の直接送付等によって行う場合は、音声認識システム(クライアントA)100は通信を介さないスタンドアロンシステムとして構築することも可能である。
第1の実施形態では、オペレータサービスシステム200による対話等、音声認識システム(クライアントA)100以外のシステムから主要言い換え語彙を抽出し、該主要言い換え語彙を認識辞書140に反映する構成について述べた。これに対し、第2の実施形態では、音声認識システム(クライアント)100自身に、言い換え語彙の発生を検出させる機能を持たせ、この検出機能により累積記憶した言い換え語彙を認識辞書140に反映させる方法について述べる。なお、第1の実施形態と同じ構造、機能には、同じ符号を付与し、詳細な説明は省略する。
1.ユーザの「初期発話」が認識不可能あるいは誤認識となる
2.ユーザが再発話もしくは発話音声以外の操作により、目的地設定を試みる
3.最終的に何らかの施設名称を目的地に設定する
という対話の流れが検出されたときに、1にてユーザが発した「初期発話」が、3にて最終的に目的地に設定された「何らかの施設名称」(第2の語彙)の言い換え語彙、すなわち「略称」や「愛称」であると検出する。
第2の実施形態では、音声認識システム(クライアント)100自身に、言い換え語彙の発生を検出させる機能を持たせ、この検出機能により累積記憶した言い換え語彙を認識辞書140に反映させる方法について述べた。第3の実施形態では、音声認識システム(クライアントA)100自身に、言い換え語彙の発生を検出させる機能を持たせ、この検出機能により検出した言い換え語彙を、この検出機能により累積記憶した言い換え語彙と別に認識辞書190に反映させる方法について述べる。なお、第2の実施形態と同じ構造、機能には、同じ符号を付与し、詳細な説明は省略する。
120 特徴抽出部、130 音声認識部、140 認識辞書、150 理解制御部、
160 操作設定部、170 文字列情報入力部、180 理解制御部、
190 認識辞書、
200 オペレータサービスシステム、210 音声入力部、
220 操作設定部、230 オペレータログ記憶部、
300 辞書更新システム(サーバA)、310 言い換え語彙検出部、
320 言い換え語彙累積部、330 言い換え頻度解析部、
340 認識辞書更新部である辞書更新部、
401 マイクロフォン、402 スピーカ、403 表示装置、
404 AD変換部、405 演算装置、406 記憶装置、
407 通信装置、408 通信装置、409 演算装置、410 記憶装置、
510 言い換え語彙検出部、520 音声認識部、530 言い換え語彙累積部、
540 言い換え頻度解析部、550 認識辞書更新部である辞書更新部、
610 言い換え語彙検出部、620 認識辞書更新部である辞書更新部
Claims (15)
- ユーザが使用する端末であり、文字列情報を記憶した認識辞書を備えるクライアント端末と、
少なくとも1以上の前記クライアント端末と通信網で接続されるサーバ端末とを備え、
前記サーバ端末は、前記クライアント端末から入力された情報に対応する第1の語彙について、前記認識辞書に記憶されている第2の語彙と等価の意味を持ち、異なる文字列情報を持つ言い換え語彙を累積記憶する言い換え語彙累積部と、
該言い換え語彙累積部を参照し、前記言い換え語彙の発生頻度を解析し、該発生頻度が第1の所定値より高い言い換え語彙の少なくとも一つを主要言い換え語彙と判断する言い換え頻度解析部と、
前記主要言い換え語彙と判断された前記第1の語彙を、前記第2の語彙と対応付けて前記認識辞書に登録するために前記認識辞書を更新する認識辞書更新部とを有し、
前記クライアント端末は、ユーザの発話音声を入力する音声入力部と、前記発話音声から前記第1の語彙に対する文字列情報を抽出する音声認識部とを含む文字列情報入力部を備え、
前記言い換え語彙累積部は、前記発話音声を音素認識により変換した音素列情報に対応する文字列情報を有する前記第1の語彙を、前記言い換え語彙として累積記憶し、
前記言い換え頻度解析部は、前記言い換え語彙の発生頻度を解析する際、音素間距離が所定内である音素列情報ごとに分類することを特徴とする認識辞書システム。 - 請求項1記載の認識辞書システムであって、
更に前記クライアント端末側又は前記サーバー側に設けられ、前記クライアント端末から入力された情報に対応する第1の語彙について、文字列情報を記憶した認識辞書に記憶されている第2の語彙と等価の意味を持ち、異なる文字列情報を持つ場合に、前記第1の語彙を前記第2の語彙と対応付けて言い換え語彙として検出する言い換え語彙検出部を備え、
前記言い換え語彙検出部は、前記発話音声を音素認識により変換した第1の音素列情報に対応する文字列情報を有する前記第1の語彙を、前記言い換え語彙として、前記第2の語彙と対応付けて前記認識辞書に登録し、
前記認識辞書更新部は、前記主要言い換え語彙が有する第2の音素列情報と前記第1の音素列情報とが完全一致せず、音素間距離が所定内である場合に、前記認識辞書に登録された前記第1の語彙と対応付けて、前記主要言い換え語彙を登録することを特徴とする認識辞書システム。 - 請求項2記載の認識辞書システムであって、
前記クライアント端末は、前記第1の音素列情報と完全一致せず、音素間距離が所定内である前記第2の音素列情報を持つ前記主要言い換え語彙をユーザに教示することを特徴とする認識辞書システム。 - 請求項1記載の認識辞書システムであって、
さらに、前記クライアント端末または前記サーバ端末は、ユーザに対する応答を決定する理解制御部を備え、
前記理解制御部は、ユーザのn回目に入力された情報に対応する前記第1の語彙が前記認識辞書内に存在しないことを検出する機能と、
該検出結果に基づき、ユーザのn+1回目以降の入力を促す応答を出力する機能と、
前記ユーザのn+1回目以降に入力された情報に対応する語彙と前記第2の語彙とが一致することを検出する機能と、
該検出結果に基づき入力文字列情報を決定する機能とを有し、
前記クライアント端末側又は前記サーバー側に設けられ、前記クライアント端末から入力された情報に対応する第1の語彙について、文字列情報を記憶した認識辞書に記憶されている第2の語彙と等価の意味を持ち、異なる文字列情報を持つ場合に、前記第1の語彙を前記第2の語彙と対応付けて言い換え語彙として検出する言い換え語彙検出部を備え、
前記言い換え語彙検出部は、前記ユーザのn+1回目以降に入力された情報に対応する語彙と前記第2の語彙とが一致した場合に、前記第1の語彙を、前記第2の語彙の言い換え語彙であると決定することを特徴とする認識辞書システム。 - 請求項4記載の認識辞書システムであって、
前記理解制御部は、前記ユーザのn回目に入力された情報に対し、確認応答を提示する機能を有し、
前記ユーザのn+1回目に入力された情報に訂正表現あるいは否定表現が含まれる場合に、前記n回目に入力された情報に対応する前記第1の語彙が前記認識辞書に存在しないと検出することを特徴とする記載の認識辞書システム。 - 請求項5記載の認識辞書システムであって、
さらに、前記クライアント端末は、ユーザの発話音声を入力する音声入力部と、
前記発話音声から所定の認識スコアを持つ認識語彙候補を前記第1の語彙と認識する音声認識部とを備え、
前記理解制御部は、前記ユーザのn回目の発話音声に対し、前記認識語彙候補が得られない場合に、前記n回目の発話音声に含まれる前記第1の語彙が前記認識辞書に存在しないことを検出する機能を有することを特徴とする認識辞書システム。 - 請求項6記載の認識辞書システムであって、
前記理解制御部は、前記ユーザのn+1回目以降に入力された情報に対する語彙が前記認識辞書に存在した場合に、前記第1の語彙が前記第2の語彙の言い換え語彙であることをユーザに確認する応答を出力する機能を有し、
前記言い換え語彙検出部は、前記応答に対するユーザ応答が前記言い換え語彙を容認するものであると判断された場合に、前記第1の語彙が前記第2の語彙の前記言い換え語彙であると決定することを特徴とする認識辞書システム。 - 請求項7記載の認識辞書システムであって、
前記ユーザのn+1回目以降の入力を促す応答を出力する機能は、前記第1の語彙が前記認識辞書に存在しないとの前記検出結果に基づいて、ユーザに音声以外の操作による入力を促す前記応答を出力することを特徴とする認識辞書システム。 - 請求項1記載の認識辞書システムであって、
前記言い換え頻度解析部は、前記言い換え語彙累積部を所定の期間間隔で参照し、前記発生頻度が前記第1の所定値を上回る場合に、前記言い換え語彙を前記主要言い換え語彙と判断し、前記発生頻度が前記第1の所定値よりも低い第2の所定値を下回る場合に、前記言い換え語彙を削除対象言い換え語彙と判断し、
前記認識辞書更新部は、前記主要言い換え語彙または前記削除対象言い換え語彙と判断された前記言い換え語彙を、前記認識辞書に登録または削除することを特徴とする認識辞書システム。 - 請求項1記載の認識辞書システムであって、
前記クライアント端末から入力された前記情報は、ナビゲーションシステムでユーザが設定する目的地を示す情報であることを特徴とする記載の認識辞書システム。 - 請求項10記載の認識辞書システムであって、
前記言い換え語彙累積部は、前記第2の語彙と、ユーザの居住地域、年齢層、家族構成、車両属性の少なくとも1つより構成されるユーザ属性情報とを対応させて累積記憶する機能を有し、
前記言い換え頻度解析部は、前記言い換え語彙の発生頻度を前記ユーザ属性情報毎に解析し、前記ユーザ属性情報毎に前記主要言い換え語彙を決定する機能を有し、
前記認識辞書更新部は、対応するユーザ属性情報に属するユーザの前記認識辞書に対して、前記主要言い換え語彙を登録する機能を有することを特徴とする認識辞書システム。 - 請求項10記載の認識辞書システムであって、
前記言い換え語彙は、ユーザとオペレータとの対話から検出されることを特徴とする認識辞書システム。 - 請求項12記載の認識辞書システムであって、
前記サーバ端末は、ユーザとオペレータとの対話により前記第2の語彙が決定された場合に、対話ログを記憶する機能を有し、
前記言い換え語彙検出部は、前記対話ログから前記言い換え語彙を検出することを特徴とする認識辞書システム。 - ユーザが使用する端末であるクライアント端末から入力されたユーザのn回目の情報に対応する第1の語彙が、文字列情報を記憶した認識辞書に記憶されている第2の語彙と一致しないことを検出する機能と、該検出結果に基づき、ユーザのn+1回目以降の入力を促す応答を出力する機能と、前記ユーザのn+1回目以降に入力された情報に対応する語彙と前記第2の語彙とが一致することを検出する機能と、該検出結果に基づき入力文字列情報を決定する機能とを備える理解制御部と、
前記クライアント端末又は少なくとも1以上の前記クライアント端末と通信網で接続されるサーバ端末に設けられ、前記ユーザのn+1回目以降に入力された情報に対応する語彙と前記第2の語彙とが一致した場合に、前記第1の語彙は前記第2の語彙と等価の意味を持ち、異なる文字列情報を持つ言い換え語彙であると判断し、前記第1の語彙を前記第2の語彙と対応付けて検出する言い換え語彙検出部と、
該言い換え語彙検出部で検出された前記言い換え語彙を累積記憶する言い換え語彙累積部と、
該言い換え語彙累積部を参照し、前記言い換え語彙の発生頻度を解析し、該発生頻度が第1の所定値より高い言い換え語彙の少なくとも一つを主要言い換え語彙と判断する言い換え頻度解析部と、
前記主要言い換え語彙と判断された前記第1の語彙を、前記第2の語彙と対応付けて前記認識辞書に登録するために前記認識辞書を更新する認識辞書更新部とを有し、
前記クライアント端末は、ユーザの発話音声を入力する音声入力部と、前記発話音声から前記第1の語彙に対する文字列情報を抽出する音声認識部とを含む文字列情報入力部を備え、
前記言い換え語彙累積部は、前記発話音声を音素認識により変換した音素列情報に対応する文字列情報を有する前記第1の語彙を、前記言い換え語彙として累積記憶し、
前記言い換え頻度解析部は、前記言い換え語彙の発生頻度を解析する際、音素間距離が所定内である音素列情報ごとに分類することを特徴とする認識辞書システム。 - サーバ端末と通信網で接続される、少なくとも1以上のクライアント端末から入力された情報に対応する第1の語彙について、文字列情報を記憶した認識辞書に記憶されている第2の語彙と等価の意味を持ち、異なる文字列情報を持つ場合に、前記第1の語彙を前記第2の語彙と対応付けて言い換え語彙として検出し、
前記クライアント端末は、ユーザの発話音声を入力する音声入力部と、前記発話音声から前記第1の語彙に対する文字列情報を抽出する音声認識部とを含む文字列情報入力部とを備え、
言い換え語彙累積部は、前記発話音声を音素認識により変換した音素列情報に対応する文字列情報を有する前記第1の語彙を、前記言い換え語彙として累積記憶し、
言い換え頻度解析部は、前記言い換え語彙累積部を参照し、音素間距離が所定内である音素列情報ごとに分類して前記言い換え語彙の発生頻度を解析し、該発生頻度が第1の所定値より高い言い換え語彙の少なくとも一つを主要言い換え語彙と判断し、
認識辞書更新部は、前記主要言い換え語彙と判断された前記第1の語彙を、前記第2の語彙と対応付けて前記認識辞書に登録するために前記認識辞書を更新することを特徴とする認識辞書システムの更新方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006293098A JP4816409B2 (ja) | 2006-01-10 | 2006-10-27 | 認識辞書システムおよびその更新方法 |
US11/646,594 US9020819B2 (en) | 2006-01-10 | 2006-12-28 | Recognition dictionary system and recognition dictionary system updating method |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006002305 | 2006-01-10 | ||
JP2006002305 | 2006-01-10 | ||
JP2006293098A JP4816409B2 (ja) | 2006-01-10 | 2006-10-27 | 認識辞書システムおよびその更新方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007213005A JP2007213005A (ja) | 2007-08-23 |
JP4816409B2 true JP4816409B2 (ja) | 2011-11-16 |
Family
ID=38233799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006293098A Expired - Fee Related JP4816409B2 (ja) | 2006-01-10 | 2006-10-27 | 認識辞書システムおよびその更新方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9020819B2 (ja) |
JP (1) | JP4816409B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110551917B (zh) * | 2019-09-29 | 2021-07-09 | 广东和润新材料股份有限公司 | 一种高导电耐腐蚀铜带及其制备方法 |
Families Citing this family (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7254773B2 (en) * | 2000-12-29 | 2007-08-07 | International Business Machines Corporation | Automated spell analysis |
KR100897554B1 (ko) * | 2007-02-21 | 2009-05-15 | 삼성전자주식회사 | 분산 음성인식시스템 및 방법과 분산 음성인식을 위한 단말기 |
US8725512B2 (en) * | 2007-03-13 | 2014-05-13 | Nuance Communications, Inc. | Method and system having hypothesis type variable thresholds |
US7917355B2 (en) * | 2007-08-23 | 2011-03-29 | Google Inc. | Word detection |
US8103506B1 (en) * | 2007-09-20 | 2012-01-24 | United Services Automobile Association | Free text matching system and method |
JP5216337B2 (ja) * | 2008-01-24 | 2013-06-19 | アルパイン株式会社 | 音声認識辞書の更新データ作成方法 |
JP4990822B2 (ja) * | 2008-03-11 | 2012-08-01 | 日本放送協会 | 辞書修正装置、システム、およびコンピュータプログラム |
GB2471811B (en) * | 2008-05-09 | 2012-05-16 | Fujitsu Ltd | Speech recognition dictionary creating support device,computer readable medium storing processing program, and processing method |
JP5263875B2 (ja) * | 2008-09-16 | 2013-08-14 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 発話入力の音声認識のためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム |
JP4930486B2 (ja) * | 2008-10-10 | 2012-05-16 | 株式会社デンソー | 音声認識システム及びナビゲーション装置 |
JP5334178B2 (ja) * | 2009-01-21 | 2013-11-06 | クラリオン株式会社 | 音声認識装置およびデータ更新方法 |
EP2211336B1 (en) * | 2009-01-23 | 2014-10-08 | Harman Becker Automotive Systems GmbH | Improved speech input using navigation information |
US8135506B2 (en) * | 2009-05-19 | 2012-03-13 | GM Global Technology Operations LLC | Methods and systems for providing vehicle information |
JP5697860B2 (ja) * | 2009-09-09 | 2015-04-08 | クラリオン株式会社 | 情報検索装置,情報検索方法及びナビゲーションシステム |
US20110184723A1 (en) * | 2010-01-25 | 2011-07-28 | Microsoft Corporation | Phonetic suggestion engine |
JP5218459B2 (ja) * | 2010-03-25 | 2013-06-26 | アイシン・エィ・ダブリュ株式会社 | 車両用情報端末及びプログラム |
DE102010040553A1 (de) * | 2010-09-10 | 2012-03-15 | Siemens Aktiengesellschaft | Spracherkennungsverfahren |
CN102411563B (zh) * | 2010-09-26 | 2015-06-17 | 阿里巴巴集团控股有限公司 | 一种识别目标词的方法、装置及系统 |
JP5491422B2 (ja) * | 2011-01-11 | 2014-05-14 | 日本電信電話株式会社 | 情報検索装置、情報検索方法、及び情報検索プログラム |
EP2695840B1 (en) * | 2011-04-04 | 2016-05-11 | Mitsubishi Electric Corporation | Destination floor registration device for elevator |
KR20120117148A (ko) * | 2011-04-14 | 2012-10-24 | 현대자동차주식회사 | 음성 명령어 처리 장치 및 그 방법 |
US9348479B2 (en) | 2011-12-08 | 2016-05-24 | Microsoft Technology Licensing, Llc | Sentiment aware user interface customization |
US9378290B2 (en) | 2011-12-20 | 2016-06-28 | Microsoft Technology Licensing, Llc | Scenario-adaptive input method editor |
JP5927969B2 (ja) * | 2012-02-15 | 2016-06-01 | 株式会社デンソー | 音声認識システム |
CN110488991A (zh) | 2012-06-25 | 2019-11-22 | 微软技术许可有限责任公司 | 输入法编辑器应用平台 |
US8959109B2 (en) | 2012-08-06 | 2015-02-17 | Microsoft Corporation | Business intelligent in-document suggestions |
US9767156B2 (en) | 2012-08-30 | 2017-09-19 | Microsoft Technology Licensing, Llc | Feature-based candidate selection |
CN103065630B (zh) * | 2012-12-28 | 2015-01-07 | 科大讯飞股份有限公司 | 用户个性化信息语音识别方法及系统 |
DE112013006384T5 (de) * | 2013-01-09 | 2015-09-24 | Mitsubishi Electric Corporation | Spracherkennungsvorrichtung und Anzeigeverfahren |
US20140343949A1 (en) * | 2013-05-17 | 2014-11-20 | Fortemedia, Inc. | Smart microphone device |
US10020008B2 (en) | 2013-05-23 | 2018-07-10 | Knowles Electronics, Llc | Microphone and corresponding digital interface |
CN105379308B (zh) | 2013-05-23 | 2019-06-25 | 美商楼氏电子有限公司 | 麦克风、麦克风系统及操作麦克风的方法 |
US9711166B2 (en) | 2013-05-23 | 2017-07-18 | Knowles Electronics, Llc | Decimation synchronization in a microphone |
EP3030982A4 (en) | 2013-08-09 | 2016-08-03 | Microsoft Technology Licensing Llc | INPUT PROCESSORS EDITOR WITH LANGUAGE SUPPORT |
US9502028B2 (en) | 2013-10-18 | 2016-11-22 | Knowles Electronics, Llc | Acoustic activity detection apparatus and method |
US9147397B2 (en) | 2013-10-29 | 2015-09-29 | Knowles Electronics, Llc | VAD detection apparatus and method of operating the same |
CN110459214B (zh) * | 2014-01-20 | 2022-05-13 | 华为技术有限公司 | 语音交互方法及装置 |
RU2631975C2 (ru) | 2014-08-29 | 2017-09-29 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для обработки входных команд пользователя |
US20160078072A1 (en) * | 2014-09-11 | 2016-03-17 | Jeffrey D. Saffer | Term variant discernment system and method therefor |
WO2016118480A1 (en) | 2015-01-21 | 2016-07-28 | Knowles Electronics, Llc | Low power voice trigger for acoustic apparatus and method |
US10121472B2 (en) | 2015-02-13 | 2018-11-06 | Knowles Electronics, Llc | Audio buffer catch-up apparatus and method with two microphones |
WO2016151698A1 (ja) * | 2015-03-20 | 2016-09-29 | 株式会社 東芝 | 対話装置、方法及びプログラム |
US9478234B1 (en) | 2015-07-13 | 2016-10-25 | Knowles Electronics, Llc | Microphone apparatus and method with catch-up buffer |
US20170018268A1 (en) * | 2015-07-14 | 2017-01-19 | Nuance Communications, Inc. | Systems and methods for updating a language model based on user input |
US9683862B2 (en) * | 2015-08-24 | 2017-06-20 | International Business Machines Corporation | Internationalization during navigation |
CN105224520B (zh) * | 2015-09-28 | 2018-03-13 | 北京信息科技大学 | 一种中文专利文献术语自动识别方法 |
US10134388B1 (en) * | 2015-12-23 | 2018-11-20 | Amazon Technologies, Inc. | Word generation for speech recognition |
CN107102990A (zh) * | 2016-02-19 | 2017-08-29 | 株式会社东芝 | 对语音进行翻译的方法和装置 |
JP6772734B2 (ja) * | 2016-09-30 | 2020-10-21 | 株式会社リコー | 言語処理システム、言語処理装置、言語処理プログラム及び言語処理方法 |
JP6821393B2 (ja) * | 2016-10-31 | 2021-01-27 | パナソニック株式会社 | 辞書修正方法、辞書修正プログラム、音声処理装置及びロボット |
US11087745B2 (en) * | 2016-12-20 | 2021-08-10 | Nippon Telegraph And Telephone Corporation | Speech recognition results re-ranking device, speech recognition results re-ranking method, and program |
JP6833203B2 (ja) * | 2017-02-15 | 2021-02-24 | フォルシアクラリオン・エレクトロニクス株式会社 | 音声認識システム、音声認識サーバ、端末装置、及び語句管理方法 |
JP6805431B2 (ja) * | 2017-04-12 | 2020-12-23 | 株式会社シーイーシー | 音声認識装置 |
US10446136B2 (en) * | 2017-05-11 | 2019-10-15 | Ants Technology (Hk) Limited | Accent invariant speech recognition |
JP6896335B2 (ja) * | 2017-05-30 | 2021-06-30 | アルパイン株式会社 | 音声認識装置および音声認識方法 |
JP2019056954A (ja) * | 2017-09-19 | 2019-04-11 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
JP6711343B2 (ja) * | 2017-12-05 | 2020-06-17 | カシオ計算機株式会社 | 音声処理装置、音声処理方法及びプログラム |
CN110019735B (zh) * | 2017-12-29 | 2023-06-23 | Tcl科技集团股份有限公司 | 一种语句匹配方法、存储介质及终端设备 |
CN111727473A (zh) * | 2018-02-22 | 2020-09-29 | 索尼公司 | 信息处理装置、信息处理方法和程序 |
JP2019191646A (ja) * | 2018-04-18 | 2019-10-31 | 株式会社東芝 | 登録語管理装置、音声対話システム、登録語管理方法およびプログラム |
KR102472010B1 (ko) * | 2018-05-04 | 2022-11-30 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 기능 실행 방법 |
JP7124442B2 (ja) * | 2018-05-23 | 2022-08-24 | 富士電機株式会社 | システム、方法、及びプログラム |
JP7202938B2 (ja) * | 2019-03-20 | 2023-01-12 | Tvs Regza株式会社 | 番組名検索支援装置、及び、番組名検索支援方法 |
JP7347990B2 (ja) * | 2019-08-16 | 2023-09-20 | 株式会社日本レカム | 音声認識による自動翻訳機の人工知能による自動アップデートとそのアップデート配信及び情報システム |
KR20210052958A (ko) * | 2019-11-01 | 2021-05-11 | 엘지전자 주식회사 | 인공 지능 서버 |
US11557288B2 (en) * | 2020-04-10 | 2023-01-17 | International Business Machines Corporation | Hindrance speech portion detection using time stamps |
CN111554298B (zh) * | 2020-05-18 | 2023-03-28 | 阿波罗智联(北京)科技有限公司 | 语音交互方法、语音交互设备和电子设备 |
JP7241142B1 (ja) | 2021-09-27 | 2023-03-16 | Tvs Regza株式会社 | 受信装置および選局システム |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6393399B1 (en) * | 1998-09-30 | 2002-05-21 | Scansoft, Inc. | Compound word recognition |
US6208971B1 (en) * | 1998-10-30 | 2001-03-27 | Apple Computer, Inc. | Method and apparatus for command recognition using data-driven semantic inference |
US6374224B1 (en) * | 1999-03-10 | 2002-04-16 | Sony Corporation | Method and apparatus for style control in natural language generation |
US6836760B1 (en) * | 2000-09-29 | 2004-12-28 | Apple Computer, Inc. | Use of semantic inference and context-free grammar with speech recognition system |
US7251595B2 (en) * | 2001-03-22 | 2007-07-31 | Nippon Telegraph And Telephone Corporation | Dialogue-type information providing apparatus, dialogue-type information providing processing method, and program and recording medium for the same |
US7257529B2 (en) * | 2001-09-10 | 2007-08-14 | Intel Corporation | Apparatus and method for an automated grammar file expansion tool |
US7222073B2 (en) * | 2001-10-24 | 2007-05-22 | Agiletv Corporation | System and method for speech activated navigation |
US7103542B2 (en) * | 2001-12-14 | 2006-09-05 | Ben Franklin Patent Holding Llc | Automatically improving a voice recognition system |
US20030120493A1 (en) * | 2001-12-21 | 2003-06-26 | Gupta Sunil K. | Method and system for updating and customizing recognition vocabulary |
JP2005519411A (ja) * | 2002-03-05 | 2005-06-30 | シーメンス メディカル ソルーションズ ヘルス サーヴィシズ コーポレイション | 動的辞書及び用語蓄積システム |
JP3892338B2 (ja) * | 2002-05-08 | 2007-03-14 | 松下電器産業株式会社 | 単語辞書登録装置および単語登録用プログラム |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7693720B2 (en) * | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
JP3980449B2 (ja) * | 2002-08-28 | 2007-09-26 | 本田技研工業株式会社 | クライアント/サーバ型車両情報通信システム |
JP4282354B2 (ja) * | 2003-03-27 | 2009-06-17 | クラリオン株式会社 | 音声認識装置 |
JP4236502B2 (ja) * | 2003-04-03 | 2009-03-11 | 三菱電機株式会社 | 音声認識装置 |
US20070112554A1 (en) * | 2003-05-14 | 2007-05-17 | Goradia Gautam D | System of interactive dictionary |
JP2005043461A (ja) * | 2003-07-23 | 2005-02-17 | Canon Inc | 音声認識方法及び音声認識装置 |
JP2005148151A (ja) * | 2003-11-11 | 2005-06-09 | Mitsubishi Electric Corp | 音声操作装置 |
JP4478925B2 (ja) | 2003-12-01 | 2010-06-09 | 株式会社国際電気通信基礎技術研究所 | 音声認識結果の信頼度検証装置、コンピュータプログラム、及びコンピュータ |
JP4515130B2 (ja) * | 2004-03-30 | 2010-07-28 | クラリオン株式会社 | テレマティクスシステムおよび車載用ナビゲーション装置 |
KR100679042B1 (ko) * | 2004-10-27 | 2007-02-06 | 삼성전자주식회사 | 음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템 |
-
2006
- 2006-10-27 JP JP2006293098A patent/JP4816409B2/ja not_active Expired - Fee Related
- 2006-12-28 US US11/646,594 patent/US9020819B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110551917B (zh) * | 2019-09-29 | 2021-07-09 | 广东和润新材料股份有限公司 | 一种高导电耐腐蚀铜带及其制备方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2007213005A (ja) | 2007-08-23 |
US9020819B2 (en) | 2015-04-28 |
US20070162281A1 (en) | 2007-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4816409B2 (ja) | 認識辞書システムおよびその更新方法 | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
US6839667B2 (en) | Method of speech recognition by presenting N-best word candidates | |
JP4221379B2 (ja) | 音声特性に基づく電話発信者の自動識別 | |
JP5334178B2 (ja) | 音声認識装置およびデータ更新方法 | |
US7805304B2 (en) | Speech recognition apparatus for determining final word from recognition candidate word sequence corresponding to voice data | |
EP1936606B1 (en) | Multi-stage speech recognition | |
KR101247578B1 (ko) | 자동 음성 인식 음향 모델들의 적응 | |
RU2393549C2 (ru) | Способ и устройство для распознавания речи | |
EP2048655A1 (en) | Context sensitive multi-stage speech recognition | |
JPWO2005122144A1 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
JP5824829B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
US8285542B2 (en) | Adapting a language model to accommodate inputs not found in a directory assistance listing | |
US20130289987A1 (en) | Negative Example (Anti-Word) Based Performance Improvement For Speech Recognition | |
US8428241B2 (en) | Semi-supervised training of destination map for call handling applications | |
US20040199385A1 (en) | Methods and apparatus for reducing spurious insertions in speech recognition | |
KR20070060581A (ko) | 화자적응 방법 및 장치 | |
US6963834B2 (en) | Method of speech recognition using empirically determined word candidates | |
JP2018045127A (ja) | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 | |
US20080065371A1 (en) | Conversation System and Conversation Software | |
JP3825526B2 (ja) | 音声認識装置 | |
US20020184019A1 (en) | Method of using empirical substitution data in speech recognition | |
JP2013178384A (ja) | 音声認識用辞書登録システム、音声認識システム、音声認識サービスシステム、方法およびプログラム | |
JP4986301B2 (ja) | 音声認識処理機能を用いたコンテンツ検索装置、プログラム及び方法 | |
EP1688914A1 (en) | Method and apparatus relating to searching of spoken audio data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090330 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20101001 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20101028 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110408 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110517 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110531 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20110616 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110802 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110815 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140909 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |