JP2000122687A - 言語モデルを更新する方法 - Google Patents
言語モデルを更新する方法Info
- Publication number
- JP2000122687A JP2000122687A JP11286143A JP28614399A JP2000122687A JP 2000122687 A JP2000122687 A JP 2000122687A JP 11286143 A JP11286143 A JP 11286143A JP 28614399 A JP28614399 A JP 28614399A JP 2000122687 A JP2000122687 A JP 2000122687A
- Authority
- JP
- Japan
- Prior art keywords
- vocabulary
- word
- base form
- words
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012937 correction Methods 0.000 claims abstract description 22
- 230000003993 interaction Effects 0.000 claims abstract description 5
- 230000002452 interceptive effect Effects 0.000 abstract 1
- 238000011156 evaluation Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
ザ対話ダイアログ・ボックスを実質上呼び出すことな
く、音声アプリケーションの音声認識エンジンにおける
言語モデルを更新する新規な自明でない方法を提供す
る。 【解決手段】 訂正セッション中に音声アプリケーショ
ンにおける言語モデルを更新する方法は、元の口述テキ
ストの音声と置換テキストの音声を互いに音響的に比較
する段階と、音響的比較の結果が、新しい音声が編集以
外の誤認識エラーの訂正を表すことを示すのに十分なほ
ど近い場合に、言語モデルを訂正で更新し、それにより
言語モデルをユーザの対話なしに更新できるようにする
段階とを含む。更新段階は、音声アプリケーションの語
彙に新しい単語を追加する段階を含むことができる。
Description
システムに関し、より詳細には、音声誤認識を訂正する
セッションにおいて音声アプリケーションの音声認識エ
ンジンにおける言語モデルを自動的に更新する方法に関
する。
は、ユーザの生産性を高める重要な方法を提供する。1
つの改良スタイルは、訂正ダイアログとの対話を省略
し、パワー・ユーザに口述テキストを直接変更できる機
能を提供することである。システム・モニタが、訂正と
して処理するために音声エンジンに送るべき訂正はどれ
か、システムが無視すべき編集はどれかを変更し決定し
ない限り、ユーザは、エンジンが訂正情報を受け取るこ
とによる認識精度の連続的改良の利益が得られない。
口述システムにおける現在のどの訂正方法よりも優れた
利点を有し、音声誤認識を訂正するセッション中に、ユ
ーザ対話ダイアログ・ボックスを実質上呼び出すことな
く、音声アプリケーションの音声認識エンジンにおける
言語モデルを更新する新規な自明でない方法を提供する
ことにある。
訂正セッション中に音声アプリケーションにおける言語
モデルを更新する方法は、元の口述テキストの音声と置
換テキストの音声とを自動的に互いに音響的に比較する
段階と、音響的な比較の結果が、新しい音声が編集以外
の誤認識エラーの訂正を表すことを示すのに十分なほど
近い場合に、言語モデルを訂正により自動的に更新し、
それにより言語モデルをユーザの対話なしに更新できる
ようにする段階とを含む。
の口述テキストの新しいテキストによる置換を検出する
段階と、元の口述音声と比較段階で使用する新しい音声
を保存する段階とを含むことができる。
ションの語彙に加える段階を含むことができる。
単語が語彙外かどうかを判定する段階と、単語が語彙外
でない場合に、比較段階に語彙中の既存のベースフォー
ムを利用する段階とを含むことができる。
単語が語彙外かどうかを判定する段階と、いずれかの単
語が語彙外の場合に、その単語のベースフォームが語彙
外で記憶されているかどうかを判定する段階と、その単
語のベースフォームが語彙外で記憶されている場合に、
比較段階に語彙外のベースフォームを利用する段階とを
含むことができる。
単語が語彙外かどうかを判定する段階と、いずれかの単
語が語彙外の場合に、その単語のベースフォームが語彙
外で記憶されているかどうかを判定する段階と、その単
語のベースフォームが語彙外で記憶されていない場合
に、その単語の新しいベースフォームの生成を延期する
段階とを含むことができる。
かの単語が語彙外かどうかを判定する段階と、いずれか
の単語が語彙に含まれていない場合に、その単語のベー
スフォームが語彙外で記憶されているかどうかを判定す
る段階と、その単語のベースフォームが語彙外で記憶さ
れていない場合に、その単語の新しいベースフォームを
生成する段階と、比較段階に新しいベースフォームを利
用する段階とを含むことができる。
かの単語が語彙外かどうかを判定する段階と、いずれか
の単語が語彙外の場合に、その単語のベースフォームが
語彙外で記憶されているかどうかを判定する段階と、そ
の単語のベースフォームが語彙外で記憶されている場合
に、比較段階に語彙外のベースフォームを利用する段階
と、その単語のベースフォームが語彙外で記憶されてい
ない場合に、その単語の新しいベースフォームの生成を
延期する段階とを含むことができる。
かの単語が語彙外かどうかを判定する段階と、いずれか
の単語が語彙外の場合に、その単語のベースフォームが
語彙外で記憶されているかどうかを判定する段階と、そ
の単語のベースフォームが語彙外で記憶されている場合
に、比較段階に語彙外のベースフォームを利用する段階
と、その単語のベースフォームが語彙外で記憶されてい
ない場合に、その単語の新しいベースフォームを生成す
る段階と、比較段階に新しいベースフォームを利用する
段階とを含むことができる。
ォームと元の口述単語の置換をそれぞれ、たとえばDM
CHECKユーティリティを用いて比較する段階を含む
ことができる。
ーションにおいて言語モデルを自動的に更新する方法
を、図1のフローチャート10に示す。開始ブロック1
1から始まって、話し手は、ブロック12の段階に従っ
て音声アプリケーションによる音声認識セッションを開
始する。
元の口述テキストが口述によって置換されたかどうかを
検出する。そうである場合、方法は、経路13に分岐し
てブロック16の段階に進み、元の音声と置換音声を比
較する。ブロック18の段階で、システムは、元の音声
と置換音声の間に近い音響的一致が存在するかどうかを
判定する。近い一致が存在する場合、方法は、経路19
に分岐してブロック20に進み、それにより言語モデル
が訂正で更新される。言語モデルは単語パターンに関す
る統計情報からなることを理解されたい。したがって、
言語モデルの訂正は、音響的訂正ではなく、統計的訂正
である。次に、経路17は、ブロック22の段階に進
み、評価のために利用可能な入力がまだあるかどうかを
検出する。近い一致が存在しない場合、方法は、経路2
1に分岐してブロック22の段階に直接進み、評価のた
めに利用可能な他の入力があるかどうかを検出する。
合、方法は、経路23に戻り、ブロック12の段階に進
む。そうでない場合、方法は、経路25に分岐してブロ
ック24に進み、それにより方法が終了する。
述テキストが口述により置換されていなかった場合、方
法は、経路15に分岐して、ブロック26に進み、図2
に関して説明する方法を使用する。次に、経路27は、
前述のように判断ブロック22に進む。
ョンにおいて言語モデルを自動的に更新する代替方法
を、図2のフローチャート30に示す。開始ブロック3
1から始まって、話し手は、ブロック32の段階に従っ
て音声アプリケーションによる音声認識セッションを開
始する。判断ブロック34の段階で、システムは、ま
ず、元の口述テキストが新しいテキストで置換されたか
どうかを検出する。元の口述テキストが新しいテキスト
で置換されていない場合、方法は、経路35に分岐して
ブロック58の段階に進み、評価のために利用可能な入
力がまだあるかどうかを検出する。評価のために利用可
能な入力がまだある場合、方法は、経路59に分岐しブ
ロック32の段階に進む。そうでない場合、方法は、経
路61に分岐してブロック60の段階に進み、それによ
り方法が終了する。
が新しいテキストで置換されている場合、方法は、経路
33に分岐してブロック36の段階に進み、元のテキス
トのテキストおよび音声を保存し、置換テキストを保存
し、可能な場合は置換音声を保存する。次の判断ブロッ
ク38の段階で、置換テキストの発音が使用可能かどう
かを調べる。可能な場合、方法は、経路39に分岐して
ブロック40の段階に進み、それにより、元の音声が、
置換テキストのベースフォームと比較される。置換テキ
ストのベースフォームが使用可能でない場合は、置換テ
キストが語彙外であることを意味し、方法は、経路47
に分岐してブロック50の段階に進み、それにより、置
換テキストのベースフォームが生成される。ベースフォ
ームは、テキスト音声エンジンを使用することにより、
または音声認識エンジンのユーザ・トレーニングにより
生成することができる。次に、方法は、前述のようにブ
ロック40の段階に進む。
ク42の段階により、元の音声と置換テキストのベース
フォームの間に近い音響的一致があるかどうか判定す
る。近い一致がある場合、方法は、経路41に分岐して
ブロック44の段階に進み、それにより、言語モデルが
訂正で更新される。次の経路45から、前述のようにブ
ロック58の段階に進む。近い一致が存在しない場合、
方法は、前述のように、経路43に分岐してブロック5
8の段階に直接進む。
の事項を開示する。
ションにおける言語モデルを更新する方法であって、元
の口述テキストの音声と置換テキストの音声を互いに音
響的に比較する比較段階と、前記比較の結果が、前記置
換テキストの音声が編集以外の誤認識エラーの訂正を表
すことを示すのに十分なほど近い場合に、前記言語モデ
ルを訂正で更新し、それにより前記言語モデルをユーザ
の対話なしに更新できるようにする更新段階とを含む方
法。 (2)前記比較段階の前に、前記元の口述テキストの新
しいテキストによる置換を検出する段階と、前記比較段
階で使用するために前記元の口述テキストの音声と前記
新しいテキストの音声を保存する段階とをさらに含む上
記(1)に記載の方法。 (3)前記更新段階が、新しい単語を前記音声アプリケ
ーションの語彙に加える段階を含む上記(1)に記載の
方法。 (4)前記比較段階が、前記新しいテキストのいずれか
の単語が語彙外かどうかを判定する段階と、前記単語が
語彙外でない場合に、前記比較段階に前記語彙中の既存
のベースフォームを利用する段階とを含む上記(1)に
記載の方法。 (5)前記比較段階が、前記新しいテキストのいずれか
の単語が語彙外かどうかを判定する段階と、前記単語が
語彙外の場合に、前記単語のベースフォームが前記語彙
外で記憶されているかどうかを判定する段階と、前記単
語の前記ベースフォームが、前記語彙外で記憶されてい
る場合に、前記比較段階に前記語彙外のベースフォーム
を利用する段階とを含む上記(1)に記載の方法。 (6)前記更新段階が、前記単語を前記語彙に加える段
階を含む上記(5)に記載の方法。 (7)前記比較段階が、前記新しいテキストのいずれか
の単語が語彙外かどうかを判定する段階と、前記いずれ
かの単語が語彙外の場合に、前記いずれかの単語のベー
スフォームが前記語彙外で記憶されているかどうかを判
定する段階と、前記いずれかの単語の前記ベースフォー
ムが前記語彙外で記憶されていない場合に、前記いずれ
かの単語の新しいベースフォームの生成を延期する段階
とを含む上記(1)に記載の方法。 (8)前記比較段階が、前記新しいテキストのいずれか
の単語が語彙外かどうかを判定する段階と、前記いずれ
かの単語が語彙外の場合に、前記いずれかの単語のベー
スフォームが前記語彙外で記憶されているかどうかを判
定する段階と、前記いずれかの単語の前記ベースフォー
ムが前記語彙外で記憶されていない場合に、前記いずれ
かの単語の新しいベースフォームを生成する段階と、前
記比較段階に前記新しいベースフォームを利用する段階
とを含む上記(1)に記載の方法。 (9)前記更新段階が、前記いずれかの単語を前記語彙
に追加する段階を含む、上記(8)に記載の方法。 (10)前記比較段階が、前記新しいテキストのいずれ
かの単語が語彙外かどうかを判定する段階と、前記いず
れかの単語が語彙外の場合に、前記いずれかの単語のベ
ースフォームが前記語彙外で記憶されているかどうかを
判定する段階と、前記いずれかの単語の前記ベースフォ
ームが前記語彙外で記憶されている場合に、前記比較段
階に前記語彙外のベースフォームを利用する段階と、前
記いずれかの単語の前記ベースフォームが前記語彙外で
記憶されていない場合に、前記いずれかの単語の新しい
ベースフォームの生成を延期する段階とを含む上記
(1)に記載の方法。 (11)前記比較段階が、前記新しいテキストのいずれ
かの単語が語彙外かどうかを判定する段階と、前記いず
れかの単語が語彙に含まれない場合に、前記いずれかの
単語のベースフォームが前記語彙外で記憶されているか
どうかを判定する段階と、前記いずれかの単語の前記ベ
ースフォームが前記語彙外で記憶されている場合に、前
記比較段階に前記語彙外のベースフォームを利用する段
階と、前記いずれかの単語の前記ベースフォームが前記
語彙外で記憶されていない場合に、前記いずれかの単語
の新しいベースフォームを生成する段階と、前記比較段
階に前記新しいベースフォームを利用する段階とを含む
上記(1)に記載の方法。 (12)前記更新段階が、前記いずれかの単語を前記語
彙に加える段階を含む上記(11)に記載の方法。 (13)前記比較段階が、元の口述単語のベースフォー
ムと前記元の口述単語の置換のベースフォームをそれぞ
れ比較する段階を含む上記(1)に記載の方法。
成の一態様によるプログラム制御の流れを示すフローチ
ャートである。
得られるときの本発明の装置のもう1つの態様によるプ
ログラム制御の流れを示すフローチャートである。
Claims (13)
- 【請求項1】訂正セッション中に音声アプリケーション
における言語モデルを更新する方法であって、 元の口述テキストの音声と置換テキストの音声を互いに
音響的に比較する比較段階と、 前記比較の結果が、前記置換テキストの音声が編集以外
の誤認識エラーの訂正を表すことを示すのに十分なほど
近い場合に、前記言語モデルを訂正で更新し、それによ
り前記言語モデルをユーザの対話なしに更新できるよう
にする更新段階とを含む方法。 - 【請求項2】前記比較段階の前に、 前記元の口述テキストの新しいテキストによる置換を検
出する段階と、 前記比較段階で使用するために前記元の口述テキストの
音声と前記新しいテキストの音声を保存する段階とをさ
らに含む請求項1に記載の方法。 - 【請求項3】前記更新段階が、新しい単語を前記音声ア
プリケーションの語彙に加える段階を含む請求項1に記
載の方法。 - 【請求項4】前記比較段階が、 前記新しいテキストのいずれかの単語が語彙外かどうか
を判定する段階と、 前記単語が語彙外でない場合に、前記比較段階に前記語
彙中の既存のベースフォームを利用する段階とを含む請
求項1に記載の方法。 - 【請求項5】前記比較段階が、 前記新しいテキストのいずれかの単語が語彙外かどうか
を判定する段階と、 前記単語が語彙外の場合に、前記単語のベースフォーム
が前記語彙外で記憶されているかどうかを判定する段階
と、 前記単語の前記ベースフォームが、前記語彙外で記憶さ
れている場合に、前記比較段階に前記語彙外のベースフ
ォームを利用する段階とを含む請求項1に記載の方法。 - 【請求項6】前記更新段階が、前記単語を前記語彙に加
える段階を含む請求項5に記載の方法。 - 【請求項7】前記比較段階が、 前記新しいテキストのいずれかの単語が語彙外かどうか
を判定する段階と、 前記いずれかの単語が語彙外の場合に、前記いずれかの
単語のベースフォームが前記語彙外で記憶されているか
どうかを判定する段階と、 前記いずれかの単語の前記ベースフォームが前記語彙外
で記憶されていない場合に、前記いずれかの単語の新し
いベースフォームの生成を延期する段階とを含む請求項
1に記載の方法。 - 【請求項8】前記比較段階が、 前記新しいテキストのいずれかの単語が語彙外かどうか
を判定する段階と、 前記いずれかの単語が語彙外の場合に、前記いずれかの
単語のベースフォームが前記語彙外で記憶されているか
どうかを判定する段階と、 前記いずれかの単語の前記ベースフォームが前記語彙外
で記憶されていない場合に、前記いずれかの単語の新し
いベースフォームを生成する段階と、 前記比較段階に前記新しいベースフォームを利用する段
階とを含む請求項1に記載の方法。 - 【請求項9】前記更新段階が、前記いずれかの単語を前
記語彙に追加する段階を含む、請求項8に記載の方法。 - 【請求項10】前記比較段階が、 前記新しいテキストのいずれかの単語が語彙外かどうか
を判定する段階と、 前記いずれかの単語が語彙外の場合に、前記いずれかの
単語のベースフォームが前記語彙外で記憶されているか
どうかを判定する段階と、 前記いずれかの単語の前記ベースフォームが前記語彙外
で記憶されている場合に、前記比較段階に前記語彙外の
ベースフォームを利用する段階と、 前記いずれかの単語の前記ベースフォームが前記語彙外
で記憶されていない場合に、前記いずれかの単語の新し
いベースフォームの生成を延期する段階とを含む請求項
1に記載の方法。 - 【請求項11】前記比較段階が、 前記新しいテキストのいずれかの単語が語彙外かどうか
を判定する段階と、 前記いずれかの単語が語彙に含まれない場合に、前記い
ずれかの単語のベースフォームが前記語彙外で記憶され
ているかどうかを判定する段階と、 前記いずれかの単語の前記ベースフォームが前記語彙外
で記憶されている場合に、前記比較段階に前記語彙外の
ベースフォームを利用する段階と、 前記いずれかの単語の前記ベースフォームが前記語彙外
で記憶されていない場合に、前記いずれかの単語の新し
いベースフォームを生成する段階と、 前記比較段階に前記新しいベースフォームを利用する段
階とを含む請求項1に記載の方法。 - 【請求項12】前記更新段階が、前記いずれかの単語を
前記語彙に加える段階を含む請求項11に記載の方法。 - 【請求項13】前記比較段階が、元の口述単語のベース
フォームと前記元の口述単語の置換のベースフォームを
それぞれ比較する段階を含む請求項1に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/174,873 US6138099A (en) | 1998-10-19 | 1998-10-19 | Automatically updating language models |
US09/174873 | 1998-10-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000122687A true JP2000122687A (ja) | 2000-04-28 |
JP3546774B2 JP3546774B2 (ja) | 2004-07-28 |
Family
ID=22637889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP28614399A Expired - Fee Related JP3546774B2 (ja) | 1998-10-19 | 1999-10-07 | 言語モデルを更新する方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US6138099A (ja) |
JP (1) | JP3546774B2 (ja) |
KR (1) | KR100321841B1 (ja) |
IL (1) | IL131712A (ja) |
MY (1) | MY115505A (ja) |
SG (1) | SG79284A1 (ja) |
TW (1) | TW440809B (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005208643A (ja) * | 2004-01-20 | 2005-08-04 | Microsoft Corp | ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法 |
CN113903342A (zh) * | 2021-10-29 | 2022-01-07 | 镁佳(北京)科技有限公司 | 一种语音识别纠错方法及装置 |
WO2022085296A1 (ja) * | 2020-10-19 | 2022-04-28 | ソニーグループ株式会社 | 情報処理装置及び情報処理方法、コンピュータプログラム、フォーマット変換装置、オーディオコンテンツ自動転記システム、学習済みモデル、並びに表示装置 |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6507816B2 (en) * | 1999-05-04 | 2003-01-14 | International Business Machines Corporation | Method and apparatus for evaluating the accuracy of a speech recognition system |
US6611802B2 (en) * | 1999-06-11 | 2003-08-26 | International Business Machines Corporation | Method and system for proofreading and correcting dictated text |
US6374214B1 (en) * | 1999-06-24 | 2002-04-16 | International Business Machines Corp. | Method and apparatus for excluding text phrases during re-dictation in a speech recognition system |
US6370503B1 (en) * | 1999-06-30 | 2002-04-09 | International Business Machines Corp. | Method and apparatus for improving speech recognition accuracy |
DE10033915B4 (de) * | 2000-07-05 | 2005-11-03 | Deutsche Telekom Ag | Testgerät für Sprachdialoge |
US6754627B2 (en) * | 2001-03-01 | 2004-06-22 | International Business Machines Corporation | Detecting speech recognition errors in an embedded speech recognition system |
US7505911B2 (en) | 2001-09-05 | 2009-03-17 | Roth Daniel L | Combined speech recognition and sound recording |
US7526431B2 (en) | 2001-09-05 | 2009-04-28 | Voice Signal Technologies, Inc. | Speech recognition using ambiguous or phone key spelling and/or filtering |
US7809574B2 (en) | 2001-09-05 | 2010-10-05 | Voice Signal Technologies Inc. | Word recognition using choice lists |
US7444286B2 (en) * | 2001-09-05 | 2008-10-28 | Roth Daniel L | Speech recognition using re-utterance recognition |
US7467089B2 (en) | 2001-09-05 | 2008-12-16 | Roth Daniel L | Combined speech and handwriting recognition |
US7124080B2 (en) * | 2001-11-13 | 2006-10-17 | Microsoft Corporation | Method and apparatus for adapting a class entity dictionary used with language models |
US7292976B1 (en) * | 2003-05-29 | 2007-11-06 | At&T Corp. | Active learning process for spoken dialog systems |
WO2005026958A1 (en) * | 2003-09-11 | 2005-03-24 | Voice Signal Technologies, Inc. | Method and apparatus for back-up of customized application information |
US7848928B2 (en) * | 2005-08-10 | 2010-12-07 | Nuance Communications, Inc. | Overriding default speech processing behavior using a default focus receiver |
US7756708B2 (en) * | 2006-04-03 | 2010-07-13 | Google Inc. | Automatic language model update |
US7805305B2 (en) * | 2006-10-12 | 2010-09-28 | Nuance Communications, Inc. | Enhancement to Viterbi speech processing algorithm for hybrid speech models that conserves memory |
JP4867654B2 (ja) * | 2006-12-28 | 2012-02-01 | 日産自動車株式会社 | 音声認識装置、および音声認識方法 |
JP5471106B2 (ja) * | 2009-07-16 | 2014-04-16 | 独立行政法人情報通信研究機構 | 音声翻訳システム、辞書サーバ装置、およびプログラム |
US9275640B2 (en) * | 2009-11-24 | 2016-03-01 | Nexidia Inc. | Augmented characterization for speech recognition |
EP3089159B1 (en) * | 2015-04-28 | 2019-08-28 | Google LLC | Correcting voice recognition using selective re-speak |
US10896681B2 (en) | 2015-12-29 | 2021-01-19 | Google Llc | Speech recognition with selective use of dynamic language models |
CN110870004B (zh) * | 2017-07-10 | 2023-09-12 | Scti控股公司 | 基于音节的自动语音识别 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6064959A (en) * | 1997-03-28 | 2000-05-16 | Dragon Systems, Inc. | Error correction in speech recognition |
GB2303955B (en) * | 1996-09-24 | 1997-05-14 | Allvoice Computing Plc | Data processing method and apparatus |
US5864805A (en) * | 1996-12-20 | 1999-01-26 | International Business Machines Corporation | Method and apparatus for error correction in a continuous dictation system |
US6006183A (en) * | 1997-12-16 | 1999-12-21 | International Business Machines Corp. | Speech recognition confidence level display |
US5970451A (en) * | 1998-04-14 | 1999-10-19 | International Business Machines Corporation | Method for correcting frequently misrecognized words or command in speech application |
-
1998
- 1998-10-19 US US09/174,873 patent/US6138099A/en not_active Expired - Lifetime
-
1999
- 1999-08-18 TW TW088114074A patent/TW440809B/zh not_active IP Right Cessation
- 1999-09-02 IL IL13171299A patent/IL131712A/en not_active IP Right Cessation
- 1999-09-13 KR KR1019990038958A patent/KR100321841B1/ko not_active IP Right Cessation
- 1999-09-29 MY MYPI99004204A patent/MY115505A/en unknown
- 1999-10-07 JP JP28614399A patent/JP3546774B2/ja not_active Expired - Fee Related
- 1999-10-12 SG SG9905086A patent/SG79284A1/en unknown
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005208643A (ja) * | 2004-01-20 | 2005-08-04 | Microsoft Corp | ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法 |
JP4657736B2 (ja) * | 2004-01-20 | 2011-03-23 | マイクロソフト コーポレーション | ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法 |
US8019602B2 (en) | 2004-01-20 | 2011-09-13 | Microsoft Corporation | Automatic speech recognition learning using user corrections |
WO2022085296A1 (ja) * | 2020-10-19 | 2022-04-28 | ソニーグループ株式会社 | 情報処理装置及び情報処理方法、コンピュータプログラム、フォーマット変換装置、オーディオコンテンツ自動転記システム、学習済みモデル、並びに表示装置 |
CN113903342A (zh) * | 2021-10-29 | 2022-01-07 | 镁佳(北京)科技有限公司 | 一种语音识别纠错方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP3546774B2 (ja) | 2004-07-28 |
SG79284A1 (en) | 2001-03-20 |
US6138099A (en) | 2000-10-24 |
TW440809B (en) | 2001-06-16 |
KR100321841B1 (ko) | 2002-02-02 |
IL131712A (en) | 2002-09-12 |
MY115505A (en) | 2003-06-30 |
IL131712A0 (en) | 2001-03-19 |
KR20000028660A (ko) | 2000-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000122687A (ja) | 言語モデルを更新する方法 | |
CN109584860B (zh) | 一种语音唤醒词定义方法和系统 | |
Raux et al. | Using task-oriented spoken dialogue systems for language learning: potential, practical applications and challenges | |
US9412364B2 (en) | Enhanced accuracy for speech recognition grammars | |
CN106710585B (zh) | 语音交互过程中的多音字播报方法及系统 | |
EP1050872A3 (en) | Method and system for selecting recognized words when correcting recognized speech | |
JP2005208643A (ja) | ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法 | |
WO1998013822A1 (en) | Method of and system for recognizing a spoken text | |
US20220284882A1 (en) | Instantaneous Learning in Text-To-Speech During Dialog | |
WO1999059135A3 (de) | Anordnung und verfahren zur erkennung eines vorgegebenen wortschatzes in gesprochener sprache durch einen rechner | |
CN106981289A (zh) | 一种识别模型训练方法及系统以及智能终端 | |
JP2002215187A (ja) | 音声認識方法及びその装置 | |
JP2002062891A (ja) | 音素割当て方法 | |
JP2002091472A (ja) | 音声言語の韻律表示装置、再生装置、類似度判定装置、音声言語処理装置、および記録媒体 | |
US6157910A (en) | Deferred correction file transfer for updating a speech file by creating a file log of corrections | |
US20060136195A1 (en) | Text grouping for disambiguation in a speech application | |
JP4798039B2 (ja) | 音声対話装置および方法 | |
WO2021059968A1 (ja) | 音声認識装置、音声認識方法、およびプログラム | |
CA2597826C (en) | Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance | |
JP3006496B2 (ja) | 音声認識装置 | |
Komatani et al. | Restoring incorrectly segmented keywords and turn-taking caused by short pauses | |
US8024191B2 (en) | System and method of word lattice augmentation using a pre/post vocalic consonant distinction | |
JP2002091967A (ja) | 言語モデル作成装置および言語モデル作成プログラムを記録した記録媒体 | |
JP2002082691A (ja) | 発声内に含まれる会社名の自動認識方法 | |
JPH10143190A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040128 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20040302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040330 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20040330 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040405 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |