JP2000122687A - 言語モデルを更新する方法 - Google Patents

言語モデルを更新する方法

Info

Publication number
JP2000122687A
JP2000122687A JP11286143A JP28614399A JP2000122687A JP 2000122687 A JP2000122687 A JP 2000122687A JP 11286143 A JP11286143 A JP 11286143A JP 28614399 A JP28614399 A JP 28614399A JP 2000122687 A JP2000122687 A JP 2000122687A
Authority
JP
Japan
Prior art keywords
vocabulary
word
base form
words
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11286143A
Other languages
English (en)
Other versions
JP3546774B2 (ja
Inventor
R Lewis James
ジェームズ・アール・ルイス
E Smith Maria
マリア・イー・スミス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2000122687A publication Critical patent/JP2000122687A/ja
Application granted granted Critical
Publication of JP3546774B2 publication Critical patent/JP3546774B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 音声誤認識を訂正するセッション中に、ユー
ザ対話ダイアログ・ボックスを実質上呼び出すことな
く、音声アプリケーションの音声認識エンジンにおける
言語モデルを更新する新規な自明でない方法を提供す
る。 【解決手段】 訂正セッション中に音声アプリケーショ
ンにおける言語モデルを更新する方法は、元の口述テキ
ストの音声と置換テキストの音声を互いに音響的に比較
する段階と、音響的比較の結果が、新しい音声が編集以
外の誤認識エラーの訂正を表すことを示すのに十分なほ
ど近い場合に、言語モデルを訂正で更新し、それにより
言語モデルをユーザの対話なしに更新できるようにする
段階とを含む。更新段階は、音声アプリケーションの語
彙に新しい単語を追加する段階を含むことができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般に、音声口述
システムに関し、より詳細には、音声誤認識を訂正する
セッションにおいて音声アプリケーションの音声認識エ
ンジンにおける言語モデルを自動的に更新する方法に関
する。
【0002】
【従来の技術】音声口述システムにおける訂正の改良
は、ユーザの生産性を高める重要な方法を提供する。1
つの改良スタイルは、訂正ダイアログとの対話を省略
し、パワー・ユーザに口述テキストを直接変更できる機
能を提供することである。システム・モニタが、訂正と
して処理するために音声エンジンに送るべき訂正はどれ
か、システムが無視すべき編集はどれかを変更し決定し
ない限り、ユーザは、エンジンが訂正情報を受け取るこ
とによる認識精度の連続的改良の利益が得られない。
【0003】
【発明が解決しようとする課題】本発明の目的は、音声
口述システムにおける現在のどの訂正方法よりも優れた
利点を有し、音声誤認識を訂正するセッション中に、ユ
ーザ対話ダイアログ・ボックスを実質上呼び出すことな
く、音声アプリケーションの音声認識エンジンにおける
言語モデルを更新する新規な自明でない方法を提供する
ことにある。
【0004】
【課題を解決するための手段】本発明の構成によれば、
訂正セッション中に音声アプリケーションにおける言語
モデルを更新する方法は、元の口述テキストの音声と置
換テキストの音声とを自動的に互いに音響的に比較する
段階と、音響的な比較の結果が、新しい音声が編集以外
の誤認識エラーの訂正を表すことを示すのに十分なほど
近い場合に、言語モデルを訂正により自動的に更新し、
それにより言語モデルをユーザの対話なしに更新できる
ようにする段階とを含む。
【0005】この方法は、さらに、比較段階の前に、元
の口述テキストの新しいテキストによる置換を検出する
段階と、元の口述音声と比較段階で使用する新しい音声
を保存する段階とを含むことができる。
【0006】更新段階は、新しい単語を音声アプリケー
ションの語彙に加える段階を含むことができる。
【0007】比較段階は、新しいテキストのいずれかの
単語が語彙外かどうかを判定する段階と、単語が語彙外
でない場合に、比較段階に語彙中の既存のベースフォー
ムを利用する段階とを含むことができる。
【0008】比較段階は、新しいテキストのいずれかの
単語が語彙外かどうかを判定する段階と、いずれかの単
語が語彙外の場合に、その単語のベースフォームが語彙
外で記憶されているかどうかを判定する段階と、その単
語のベースフォームが語彙外で記憶されている場合に、
比較段階に語彙外のベースフォームを利用する段階とを
含むことができる。
【0009】比較段階は、新しいテキストのいずれかの
単語が語彙外かどうかを判定する段階と、いずれかの単
語が語彙外の場合に、その単語のベースフォームが語彙
外で記憶されているかどうかを判定する段階と、その単
語のベースフォームが語彙外で記憶されていない場合
に、その単語の新しいベースフォームの生成を延期する
段階とを含むことができる。
【0010】比較段階はまた、新しいテキストのいずれ
かの単語が語彙外かどうかを判定する段階と、いずれか
の単語が語彙に含まれていない場合に、その単語のベー
スフォームが語彙外で記憶されているかどうかを判定す
る段階と、その単語のベースフォームが語彙外で記憶さ
れていない場合に、その単語の新しいベースフォームを
生成する段階と、比較段階に新しいベースフォームを利
用する段階とを含むことができる。
【0011】比較段階はまた、新しいテキストのいずれ
かの単語が語彙外かどうかを判定する段階と、いずれか
の単語が語彙外の場合に、その単語のベースフォームが
語彙外で記憶されているかどうかを判定する段階と、そ
の単語のベースフォームが語彙外で記憶されている場合
に、比較段階に語彙外のベースフォームを利用する段階
と、その単語のベースフォームが語彙外で記憶されてい
ない場合に、その単語の新しいベースフォームの生成を
延期する段階とを含むことができる。
【0012】比較段階はまた、新しいテキストのいずれ
かの単語が語彙外かどうかを判定する段階と、いずれか
の単語が語彙外の場合に、その単語のベースフォームが
語彙外で記憶されているかどうかを判定する段階と、そ
の単語のベースフォームが語彙外で記憶されている場合
に、比較段階に語彙外のベースフォームを利用する段階
と、その単語のベースフォームが語彙外で記憶されてい
ない場合に、その単語の新しいベースフォームを生成す
る段階と、比較段階に新しいベースフォームを利用する
段階とを含むことができる。
【0013】比較段階はまた、元の口述単語のベースフ
ォームと元の口述単語の置換をそれぞれ、たとえばDM
CHECKユーティリティを用いて比較する段階を含む
ことができる。
【0014】
【発明の実施の形態】本発明の構成による音声アプリケ
ーションにおいて言語モデルを自動的に更新する方法
を、図1のフローチャート10に示す。開始ブロック1
1から始まって、話し手は、ブロック12の段階に従っ
て音声アプリケーションによる音声認識セッションを開
始する。
【0015】ブロック14の段階で、システムはまず、
元の口述テキストが口述によって置換されたかどうかを
検出する。そうである場合、方法は、経路13に分岐し
てブロック16の段階に進み、元の音声と置換音声を比
較する。ブロック18の段階で、システムは、元の音声
と置換音声の間に近い音響的一致が存在するかどうかを
判定する。近い一致が存在する場合、方法は、経路19
に分岐してブロック20に進み、それにより言語モデル
が訂正で更新される。言語モデルは単語パターンに関す
る統計情報からなることを理解されたい。したがって、
言語モデルの訂正は、音響的訂正ではなく、統計的訂正
である。次に、経路17は、ブロック22の段階に進
み、評価のために利用可能な入力がまだあるかどうかを
検出する。近い一致が存在しない場合、方法は、経路2
1に分岐してブロック22の段階に直接進み、評価のた
めに利用可能な他の入力があるかどうかを検出する。
【0016】評価のために利用できる入力がまだある場
合、方法は、経路23に戻り、ブロック12の段階に進
む。そうでない場合、方法は、経路25に分岐してブロ
ック24に進み、それにより方法が終了する。
【0017】判断ブロック14での判定により、元の口
述テキストが口述により置換されていなかった場合、方
法は、経路15に分岐して、ブロック26に進み、図2
に関して説明する方法を使用する。次に、経路27は、
前述のように判断ブロック22に進む。
【0018】本発明の別の構成による音声アプリケーシ
ョンにおいて言語モデルを自動的に更新する代替方法
を、図2のフローチャート30に示す。開始ブロック3
1から始まって、話し手は、ブロック32の段階に従っ
て音声アプリケーションによる音声認識セッションを開
始する。判断ブロック34の段階で、システムは、ま
ず、元の口述テキストが新しいテキストで置換されたか
どうかを検出する。元の口述テキストが新しいテキスト
で置換されていない場合、方法は、経路35に分岐して
ブロック58の段階に進み、評価のために利用可能な入
力がまだあるかどうかを検出する。評価のために利用可
能な入力がまだある場合、方法は、経路59に分岐しブ
ロック32の段階に進む。そうでない場合、方法は、経
路61に分岐してブロック60の段階に進み、それによ
り方法が終了する。
【0019】ブロック34の段階で、元の口述テキスト
が新しいテキストで置換されている場合、方法は、経路
33に分岐してブロック36の段階に進み、元のテキス
トのテキストおよび音声を保存し、置換テキストを保存
し、可能な場合は置換音声を保存する。次の判断ブロッ
ク38の段階で、置換テキストの発音が使用可能かどう
かを調べる。可能な場合、方法は、経路39に分岐して
ブロック40の段階に進み、それにより、元の音声が、
置換テキストのベースフォームと比較される。置換テキ
ストのベースフォームが使用可能でない場合は、置換テ
キストが語彙外であることを意味し、方法は、経路47
に分岐してブロック50の段階に進み、それにより、置
換テキストのベースフォームが生成される。ベースフォ
ームは、テキスト音声エンジンを使用することにより、
または音声認識エンジンのユーザ・トレーニングにより
生成することができる。次に、方法は、前述のようにブ
ロック40の段階に進む。
【0020】ブロック40の比較段階の後、判断ブロッ
ク42の段階により、元の音声と置換テキストのベース
フォームの間に近い音響的一致があるかどうか判定す
る。近い一致がある場合、方法は、経路41に分岐して
ブロック44の段階に進み、それにより、言語モデルが
訂正で更新される。次の経路45から、前述のようにブ
ロック58の段階に進む。近い一致が存在しない場合、
方法は、前述のように、経路43に分岐してブロック5
8の段階に直接進む。
【0021】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0022】(1)訂正セッション中に音声アプリケー
ションにおける言語モデルを更新する方法であって、元
の口述テキストの音声と置換テキストの音声を互いに音
響的に比較する比較段階と、前記比較の結果が、前記置
換テキストの音声が編集以外の誤認識エラーの訂正を表
すことを示すのに十分なほど近い場合に、前記言語モデ
ルを訂正で更新し、それにより前記言語モデルをユーザ
の対話なしに更新できるようにする更新段階とを含む方
法。 (2)前記比較段階の前に、前記元の口述テキストの新
しいテキストによる置換を検出する段階と、前記比較段
階で使用するために前記元の口述テキストの音声と前記
新しいテキストの音声を保存する段階とをさらに含む上
記(1)に記載の方法。 (3)前記更新段階が、新しい単語を前記音声アプリケ
ーションの語彙に加える段階を含む上記(1)に記載の
方法。 (4)前記比較段階が、前記新しいテキストのいずれか
の単語が語彙外かどうかを判定する段階と、前記単語が
語彙外でない場合に、前記比較段階に前記語彙中の既存
のベースフォームを利用する段階とを含む上記(1)に
記載の方法。 (5)前記比較段階が、前記新しいテキストのいずれか
の単語が語彙外かどうかを判定する段階と、前記単語が
語彙外の場合に、前記単語のベースフォームが前記語彙
外で記憶されているかどうかを判定する段階と、前記単
語の前記ベースフォームが、前記語彙外で記憶されてい
る場合に、前記比較段階に前記語彙外のベースフォーム
を利用する段階とを含む上記(1)に記載の方法。 (6)前記更新段階が、前記単語を前記語彙に加える段
階を含む上記(5)に記載の方法。 (7)前記比較段階が、前記新しいテキストのいずれか
の単語が語彙外かどうかを判定する段階と、前記いずれ
かの単語が語彙外の場合に、前記いずれかの単語のベー
スフォームが前記語彙外で記憶されているかどうかを判
定する段階と、前記いずれかの単語の前記ベースフォー
ムが前記語彙外で記憶されていない場合に、前記いずれ
かの単語の新しいベースフォームの生成を延期する段階
とを含む上記(1)に記載の方法。 (8)前記比較段階が、前記新しいテキストのいずれか
の単語が語彙外かどうかを判定する段階と、前記いずれ
かの単語が語彙外の場合に、前記いずれかの単語のベー
スフォームが前記語彙外で記憶されているかどうかを判
定する段階と、前記いずれかの単語の前記ベースフォー
ムが前記語彙外で記憶されていない場合に、前記いずれ
かの単語の新しいベースフォームを生成する段階と、前
記比較段階に前記新しいベースフォームを利用する段階
とを含む上記(1)に記載の方法。 (9)前記更新段階が、前記いずれかの単語を前記語彙
に追加する段階を含む、上記(8)に記載の方法。 (10)前記比較段階が、前記新しいテキストのいずれ
かの単語が語彙外かどうかを判定する段階と、前記いず
れかの単語が語彙外の場合に、前記いずれかの単語のベ
ースフォームが前記語彙外で記憶されているかどうかを
判定する段階と、前記いずれかの単語の前記ベースフォ
ームが前記語彙外で記憶されている場合に、前記比較段
階に前記語彙外のベースフォームを利用する段階と、前
記いずれかの単語の前記ベースフォームが前記語彙外で
記憶されていない場合に、前記いずれかの単語の新しい
ベースフォームの生成を延期する段階とを含む上記
(1)に記載の方法。 (11)前記比較段階が、前記新しいテキストのいずれ
かの単語が語彙外かどうかを判定する段階と、前記いず
れかの単語が語彙に含まれない場合に、前記いずれかの
単語のベースフォームが前記語彙外で記憶されているか
どうかを判定する段階と、前記いずれかの単語の前記ベ
ースフォームが前記語彙外で記憶されている場合に、前
記比較段階に前記語彙外のベースフォームを利用する段
階と、前記いずれかの単語の前記ベースフォームが前記
語彙外で記憶されていない場合に、前記いずれかの単語
の新しいベースフォームを生成する段階と、前記比較段
階に前記新しいベースフォームを利用する段階とを含む
上記(1)に記載の方法。 (12)前記更新段階が、前記いずれかの単語を前記語
彙に加える段階を含む上記(11)に記載の方法。 (13)前記比較段階が、元の口述単語のベースフォー
ムと前記元の口述単語の置換のベースフォームをそれぞ
れ比較する段階を含む上記(1)に記載の方法。
【図面の簡単な説明】
【図1】置換テキストが音声を有するときの本発明の構
成の一態様によるプログラム制御の流れを示すフローチ
ャートである。
【図2】置換テキストが口述またはタイプ入力によって
得られるときの本発明の装置のもう1つの態様によるプ
ログラム制御の流れを示すフローチャートである。
【符号の説明】
10 フローチャート 11 開始ブロック 12 ブロック 13 経路 14 判断ブロック 15 経路 16 ブロック 17 経路 18 ブロック 19 経路 20 ブロック 21 経路 22 判断ブロック 23 経路 24 ブロック 25 経路 26 ブロック 27 経路
フロントページの続き (72)発明者 ジェームズ・アール・ルイス アメリカ合衆国33445 フロリダ州デルリ ー・ビーチ マジェスティック・パルム・ ウェイ 4000 (72)発明者 マリア・イー・スミス アメリカ合衆国33324 フロリダ州プラン テーション ノースウェスト・セブンス・ サークル 9632 アパートメント ナンバ ー17−27

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】訂正セッション中に音声アプリケーション
    における言語モデルを更新する方法であって、 元の口述テキストの音声と置換テキストの音声を互いに
    音響的に比較する比較段階と、 前記比較の結果が、前記置換テキストの音声が編集以外
    の誤認識エラーの訂正を表すことを示すのに十分なほど
    近い場合に、前記言語モデルを訂正で更新し、それによ
    り前記言語モデルをユーザの対話なしに更新できるよう
    にする更新段階とを含む方法。
  2. 【請求項2】前記比較段階の前に、 前記元の口述テキストの新しいテキストによる置換を検
    出する段階と、 前記比較段階で使用するために前記元の口述テキストの
    音声と前記新しいテキストの音声を保存する段階とをさ
    らに含む請求項1に記載の方法。
  3. 【請求項3】前記更新段階が、新しい単語を前記音声ア
    プリケーションの語彙に加える段階を含む請求項1に記
    載の方法。
  4. 【請求項4】前記比較段階が、 前記新しいテキストのいずれかの単語が語彙外かどうか
    を判定する段階と、 前記単語が語彙外でない場合に、前記比較段階に前記語
    彙中の既存のベースフォームを利用する段階とを含む請
    求項1に記載の方法。
  5. 【請求項5】前記比較段階が、 前記新しいテキストのいずれかの単語が語彙外かどうか
    を判定する段階と、 前記単語が語彙外の場合に、前記単語のベースフォーム
    が前記語彙外で記憶されているかどうかを判定する段階
    と、 前記単語の前記ベースフォームが、前記語彙外で記憶さ
    れている場合に、前記比較段階に前記語彙外のベースフ
    ォームを利用する段階とを含む請求項1に記載の方法。
  6. 【請求項6】前記更新段階が、前記単語を前記語彙に加
    える段階を含む請求項5に記載の方法。
  7. 【請求項7】前記比較段階が、 前記新しいテキストのいずれかの単語が語彙外かどうか
    を判定する段階と、 前記いずれかの単語が語彙外の場合に、前記いずれかの
    単語のベースフォームが前記語彙外で記憶されているか
    どうかを判定する段階と、 前記いずれかの単語の前記ベースフォームが前記語彙外
    で記憶されていない場合に、前記いずれかの単語の新し
    いベースフォームの生成を延期する段階とを含む請求項
    1に記載の方法。
  8. 【請求項8】前記比較段階が、 前記新しいテキストのいずれかの単語が語彙外かどうか
    を判定する段階と、 前記いずれかの単語が語彙外の場合に、前記いずれかの
    単語のベースフォームが前記語彙外で記憶されているか
    どうかを判定する段階と、 前記いずれかの単語の前記ベースフォームが前記語彙外
    で記憶されていない場合に、前記いずれかの単語の新し
    いベースフォームを生成する段階と、 前記比較段階に前記新しいベースフォームを利用する段
    階とを含む請求項1に記載の方法。
  9. 【請求項9】前記更新段階が、前記いずれかの単語を前
    記語彙に追加する段階を含む、請求項8に記載の方法。
  10. 【請求項10】前記比較段階が、 前記新しいテキストのいずれかの単語が語彙外かどうか
    を判定する段階と、 前記いずれかの単語が語彙外の場合に、前記いずれかの
    単語のベースフォームが前記語彙外で記憶されているか
    どうかを判定する段階と、 前記いずれかの単語の前記ベースフォームが前記語彙外
    で記憶されている場合に、前記比較段階に前記語彙外の
    ベースフォームを利用する段階と、 前記いずれかの単語の前記ベースフォームが前記語彙外
    で記憶されていない場合に、前記いずれかの単語の新し
    いベースフォームの生成を延期する段階とを含む請求項
    1に記載の方法。
  11. 【請求項11】前記比較段階が、 前記新しいテキストのいずれかの単語が語彙外かどうか
    を判定する段階と、 前記いずれかの単語が語彙に含まれない場合に、前記い
    ずれかの単語のベースフォームが前記語彙外で記憶され
    ているかどうかを判定する段階と、 前記いずれかの単語の前記ベースフォームが前記語彙外
    で記憶されている場合に、前記比較段階に前記語彙外の
    ベースフォームを利用する段階と、 前記いずれかの単語の前記ベースフォームが前記語彙外
    で記憶されていない場合に、前記いずれかの単語の新し
    いベースフォームを生成する段階と、 前記比較段階に前記新しいベースフォームを利用する段
    階とを含む請求項1に記載の方法。
  12. 【請求項12】前記更新段階が、前記いずれかの単語を
    前記語彙に加える段階を含む請求項11に記載の方法。
  13. 【請求項13】前記比較段階が、元の口述単語のベース
    フォームと前記元の口述単語の置換のベースフォームを
    それぞれ比較する段階を含む請求項1に記載の方法。
JP28614399A 1998-10-19 1999-10-07 言語モデルを更新する方法 Expired - Fee Related JP3546774B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/174,873 US6138099A (en) 1998-10-19 1998-10-19 Automatically updating language models
US09/174873 1998-10-19

Publications (2)

Publication Number Publication Date
JP2000122687A true JP2000122687A (ja) 2000-04-28
JP3546774B2 JP3546774B2 (ja) 2004-07-28

Family

ID=22637889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28614399A Expired - Fee Related JP3546774B2 (ja) 1998-10-19 1999-10-07 言語モデルを更新する方法

Country Status (7)

Country Link
US (1) US6138099A (ja)
JP (1) JP3546774B2 (ja)
KR (1) KR100321841B1 (ja)
IL (1) IL131712A (ja)
MY (1) MY115505A (ja)
SG (1) SG79284A1 (ja)
TW (1) TW440809B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005208643A (ja) * 2004-01-20 2005-08-04 Microsoft Corp ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法
CN113903342A (zh) * 2021-10-29 2022-01-07 镁佳(北京)科技有限公司 一种语音识别纠错方法及装置
WO2022085296A1 (ja) * 2020-10-19 2022-04-28 ソニーグループ株式会社 情報処理装置及び情報処理方法、コンピュータプログラム、フォーマット変換装置、オーディオコンテンツ自動転記システム、学習済みモデル、並びに表示装置

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6507816B2 (en) * 1999-05-04 2003-01-14 International Business Machines Corporation Method and apparatus for evaluating the accuracy of a speech recognition system
US6611802B2 (en) * 1999-06-11 2003-08-26 International Business Machines Corporation Method and system for proofreading and correcting dictated text
US6374214B1 (en) * 1999-06-24 2002-04-16 International Business Machines Corp. Method and apparatus for excluding text phrases during re-dictation in a speech recognition system
US6370503B1 (en) * 1999-06-30 2002-04-09 International Business Machines Corp. Method and apparatus for improving speech recognition accuracy
DE10033915B4 (de) * 2000-07-05 2005-11-03 Deutsche Telekom Ag Testgerät für Sprachdialoge
US6754627B2 (en) * 2001-03-01 2004-06-22 International Business Machines Corporation Detecting speech recognition errors in an embedded speech recognition system
US7505911B2 (en) 2001-09-05 2009-03-17 Roth Daniel L Combined speech recognition and sound recording
US7526431B2 (en) 2001-09-05 2009-04-28 Voice Signal Technologies, Inc. Speech recognition using ambiguous or phone key spelling and/or filtering
US7809574B2 (en) 2001-09-05 2010-10-05 Voice Signal Technologies Inc. Word recognition using choice lists
US7444286B2 (en) * 2001-09-05 2008-10-28 Roth Daniel L Speech recognition using re-utterance recognition
US7467089B2 (en) 2001-09-05 2008-12-16 Roth Daniel L Combined speech and handwriting recognition
US7124080B2 (en) * 2001-11-13 2006-10-17 Microsoft Corporation Method and apparatus for adapting a class entity dictionary used with language models
US7292976B1 (en) * 2003-05-29 2007-11-06 At&T Corp. Active learning process for spoken dialog systems
WO2005026958A1 (en) * 2003-09-11 2005-03-24 Voice Signal Technologies, Inc. Method and apparatus for back-up of customized application information
US7848928B2 (en) * 2005-08-10 2010-12-07 Nuance Communications, Inc. Overriding default speech processing behavior using a default focus receiver
US7756708B2 (en) * 2006-04-03 2010-07-13 Google Inc. Automatic language model update
US7805305B2 (en) * 2006-10-12 2010-09-28 Nuance Communications, Inc. Enhancement to Viterbi speech processing algorithm for hybrid speech models that conserves memory
JP4867654B2 (ja) * 2006-12-28 2012-02-01 日産自動車株式会社 音声認識装置、および音声認識方法
JP5471106B2 (ja) * 2009-07-16 2014-04-16 独立行政法人情報通信研究機構 音声翻訳システム、辞書サーバ装置、およびプログラム
US9275640B2 (en) * 2009-11-24 2016-03-01 Nexidia Inc. Augmented characterization for speech recognition
EP3089159B1 (en) * 2015-04-28 2019-08-28 Google LLC Correcting voice recognition using selective re-speak
US10896681B2 (en) 2015-12-29 2021-01-19 Google Llc Speech recognition with selective use of dynamic language models
CN110870004B (zh) * 2017-07-10 2023-09-12 Scti控股公司 基于音节的自动语音识别

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6064959A (en) * 1997-03-28 2000-05-16 Dragon Systems, Inc. Error correction in speech recognition
GB2303955B (en) * 1996-09-24 1997-05-14 Allvoice Computing Plc Data processing method and apparatus
US5864805A (en) * 1996-12-20 1999-01-26 International Business Machines Corporation Method and apparatus for error correction in a continuous dictation system
US6006183A (en) * 1997-12-16 1999-12-21 International Business Machines Corp. Speech recognition confidence level display
US5970451A (en) * 1998-04-14 1999-10-19 International Business Machines Corporation Method for correcting frequently misrecognized words or command in speech application

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005208643A (ja) * 2004-01-20 2005-08-04 Microsoft Corp ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法
JP4657736B2 (ja) * 2004-01-20 2011-03-23 マイクロソフト コーポレーション ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法
US8019602B2 (en) 2004-01-20 2011-09-13 Microsoft Corporation Automatic speech recognition learning using user corrections
WO2022085296A1 (ja) * 2020-10-19 2022-04-28 ソニーグループ株式会社 情報処理装置及び情報処理方法、コンピュータプログラム、フォーマット変換装置、オーディオコンテンツ自動転記システム、学習済みモデル、並びに表示装置
CN113903342A (zh) * 2021-10-29 2022-01-07 镁佳(北京)科技有限公司 一种语音识别纠错方法及装置

Also Published As

Publication number Publication date
JP3546774B2 (ja) 2004-07-28
SG79284A1 (en) 2001-03-20
US6138099A (en) 2000-10-24
TW440809B (en) 2001-06-16
KR100321841B1 (ko) 2002-02-02
IL131712A (en) 2002-09-12
MY115505A (en) 2003-06-30
IL131712A0 (en) 2001-03-19
KR20000028660A (ko) 2000-05-25

Similar Documents

Publication Publication Date Title
JP2000122687A (ja) 言語モデルを更新する方法
CN109584860B (zh) 一种语音唤醒词定义方法和系统
Raux et al. Using task-oriented spoken dialogue systems for language learning: potential, practical applications and challenges
US9412364B2 (en) Enhanced accuracy for speech recognition grammars
CN106710585B (zh) 语音交互过程中的多音字播报方法及系统
EP1050872A3 (en) Method and system for selecting recognized words when correcting recognized speech
JP2005208643A (ja) ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法
WO1998013822A1 (en) Method of and system for recognizing a spoken text
US20220284882A1 (en) Instantaneous Learning in Text-To-Speech During Dialog
WO1999059135A3 (de) Anordnung und verfahren zur erkennung eines vorgegebenen wortschatzes in gesprochener sprache durch einen rechner
CN106981289A (zh) 一种识别模型训练方法及系统以及智能终端
JP2002215187A (ja) 音声認識方法及びその装置
JP2002062891A (ja) 音素割当て方法
JP2002091472A (ja) 音声言語の韻律表示装置、再生装置、類似度判定装置、音声言語処理装置、および記録媒体
US6157910A (en) Deferred correction file transfer for updating a speech file by creating a file log of corrections
US20060136195A1 (en) Text grouping for disambiguation in a speech application
JP4798039B2 (ja) 音声対話装置および方法
WO2021059968A1 (ja) 音声認識装置、音声認識方法、およびプログラム
CA2597826C (en) Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance
JP3006496B2 (ja) 音声認識装置
Komatani et al. Restoring incorrectly segmented keywords and turn-taking caused by short pauses
US8024191B2 (en) System and method of word lattice augmentation using a pre/post vocalic consonant distinction
JP2002091967A (ja) 言語モデル作成装置および言語モデル作成プログラムを記録した記録媒体
JP2002082691A (ja) 発声内に含まれる会社名の自動認識方法
JPH10143190A (ja) 音声認識装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040128

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040330

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20040330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040405

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees