JP2003029784A - データベースのエントリを決定する方法 - Google Patents
データベースのエントリを決定する方法Info
- Publication number
- JP2003029784A JP2003029784A JP2002118436A JP2002118436A JP2003029784A JP 2003029784 A JP2003029784 A JP 2003029784A JP 2002118436 A JP2002118436 A JP 2002118436A JP 2002118436 A JP2002118436 A JP 2002118436A JP 2003029784 A JP2003029784 A JP 2003029784A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- entry
- database
- entries
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 230000006978 adaptation Effects 0.000 claims description 14
- 230000002452 interceptive effect Effects 0.000 claims description 6
- 230000003993 interaction Effects 0.000 abstract description 4
- 230000003044 adaptive effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 241000282461 Canis lupus Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
的な費用を最小限としつつユーザへ出力されるデータベ
ースエントリをサーチすることを目的とする。 【解決手段】 本発明の自動対話システムによりデータ
ベースのエントリを決定する方法は、音声入力を一時的
に記憶する段階と、音声入力を自動音声認識装置で処理
し、各辞書エントリが少なくとも1つの音響リファレン
スを含む第1の辞書エントリ集合を有する第1の辞書を
用いて音声認識結果を生成する段階と、音声認識結果に
対応するデータベースエントリについてサーチする段階
と、データベースエントリが見つからない場合は、少な
くとも1つの辞書エントリが第1の辞書エントリ集合と
は異なる第2の辞書エントリ集合を有するよう、第1の
辞書を適応し、一時的に記憶された音声発話と適応され
た第1の辞書とを用いて自動音声認識装置による処理及
びデータベースのサーチの段階を繰り返す段階とを含
む。
Description
よってデータベースのデータベースエントリを決定する
方法に関する。
ため、一般的に、辞書エントリ(音声認識装置の語彙)
を用いて辞書にアクセスし、隠れマルコフモデルに基づ
いて動作する自動音声認識装置が用いられる。辞書エン
トリは、音声認識手順において音声入力と比較される音
声認識装置用の音響リファレンスを含む。音響リファレ
ンスは、例えば一連の音素を表わす。本発明による方法
は、例えば「イエローページ」サービスに関連する。こ
のようなサービスを用いて、各ユーザは、要求されてい
る地区の利用可能な提供者から、例えば医者、販売者又
は他の企業についての情報、また、警察、プール、学校
等の公共の設備についての情報を得ることができる。電
話を通じたこのような地区情報システム、即ち職業別電
話情報の形式のシステムは周知である。
ネットのためのデータネットワークにおいてかかる情報
システムが既に知られている。端末は、情報システムの
種別に応じて、電話機、移動電話機、適切な電話機能を
有するコンピュータ又はオーガナイザ等であるか、純粋
なデータネットワーク中の情報システムが使用される場
合は例えばWAP移動電話機といった関連するネットワ
ークへの対応するアクセス機能を有するPC又はオーガ
ナイザ又は移動電話機が使用される。サーチパラメータ
は、例えば、地区、職業分野、或いは場所、又は、例え
ば「医師」或いは「ホメオパシー」或いは「ミュンヘ
ン」といった関連するサーチ概念といった種々のサーチ
規準である。加入者データは、例えば、情報システムに
加入している供給者にユーザが接触すること又は連絡を
とることを可能とする電話番号、住所、又は他の情報、
即ち情報システムのデータベースに含まれる情報であり
うる。公知のシステムでは、辞書は例えば地区の入力と
いったあるカテゴリの音声入力のために使用され、この
辞書は計算上の費用を制限するために音声認識システム
上の要求に応じて調整される。
識の結果について行われるデータベースのサーチにおい
て、ユーザへ出力されうる関連するデータベースエント
リが見いだせないという問題が生ずる。本発明は、ユー
ザによる使い心地ができる限り影響を受けないよう追加
的な計算上の費用を最小限としつつ上述の問題を解決す
ることを目的とする。
声入力を一時的に記憶する段階と、(2)音声入力を自
動音声認識装置によって処理し、各辞書エントリが少な
くとも1つの音響リファレンスを含む第1の辞書エント
リ集合を有する第1の辞書を用いて音声認識結果を生成
する段階と、(3)音声認識結果に対応するデータベー
スエントリについてサーチする段階と、(4)段階
(3)においてデータベースエントリが見つからない場
合は、少なくとも1つの辞書エントリが第1の辞書エン
トリ集合とは異なる第2の辞書エントリ集合を有するよ
う、第1の辞書を適応し、一時的に記憶された音声発話
と適応された第1の辞書とを用いて段階(2)及び
(3)を繰り返す段階とを含む上述の方法によって達成
される。
った場合でも、ユーザは音声の発話によって生成される
音声入力を繰り返す必要がない。一時的に記憶された音
声入力は、適応された辞書を用いた第2の音声認識動作
にも使用される。辞書は動的に適応される。辞書の適用
の方法は、出来る限り小さい辞書で考慮されている音声
認識結果に対してデータベースの入力の割当てが成功す
る確率を最大とすることを保証するよう選択される。特
に、第1の辞書を適応するためにそのエントリが使用さ
れうる総合辞書が使用される(請求項2)。
能なデータベースエントリがない場合に本発明による方
法が予め設定された基準に従って中断されることを保証
する。
に使用される第1の辞書がデータベースエントリのカテ
ゴリに関連付けられる実施例を示す。請求項4に記載の
ように辞書を適応するとき、データベースエントリのカ
テゴリ(例えば地区)の制限内で、追加的な辞書エント
リが追加されるか、辞書エントリが変更される。請求項
4は、第1の辞書の適応のために、辞書のエントリがカ
テゴリの外で適応される実施例を開示する。適応される
前の第1の辞書がデータベースエントリの特定のカテゴ
リに属する辞書エントリを含む場合、適応された後は、
第1の辞書は関連するカテゴリ(例えば関連する地区)
に属する少なくとも1つの辞書エントリを含む。
対してデータベースエントリを割り当てることができな
い場合、辞書は個々の音声認識結果の選択肢に対して適
応されるだけでなく、音声認識の選択肢は辞書が適応さ
れるときにも考慮される。従って、新規な音声認識動作
により、データベースエントリが一時的に記憶された音
声入力に対して割り当てられうる確率が高まる。
へのアクセスが特に電話インタフェース(請求項8)を
通じて行われるイエローページのデータの集合(請求項
7)においてエントリを決定するために使用される。
するために使用される自動対話システムに関する。
面を参照して詳述する。図1は、本実施例では電話イン
タフェースであるインタフェース2を有する対話システ
ム1を示す。対話システム1は、インタフェース2を通
じて、また構内交換機が利用可能であればこれを介し
て、電話網に接続される。メモリ3が設けられ、これに
受信される音声入力が音声ファイルとして一時的に記憶
されうる。自動音声認識装置4は、メモリ3に記憶され
た音声認識の自動認識を行う。音声認識装置4は、音声
認識モジュール5と辞書6とを含み、辞書のエントリは
音声認識装置4によって利用可能な語彙を構成する。各
辞書エントリは、語又は単語を示す少なくとも1つの音
響リファレンスを含む。各音響リファレンスは、少なく
とも1つの状態を有する隠れマルコフモデル(HMM)
に対応する。音声認識モジュール5は、ここでは辞書6
を除く音声認識装置4の全ての機能を含む。音声認識装
置4は、例えばフィリップス社製のシステム「Speech P
earl」を用いて実施されうる。
識装置4によって用いられる辞書6は、設定されている
ものではなく、動的に適応可能である。本例では、辞書
6の辞書エントリは、総合辞書7の部分集合を構成す
る。総合辞書7は、辞書6のための辞書エントリの貯蔵
部を構成する。中央対話制御・管理ユニット8は、ユー
ザとの対話を制御すると共に辞書6の適応を制御する。
ユニット8は特定用途向けデータを有するデータベース
9にアクセス可能であり、音声出力を生成しこれをイン
タフェース2を介してユーザへ出力する音声出力ユニッ
ト10を制御する。
データは、各用途に対して予め設定されうる対話構造を
定義する。従って、例えばユーザとの対話は、挨拶から
始まり続いて特定の音声入力のアクティブ化の要求がな
されうる。ユーザによる続く音声入力は、インタフェー
ス2を介して受信されメモリ3に一時的に記憶される。
一時的に記憶された音声入力3は、自動音声認識装置4
によって音声認識結果へ変化され、音声認識結果はユニ
ット8へ与えられ、音声認識結果に応じて、データベー
ス9に記憶されたデータに従って予め指定されたような
ユーザとの対話を続けるか、対話を終了する。
ーチャートを示す図である。本発明について、ユーザが
地区情報を検索しうるイエローページデータ集合へのア
クセスの例を用いて説明する。本例では、地区情報はデ
ータベース9に記憶され、例えば複数の企業名、夫々の
場所、関連する地区、通りの名前、電話番号、及び郵便
番号を含む。電話の呼によりユーザにより対話システム
1へアクセスした後、対話システム1はユーザへの挨拶
定型文を出力し、町名を入力するよう求める。ステップ
20において町名が入力され正しく検出されると、ステ
ップ21においてユーザに対して地区を入力するよう要
求する。ステップ22において音声入力によって地区を
入力した後、ステップ23においてこの音声入力はメモ
リ中に音声ファイルとして一時的に記憶される。ステッ
プ24において、音声認識装置4を用いて一時的に記憶
された音声入力に対して音声認識手順が実行される。こ
のために、限られた数の地区名を表わす辞書LEX
(1)が使用され、即ち音声認識装置によって使用され
る語彙はこのようにステップ24において制限される。
ステップ24において発生した音声認識結果を用いて、
つづくステップ25において、認識されたセクタ名及び
町名に対してデータベース9に記憶された企業名を探す
ために対話制御・管理ユニット8によってデータベース
9におけるデータベースサーチが実行される。
チ名に属する少なくとも1つのデータベースエントリが
見つかると、ステップ35において対応する企業名及び
存在する場合は更なる関連する企業情報がユーザへ出力
されるか、必要な情報をより詳細に指定するよう(例え
ば郵便番号又は通りの名前を入力することによって行わ
れる)ユーザに求める音声出力を用いてユーザとの対話
を続ける。しかしながら、ステップ26において、デー
タベース9には認識された町名及びセクタ名に対応する
データベースエントリが見つからない場合、ステップ2
7において、先行する音声認識手順で使用される辞書6
のバージョンを示すために用いられるパラメータnは、
n=1に設定される。ステップ28において、辞書6
は、辞書バージョンLEX(n)が少なくとも1つの辞
書エントリについて辞書バージョンLEX(n)とは異
なる辞書バージョンLEX(n+1)へ変形されるよ
う、適応される。辞書バージョンLEX(n+1)と比
較して、辞書バージョンLEX(n)は限られた数のセ
クタ名を表わす辞書エントリを含み、nが増加するにつ
れあまり頻繁に探されない地区名も考慮される。辞書の
拡張は、データベース9に記憶された割当てテーブルに
よって決まる。
テゴリに分割されると、辞書は、カテゴリ内及び/又は
カテゴリ間で適応されうる。辞書エントリの特定のカテ
ゴリについての例は、例えば特定の町に対する地区名の
数である。カテゴリ内の辞書適応は、その町に割り当て
られた他の及び/又は追加的な地区名が辞書6の作成の
ために考慮された場合に生じうる。カテゴリ間の辞書の
適応の場合、すなわち本例では辞書の適応の場合、例え
ば認識された町に近い他の町に割り当てられた地区名も
考慮に入れられる。この場合も、割当てはデータベース
9に記憶された割当てテーブル中で定義される。原理的
には、当該の用途及び辞書の適応についての要求から生
ずる多数のカテゴリが存在することが可能であり、この
ために最適化される。
後、ステップ29において、変更された辞書LEX(n
+1)を用いて音声認識方法が行われる。既知の地区を
表わす音声認識結果が決定され、町が既に知られている
ときに、対話制御・管理ユニット8によってデータベー
ス9の更なるデータベースサーチが行われる。ステップ
31において、データベースのサーチによって認識され
た町に対するエントリ(地区名)が与えられることがわ
かると、方法は、ステップ35と同様にデータ出力を行
うステップ36へ進む。
れうるデータベースがないことがわかると、ステップ3
2においてパラメータnは1ずつインクリメントされ
る。ステップ33において、中断判定基準が満たされて
いるかチェックする。本例では、中断判定基準は先験的
に設定される数字Nによって表わされる。数字Nは、辞
書の所望の適応の回数を表わす。ステップ33において
中断判定基準がまだ満たされてない場合(n≦N)、シ
ステムはステップ28へ戻る。ステップ33において、
中断判定基準が満たされた、即ちn>Nであるとわかる
と、対話システム1によるユーザ入力の処理は中断され
る。本例では、対話システム1とユーザとの間の対話は
中断され、ステップ34において所望のデータをユーザ
によって利用可能とするために、ユーザは電話オペレー
タに接続される。
個々の音声認識結果を供給するだけでなく、N≧1の最
善の認識結果の選択肢の数Nも与える。この場合、辞書
6の適応は、音声認識装置4によって供給される1以上
の認識結果の選択肢に依存する。このように、音声認識
装置6は、例えば地区名の入力の後に認識結果として2
つの同様の音の地区名を出力し、2つの音声認識結果の
選択肢はそれらの信頼性に従って順序付けられる。デー
タベース9に、その中に記憶された割当てテーブルに、
音声認識結果の選択肢として決定された2つの地区名に
ついて辞書6の適応のための異なる割当てが与えられ、
これらは辞書6の適応にも考慮される。
ートである。
Claims (9)
- 【請求項1】 (1)音声入力を一時的に記憶する段階
と、 (2)上記音声入力を自動音声認識装置によって処理
し、各辞書エントリが少なくとも1つの音響リファレン
スを含む第1の辞書エントリ集合を有する第1の辞書を
用いて音声認識結果を生成する段階と、 (3)上記音声認識結果に対応するデータベースエント
リについてサーチする段階と、 (4)上記段階(3)においてデータベースエントリが
見つからない場合は、 少なくとも1つの辞書エントリが上記第1の辞書エント
リ集合とは異なる第2の辞書エントリ集合を有するよ
う、上記第1の辞書を適応し、 上記一時的に記憶された音声発話と上記適応された第1
の辞書とを用いて上記段階(2)及び(3)を繰り返す
段階とを含む、 自動対話システムによってデータベースのデータベース
エントリを決定する方法。 - 【請求項2】 上記辞書エントリは総合辞書として用い
られる第2の辞書から得られることを特徴とする、請求
項1記載の方法。 - 【請求項3】 上記段階(2)乃至(4)は、中断判定
基準に達するまで繰り返されることを特徴とする、請求
項1又は2記載の方法。 - 【請求項4】 データベースエントリのカテゴリに対応
する辞書エントリのカテゴリが設けられ、 辞書エントリのカテゴリについて適応された後の第1の
辞書は少なくとも1つの辞書エントリが適応される前の
形とは異なることを特徴とする、請求項1乃至3のうち
いずれか一項記載の方法。 - 【請求項5】 データベースエントリのカテゴリに対応
する辞書エントリのカテゴリが設けられ、 適応される前の第1の辞書が少なくとも部分集合を含む
少なくとも1つの辞書エントリのカテゴリには、適応さ
れた後の第1の辞書が少なくとも部分集合を含む第2の
辞書エントリのカテゴリが割り当てられることを特徴と
する、請求項1乃至4のうちいずれか一項記載の方法。 - 【請求項6】 音声認識装置によって与えられる音声認
識結果は、N個(N≧1)の最善の認識結果の選択肢を
含み、 上記辞書の適応は、少なくとも1つの認識結果の選択肢
に依存することを特徴とする、請求項1乃至5のうちい
ずれか一項記載の方法。 - 【請求項7】 上記データベースエントリはイエローペ
ージデータの集まりの部分であることを特徴とする、請
求項1乃至6のうちいずれか一項記載の方法。 - 【請求項8】 上記対話システムは電話インタフェース
を有し、前記電話インタフェースを通じて音声入力及び
音声出力が伝送されることを特徴とする、請求項1乃至
7のうちいずれか一項記載の方法。 - 【請求項9】 (1)入力されるべき音声発話を一時的
に記憶する段階と、(2)上記音声発話を自動音声認識
装置によって処理し、各辞書エントリが少なくとも1つ
の音響リファレンスを含む第1の辞書エントリ集合を有
する第1の辞書を用いて音声認識結果を生成する段階
と、(3)上記音声認識結果に対応するデータベースエ
ントリについてサーチする段階と、(4)上記段階
(3)においてデータベースエントリが見つからない場
合は、少なくとも1つの辞書エントリが上記第1の辞書
エントリ集合とは異なる第2の辞書エントリ集合を有す
るよう、上記第1の辞書を適応し、上記一時的に記憶さ
れた音声発話と上記適応された第1の辞書とを用いて上
記段階(2)及び(3)を繰り返す段階とを含む方法を
実行するためのシステム構成要素を有するデータベース
のデータベースエントリを決定する自動対話システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10119677.6 | 2001-04-20 | ||
DE10119677A DE10119677A1 (de) | 2001-04-20 | 2001-04-20 | Verfahren zum Ermitteln von Datenbankeinträgen |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003029784A true JP2003029784A (ja) | 2003-01-31 |
JP4741777B2 JP4741777B2 (ja) | 2011-08-10 |
Family
ID=7682289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002118436A Expired - Lifetime JP4741777B2 (ja) | 2001-04-20 | 2002-04-19 | データベースのエントリを決定する方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7496508B2 (ja) |
EP (1) | EP1251491B1 (ja) |
JP (1) | JP4741777B2 (ja) |
CN (1) | CN1326074C (ja) |
AT (1) | ATE311649T1 (ja) |
DE (2) | DE10119677A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016103270A (ja) * | 2014-11-12 | 2016-06-02 | 株式会社アドバンスト・メディア | 情報処理システム、受付サーバ、情報処理方法及びプログラム |
JP7549429B2 (ja) | 2020-03-20 | 2024-09-11 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ入力に対する音声認識及び訓練 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7958151B2 (en) * | 2005-08-02 | 2011-06-07 | Constad Transfer, Llc | Voice operated, matrix-connected, artificially intelligent address book system |
CN101558443B (zh) * | 2006-12-15 | 2012-01-04 | 三菱电机株式会社 | 声音识别装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63163496A (ja) * | 1986-12-26 | 1988-07-06 | 日本電信電話株式会社 | 並列検索照合型認識システム |
JPH01293397A (ja) * | 1988-05-23 | 1989-11-27 | Hitachi Ltd | 音声応答方式 |
JPH07219590A (ja) * | 1994-01-31 | 1995-08-18 | Canon Inc | 音声情報検索装置及び方法 |
JPH09114482A (ja) * | 1995-10-17 | 1997-05-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識のための話者適応化方法 |
JPH1124695A (ja) * | 1997-06-27 | 1999-01-29 | Sony Corp | 音声認識処理装置および音声認識処理方法 |
JP2000075895A (ja) * | 1998-08-05 | 2000-03-14 | Texas Instr Inc <Ti> | 連続音声認識用n最良検索方法 |
JP2000200093A (ja) * | 1999-01-07 | 2000-07-18 | Nec Corp | 音声認識装置及びそれに用いる音声認識方法並びにその制御プログラムを記録した記録媒体 |
JP2000250585A (ja) * | 1999-02-25 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体 |
JP2000322088A (ja) * | 1999-05-14 | 2000-11-24 | Hitachi Ltd | 音声認識マイクおよび音声認識システムならびに音声認識方法 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5027406A (en) * | 1988-12-06 | 1991-06-25 | Dragon Systems, Inc. | Method for interactive speech recognition and training |
US5909666A (en) * | 1992-11-13 | 1999-06-01 | Dragon Systems, Inc. | Speech recognition system which creates acoustic models by concatenating acoustic models of individual words |
JP3397372B2 (ja) * | 1993-06-16 | 2003-04-14 | キヤノン株式会社 | 音声認識方法及び装置 |
MX9702759A (es) * | 1994-10-25 | 1997-07-31 | British Telecomm | Servicios operados por voz. |
US5758322A (en) * | 1994-12-09 | 1998-05-26 | International Voice Register, Inc. | Method and apparatus for conducting point-of-sale transactions using voice recognition |
US5845246A (en) * | 1995-02-28 | 1998-12-01 | Voice Control Systems, Inc. | Method for reducing database requirements for speech recognition systems |
US5717828A (en) * | 1995-03-15 | 1998-02-10 | Syracuse Language Systems | Speech recognition apparatus and method for learning |
US5852801A (en) * | 1995-10-04 | 1998-12-22 | Apple Computer, Inc. | Method and apparatus for automatically invoking a new word module for unrecognized user input |
US5765132A (en) * | 1995-10-26 | 1998-06-09 | Dragon Systems, Inc. | Building speech models for new words in a multi-word utterance |
US6601027B1 (en) * | 1995-11-13 | 2003-07-29 | Scansoft, Inc. | Position manipulation in speech recognition |
US5715369A (en) * | 1995-11-27 | 1998-02-03 | Microsoft Corporation | Single processor programmable speech recognition test system |
US5933804A (en) * | 1997-04-10 | 1999-08-03 | Microsoft Corporation | Extensible speech recognition system that provides a user with audio feedback |
US6018708A (en) * | 1997-08-26 | 2000-01-25 | Nortel Networks Corporation | Method and apparatus for performing speech recognition utilizing a supplementary lexicon of frequently used orthographies |
US6122361A (en) * | 1997-09-12 | 2000-09-19 | Nortel Networks Corporation | Automated directory assistance system utilizing priori advisor for predicting the most likely requested locality |
JP4267081B2 (ja) * | 1997-10-20 | 2009-05-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 分散システムにおけるパターン認識登録 |
US6138100A (en) * | 1998-04-14 | 2000-10-24 | At&T Corp. | Interface for a voice-activated connection system |
US6012030A (en) * | 1998-04-21 | 2000-01-04 | Nortel Networks Corporation | Management of speech and audio prompts in multimodal interfaces |
US6208964B1 (en) * | 1998-08-31 | 2001-03-27 | Nortel Networks Limited | Method and apparatus for providing unsupervised adaptation of transcriptions |
DE60026637T2 (de) * | 1999-06-30 | 2006-10-05 | International Business Machines Corp. | Verfahren zur Erweiterung des Wortschatzes eines Spracherkennungssystems |
US7120582B1 (en) * | 1999-09-07 | 2006-10-10 | Dragon Systems, Inc. | Expanding an effective vocabulary of a speech recognition system |
US20020188447A1 (en) * | 2001-04-10 | 2002-12-12 | Coon Bradley S. | Generation of grammars from dynamic data structures |
-
2001
- 2001-04-20 DE DE10119677A patent/DE10119677A1/de not_active Withdrawn
-
2002
- 2002-04-17 CN CNB021231192A patent/CN1326074C/zh not_active Expired - Lifetime
- 2002-04-18 EP EP02100391A patent/EP1251491B1/de not_active Expired - Lifetime
- 2002-04-18 DE DE50205081T patent/DE50205081D1/de not_active Expired - Lifetime
- 2002-04-18 US US10/125,796 patent/US7496508B2/en active Active
- 2002-04-18 AT AT02100391T patent/ATE311649T1/de not_active IP Right Cessation
- 2002-04-19 JP JP2002118436A patent/JP4741777B2/ja not_active Expired - Lifetime
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63163496A (ja) * | 1986-12-26 | 1988-07-06 | 日本電信電話株式会社 | 並列検索照合型認識システム |
JPH01293397A (ja) * | 1988-05-23 | 1989-11-27 | Hitachi Ltd | 音声応答方式 |
JPH07219590A (ja) * | 1994-01-31 | 1995-08-18 | Canon Inc | 音声情報検索装置及び方法 |
JPH09114482A (ja) * | 1995-10-17 | 1997-05-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識のための話者適応化方法 |
JPH1124695A (ja) * | 1997-06-27 | 1999-01-29 | Sony Corp | 音声認識処理装置および音声認識処理方法 |
JP2000075895A (ja) * | 1998-08-05 | 2000-03-14 | Texas Instr Inc <Ti> | 連続音声認識用n最良検索方法 |
JP2000200093A (ja) * | 1999-01-07 | 2000-07-18 | Nec Corp | 音声認識装置及びそれに用いる音声認識方法並びにその制御プログラムを記録した記録媒体 |
JP2000250585A (ja) * | 1999-02-25 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体 |
JP2000322088A (ja) * | 1999-05-14 | 2000-11-24 | Hitachi Ltd | 音声認識マイクおよび音声認識システムならびに音声認識方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016103270A (ja) * | 2014-11-12 | 2016-06-02 | 株式会社アドバンスト・メディア | 情報処理システム、受付サーバ、情報処理方法及びプログラム |
JP7549429B2 (ja) | 2020-03-20 | 2024-09-11 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ入力に対する音声認識及び訓練 |
Also Published As
Publication number | Publication date |
---|---|
EP1251491B1 (de) | 2005-11-30 |
US20020169751A1 (en) | 2002-11-14 |
CN1326074C (zh) | 2007-07-11 |
EP1251491A2 (de) | 2002-10-23 |
ATE311649T1 (de) | 2005-12-15 |
JP4741777B2 (ja) | 2011-08-10 |
CN1384453A (zh) | 2002-12-11 |
EP1251491A3 (de) | 2003-12-17 |
DE10119677A1 (de) | 2002-10-24 |
DE50205081D1 (de) | 2006-01-05 |
US7496508B2 (en) | 2009-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20030149566A1 (en) | System and method for a spoken language interface to a large database of changing records | |
US5839107A (en) | Method and apparatus for automatically generating a speech recognition vocabulary from a white pages listing | |
USRE42868E1 (en) | Voice-operated services | |
US6751595B2 (en) | Multi-stage large vocabulary speech recognition system and method | |
US5983177A (en) | Method and apparatus for obtaining transcriptions from multiple training utterances | |
US9805722B2 (en) | Interactive speech recognition system | |
US20030115289A1 (en) | Navigation in a voice recognition system | |
US20080010058A1 (en) | Method and apparatus for recognizing large list of proper names in spoken dialog systems | |
US20080162146A1 (en) | Method and device for classifying spoken language in speech dialog systems | |
US20050004799A1 (en) | System and method for a spoken language interface to a large database of changing records | |
JP2010191400A (ja) | 音声認識装置およびデータ更新方法 | |
EP1240642A1 (en) | Learning of dialogue states and language model of spoken information system | |
CA2419526A1 (en) | Voice recognition system | |
GB2428853A (en) | Speech recognition application specific dictionary | |
US7809567B2 (en) | Speech recognition application or server using iterative recognition constraints | |
US20010056345A1 (en) | Method and system for speech recognition of the alphabet | |
JP4741777B2 (ja) | データベースのエントリを決定する方法 | |
JP4504469B2 (ja) | 音声信号により構成されるデータの信頼度決定方法 | |
Ju et al. | A voice search approach to replying to SMS messages in automobiles | |
Georgila et al. | A speech-based human-computer interaction system for automating directory assistance services | |
EP1581927A2 (en) | Voice recognition system and method | |
Georgila et al. | Improved large vocabulary speech recognition using lexical rules | |
CA2438926A1 (en) | Voice recognition system | |
JPH08139813A (ja) | 国番号およびエリアコード自動案内装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050415 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071009 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080107 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080409 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090501 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090609 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20090717 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110311 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110509 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4741777 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |