JP4408490B2 - データベース照会を実行する方法及びその装置 - Google Patents

データベース照会を実行する方法及びその装置 Download PDF

Info

Publication number
JP4408490B2
JP4408490B2 JP23002999A JP23002999A JP4408490B2 JP 4408490 B2 JP4408490 B2 JP 4408490B2 JP 23002999 A JP23002999 A JP 23002999A JP 23002999 A JP23002999 A JP 23002999A JP 4408490 B2 JP4408490 B2 JP 4408490B2
Authority
JP
Japan
Prior art keywords
statements
statement
probability
speech
drawn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23002999A
Other languages
English (en)
Other versions
JP2000105776A (ja
Inventor
ヤーコプ リューバー ベルンハルト
ケルナー アンドレーアス
ザイデ フランク
Original Assignee
ニュアンス コミュニケーションズ,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ニュアンス コミュニケーションズ,インコーポレイテッド filed Critical ニュアンス コミュニケーションズ,インコーポレイテッド
Publication of JP2000105776A publication Critical patent/JP2000105776A/ja
Application granted granted Critical
Publication of JP4408490B2 publication Critical patent/JP4408490B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、データ処理装置によりデータベース照会を実行する方法に関し、照会は自然音声での複数の音声発言の形でユーザにより入力され、データ処理装置は各音声発言に応じて音声出力を発生させ、認識装置は各音声発言を言語モデルを利用して音響的に最も高い確率の少なくとも1組のステートメントに変換させ、そのステートメントは整合性がテストされ、一致したステートメントは本目的に適する装置に保存される。
【0002】
【従来の技術】
かかる方法及び対応する装置は、DE19639843.
6A1(PHD96.167)に開示されている。各音声発言から引き出され、巧く整合性がテストされた最も高い確率のステートメントは、装置内に保存される。上記ステートメントは次の音声発言から引き出されたステートメントの整合性をテストするために利用され、最終的にデータベース照会用に利用される。システムにより発せられる音声出力により、データベース照会に必要な全てのステートメントが得られるまで、ユーザは音声応答を与えるように何度も催促される。よって、システムにより発せられる各音声出力は、先行する音声発言及びそれから引き出されたステートメントに限られた程度に依存する。
【0003】
しかしながら、本方法では音声発言を通してユーザにより意図された正しいステートメントは、例えばユーザによる不十分な発音に起因して、最も高い確率ではなく低い確率で認識されることが起こり得る。上記の低い確率のステートメントはもはや追跡されないので、ユーザとの対話が最も高い確率で間違って認識され続け、このステートメントが正しくない場合には、最終のデータベース照会は間違ったステートメントから引き出されることが最終的に起こり得る。
【0004】
WO96/13030において、電話照会サービス用の装置及びその方法が開示され、複数のステートメントはユーザの各音声発言から引き出され、保存される。しかしながら、システムによりユーザへ提供される音声出力は、固定スキームに従って進行し、次の音声発言から引き出されるステートメントと比較されるデータベースからのデータ量を減少させるために、今までに引き出されたステートメントが利用される。
【0005】
【発明が解決しようとする課題】
本発明は上述の点に鑑みてなされたものであり、ユーザにとってできる限り信頼でき、かつできる限り便利である方法で、データベース照会に必要な全てのステートメントを引き出すことが幅広い応用分野において可能であり、オープニングパラグラフで定義されたタイプの方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
上記の目的は、言語モデルを利用して各音声発言から少なくとも1組のステートメントを引き出し、前記少なくとも1組のステートメントを与える認識装置と、前記認識装置により与えられた各組のステートメントの整合性をテストし、音声出力を発生させる制御装置から成る自然音声での音声発言の形でユーザからのデータベース照会を実行する方法であって、前記制御装置によって、前記ユーザからの自然音声から得られる音声発言に対して前記認識装置により引き出された全ての組のステートメントと、全ての保存された組のステートメントとの整合性テストし、整合性のあるステートメント保存、少なくとも一つの音声出力保存ステートメントから引き出ことを特徴とし、更に、幾つかの同じ分類のステートメントが前記認識装置により割り当てられた異なる確率で引き出され、前記幾つかの同じ分類のステートメントのうち、少なくともあるステートメントは既に保存されている場合、前記制御装置によって、前記幾つかの同じ分類のステートメントは、最後の音声発言から引き出されたステートメントの確率、及び従来から保存されていたステートメントの確率により決定される混合型確率で保存することにより達成される。
【0007】
よって、一致し、結果として有用である全てのステートメントが保存されるわけではないが、上記ステートメントからシステムにより発せられる次の音声出力を引き出すために、従来からの所定ステートメントと同様に上記ステートメントも各対話段階で利用されることが好ましい。この結果として、例えば電話照会サービスの場合における所望の加入者の都市及び通り、又は列車スケジュールサービスの場合における駅若しくは出発時間又は目的地に関する一般の音声出力を発するだけでなく、代わりの形態が望ましいのなら、例えば特定のステートメントを調べるために、つまりユーザにかかるステートメントを繰り返し行うように特定の質問を尋ねることも、同様に可能である。
【0008】
個々のステートメントは、音声信号で若しくはEP702353A2 (PHD94.120)に説明された方法で、個々の十分な確率のある全ての言葉を決定することにより、音声発言から引き出すことが可能である。前記方法において、ワードグラフが音声発言から引き出され、端からデータベース照会に関係するステートメント若しくはその情報が抽出される。さらに、一般言語モデル及び専用ルールが採用される。例えば、ステートメント“p. m. ”及び“3時”はステートメント“15. 00時”と同意義である。
【0009】
特に音声発言からステートメントを引き出す上記既知方法では、異なるステートメントが、例えば名前、時間指摘などのような同じ分類のステートメントに対して得られるが、これらは音声発言と異なる類似の結果として、言語モデルのような更なるルールによりさまざまな可能性を有する。よって、本発明の実施例は、各ステートメントが、ステートメントに割り当てられた確率及び整合性を巧くテストされた保存ステートメントの最も高い確率から引き出された確率で保存されることを特徴とする。認識中に、例えば幾つかの名前が異なる確率で引き出され、少なくともある名前が既に保存されており、それらの名前は、最後の音声発言から引き出されたステートメントの、及び従来から保存さえていたステートメントの確率により決定された混合型確率で保存される。
【0010】
ステートメントが音声信号から引き出される際に、認識装置は、例えば一定の数のステートメント若しくは一定の閾値以上の確率を有するステートメントという限られた数のステートメントを与える。一般に、このことは各対話段階で、つまり各新しい音声発言で、全てのステートメントの全数は増加するという結果をもたらす。この効果を制限させるために、本発明の更なる実施例によれば、閾値を超えた確率を有するステートメントのみを保存することが効果的である。これはステートメント自身の確率から生じる混合型確率と、保存されたステートメントと一致する最も高い確率との双方に関係する。
【0011】
ステートメントの幾つかの順序が音声発言により引き出される際に、上記ステートメントを含むステートメントの組の個々の確率から、上記ステートメントへの信頼性の値を形成することも可能である。この場合、閾値を超えた信頼性の値のある上記ステートメントのみを保存することは、本発明の更なる実施例において効果的である。この結果として、データベース照会の最終発生まで保存され処理されるステートメントの数は制限される。
【0012】
本発明の別の目的は、ユーザにとって便利である最も信頼できる方法で、データベース照会用のステートメントが決定されることを可能にする装置を提供することである。この目的は、更に独立した請求項で定義される特徴的性質により達成される。
【0013】
【発明の実施の形態】
図1はかかる装置の例を示す。図1はユーザによる音声発言をひろい、それを装置12へ加えるマイクロフォン10を示し、上記音声発言は繰り返してサンプリングされ、サンプル音声信号は、例えば異なる周波数帯における振幅から引き出された音声信号を特徴付ける特徴的な値であるデジタル値に変換される。上記特徴的な値は装置13へ加えられ、メモリ14からの参照値と上記値を比較し、比較結果からのワード仮説を引き出す。
【0014】
装置13は、更なる装置15に加えられるワードグラフとして、終了ワード仮説を出力し、前述のEP 0701353A2 (PHD94.120)に説明されているように、いわゆる概念グラフはメモリ16に保存されたルールによるワードグラフから引き出される。概念グラフにおいて、さまざまなスコアを有する数多くの異なる経路は、概念グラフの始めから最後まで可能である。上記スコアはワードグラフ及びルールのスコアから形成され、概念グラフを通した関係する経路での一連の概念が、ユーザにより実際に話された音声発言に相当する音響的確率の尺度を提供する。
【0015】
上記組のステートメントは更なる装置20に加えられ、ステートメントは整合性をテストされる。この目的のために、ステートメントはまず相互整合性、つまり矛盾の自由がテストされる。さらに、ステートメントは、ユーザとシステムとの間の対話の前の段階中に決定され、メモリ24に一時的に保存された対応するステートメントと比較される。最後に、装置1により与えられた組の中のステートメントは、メモリ22に保存されたデータベースの少なくとも幾つかの情報アイテムと比較される。上記メモリ22は高記憶能力を有するディスクメモリとして、従来から実施されている。例えば、列車スケジュール情報システムの場合における特定の駅名、若しくは電話登録名簿システムにおける特定の加入者の名前などの特定のステートメントが、メモリ22のデータベースに実際に存在しているかどうかが、チェックされる。
【0016】
装置15による個々の組のステートメントに与えられる確率に対応するスコアは、整合性が巧くテストされたステートメントに対する新しいスコアとして、装置20において利用され、新しい確率は上記確率から決定され、整合性のあるステートメントの最善の確率は検出され、新しい確率はメモリ24のステートメントと共に保存される。保存される前に、新しい確率は一定若しくは対話中に適応された閾値と比較される。あるいは、音声発言から引き出された全ての組のステートメントの確率から信頼性の値を作り出すこと、及び同様な方法で閾値と上記信頼性の値が比較され、ステートメントと共に保存することが可能である。確率値若しくは信頼性の値を有する保存されたステートメントは、音声発言から引き出されるステートメントを次の音声発言のテストに用いている間に、再び利用される。
【0017】
各音声発言の処理後、装置20は、完全なデータベース照会用の全てのステートメントが利用可能かどうかを調べる。そうでないのなら、装置20はメモリ24に保存されたステートメント及び確率に応じて音声出力を発生し、増幅器26及び拡声器30を経由して、ユーザにある種の更なるステートメントを有する音声発言を音響的に発するように催促する。このためには、メモリ24からの各時間の高い確率を有するステートメントが利用される。個々のステートメントが正しく、例えばユーザからの次の音声発言の結果として無視された際には、夫々のステートメントはその後の上記音声発言の処理中に消去され、例えば名前のような同じ分類のステートメントは、対話が進行するにつれ、次の低い確率若しくは信頼性で利用される。上記処理は、完全なデータベース照会用の全てのステートメントが満足のいく確率若しくは信頼性で、最終的に利用可能であるまで繰り返される。
【図面の簡単な説明】
【図1】図1は、本発明のよるデータベース照会を実行する装置を示す。
【符号の説明】
10 マイクロフォン
12 装置
13 装置
14 メモリ
15 装置
16 メモリ
20 装置
22 メモリ
24 メモリ
26 増幅器
30 拡声器

Claims (5)

  1. 言語モデルを利用して各音声発言から少なくとも1組のステートメントを引き出し、前記少なくとも1組のステートメントを与える認識装置と、前記認識装置により与えられた各組のステートメントの整合性をテストし、音声出力を発生させる制御装置から成る自然音声での音声発言の形でユーザからのデータベース照会を実行する方法であって、
    前記制御装置によって、前記ユーザからの自然音声から得られる音声発言に対して前記認識装置により引き出された全ての組のステートメントと、全ての保存された組のステートメントとの整合性テストし、整合性のあるステートメント保存、少なくとも一つの音声出力保存ステートメントから引き出ことを特徴とし、
    更に、幾つかの同じ分類のステートメントが前記認識装置により割り当てられた異なる確率で引き出され、前記幾つかの同じ分類のステートメントのうち、少なくともあるステートメントは既に保存されている場合、前記制御装置によって、前記幾つかの同じ分類のステートメントは、最後の音声発言から引き出されたステートメントの確率、及び従来から保存されていたステートメントの確率により決定される混合型確率で保存することを特徴とする方法。
  2. 前記整合性のあるステートメントを保存する場合、前記認識装置により各ステートメントに割り当てられた確率及び整合性がテストされた保存ステートメントの最も高い確率から引き出された確率で保存することを特徴とする請求項1記載の方法。
  3. 前記整合性のあるステートメントを保存する場合、予め設定された閾値を超える確率を有するステートメントのみ保存することを特徴とする請求項2記載の方法。
  4. 前記整合性のあるステートメントを保存する場合、各ステートメントに対して信頼性が夫々のステートメントを含む組のステートメントの確率から引き出され、予め設定された閾値を超える信頼性を有するステートメントのみ保存すること特徴とする請求項2記載の方法。
  5. 言語モデルを利用して各音声発言から少なくとも1組のステートメントを引き出し、前記少なくとも1組のステートメントを与える認識装置と、前記認識装置により与えられた各組のステートメントの整合性をテストし、音声出力を発生させる制御装置から成る自然音声での音声発言の形でユーザからのデータベース照会を実行する装置であって、
    認識装置は各音声発言から複数の組の減少した確率のステートメントを引き出すように改造され、認識装置は複数の異なる組のステートメントを保存させるメモリ装置を含み、制御装置
    - 音声発言から引き出された各組のステートメントを全ての保存された組のステートメントの対応するステートメントと整合性をテストし、
    - 一致した組のステートメントをメモリ装置に保存し、
    - 保存ステートメントから少なくとも一つの音声出力を発生させるように改造されたことを特徴とし、
    更に、幾つかの同じ分類のステートメントが前記認識装置により割り当てられた異なる確率で引き出され、前記幾つかの同じ分類のステートメントのうち、少なくともあるステートメントは既に保存されている場合、前記制御装置は、前記幾つかの同じ分類のステートメントに対して、最後の音声発言から引き出されたステートメントの確率、及び従来から保存されていたステートメントの確率により決定される混合型確率で保存することを特徴とする装置
JP23002999A 1998-08-17 1999-08-16 データベース照会を実行する方法及びその装置 Expired - Fee Related JP4408490B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19837102A DE19837102A1 (de) 1998-08-17 1998-08-17 Verfahren und Anordnung zum Durchführen einer Datenbankanfrage
DE19837102:0 1998-08-17

Publications (2)

Publication Number Publication Date
JP2000105776A JP2000105776A (ja) 2000-04-11
JP4408490B2 true JP4408490B2 (ja) 2010-02-03

Family

ID=7877681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23002999A Expired - Fee Related JP4408490B2 (ja) 1998-08-17 1999-08-16 データベース照会を実行する方法及びその装置

Country Status (4)

Country Link
US (1) US6513037B1 (ja)
EP (1) EP0981129A3 (ja)
JP (1) JP4408490B2 (ja)
DE (1) DE19837102A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7392185B2 (en) * 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US9076448B2 (en) * 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US7050977B1 (en) * 1999-11-12 2006-05-23 Phoenix Solutions, Inc. Speech-enabled server for internet website and method
JP3799280B2 (ja) * 2002-03-06 2006-07-19 キヤノン株式会社 対話システムおよびその制御方法
EP1363271A1 (de) * 2002-05-08 2003-11-19 Sap Ag Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs
DE10220524B4 (de) * 2002-05-08 2006-08-10 Sap Ag Verfahren und System zur Verarbeitung von Sprachdaten und zur Erkennung einer Sprache
DE10220521B4 (de) * 2002-05-08 2005-11-24 Sap Ag Verfahren und System zur Verarbeitung von Sprachdaten und Klassifizierung von Gesprächen
DE10220522B4 (de) * 2002-05-08 2005-11-17 Sap Ag Verfahren und System zur Verarbeitung von Sprachdaten mittels Spracherkennung und Frequenzanalyse
EP1361740A1 (de) * 2002-05-08 2003-11-12 Sap Ag Verfahren und System zur Verarbeitung von Sprachinformationen eines Dialogs
US8386248B2 (en) * 2006-09-22 2013-02-26 Nuance Communications, Inc. Tuning reusable software components in a speech application
JP2009217611A (ja) * 2008-03-11 2009-09-24 Toshiba Corp 音声対話装置
US8661018B2 (en) 2010-08-10 2014-02-25 Lockheed Martin Corporation Data service response plan generator
US8589164B1 (en) * 2012-10-18 2013-11-19 Google Inc. Methods and systems for speech recognition processing using search query information
US10776375B2 (en) 2013-07-15 2020-09-15 Microsoft Technology Licensing, Llc Retrieval of attribute values based upon identified entities
CN105469788A (zh) * 2015-12-09 2016-04-06 百度在线网络技术(北京)有限公司 语音信息验证方法及装置
CN108320743A (zh) * 2018-02-07 2018-07-24 上海速益网络科技有限公司 一种数据录入方法及装置
JP2020086943A (ja) * 2018-11-26 2020-06-04 シャープ株式会社 情報処理装置、情報処理方法、および、プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434777A (en) * 1992-05-27 1995-07-18 Apple Computer, Inc. Method and apparatus for processing natural language
EP0645757B1 (en) * 1993-09-23 2000-04-05 Xerox Corporation Semantic co-occurrence filtering for speech recognition and signal transcription applications
DE19581667C2 (de) * 1994-06-06 1999-03-11 Motorola Inc Spracherkennungssystem und Verfahren zur Spracherkennung
JP3968133B2 (ja) * 1995-06-22 2007-08-29 セイコーエプソン株式会社 音声認識対話処理方法および音声認識対話装置
US5712957A (en) * 1995-09-08 1998-01-27 Carnegie Mellon University Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists
DE19639843A1 (de) * 1996-09-27 1998-04-02 Philips Patentverwaltung Verfahren zum Durchführen von Datenbankanfragen
US6173279B1 (en) * 1998-04-09 2001-01-09 At&T Corp. Method of using a natural language interface to retrieve information from one or more data resources

Also Published As

Publication number Publication date
EP0981129A2 (de) 2000-02-23
US6513037B1 (en) 2003-01-28
EP0981129A3 (de) 2003-12-10
DE19837102A1 (de) 2000-02-24
JP2000105776A (ja) 2000-04-11

Similar Documents

Publication Publication Date Title
JP4408490B2 (ja) データベース照会を実行する方法及びその装置
US6751595B2 (en) Multi-stage large vocabulary speech recognition system and method
US5167004A (en) Temporal decorrelation method for robust speaker verification
US5758319A (en) Method and system for limiting the number of words searched by a voice recognition system
US6470315B1 (en) Enrollment and modeling method and apparatus for robust speaker dependent speech models
US7974842B2 (en) Algorithm for n-best ASR result processing to improve accuracy
JP2768274B2 (ja) 音声認識装置
US5987409A (en) Method of and apparatus for deriving a plurality of sequences of words from a speech signal
US7865364B2 (en) Avoiding repeated misunderstandings in spoken dialog system
US6546369B1 (en) Text-based speech synthesis method containing synthetic speech comparisons and updates
US8423354B2 (en) Speech recognition dictionary creating support device, computer readable medium storing processing program, and processing method
US20170270923A1 (en) Voice processing device and voice processing method
KR100379994B1 (ko) 문법적 제한사항을 갖는 라벨러를 이용한 구두 발언 거절
JPH11231895A (ja) 音声認識方法及びその装置
JP2002215184A (ja) 音声認識装置、及びプログラム
US6934680B2 (en) Method for generating a statistic for phone lengths and method for determining the length of individual phones for speech synthesis
JPS6326699A (ja) 連続語認識記録方法
US8688452B2 (en) Automatic generation of distractors for special-purpose speech recognition grammars
JP2905686B2 (ja) 音声認識装置
JP2731133B2 (ja) 連続音声認識装置
US20240144934A1 (en) Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium
JPH10105190A (ja) データベースへの照会を実施する方法
JP3818154B2 (ja) 音声認識方法
JP2864511B2 (ja) 話者識別方式と装置
JP3357752B2 (ja) パターンマッチング装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090519

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091104

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091110

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121120

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121120

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131120

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees