JP4408490B2 - データベース照会を実行する方法及びその装置 - Google Patents
データベース照会を実行する方法及びその装置 Download PDFInfo
- Publication number
- JP4408490B2 JP4408490B2 JP23002999A JP23002999A JP4408490B2 JP 4408490 B2 JP4408490 B2 JP 4408490B2 JP 23002999 A JP23002999 A JP 23002999A JP 23002999 A JP23002999 A JP 23002999A JP 4408490 B2 JP4408490 B2 JP 4408490B2
- Authority
- JP
- Japan
- Prior art keywords
- statements
- statement
- probability
- speech
- drawn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 14
- 238000012360 testing method Methods 0.000 claims description 7
- 230000003993 interaction Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
【発明の属する技術分野】
本発明は、データ処理装置によりデータベース照会を実行する方法に関し、照会は自然音声での複数の音声発言の形でユーザにより入力され、データ処理装置は各音声発言に応じて音声出力を発生させ、認識装置は各音声発言を言語モデルを利用して音響的に最も高い確率の少なくとも1組のステートメントに変換させ、そのステートメントは整合性がテストされ、一致したステートメントは本目的に適する装置に保存される。
【0002】
【従来の技術】
かかる方法及び対応する装置は、DE19639843.
6A1(PHD96.167)に開示されている。各音声発言から引き出され、巧く整合性がテストされた最も高い確率のステートメントは、装置内に保存される。上記ステートメントは次の音声発言から引き出されたステートメントの整合性をテストするために利用され、最終的にデータベース照会用に利用される。システムにより発せられる音声出力により、データベース照会に必要な全てのステートメントが得られるまで、ユーザは音声応答を与えるように何度も催促される。よって、システムにより発せられる各音声出力は、先行する音声発言及びそれから引き出されたステートメントに限られた程度に依存する。
【0003】
しかしながら、本方法では音声発言を通してユーザにより意図された正しいステートメントは、例えばユーザによる不十分な発音に起因して、最も高い確率ではなく低い確率で認識されることが起こり得る。上記の低い確率のステートメントはもはや追跡されないので、ユーザとの対話が最も高い確率で間違って認識され続け、このステートメントが正しくない場合には、最終のデータベース照会は間違ったステートメントから引き出されることが最終的に起こり得る。
【0004】
WO96/13030において、電話照会サービス用の装置及びその方法が開示され、複数のステートメントはユーザの各音声発言から引き出され、保存される。しかしながら、システムによりユーザへ提供される音声出力は、固定スキームに従って進行し、次の音声発言から引き出されるステートメントと比較されるデータベースからのデータ量を減少させるために、今までに引き出されたステートメントが利用される。
【0005】
【発明が解決しようとする課題】
本発明は上述の点に鑑みてなされたものであり、ユーザにとってできる限り信頼でき、かつできる限り便利である方法で、データベース照会に必要な全てのステートメントを引き出すことが幅広い応用分野において可能であり、オープニングパラグラフで定義されたタイプの方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
上記の目的は、言語モデルを利用して各音声発言から少なくとも1組のステートメントを引き出し、前記少なくとも1組のステートメントを与える認識装置と、前記認識装置により与えられた各組のステートメントの整合性をテストし、音声出力を発生させる制御装置から成る自然音声での音声発言の形でユーザからのデータベース照会を実行する方法であって、前記制御装置によって、前記ユーザからの自然音声から得られる音声発言に対して前記認識装置により引き出された全ての組のステートメントと、全ての保存された組のステートメントとの整合性をテストし、整合性のあるステートメントを保存し、少なくとも一つの音声出力を保存ステートメントから引き出すことを特徴とし、更に、幾つかの同じ分類のステートメントが前記認識装置により割り当てられた異なる確率で引き出され、前記幾つかの同じ分類のステートメントのうち、少なくともあるステートメントは既に保存されている場合、前記制御装置によって、前記幾つかの同じ分類のステートメントは、最後の音声発言から引き出されたステートメントの確率、及び従来から保存されていたステートメントの確率により決定される混合型確率で保存することにより達成される。
【0007】
よって、一致し、結果として有用である全てのステートメントが保存されるわけではないが、上記ステートメントからシステムにより発せられる次の音声出力を引き出すために、従来からの所定ステートメントと同様に上記ステートメントも各対話段階で利用されることが好ましい。この結果として、例えば電話照会サービスの場合における所望の加入者の都市及び通り、又は列車スケジュールサービスの場合における駅若しくは出発時間又は目的地に関する一般の音声出力を発するだけでなく、代わりの形態が望ましいのなら、例えば特定のステートメントを調べるために、つまりユーザにかかるステートメントを繰り返し行うように特定の質問を尋ねることも、同様に可能である。
【0008】
個々のステートメントは、音声信号で若しくはEP702353A2 (PHD94.120)に説明された方法で、個々の十分な確率のある全ての言葉を決定することにより、音声発言から引き出すことが可能である。前記方法において、ワードグラフが音声発言から引き出され、端からデータベース照会に関係するステートメント若しくはその情報が抽出される。さらに、一般言語モデル及び専用ルールが採用される。例えば、ステートメント“p. m. ”及び“3時”はステートメント“15. 00時”と同意義である。
【0009】
特に音声発言からステートメントを引き出す上記既知方法では、異なるステートメントが、例えば名前、時間指摘などのような同じ分類のステートメントに対して得られるが、これらは音声発言と異なる類似の結果として、言語モデルのような更なるルールによりさまざまな可能性を有する。よって、本発明の実施例は、各ステートメントが、ステートメントに割り当てられた確率及び整合性を巧くテストされた保存ステートメントの最も高い確率から引き出された確率で保存されることを特徴とする。認識中に、例えば幾つかの名前が異なる確率で引き出され、少なくともある名前が既に保存されており、それらの名前は、最後の音声発言から引き出されたステートメントの、及び従来から保存さえていたステートメントの確率により決定された混合型確率で保存される。
【0010】
ステートメントが音声信号から引き出される際に、認識装置は、例えば一定の数のステートメント若しくは一定の閾値以上の確率を有するステートメントという限られた数のステートメントを与える。一般に、このことは各対話段階で、つまり各新しい音声発言で、全てのステートメントの全数は増加するという結果をもたらす。この効果を制限させるために、本発明の更なる実施例によれば、閾値を超えた確率を有するステートメントのみを保存することが効果的である。これはステートメント自身の確率から生じる混合型確率と、保存されたステートメントと一致する最も高い確率との双方に関係する。
【0011】
ステートメントの幾つかの順序が音声発言により引き出される際に、上記ステートメントを含むステートメントの組の個々の確率から、上記ステートメントへの信頼性の値を形成することも可能である。この場合、閾値を超えた信頼性の値のある上記ステートメントのみを保存することは、本発明の更なる実施例において効果的である。この結果として、データベース照会の最終発生まで保存され処理されるステートメントの数は制限される。
【0012】
本発明の別の目的は、ユーザにとって便利である最も信頼できる方法で、データベース照会用のステートメントが決定されることを可能にする装置を提供することである。この目的は、更に独立した請求項で定義される特徴的性質により達成される。
【0013】
【発明の実施の形態】
図1はかかる装置の例を示す。図1はユーザによる音声発言をひろい、それを装置12へ加えるマイクロフォン10を示し、上記音声発言は繰り返してサンプリングされ、サンプル音声信号は、例えば異なる周波数帯における振幅から引き出された音声信号を特徴付ける特徴的な値であるデジタル値に変換される。上記特徴的な値は装置13へ加えられ、メモリ14からの参照値と上記値を比較し、比較結果からのワード仮説を引き出す。
【0014】
装置13は、更なる装置15に加えられるワードグラフとして、終了ワード仮説を出力し、前述のEP 0701353A2 (PHD94.120)に説明されているように、いわゆる概念グラフはメモリ16に保存されたルールによるワードグラフから引き出される。概念グラフにおいて、さまざまなスコアを有する数多くの異なる経路は、概念グラフの始めから最後まで可能である。上記スコアはワードグラフ及びルールのスコアから形成され、概念グラフを通した関係する経路での一連の概念が、ユーザにより実際に話された音声発言に相当する音響的確率の尺度を提供する。
【0015】
上記組のステートメントは更なる装置20に加えられ、ステートメントは整合性をテストされる。この目的のために、ステートメントはまず相互整合性、つまり矛盾の自由がテストされる。さらに、ステートメントは、ユーザとシステムとの間の対話の前の段階中に決定され、メモリ24に一時的に保存された対応するステートメントと比較される。最後に、装置1により与えられた組の中のステートメントは、メモリ22に保存されたデータベースの少なくとも幾つかの情報アイテムと比較される。上記メモリ22は高記憶能力を有するディスクメモリとして、従来から実施されている。例えば、列車スケジュール情報システムの場合における特定の駅名、若しくは電話登録名簿システムにおける特定の加入者の名前などの特定のステートメントが、メモリ22のデータベースに実際に存在しているかどうかが、チェックされる。
【0016】
装置15による個々の組のステートメントに与えられる確率に対応するスコアは、整合性が巧くテストされたステートメントに対する新しいスコアとして、装置20において利用され、新しい確率は上記確率から決定され、整合性のあるステートメントの最善の確率は検出され、新しい確率はメモリ24のステートメントと共に保存される。保存される前に、新しい確率は一定若しくは対話中に適応された閾値と比較される。あるいは、音声発言から引き出された全ての組のステートメントの確率から信頼性の値を作り出すこと、及び同様な方法で閾値と上記信頼性の値が比較され、ステートメントと共に保存することが可能である。確率値若しくは信頼性の値を有する保存されたステートメントは、音声発言から引き出されるステートメントを次の音声発言のテストに用いている間に、再び利用される。
【0017】
各音声発言の処理後、装置20は、完全なデータベース照会用の全てのステートメントが利用可能かどうかを調べる。そうでないのなら、装置20はメモリ24に保存されたステートメント及び確率に応じて音声出力を発生し、増幅器26及び拡声器30を経由して、ユーザにある種の更なるステートメントを有する音声発言を音響的に発するように催促する。このためには、メモリ24からの各時間の高い確率を有するステートメントが利用される。個々のステートメントが正しく、例えばユーザからの次の音声発言の結果として無視された際には、夫々のステートメントはその後の上記音声発言の処理中に消去され、例えば名前のような同じ分類のステートメントは、対話が進行するにつれ、次の低い確率若しくは信頼性で利用される。上記処理は、完全なデータベース照会用の全てのステートメントが満足のいく確率若しくは信頼性で、最終的に利用可能であるまで繰り返される。
【図面の簡単な説明】
【図1】図1は、本発明のよるデータベース照会を実行する装置を示す。
【符号の説明】
10 マイクロフォン
12 装置
13 装置
14 メモリ
15 装置
16 メモリ
20 装置
22 メモリ
24 メモリ
26 増幅器
30 拡声器
Claims (5)
- 言語モデルを利用して各音声発言から少なくとも1組のステートメントを引き出し、前記少なくとも1組のステートメントを与える認識装置と、前記認識装置により与えられた各組のステートメントの整合性をテストし、音声出力を発生させる制御装置から成る自然音声での音声発言の形でユーザからのデータベース照会を実行する方法であって、
前記制御装置によって、前記ユーザからの自然音声から得られる音声発言に対して前記認識装置により引き出された全ての組のステートメントと、全ての保存された組のステートメントとの整合性をテストし、整合性のあるステートメントを保存し、少なくとも一つの音声出力を保存ステートメントから引き出すことを特徴とし、
更に、幾つかの同じ分類のステートメントが前記認識装置により割り当てられた異なる確率で引き出され、前記幾つかの同じ分類のステートメントのうち、少なくともあるステートメントは既に保存されている場合、前記制御装置によって、前記幾つかの同じ分類のステートメントは、最後の音声発言から引き出されたステートメントの確率、及び従来から保存されていたステートメントの確率により決定される混合型確率で保存することを特徴とする方法。 - 前記整合性のあるステートメントを保存する場合、前記認識装置により各ステートメントに割り当てられた確率及び整合性がテストされた保存ステートメントの最も高い確率から引き出された確率で保存することを特徴とする請求項1記載の方法。
- 前記整合性のあるステートメントを保存する場合、予め設定された閾値を超える確率を有するステートメントのみを保存することを特徴とする請求項2記載の方法。
- 前記整合性のあるステートメントを保存する場合、各ステートメントに対して信頼性が夫々のステートメントを含む組のステートメントの確率から引き出され、予め設定された閾値を超える信頼性を有するステートメントのみを保存すること特徴とする請求項2記載の方法。
- 言語モデルを利用して各音声発言から少なくとも1組のステートメントを引き出し、前記少なくとも1組のステートメントを与える認識装置と、前記認識装置により与えられた各組のステートメントの整合性をテストし、音声出力を発生させる制御装置から成る自然音声での音声発言の形でユーザからのデータベース照会を実行する装置であって、
認識装置は各音声発言から複数の組の減少した確率のステートメントを引き出すように改造され、認識装置は複数の異なる組のステートメントを保存させるメモリ装置を含み、制御装置は
- 音声発言から引き出された各組のステートメントを全ての保存された組のステートメントの対応するステートメントと整合性をテストし、
- 一致した組のステートメントをメモリ装置に保存し、
- 保存ステートメントから少なくとも一つの音声出力を発生させるように改造されたことを特徴とし、
更に、幾つかの同じ分類のステートメントが前記認識装置により割り当てられた異なる確率で引き出され、前記幾つかの同じ分類のステートメントのうち、少なくともあるステートメントは既に保存されている場合、前記制御装置は、前記幾つかの同じ分類のステートメントに対して、最後の音声発言から引き出されたステートメントの確率、及び従来から保存されていたステートメントの確率により決定される混合型確率で保存することを特徴とする装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19837102A DE19837102A1 (de) | 1998-08-17 | 1998-08-17 | Verfahren und Anordnung zum Durchführen einer Datenbankanfrage |
DE19837102:0 | 1998-08-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000105776A JP2000105776A (ja) | 2000-04-11 |
JP4408490B2 true JP4408490B2 (ja) | 2010-02-03 |
Family
ID=7877681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP23002999A Expired - Fee Related JP4408490B2 (ja) | 1998-08-17 | 1999-08-16 | データベース照会を実行する方法及びその装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6513037B1 (ja) |
EP (1) | EP0981129A3 (ja) |
JP (1) | JP4408490B2 (ja) |
DE (1) | DE19837102A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7392185B2 (en) * | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US9076448B2 (en) * | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US7050977B1 (en) * | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
JP3799280B2 (ja) * | 2002-03-06 | 2006-07-19 | キヤノン株式会社 | 対話システムおよびその制御方法 |
EP1363271A1 (de) * | 2002-05-08 | 2003-11-19 | Sap Ag | Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs |
DE10220524B4 (de) * | 2002-05-08 | 2006-08-10 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachdaten und zur Erkennung einer Sprache |
DE10220521B4 (de) * | 2002-05-08 | 2005-11-24 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachdaten und Klassifizierung von Gesprächen |
DE10220522B4 (de) * | 2002-05-08 | 2005-11-17 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachdaten mittels Spracherkennung und Frequenzanalyse |
EP1361740A1 (de) * | 2002-05-08 | 2003-11-12 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachinformationen eines Dialogs |
US8386248B2 (en) * | 2006-09-22 | 2013-02-26 | Nuance Communications, Inc. | Tuning reusable software components in a speech application |
JP2009217611A (ja) * | 2008-03-11 | 2009-09-24 | Toshiba Corp | 音声対話装置 |
US8661018B2 (en) | 2010-08-10 | 2014-02-25 | Lockheed Martin Corporation | Data service response plan generator |
US8589164B1 (en) * | 2012-10-18 | 2013-11-19 | Google Inc. | Methods and systems for speech recognition processing using search query information |
US10776375B2 (en) | 2013-07-15 | 2020-09-15 | Microsoft Technology Licensing, Llc | Retrieval of attribute values based upon identified entities |
CN105469788A (zh) * | 2015-12-09 | 2016-04-06 | 百度在线网络技术(北京)有限公司 | 语音信息验证方法及装置 |
CN108320743A (zh) * | 2018-02-07 | 2018-07-24 | 上海速益网络科技有限公司 | 一种数据录入方法及装置 |
JP2020086943A (ja) * | 2018-11-26 | 2020-06-04 | シャープ株式会社 | 情報処理装置、情報処理方法、および、プログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434777A (en) * | 1992-05-27 | 1995-07-18 | Apple Computer, Inc. | Method and apparatus for processing natural language |
EP0645757B1 (en) * | 1993-09-23 | 2000-04-05 | Xerox Corporation | Semantic co-occurrence filtering for speech recognition and signal transcription applications |
DE19581667C2 (de) * | 1994-06-06 | 1999-03-11 | Motorola Inc | Spracherkennungssystem und Verfahren zur Spracherkennung |
JP3968133B2 (ja) * | 1995-06-22 | 2007-08-29 | セイコーエプソン株式会社 | 音声認識対話処理方法および音声認識対話装置 |
US5712957A (en) * | 1995-09-08 | 1998-01-27 | Carnegie Mellon University | Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists |
DE19639843A1 (de) * | 1996-09-27 | 1998-04-02 | Philips Patentverwaltung | Verfahren zum Durchführen von Datenbankanfragen |
US6173279B1 (en) * | 1998-04-09 | 2001-01-09 | At&T Corp. | Method of using a natural language interface to retrieve information from one or more data resources |
-
1998
- 1998-08-17 DE DE19837102A patent/DE19837102A1/de not_active Withdrawn
-
1999
- 1999-08-09 EP EP99202592A patent/EP0981129A3/de not_active Withdrawn
- 1999-08-16 JP JP23002999A patent/JP4408490B2/ja not_active Expired - Fee Related
- 1999-08-17 US US09/375,947 patent/US6513037B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0981129A2 (de) | 2000-02-23 |
US6513037B1 (en) | 2003-01-28 |
EP0981129A3 (de) | 2003-12-10 |
DE19837102A1 (de) | 2000-02-24 |
JP2000105776A (ja) | 2000-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4408490B2 (ja) | データベース照会を実行する方法及びその装置 | |
US6751595B2 (en) | Multi-stage large vocabulary speech recognition system and method | |
US5167004A (en) | Temporal decorrelation method for robust speaker verification | |
US5758319A (en) | Method and system for limiting the number of words searched by a voice recognition system | |
US6470315B1 (en) | Enrollment and modeling method and apparatus for robust speaker dependent speech models | |
US7974842B2 (en) | Algorithm for n-best ASR result processing to improve accuracy | |
JP2768274B2 (ja) | 音声認識装置 | |
US5987409A (en) | Method of and apparatus for deriving a plurality of sequences of words from a speech signal | |
US7865364B2 (en) | Avoiding repeated misunderstandings in spoken dialog system | |
US6546369B1 (en) | Text-based speech synthesis method containing synthetic speech comparisons and updates | |
US8423354B2 (en) | Speech recognition dictionary creating support device, computer readable medium storing processing program, and processing method | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
KR100379994B1 (ko) | 문법적 제한사항을 갖는 라벨러를 이용한 구두 발언 거절 | |
JPH11231895A (ja) | 音声認識方法及びその装置 | |
JP2002215184A (ja) | 音声認識装置、及びプログラム | |
US6934680B2 (en) | Method for generating a statistic for phone lengths and method for determining the length of individual phones for speech synthesis | |
JPS6326699A (ja) | 連続語認識記録方法 | |
US8688452B2 (en) | Automatic generation of distractors for special-purpose speech recognition grammars | |
JP2905686B2 (ja) | 音声認識装置 | |
JP2731133B2 (ja) | 連続音声認識装置 | |
US20240144934A1 (en) | Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium | |
JPH10105190A (ja) | データベースへの照会を実施する方法 | |
JP3818154B2 (ja) | 音声認識方法 | |
JP2864511B2 (ja) | 話者識別方式と装置 | |
JP3357752B2 (ja) | パターンマッチング装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060802 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090519 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090819 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091104 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091110 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121120 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121120 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131120 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |