JP2003029784A - データベースのエントリを決定する方法 - Google Patents

データベースのエントリを決定する方法

Info

Publication number
JP2003029784A
JP2003029784A JP2002118436A JP2002118436A JP2003029784A JP 2003029784 A JP2003029784 A JP 2003029784A JP 2002118436 A JP2002118436 A JP 2002118436A JP 2002118436 A JP2002118436 A JP 2002118436A JP 2003029784 A JP2003029784 A JP 2003029784A
Authority
JP
Japan
Prior art keywords
dictionary
entry
database
entries
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002118436A
Other languages
English (en)
Other versions
JP4741777B2 (ja
Inventor
Stefanie Krass
クラース シュテファニー
Henrik Hodam
ホーダム ヘンリク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2003029784A publication Critical patent/JP2003029784A/ja
Application granted granted Critical
Publication of JP4741777B2 publication Critical patent/JP4741777B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/187Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ユーザによる使い心地に影響を与えずに追加
的な費用を最小限としつつユーザへ出力されるデータベ
ースエントリをサーチすることを目的とする。 【解決手段】 本発明の自動対話システムによりデータ
ベースのエントリを決定する方法は、音声入力を一時的
に記憶する段階と、音声入力を自動音声認識装置で処理
し、各辞書エントリが少なくとも1つの音響リファレン
スを含む第1の辞書エントリ集合を有する第1の辞書を
用いて音声認識結果を生成する段階と、音声認識結果に
対応するデータベースエントリについてサーチする段階
と、データベースエントリが見つからない場合は、少な
くとも1つの辞書エントリが第1の辞書エントリ集合と
は異なる第2の辞書エントリ集合を有するよう、第1の
辞書を適応し、一時的に記憶された音声発話と適応され
た第1の辞書とを用いて自動音声認識装置による処理及
びデータベースのサーチの段階を繰り返す段階とを含
む。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は自動対話システムに
よってデータベースのデータベースエントリを決定する
方法に関する。
【0002】
【従来の技術】対話システムの自動的な動作を保証する
ため、一般的に、辞書エントリ(音声認識装置の語彙)
を用いて辞書にアクセスし、隠れマルコフモデルに基づ
いて動作する自動音声認識装置が用いられる。辞書エン
トリは、音声認識手順において音声入力と比較される音
声認識装置用の音響リファレンスを含む。音響リファレ
ンスは、例えば一連の音素を表わす。本発明による方法
は、例えば「イエローページ」サービスに関連する。こ
のようなサービスを用いて、各ユーザは、要求されてい
る地区の利用可能な提供者から、例えば医者、販売者又
は他の企業についての情報、また、警察、プール、学校
等の公共の設備についての情報を得ることができる。電
話を通じたこのような地区情報システム、即ち職業別電
話情報の形式のシステムは周知である。
【0003】更に、例えばインターネット又はイントラ
ネットのためのデータネットワークにおいてかかる情報
システムが既に知られている。端末は、情報システムの
種別に応じて、電話機、移動電話機、適切な電話機能を
有するコンピュータ又はオーガナイザ等であるか、純粋
なデータネットワーク中の情報システムが使用される場
合は例えばWAP移動電話機といった関連するネットワ
ークへの対応するアクセス機能を有するPC又はオーガ
ナイザ又は移動電話機が使用される。サーチパラメータ
は、例えば、地区、職業分野、或いは場所、又は、例え
ば「医師」或いは「ホメオパシー」或いは「ミュンヘ
ン」といった関連するサーチ概念といった種々のサーチ
規準である。加入者データは、例えば、情報システムに
加入している供給者にユーザが接触すること又は連絡を
とることを可能とする電話番号、住所、又は他の情報、
即ち情報システムのデータベースに含まれる情報であり
うる。公知のシステムでは、辞書は例えば地区の入力と
いったあるカテゴリの音声入力のために使用され、この
辞書は計算上の費用を制限するために音声認識システム
上の要求に応じて調整される。
【0004】
【発明が解決しようとする課題】ここで、当該の音声認
識の結果について行われるデータベースのサーチにおい
て、ユーザへ出力されうる関連するデータベースエント
リが見いだせないという問題が生ずる。本発明は、ユー
ザによる使い心地ができる限り影響を受けないよう追加
的な計算上の費用を最小限としつつ上述の問題を解決す
ることを目的とする。
【0005】
【課題を解決するための手段】上述の目的は、(1)音
声入力を一時的に記憶する段階と、(2)音声入力を自
動音声認識装置によって処理し、各辞書エントリが少な
くとも1つの音響リファレンスを含む第1の辞書エント
リ集合を有する第1の辞書を用いて音声認識結果を生成
する段階と、(3)音声認識結果に対応するデータベー
スエントリについてサーチする段階と、(4)段階
(3)においてデータベースエントリが見つからない場
合は、少なくとも1つの辞書エントリが第1の辞書エン
トリ集合とは異なる第2の辞書エントリ集合を有するよ
う、第1の辞書を適応し、一時的に記憶された音声発話
と適応された第1の辞書とを用いて段階(2)及び
(3)を繰り返す段階とを含む上述の方法によって達成
される。
【0006】最初のデータベースのサーチが成功しなか
った場合でも、ユーザは音声の発話によって生成される
音声入力を繰り返す必要がない。一時的に記憶された音
声入力は、適応された辞書を用いた第2の音声認識動作
にも使用される。辞書は動的に適応される。辞書の適用
の方法は、出来る限り小さい辞書で考慮されている音声
認識結果に対してデータベースの入力の割当てが成功す
る確率を最大とすることを保証するよう選択される。特
に、第1の辞書を適応するためにそのエントリが使用さ
れうる総合辞書が使用される(請求項2)。
【0007】請求項3は、音声入力の質が低く割当て可
能なデータベースエントリがない場合に本発明による方
法が予め設定された基準に従って中断されることを保証
する。
【0008】請求項4及び請求項5は、音声認識のため
に使用される第1の辞書がデータベースエントリのカテ
ゴリに関連付けられる実施例を示す。請求項4に記載の
ように辞書を適応するとき、データベースエントリのカ
テゴリ(例えば地区)の制限内で、追加的な辞書エント
リが追加されるか、辞書エントリが変更される。請求項
4は、第1の辞書の適応のために、辞書のエントリがカ
テゴリの外で適応される実施例を開示する。適応される
前の第1の辞書がデータベースエントリの特定のカテゴ
リに属する辞書エントリを含む場合、適応された後は、
第1の辞書は関連するカテゴリ(例えば関連する地区)
に属する少なくとも1つの辞書エントリを含む。
【0009】請求項6に記載の実施例では、音声入力に
対してデータベースエントリを割り当てることができな
い場合、辞書は個々の音声認識結果の選択肢に対して適
応されるだけでなく、音声認識の選択肢は辞書が適応さ
れるときにも考慮される。従って、新規な音声認識動作
により、データベースエントリが一時的に記憶された音
声入力に対して割り当てられうる確率が高まる。
【0010】本発明による方法は、特に、対話システム
へのアクセスが特に電話インタフェース(請求項8)を
通じて行われるイエローページのデータの集合(請求項
7)においてエントリを決定するために使用される。
【0011】また、本発明は、本発明による方法を実施
するために使用される自動対話システムに関する。
【0012】
【発明の実施の形態】以下、本発明の実施例について図
面を参照して詳述する。図1は、本実施例では電話イン
タフェースであるインタフェース2を有する対話システ
ム1を示す。対話システム1は、インタフェース2を通
じて、また構内交換機が利用可能であればこれを介し
て、電話網に接続される。メモリ3が設けられ、これに
受信される音声入力が音声ファイルとして一時的に記憶
されうる。自動音声認識装置4は、メモリ3に記憶され
た音声認識の自動認識を行う。音声認識装置4は、音声
認識モジュール5と辞書6とを含み、辞書のエントリは
音声認識装置4によって利用可能な語彙を構成する。各
辞書エントリは、語又は単語を示す少なくとも1つの音
響リファレンスを含む。各音響リファレンスは、少なく
とも1つの状態を有する隠れマルコフモデル(HMM)
に対応する。音声認識モジュール5は、ここでは辞書6
を除く音声認識装置4の全ての機能を含む。音声認識装
置4は、例えばフィリップス社製のシステム「Speech P
earl」を用いて実施されうる。
【0013】本発明による対話システム1では、音声認
識装置4によって用いられる辞書6は、設定されている
ものではなく、動的に適応可能である。本例では、辞書
6の辞書エントリは、総合辞書7の部分集合を構成す
る。総合辞書7は、辞書6のための辞書エントリの貯蔵
部を構成する。中央対話制御・管理ユニット8は、ユー
ザとの対話を制御すると共に辞書6の適応を制御する。
ユニット8は特定用途向けデータを有するデータベース
9にアクセス可能であり、音声出力を生成しこれをイン
タフェース2を介してユーザへ出力する音声出力ユニッ
ト10を制御する。
【0014】データベース9に記憶された特定用途向け
データは、各用途に対して予め設定されうる対話構造を
定義する。従って、例えばユーザとの対話は、挨拶から
始まり続いて特定の音声入力のアクティブ化の要求がな
されうる。ユーザによる続く音声入力は、インタフェー
ス2を介して受信されメモリ3に一時的に記憶される。
一時的に記憶された音声入力3は、自動音声認識装置4
によって音声認識結果へ変化され、音声認識結果はユニ
ット8へ与えられ、音声認識結果に応じて、データベー
ス9に記憶されたデータに従って予め指定されたような
ユーザとの対話を続けるか、対話を終了する。
【0015】図2は、本発明の更なる説明のためのフロ
ーチャートを示す図である。本発明について、ユーザが
地区情報を検索しうるイエローページデータ集合へのア
クセスの例を用いて説明する。本例では、地区情報はデ
ータベース9に記憶され、例えば複数の企業名、夫々の
場所、関連する地区、通りの名前、電話番号、及び郵便
番号を含む。電話の呼によりユーザにより対話システム
1へアクセスした後、対話システム1はユーザへの挨拶
定型文を出力し、町名を入力するよう求める。ステップ
20において町名が入力され正しく検出されると、ステ
ップ21においてユーザに対して地区を入力するよう要
求する。ステップ22において音声入力によって地区を
入力した後、ステップ23においてこの音声入力はメモ
リ中に音声ファイルとして一時的に記憶される。ステッ
プ24において、音声認識装置4を用いて一時的に記憶
された音声入力に対して音声認識手順が実行される。こ
のために、限られた数の地区名を表わす辞書LEX
(1)が使用され、即ち音声認識装置によって使用され
る語彙はこのようにステップ24において制限される。
ステップ24において発生した音声認識結果を用いて、
つづくステップ25において、認識されたセクタ名及び
町名に対してデータベース9に記憶された企業名を探す
ために対話制御・管理ユニット8によってデータベース
9におけるデータベースサーチが実行される。
【0016】ステップ26において、認識されたブラン
チ名に属する少なくとも1つのデータベースエントリが
見つかると、ステップ35において対応する企業名及び
存在する場合は更なる関連する企業情報がユーザへ出力
されるか、必要な情報をより詳細に指定するよう(例え
ば郵便番号又は通りの名前を入力することによって行わ
れる)ユーザに求める音声出力を用いてユーザとの対話
を続ける。しかしながら、ステップ26において、デー
タベース9には認識された町名及びセクタ名に対応する
データベースエントリが見つからない場合、ステップ2
7において、先行する音声認識手順で使用される辞書6
のバージョンを示すために用いられるパラメータnは、
n=1に設定される。ステップ28において、辞書6
は、辞書バージョンLEX(n)が少なくとも1つの辞
書エントリについて辞書バージョンLEX(n)とは異
なる辞書バージョンLEX(n+1)へ変形されるよ
う、適応される。辞書バージョンLEX(n+1)と比
較して、辞書バージョンLEX(n)は限られた数のセ
クタ名を表わす辞書エントリを含み、nが増加するにつ
れあまり頻繁に探されない地区名も考慮される。辞書の
拡張は、データベース9に記憶された割当てテーブルに
よって決まる。
【0017】総合辞書7の利用可能な辞書エントリがカ
テゴリに分割されると、辞書は、カテゴリ内及び/又は
カテゴリ間で適応されうる。辞書エントリの特定のカテ
ゴリについての例は、例えば特定の町に対する地区名の
数である。カテゴリ内の辞書適応は、その町に割り当て
られた他の及び/又は追加的な地区名が辞書6の作成の
ために考慮された場合に生じうる。カテゴリ間の辞書の
適応の場合、すなわち本例では辞書の適応の場合、例え
ば認識された町に近い他の町に割り当てられた地区名も
考慮に入れられる。この場合も、割当てはデータベース
9に記憶された割当てテーブル中で定義される。原理的
には、当該の用途及び辞書の適応についての要求から生
ずる多数のカテゴリが存在することが可能であり、この
ために最適化される。
【0018】ステップ28において辞書を適応させた
後、ステップ29において、変更された辞書LEX(n
+1)を用いて音声認識方法が行われる。既知の地区を
表わす音声認識結果が決定され、町が既に知られている
ときに、対話制御・管理ユニット8によってデータベー
ス9の更なるデータベースサーチが行われる。ステップ
31において、データベースのサーチによって認識され
た町に対するエントリ(地区名)が与えられることがわ
かると、方法は、ステップ35と同様にデータ出力を行
うステップ36へ進む。
【0019】ステップ31において、やはり割り当てら
れうるデータベースがないことがわかると、ステップ3
2においてパラメータnは1ずつインクリメントされ
る。ステップ33において、中断判定基準が満たされて
いるかチェックする。本例では、中断判定基準は先験的
に設定される数字Nによって表わされる。数字Nは、辞
書の所望の適応の回数を表わす。ステップ33において
中断判定基準がまだ満たされてない場合(n≦N)、シ
ステムはステップ28へ戻る。ステップ33において、
中断判定基準が満たされた、即ちn>Nであるとわかる
と、対話システム1によるユーザ入力の処理は中断され
る。本例では、対話システム1とユーザとの間の対話は
中断され、ステップ34において所望のデータをユーザ
によって利用可能とするために、ユーザは電話オペレー
タに接続される。
【0020】本発明の実施例では、音声認識装置1は、
個々の音声認識結果を供給するだけでなく、N≧1の最
善の認識結果の選択肢の数Nも与える。この場合、辞書
6の適応は、音声認識装置4によって供給される1以上
の認識結果の選択肢に依存する。このように、音声認識
装置6は、例えば地区名の入力の後に認識結果として2
つの同様の音の地区名を出力し、2つの音声認識結果の
選択肢はそれらの信頼性に従って順序付けられる。デー
タベース9に、その中に記憶された割当てテーブルに、
音声認識結果の選択肢として決定された2つの地区名に
ついて辞書6の適応のための異なる割当てが与えられ、
これらは辞書6の適応にも考慮される。
【図面の簡単な説明】
【図1】対話システムを示すブロック回路図である。
【図2】本発明による方法を説明するためのフローチャ
ートである。
【符号の説明】 1 対話システム 2 インタフェース 3 メモリ 4 音声認識装置 5 音声認識モジュール 6 辞書 7 総合辞書 8 対話制御・管理ユニット 9 データベース 10 音声出力ユニット
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/14 G10L 3/00 571U 535Z (72)発明者 シュテファニー クラース ドイツ連邦共和国,52068 アーヘン,ぺ リゼルカーシュトラーセ 84 (72)発明者 ヘンリク ホーダム ドイツ連邦共和国,52070 アーヘン,ア ム ヴォルフ 4 Fターム(参考) 5B075 NK02 NK34 PP07 PQ04 UU40 5D015 AA05 HH11

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 (1)音声入力を一時的に記憶する段階
    と、 (2)上記音声入力を自動音声認識装置によって処理
    し、各辞書エントリが少なくとも1つの音響リファレン
    スを含む第1の辞書エントリ集合を有する第1の辞書を
    用いて音声認識結果を生成する段階と、 (3)上記音声認識結果に対応するデータベースエント
    リについてサーチする段階と、 (4)上記段階(3)においてデータベースエントリが
    見つからない場合は、 少なくとも1つの辞書エントリが上記第1の辞書エント
    リ集合とは異なる第2の辞書エントリ集合を有するよ
    う、上記第1の辞書を適応し、 上記一時的に記憶された音声発話と上記適応された第1
    の辞書とを用いて上記段階(2)及び(3)を繰り返す
    段階とを含む、 自動対話システムによってデータベースのデータベース
    エントリを決定する方法。
  2. 【請求項2】 上記辞書エントリは総合辞書として用い
    られる第2の辞書から得られることを特徴とする、請求
    項1記載の方法。
  3. 【請求項3】 上記段階(2)乃至(4)は、中断判定
    基準に達するまで繰り返されることを特徴とする、請求
    項1又は2記載の方法。
  4. 【請求項4】 データベースエントリのカテゴリに対応
    する辞書エントリのカテゴリが設けられ、 辞書エントリのカテゴリについて適応された後の第1の
    辞書は少なくとも1つの辞書エントリが適応される前の
    形とは異なることを特徴とする、請求項1乃至3のうち
    いずれか一項記載の方法。
  5. 【請求項5】 データベースエントリのカテゴリに対応
    する辞書エントリのカテゴリが設けられ、 適応される前の第1の辞書が少なくとも部分集合を含む
    少なくとも1つの辞書エントリのカテゴリには、適応さ
    れた後の第1の辞書が少なくとも部分集合を含む第2の
    辞書エントリのカテゴリが割り当てられることを特徴と
    する、請求項1乃至4のうちいずれか一項記載の方法。
  6. 【請求項6】 音声認識装置によって与えられる音声認
    識結果は、N個(N≧1)の最善の認識結果の選択肢を
    含み、 上記辞書の適応は、少なくとも1つの認識結果の選択肢
    に依存することを特徴とする、請求項1乃至5のうちい
    ずれか一項記載の方法。
  7. 【請求項7】 上記データベースエントリはイエローペ
    ージデータの集まりの部分であることを特徴とする、請
    求項1乃至6のうちいずれか一項記載の方法。
  8. 【請求項8】 上記対話システムは電話インタフェース
    を有し、前記電話インタフェースを通じて音声入力及び
    音声出力が伝送されることを特徴とする、請求項1乃至
    7のうちいずれか一項記載の方法。
  9. 【請求項9】 (1)入力されるべき音声発話を一時的
    に記憶する段階と、(2)上記音声発話を自動音声認識
    装置によって処理し、各辞書エントリが少なくとも1つ
    の音響リファレンスを含む第1の辞書エントリ集合を有
    する第1の辞書を用いて音声認識結果を生成する段階
    と、(3)上記音声認識結果に対応するデータベースエ
    ントリについてサーチする段階と、(4)上記段階
    (3)においてデータベースエントリが見つからない場
    合は、少なくとも1つの辞書エントリが上記第1の辞書
    エントリ集合とは異なる第2の辞書エントリ集合を有す
    るよう、上記第1の辞書を適応し、上記一時的に記憶さ
    れた音声発話と上記適応された第1の辞書とを用いて上
    記段階(2)及び(3)を繰り返す段階とを含む方法を
    実行するためのシステム構成要素を有するデータベース
    のデータベースエントリを決定する自動対話システム。
JP2002118436A 2001-04-20 2002-04-19 データベースのエントリを決定する方法 Expired - Lifetime JP4741777B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10119677.6 2001-04-20
DE10119677A DE10119677A1 (de) 2001-04-20 2001-04-20 Verfahren zum Ermitteln von Datenbankeinträgen

Publications (2)

Publication Number Publication Date
JP2003029784A true JP2003029784A (ja) 2003-01-31
JP4741777B2 JP4741777B2 (ja) 2011-08-10

Family

ID=7682289

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002118436A Expired - Lifetime JP4741777B2 (ja) 2001-04-20 2002-04-19 データベースのエントリを決定する方法

Country Status (6)

Country Link
US (1) US7496508B2 (ja)
EP (1) EP1251491B1 (ja)
JP (1) JP4741777B2 (ja)
CN (1) CN1326074C (ja)
AT (1) ATE311649T1 (ja)
DE (2) DE10119677A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016103270A (ja) * 2014-11-12 2016-06-02 株式会社アドバンスト・メディア 情報処理システム、受付サーバ、情報処理方法及びプログラム
JP7549429B2 (ja) 2020-03-20 2024-09-11 インターナショナル・ビジネス・マシーンズ・コーポレーション データ入力に対する音声認識及び訓練

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7958151B2 (en) * 2005-08-02 2011-06-07 Constad Transfer, Llc Voice operated, matrix-connected, artificially intelligent address book system
CN101558443B (zh) * 2006-12-15 2012-01-04 三菱电机株式会社 声音识别装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63163496A (ja) * 1986-12-26 1988-07-06 日本電信電話株式会社 並列検索照合型認識システム
JPH01293397A (ja) * 1988-05-23 1989-11-27 Hitachi Ltd 音声応答方式
JPH07219590A (ja) * 1994-01-31 1995-08-18 Canon Inc 音声情報検索装置及び方法
JPH09114482A (ja) * 1995-10-17 1997-05-02 Nippon Telegr & Teleph Corp <Ntt> 音声認識のための話者適応化方法
JPH1124695A (ja) * 1997-06-27 1999-01-29 Sony Corp 音声認識処理装置および音声認識処理方法
JP2000075895A (ja) * 1998-08-05 2000-03-14 Texas Instr Inc <Ti> 連続音声認識用n最良検索方法
JP2000200093A (ja) * 1999-01-07 2000-07-18 Nec Corp 音声認識装置及びそれに用いる音声認識方法並びにその制御プログラムを記録した記録媒体
JP2000250585A (ja) * 1999-02-25 2000-09-14 Nippon Telegr & Teleph Corp <Ntt> 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体
JP2000322088A (ja) * 1999-05-14 2000-11-24 Hitachi Ltd 音声認識マイクおよび音声認識システムならびに音声認識方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5027406A (en) * 1988-12-06 1991-06-25 Dragon Systems, Inc. Method for interactive speech recognition and training
US5909666A (en) * 1992-11-13 1999-06-01 Dragon Systems, Inc. Speech recognition system which creates acoustic models by concatenating acoustic models of individual words
JP3397372B2 (ja) * 1993-06-16 2003-04-14 キヤノン株式会社 音声認識方法及び装置
MX9702759A (es) * 1994-10-25 1997-07-31 British Telecomm Servicios operados por voz.
US5758322A (en) * 1994-12-09 1998-05-26 International Voice Register, Inc. Method and apparatus for conducting point-of-sale transactions using voice recognition
US5845246A (en) * 1995-02-28 1998-12-01 Voice Control Systems, Inc. Method for reducing database requirements for speech recognition systems
US5717828A (en) * 1995-03-15 1998-02-10 Syracuse Language Systems Speech recognition apparatus and method for learning
US5852801A (en) * 1995-10-04 1998-12-22 Apple Computer, Inc. Method and apparatus for automatically invoking a new word module for unrecognized user input
US5765132A (en) * 1995-10-26 1998-06-09 Dragon Systems, Inc. Building speech models for new words in a multi-word utterance
US6601027B1 (en) * 1995-11-13 2003-07-29 Scansoft, Inc. Position manipulation in speech recognition
US5715369A (en) * 1995-11-27 1998-02-03 Microsoft Corporation Single processor programmable speech recognition test system
US5933804A (en) * 1997-04-10 1999-08-03 Microsoft Corporation Extensible speech recognition system that provides a user with audio feedback
US6018708A (en) * 1997-08-26 2000-01-25 Nortel Networks Corporation Method and apparatus for performing speech recognition utilizing a supplementary lexicon of frequently used orthographies
US6122361A (en) * 1997-09-12 2000-09-19 Nortel Networks Corporation Automated directory assistance system utilizing priori advisor for predicting the most likely requested locality
JP4267081B2 (ja) * 1997-10-20 2009-05-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 分散システムにおけるパターン認識登録
US6138100A (en) * 1998-04-14 2000-10-24 At&T Corp. Interface for a voice-activated connection system
US6012030A (en) * 1998-04-21 2000-01-04 Nortel Networks Corporation Management of speech and audio prompts in multimodal interfaces
US6208964B1 (en) * 1998-08-31 2001-03-27 Nortel Networks Limited Method and apparatus for providing unsupervised adaptation of transcriptions
DE60026637T2 (de) * 1999-06-30 2006-10-05 International Business Machines Corp. Verfahren zur Erweiterung des Wortschatzes eines Spracherkennungssystems
US7120582B1 (en) * 1999-09-07 2006-10-10 Dragon Systems, Inc. Expanding an effective vocabulary of a speech recognition system
US20020188447A1 (en) * 2001-04-10 2002-12-12 Coon Bradley S. Generation of grammars from dynamic data structures

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63163496A (ja) * 1986-12-26 1988-07-06 日本電信電話株式会社 並列検索照合型認識システム
JPH01293397A (ja) * 1988-05-23 1989-11-27 Hitachi Ltd 音声応答方式
JPH07219590A (ja) * 1994-01-31 1995-08-18 Canon Inc 音声情報検索装置及び方法
JPH09114482A (ja) * 1995-10-17 1997-05-02 Nippon Telegr & Teleph Corp <Ntt> 音声認識のための話者適応化方法
JPH1124695A (ja) * 1997-06-27 1999-01-29 Sony Corp 音声認識処理装置および音声認識処理方法
JP2000075895A (ja) * 1998-08-05 2000-03-14 Texas Instr Inc <Ti> 連続音声認識用n最良検索方法
JP2000200093A (ja) * 1999-01-07 2000-07-18 Nec Corp 音声認識装置及びそれに用いる音声認識方法並びにその制御プログラムを記録した記録媒体
JP2000250585A (ja) * 1999-02-25 2000-09-14 Nippon Telegr & Teleph Corp <Ntt> 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体
JP2000322088A (ja) * 1999-05-14 2000-11-24 Hitachi Ltd 音声認識マイクおよび音声認識システムならびに音声認識方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016103270A (ja) * 2014-11-12 2016-06-02 株式会社アドバンスト・メディア 情報処理システム、受付サーバ、情報処理方法及びプログラム
JP7549429B2 (ja) 2020-03-20 2024-09-11 インターナショナル・ビジネス・マシーンズ・コーポレーション データ入力に対する音声認識及び訓練

Also Published As

Publication number Publication date
EP1251491B1 (de) 2005-11-30
US20020169751A1 (en) 2002-11-14
CN1326074C (zh) 2007-07-11
EP1251491A2 (de) 2002-10-23
ATE311649T1 (de) 2005-12-15
JP4741777B2 (ja) 2011-08-10
CN1384453A (zh) 2002-12-11
EP1251491A3 (de) 2003-12-17
DE10119677A1 (de) 2002-10-24
DE50205081D1 (de) 2006-01-05
US7496508B2 (en) 2009-02-24

Similar Documents

Publication Publication Date Title
US20030149566A1 (en) System and method for a spoken language interface to a large database of changing records
US5839107A (en) Method and apparatus for automatically generating a speech recognition vocabulary from a white pages listing
USRE42868E1 (en) Voice-operated services
US6751595B2 (en) Multi-stage large vocabulary speech recognition system and method
US5983177A (en) Method and apparatus for obtaining transcriptions from multiple training utterances
US9805722B2 (en) Interactive speech recognition system
US20030115289A1 (en) Navigation in a voice recognition system
US20080010058A1 (en) Method and apparatus for recognizing large list of proper names in spoken dialog systems
US20080162146A1 (en) Method and device for classifying spoken language in speech dialog systems
US20050004799A1 (en) System and method for a spoken language interface to a large database of changing records
JP2010191400A (ja) 音声認識装置およびデータ更新方法
EP1240642A1 (en) Learning of dialogue states and language model of spoken information system
CA2419526A1 (en) Voice recognition system
GB2428853A (en) Speech recognition application specific dictionary
US7809567B2 (en) Speech recognition application or server using iterative recognition constraints
US20010056345A1 (en) Method and system for speech recognition of the alphabet
JP4741777B2 (ja) データベースのエントリを決定する方法
JP4504469B2 (ja) 音声信号により構成されるデータの信頼度決定方法
Ju et al. A voice search approach to replying to SMS messages in automobiles
Georgila et al. A speech-based human-computer interaction system for automating directory assistance services
EP1581927A2 (en) Voice recognition system and method
Georgila et al. Improved large vocabulary speech recognition using lexical rules
CA2438926A1 (en) Voice recognition system
JPH08139813A (ja) 国番号およびエリアコード自動案内装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071009

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080107

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080409

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090501

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090609

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20090717

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110509

R150 Certificate of patent or registration of utility model

Ref document number: 4741777

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term