JP2004529390A

JP2004529390A - ユーザ・グループに固有のパターン処理システム

Info

Publication number: JP2004529390A
Application number: JP2003502817A
Authority: JP
Inventors: バイヤーライン，ペーター
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2001-06-06
Filing date: 2002-06-05
Publication date: 2004-09-24
Anticipated expiration: 2022-06-05
Also published as: DE10127559A1; ATE340399T1; DE60214850T2; US9009043B2; JP4837887B2; US20150179164A1; US20120310647A1; US9424838B2; WO2002099785A1; EP1402518A1; EP1402518B1; DE60214850D1; US20040148165A1

Abstract

本発明は、パターン処理（特に音声処理）方法であって、ユーザに対して規定されたユーザ・グループのユニーク識別子を受信する工程（１０４）と、そのユーザ・グループに固有なパターン処理データセット（８０・・・８１）を用いて（１０５）、そのユーザのパターン入力を処理する工程（１１０）と、を有する方法に関する。

Description

【０００１】
本発明は、パターン処理システムに係り、特に、音声処理システムに関する。パターン処理システム、特に音声認識を伴ったもの、は多くの場所で、多くの用途に使われている。例として、電話によって利用可能な自動的情報・取引システム（例えば、オランダ公共交通機関（ＯＶＲ）の自動時刻表情報、多くの銀行のテレバンキング・システム、及び、Ｐｈｉｌｉｐｓ社がウィーン市に設置した情報キオスク（ユーザはそこでキーボード及び音声入力によって例えばウィーンの場所及びホテルについての情報を得ることができる））が挙げられる。
【０００２】
パターン処理システムが、多くのユーザによって使われる場合、いわゆるユーザ独立パターン処理データセットがパターン処理のためにたいてい使われ、すなわち異なるユーザからのパターン処理においてユーザ間に差が設けられない。例えば、音声認識において、同じ音響学的基準モデルがすべてのユーザに対して用いられる。しかし、当業者には既知のように、パターン処理の品質は、ユーザ固有のパターン処理データセットを使用することで高められる。例えば、ある話者に対して特別に調律された母音長の標準化がその話者の話した発声に対して実行されるならば、音声認識システムの精度は強化される。
【０００３】
このような話者依存音声認識システムは、ユーザ数が少ない用途では今日幅広く使用されている。例として、個人向け口述筆記システム（例えば、Ｐｈｉｌｉｐｓ社のＦｒｅｅＳｐｅｅｃｈ）や、クローズド・ユーザ・グループ用のプロ向け口述筆記システム（例えば、Ｘ線医術分野におけるＰｈｉｌｉｐｓ社のＳｐｅｅｃｈＭａｇｉｃ）が挙げられる。しかし、多くのユーザを持つパターン処理システムへのこれらの技術の移転は、多くの難題によって妨げられている。
【０００４】
第一に、このようなシステムの大量のユーザにより、ユーザ固有のパターン処理データセット用にストレージへの要求が高くなり得る。第二に、大量のユーザは、ユーザ依存のパターン処理データセットを作成するためのトレーニングに要求される努力をする準備ができていないと考えられる。このトレーニング努力は、実にユーザが使いたいすべてのシステムに対して実際に必要となるであろう。なぜなら、個々のメーカのパターン処理システムは、更に一メーカの個々の製品でも一部のものは、互いに異なるので、ユーザ固有のパターン処理データセットをシステム間で交換できないからである。
【０００５】
したがって、日本国特許公開：特開平８−１２３４６１号公報の要約には、ユーザが、そのユーザの特性を示した個人情報データを含んだ情報カードを携帯するべきであることが提案されている。その場合、ユーザは、例えば、情報カードをシステムのスロットに挿入して、個々の音声処理システム（音声インターフェース・システム）をその関連する個人用に特化させる。次いで、そのシステムは、そのカードからデータを読み取り、これらデータを用いて彼が話した言葉のユーザ依存処理を実行する。
【０００６】
また、個々の情報カードの使用は、音声処理システムのメーカが彼らのシステムにおいてそのカードの使用をサポートするならば、高ストレージ要求と複数のユーザ固有データの準備の問題を解決する。しかし、これは、ユーザはシステムを使うために常にカードを携帯し、各システムはそのカード用の入力装置を備えていなければならない、という必要性を生じさせる。それは、例えば、電話情報システムの相談のために使うことができない。
【０００７】
したがって、本発明の目的は、冒頭段落に記載した種類のパターン処理システム（特に音声処理システム）であって、ユーザ固有パターン処理システムと同等の品質を持ち、例えば電話などの既存のユーザ端末と共に用いることが可能でありつつ、システムを用いるために情報カードなどの追加的な機器をユーザが持つ必要がなく、高ストレージ要求と複数のユーザ固有データの作成の問題を解決する、システムを提供することである。
【０００８】
この目的は、一方で、パターン処理（特に音声処理）方法であって、ユーザに対して規定されたユーザ・グループのユニーク識別子を受信する工程と、前記ユーザ・グループに固有なパターン処理データセットを用いて前記ユーザのパターン入力を処理する工程とを有する方法によって達成され、他方で、パターン処理システム（特に音声処理システム）であって、ユーザに対して規定されたユーザ・グループのユニーク識別子を受信し、前記ユーザ・グループに固有なパターン処理データセットを用いて前記ユーザのパターン入力を処理するように設計されたシステムによって達成される。
【０００９】
高ストレージ要求の問題は、ユーザをユーザ・グループへ再分割することを通じて回避される。加えて、ユーザ・グループに固有なパターン処理データセットは、中央データ・メモリに収容されてもよく、ネットワークを通じてパターン処理装置に提供されてもよい。したがって、メモリ・スペースを説明するための更なる可能性は、複数のデータ・ストレージの回避から生じる。複数のシステムにおけるユーザ・グループに固有なパターン処理データセットの多重共有使用により、ユーザに対して複数のユーザ・グループが規定されることに関する問題が回避される。
【００１０】
ユーザが、ユーザ・グループに固有なパターン処理システムを使用したい場合、彼は、例えば番号又は識別名を用いて、彼のユーザ・グループについてのみ、システムに知らせなければならない。また、ユーザ・グループ情報は、チップカード上に収容され得るが、例えば電話情報システムを使うためには、口頭でユーザ・グループをシステムに知らせれば、又は、例えば数字コードの場合にはＤＴＭＦ対応の電話のキーボードを通じて数字を入力すれば、十分である。このように、ユーザ・グループに固有な個々のパターン処理システムは、例えば情報カードなどの追加的機器無しで、そして例えば電話などの既存のユーザ端末を用いて、使用することができる。
【００１１】
請求項２記載のように、ユーザ・グループは、トレーニング段階において、ユーザに対して定義されてもよい。その場合、ユーザは、例えば、トレーニング・システムによって記録され、ユーザ・グループを決定するのに用いられる所定のテキストを発音しなければならない。このトレーニング段階は、ユーザ・グループに固有なパターン処理システムの使用からは独立して行われ得る。しかし、代替的に、それは、「新しい」ユーザ、すなわち、どのユーザ・グループにもいまだ関連付けられていないユーザ、に対してシステムの使用中に提供されてもよい。さらに、システムの使用中に入力されたユーザのパターン入力を用いることが考えられる。その場合、該パターン入力は、おそらく、最初の又は新しいユーザ・グループの定義のために、当初はユーザ独立パターン処理で取り扱われる。後者は、ユーザのパターン特徴又はシステムのユーザ・グループが変わった時に起こり得る。
【００１２】
このようなユーザ・グループの定義を実行するための多くの方法が、ユーザ適合の分野から、例えば文献により、当業者には知られている。例えば音声認識からの「ｓｐｅａｋｅｒｃｌｕｓｔｅｒｉｎｇ」方法などのこれらの方法のうちの一部は、ここでいうユーザ・グループを直接導く。例えば音声認識からの「ａｄａｐｔｉｖｅｓｐｅａｋｅｒｃｌｕｓｔｅｒｉｎｇ」、ＭＬＬＲ、又はＭＡＰ、或いは、写真認識からの「ｃｈａｒａｃｔｅｒｉｓｔｉｃｆａｃｅｓ」などの他の方法は、ユーザ固有のパターン処理データセットを得るために通常使用される。適合プロセスの解像度は、所望数のユーザ・グループが定着するように、量子化によって、すなわち、ユーザ固有適合パラメータをあるレベルまで減らすことによって、より粗くすることができる。
【００１３】
請求項３は、ユーザに対するユーザ・グループの定義がどのようにユーザによって影響が及ぼされることができるかを定義する。例えば、システムが異なる品質のユーザ・グループを提供することがここで考えられる。このように、システムは、例えば、非常に似た話し方及び動作モードのユーザが排他的に存在する非常に精細に区別された音響学的基準モデルをこれらグループに対して提供するという点で高品質のユーザ・グループを提供し得る。結果として、そのようなユーザ・グループには、例えば音声認識において、ユーザ依存システムにおいて得られたものと類似した認識精度が提供され得る。このためにシステムにおいて必要なより高い支出は、対応した料金構造によって、ユーザから回収し得る。
【００１４】
従属クレーム４及び５は、ユーザ入力に対する２つの有益的な可能性に関する。一方で、ユーザ入力は、例えば上記情報キオスクや自動銀行カウンタなどの公衆ユーザ端末へ行われ得る。他方で、ユーザは、電話又はＰＣ若しくはラップトップを使うことができる。その場合、彼の入力は、例えば電話網やインターネットなどのネットワークを通じて送信される。
【００１５】
従属クレーム６は、ユーザ・グループに固有なパターン処理データセットのいくつかの考えられる構成要素：
ユーザ・グループに固有な言語、及び／又は方言；
ユーザ・グループに固有な特徴抽出（特に、ユーザ・グループに固有な声道長の標準化）；
ユーザ・グループに固有な音響学的基準モデル；
ユーザ・グループに固有な語彙；
ユーザ・グループに固有な言語モデル；及び／又は、
ユーザ・グループに固有なダイアログ・モデル；
を指定する。
【００１６】
これらは、例えばユーザ・グループに固有な音声認識のために用いられ得るこのようなデータセットの典型的な構成要素である。例えば言語の語音用のいわゆるＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌなどの音響学的基準モデルが利用できる。ユーザ・グループに固有な語彙は、例えば、ユーザ・グループによってある用途に通常用いられる言葉を含む。言語モデルは、ワード・シーケンスを形成するためのすべての相互関係、すなわち、例えば、ユーザ・グループの文法規則又は意味上のプリファレンスを有し得る。他方、ダイアログ・モデルは、システムとユーザ・グループからのユーザとの間のインタラクションの特徴的なパターンを識別する。
【００１７】
音声認識の他に、本発明は、例えばユーザ・グループに固有な記号一覧表を使用して、例えばユーザ・グループに固有な音声エンコードなどの他の種類のユーザ・グループに固有なパターン処理にも関連する。例えばアニメーション化した文字（いわゆる化身（ａｖａｔａｒ））を用いてオンラインでチャットするためのシステムなどにおいてユーザ・グループに固有な手書き文字認識及び顔表情処理も本発明の範囲に入る。
【００１８】
請求項７は、例えば時刻表や旅客情報などの情報を提供するシステムの使用を記載する。自動販売機からの購入やインターネット経由での銀行取引の実行などの命令を発するシステムの使用も記載されている。
【００１９】
本発明の上記及び別の態様及び利点は、実施形態及び特に添付図面を参照して、以下により詳細に説明される。
【００２０】
図１は、ユーザ入力用の公衆ユーザ端末１０を提供する、本発明に係るユーザ・グループに固有なパターン処理システムの一実施形態を示す。本発明のこのような実施形態の典型的な用途は、自動銀行カウンタ１０における銀行取引の実行、上述の情報キオスク１０での情報呼び出し、又は、自動切符販売機１０からの切符購入、である。
【００２１】
公衆ユーザ端末１０は、グラフィック・ディスプレイ１１、入力キーボード１２、ユーザが話したメッセージを入れるためのマイク１３、及び、ユーザの特性を示すチップカード７０（例えばＥＣ又はカスタマ・カード）用の挿入スロット１４、を備える。さらに、端末１０は、ユーザ・グループに固有な音声処理のための該ユーザ・グループに固有なパターン処理データセットを格納するためのローカル・データ・メモリ３２を備えたローカル音声認識装置４２を有する。システムを使うためにスロット１４に挿入されるユーザのチップカード７上には、例えば、その用途について典型的なデータ（例えば、銀行カードの場合には銀行口座の口座番号）を格納するチップ７１と、ユーザ・グループに固有な音声処理のために規定されたそのユーザのユーザ・グループのユニーク識別子を格納する別のチップ７２と、がある。
【００２２】
このようなユニーク識別子は、例えば、１つの番号から成ってもよく、或いは、代替的に、識別名が考えられる。例えば、その人の特性を示す音声処理がそのユーザ・グループを代表しているような、そのユーザ・グループに属する広く知られている人の名前など。このような識別名及び番号は、ユーザが容易に思い出すことができるため、ユニーク識別子は、チップカードの助けなしでも、例えばマイク１３やキーボード１２を用いて、パターン処理システムに送信できる。この場合、チップ７２は、チップカード７０上で余分となる。別の方法として、さらに、あらゆるユーザ・グループの特徴説明などのすべての情報が、チップカード７０上の一チップ７１上に収容されてもよい。
【００２３】
ユーザ・グループに固有なすべてのパターン処理データセットがローカル・データ・メモリ３２に格納されていれば、ローカル音声認識装置４２は、ローカルで完全に独立して作動することが可能である。このような「スタンドアロン」自動機械は、特に、タバコなどの自動販売機から直接入手可能な物品の販売に、適当である。公衆ユーザ端末１０は、代替的に、個々のユーザ・グループに固有な音声認識のためのユーザ・グループに固有なパターン処理データセットのストレージのための別のデータ・メモリ３０・・・３１にネットワーク２０経由で接続されてもよい。その際、ネットワーク２０は、例えば、プライベートＭＡＮ（メトロポリタン・エリア・ネットワーク）（例えば、銀行のネットワーク）である。ネットワーク２０は、代替的に、公衆網、特にインターネット、という形で実現されてもよい。考え得るハイブリッドな形は、例えば、インターネットをベースとして実現されたＶＰＮ（仮想プライベート・ネットワーク）である。
【００２４】
図２は、ユーザ・グループに固有の本発明に係るパターン処理システムの別の一実施形態を示す。図１と同様、ネットワーク２０及びそれに接続されたデータ・メモリ３０・・・３１が図示されている。ただし、図１と対照してみると、音声認識装置４０・・・４１もまたネットワーク２０に接続されている。ユーザ入力は、公衆ユーザ端末１０（ここでは、図１と異なり、ローカル・データ・メモリ３２を備えたローカル音声認識装置４２を有していない）において行われるか、或いは、このためにネットワーク２０に接続された又は接続可能な電話６０又はＰＣ、ラップトップなど５０を通じて行われる。例えばローカル音声認識装置を備えた図１に示した公衆ユーザ端末１０などの上記及び他の入力可能性は、ユーザ・グループに固有なパターン処理システムにおいて全部又は一部のみが実現されてもよい。
【００２５】
したがって、図１及び２に図示したシナリオは、ユーザが話した言葉の認識が行われる音声認識装置４２又は４０・・・４１の配置について特に異なっている。図１の公衆ユーザ端末１０においてローカルに収容された音声認識装置４２は、シンプルな命令だけが認識されることになっており、公衆ユーザ端末１０がいつも主として同じ顧客によって使われるケースに適当である。この場合、比較的シンプルで安価な音声認識装置４２で十分であり、メイン・ユーザのユーザ・グループに固有なパターン処理データセットは、そのユーザ・グループに固有な音声認識のための音声認識装置４２のローカル・データ・メモリ３２に格納され得る。例えば、巡回しているユーザによって必要とされ、データ・メモリ３２にローカルに存在しないユーザ・グループに固有な別のパターン処理データセットは、ネットワーク２０を通じて接続されたデータ・メモリ３０・・・３１からロードされる。これにより、ネットワーク２０全体の負荷が小さくなる。
【００２６】
図２において、ユーザの話した発話の音声認識は、ネットワークを通じて接続された音声認識装置４０・・・４１において行われる。これは、高い認識性能を必要とするより複雑な発話の場合、及び／又は、ユーザが継続的に変わる場合に、有用である。この音声認識タスクとデータ・ストレージの結合は、機械占有、必要とされるメモリ・スペース、及び、ネットワーク２０を通る必要なデータ・トラフィック、において利点をもたらす。このように、例えば、音声認識装置４０・・・４１を互いに接続し、さらに、ネットワーク２０内でブロードバンド・サブネットワークによってデータ・メモリ３０と接続することは、有益的となり得る。また、特定の場合には、個々のユーザの話した発話の認識を常に可能な限りそのユーザのユーザ・グループに固有なパターン処理データセットを保持し得る同じ音声認識装置４０に割り当てることも有益的となり得る。
【００２７】
上述のシステム実施形態の他に、多くの別の変形例が、用途分野に応じて、当業者によって容易に実施され得る。したがって、ここでは、分散型データベースの分野で十分に知られているミラード・データ・ストレージの技術に言及すれば十分である。ユーザ（すなわち、この場合はユーザ・グループ）のデータは、ネットワーク２０上が高負荷の場合でもユーザに彼／彼女のデータへの高速アクセスを与えるために、例えば図１のメモリ３２及び３０・・・３１などの複数の、通常は空間的に幅広く隔たったデータ・メモリにおいて保持される。その際、個々のメモリにおいて保持されたデータの整合性は、時間に関してよりクリティカルでなく、所望であれば低ネットワーク負荷時に実行され得る適切な同期化手順によって保証される。
【００２８】
本発明の別の実施形態は、ユーザ・グループに固有なパターン処理データセットが、システムに属しているデータ・メモリにおいて保持されず、ユーザ・グループに固有なパターン処理のために設計されてもいないが、例えば、サードパーティ事業者によって又は代替的にユーザ自身によって（彼自身のユーザ・グループのために）利用可能とされる。前者の場合、サードパーティは、ユーザ・グループに固有なパターン処理データセットをユーザ・グループに固有なパターン処理システムのオペレータに利用可能にするために、例えば対価と引き換えに、ユーザ・グループに固有なパターン処理データセットの作成、管理、及び／又は更新に特化し得る。サードパーティは、ユーザのためにユーザ・グループ・メンバーシップの定義の管理もし得る。
【００２９】
後者の場合、ユーザ自身は、例えば、ユーザ・グループに固有なパターン処理システムのデータ・メモリ３２、３０・・・３１の１つから彼自身のユーザ・グループに固有なパターン処理データセットをダウンロードするであろう。システム自体がそのユーザの個々のユーザ・グループに固有なパターン処理データセットを持っておらず、別のユーザ・グループに固有なパターン処理システムが使われる場合、彼は個々のデータをラップトップ５０上のシステムに提供することができる。ただし、一般的に、彼は、ネットワーク２０、特にインターネット、に接続されているＰＣ経由でもそれらを提供し得る。この場合、彼は、その後、このＰＣのアドレスをシステムに知らせるであろう。したがって、このシナリオでは、ＰＣ又はラップトップ５０のアドレスを含んでいるメッセージが、ユーザ・グループのユニーク識別子を提供するタスクを実行するであろう。
【００３０】
上記実施形態においてシステムへのアクセスを得るために使われたユーザ端末は、平均的な複雑さの公衆ユーザ端末１０、電話６０、及び、ＰＣ又はラップトップ５０であったが、代替的な解決策も等しく可能である。例として、タッチスクリーン、カメラ、スピーカなどの複雑なマルチメディア・インタラクション可能性を持つ携帯電話や情報キオスクである。
【００３１】
図３は、ユーザ・グループに固有なパターン処理データセット８０・・・８１用のデータ・メモリ３０のコンテンツを示す図である。ここではローカル・データ・メモリ３２とネットワーク２０に接続された別のデータ・メモリ３０・・・３１とを表しているデータ・メモリ３０は、例えばハードディスクなどの既知のコンピュータ・データ・メモリである。ユーザ・グループに固有なパターン処理データセット８０・・・８１は、例えば、ユーザ・グループに固有なパターン処理システムに適したバイナリ・コードにおいて、個々のデータ・ファイルという形で利用可能であり得る。代替的可能性は、データベースなどの形の組織である。
【００３２】
図４は、本発明に係るユーザ・グループに固有なパターン処理システムの使用の考え得るフローチャートを示す。例えば銀行用途用の銀行口座番号及びＰＩＮコードの通信などの用途に固有な動作を表さず、ユーザ・グループに固有なパターン処理に関連するプロセスのみを説明する。
【００３３】
スタート・ブロック１０１後、ユーザ・グループに固有なパターン処理システムは、プロセス・ブロック１０２において、ユーザに、彼のユーザ・グループを識別するように、すなわちユーザ・グループに固有なパターン処理のために個々のユーザに対して定義されたユーザ・グループのユニーク識別子をシステムに入力するように、要求する。判断ブロック１０３後、ユーザが彼のユーザ・グループを知っているか否かに応じて、別のプロセスが分岐する。
【００３４】
ユーザが彼自身のユーザ・グループを知っている場合、ブロック１０４において、彼はそれを、例えば、図１及び２のシナリオのように彼がチップカード７０を公衆ユーザ端末１０の挿入スロット１４に挿入することによって、或いは、彼が公衆ユーザ端末１０のキーボード１２又はマイク１３を使うことによって、或いは、彼が電話６０又はラップトップ５０を通じてユーザ・グループをシステムに教えることによって、システムに伝達する。すると、システムは、ブロック１０５において、データ・メモリ３２、３０・・・３１においてそのユーザのユーザ・グループに固有なパターン処理データセットを検索し、それをパターン処理装置４２、４０・・・４１に提供する。
【００３５】
ユーザが彼自身のユーザ・グループを知らない場合、ブロック１０６において、システムは、彼に、彼がシステムに彼用のユーザ・グループを今定義してもらいたいか否かを尋ねる。彼がそうしたい場合、システムは、ブロック１０７において、そのユーザのトレーニング・パターン入力を集め、それらを処理してそのユーザのユーザ・グループを定義する。このように決定されたユーザ・グループは、ブロック１０８において、ユーザに伝達され、コントロールは、上述のブロック１０５へ切り換えられる。そこでは、現在のユーザのユーザ・グループに固有なパターン処理データセットがデータ・メモリ３２、３０・・・３１において探され、パターン処理装置４２、４０・・・４１に提供される。
【００３６】
例えば、そのとき彼にそれのための時間がないので、或いは、ユーザ・グループは既に彼に割り当てられたが、そのユニーク識別子を彼がそのとき利用可能でないために、ユーザが彼のために規定されるユーザを今は望んでいない場合、コントロールは、ブロック１０６からブロック１０９へ分岐する。そこで、後続のパターン処理工程がユーザの特殊な特徴とは無関係に実行されるように、ユーザ独立パターン処理データセットがデータ・メモリ３２、３０・・・３１において探され、パターン処理装置４２、４０・・・４１に提供される。
【００３７】
ブロック１０５及び１０９の一方においてパターン処理装置４２、４０・・・４１に提供にされたユーザ・グループ固有の又はユーザ独立のパターン処理データセットは、別の条件にも依存し得る。したがって、例えば、音声認識の場合には異なる背景雑音、或いは、音声入力の場合にはマイク種類又はジェスチャ認識の場合にはカメラ種類などのユーザ入力用の異なる端末、などの異なる周囲条件が異なる用途に対して保持されてもよく、これらに適切に適合したパターン処理データセットが用いられ得る。
【００３８】
ブロック１０５又は１０９の後、適用可能であるように、ユーザのパターン入力がブロック１１０において処理される。すなわち、ユーザは、パターンに入力するように要求され、入力されたパターンは記録・処理される。このようなパターン入力は、例えば、マイク１３又は電話６０を通じて入力された話された発話である。他の考えられる入力は、手書きのテキスト、及び／又は、ディスプレイ１１上で提供されたメニュ項目を選択するポインタ動作である。公衆ユーザ端末１０のディスプレイ１１は、この目的のために、例えばタッチスクリーンとして構成されてもよく、及び／又は、公衆ユーザ端末１０にカメラが取り付けられてもよい。
【００３９】
任意で、ブロック１１０で行われたユーザのパターン入力を、中間ストレージに入れ、例えばユーザに対してユーザ・グループ定義をテストするために用いてもよい。このようなテストのために十分な量のユーザ入力が収集され、そのときのユーザ・グループ定義がパターン処理の観点からそのユーザにとって最適ではないことが確かめられると、システムは、ユーザと相談して、そのユーザにより良く適したユーザ・グループに固有なデータセットをパターン処理装置４２、４０・・・４１にロードし、それを用いてその後のパターン処理工程を実行してもよい。このような手順は、例えば、パターンがその瞬間までユーザ独立パターン処理データセットに基づいて処理されていた場合にも、実行され得る。
【００４０】
ブロック１１１において、ユーザのパターン入力に対応した行動がされる。例えば、銀行取引の場合、口座データが公衆ユーザ端末１０のディスプレイ１１上で示される。リターン・クエスチョンをユーザにすることも可能である。ユーザは、例えば銀行コード番号の欠落などの別の入力が要求され得る。
【００４１】
ブロック１１２において、ユーザとのインタラクションが完了したか否かが判断される。完了していない場合、コントロールはブロック１１０に戻り、ユーザからの次のパターン入力を処理する。ユーザとのインタラクションが完了した場合、あらゆる新しい又は修正されたユーザ・グループは、適用可能であれば、これらのデータが、例えば、そのときまで音声認識装置４２、４０・・・４１の１つにおいてのみローカルにストレージに保持されたならば、そのユーザのためにデータ・メモリ３２、３０・・・３１に格納される。そして、システムは、ブロック１１４において、ユーザ入力の処理を終える。
【００４２】
ブロック１１２におけるユーザとのインタラクションの終了は、例えば、ブロック１１０における関連する前のシステム質問へのユーザの肯定返答の認識の後でもよい。しかし、代わりに又は加えて、人−機械通信においていつでも作動され得る公衆ユーザ端末１０の入力キーボード１２上の終了ボタンが提供されてもよい。当業者に明らかな更なる修正も考えられる。
【００４３】
ブロック１０７及び１１３は、このような人−機械通信中にそのユーザ用のユーザ・グループを定義する可能性を提供し、ブロック１１０及び１１３は、このようなユーザ・グループ定義を修正することを可能にした。しかし、ユーザ・グループの定義・修正は、例えば銀行取引の実行などのシステム利用のフレームワーク内で行われる必要はなく、代替的に別々に行われてもよい。
【００４４】
この可能性は、例えば、ユーザが彼自身の家から余裕を持って彼のユーザ・グループを定義できる図２に示したシナリオの１つにとって、特に興味深いように見えるであろう。その際、彼は、システム・オペレータによってラップトップ５０内にローカルに提供されたソフトウェアをロードしてもよく、及び／又は、プロセッサ、プログラム、及び／又はデータ・メモリなどのインターネットを通じてアクセス可能なオペレータのインフラを使ってもよい。この定義は、例えばマイク又はカメラの特性又は周囲雑音などの関連する機械の使用条件により良く適合するため、図４を参照して説明した公衆ユーザ端末１０においてユーザ・グループを直接定義するシナリオもまたその正当性を持っている。
【００４５】
図４は、本発明に係るユーザ・グループに固有なパターン処理方法の必須の態様を明確化したが、当業者には明らかなように、このような方法は、例えばエラー条件の取り扱いなどのために、実際には別のメカニズムを含むべきである。このように、例えば、システムによって規定されたユーザのユーザ・グループは別のシステムに既知ではないということが生じ得る。その際、この他のシステムは、例えば、ユーザがその特定の瞬間に彼自身のユーザ・グループを知らないブロック１０６から始まる上記場合とちょうど同じように、エラー取り扱いのために作動し得る。
【図面の簡単な説明】
【００４６】
【図１】ユーザ・グループに固有な本発明に係るパターン処理システムの実施形態を示す図である。
【図２】ユーザ・グループに固有な本発明に係るパターン処理システムの実施形態を示す図である。
【図３】ユーザ・グループに固有のパターン処理データセット用のデータ・メモリのコンテンツを図式的に示す図である。
【図４】本発明に係るユーザ・グループに固有のパターン処理システムの使用のシーケンスを示すフローチャートである。

Claims

パターン処理（特に音声処理）方法であって、
ユーザに対して規定されたユーザ・グループのユニーク識別子を受信する工程と、
前記ユーザ・グループに固有なパターン処理データセットを用いて前記ユーザのパターン入力を処理する工程と、を有することを特徴とする方法。
請求項１記載の方法であって、
前記ユーザ用の前記ユーザ・グループはトレーニング段階において定義される、ことを特徴とする方法。
請求項１又は２記載の方法であって、
前記ユーザは、該ユーザ用の前記ユーザ・グループの定義に影響を及ぼすことができる、ことを特徴とする方法。
請求項１乃至３のいずれか一項記載の方法であって、
公衆ユーザ端末（特に、銀行端末、自動切符販売機、又は、情報キオスク）へのユーザ入力が行われる、ことを特徴とする方法。
請求項１乃至４のいずれか一項記載の方法であって、
ユーザ入力はネットワーク（特にインターネット）を通じて提供される、ことを特徴とする方法。
請求項１乃至５のいずれか一項記載の方法であって、
ユーザ・グループに固有な音声認識のためのパターン処理データセットは、
ユーザ・グループに固有な言語、及び／又は方言；
ユーザ・グループに固有な特徴抽出（特に、ユーザ・グループに固有な声道長の標準化）；
ユーザ・グループに固有な音響学的基準モデル；
ユーザ・グループに固有な語彙；
ユーザ・グループに固有な言語モデル；及び／又は、
ユーザ・グループに固有なダイアログ・モデル；という項目形式部分を有する、ことを特徴とする方法。
請求項１乃至６のいずれか一項記載の方法であって、
情報を取得する及び／又は命令を与える（特に、銀行取引を実行する）のに用いる、ことを特徴とする方法。
パターン処理システム（特に音声処理システム）であって、
ユーザに対して規定されたユーザ・グループのユニーク識別子を受信し、
前記ユーザ・グループに固有なパターン処理データセットを用いて前記ユーザのパターン入力を処理するように設計された、ことを特徴とするシステム。