JP2002539480A

JP2002539480A - 音声認識方法

Info

Publication number: JP2002539480A
Application number: JP2000604399A
Authority: JP
Inventors: ベスリンク，シュテファン; テレン，エリク; ウルリヒ，マインハルト
Original assignee: Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 1999-03-09
Filing date: 2000-02-10
Publication date: 2002-11-19
Anticipated expiration: 2020-02-10
Also published as: WO2000054251A3; WO2000054251A2; KR20020003865A; DE60007620D1; EP1163661A2; DE19910236A1; US6757655B1; ATE257616T1; CN1343351A; AU3153700A; EP1163661B1; JP4597383B2; DE60007620T2

Abstract

(57)【要約】音声入力可能な情報ユニット（４）が、サーバ（５）上に格納されると共に、通信ネットワーク（６）を通じて１以上の音声認識器（７、８、９）に接続されることが可能なクライアント（１、２、３）によって取り出され得る方法において、通信ネットワーク（６）における音声認識器（７、８、９）を情報ユニット（４）へ動的に割り当て、よって音声入力の認識について高認識品質を保ちつつ、処理時間を許容し得るものとするために、発せられた音声信号を認識する少なくとも１つの音声認識器（７、８、９）とクライアント（１、２、３）との組み合わせを決定するために設けられた追加情報（１２）が情報ユニット（４）に割り当てられる。

Description

【発明の詳細な説明】

【０００１】本発明は、音声入力可能な情報ユニットが、サーバ上に格納されると共に、通
信ネットワークを通じて音声認識器に接続されることが可能なクライアントによ
って取り出され得る方法に関する。

【０００２】キーボード若しくはマウスの代わりに音声入力によってコンピュータとの通信
を実行する可能性は、ユーザにコンピュータでの作業を楽にさせると共に、入力
スピードもしばしば向上させる。音声認識は、近年キーボードによって入力され
てきた多くの分野において、用いられ得る。この論点は、ほとんどの様々な性質
を有し得ることは明らかである。他方、音声認識中、計算力上に厳しい要求が作
られ、これはしばしばローカル・コンピュータ（クライアント）上では十分に使
用可能ではない。特に多くの語彙を有する話者から独立した音声認識にとって、
クライアントの計算力はしばしば不十分である。音声入力の高信頼且つ高速の音
声認識を可能にするために、パワのあるコンピュータ上で動く専用音声認識器上
で音声認識を実行することが賢明である。

【０００３】ＥＰ０８７２８２７は、音声認識方法及びシステムを開示している。音声認識
用圧縮ソフトウェアが実行されるクライアントは、ネットワークを通じて音声認
識サーバへ接続される。クライアントは、音声認識グラマ及び音声入力データを
音声認識サーバへ送信する。音声認識サーバは、音声認識を実行し、認識結果を
クライアントへ返す。

【０００４】冒頭段落に開示されたクライアント／サーバ音声認識システムにおける欠点は
、ＨＴＭＬ（Ｈｙｐｅｒ−ＴｅｘｔＭａｒｋｕｐ−Ｌａｎｇｕａｇｅ）ページ
は多くのユーザによって同時にアクセスされ、結果として起こる多くの音声入力
によってフル荷重が掛かるため、音声認識は許容し得ない処理時間を要求するこ
とである。

【０００５】よって、本発明の目的は、音声入力の認識について高認識品質を保ちつつ、処
理時間を許容し得るものとすることである。

【０００６】この目的は、クライアントが複数の音声認識器へ接続されることが可能であっ
て、クライアントの入力された音声信号を認識する少なくとも１つの音声認識器
との組み合わせを決定するために用いられる追加情報が情報ユニットに割り当て
られることによって、実現される。

【０００７】クライアントは、例えばインターネットなどの通信ネットワークを通じて接続
されたサーバから、情報ユニットをダウンロードする。この情報ユニットは、サ
ーバ上に格納され、ユーザに音声入力の可能性を提供する。サーバは、その上に
クライアントによって取り出され得る提供者からの情報を格納した、例えばイン
ターネットなどの通信ネットワークにおけるコンピュータである。クライアント
は、インターネットから情報を取り出し、ソフトウェアによって情報ユニットを
表示するためにサーバ上に格納された該情報ユニットをダウンロードするコンピ
ュータである。クライアントは計算力が限定されているため、音声認識はクライ
アント上では為されず、代わりに通信ネットワークを通じてクライアントに接続
された音声認識器上で為される。クライアントと専用音声認識器とを組み合わせ
るために、サーバは、該サーバ上に格納された情報ユニットに追加情報を割り当
てる。この追加情報は、情報ユニットと組み合わせられ、ダウンロード中にクラ
イアントへ同時に転送される。該追加情報によって、情報ユニットには、このダ
ウンロードされた情報ユニットに特化して調和された音声認識器が割り当てられ
、この音声認識器が音声認識を実行する。

【０００８】追加情報は、例えば、テーマ分野、音声認識器の種類、若しくは音声認識器の
完全利用などの所定の基準に従って、サーバによって発行される。結果として、
専用音声認識器は、ダウンロードされた情報ユニット毎に選択され、高い品質及
び短い処理時間を有する音声入力の音声認識を実行する。

【０００９】これは、期待されている語彙を知っている情報ユニットの提供者が、音声認識
器を選択し、この音声認識器と上記情報ユニットとを組み合わせる、という利点
を有する。音声入力の認識品質は、該提供者によって制御される音声認識器の割
当によって大幅に向上させ得る。なぜなら、該提供者によってサーバ上に格納さ
れた個々の情報ユニットに関して常に同様の音声入力が予期され得るからである
。ユーザによって決定された音声認識器に関しては、これら音声認識器は非常に
幅広い用途分野からの音声入力を認識しなければならない。例えばウェブ・ブラ
ウザなどの上記固定された音声認識器の接続に関して、音声認識器は、幅広いレ
ンジの用途分野に対して十分に専用化されていないため、この固定された接続は
、認識結果の品質に悪影響を与える。

【００１０】上記追加情報は、通信ネットワークにおける専用音声認識器のアドレスを含む
ことが好ましい。更に、該追加情報は、認識結果の適合に関する選択表示を含む
。最も簡素な場合、認識結果は、クライアントに返され、そこでテキスト若しく
は音声として生成される。それに加えて、上記追加情報は、用いられる音声認識
器の種類が正確に指定された選択表示を含む。該追加情報は、更に、例えば、該
音声入力に対して該音声認識器を適合させるための語彙若しくはパラメータを含
み得ると共に、上記音声認識器に対する適合化を実行し得る。別のパラメータの
任意的転送は、音声認識のスピード及び／若しくは品質を向上させる。

【００１１】本発明の有益な実施形態においては、分配器のアドレスが追加情報において示
される。この分配器は、複数の音声認識器を制御する。例えば、同じ種類の複数
の音声認識器、又は、数字若しくは「Ｙｅｓ／Ｎｏ」などの単純な発声の認識の
みに供される音声認識器群、が一分配器に属する。追加情報によって指定された
分配器は、複数のクライアントからの音声信号を、それらに対して有効な音声認
識器へ割り当てる。結果として、音声入力のより迅速な処理が実現されるだけで
なく、音声認識器への負荷を均一にすることができる。

【００１２】本発明の別の実施形態として、クライアントがサーバからＨＴＭＬページの形
式で情報ユニットをダウンロードすることが提案される。これらＨＴＭＬページ
は、クライアント上でウェブ・ブラウザによって、若しくはそれらを表示するの
に適した別のアプリケーションによって、示される。上記情報ユニットは、更に
、ウェブ・ページとしても実現され得る。このＨＴＭＬページをダウンロードす
るために、クライアントは該ＨＴＭＬページが格納されたサーバへの接続をセッ
トアップする。ダウンロード中、データはＨＴＭＬコードの形式でクライアント
へ送信される。このＨＴＭＬコードは、例えばＨＴＭＬタグとして実現される追
加情報を含む。このダウンロードされたＨＴＭＬページは、ウェブ・ブラウザに
よって示され、ユーザは音声を入力し得る。同時に送信されたＨＴＭＬタグは、
該音声入力を認識するために設けられた音声認識器を定義する。音声入力の認識
のために、クライアントは、通信ネットワークを通じて、音声認識器への接続を
セットアップする。音声入力は、音声認識器へ送信され、そこで認識され、認識
結果が、例えばクライアントへ、返される。

【００１３】本発明の有益な実施形態において、複数のクライアントがＨＴＭＬページにア
クセスする場合、個別のＨＴＭＬタグが各個別のクライアントに割り当てられる
。このため、サーバは、複数のクライアントがアクセスするＨＴＭＬページ毎に
異なる音声認識器のアドレスを割り当てる。これにより、一ＨＴＭＬページに多
くのアクセスがある場合に、複数の音声認識器が音声入力を処理することができ
、よってより迅速な認識を可能にすることができる。異なるタイム・ゾーンから
のユーザがアクセスを実行する場合、タイム・ゾーン毎に音声認識器が割り当て
られ得る。前述の分配器が音声認識器を割り当てるのに用いられる場合であって
、複数のクライアントが一ＨＴＭＬページにアクセスし、且つ分配器によって制
御される音声認識器が音声認識中の品質要求を満たさない場合、ＨＴＭＬタグは
異なる分配器のアドレスを示す。

【００１４】本発明の好ましい別の実施形態においては、音声入力は、クライアント上で追
加ソフトウェアによって前処理される。この追加ソフトウェアは、音声入力に基
づいたＨＴＭＬページがダウンロードされるときに個々のサーバからダウンロー
ドされ得る。別の方法として、該追加ソフトウェアはウェブ・ブラウザにオプシ
ョンとして統合されてもよく、クライアント上にローカルにインストールされて
もよい。この追加ソフトウェアは、個々のＨＴＭＬページがダウンロードされ、
ユーザが音声を入力し、音声入力の特徴が抽出されたときに、開始される。電気
信号として有効な音声入力は、ディジタル化され、量子化され、特徴ベクトルへ
割り当てられる成分を生成する個々の分析を受ける。クライアントがＨＴＭＬタ
グに書かれた音声認識器若しくは分配器への接続をセットアップすると、特徴ベ
クトルは、通信ネットワークを通じて、音声認識器若しくは分配器へ送信される
。音声認識器は、計算集約認識を実行する。クライアント上で実行された特徴の
抽出の結果として、音声入力は圧縮され、コード化されるため、送信されるべき
データ数が低減される。更に、クライアント側での特徴抽出に掛かる時間が低減
されるため、音声認識器はそこに適用された特徴ベクトルの認識のみを行う。こ
の低減は、頻繁に用いられる音声認識器にとって有益となり得る。

【００１５】本発明の別の実施形態において、認識結果がいかに用いられるべきであるかに
ついて音声認識器若しくは分配器に伝達するＨＴＭＬタグ表示を与えることが提
供される。これらの表示は、認識された音声入力がクライアントへ返されるか、
若しくはサーバへ返されるかを決定し得る。サーバへ返される場合、例えば、別
のＨＴＭＬページがサーバからクライアントへ送信され得る。クライアントへ返
される認識結果は、更に、ある基準に従って認識されたテキストから導かれ得る
。

【００１６】本発明は、更に、１以上の音声認識器へ接続され得るクライアントによって取
り出され得る情報ユニットが格納されたサーバに関し、該情報ユニットには、ク
ライアントと入力された音声信号を認識する音声認識器との間の組み合わせを確
立するために、追加情報が割り当てられる。

【００１７】更に、本発明は、通信ネットワークを通じて１以上の音声認識機に接続される
ことが可能で、サーバ上に格納された情報ユニットを検索するために設けられた
クライアントにも関し、該情報ユニットには、クライアントと入力された音声信
号を認識する音声認識器との間の組み合わせを確立するために、追加情報が割り
当てられる。

【００１８】本発明の実施形態の例は、図面を参照して、以下において更に説明される。

【００１９】図１は、音声認識方法を実施する装置を示す。クライアント１、２、及び３は
、通信ネットワーク６を通じて、サーバ５へ接続されている。このサーバ５から
、クライアント１、２、及び３は、ＨＴＭＬページ４の形式で、情報ユニット４
をダウンロードする。これらＨＴＭＬページ４は、ウェブ・ブラウザ１３によっ
て、クライアント１、２、及び３上に表示される。クライアント１〜３によって
リクエストされたＨＴＭＬページ４は、サーバ５上に格納されている。サービス
事業者がユーザに伝達したいと思っている情報ユニット４の内容は、ＨＴＭＬコ
ードによって、サーバ５からクライアント１、２、若しくは３へ送信される。こ
のＨＴＭＬコード化されたデータ・ストリームは、表示されるべき内容に加えて
、例えばＨＴＭＬタグ１２の形式のフォーマット命令及び追加情報１２を含む。

【００２０】表示されたＨＴＭＬページ４の内容必ずしも音声入力の内容につながっている
必要はないが、ＨＴＭＬページ４は、ユーザに、音声を入力する可能性を提供す
る。

【００２１】クライアントは、リンクを通じて個々のＨＴＭＬページを呼び出す若しくはリ
クエストするサーバ５への接続をセットアップする。クライアントへのＨＴＭＬ
ページの送信に先立ち、サーバ５は、このＨＴＭＬページ４に、指定されたＨＴ
ＭＬタグ１２における専用音声認識器のアドレスを割り当てる。用いられる音声
認識器１８の種類や音声認識器の適合化についてのパラメータなどの他の詳細や
認識結果についての詳細に関する割当は、要求されたようにＨＴＭＬタグへ割り
当てられる。

【００２２】ＨＴＭＬタグ１２を含むＨＴＭＬページ４が読み出されると、追加ソフトウェ
ア１４が起動する。この追加ソフトウェア１４は、電気信号として有効な音声入
力の特徴の抽出を実行する。追加ソフトウェア１４は、ウェブ・ブラウザ１３の
一部でもよく、クライアント１、２、若しくは３上にローカルにインストールさ
れてもよい。

【００２３】クライアントは、ＨＴＭＬタグ１２にアドレスが示された音声認識器７、８、
若しくは９への接続をセットアップする。この音声認識器は、追加ソフトウェア
１４によって生成された特徴ストリームを受信し、音声入力の音声認識を実行す
る。音声認識器７、８、若しくは９が音声入力を認識すると、それは音声認識器
７、８、若しくは９からクライアント１、２、若しくは３へ返され、そこでテキ
スト若しくは音声として発行される。

【００２４】別の実施形態において、認識結果がいかに用いられるべきかが、ＨＴＭＬタグ
１２における任意的成分を用いて、判断され得る。クライアント１〜３への返し
に加えて、認識結果をサーバ５へ送信し、その後、別のＨＴＭＬページ４を例え
ばクライアント１〜３へ送信する（ライン１６によって示される）可能性もある
。例えば、クライアント１のユーザが、ＨＴＭＬページ４として表示されている
日刊新聞を読んでいる間、「現在の温度」と言ったとする。この音声入力は、次
いで、音声認識を実行するために、ＨＴＭＬタグ１２において指定された音声認
識器７〜９へ送信される。音声認識結果の利用に関する表示において、認識され
たテキストは、クライアント１へ返されず、代わりにサーバ５へ返される。サー
バ５は、次いで、クライアント１へ、テキストとして挿入されるか或いは音声と
して出力される現在の温度に関する表示を送信する。

【００２５】図２は、別の実施形態例を示す。各クライアント１〜３は、サーバ５から異な
る内容のＨＴＭＬページ４をダウンロードする。これらＨＴＭＬページ４は、そ
れぞれＨＴＭＬタグ１２を有する。このＨＴＭＬタグ１２は、分配器１０のアド
レス１７を含む。分配器１０のアドレス１７に加えて、このＨＴＭＬラグ１２は
、更に、認識結果の利用、用いられるべき音声認識器１８の種類、および／若し
くはその適合を有する音声認識器に対するパラメータ、に関する詳細を含む。

【００２６】分配器１０は、多様な音声認識器群を制御する。これら音声認識器は、更に、
異なる種類であってもよい。群７は、種類Ｒａの多様な音声認識器Ｒａ，ｎを有
する。群８は、別の種類Ｒｂの音声認識器Ｒｂ，ｎを有する。種類Ｒａの音声認
識器Ｒａ，ｎの群７は、例えば数字の認識に特化されている。種類Ｒｂの音声認
識器Ｒｂ，ｎの群８は、「Ｙｅｓ／Ｎｏ」の認識に特化されている。分配器１０
は、多様なクライアント１〜３からの到来音声入力を、個々のＨＴＭＬラグ１２
に書かれた音声認識器の種類に応じて、分配する。

【００２７】クライアント１及び２によって呼び出され、分配器１０に割り当てられたＨＴ
ＭＬページ４は、用いられるべき音声認識器１８の種類に応じて、種類Ｒａの音
声認識器によって参照され得る。クライアント１及び２のユーザによって為され
た音声入力は、群７の分配器１０によって、音声認識器Ｒａ，ｎへ割り当てられ
る。クライアント３によって呼び出されたＨＴＭＬページ４は、音声認識器１８
に応じて、種類Ｒｂの音声認識器を有する必要がある。クライアント３のユーザ
によって為された音声入力は、群８の分配器１０によって、種類Ｒｂ，ｎの音声
認識器へ割り当てられる。

【００２８】音声認識器Ｒａ，１が音声入力の処理でビジー状態のとき、分配器１０は同じ
種類の音声認識器Ｒａに対する次の音声入力を次の音声認識器Ｒａ，２へ導く。
ここの認識結果は、音声認識器Ｒ，ｎによってクライアント１〜３へ返され、そ
こで処理される。

【００２９】図３は、複数のクライアント１〜３が同じＨＴＭＬページ４にアクセスする場
合を示す。ＨＴＭＬページ４がウェブ・ブラウザ１３によって表示される場合、
それらは同じ内容を示す。各ＨＴＭＬタグ１２は、アドレス・フィールド１７に、ＩＰアドレス、及び、ク
ライアント１、２、若しくは３から音声認識器７、８、若しくは９へのＴＣＰ／
ＩＰリンク要のソケット・ポートを含む。このようにして、ＨＴＭＬページ４の
サービス事業者は、サーバ５における音声認識器７、８、若しくは９、すなわち
ユーザによって発せられた音声を処理するための音声認識器７、８、若しくは９
、を決定する。クライアント１、２、若しくは３がインターネットを通じて個々
のＨＴＭＬページ４を呼び出すたびに、ＨＴＭＬページ４には、個々の音声認識
器７、８、若しくは９のアドレス１７を判断するＨＴＭＬタグ１２がサーバ５に
よって割り当てられる。該ＨＴＭＬページ４に対して単一の音声認識器７、８、
若しくは９が固定的に規定されていると、ＨＴＭＬページ４が同時に多数のクラ
イアント１〜３によって呼び出された場合に多くの音声入力の迅速な処理が保証
されない。よって、このような場合、個々のＨＴＭＬページ４を呼び出した各ク
ライアント１、２、若しくは３には、ＨＴＭＬタグ１２毎に異なるアドレス１７
によって、別の音声認識器７、８、若しくは９が割り当てられる。例えば、音声
認識器７は、ＨＴＭＬページ４がクライアント１によってダウンロードされたと
きに、ＨＴＭＬタグ１２へ割り当てられる。音声認識器８は、音声入力の音声認
識のために、クライアント２へ割り当てられ、音声認識器９は、クライアント３
へ割り当てられる。これは、３人のユーザ全員に対する音声入力の迅速且つ高信
頼な音声認識を実現する。

【００３０】音声認識器の特殊な割当の一適用例を以下に示す。クライアント１が演劇番組
に関するＨＴＭＬページ４を呼び出す。クライアント２がサッカー番組に関する
ＨＴＭＬページ４を呼び出し、クライアント３が航空機の接続に関するＨＴＭＬ
ページ４を呼び出す。これら３つのＨＴＭＬページ４すべてが異なる音声入力を
有することは明らかである。ＨＴＭＬページ４のサービス事業者は、期待される
語彙を知っており、関連付けられたＨＴＭＬタグ１２を用いて、各ＨＴＭＬペー
ジ４に専用の音声認識器７、８、若しくは９を割り当てる。

【００３１】複数の音声入力が可能なＨＴＭＬページ４の場合、例えばフォームに記入する
ために、１以上のＨＴＭＬタグ１２にも書かれた、異なる音声認識器７、８、若
しくは９が個々の音声入力フィールドに割り当てられ得る。いずれの音声入力が
現在処理されているかは、キーワードによって、ユーザの見ている方向を確立す
ることによって、マウスがどれだけ近いかによって、又は、優先度若しくはシー
ケンシャル順によって、区別され得る。

【図面の簡単な説明】

【図１】音声認識器の割当を概略的に示す図である。

【図２】分配器を用いた場合の音声認識器の割当を概略的に示す図である。

【図３】多くのクライアントのＨＴＭＬページへのアクセス及び音声認識器の割当を概
略的に示す図である。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＧＷ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＧＭ，ＫＥ，ＬＳ，ＭＷ，ＳＤ，ＳＬ，ＳＺ，ＴＺ，ＵＧ，ＺＷ )，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＥ，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＣＡ，ＣＨ，ＣＮ，ＣＲ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＤＭ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＤ，ＧＥ，ＧＨ，ＧＭ，ＨＲ，ＨＵ，ＩＤ，ＩＬ，ＩＮ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＡ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＳＬ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＴＺ，ＵＡ，ＵＧ，ＵＺ，ＶＮ，ＹＵ，ＺＡ，ＺＷ (72)発明者テレン，エリクオランダ国，5656 アーアーアインドーフェン，プロフ・ホルストラーン６ (72)発明者ウルリヒ，マインハルトオランダ国，5656 アーアーアインドーフェン，プロフ・ホルストラーン６Ｆターム(参考） 5D015 KK02 LL10 LL12

Claims

【特許請求の範囲】

【請求項１】音声入力可能な情報ユニットが、サーバ上に格納されると共
に、通信ネットワークを通じて音声認識器に接続されることが可能なクライアン
トによって取り出され得る方法において、入力された信号を認識する少なくとも１つの音声認識器とクライアントとの組
み合わせを決定するために用いられる追加情報が該情報ユニットに割り当てられ
ることを特徴とする方法。
【請求項２】請求項１記載の方法であって、前記追加情報は、音声認識器を指定するアドレスに加えて、認識結果の処理及
び／若しくは音声認識器の種類及び／若しくはその適合のために音声認識器へ転
送されるべきパラメータに関する表示を含むことを特徴とする方法。
【請求項３】請求項１記載の方法であって、前記追加情報は、サーバによって前記情報ユニットへ割り当てられることを特
徴とする方法。
【請求項４】請求項１記載の方法であって、前記割り当てられた追加情報を有する情報ユニットは、クライアントによって
読み出されることを特徴とする方法。
【請求項５】請求項１乃至４のいずれか一記載の方法であって、入力音声信号は、認識のため、クライアントから、前記追加情報において示さ
れたアドレスの音声認識器へ転送されることを特徴とする方法。
【請求項６】請求項１記載の方法であって、前記追加情報は、入力音声信号が運ばれる分配器のアドレスを含み、複数の音
声認識器の一へ割り当てられることを特徴とする方法。
【請求項７】請求項１記載の方法であって、前記情報ユニットは、ＨＴＭＬページとして実現され、前記追加情報は、ＨＴ
ＭＬタグとして実現されることを特徴とする方法。
【請求項８】請求項１乃至７のいずれか一記載の方法であって、一ＨＴＭＬページに異なるクライアントから複数のアクセスがある場合に、各
クライアントには、ＨＴＭＬタグにおいて音声認識器の多様なアドレスが割り当
てられることを特徴とする方法。
【請求項９】請求項１乃至７のいずれか一記載の方法であって、クライアントは、ＨＴＭＬタグを含むＨＴＭＬページがダウンロードされたと
きに起動し、該クライアントに適用された音声信号の特徴を抽出する追加ソフト
ウェアを有することを特徴とする方法。
【請求項１０】請求項１乃至９のいずれか一記載の方法であって、音声信号に関する特徴の抽出中に生成された特徴ストリームは、ＨＴＭＬタグ
において規定された、音声認識を実行し、認識結果をＨＴＭＬタグに含まれる表
示に応じてクライアントに返す音声認識器へ適用されることを特徴とする方法。
【請求項１１】請求項１０記載の方法であって、前記認識結果は、ＨＴＭＬタグに含まれる表示に応じてサーバへ返されること
を特徴とする方法。
【請求項１２】１以上の音声認識器に接続され得るクライアントによって
検索されることが可能であって、クライアントと入力音声信号を認識する音声認
識器との間の組み合わせを決定する追加情報が割り当てられる情報ユニットが格
納されたサーバ。
【請求項１３】通信ネットワークを通じて１以上の音声認識器へ接続され
ることが可能であって、サーバ上に格納され、クライアントと入力音声信号を認
識する音声認識器との間の組み合わせを決定する追加情報が割り当てられる情報
ユニットを検索するように設けられるクライアント。