JP2014510942A5

JP2014510942A5 -

Info

Publication number: JP2014510942A5
Application number: JP2013554691A
Authority: JP
Filing date: 2012-02-22
Publication date: 2015-04-16
Anticipated expiration: 2032-02-22

Claims

少なくとも１つのプログラマブルプロセッサを含むコンピューティングシステムによって実行されるときに、上記コンピューティングシステムに動作を実行させるコマンドを格納するコンピュータ可読記憶媒体を備えたコンピュータプログラム製品であって、
上記動作は、
受信コンピューティングデバイスにおいて、音声発話を受信して音声認識によって処理されるステップと、
別のコンピューティングデバイスによって上記受信コンピューティングデバイスよりも効率的に処理される上記受信された音声発話の特徴を識別することにより上記音声発話を初期分析することにより、上記音声発話を２つもしくはそれ以上の音声発話セグメントにセグメント化するステップと、
上記２つもしくはそれ以上の音声発話セグメントのそれぞれを複数の利用可能な音声認識器の１つに割り当てるステップとを含み、
上記割り当てるステップは、上記受信コンピューティングデバイスとは別のコンピューティングデバイス上に実装された上記複数の利用可能な音声認識器の１つの第１の音声認識器によって処理するために上記２つもしくはそれ以上の音声発話セグメントの第１のセグメントと、上記受信コンピューティングデバイス上に実装された上記複数の利用可能な音声認識器の第２の音声認識器によって処理するための上記２つもしくはそれ以上の音声発話セグメントの第２のセグメントとを指定することを含み、
上記音声発話の特徴を識別することは、
上記別のコンピューティングデバイスと上記受信コンピューティングデバイスとを関連付ける処理速度と、上記受信コンピューティングデバイスと上記別のコンピューティングデバイスとの間の帯域幅制限と、上記受信コンピューティングデバイスと上記別のコンピューティングデバイスとの間のネットワーク接続の品質を決定することを含み、
上記動作は、
上記第１のセグメントを上記受信コンピューティングデバイスから、処理を行う上記別のコンピューティングデバイスに送信するステップと、
第１のセグメント処理結果を上記別のコンピューティングデバイスから戻されて受信するステップを含み、
上記送信するステップと上記受信するステップとは、上記ネットワークを介して行われ、
上記動作は、
上記受信コンピューティングデバイスにおいて上記第２のセグメントを処理して第２のセグメント処理結果を生成するステップと、
完了された音声認識結果を戻すステップとを含み、
上記完了された音声認識結果は、上記第１のセグメント処理結果及び上記第２の処理結果を含むコンピュータプログラム製品。
上記初期分析するステップはさらに、上記受信コンピューティングデバイスにおいて、１つもしくはそれ以上のプロセッサ上に実装された音響モデルを用いることを含み、
上記初期分析するステップは、上記２つもしくはそれ以上の音声発話セグメントの少なくとも１つに対して、信頼スコア及びオーディオ品質測定基準を決定することを含む請求項１記載のコンピュータプログラム製品。
上記割り当てるステップは、
ａ）上記信頼スコア及びオーディオ品質測定基準の少なくとも１つが第１の各しきい値未満であるときに上記別のコンピューティングデバイス上に実装された上記第１の音声認識器により処理するために、上記第１のセグメントを指定することと、
ｂ）上記信頼スコア及びオーディオ品質測定基準の少なくとも１つが第２の各しきい値よりも大きいときに上記別のコンピューティングデバイス上に実装された上記第２の音声認識器により処理するために、上記第２のセグメントを指定することと、
ｃ）実用的に粗悪な品質を有するとして第３のセグメントを識別することと、
のうちの１つもしくはそれ以上を含み、
上記第１の各しきい値は、設計時間において定義されもしくは実行時間において動的に評価される１つもしくはそれ以上の測定基準に基づいて決定され、
上記第２の各しきい値は、設計時間において定義されもしくは実行時間において動的に評価される１つもしくはそれ以上の測定基準に基づいて決定される請求項２記載のコンピュータプログラム製品。
上記割り当てるステップは、
上記第１のセグメントが上記初期分析するステップによって決定されて上記別のコンピューティングデバイスにおいて上記受信コンピューティングデバイスよりも速くアクセスできるデータに関連する１つもしくはそれ以上の単語を含むときに、上記別のコンピューティングデバイス上に実装される上記第１の音声認識器によって処理するために、上記第１のセグメントを指定することを含み、
上記第１のセグメント処理結果は、適応された言語を用いて上記別のコンピューティングデバイスにより実行される上記第１のセグメントの分析を選択的に含み、
上記適応された言語モデルは、上記別のコンピューティングデバイスにおいて上記受信コンピューティングデバイスにおけるよりも速くアクセスできるデータに基づいて適応化される請求項１から３のうちのいずれか１つに記載のコンピュータプログラム製品。
上記受信コンピューティングデバイスは、シンクライアントコンピューティングデバイスもしくは端末を備え、
上記別のコンピューティングデバイスは、上記シンクライアントコンピューティングデバイスもしくは端末から上記データネットワークを介してアクセス可能な少なくとも１つのサーバを備える請求項１から４のうちのいずれか１つに記載のコンピュータプログラム製品。
少なくとも１つのプログラマブルプロセッサを含むコンピューティングシステムと、コンピューティングシステムによって実行されるときに、上記コンピューティングシステムの上記少なくとも１つのプログラマブルプロセッサに動作を実行させるコマンドを格納するコンピュータ可読記憶媒体とを備えた受信コンピューティングデバイスであって、
上記動作は、
受信コンピューティングデバイスにおいて、音声発話を受信して音声認識によって処理されるステップと、
別のコンピューティングデバイスによって上記受信コンピューティングデバイスよりも効率的に処理される上記受信された音声発話の特徴を識別することにより上記音声発話を初期分析することにより、上記音声発話を２つもしくはそれ以上の音声発話セグメントにセグメント化するステップと、
上記２つもしくはそれ以上の音声発話セグメントのそれぞれを複数の利用可能な音声認識器の１つに割り当てるステップとを含み、
上記割り当てるステップは、上記受信コンピューティングデバイスとは別のコンピューティングデバイス上に実装された上記複数の利用可能な音声認識器の１つの第１の音声認識器によって処理するために上記２つもしくはそれ以上の音声発話セグメントの第１のセグメントと、上記受信コンピューティングデバイス上に実装された上記複数の利用可能な音声認識器の第２の音声認識器によって処理するための上記２つもしくはそれ以上の音声発話セグメントの第２のセグメントとを指定することを含み、
上記音声発話の特徴を識別することは、
上記別のコンピューティングデバイスと上記受信コンピューティングデバイスとを関連付ける処理速度と、上記受信コンピューティングデバイスと上記別のコンピューティングデバイスとの間の帯域幅制限と、上記受信コンピューティングデバイスと上記別のコンピューティングデバイスとの間のネットワーク接続の品質を決定することを含み、
上記動作は、
上記第１のセグメントを上記受信コンピューティングデバイスから、処理を行う上記別のコンピューティングデバイスに送信するステップと、
第１のセグメント処理結果を上記別のコンピューティングデバイスから戻されて受信するステップとを含み、
上記送信するステップと上記受信するステップとは、上記ネットワークを介して行われ、
上記動作は、
上記受信コンピューティングデバイスにおいて上記第２のセグメントを処理して第２のセグメント処理結果を生成するステップと、
完了された音声認識結果を戻すステップとを含み、
上記完了された音声認識結果は、上記第１のセグメント処理結果及び上記第２の処理結果を含む受信コンピューティングデバイス。
上記初期分析するステップはさらに、上記受信コンピューティングデバイスにおいて、１つもしくはそれ以上のプロセッサ上に実装された音響モデルを用いることと、
上記２つもしくはそれ以上の音声発話セグメントの少なくとも１つに対して、信頼スコア及びオーディオ品質測定基準を決定することを含む請求項６記載の受信コンピューティングデバイス。
上記割り当てるステップは、
ａ）上記信頼スコア及びオーディオ品質測定基準の少なくとも１つが第１の各しきい値未満であるときに上記別のコンピューティングデバイス上に実装された上記第１の音声認識器により処理するために、上記第１のセグメントを指定することと、
ｂ）上記信頼スコア及びオーディオ品質測定基準の少なくとも１つが第２の各しきい値よりも大きいときに上記別のコンピューティングデバイス上に実装された上記第２の音声認識器により処理するために、上記第２のセグメントを指定することと、
ｃ）実用的に粗悪な品質を有するとして第３のセグメントを識別することと、
のうちの１つもしくはそれ以上を含み、
上記第１の各しきい値は、設計時間において定義されもしくは実行時間において動的に評価される１つもしくはそれ以上の測定基準に基づいて決定され、
上記第２の各しきい値は、設計時間において定義されもしくは実行時間において動的に評価される１つもしくはそれ以上の測定基準に基づいて決定される請求項７記載の受信コンピューティングデバイス。
上記割り当てるステップは、
上記第１のセグメントが上記初期分析するステップによって決定されて上記別のコンピューティングデバイスにおいて上記受信コンピューティングデバイスよりも速くアクセスできるデータに関連する１つもしくはそれ以上の単語を含むときに、上記別のコンピューティングデバイス上に実装される上記第１の音声認識器によって処理するために、上記第１のセグメントを指定することを含み、
上記第１のセグメント処理結果は、適応された言語を用いて上記別のコンピューティングデバイスにより実行される上記第１のセグメントの分析を選択的に含み、
上記適応された言語モデルは、上記別のコンピューティングデバイスにおいて上記受信コンピューティングデバイスにおけるよりも速くアクセスできるデータに基づいて適応化される請求項６から８のうちのいずれか１つに記載の受信コンピューティングデバイス。
上記受信コンピューティングデバイスは、シンクライアントコンピューティングデバイスもしくは端末を備え、
上記別のコンピューティングデバイスは、上記シンクライアントコンピューティングデバイスもしくは端末から上記データネットワークを介してアクセス可能な少なくとも１つのサーバを備える請求項６から９のうちのいずれか１つに記載の受信コンピューティングデバイス。
少なくとも１つのプログラマブルプロセッサを含むコンピューティングシステムを備えた受信コンピューティングデバイスにおいて、音声発話を受信して音声認識によって処理されるステップと、
上記コンピューティングシステムによって、別のコンピューティングデバイスによって上記受信コンピューティングデバイスよりも効率的に処理される上記受信された音声発話の特徴を識別することにより上記音声発話を初期分析することにより、上記音声発話を２つもしくはそれ以上の音声発話セグメントにセグメント化するステップと、
上記コンピューティングシステムによって、上記２つもしくはそれ以上の音声発話セグメントのそれぞれを複数の利用可能な音声認識器の１つに割り当てるステップとを含む方法であって、
上記割り当てるステップは、上記受信コンピューティングデバイスとは別のコンピューティングデバイス上に実装された上記複数の利用可能な音声認識器の１つの第１の音声認識器によって処理するために上記２つもしくはそれ以上の音声発話セグメントの第１のセグメントと、上記受信コンピューティングデバイス上に実装された上記複数の利用可能な音声認識器の第２の音声認識器によって処理するための上記２つもしくはそれ以上の音声発話セグメントの第２のセグメントとを指定することを含み、
上記音声発話の特徴を識別することは、
上記別のコンピューティングデバイスと上記受信コンピューティングデバイスとを関連付ける処理速度と、上記受信コンピューティングデバイスと上記別のコンピューティングデバイスとの間の帯域幅制限と、上記受信コンピューティングデバイスと上記別のコンピューティングデバイスとの間のネットワーク接続の品質を決定することを含み、
上記方法は、
上記コンピューティングシステムによって、上記第１のセグメントを上記受信コンピューティングデバイスから、処理を行う上記別のコンピューティングデバイスに送信するステップと、
上記コンピューティングによって、第１のセグメント処理結果を上記別のコンピューティングデバイスから戻されて受信するステップを含み、
上記送信するステップと上記受信するステップとは、上記ネットワークを介して行われ、
上記方法は、
上記コンピューティングシステムによって、上記受信コンピューティングデバイスにおいて上記第２のセグメントを処理して第２のセグメント処理結果を生成するステップと、
上記コンピューティングシステムによって、完了された音声認識結果を戻すステップとを含み、
上記完了された音声認識結果は、上記第１のセグメント処理結果及び上記第２の処理結果を含む方法。
上記初期分析するステップはさらに、上記受信コンピューティングデバイスにおいて、１つもしくはそれ以上のプロセッサ上に実装された音響モデルを用いることを含み、
上記初期分析するステップは、
上記２つもしくはそれ以上の音声発話セグメントの少なくとも１つに対して、信頼スコア及びオーディオ品質測定基準を決定することを選択的に含む請求項９記載の方法。
上記割り当てるステップは、
ａ）上記信頼スコア及びオーディオ品質測定基準の少なくとも１つが第１の各しきい値未満であるときに上記別のコンピューティングデバイス上に実装された上記第１の音声認識器により処理するために、上記第１のセグメントを指定することと、
ｂ）上記信頼スコア及びオーディオ品質測定基準の少なくとも１つが第２の各しきい値よりも大きいときに、上記別のコンピューティングデバイス上に実装された上記第２の音声認識器により処理するために、上記第２のセグメントを指定することと、
ｃ）実用的に粗悪な品質を有するとして第３のセグメントを識別することと、
のうちの１つもしくはそれ以上を含み、
上記第１の各しきい値は、設計時間において定義されもしくは実行時間において動的に評価される１つもしくはそれ以上の測定基準に基づいて決定され、
上記第２の各しきい値は、設計時間において定義されもしくは実行時間において動的に評価される１つもしくはそれ以上の測定基準に基づいて決定される請求項１０記載の方法。
上記割り当てるステップは、
上記第１のセグメントが上記初期分析するステップによって決定されて上記別のコンピューティングデバイスにおいて上記受信コンピューティングデバイスよりも速くアクセスできるデータに関連する１つもしくはそれ以上の単語を含むときに、上記別のコンピューティングデバイス上に実装される上記第１の音声認識器によって処理するために、上記第１のセグメントを指定することを含み、
上記第１のセグメント処理結果は、適応された言語を用いて上記別のコンピューティングデバイスにより実行される上記第１のセグメントの分析を選択的に含み、
上記適応された言語モデルは、上記別のコンピューティングデバイスにおいて上記受信コンピューティングデバイスにおけるよりも速くアクセスできるデータに基づいて適応化される請求項９から１１のうちのいずれか１つに記載の方法。
上記受信コンピューティングデバイスは、シンクライアントコンピューティングデバイスもしくは端末を備え、
上記別のコンピューティングデバイスは、上記シンクライアントコンピューティングデバイスもしくは端末から上記データネットワークを介してアクセス可能な少なくとも１つのサーバを備える請求項１１から１４のうちのいずれか１つに記載の方法。
少なくとも１つのプログラマブルプロセッサを含むコンピューティングシステムによって実行されるときに、上記コンピューティングシステムに動作を実行させるコマンドを格納するコンピュータ可読記憶媒体を備えたコンピュータプログラム製品であって、
上記動作は、
受信コンピューティングデバイスにおいて、別のコンピューティングデバイスから第１の音声発話セグメントを受信するステップを含み、
第１のセグメントは、上記コンピューティングデバイス上に実装された複数の利用可能な音声認識器の第１の音声認識器にセグメント化されて割り当てられた音声発話の２つもしくはそれ以上の音声発話セグメントの１つであり、
上記セグメント化することは、上記別のコンピューティングデバイスよりも効率的に上記コンピュータデバイスにより処理される上記音声発話の特徴を識別することにより上記音声発話を初期分析することによりセグメント化され、
上記音声発話の特徴を識別することは、
上記別のコンピューティングデバイスと上記受信コンピューティングデバイスとを関連付ける処理速度と、上記受信コンピューティングデバイスと上記別のコンピューティングデバイスとの間の帯域幅制限と、上記受信コンピューティングデバイスと上記別のコンピューティングデバイスとの間のネットワーク接続の品質を決定することを含み、
上記動作は、
上記セグメント化を処理するステップと、
上記第１のセグメント処理結果を上記別のコンピューティングデバイスに戻されて送信するステップとを含み、
上記送信するステップと上記受信するステップは、上記ネットワークを介して行われるコンピュータプログラム製品。
受信コンピューティングデバイスにおいて、別のコンピューティングデバイスから第１の音声発話セグメントを受信するステップを含む方法であって、
第１のセグメントは、上記コンピューティングデバイス上に実装された複数の利用可能な音声認識器の第１の音声認識器にセグメント化されて割り当てられた音声発話の２つもしくはそれ以上の音声発話セグメントの１つであり、
上記セグメント化することは、上記別のコンピューティングデバイスよりも効率的に上記コンピュータデバイスにより処理される上記音声発話の特徴を識別することにより上記音声発話を初期分析することによりセグメント化され、
上記音声発話の特徴を識別することは、
上記別のコンピューティングデバイスと上記受信コンピューティングデバイスとを関連付ける処理速度と、上記受信コンピューティングデバイスと上記別のコンピューティングデバイスとの間の帯域幅制限と、上記受信コンピューティングデバイスと上記別のコンピューティングデバイスとの間のネットワーク接続の品質を決定することを含み、
上記方法は、
上記セグメント化を処理するステップと、
上記第１のセグメント処理結果を上記別のコンピューティングデバイスに戻されて送信するステップを含み、
上記送信するステップと上記受信するステップとは、上記ネットワークを介して行われる方法。