JP2003511924A

JP2003511924A - ローカルなインターラプト検出に基づく音声認識技術

Info

Publication number: JP2003511924A
Application number: JP2001529228A
Authority: JP
Inventors: アイラ・エイ・ガーソン
Original assignee: オーボ・テクノロジーズ・インコーポレイテッド
Priority date: 1999-10-05
Filing date: 2000-10-04
Publication date: 2003-03-25
Also published as: US6963759B1; CN100433840C; CN1408182A; KR20020071851A; WO2001026394A9; JP2012108557A; JP5425945B2; KR100742259B1; AU2112601A; WO2001026394A1

Abstract

(57)【要約】無線通信システム（１００）の中で、加入者ユニットのユーザーと他の者との間の音声通話中の加入者ユニットの中のインターラプト表示の検出が、提供される。前記のインターラプト表示に応答して、音声認識エレメントが、動作させられて、音声をベースとするコマンドの処理を開始する。前記の音声認識エレメントを、クライアント−サーバ音声認識構成（１１５）の中のようなインフラの少なくとも一部の中で実行することができる。前記のインターラプト表示を、加入者の装置の一部を形成するデバイスを使用するか、あるいは加入者の装置（１４０）の中の音声認識装置を経由して、提供することができる。前記の加入者の装置の所でインターラプト表示を検出することで、この発明で、無線通信環境の中の電子アシスタントと同様のサービスを利用することが容易にできる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】

この発明は、一般的に音声認識が組み込まれている通信システムに関し、また
より具体的には、音声通信中のインターラプト検出のための新規の技術に関する
。

【０００２】

【従来の技術】

音声認識システムは、特に電話システムに関して一般的に公知の技術である。
米国特許４，９１４，６９２、５，４７５，７９１、５，７０８，７０４と、ま
た５，７６５，１３０は、音声認識システムを組み込んだ電話網を例示している
。各システムの共通する特徴は、音声認識エレメント（即ち、音声認識を実施す
るデバイス）は、加入者の通信デバイス（即ち、ユーザーの電話）とは逆に、一
般的に、電話網の構成の中心に位置されている。典型的には、音声の合成と音声
認識エレメントとの組み合せは、電話網あるいはインフラストラクチャ内で展開
されている。呼者は、そのシステムにアクセスし、音声合成エレメントを介して
、合成された音声の形での情報のプロンプトあるいはクエリーの提供を受けるこ
とができる。呼者は、一般的に、合成された音声に対して口頭による応答を行い
、音声認識エレメントは、呼者にさらなるサービスを提供するために、呼者の口
頭による応答を処理する。

【０００３】このタイプのシステムの特定のアプリケーションは、時には、“仮想アシスタ
ント”あるいは“自動アシスタント”と呼ばれる“電子アシスタント”であった
。例えば、米国特許５，６５２，７８９（以下“７８９特許”と称す）は、電子
アシスタントを経由して加入者が、個人通話を管理できるサービスを説明してい
る。音声認識技術を使用して、加入者は、命令を発して、出入りする通話とメッ
セージを管理できる。一般的な、電話をベースとするシステムの中の様に、‘７
８９特許の中で説明されている音声認識エレメントは、全て電話インフラ組織の
中にある。‘７８９特許の中で説明されている特徴の一つは、電子アシスタント
を設けて、加入者が。他の当事者と音声通話中に、バックグラウンド・モードに
入ることができる音声認識エレメントの性能である。このバックグラウンド・モ
ード中に、電子アシスタントは、音声をベースとする、特に電子アシスタントが
、“フォアグラウンド・モード”にさせる“呼び出しコマンド”の様な所定の発
生のセットに対して加入者の音声通話を監視する。フォアグラウンド・モードの
中で、電子アシスタントは、引続き音声をベースとするコマンドの大きなセット
に対して監視する。この方法で、電子台は、文字どおり“通話中”となり、加入
者のニーズに答え、特定の呼び出しあるいは“ウェークアップ”コマンドの検出
を通して呼び出される。

【０００４】

【発明が解決しようとする課題】

前記で説明されているとおり、‘７８９特許の中で説明されている、電子台を
呼び出す機能は、電話網の中に展開されている音声認識エレメントを通して動作
させることができる。同様の電子アシスタントのサービスを実行する種々の他の
システムは、現在一般に入手可能である。同様に、このようなシステムは、ネッ
トワークをベースとする音声認識エレメントを通して動作させることができる。
呼び出し時間あるいは遅延が、大部分の電話網の中で一般的に短いので（約数ミ
リ秒間）、特に電子アシスタントに対する“ウェークアップ”コマンドが応用さ
れたインフラをベースとする音声認識エレメントが実用的であるが、しかし、現
行のシステムは、無線システムに的を絞ることを怠ってきた。例えば、異なるセ
ルラ・システムの中で、無線通信チャンネルの変動する性格（即ち、時間と共に
変化する劣化とスループットの遅延）と、また応用される音声の処理の差、があ
ると仮定して、純粋にインフラをベースとする音声認識エレメントの使用は、問
題を引き起こす可能性がある。現在の解決として、また完全に音声チャンネルと
専用のネットワーク資源を使用して、音声認識機能に“ウェークアップ”を提供
する。この方法では、“空白時間”と、ネットワークをベースとする音声認識を
利用可能とするサービスのためのネットワーク資源の非効率的な使用につながる
。従って、加入者が電子アシスタントサービス、あるいは音声をベースとするサ
ービスを利用して、無線通信の環境の中で“ウェークアップ”音声認識性能を発
揮させることができるより効率的な技術を提供することが有利である。

【０００５】

【課題を解決するための手段】

この発明は、一般的に、音声認識機能をウェークアップさせたり呼び出したり
するための、主として無線通信環境に応用可能な技術を提供する。特に、この発
明は、加入者と他の当事者との間の音声通話の間のインターラプト表示のローカ
ルの検出を組み込んでいる。インターラプト表示に応答して、音声認識エレメン
トの一部が動作して、音声をベースとするコマンドの処理を開始する。一つの実
施例の中では、音声認識エレメントは、インフラの中の少なくとも部分的に実行
され、できれば、加入者ユニットの中で実施される音声認識クライアントと、ま
た無線通信システムのインフラの中で実施される音声認識サーバを備えることが
このましい。他方の実施例の中では、加入者ユニットの一部を形成する入力デバ
イスを使用してインターラプト表示を提供することができる。更にもう一つの実
施例の中では、加入者ユニットの中の音声認識装置を使用して、インターラプト
表示を提供することができる。加入者ユニットの中で表示信号を検出することで
、この発明により、無線通信環境の中でより容易に電子アシスタントあるいは同
様のサービスを利用することができる。

【０００６】

【発明の実施の形態】

本発明を、図１〜６を引用して、より詳しく説明することができる。図１は、
加入者ユニット１０２、１０３を備える無線通信１００のシステム全体のアーキ
テクチャを示している。加入者の装置１０２、１０３は、無線システム１１０に
対応している無線チャンネル１０５を経由してインフラストラクチャと通信する
。本発明のインフラストラクチャは、無線システム１１０に加えて、スモール・
エンティティ・システム１２０と、コンテンツ・プロバイダ・システム１３０と
、企業システム１４０がデータ網１５０を介して相互に接続されているものとす
ることもできる。

【０００７】加入者ユニットは、通信インフラストラクチャと通信可能な携帯電話１０３ある
いは車両搭載の無線通信デバイス１０２のような無線通信デバイスであってもよ
い。図１の中に示されている以外の各種の加入者ユニットを使用することができ
、本発明はこの点で限定されないものと解釈されるものとする。加入者ユニット
１０２、１０３を、ハンズフリーで音声通信するためのハンズフリーセルラ電話
と、ローカルの音声認識及び合成システムと、またクライアント−サーバ音声認
識及び合成システムのクライアント部分の構成部品を備えるものとすることがで
きる。これらの構成部品は、図２、図３に関して、更に詳しく説明される。

【０００８】加入者ユニット１０２、１０３は、無線チャンネル１０５を経由して無線システ
ム１１０と無線通信を行う。無線システム１１０は、当業者であれば、本発明を
、音声通信に対応しているセルラ以外のタイプの無線システムに有利に応用する
ことが分かるが、好ましくは、セルラ・システムを備えるものとすることが好ま
しい。無線チャンネル１０５は、一般的に、デジタル搬送技術を実施し、また音
声あるいはデータあるいはその双方を、加入者ユニット１０２、１０３へ及びユ
ニットから搬送できる無線周波数（ＲＦ）搬送波である。アナログ技術のような
他の伝送技術でも、使用できるものと解釈されるものとする。好ましい実施例の
中で、無線チャンネル１０５は、欧州通信規格協会（ＥＴＳＩ）により規定され
ている一般パケット無線サービス（ＧＰＲＳ）のような無線パケット・データ・
チャンネルである。無線チャンネル１０５は、データを転送して、クライアント
−サーバ音声認識及び合成システムのクライアント部分と、クライアント−サー
バ音声認識及び合成システムのサーバ部分との間の通信を容易にする。表示、制
御、あるいは状態情報の様な他の情報も、また無線チャンネル１０５上で転送で
きる。

【０００９】無線システム１１０は、加入者ユニット１０２、１０３から無線チャンネル１
０５により送信されたものを受信するアンテナ１１２を備える。アンテナ１１２
は、またチャンネル１０５を経由して加入者ユニット１０２、１０３に送信する
。アンテナ１１２を経由して受信されたデータは、データ信号に転換されて、無
線網１１３に転送される。反対に、無線網１１３からのデータは、転送のために
アンテナ１１２に送信される。本発明に関連しては、無線網１１３は、一般的に
公知の基地局や、制御装置や、リソース・アロケータ（資源割当装置）や、イン
ターフェースや、データベース等の様な無線システムを実行するのに必要な諸デ
バイスを備える。当業者であれば分かるとおり、無線網１１３に組み込まれる特
定のエレメントは、例えば、セルラ・システム、自動車に搭載された地上移動シ
ステムのような無線システム１１０の特定のタイプに応じて異なる。

【００１０】クライアント−サーバ音声認識及び合成システムのサーバ部分を提供する音声
認識サーバ１１５を無線網１１３に連結して、無線システム１１０のオペレータ
が、音声を基礎とするサービスを、加入者ユニット１０２、１０３に提供するこ
とができるようにすることができる。制御エンティティ１１６を、無線網１１３
に連結することができる。音声認識サーバ１１５により提供された入力に応答し
て、制御エンティティ１１６を使用して、制御信号を加入者ユニット１０２、１
０３に送って、加入者ユニットあるいは装置に相互接続されているデバイスを制
御することができる。図示されているとおり、適切にプログラムされた全ての汎
用コンピュータを備えるものとすることができるエンティティ１１６を、無線網
１１３を経由するかあるいは図の中の破線で示されているように直接に音声認識
サーバ１１５に接続することができる。

【００１１】前記で指摘されているとおり、本発明のインフラストラクチャを、データ網１
５０を経由して互いに接続された種々のシステム１１０、１２０、１３０、１４
０を備えるものとすることができる。適切なデータ網１５０は、公知の通信網技
術を使用したプライベートデータ網やインターネットなどの公衆ネットワークや
、これらの組み合せなどを備えるものとすることができる。無線システム１１０
内の音声認識サーバ１１５と選択的に又は付加的に、遠隔音声認識サーバ１２３
、１３２、１４３、１４５を、各種の方法でデータ網１５０に接続して、音声を
基礎とするサービスを、加入者ユニット１０２、１０３に提供するようにしても
よい。遠隔音声認識サーバが備わっている場合は、同様に、データ網１５０及び
全ての介在する通信パス（経路）を経由して、制御エンティティ１１６と通信す
ることができる。

【００１２】小型のエンティティ・システム１２０（小規模事業所あるいは在宅の様な）内
では、デスクトップ・パソコンあるいは他の汎用処理デバイスの様な、コンピュ
ータ１２２を使用して、音声認識サーバ１２３を実行することができる。加入者
ユニット１０２、１０３を出入りするデータは、無線システム１１０とデータ網
１５０を経由して、コンピュータ１２２に向けられる。保存されたソフトウエア
のアルゴリズム及び処理を実行してから、コンピュータ１２２は、音声認識サー
バ１２３の機能を提供する。サーバは、好ましい実施例の中で、音声認識システ
ムと音声合成システムの双方のサーバ部分を備える。場合、例えば、コンピュー
タ１２２がユーザーのパソコンである場合、コンピュータ上の音声認識サーバの
ソフトウエアを、コンピュータ内のユーザーのＥメールや、電話帖や、カレンダ
ーや、他の情報の様なユーザーの個人情報に接続させることができる。この構成
で、加入者ユニットのユーザーは、音声をベースとするインターフェースを利用
して、自分のパソコン上の個人情報にアクセスできる。本発明に基づくクライア
ント−サーバ音声認識と音声合成システムのクライアント部分は、下記の図２と
３に関連させて説明される。本発明に基づくクライアント−サーバ音声認識と音
声合成システムのサーバ部分は、下記の図４と５に関連させて説明される。

【００１３】また、加入者ユニットのユーザーが利用可能にしたい情報を有するコンテンツ
・プロバイダ１３０は、音声認識サーバ１３２を、データ網に接続させることが
できる。特集あるいは特別のサービスとしての申出に、音声認識サーバ１３２は
、コンテンツのプロバイダの情報（図示されていない）へのアクセスを希望する
加入者ユニットのユーザーに、音声をベースとするインターフェースを提供する
。

【００１４】別の音声認識サーバのための可能な場所は、大企業あるいは同様のエンティテ
ィなどの企業１４０内である。イントラネットの様な企業内の通信網１４６は、
セキュリティ（安全）ゲートウエイ（複数のネット間の接続）１４２を経由して
データ網１５０に接続される。セキュリティ・ゲートウエイ１４２は、加入者ユ
ニットと連動して、企業内通信網１４６に対する安全なアクセスを提供する。公
知の技術のとおり、この方法で提供される安全なアクセスは、一般的に、認証と
暗号技術に一部依存する。この方法で、安全でないデータ網１５０を介した、加
入者ユニットと内部通信網１４６との間の安全な通信が提供される。企業１４０
内で、音声認識サーバ１４５を実行するサーバ・ソフトウエアを、所定の従業員
のワークステーションのようなパソコン１４４上に提供できる。小規模のエンテ
ィティ・システムの中で使用するための前記で説明された構成と同様に、このワ
ークステーションアプローチで、従業員は音声をベースとするインターフェース
を経由して、作業に関連の又は他の情報にアクセスできる。また、コンテンツ・
プロバイダ１３０モデルと同様に、企業１４０は、内部で利用できる音声認識サ
ーバ１４３を提供して、企業のデータベースへのアクセスを提供することができ
る。

【００１５】本発明の音声認識サーバが配置されている場所の如何を問わず、サーバを使用
して、各種の音声をベースとするサービスを実行することができる。例えば、制
御エンティティ１１６が設けられている場合、これと連動させて、音声認識サー
バで、加入者ユニット又は、これに接続されているデバイスの操作の制御をする
ことができる。この明細書全体を通じて使用されている音声認識サーバと言う用
語が、音声合成機能をも同時に含むことに留意しなければならない。

【００１６】本発明のインフラストラクチャは、また、音声認識サーバ１０２、１０３とま
た通常の電話システムとの間の相互接続を提供する。機能は、無線網１１３をＰ
ＯＴＳ（旧式の電話システム）網１１８に接続することで、図１の中に示されて
いる。公知の技術のとおり、ＰＯＴＳ網、あるいは同様の電話網は、陸上通信線
あるいは他の無線デバイスのような複数の呼び局への通話アクセスを提供する。
この方法で、音声認識サーバ１０２、１０３のユーザーは、他の呼び局１１９と
の音声通信を続行できる。下記に詳しく説明されているとおり、この発明は、ロ
ーカルで、音声通信中に電子アシスタントに対するウェークアップコマンドの様
なインターラプト表示を検出する技術を提供する。

【００１７】図２は、この発明に係る加入者ユニットを実行するのに使用できるハードウエ
アのアーキテクチュアを示している。図示されているように、２個の無線トラン
シーバ、即ち無線データ・トランシーバと無線音声トランシーバを使用すること
ができる。公知の技術のように、これらのトランシーバを、データと音声機能の
双方を実行することができる単独のトランシーバに結合させることができる。無
線データ・トランシーバ２０３と無線音声トランシーバ２０４の双方ともアンテ
ナ２０５に接続されている。また、各々のトランシーバに対して、別個のアンテ
ナを使用することができる。無線音声トランシーバ２０４は、全ての必要な信号
処理や、プロトコル終了や、変調／復調等を実行して、無線音声通信を提供し、
セルラ・トランシーバを備える。同様の方法で、無線データ・トランシーバー２
０３はインフラとのデータ接続性を提供する。好ましい実施例の中では、無線デ
ータ・トランシーバ２０３は、欧州通信規格協会（ＥＴＳＩ）により規定されて
いる一般パケット・データ無線サービス（ＧＰＲＳ）のような無線パケットデー
タに対応している。

【００１８】この発明を、下記で説明されているとおり、車両搭載システムに有利に応用で
きることが見込まれる。車両搭載に利用された場合、この発明に係る加入者ユニ
ットは、また、一般的に車両の一部であり、加入者ユニットの一部ではないと見
なされる処理構成部品を備える。この発明を説明する目的で、処理構成部品を、
加入者ユニットの一部と仮定する。加入者ユニットの実用に当たって、設計面を
斟酌して、処理構成部品を含めたり専用とし含めないこともできるものと解釈さ
れるものとする。好ましい実施例の中で、処理構成部品は、ＩＢＭ社の“ＰＯＷ
ＥＲＰＣ”のような汎用プロセッサ（ＣＰＵ）２０１と、また、Ｍｏｔｏｒｏ
ｌａ社のＤＳＰ５６３００シリーズ・プロセッサのようなデジタル信号処理装置
（ＤＳＰ）２０２を備える。ＣＰＵ２０１とＤＳＰ２０２は、公知の技術のとお
り、データ・バスとアドレス・バスを介して互いに接続されていることと、また
他の制御接続を示すために、図２の中で隣接して示されている。また、実施例の
中で、ＣＰＵ２０１とＤＳＰ２０２の双方の機能を単独のプロセッサに結合させ
たり、あるいは複数のプロセッサに分割することができるようになっている。Ｃ
ＰＵ２０１とＤＳＰ２０２の双方は、関連するプロセッサに対するプログラムと
データの保存を提供する個々のメモリー２４０、２４１に接続されている。保存
されているソフトウエアのルーチンを使用して、ＣＰＵ２０１あるいはＤＳＰ２
０２あるいはその双方をプログラム化して、この発明の機能の少なくとも一部を
実行することができる。ＣＰＵ２０１とＤＳＰ２０２は、下記の図３と６に関連
させて、少なくとも部分的に、下記で説明される。

【００１９】好ましい実施例の中で、加入者ユニットは、また、アンテナ２０７に接続され
ている全地球測位衛星（ＧＰＳ）受信機２０６を備える。ＧＰＳ受信機２０６は
、ＤＳＰ２０２に接続されて、受信されたＧＰＳ情報を提供している。ＤＳＰ２
０２は、ＧＰＳ受信機から情報を取り込んでから、無線通信デバイスの場所の座
標を計算する。また、ＧＰＳ受信機２０６を、ＣＰＵ２０１に直接場所の情報を
提供するものとすることができる。

【００２０】ＣＰＵ２０１とＤＳＰ２０２の種々の出入力は、図２の中に示されている。図
２の中に示されているとおり、太線は、音声関係情報に対応し、また太い破線は
、制御／データ関連情報に対応する。オプションとしてのエレメントと信号パス
は、点線で示されている。ＤＳＰ２０２は、下記で更に詳しく説明されていると
おり、電話（セル電話）の音声に対する音声入力と、ローカルの音声認識装置と
クライアント−サーバ音声認識装置のクライアント側の部分の双方に音声入力を
提供するマイク２７０から、マイク音声２２０を受信する。ＤＳＰ２０２は、ま
た、電話（セル電話）の音声に対する音声出力と、ローカルの音声合成装置とク
ライアント−サーバ音声合成装置のクライアント側の部分の双方からの音声出力
の双方を提供する少なくとも１個のスピーカー２７１に向けられている出力音声
２１１に接続されている。携帯デバイスの中のように、マイク２７０とスピーカ
ー２７１の位置を互いに近付けたり、あるいは、サンバイザーに取り付けられて
いるマイクとダッシュボードあるいはドアに取り付けられているスピーカーを有
する自動車での応用のように、互いに引き離すことができることに留意しなけれ
ばならない。

【００２１】この発明のもう一つの実施例の中で、ＣＰＵ２０１は、双方向インターフェー
ス２３０を経由して、車両搭載のデータ・バス２０８に接続されている。データ
・バス２０８で、セル電話や、娯楽（ラジオ、カセット・プレーヤー）システム
や、車内環境システムのような車に搭載されている種々のデバイス２０９ａ〜n
とＣＰＵ２０１との間で通信される状態情報を制御することができる。適切なデ
ータ・バス２０８を、自動車技術者協会により現在標準化作業が進行中のＩＴＳ
データ・バス（ＩＤＢ）とすることが見込まれる。ブルーツース・シグ（ＳＩＧ
）（意見交換フォーラム）により定義される近距離無線データ通信システムのよ
うな種々のデバイス間の制御と状態情報を通信するまたの手段を使用することが
できる。データ・バス２０８で、ＣＰＵ２０１は、ローカルの認識装置、あるい
はクライアント−サーバ認識装置の何れかにより認識された音声命令に応答して
、車両搭載のデータ・バス上のデバイス２０９を制御できる。

【００２２】ＣＰＵ２０１は、データ受信接続線２３１と、またデータ送信接続線２３２を
経由して無線データ・トランシーバ２０３に接続されている。接続線２３１、２
３２で、ＣＰＵ２０１は、無線システム１１０から送信された制御情報と音声合
成情報を受信することができる。音声合成情報は、無線データ・チャンネル１０
５を経由して、クライアント−サーバ音声合成システムのサーバ部分から受信さ
れる。ＣＰＵ２０１は、音声合成情報を復号してから、ＤＳＰ２０２に届けられ
る。ＤＳＰ２０２は、出力された音声を合成してから、合成されたものを音声出
力２１１に届けられる。受信データ接続線２３１を経由して受信された全ての制
御情報を、加入者ユニット自身を操作するために利用したり、１個あるいはそれ
以上のデバイスに送信して、デバイスの動作を制御することができる。更に、Ｃ
ＰＵ２０１は、状態情報と、またクライアント−サーバ音声認識システムのクラ
イアント部分からの出力データを、無線システム１１０に送信することができる
。クライアント−サーバ音声認識システムのクライアント部分は、下記で更に詳
しく説明されているとおり、好ましくは、ＤＳＰ２０２とＣＰＵ２０１内のソフ
トウエアの中で実行されることが好ましい。音声認識に対応させるときに、ＤＳ
Ｐ２０２は、マイク入力線２２０を受信してから、音声を処理して、パラメータ
化された音声信号を、ＣＰＵ２０１に音声を提供する。ＣＰＵ２０１は、パラメ
ータ化された音声信号を符号化して、情報は、接続線２３２を経由して、無線デ
ータ・トランシーバ２０３に送信され、更に、無線データ・チャンネル１０５上
で、インフラストラクチャの中の音声認識サーバに向けて送信される。

【００２３】無線音声トランシーバ２０４は、双方向データ・バス２３３を経由して、ＣＰ
Ｕ２０１に接続されている。データ・バスで、音声トランシーバ２０４を操作し
て、無線音声トランシーバ２０４からの状態情報を受信することができる。無線
音声トランシーバ２０４は、音声送信接続線２２１と、また受信音声接続線２１
０を経由して、ＤＳＰ２０２に接続されている。電話（セルラ）の通話を活用す
るために無線音声トランシーバ２０４が使用されているとき、音声は、ＤＳＰ２
０２により、マイクの入力線２２０から受信される。マイクの音声は、処理（例
えば、フィルター、圧縮等）されてから、無線音声トランシーバ２０４に提供さ
れて、更にセルラ・インフラに送信される。反対に、無線音声トランシーバ２０
４により受信された音声は、受信音声接続線２１０を経由して、ＤＳＰ２０２に
送信され、ＤＳＰ２０２で、音声は処理（解凍、フィルター等）されてから、ス
ピーカー出力線２１１に提供される。ＤＳＰ２０２により実行される処理は、図
３を引用して、更に詳しく説明される。

【００２４】図２の中に示されている加入者ユニットを、オプションとして、音声通信中に
、手動でインターラプト表示線２５１を使用するための入力デバイス２５０を備
えるものとすることができる。即ち、音声による通信中に、加入者ユニットのユ
ーザーは、手動で入力デバイスを動作させて、インターラプト表示を提供するこ
とで、音声認識機能をウェークアップさせたいと言うユーザーの意思を伝えるこ
とができる。例えば、音声による通信中に、加入者ユニットのユーザーが、音声
をインターラプトして、音声をベースとするコマンドを電子アシスタントに提供
して、ダイヤルして、通話に第三者を加えたくなることがある。入力デバイス２
５０を、実質的に如何なるタイプのユーザーにより動作化される入力機構を備え
るものとすることができる。例として、特に挙げることができるものは、単一あ
るいは多目的ボタンや、多重位置セレクタや、あるいは入力機能を有するメニュ
ーで駆動されるディスプレーである。また、入力デバイス２５０を、双方向イン
ターフェース２３０と、また車両搭載データ・バス２０８を経由して、ＣＰＵ２
０１に接続することができる。入力デバイスが設けられていると否とを問わず、
ＣＰＵ２０１は、インターラプト表示があるかないかを識別するための検出装置
としての役割を果たす。ＣＰＵ２０１が、入力デバイス２５０に対する検出装置
としての役割を果たしているときは、ＣＰＵ２０１は、参照符号２６０がふられ
ている信号パスにより示されているとおり、インターラプト表示の存在をＤＳＰ
２０２に指摘する。反対に、インターラプト表示を提供するための検出装置に接
続されているローカルの音声認識装置を使用する他の機能（できれば、ＤＳＰ２
０２あるいはＣＰＵ２０１あるいはその双方により実行されることが好ましい）
を有している。この場合、参照符号２６０ａが振られている信号パスで示されて
いるとおり、ＣＰＵ２０１あるいはＤＳＰ２０２の何れかは、インターラプト表
示の存在を指摘する。一旦インターラプト表示の存在が検出されたか否かを問わ
ず、音声認識エレメントの一部（できれば、加入者ユニットに関連してか、ある
いは一部として実行されるクライアント部分であることが好ましい）が動作して
、コマンドをベースとする音声処理を開始する。更に、音声認識エレメントの一
部が動作したと言う表示をユーザーと、また音声認識サーバに提供することがで
きる。好ましい実施例の中で、この表示は、送信データ接続線２３２を経由して
、無線データ・トランシーバ２０３に搬送され、更に、音声識別エレメントを提
供するために、音声認識クライアントと協動する音声認識サーバに送信される。

【００２５】最後に、加入者ユニットには、インターラプト表示に応答して音声認識の機能
が動作したことを伝える表示器制御線２５６に応答して加入者ユニットのユーザ
ーに表示を提供する表示器２５５が装備されていることが好ましい。表示器２５
５は、インターラプト表示装置に応答して動作させられ、一定期間のトーンある
いはビープの様な、音声表示を提供するのに使用されるスピーカーを備えるもの
とすることができる（ここでも、入力デバイスをベースとする信号２６０、ある
いは音声をベースとする信号２６０ａの何れかを使用して、インターラプト表示
装置が、表示を受けることができるようになっている。）他の実施例の中で、音
声をスピーカー出力線２１１に向ける、ＤＳＰ２０２により実行されるソフトウ
エア・プログラムを経由して表示器の機能が設けられている。スピーカーを、別
々のものにするか、あるいは同じスピーカー２７１を使用して、出力音声線２１
１を可聴とすることができる。また、表示器２５５を、可視表示装置を提供する
ＬＥＤあるいはＬＣＤ表示装置の様な表示装置を備えるものとすることができる
。表示器２５５の特定の形態は、設計の選択の問題であり、この発明では、必ず
しもこの事項に限定されないものとする。更に、表示器２５５を、双方向インタ
ーフェース２３０と、また車両搭載データ・バス２０８を経由して、ＣＰＵ２０
１に接続することができる。

【００２６】ここで、図３を引用して、加入者ユニット（この発明に従って動作する）の中
で実行される処理部分は、保存された、ＣＰＵ２０１あるいはＤＳＰ２０２ある
いはその双方により実行されるマシンにより読み取り可能な命令を使用して実行
される。下記に発表されている解説は、自動車の中に展開されている加入者ユニ
ットの動作を説明しているが、図３の中に一般的に示され、この明細書の中で説
明されている機能は、同様に非車両をベースとする使用に応用できるか、あるい
は音声認識を使用することで利点を発揮させることができる。

【００２７】マイクの音声線２２０は、入力として加入者ユニットに提供される。自動車の
環境下では、マイクは、一般的にサンバイサあるいは車両のステアリングコラム
に直接取り付けられているか隣接した所にある通常ハンズフリーマイクである。
できれば、マイクの音声線２２０が、デジタルの形態で、エコー・キャンセラー
（２個の信号の伝送遅延による反射の取消）と環境処理（ＥＣＥＰ）ブロック３
０１の所まで到達することが好ましい。スピーカーの音声２１１は、全ての必要
な処理を受けてから、ＥＣＥＰブロック３０１を経由して、スピーカー（複数を
含む）に届けられる。車両の中では、スピーカーは、ダッシュボードの下に取り
付けられる。また、スピーカー音声線２１１を、娯楽システムのスピーカー・シ
ステムを経由して演奏される車両の中の娯楽システムを経由させることができる
。スピーカー音声線２１１は、できれば、デジタル・フォーマットであることが
好ましい。例えば、セルラ通話が進行中であるとき、セルラ電話から受信された
音声は、受信音声接続線２１０を経由してＥＣＥＰブロック３０１に到達する。
同様にして、送信される音声は、送信音声接続線２２１を経由して、セル電話に
届けられる。

【００２８】ＥＣＥＰブロック３０１には、送信音声接続線２２１を経由して、無線トラン
シーバ２０４に届けられる前に、マイク音声線２２０からのスピーカー音声線２
１１のエコー・キャンセルが提供される。エコー・キャンセルは、音声エコー・
キャンセルとして知られており、また公知の技術である。例えば、Ａｍａｎｏ他
に交付された、“サブ・バンド音声エコー・キャンセラー”の名称の米国特許５
，１３６，５９９と、またＧｅｎｔｅｒに交付された、“サブバンド減衰とノイ
ズ除去制御を有するエコー・キャンセラー”の名称の米国特許５，５６１，６６
８は、音声エコー・キャンセルを実施するのに適切な技術を教示しており、特許
の教示事項は、引用により、この明細書の中に組み込まれている。

【００２９】ＥＣＥＰブロック３０１は、またエコー・キャンセルの他に、環境処理をマイ
ク音声線２２０に提供して、加入者ユニットにより送信された音声を受信する側
により快適な音声信号を提供する。一般的に普及している一つの技術は、ノイズ
抑圧と呼ばれている。車両の中のハンズフリーマイクは、一般的に、他人に聞き
取られる多数のタイプの音声ノイズを取り込む。他人に聞き取られる知覚される
バックグラウンド・ノイズを減らす技術は、例えば、Ｖｉｌｍｕｒ他に交付され
た米国特許４，８１１，４０４により説明されており、特許の教示事項は、引用
により、この明細書の中に組み込まれている。

【００３０】ＥＣＥＰブロック３０１は、また、第１音声パス３１６を経由して、音声合成
バックエンド３０４により提供された合成された音声のエコー・キャンセル処理
を提供する。合成された音声は、音声出力線２１１を経由して、スピーカー（複
数を含む）に届けられる。受信された音声がスピーカー（複数を含む）に向けら
れた場合と同様に、マイクの音声パス２２０上で到達したスピーカーの音声“エ
コー”は、打ち消される。作用で、音響的にマイクに連結されたスピーカーの音
声を、音声が音声認識のフロント・エンド３０２に届く前に、マイクの音声から
取り除くことができる。タイプの処理により、公知の技術で“バージイン”とし
て知られている技術を動作させることができる。バージインで、出力音声が同時
にシステムで生成されながら、音声認識システムを、音声に対応させることがで
きる。“バージイン”の実施例は、例えば、米国特許４，９１４，６９２と、５
，４７５，７９１と、５，７０８，７０４また５，７６５，１３０の中に見い出
すことができる。

【００３１】エコーが打ち消されたマイクの音声は、音声認識処理が事項される度に、第２
音声パス３２６を経由して、音声認識フロント・エンド３０２に供給される。オ
プションとして、ＥＣＥＰブロック３０１は、第１データ・パス３２７を経由し
て、バックグラウンド・ノイズ情報を音声認識フロント・エンド３０２に提供す
る。バックグラウンド・ノイズ情報を、ノイズが多い環境の中で動作する音声認
識システムに対する認識性能を改善するのに使用できる。処理を実施するのに適
する技術は、Ｇｅｒｓｏｎ他に交付された米国特許４，９１８，７３２の中で説
明されており、特許の教示事項は、この明細書の中で、引用で組み込まれている
。

【００３２】エコーが打ち消されたマイクの音声と、オプションとして、ＥＣＥＰブロック
３０１から受信されたバックグラウンド・ノイズ情報を基礎として、音声認識フ
ロント・エンド３０２は、パラメータ化された音声情報を生成する。音声認識フ
ロント・エンド３０２と、また音声合成バック・エンド３０４は、共に、音声認
識及び合成システムをベースとするクライアント−サーバのクライアント側の部
分の核となる機能を提供する。パラメータ化された音声情報は、一般的に、特徴
ベクトルの形態であり、この場合、１０から２０ミリ秒毎に新しいベクトルが計
算される。音声信号のパラメータ化のために普及している一つの技術は、１９８
０年８月の、音声音声と信号処理に関する、ＡＳＳＰ−２８（４）の、頁３５７
−３６６ＩＥＥＥ（米国電気電子技術者協会の会報の、“連続的に喋られる文の
単音節の言葉の認識に対するパラメータによる表示の比較”Ｄａｖｉ他により説
明されているとおりの、ｍｅｌｃｅｐｓｔｒａであり、刊行物の教示、引用に
よりこの明細書の中に組み込まれている。

【００３３】音声認識フロント・エンド３０２により計算されたパラメータのベクトルは、
ローカルの音声認識処理のために、第２データ・パス３２５を経由して、ローカ
ルの音声認識ブロック３０３に送られる。パラメータのベクトルは、また、オプ
ションとして、第３データ・パス３２３を経由して、音声アプリケーション・プ
ロトコル・インターフェース（ＡＰＩ）（複数）と、またデータ・プロトコル（
複数）を備えるプロトコル処理ブロック３０６に送られる。公知の技術に従って
、処理ブロック３０６は、送信データ接続線２３２を経由して、パラメータ・ベ
クトルを無線データトランシーバ２０３に送る。反対に、無線データトランシー
バ２０３は、音声認識装置をベースとするクライアント−サーバの一部として機
能するパラメータ・ベクトルをサーバに送る。（パラメータ・ベクトルを送信す
るよりも、加入者ユニットのほうが、無線データトランシーバ２０３または無線
音声トランシーバ２０４のいずれかを用いるサーバに音声情報を代わりに送信す
ることができるということが理解される。このことは、加入者ユニットから電話
ネットワークへの音声伝送を支持するのに用いられる、または、音声信号を生ず
る他の適切な同様の方法で行われてもよい。すなわち音声信号は、生のデジタル
化されたオーディオ、セルラー音声コーダで処理したオーディオ、ＩＰ（インタ
ーネットプロトコル）等の特定のプロトコルに準ずる伝送に好適なオーディオデ
ータ等の種々のパラメータ化されていない生成物のいずれかを備えてもよい。次
いでサーバは、パラメータ化されていない音声情報を受信すると、必要とされる
パラメータ化を行うことができる。）単独の音声認識フロント・エンド３０２が
示されているが、実際的には、ローカルの音声認識装置３０３と、音声認識装置
をベースとするクライアント−サーバは、種々の音声認識フロントエンドを利用
することができる。

【００３４】ローカルの音声認識装置３０３は、音声認識フロント・エンド３０２からパラ
メータ・ベクトル３２５を受信してから、フロント・エンド上で音声認識分析を
実行し、例えば、パラメータ化された音声の中に認識できる発話があるかどうか
を決定する。一つの実施例の中で、認識された発話（一般的に単語）は、加入者
ユニットの中の音声認識装置３０３から、第４データ・パス３２４を経由して、
プロトコル処理ブロック３０６に送られ、パスは、更に処理を行うために、認識
された発話を種々のアプリケーション３０７に渡す。ＣＰＵ２０１、あるいはＤ
ＳＰ２０２あるいはその双方を使用して実行することができるアプリケーション
３０７は、認識された発話をベースとする検出装置アプリケーションを備えるも
のとすることができ、音声をベースとするインターラプト指示表示が受信された
ことを確かめる。例えば、検出装置は、マッチングのための検索を行いながら、
認識された発話を予め設定された発話のリスト（例えば“ウェークアップ”）と
比較する。整合が検出されたときは、検出装置アプリケーションは、信号２６０
ａを発して、インターラプト表示の存在を知らせる。インターラプト表示の存在
は、次に、音声認識エレメントを動作させて、音声をベースとするコマンドの処
理を開始させるのに使用される。作用の概略は、音声認識フロント・エンドに送
られる信号２６０ａにより図３の中で示されている。この作用に応答して、音声
認識フロント・エンド３０２は、引続き、パラメータ化された音声を、加入者ユ
ニットの中の音声認識装置に向けて送るか、あるいは、できれば、追加の処理の
ために音声認識サーバに送信するために、プロトコル処理ブロック３０６に送る
ことが好ましい。（また、オプションとして入力デバイス２５０により提供され
る入力デバイスをベースとする信号２６０が、同じ役割を果たすことができるこ
とに留意しなければならない）。更に、インターラプト表示の存在を、送信デー
タ接続線２３２に送信して、音声認識装置のインフラをベースとするエレメント
に表示を与えることができる。

【００３５】音声合成バック・エンド３０４は、入力として音声のパラメータ化された表示
を取り込んでから、パラメータ化された表示を、音声信号に転換し、信号は、そ
れから、第１音声パス３１６を経由して、ＥＣＥＰブロック３０１に届けられる
。使用される特定のパラメータ化された表示は、設計の選択の問題である。一般
的に普及しているパラメータ化された表示は、Ｋｌａｔｔの“縦続接続／並列接
続フォルマント合成装置のためのソフトウエア”の題名の米国音声協会の協会誌
の、１９８０年の６７卷の頁９７１−９９５の中で説明されている、フォルマン
ト（音色を特徴づける周波数成分）である。直線予測パラメータは、１９７６年
のＳｐｒｉｎｇｅｒ書房の、Ｍａｒｋｅｌ他の、音声の直線予測の中で解説され
ている、もう一つの一般に普及しているパラメータ化された表示である。Ｋｌａ
ｔｔとＭａｒｋｅｌ他の関連する教示は、引用で、この明細書の中に組み込まれ
ている。

【００３６】クライアント−サーバをベースとする音声合成の場合、音声のパラメータ化さ
れた表示は、無線チャンネル１０５と、無線データ・トランシーバ２０３と、ま
たプロトコル処理ブロック３０６を経由する通信網から受信され、それから、音
声のパラメータ化された表示は、第５パス３１３を経由して、音声合成バック−
エンドに送られる。加入者ユニットの中の音声合成の場合は、アプリケーション
３０７は、喋られるテキストのストリングを生成する。テキスト・ストリングは
、プロトコル処理ブロック３０６を通過してから、第６パス３１４を経由して、
ローカルの音声合成装置３０５に送られる。音声合成装置３０５は、テキスト・
ストリングを、音声信号のパラメータ化された表示に転換してから、パラメータ
化された表示を、第７パス３１５を経由して、音声合成バック−エンド３０４に
送って、音声信号に転換する。

【００３７】受信データ接続線２３１を、音声合成情報以外の受信された情報を、更に転送
するのに使用できることに留意しなければならない。例えば、音声合成情報以外
の情報を、インフラから受信されたデータ（表示情報の様な）あるいは制御情報
あるいはその双方と、またシステムにダウンロードされるべきコードを備えるも
のとすることができる。同様に、送信データ接続線２３２を、音声認識フロント
−エンド３０２により計算されたパラメータ・ベクトル以外の送信情報を転送す
るのに使用できる。例えば、他の送信情報を、デバイス状態情報と、デバイスの
容量と、またバージインのタイミングに関する情報を備えるものとすることがで
きる。

【００３８】ここで、図４を引用して、音声認識サーバのハードウエアの実施例が示されて
おり、実施例には、この発明に係るクライアント−サーバ音声認識及び合成シス
テムのサーバ部分が設けられている。図１に関連して前記で説明されているとお
り、サーバを、複数の環境の中で常駐させることができる。インフラあるいは通
信網接続線４１１を経由して、加入者ユニットあるいは制御エンティティとのデ
ータ通信を行うことができる。図１の中で示されているとおり、接続線４１１を
、例えば無線システム内に限定して、無線通信網に直接接続させることができる
。また、接続線４１１を、公衆あるいは専用通信網、あるいは、他のデータ通信
リンクとすることができるが、この発明は、点に限定されない。

【００３９】通信網インターフェース４０５は、ＣＰＵ４０１と通信網接続線との間の接続
性を提供する。通信網インターフェース４０５は、通信網４１１からのデータを
、受信パス４０８を経由して、ＣＰＵ４０１に向けて送り、送信パス４１０を経
由してＣＰＵ４０１から通信網接続線４１１に向けて送る。クライアント−サー
バ構成の一部として、ＣＰＵ４０１は、通信網インターフェースと通信網接続線
４１１を経由して、１個あるいはそれ以上のクライアントと通信する（できれば
、加入者ユニットの中で実行される）。好ましい実施例の中で、ＣＰＵ４０１は
、クライアント−サーバ音声認識及び合成システムのサーバ部分を実行する。図
示されていないが、図４の中のサーバを、加入者ユニットの中のインターフェー
スを備えるものとして、サーバへの装置内のアクセスを行って、例えばサーバの
保守と、状態の点検と他の同様の機能を容易にすることができる。

【００４０】メモリー４０３は、マシンで読み取り可能な命令（ソフトウエア）と、また、
クライアント−サーバ構成のサーバ部分を実施するのに当たって、ＣＰＵ４０１
による実行と使用のためのプログラム・データを保存する。ソフトウエアの動作
と構造は、図５を引用して説明される。

【００４１】図５は、音声認識及び合成サーバ機能を示している。少なくとも１個の音声認
識クライアントと協働して、図５の中に示されている音声認識サーバの機能は、
音声認識エレメントを提供する。加入者ユニットからのデータは、受信パス４０
８を経由して、受信機（ＲＸ）５０２の所に到達する。受信機は、データを復号
してから、音声認識データ５０３を、音声認識クライアントから音声認識分析装
置５０４に向ける。デバイスの状態情報と、デバイスの容量、とバージイン・コ
ンテキストに関する情報の様な、加入者ユニットからの他の情報５０６は、受信
機５０２により、ローカル制御プロセッサ５０８に向けられる。一つの実施例の
中で、他の情報５０６は、音声認識エレメント（例えば、音声認識クライアント
）の一部が動作した加入者ユニットからの表示を備える。表示を、音声認識サー
バの中の音声認識処理を開始させるのに使用することができる。

【００４２】クライアント−サーバ構成の一部として、音声認識分析装置５０４は、加入者
ユニットから音声認識パラメータ・ベクトルを取り込んでから、認識処理を完了
する。認識された単語あるいは発話５０７は、それから、ローカルの制御プロセ
ッサ５０８に送られる。パラメータ・ベクトルを認識された発話に転換するのに
必要な処理の説明は、１９８８年の、“自動音声認識：スフィンクス・システム
”の中で見ることができ、刊行物の教示事項は、引用でこの明細書の中に組み込
まれている。

【００４３】ローカルの制御プロセッサ５０８は、音声認識分析装置５０４と、他の情報５
０８から認識された発話５０７を受信する。一般的に、この発明には、認識され
た発話を受信したら直ちに動作し、認識された発話が、制御信号を提供する制御
プロセッサが必要である。好ましい実施例の中で、諸制御信号が、使用されて、
次の加入者ユニット、あるいは加入者ユニットに接続されている少なくとも１個
のデバイスの動作を制御する。この目的のために、ローカルの制御プロセッサを
、できれば１個あるいはそれ以上の方法で動作するようになっていることが好ま
しい。第１に、ローカルの制御プロセッサ５０８が、アプリケーション・プログ
ラムを実行することができる。一般的なアプリケーションの一つの例は、米国特
許５，６５２，７８９の中で説明されているとおりの電子アシスタントである。
また、アプリケーションを、遠隔操作プロセッサ５１６上で操作できる。例えば
、図１のシステムの中で、遠隔操作プロセッサは、制御エンティティ１１６を備
える。前述の場合、ローカルの制御プロセッサ５０８は、データ通信網接続線５
１５を経由して、遠隔操作プロセッサ５１６と通信することで、データを通過さ
せてから受信するゲートウェーとして動作する。データ通信網接続線５１５を、
公衆（例えばインターネット）や、専用通信網（例えば、イントラネット）、あ
るいは他の一部のデータ通信リンクとすることができる。事実、ローカルの制御
プロセッサ５０８は、ユーザーにより使用されるアプリケーション又はサービス
あるいはその双方次第で、データ通信網上に常駐する種々の遠隔操作プロセッサ
と通信できる。

【００４４】遠隔操作プロセッサ５１６あるいはローカルの制御プロセッサ５０８の何れか
を実行させるアプリケーション・プログラムは、認識された発話５０７あるいは
他の情報５０６あるいはその双方に対する応答を決定する。できれば、応答を、
合成されたメッセージあるいは、制御信号あるいはその双方を備えるものとする
ことができることが好ましい。制御信号５１３は、ローカルの制御プロセッサ５
０８から、送信機（ＴＸ）５１０に中継される。一般的にテキスト情報に合成さ
れる情報５１４は、ローカルの制御プロセッサ５０８から、テキストから音声へ
の分析装置５１２に送られる。テキストから音声への分析装置５１２は、入力テ
キスト・ストリングを、パラメータ化された音声表示に転換する。前記に転換を
実行するのに適切な技術は、１９９７年の、Ｓｐｒｏａｔ（編集者）の“多言語
テキストから音声の合成：ベル社の取り組み”の中に説明されており、刊行物の
教示事項は、引用により、この明細書の中に組み込まれている。テキストから音
声への分析装置５１２からのパラメータ化された音声表示５１１は、必要に応じ
て多重化する送信機５１０に、パラメータ化された音声表示５１１と制御情報５
１３は、送信パス４１０上で加入者ユニットに提供される。前述で説明されたも
のと同じ方法で操作して、テキストから音声への分析装置５１２を使用して、合
成されたプロンプトを提供するか、あるいは同様に、加入者ユニットの所での出
力音声信号としての役割を果たさせることができる。

【００４５】ここで、図６を引用して、この発明に係る音声認識サーバの動作を説明するフ
ローチャートが示されている。ステップ６０１の所で、音声認識サーバは、加入
者ユニットからパラメータ化された音声信号を受信する。実用面では、音声認識
サーバは、単独の加入者ユニットからのパラメータ化された音声信号を処理する
性能を有しており、利用可能な処理と通信資源によってのみ制約される。ステッ
プ６０２の所で、音声認識サーバは、パラメータ化された音声信号を受信したら
、直ちに音声認識分析を実行する。良好な環境を仮定して、音声認識分析は、パ
ラメータ化された信号の中で検出された認識された発話に関する情報を提供する
。

【００４６】インターラプト表示の存在に応答して、音声認識エレメントの部分は、ステッ
プ６０３の所で動作させられる。前記で説明されているとおり、好ましい実施例
の中で、動作により、クライアント−サーバ音声認識及び合成システムのクライ
アント側の部分は、音声をベースとするコマンドの処理が開始される。更に、ス
テップ６０４の所で、インターラプト表示の存在に応答する表示で、音声認識エ
レメント、とまた特に加入者ユニットの中に常駐している音声認識エレメントの
部分が、動作したことをユーザーに表示することができる。表示を、独特で知覚
できる刺激とすることができる。前述の方法で、加入者ユニットのユーザーは、
音声通信をインターラプトしたい自己の意向が認識されたことを知り、さらに、
音声認識エレメントが動作しているとの認識で継続できること知るのである。更
に、ステップ６０４の所で、無線送信のために適切に処理された表示を、音声認
識エレメントの一部を形成している音声認識サーバに提供できる。

【００４７】前記に説明されたこの発明は、音声認識機能をウェークアップしたりあるいは
呼び出すための独特の技術を提供する。前述の技術は、例えばウェークアップコ
マンドの様なインターラプト表示の検出部が、ローカルに加入者ユニットで実行
されるので、無線通信環境に対して容易に応用できる。前記で説明されたことは
、単にこの発明の原理の応用の例示である。当業者であれば、この発明の精神と
範囲を逸脱することなく、他の構成と方法を実行できる。

【図面の簡単な説明】

【図１】この発明に係る無線通信システムのブロック図である。

【図２】この発明に係る加入者ユニットのブロック図である。

【図３】この発明に係る加入者ユニットの中の音声とデータ処理機能の略図である。

【図４】この発明に係る音声認識サーバのブロック図である。

【図５】この発明に係る音声認識サーバ内の音声とデータ処理機能の略図である。

【図６】この発明に係る加入者ユニットの動作を示すフローチャートである。

───────────────────────────────────────────────────── フロントページの続きＦターム(参考） 5D015 KK02 5K015 AA06 AA07 AD05 5K024 BB01 BB02 CC11 DD01 EE04 EE09 FF02 5K027 AA11 CC08 HH19 HH20

Claims

【特許請求の範囲】

【請求項１】インフラと無線通信して、インフラを経由して、加入者ユニ
ットのユーザーと他の者との間で音声通信を提供できる加入者ユニットの中で、
インフラが、音声認識サーバからなるものにおいて、インフラを経由して、加入者ユニットのユーザーと他の者との間の音声通話を
行うことと、加入者ユニットの中で、音声通話中に、インターラプト表示を検出することと
、また、インターラプト表示に応答して、音声認識エレメントを動作させて、音声をベー
スとするコマンドの処理を開始することにおいて、音声認識エレメントが、少な
くとも部分的にインフラの中で実行されることを備えることを特徴とする方法。
【請求項２】加入者ユニットの中で検出する方法が、更に、加入者ユニッ
トの一部を形成している入力デバイスを動作させて、インターラプト表示を提供
する方法からなることを特徴とする、請求項１に記載されている方法。
【請求項３】入力デバイスを動作させる方法が、ボタンと、セレクタと、
メニューで駆動される入力デバイスの何れかを動作させる方法を備えることを特
徴とする、請求項２に記載されている方法。
【請求項４】加入者ユニットの中で検出する方法において、加入者ユニットの中で実行されるローカルの音声認識装置を経由して、加入者
ユニットの中で音声通信を、少なくとも１個の予め設定された発話に対してモニ
ターすることと、また、少なくとも１個の予め設定された発話が検出されたら、直ちにインターラプト
表示を提供することを備えることを特徴とする、請求項１に記載されている方法
。
【請求項５】音声認識エレメントの一部を動作させる方法において、加入
者ユニットの中で実行される音声認識クライアントを動作させる、作用の中で、
音声認識クライアントと音声認識サーバが、協働して、音声認識エレメントを提
供することを特徴とする、請求項１に記載されている方法。
【請求項６】音声認識クライアントにより、パラメータ化された音声情報
を音声認識サーバに提供することを特徴とする、請求項５に記載されている方法
。
【請求項７】ユーザーに、音声認識エレメントが動作した部分の表示を提
供することを特徴とする、請求項１に記載されている方法。
【請求項８】音声認識サーバに、音声認識エレメントが動作した部分の表
示を提供することを特徴とする、請求項１に記載されている方法。
【請求項９】無線でインフラと通信する加入者ユニットにおいて、加入者ユニットとインフラとの間の通信中に、加入者ユニットの中でインター
ラプト表示の存在を検出する検出装置と、また、入力としてインターラプト表示の存在を取り込んでから、インターラプト表示
の存在により動作させられ、音声をベースとするコマンドの処理を開始する音声
認識エレメントの部分において、音声認識エレメントが、少なくともインフラの
中で実行されるものを備えることを特徴とする加入者ユニット。
【請求項１０】更に、動作したときにインターラプト表示を提供する検出
装置に接続されている入力デバイスを備えることを特徴とする、請求項９に記載
されている加入者ユニット。
【請求項１１】入力デバイスが、ボタン、セレクタとメニュー駆動入力デ
バイスを備えることを特徴とする、請求項１０に記載されている加入者ユニット
。
【請求項１２】検出装置が、少なくとも１個の予め設定された発話に対し
て音声通話をモニターし、また少なくとも１個の予め設定された発話検出したら
、直ちにインターラプト表示の存在を検出するローカルの音声認識装置を備える
ことを特徴とする、請求項９に記載されている加入者ユニット。
【請求項１３】音声認識エレメントの一部が、音声認識クライアントを備
えるものにおいて音声認識クライアントと音声認識サーバが、インフラの中で協
働して音声認識エレメントを提供することを特徴とする、請求項９に記載されて
いる加入者ユニット。
【請求項１４】音声認識エレメント一部が動作したことを示すためのイン
ターラプト表示に対応する表示装置を備えることを特徴とする、請求項９に記載
されている加入者ユニット。
【請求項１５】インフラに対して、音声認識エレメント一部により提供さ
れたパラメータ化された音声情報を送信する無線トランシーバことを特徴とする
、請求項９に記載されている加入者ユニット。
【請求項１６】無線トランシーバが、インフラに、音声認識エレメント一
部が動作した表示を送信することを特徴とする、請求項１５に記載されている加
入者ユニット。
【請求項１７】インフラと無線で通信する少なくとも１個の加入者ユニッ
トを備える無線通信システムにおいて、少なくとも１個の加入者ユニットの中で、少なくとも１個の加入者装置とインフラとの間の音声通話中に、加入者ユニッ
トの中でインターラプト表示の存在を検出する検出装置と、入力としてインターラプト表示の存在を取り込んでから、音声をベースとする
コマンドの処理を開始する、インターラプト表示の存在により動作させられる音
声認識クライアントと、また、インフラの中で、音声認識クライアントと協働して、音声認識エレメントを提
供する音声認識サーバを備えることを特徴とする無線通信システム。
【請求項１８】少なくとも１個の加入者ユニットが、無線電話を備えるこ
とを特徴とする、請求項１７に記載されている無線通信システム。
【請求項１９】少なくとも１個の加入者ユニットが、車両搭載無線通信デ
バイスを備えることを特徴とする、請求項１７に記載されている無線通信システ
ム。
【請求項２０】インフラの一部と音声認識エレメントの一部を形成する音
声認識サーバで、インフラが、少なくとも１個の加入者ユニットと無線で通信す
ることにおいて、音声通話中に、少なくとも１個の加入者ユニットの加入者ユニットから、ロー
カルのインターラプト表示の検出に応答して提供された音声情報を受信すること
と、音声情報をベースとして音声認識処理を実行することを備えることを特徴とす
る方法。
【請求項２１】加入者ユニットから、音声認識エレメントが動作させられ
たと言う表示を受信することと、また、表示をベースとして音声認識処理を開始することを備えることを特徴とする、
請求項２０に記載されている方法。
【請求項２２】加入者ユニットの所で、入力デバイスを動作させることで
、インターラプト表示が提供されることを特徴とする、請求項２０に記載されて
いる方法。
【請求項２３】加入者ユニットの中で提供されたインターラプト表示が、
少なくとも１個の予め設定された発話に対して音声通話のモニターすることを特
徴とする、請求項２０に記載されている方法。
【請求項２４】音声情報を処理して、パラメータ化された音声情報と提供
することにおいて、音声認識の処理がパラメータ化された音声情報をベースとし
ていることを特徴とする、請求項２０に記載されている方法。
【請求項２５】少なくとも１個の加入者ユニットと無線通信であるインフ
ラの中で使用される音声認識サーバにおいて、音声通話中に、インターラプト表示のローカルの検出に応答して入力として受
信する受信機と、また、音声情報をベースとして音声認識処理を実行する音声認識分析装置を備えるこ
とを特徴とする音声認識サーバ。
【請求項２６】受信機が、加入者ユニットから、音声認識エレメントが動
作させられたと言う表示を受信するように動作することと、また表示が、音声認
識処理を開始することを特徴とする、請求項２５に記載されている音声認識サー
バ。
【請求項２７】インターラプト表示が、加入者ユニットの所で、入力デバ
イスを動作させることで提供されることを特徴とする、請求項２５に記載されて
いる音声認識サーバ。
【請求項２８】インターラプト表示が、加入者ユニットの中で、少なくと
も１個の予め設定された発話に対して音声通話をモニターされることで提供され
ることを特徴とする、請求項２５に記載されている音声認識サーバ。
【請求項２９】音声認識分析装置が、音声情報を処理して、パラメータ化
された音声情報を提供し、音声認識処理が、パラメータ化された音声情報をベー
スとしていることを特徴とする、請求項２５に記載されている音声認識サーバ。