JP2007535842A - 音声起動通信のための装置および方法 - Google Patents

音声起動通信のための装置および方法 Download PDF

Info

Publication number
JP2007535842A
JP2007535842A JP2007503887A JP2007503887A JP2007535842A JP 2007535842 A JP2007535842 A JP 2007535842A JP 2007503887 A JP2007503887 A JP 2007503887A JP 2007503887 A JP2007503887 A JP 2007503887A JP 2007535842 A JP2007535842 A JP 2007535842A
Authority
JP
Japan
Prior art keywords
wireless communication
communication device
response
voice command
transceiver
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007503887A
Other languages
English (en)
Inventor
ロバート ザック,
Original Assignee
ソニー エリクソン モバイル コミュニケーションズ, エービー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー エリクソン モバイル コミュニケーションズ, エービー filed Critical ソニー エリクソン モバイル コミュニケーションズ, エービー
Publication of JP2007535842A publication Critical patent/JP2007535842A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/06Selective distribution of broadcast services, e.g. multimedia broadcast multicast service [MBMS]; Services to user groups; One-way selective calling services
    • H04W4/10Push-to-Talk [PTT] or Push-On-Call services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W76/00Connection management
    • H04W76/40Connection management for selective distribution or broadcast
    • H04W76/45Connection management for selective distribution or broadcast for Push-to-Talk [PTT] or Push-to-Talk over cellular [PoC] services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Transceivers (AREA)

Abstract

無線通信装置(12)はプッシュトークモードで通信するためのトランシーバ(66)を有し、スピーチプロセッサ(60)は音声認識エンジン(58)を含む。スピーチプロセッサ(60)はユーザが入力する音声信号を検出、処理し、ユーザが発する所定の音声コマンドを認識する。トランシーバ(66)は所定の音声コマンドの検出に応じてプッシュトークモードの音声信号を送信するように制御されうる。

Description

本発明は無線通信装置に関し、特に、音声によって起動する無線通信装置に関する。
幾つかのセルラ網では、無線通信装置はパケットデータのプッシュトーク(push-to-talk : PTT)プロトコルのサポートが可能になる。プライベート無線システムと深く関連するPTTサービスはポイントツーマルチポイント(point-to-multipoint)通信を可能にし、呼の設定に関してより高速なアクセスを提供する。さらに、パケットデータ通信は音声通信より少ない帯域幅を使用するので、パケットデータ網(例えばGSM)による音声の送信はコストの低減に役立つ。しかしながらPTT送信では、ユーザはマイクロフォンに向かって話すときに、無線通信装置のボタンを押しこれを保持することが必ず要求される。このため、車の運転中などではユーザは遠隔の相手と通信することは困難であり、州によっては違法となる。
したがって、従来の制約に従う必要なしに移動体装置のユーザにPTTサービスを利用することを可能にする方法が必要である。
一実施形態においては、本発明による無線通信装置は1または2以上の基地局を持つパケットデータ通信システムにおいて動作する。無線通信装置はプッシュトークモードで通信を行うトランシーバ、およびスピーチプロセッサを含む。スピーチプロセッサは、ユーザが入力する音声信号を処理して所定の音声コマンドを認識する音声認識エンジンを含む。トランシーバはユーザが発する所定のキーワードすなわち音声コマンドに応じてプッシュトークモードの音声信号を送信する。一実施形態では、ユーザが発する第1のキーワードすなわちコマンドによって送信機がオン (keys) されて、音声信号の送信が開始される。また、ユーザが発する第2のキーワードすなわちコマンドによって送信機がオフ (unkeys) されて、音声信号の送信が停止される。その他のキーワードすなわちコマンドも同様な動作が可能である。
別の実施形態では、コントローラがトランシーバに動作上接続され、スピーチプロセッサがトランシーバを制御し、1または2以上の受信者宛の予め録音されたメッセージを送信する。以上のように、1つの所定の音声コマンドによってユーザはメッセージを録音することが可能になり、一方、他の所定の音声コマンドによって、ユーザは受信者を選択し、メッセージを送信し、メッセージの送信を停止することが可能になる。
以下、図面を参照して説明する。図1は、本発明において使用することのできる通信ネットワークの論理的構造を示す。図1で、移動通信網10はパケット交換網20とインタフェースする。パケット交換網20は、たとえばGSM(Global System for Mobile Communications)ネットワークのために開発された汎用パケット無線サービス(General Packet Radio Service : GPRS)規格を実装するが、他の規格も使用することも可能である。さらには、パケット交換網以外のネットワークも使用することもできる。
移動通信網10は複数の移動端末12、複数の基地局14、および1または2以上の移動交換局(MSC)16を含む。移動端末12は、車両に搭載可能であり、あるいは携帯ハンドヘルド装置として使用することができ、一般的にはトランシーバ、アンテナおよび制御回路を含む。移動端末12は、無線周波数チャネルを介してサーバである在圏基地局(a serving base station)14と通信し、通話中に別の基地局14にハンドオフすることが可能である。後述するように、移動端末12はまた、パケット交換網20を介したパケットデータの通信を行うことが可能である。
各基地局14は、セルと呼ばれる地理的領域に割り当てられ、サービスを提供する。一般には、1つの基地局14が所与の移動通信網10内の各セルに存在する。基地局14は幾つかの送信機、受信機を含み、多くの異なる呼を同時に扱うことができる。基地局14は電話回線あるいはマイクロ波リンクを介してMSC16に接続する。MSC16は移動通信網10内の基地局12の動作を調整し、移動通信網10を公衆交換電話網(Public Switched Telephone Network : PSTN)のような公衆網に接続する。MSC16は適切な基地局14を通じて移動端末12へ、および移動端末12から呼をルーティングし、移動端末12が移動通信網10内のセル間を移動する場合のハンドオフを調整する。加入移動端末12の位置および動作状態に関する情報はホームロケーションレジスタ(Home Location Register : HLR)18に格納される。MSC16はまた、そのホーム領域外をローミングする移動端末12に関する情報を含む在圏ロケーション・レジスタ(Visitor Location Register : VLR)を含む。
図1の例示的なパケット交換網20は、少なくとも1つのサーバの働きをするGPRSサポートノード(Serving GPRS Support Node : SGSN)22、1または2以上のゲートウェイGPRSサポートノード(Gateway GPRS Support Node : GGSN)24、GPRSホーム・ロケーション・レジスタ(GPRS Home Location Register : GPRS-HLR)26およびショート・メッセージ・サービス・ゲートウェイMSC(Short Message Service Gateway MSC : SMS-GMSC)28を含む。パケット交換網20もまた基地局14を含む。これは図1で移動通信網10によって使用されるのと同じ基地局14である。
SGSN22はMSC16と同じ階層レベルにあり、GPRSのサポートに必要な機能を含む。SGSN22はパケット交換網20のネットワークアクセス制御を提供する。SGSN22は基地局14に、一般にはフレームリレー接続により接続する。パケット交換網20には複数のSGSN22が存在する。
GGSN24は、パケットデータ網(PDN)30と呼ばれる外部パケット交換網との相互動作を提供し、典型的にはX.25あるいはTCP/IPプロトコルを使用するバックボーンネットワークを介してSGSN22に接続される。GGSN24はまた、パケット交換網20を他の公衆陸上移動通信網(PLMN)に接続することができる。GGSN24は外部パケットデータ網30によりアクセスされるノードであり、データパケットによりアドレス指定された移動端末12にパケットを配信する。移動端末12において発生し、外部PDN30のノードをアドレス指定するデータパケットはまたGGSN24を通過する。したがって、GGSN24はパケット交換網20のユーザと、例えばインターネットあるいは他のグローバルネットワークでありうる外部PDN30との間のゲートウェイとしての役割を果たす。SGSN22およびGGSN24の機能は、パケット交換網20における別々のノードに置くこともできるし、同一のノードに置くこともできる。
GPRS−HLR26は移動通信網10のHLR18に類似の機能を実行する。GPRS−HLR26は加入者情報および加入者の現在位置を記憶する。SMS−GMSC28は、GPRS無線チャネルを介してSMSをサポートするのに必要な機能を有し、ポイントツーポイント(PTP)メッセージングサービスへのアクセスを提供する。
パケットデータ通信機能を持つ移動端末12は、パケットデータサービスを受けるためにSGSN22に登録する必要がある。登録は、移動端末のIDをパケット交換網20のユーザアドレスおよび外部PDN30へのユーザのアクセスポイントと関連付けるプロセスである。登録後、移動端末12はパケット共通制御チャネル(Packet Common Control Channel : PCCCH)にキャンプオン (camp on) する。同様に、移動端末12にも音声サービスの能力があれば、MSC16に登録し、音声サービスを受け、SGSN22に登録後、回線交換網10のSMSサービスを受けることができる。MSC16の登録はSGSN22とMSC16の間のトネリング・プロトコルを使用して行うことができ、国際移動電話加入者ID(International Mobile Subscriber Identity : IMSI)接続手順を実行する。IMSI接続手順はSGSN22とMSC16との間の連結を確立し、SGSN22とMSC16との間の相互作用を提供する。この連結はパケットデータ網20および移動通信網10の両方に接続される移動端末12の動作を調整するのに使用される。
前述したように、一般にPTTサービスはプライベート無線システムと関連するものであるが、一方で、GSMシステムを介したPTTサービスのプロトコルのサポートが計画されている。PTTサービスを備える従来の移動端末では、一般にはユーザは発声の際にボタンを押してこれを保持することが必要とされる。しかしこれでは、ユーザが例えば車を運転しPTTを使用して遠隔の相手と通信することは困難である。
図2に、本発明の一実施形態による端末12の一例を示す。端末12はユーザインタフェース40、回路52およびトランシーバ部70を含む。ユーザインタフェース部40はマイクロフォン42、スピーカ44、キーパッド46、ディスプレイ48およびPTTボタン50を含む。
マイクロフォン42はユーザの音声を電気音響信号に変換し、その信号をスピーチプロセッサ60の音声アクティビティ検出器(voice activity detector : VAD)54およびスピーチエンコーダ(SPE)56に出力する。スピーカ44は電気信号をユーザが聴取可能な可聴信号へと変換する。音声の電気信号への変換および電気信号の音声への変換は公知の任意のオーディオ処理回路により実行される。キーパッド46は端末12の表面に配置され、英数字キーパッドおよびジョイスティックをはじめ、ボタンあるいはダイヤルのような操作部を含む。このキーパッド46により、ユーザは電話番号をダイヤルし、コマンドを入力し、メニューの選択肢を選ぶことができる。ディスプレイ48により、ユーザはダイヤルした数字、画像、呼状態、メニューの選択肢、その他のサービス情報を見ることができる。本発明の実施形態では、ディスプレイ48は、グラフィックイメージを表示し、ユーザ入力を受け入れるタッチパネルを含む。
ユーザは遠隔の相手とPTTモード(すなわちシンプレックスモード)で通話することを望む場合、PTTボタン50を押下する。ユーザは、PTTボタンを押している間は遠隔の相手の話を聞くことはできない。ユーザは、PTTボタン64を押していないときに、遠隔の相手の音声をスピーカ44を通して聞くことができる。
トランシーバ部70はアンテナ68に結合されるトランシーバ66を含む。トランシーバ66は完全機能のセル無線送受信器であり、デュープレックスモードあるいはシンプレックスモードで基地局14との信号の送受信を行うことができる。トランシーバ66は音声およびパケットデータの両方を送受信することができ、従って移動通信網10およびパケット交換網20の両方と動作する。トランシーバ66はGSMとして一般に知られる規格を含む任意の公知の規格に従い動作することができる。
回路52はスピーチプロセッサ60、メモリ64およびマイクロプロセッサ62を含む。メモリ64は移動通信デバイスにおけるメモリの全階層を表し、ランダムアクセスメモリ(RAM)と読み出し専用メモリ(ROM)の両方を含みうる。実行可能なプログラム命令および端末12の動作に必要なデータは、EPROM、EEPROMおよび/またはフラッシュメモリのような不揮発性メモリに格納され、これらメモリは例えば個別、あるいは組み込みデバイスとして実装可能である。以下にさらに詳細に説明されるように、メモリ64はスピーチプロセッサ60により認識される所定のキーワードすなわち音声コマンドを記憶することができる。
マイクロプロセッサ62はメモリ64に格納されたプログラム命令に従い端末12の動作を制御する。制御機能は単一のプロセッサあるいは複数のプロセッサに実装可能である。適切なマイクロプロセッサは、例えば汎用および専用の両方のマイクロプロセッサおよびディジタル信号処理プロセッサを含みうる。メモリ64およびマイクロプロセッサ62を、専用に設計される特定用途向け集積回路(ASIC)に組み込めることは当業者には容易に理解されよう。
スピーチプロセッサ60は、マイクロプロセッサ62とインタフェースし、マイクロフォン42を介してユーザが入力する音声を検出し、認識する。本発明で使用可能な公知の任意のスピーチプロセッサには、例えばディジタル信号処理プロセッサ(DSP)を使用可能である。スピーチプロセッサ60はVAD54、スピーチエンコーダ(SPE)56、音声認識エンジン(VRE)58を含むことができる。VAD54は音声アクティビティの検出を行う回路であり、マイクロフォン42における音声アクティビティを表す信号をVRE58に出力する。したがって、VAD54は音声アクティブまたは音声非アクティブを示す信号を出力することができる。音声アクティビティの検出は当業者には公知であり、従ってVAD54は任意の適当なVAD回路、アルゴリズム、プログラムを含み、実装可能である。
SPE56はスピーチエンコーダであり、音声が存在するときにマイクロフォン42から入力信号を受信する。あるいは、SPE56はVAD54から出力される信号を入力として受信するようにしてもよい。VAD54からの信号は、例えばVAD54により出力される音声のアクティブ/非アクティブの指示に従いSPE56をイネーブル/ディスイネーブルにすることができる。SPE56はマイクロフォン42からの入力音声信号を符号化し、符号化音声をVRE58に出力する。符号化音声は直接またはマイクロプロセッサ62を介してVRE58に出力されるうる。音声は、当業者には公知の任意の音声符号化規格、例えばITU G.711、あるいはITU G.72xに従い符号化することができる。
VRE58は、符号化音声をメモリ64に格納された複数の所定の音声コマンドと比較する。VRE58は限定されたボキャブラリを認識するものとするが、より精密なものであってもよい。VRE58により受信される符号化音声が所定の音声コマンドの1つとマッチすると、VRE58はマイクロプロセッサ62にマッチしたコマンドの種類を示す信号を出力する。逆に、マッチが生じなければ、VRE58はマイクロプロセッサ62に非マッチ状態を示す信号を出力するか、あるいは単に信号を全く送信しない。
実施形態では、所定の音声コマンドはベクトルとしてメモリ62に格納される。ただし、音声を表す任意の公知の方法を使用してもよい。製造業者は所定の音声コマンドを表すベクトルをメモリ62にロードすることができる。これらのコマンドは話者非依存コマンドとよばれるものである。このかわりに、ユーザはスピーチプロセッサ60を「トレーニング」することにより認識対象の所定の音声コマンドをカスタマイズすることができる。これらは発声者依存コマンドとよばれている。一般に、発声者依存コマンドの「トレーニング」には、ユーザがマイクロフォン42に向かって1または2以上の語句を発する作業を伴う。次に、スピーチプロセッサ60は、音声信号を基準音声とよばれるベクトル系列に変換し、ベクトルをメモリ64に保存する。ユーザはその後、保存された音声コマンドを端末12により提供される特定の機能に割り当てることができる。次に、ユーザがコマンドをマイクロフォン42に向けて発声すると、VRE58は発声されたコマンドをメモリに格納されたベクトルと比較する。マッチすれば、音声コマンドに割り当てられた機能が動作する。例えば、ユーザはスピーチプロセッサ60をトレーニングし、音声コマンド「送信開始」および「送信終了」を認識するようにできる。これらコマンドによりそれぞれ、送信機66がオンしてユーザの音声信号の送信が開始し、送信機66がオフしてユーザの音声信号の送信が停止するようにすることができる。これらコマンドのマイクロフォン42に向けた発声は、ユーザが(起動するために)PTTボタンを手動で押下し、(動作解除するために)離す場合と同じ効果を有する。なお、これらコマンドは例示に過ぎず、他の語句を音声コマンドとして使用可能であることはいうまでもない。
一般的な音声認識システムでは、継続してマイクロフォン42をモニタし、ユーザの所定の音声コマンドの発声を判断することになる。しかし、マイクロフォン42からの音のエネルギの多くは音声コマンドではないと考えられるので、スピーチプロセッサ60が継続的にモニタするのではバッテリ寿命が低下してしまう。これを緩和するために、本発明は、スピーチプロセッサ60を端末12のメニューシステムにより手動で「聴取」モードにすることを可能とする。すなわちスピーチプロセッサ60は、このモードにある場合にのみマイクロフォン42からの音声信号をモニタする。図3Aおよび図3Bに、ディスプレイ48でユーザに表示されるメニューシステムの例を示す。その一方で、キーパッド46によるユーザの誘導を必要とする従来のメニューシステムも可能である。
図3Aにおいて、ディスプレイ48には、ショートカット部72、ドロップダウン部76、ディスプレイ部76、スクロールバー78および1または2以上のメニュー選択80を含むメイン画面が表示される。ショートカット部72のアイコンは、ユーザによって選択されるアイコンに関連する予めプログラムされた機能を起動し、一方、ドロップダウン部76はユーザがメモリ64に格納されたプログラムとさらに対話することを可能にする。ディスプレイ部76はサイズに制限があるので、スクロールバー78はユーザがディスプレイ部76に収まりきらない任意のメニュー選択80を見るためにスクロールを上下することを可能にする。スピーチプロセッサ60を聴取モードにするために、ユーザは関連するメニューを単に選択すればよい。図3Aで、ユーザは「音声起動聴取モード」を選択する。これにより図3Bに示される第2のメニュー画面が起動される。図3Bにおいて、ディスプレイ部76には2つのボタンが示される。ボタン82が押されると聴取モードが起動し、一方、ボタン84が押されると聴取モードが解除される。所望により、チェックボックスおよび無線ボタンのようなその他の操作で実現してもよい。したがってユーザは、必要な場合にのみ、例えば車を運転する場合に、スピーチプロセッサ60の音声認識機能を起動することができるが、その他の場合はPTTボタンを手動で押下する/解放する操作手法を留保することができる。
図4Aおよび図4Bに、本発明の端末12を使用してPTTモードで音声の通信方法90の例を示す。図4Aにおいて、ユーザが聴取モードをアクティブにすると(ボックス92)、方法90が開始する。このモードでは、スピーチプロセッサ60は音声信号を受信し(ボックス94)、ユーザが発声するとその音声信号を検出する(ボックス96)。次に、スピーチプロセッサは、音声信号をメモリ64に格納された所定の音声コマンドと比較し(ボックス98)、「送信開始」コマンドとのマッチの有無を判断する(ボックス100)。マッチすれば、マイクロプロセッサ62は例えば「ビープ」などの音響信号を出力してスピーカ44によりPTTモードがアクティブであることをユーザに警告するようにし、トランシーバ66がオンする(ボックス102)。その後、ユーザは自由にマイクロフォン42に向かって話をする。音声信号はネットワークに送信される(ボックス104)。パケット交換網では、これらの音声信号はデータパケットに変換され、遠隔の相手に送信される。一方、マッチが生じなければ(ボックス100)、ユーザが聴取モードを非アクティブ化したかの判断がなされる(ボックス106)。聴取モードがなおアクティブであれば、スピーチプロセッサ60はマイクロフォン42からの音声信号のモニタを継続し(ボックス94)、そうでなければ端末12は通常の動作に戻る。図4Aおよび図4Bでは聴取モードのアクティブ化/非アクティブ化を特定の点でチェックするが、これらのチェックはいつでもなされることができることが注意されるべきである。
図4Bに見られるようにスピーチプロセッサ60は、ユーザが送信の停止を望む時点を判断するために音声信号のモニタを継続する。典型的には、ユーザは発声センテンスの終了後小休止し、その後「送信終了」コマンドを発して、端末12をPTTモードから外す。このように、スピーチプロセッサ60は、音声の非アクティブ期間を検出し(ボックス108)、非アクティブタイマを開始させる(ボックス110)。非アクティブタイマはユーザのスピーチに自然なポーズを許すウインドウを設け、PTTモードの早計な終了を防止する。これらの休止の間に、端末12は、公知のコンフォートノイズを生成して通信相手に送信するとともに、スピーチプロセッサ60はマイクロフォン42からの音声信号のモニタを継続する(ボックス114)。音声信号が検出されなければ、非アクティブタイマが満了したかの判断を行う(ボックス116)。タイマが未了であれば、コンフォートノイズは休止期間中生成、送信され続ける(ボックス112)。タイマが満了すれば、音響信号(例えば素早く続く2つのビープ)がスピーカ44を通して出力され(ボックス118)、トランシーバ66がオフする。この音響信号はユーザにPTTモードが終了したことを示すものである。次に、ユーザが聴取モードを非アクティブ化したかを判断する(ボックス120)。非アクティブ化していなければ、処理は図4Aに戻り、後続の音声コマンドあるいは聴取モードのアクティブ化を待機する。
ユーザが音声非アクティブ期間中、タイマの満了前にマイクロフォンに向かって発声することにより、あるいは「送信再開」のような所定の音声コマンドを発することにより音声信号の送信を再開できることに留意されたい。スピーチプロセッサ60はこれらの音声信号および/またはコマンドを処理し、トランシーバ66は音声信号の送信を再開する。
一方、スピーチプロセッサ60がタイマの満了前に音声信号を検出すると(ボックス114)、スピーチプロセッサ60はメモリ64に格納された所定の音声コマンドと音声信号を比較する(ボックス122)。音声コマンド「送信終了」とマッチした場合(ボックス124)、送信終了を示す音響信号がスピーカを通してユーザに再生され、トランシーバ66がオフする(ボックス118)。その後、ユーザは遠隔の相手からの送信をスピーカ44を通して聞くことができる。音声コマンド「送信終了」とマッチしない場合には、非アクティブタイマがリセットされ(ボックス126)、遠隔の相手への音声信号の送信が継続される(ボックス128)。スピーチプロセッサ60が非アクティブ期間を検出すると(ボックス108)、非アクティブタイマが再び開始される(ボックス110)。
本発明はユーザの音声信号をメモリにバッファする、あるいは音声信号の送信を遅らせることができることに留意されたい。これによりスピーチプロセッサ60あるいはマイクロプロセッサ62はユーザが話すコマンドを「選別する」ことができる。結果として、遠隔の相手はユーザの通話だけを受信し、ユーザが話したコマンドは聞こえない。
本発明の別の実施形態では、PTTモードの音声信号の送信に加えて、単に音声コマンドを発することによる1または2以上の受信者への音声信号の送信が可能である。例えば、ユーザはアフィニティ・グループ(affinity group)のメンバーへの配信のためのメッセージを予め録音する。図5の方法130により一例を示す。
図5において、ユーザは音声起動聴取モードをアクティブ化する(ボックス132)。このモードでは、スピーチプロセッサ60はユーザが入力する音声信号を受信し、検出する(ボックス134、136)。次に、スピーチプロセッサ60は音声信号をメモリ64に格納された所定の音声コマンドと比較する(ボックス138)。「メッセージ送信」コマンドとマッチした場合(ボックス140)、ユーザは予め録音された送信メッセージ(ボックス144)および1または2以上の指定受信者(ボックス146)を確認する。一方、「メッセージ送信」コマンドとしなかった場合(ボックス140)、ユーザが聴取モードを非アクティブ化したかを判断する(ボックス142)。聴取モードがなおアクティブであれば、スピーチプロセッサ60はマイクロフォン42からの音声信号を再び受信し(ボックス134)、そうでなければ端末12は通常の動作に戻る。
受信者を、例えば名前、あるいは関連するグループIDのみにより識別することができる。後者の場合、受信者は無線通信装置のアフィニティ・グループIDに既に関連するアフィニティ・グループの一部とすることができる。アフィニティ・グループは周知であるため、本明細書では詳細な説明は省略する。予め録音されたメッセージは識別された受信者に送信され(ボックス148)、スピーカ44から出力される音響信号はメッセージが送信されたことを示す(ボックス150)。一度メッセージが送信されると、スピーチプロセッサは再び音声起動聴取モードの非アクティブ化を判断し(ボックス142)、その結果に応じて動作を継続する。なお、図5に明確に示されてはいないが、ユーザは、例えば「メッセージ停止」と言うことによりいつでもメッセージの送信を終了させることができる。
以上の説明において示された音声コマンドは例示的なものにすぎず、本発明がこれらに限定されるものでないことは当業者には理解されよう。任意の用語を音声コマンドとして使用し端末12の機能に関連付けることが可能である。図6に、本発明を使用して制御されうるファンクションの例160を示す。
本発明は、その本質から逸脱することなしに、本明細書において明示された方法以外の方法で実施可能である。実施形態はあらゆる点で例示にすぎないものであり、限定的なものではない。添付の請求の範囲の意味するところおよび均等の範囲に含まれる全ての変更は本発明の範囲に属する。
本発明の一実施形態による無線通信網の例を示す図である。 本発明の一実施形態による無線通信装置の例を示す図である。 本発明の一実施形態に従って動作する無線通信装置により使用されるうるメニューシステムの例を示す図である。 本発明の一実施形態による方法を例示する図である。 本発明の一実施形態による別の方法を例示する図である。 本発明を使用して制御されうるファンクションを例示する図である。

Claims (43)

  1. 無線通信装置(12)であって、
    プッシュトークモードで通信を行うことが可能なトランシーバ(66)と、
    音声信号を処理し所定の音声コマンドを認識する音声認識エンジン(58)を含むスピーチプロセッサ(60)と、
    を有し、
    前記トランシーバ(66)は、前記所定の音声コマンドの検出に応じて前記プッシュトークモードで音声信号の送信を行うことを特徴とする無線通信装置(12)。
  2. 前記トランシーバ(66)は、更に、前記所定の音声コマンドの検出に応じて前記音声信号の送信を終了することを特徴とする請求項1に記載の無線通信装置。
  3. 前記トランシーバ(66)は、更に、タイマの満了に応じて前記音声信号の送信を停止することを特徴とする請求項1に記載の無線通信装置。
  4. 前記トランシーバを制御するコントローラ(62)を更に有することを特徴とする請求項1に記載の無線通信装置。
  5. 前記コントローラ(62)は、前記所定の音声コマンドの検出に応じて前記プッシュトークモードをアクティブ化および非アクティブ化を行うことを特徴とする請求項4に記載の無線通信装置。
  6. 前記コントローラ(62)は、ユーザにより入力されたメニューコマンドに応じて前記スピーチプロセッサの聴取モードのアクティブ化および非アクティブ化を行うことを特徴とする請求項4に記載の無線通信装置。
  7. 前記スピーチプロセッサ(60)は、前記音声認識(58)エンジンに接続され音声信号を検出する音声アクティビティ検出器(54)を更に含むことを特徴とする請求項1に記載の無線通信装置。
  8. 前記音声アクティビティ検出器(54)は、音声非アクティブ期間をさらに検出することを特徴とする請求項7に記載の無線通信装置。
  9. 前記トランシーバ(66)は、検出された前記音声非アクティブ期間に応じてコンフォートノイズを送信することを特徴とする請求項8に記載の無線通信装置。
  10. 前記トランシーバ(66)は、更に、前記音声非アクティブタイマの満了前に前記音声信号の送信を再開することを特徴とする請求項8に記載の無線通信装置。
  11. 前記トランシーバ(66)は、更に、前記所定の音声コマンドの検出に応じて前記音声信号の送信を再開することを特徴とする請求項7に記載の無線通信装置。
  12. 前記スピーチプロセッサ(60)は、前記音声信号を符号化するスピーチエンコーダ(56)を更に含むことを特徴とする請求項7に記載の無線通信装置。
  13. 前記所定の音声コマンドの表現を格納するメモリ(64)を更に有し、前記音声認識エンジン(58)は、前記音声信号を前記所定の音声コマンドの前記表現と比較することを特徴とする請求項12に記載の無線通信装置。
  14. 無線通信装置(12)からの音声信号をパケットデータとして通信する方法であって、
    前記無線通信装置(12)のユーザが発した音声信号を検出するステップと、
    前記無線通信装置(12)の前記ユーザが発した所定の音声コマンドを認識するステップと、
    前記所定の音声コマンドの検出に応じてプッシュトークモードで前記音声信号を送信するステップと、
    を有することを特徴とする方法。
  15. 前記所定の音声コマンドの検出に応じて前記音声信号の送信を終了するステップを更に有することを特徴とする請求項14に記載の方法。
  16. 前記所定の音声コマンドの検出に応じて前記プッシュトークモードをアクティブ化するステップを更に有することを特徴とする請求項14に記載の方法。
  17. 前記所定の音声コマンドの検出に応じて前記プッシュトークモードを非アクティブ化するステップを更に有することを特徴とする請求項14に記載の方法。
  18. タイマの満了に応じて前記プッシュトークモードを非アクティブ化するステップを更に有することを特徴とする請求項14に記載の方法。
  19. 検出された音声非アクティブの期間に応じて前記音声信号を送信させるステップを更に有することを特徴とする請求項14に記載の方法。
  20. 前記所定の音声コマンドの検出に応じて前記音声信号の送信を再開するステップを更に有することを特徴とする請求項19に記載の方法。
  21. 前記ユーザが入力する1または2以上のメニューコマンドに応じて聴取モードのアクティブ化および非アクティブ化を行うステップを更に有することを特徴とする請求項14に記載の方法。
  22. 基地局(14)と、
    無線通信装置(12)と、
    を有し、
    前記無線通信装置(12)は、
    プッシュトークモードで通信を行うことが可能なトランシーバ(66)と、
    音声信号を処理しユーザにより入力された所定の音声コマンドを認識する音声認識エンジン(58)を含むスピーチプロセッサ(60)と、を含み、
    前記トランシーバ(66)は、前記所定の音声コマンドの検出に応じて前記プッシュトークモードで音声信号の送信を行う
    ことを特徴とする無線通信システム。
  23. 前記無線通信システム(10)はパケット交換網(20)を含むことを特徴とする請求項22に記載の無線通信システム。
  24. 前記音声信号はデータパケットとして送信されることを特徴とする請求項22に記載の無線通信システム。
  25. 無線通信ネットワーク(10)を介して通信するトランシーバ(66)と、
    音声信号を処理し所定の音声コマンドを認識する音声認識エンジン(58)を含むスピーチプロセッサ(60)と、
    前記所定の音声コマンドの検出に応じて前記音声信号の送信のために前記トランシーバ(66)の制御を行うべく前記トランシーバ(66)とスピーチプロセッサ(60)とに接続されるコントローラ(62)と、
    を有することを特徴とする無線通信装置。
  26. 前記音声信号は予め録音されたメッセージを含むことを特徴とする請求項25に記載の無線通信装置。
  27. 前記予め録音されたメッセージを格納するメモリ(64)を更に有することを特徴とする請求項26に記載の無線通信装置。
  28. 前記コントローラ(62)は、前記スピーチプロセッサ(60)を更に制御して前記所定の音声コマンドの検出に応じて記録セッションをアクティブ化することを特徴とする請求項26に記載の無線通信装置。
  29. 前記コントローラ(62)は、前記スピーチプロセッサ(60)を更に制御して前記所定の音声コマンドの検出に応じて前記記録セッションを非アクティブ化することを特徴とする請求項28に記載の無線通信装置。
  30. 前記コントローラ(62)は、前記スピーチプロセッサ(60)を更に制御して前記所定の音声コマンドの検出に応じて前記記録セッションを休止させることを特徴とする請求項28に記載の無線通信装置。
  31. 前記コントローラ(62)は、前記スピーチプロセッサ(60)を更に制御して前記所定の音声コマンドの検出に応じて前記予め記録されたメッセージをリプレイすることを特徴とする請求項28に記載の無線通信装置。
  32. 前記所定の音声コマンドは、前記予め録音されたメッセージの受信者を識別することを特徴とする請求項26に記載の無線通信装置。
  33. 前記受信者は1または2以上のメンバーを有するアフィニティ・グループを含むことを特徴とする請求項32に記載の無線通信装置。
  34. 前記コントローラ(62)は、前記トランシーバ(66)を制御して前記予め録音されたメッセージを前記識別された受信者に送信することを特徴とする請求項32に記載の無線通信装置。
  35. 前記コントローラ(62)は、前記トランシーバ(66)を更に制御して前記識別された受信者への前記予め記録されたメッセージの送信を終了させる、請求項34に記載の無線通信装置。
  36. 無線通信装置(12)を介して音声信号の通信を行う方法であって、
    前記無線通信装置(12)のユーザが発した音声信号を検出するステップと、
    前記無線通信装置(12)の前記ユーザが発した所定の音声コマンドを認識するステップと、
    前記所定の音声コマンドの検出に応じて前記音声信号を送信するステップと、
    を有することを特徴とする方法。
  37. 前記所定の音声コマンドの検出に応じて前記音声信号を録音し、予め録音されたメッセージを作成するステップを更に有することを特徴とする請求項36に記載の方法。
  38. 前記所定の音声コマンドの検出に応じて前記メッセージをメモリに保存するステップを更に有することを特徴とする請求項37に記載の方法。
  39. 前記所定の音声コマンドの検出に応じて前記記録を休止するステップを更に有することを特徴とする請求項37に記載の方法。
  40. 前記所定の音声コマンドの検出に応じて前記メッセージをリプレイするステップを更に有することを特徴とする請求項37に記載の方法。
  41. 前記メッセージの受信者を識別するステップを更に有することを特徴とする請求項37に記載の方法。
  42. 前記受信者は、1または2以上のメンバーを有するアフィニティ・グループを含むことを特徴とする請求項43に記載の方法。
  43. 前記音声信号を送信するステップは、前記所定の音声コマンドの検出に応じて前記音声信号をパケットデータとして送信することを特徴とする請求項36に記載の方法。
JP2007503887A 2004-03-16 2004-10-15 音声起動通信のための装置および方法 Pending JP2007535842A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/801,779 US20050209858A1 (en) 2004-03-16 2004-03-16 Apparatus and method for voice activated communication
PCT/US2004/033877 WO2005096647A1 (en) 2004-03-16 2004-10-15 Apparatus and method for voice activated communication

Publications (1)

Publication Number Publication Date
JP2007535842A true JP2007535842A (ja) 2007-12-06

Family

ID=34959009

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007503887A Pending JP2007535842A (ja) 2004-03-16 2004-10-15 音声起動通信のための装置および方法

Country Status (5)

Country Link
US (1) US20050209858A1 (ja)
EP (1) EP1726175A1 (ja)
JP (1) JP2007535842A (ja)
CN (1) CN1926897A (ja)
WO (1) WO2005096647A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015177226A (ja) * 2014-03-13 2015-10-05 アイコム株式会社 無線機および近距離無線通信方法

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0328035D0 (en) * 2003-12-03 2004-01-07 British Telecomm Communications method and system
US20060047511A1 (en) * 2004-09-01 2006-03-02 Electronic Data Systems Corporation System, method, and computer program product for content delivery in a push-to-talk communication system
FR2881867A1 (fr) * 2005-02-04 2006-08-11 France Telecom Procede de transmission de marques de fin de parole dans un systeme de reconnaissance de la parole
US20060178159A1 (en) * 2005-02-07 2006-08-10 Don Timms Voice activated push-to-talk device and method of use
CN101346885B (zh) * 2005-12-20 2013-01-30 日本电气株式会社 便携终端装置及其控制方法和程序
CN100438654C (zh) * 2005-12-29 2008-11-26 华为技术有限公司 一种即按即通系统及实现即按即通业务的方法
DE102006011288A1 (de) * 2006-03-10 2007-09-13 Siemens Ag Verfahren zur Auswahl von Funktionen mithilfe einer Benutzerschnittstelle und Benutzerschnittstelle
US8521537B2 (en) * 2006-04-03 2013-08-27 Promptu Systems Corporation Detection and use of acoustic signal quality indicators
US20080045256A1 (en) * 2006-08-16 2008-02-21 Microsoft Corporation Eyes-free push-to-talk communication
US20080153432A1 (en) * 2006-12-20 2008-06-26 Motorola, Inc. Method and system for conversation break-in based on user context
US8145215B2 (en) * 2007-12-27 2012-03-27 Shoretel, Inc. Scanning for a wireless device
KR20100007625A (ko) * 2008-07-14 2010-01-22 엘지전자 주식회사 이동 단말기 및 그 메뉴 표시 방법
US8913961B2 (en) 2008-11-13 2014-12-16 At&T Mobility Ii Llc Systems and methods for dampening TDMA interference
JP5039214B2 (ja) * 2011-02-17 2012-10-03 株式会社東芝 音声認識操作装置及び音声認識操作方法
US8971946B2 (en) * 2011-05-11 2015-03-03 Tikl, Inc. Privacy control in push-to-talk
KR20130032966A (ko) * 2011-09-26 2013-04-03 엘지전자 주식회사 사용자 인터페이스 방법 및 장치
US9704486B2 (en) * 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
US9349386B2 (en) * 2013-03-07 2016-05-24 Analog Device Global System and method for processor wake-up based on sensor data
US20140269556A1 (en) * 2013-03-14 2014-09-18 Mobilesphere Holdings II LLC System and method for unit identification in a broadband push-to-talk communication system
CN103198831A (zh) * 2013-04-10 2013-07-10 威盛电子股份有限公司 语音操控方法与移动终端装置
JP2015052466A (ja) * 2013-09-05 2015-03-19 株式会社デンソー 車両用装置及び音声切換制御プログラム
US9607137B2 (en) * 2013-12-17 2017-03-28 Lenovo (Singapore) Pte. Ltd. Verbal command processing based on speaker recognition
US20150223110A1 (en) * 2014-02-05 2015-08-06 Qualcomm Incorporated Robust voice-activated floor control
US20160055847A1 (en) * 2014-08-19 2016-02-25 Nuance Communications, Inc. System and method for speech validation
US11722571B1 (en) * 2016-12-20 2023-08-08 Amazon Technologies, Inc. Recipient device presence activity monitoring for a communications session
TWI672690B (zh) * 2018-03-21 2019-09-21 塞席爾商元鼎音訊股份有限公司 人工智慧語音互動之方法、電腦程式產品及其近端電子裝置
CN111694479B (zh) * 2020-06-11 2022-03-25 北京百度网讯科技有限公司 远程会议中的静音处理方法、装置、电子设备和存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4945570A (en) * 1987-10-02 1990-07-31 Motorola, Inc. Method for terminating a telephone call by voice command
WO1996011529A1 (en) * 1994-10-06 1996-04-18 Rotunda Thomas J Jr Voice activated transmitter switch
US6816577B2 (en) * 2001-06-01 2004-11-09 James D. Logan Cellular telephone with audio recording subsystem
US6370375B1 (en) * 1997-04-14 2002-04-09 At&T Corp. Voice-response paging device and method
US6212408B1 (en) * 1999-05-03 2001-04-03 Innovative Global Solution, Inc. Voice command system and method
US20020132635A1 (en) * 2001-03-16 2002-09-19 Girard Joann K. Method of automatically selecting a communication mode in a mobile station having at least two communication modes
GB2379785A (en) * 2001-09-18 2003-03-19 20 20 Speech Ltd Speech recognition
FI114358B (fi) * 2002-05-29 2004-09-30 Nokia Corp Menetelmä digitaalisessa verkkojärjestelmässä päätelaitteen lähetyksen ohjaamiseksi
US20050059419A1 (en) * 2003-09-11 2005-03-17 Sharo Michael A. Method and apparatus for providing smart replies to a dispatch call

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015177226A (ja) * 2014-03-13 2015-10-05 アイコム株式会社 無線機および近距離無線通信方法

Also Published As

Publication number Publication date
WO2005096647A1 (en) 2005-10-13
CN1926897A (zh) 2007-03-07
EP1726175A1 (en) 2006-11-29
US20050209858A1 (en) 2005-09-22

Similar Documents

Publication Publication Date Title
JP2007535842A (ja) 音声起動通信のための装置および方法
US7957772B2 (en) Apparatus and method for delayed answering of an incoming call
US7684766B2 (en) System and method for managing talk burst authority of a mobile communication terminal
EP1869666B1 (en) Wireless communications device with voice-to-text conversion
US20050203998A1 (en) Method in a digital network system for controlling the transmission of terminal equipment
EP1271973B1 (en) Dispatch call origination and set up in a cdma mobile communication system
EP1784962B1 (en) System, method, and computer program product for content delivery in a push-to-talk communication system
US20070060054A1 (en) Wireless home communication system method and apparatus
US20060040695A1 (en) Method of group call service using push to talk scheme in mobile communication terminal
JP2003152827A (ja) 移動電子機器が着呼に応答して環境配慮警報メッセージを送信する方法。
JPH10327438A (ja) 音声応答式ページングを行う装置と方法
WO2017220856A1 (en) Electronic accessory incorporating dynamic user-controlled audio muting capabilities, related methods and communications terminal
US20070147316A1 (en) Method and apparatus for communicating with a multi-mode wireless device
JP2007524320A (ja) 携帯電話の構成
JP2005515691A6 (ja) 文字入出力(tty/tdd)サービスのための通信システムの音響反響除去方法及び装置
JP2005515691A (ja) 文字入出力(tty/tdd)サービスのための通信システムの音響反響除去方法及び装置
JP2007512788A (ja) 無線装置用プッシュトーク・インジケータ
JP2003339083A (ja) 携帯端末装置、通信装置、電話システムおよび通信制御方法
US20040192368A1 (en) Method and mobile communication device for receiving a dispatch call
JP2006020304A (ja) 携帯端末装置
JP2000152328A (ja) 携帯電話付加サービス設定自動処理システム及び自動応答機能付き携帯電話機
US20060089180A1 (en) Mobile communication terminal
KR100606018B1 (ko) Ptt통화내용 저장 및 재생방법
US8059566B1 (en) Voice recognition push to message (PTM)
KR20060114914A (ko) 이동통신 단말기에서 수신음성레벨을 조절하기 위한 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080804

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090105