JP2014512049A - 音声対話型メッセージ交換 - Google Patents

音声対話型メッセージ交換 Download PDF

Info

Publication number
JP2014512049A
JP2014512049A JP2014503705A JP2014503705A JP2014512049A JP 2014512049 A JP2014512049 A JP 2014512049A JP 2014503705 A JP2014503705 A JP 2014503705A JP 2014503705 A JP2014503705 A JP 2014503705A JP 2014512049 A JP2014512049 A JP 2014512049A
Authority
JP
Japan
Prior art keywords
user
message
text
voice
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014503705A
Other languages
English (en)
Inventor
アイハラ,リアネ
ランドリー,シェーン
スティフェルマン,リサ
チンサクンタ,マドゥスーダン
サリバン,アン
リー,キャスリーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2014512049A publication Critical patent/JP2014512049A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. short messaging services [SMS] or e-mails
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

特には携帯型デバイスにおける、完全にハンズフリーのメッセージ交換が、音声認識、テキストトゥスピーチ(TTS)、および検出アルゴリズムの組合せを介して提供される。入力メッセージがユーザに対して読み上げられ、ユーザは、その音声対話モードが適切であるかどうかを判定すると、音声入力を介する応答メッセージでその送信者に応答することを可能にされる。ユーザはまた、異なる通信モード(たとえば、通話)で応答するためのオプションを提供され得る、または他のアクションを実行することができる。ユーザはさらに、自然言語を使用し、メッセージ交換を開始することを可能にされ得る。

Description

[0001]コンピュータおよびネットワーク技術の発達および普及で、パーソナル通信およびビジネス通信は、量および質において急速に成長した。
デスクトップコンピュータ、車載コンピュータ、携帯型コンピュータ、スマートフォン、および同様のデバイスなどの固定型または携帯型のコンピューティングデバイスを介するマルチモーダル通信は、ごく一般的である。多数の通信の様相が、容易にカスタマイズ可能なソフトウェア/ハードウェアの組合せを介して制御されるので、以前に知られていなかった機能が、日常生活で使用するために利用可能である。たとえば、存在情報の通信アプリケーションへの統合により、人々はより効率的に互いに通信することが可能になる。同時に行われるサイズの縮小と計算能力の向上により、音声(audio)、ビデオ、テキストメッセージ交換、電子メール、インスタントメッセージング、ソーシャルネットワーキングポスト/更新などを含むが、これらに限定されない、マルチモーダル通信のためのスマートフォンまたは同様のハンドヘルドコンピューティングデバイスの使用が可能になる。
[0002]通信技術の急速な成長の結果の1つは、情報過多である。一人が毎日数百の電子メールを交換し、数えきれないほどの音声またはビデオ通信セッションに参加し、多数のテキストメッセージを交換することは珍しくない。膨張する通信の範囲を所与として、より公式な電子メールおよび時間を要する音声/ビデオ通信の代わりに、テキストメッセージ交換が益々盛んになっている。さらに、従来のタイピング技術を使用すると、物理的キーボード上であるかタッチ技術を使用するかに関わらず、テキストメッセージさえも、場合により(たとえば、運転中)、非効率的、非実用的、または危険であることがある。
[0003]この概要は、発明を実施するための形態において以下でさらに説明される概念の選択を簡潔な形で紹介するために提供される。本概要は、特許請求されている対象の重要な特徴または本質的特徴を排他的に識別するものではなく、特許請求されている対象の範囲を確定する際の助けとされるものでもない。
[0004]諸実施形態は、特に、音声認識(speech recognition)、テキストトゥスピーチ(TTS)、および検出アルゴリズムの組合せを介する携帯型デバイスにおいて、メッセージの完全にハンズフリーの交換を提供することを対象とする。いくつかの実施形態によれば、入力メッセージがユーザに対して読み上げ可能であり、ユーザは、音声入力を介する応答メッセージでその送信者に応答できるようにされる。ユーザはまた、異なる通信モード(たとえば、通話)で応答するためのオプションを提供され得る、または他のアクションを実行することができる。他の実施形態によれば、ユーザは、自然言語を使用して、メッセージ交換を開始できるようにされ得る。
[0005]これらのならびに他の特徴および利点が、以下の詳細な説明を読むことおよび関連図面の再検討から明らかとなろう。前述の概要および以下の詳細な説明の両方は説明のためであり、特許請求されているものとしての態様を制限しないことを理解すべきである。
[0006]様々なモダリティでの異なる例示的デバイス間のネットワーク通信を示す概念図である。 [0007]音声入力を介してメッセージ交換を開始するための実施形態によるシステム内の動作の例示的流れを示す図である。 [0008]音声入力を介して入力メッセージに応答するための実施形態によるシステム内の動作の例示的流れを示す図である。 [0009]通信を円滑に進めるための携帯型コンピューティングデバイスの例示的ユーザインターフェースを示す図である。 [0010]実施形態によるシステムが実装され得るネットワーク環境である。 [0011]実施形態が実装され得る例示的コンピューティング動作環境のブロック図である。
[0012]簡単に前述したように、入力メッセージがユーザに対して読み上げ可能であり、ユーザは、その音声対話モードが適切であるかどうかを判定すると、音声入力を介して応答メッセージで送信者に応答することを可能にされ得る。ユーザはまた、異なる通信モード(たとえば、通話)で応答するためのオプションを提供され得る、または他のアクションを実行することができる。ユーザは、自然言語を使用し、メッセージ交換を開始することをさらに可能にされ得る。以下の詳細な説明で、本明細書の一部を形成し、例として特定の実施形態または例が示された、添付の図面が参照される。これらの態様は組み合わせることができ、他の態様が使用可能であり、構造的変更が、本開示の趣旨および範囲を逸脱することなしに行われ得る。したがって、以下の詳細な説明は、限定的な意味で取られるべきではなく、本発明の範囲は、添付の特許請求の範囲およびそれらの同等のものによって定義される。
[0013]実施形態は、パーソナルコンピュータのオペレーティングシステムで動作するアプリケーションプログラムとともに実行するプログラムモジュールの概括的文脈において説明されるが、態様は他のプログラムモジュールとの組合せでも実装され得ることが、当業者には理解されよう。
[0014]概して、プログラムモジュールは、ルーチン、プログラム、構成要素、データ構造、および特定のタスクを実行するまたは特定の抽象データタイプを実装する他のタイプの構造を含む。さらに、諸実施形態は、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースのもしくはプログラマブルな家庭用電化製品、ミニコンピュータ、メインフレームコンピュータ、および同等のコンピューティングデバイスを含む、他のコンピュータシステム構成で実施され得ることが、当業者には理解されよう。諸実施形態はまた、タスクが通信ネットワークを介してリンクされた遠隔処理装置によって実行される分散型コンピューティング環境において実施され得る。分散型コンピューティング環境で、プログラムモジュールは、ローカルおよび遠隔メモリ記憶装置の両方の中に置かれ得る。
[0015]諸実施形態は、コンピュータ実装プロセス(方法)、コンピューティングシステム、またはコンピュータプログラム製品もしくはコンピュータ可読媒体などの製造品として、実装することができる。そのコンピュータプログラム製品は、コンピュータシステムにより可読の、かつコンピュータもしくはコンピューティングシステムに(1つまたは複数の)例示的プロセスを実行させるための命令を備えるコンピュータプログラムを符号化する、コンピュータ記憶媒体でもよい。コンピュータ可読記憶媒体は、たとえば、揮発性コンピュータメモリ、非揮発性メモリ、ハードドライブ、フラッシュドライブ、フロッピディスク、またはコンパクトディスク、および同等の媒体のうちの1つまたは複数を介して実装することができる。
[0016]本明細書全体を通して、「プラットフォーム」という用語は、マルチモーダル通信を円滑に進めるためのソフトウェアおよびハードウェア構成要素の組合せでもよい。プラットフォームの例は、複数のサーバに亘って実行されるホスト型サービス、単一のサーバで実行されるアプリケーション、および同等のシステムを含むが、これらに限定されない。概して、「サーバ」という用語は、典型的にはネットワーク環境内で1つまたは複数のソフトウェアプログラムを実行するコンピューティングデバイスを指す。しかし、サーバはまた、そのネットワーク上のサーバとして見られる1つまたは複数のコンピューティングデバイス上で実行される仮想サーバ(ソフトウェアプログラム)としても実装され得る。
[0017]図1は、様々なモダリティにおける異なる例示的デバイス間のネットワーク通信を示す概念図である。現代の通信システムは、サーバおよび他の専門の装置によって管理される1つまたは複数のワイヤードおよび/またはワイヤレスネットワークを介する情報の交換を含み得る。ユーザ対話は、携帯電話、スマートフォン、専用デバイスなどの専門のデバイスによって、または通信アプリケーションを実行した汎用コンピューティングデバイス(固定型または携帯型)によって、円滑に進めることができる。
[0018]現代の通信システムによって供される機能および特徴の多様性により、ユーザは様々な通信モダリティを活用することができる。たとえば、音声、ビデオ、電子メール、テキストメッセージ、データ共用、アプリケーション共用、および同様のモダリティは、個々に、または同じデバイスを介して組み合わせて使用することができる。ユーザは、その携帯型デバイスを介してテキストメッセージを交換し、次いで、異なるモダリティを介して同じ人と会話を継続することができる。
[0019]図100は、2つの例示的システムを示し、一方はセルラネットワークを使用し、他方はデータネットワークを使用する。セルラ通信システムは、音声、ビデオ、またはテキストベースの交換が、複雑なバックボーンシステムによって管理されるセルラネットワーク102を介して行われることを可能にする。携帯電話112および122は、様々な機能を有し得る。今日、スマートファンが機能に関してデスクトップコンピューティングデバイスと酷似していることは珍しくない。
[0020]他方でデータネットワーク104ベースの通信システムは、携帯型(たとえばハンドヘルドコンピュータ114、124)または固定型(たとえばデスクトップコンピュータ116、126)コンピューティングデバイスを介して、より広範なデータおよび通信モダリティのセットの交換を可能にする。データネットワーク104に基づく通信システムは、典型的には、1つまたは複数のサーバ(たとえばサーバ106)によって管理される。通信セッションもまた、ネットワークを横切って円滑に進められ得る。たとえば、データネットワーク104に接続されたユーザは、セルラネットワーク102に接続された携帯電話ユーザと、そのデスクトップ通信アプリケーションを介して通信セッション(任意のモダリティで)を開始することができる。
[0021]しかし、従来のシステムおよび通信デバイスは、ほとんど、その通信デバイスのボタンまたは同様の制御要素のタイピングまたは起動などの物理的対話に制限される。音声認識に基づく技術が一部のシステムで使用されるが、ユーザは、典型的には、ボタンを押すことによってそれらを起動させなければならない。さらに、ユーザは、音声に基づく機能を使用する前に、デバイス/アプリケーションを適切なモードにする必要がある。
[0022]いくつかの実施形態による通信システムは、ユーザが出力のテキストベースのメッセージを送信して、ボタンを押すまたはデバイス画面を見ることさえ必要とせずに、入力のテキストベースのメッセージに応答できる(通知を受信する、ユーザに対してメッセージを読ませる、および応答を作成する)ようにするのに、音声認識、口述、およびテキストトゥスピーチ(音声出力)技術の組合せを使用し、それによって、通信デバイスとの対話を最小限にまたはなくする。テキストベースのメッセージは、インスタントメッセージ(IM)、ショートメッセージサービス(SMS)メッセージ、マルチメディアメッセージングサービス(MMS)メッセージ、ソーシャルネットワーキングポスト/更新、電子メール、および同等のものを含むが、これらに限定されない、任意の形のテキストのメッセージを含み得る。
[0023]例示的実施形態はまた、方法を含む。これらの方法は、本明細書に記載の構造を含む、任意の数の方法で実装することができる。そのような方法の1つは、本明細書に記載のタイプのデバイスの機械動作による。
[0024]別のオプションの方法は、いくらかを実行する1人または複数の人間のオペレータと連動して実行されることになる本方法の個々の動作のうちの1つまたは複数についてである。これらの人間のオペレータは、互いに一緒に配置される必要はなく、各々がそのプログラムの一部を実行する機械とともにいるだけでもよい。
[0025]図2は、音声入力を介してメッセージ交換を開始するための実施形態によるシステム内の動作の例示的流れを示す。通信を円滑に進めるためのコンピューティングデバイスへの音声入力が、マイクロフォン、ヘッドセット、カーキット、または同様の音声デバイスなどの統合されたまたは別個の構成要素(ワイヤードまたはワイヤレス)を介して届き得る。様々なシーケンスの動作が、実施形態による通信システム内で実行され得るが、2つの例示的流れが図2および図3で論じられる。
[0026]例示的動作の流れ200は、所定のキーワード(たとえば「メッセージングを開始」)またはデバイス(232)のボタンを押すことを介するメッセージングアクションの起動で開始することができる。いくつかの実施形態によれば、そのメッセージングアクションは、自然言語を介して起動することができる。たとえば、ユーザは、「ジョン・ドゥにメッセージを送る」と声に出すことによって指示を与えることができる。ユーザが電話番号または受信者としての同様の識別子を述べた場合、システムは、その識別子が適切であることを確認し、さらなる音声入力を待つことができる。ユーザが名前を述べた場合、1つまたは複数の判定アルゴリズムが実行されて、同様の識別子(たとえば、SIP識別子)の電話番号と受信された名前を関連付けることができる。たとえば、その受信された名前は、連絡先リストまたは同様のデータベースと比較され得る。複数の名前または同音の名前が存在する場合、本システムは、どの連絡先がそのメッセージを受信することを意図されているかを指定するようにユーザに促すことができる。さらに、ある連絡先と関連する複数の識別子(たとえば、電話番号、SIP識別子、電子メールアドレス、ソーシャルネットワーキングアドレスなど)が存在する場合、本システムは、意図された識別子を選択する(音声入力を介して)ようにユーザに再び促すことができる。たとえば、本システムは、テキストメッセージが連絡先と関連する通常の電話番号のファックス番号に送信されるものではないと自動的に判定することができるが、その連絡先が2つの携帯電話番号を有する場合、ユーザは2つの電話番号の中から選択するように促され得る。
[0027]意図された受信者の識別子が判定された後は、本システムは、メッセージ(234)を話すように音声プロンプトまたはイアコンを介してユーザに促すことができる。イアコンは、特定の事象を表すために使用される短い、独特の音(通常は、合成された音色または音パターン)である。イアコンは、コンピュータオペレーティングシステムの共通の機能であり、警告またはエラーメッセージが独特の音色または音色の組合せを伴う。ユーザがメッセージを話し終えたとき(所定の時間間隔を超える最後の沈黙の継続または「メッセージの終了」などのユーザ音声プロンプトのいずれかによって判定される)、本システムは音声認識(236)を実行することができる。音声認識および/または他の処理は、通信デバイスで完全にまたは部分的に実行され得る。たとえば、いくつかの適用例で、通信デバイスは、音声認識を実行し通信デバイスにその結果を提供することができるサーバにその記録された音声を送信することができる。
[0028]音声認識プロセスが終結すると、デバイス/アプリケーションは、オプションでそのメッセージを復唱し、ユーザにそのメッセージ(238)を編集/添付/確認することを促すことができる。確認すると、そのメッセージは、テキストベースのメッセージとして受信者(240)に送信することができ、ユーザは、そのテキストベースのメッセージが送信されたという確認(242)をオプションで提供される。処理の異なるステージで、通信デバイス/アプリケーションのユーザインターフェースはまた、ユーザに視覚的フィードバックを提供することができる。たとえば、様々なアイコンおよび/またはテキストが表示され、実行されているアクションまたはその結果(たとえば、進行中の音声認識を指示するアニメーション化されたアイコン、または確認アイコン/テキスト)を指示することができる。
[0029]図3は、音声入力を介する入力メッセージに応答するための実施形態によるシステム内の動作の例示的流れを示す。
[0030]図の動作300は、テキストベースのメッセージの受信(352)で開始する。次に、本システムは、音声対話モードが使用可能であるまたは許可されるかどうかの判定(354)を行うことができる。たとえば、ユーザは、彼/彼女が会議中または公共の場にいるときに音声対話モードを切ることができる。いくつかの実施形態によれば、その判定は、いくつかの要因に基づき自動的に行われ得る。たとえば、会議を指示するユーザのカレンダが、音声対話モードを切るために使用され得る、またはモバイルであるデバイス(たとえば、GPSまたは同様のロケーションサービスを介する)が、音声対話モードを起動するようにシステムに促すことができる。同様に、デバイスのポジション(たとえば、デバイスが表を下にしている)または同等の状況もまた、音声対話モードが使用されるべきかどうかを判定するために使用され得る。音声対話型モードを判定する際のさらなる要因は、ユーザの可動性の状況(たとえば、ユーザが静止している、歩いている、運転している)、ユーザの可用性状況(ユーザのカレンダまたは同様のアプリケーションで指示されるものとして)、および通信デバイスの構成(たとえば、接続された入力/出力デバイス)を含み得るが、これらに限定されない。
[0031]音声対話モードが許可される/使用可能である場合、受信されたテキストベースのメッセージは、デバイスでまたはサーバでのテキストトゥスピーチ変換(356)を介して音声内容に変換することができ、音声メッセージがユーザに再生される(358)。メッセージの再生が完了すると、デバイス/アプリケーションは、応答メッセージの記録、音声通話(もしくはビデオ通話)の開始、または同等のアクションの実行などのオプションをユーザに促すことができる(360)。たとえば、ユーザは、メッセージのストリング内の音声または前のメッセージが再生されることを介して送信者に連絡先の詳細が提供されることを要求することができる。送信者の名前および/または識別子(たとえば、電話番号)もまた、メッセージの最初にまたは最後にユーザに対して再生され得る。
[0032]ユーザに対してオプションを再生すると、そのデバイス/アプリケーションは、リスニングモードに切り替わり、ユーザからの音声入力を待つことができる。ユーザの応答が受信されるとき、音声認識が受信された音声入力に実行可能であり(362)、ユーザの応答に応じて、送信者に電話をかけること(364)、テキストメッセージに応答すること(366)、または他のアクション(368)などのいくつかのアクションのうちの1つが実行され得る。図2の動作の流れと同様に、アイコン、テキスト、色の警告など、視覚的合図が、ユーザとの音声対話中に表示され得る。
[0033]動作の流れ200および300での対話は、完全に自動化することができ、ユーザが自然言語を介して音声入力を提供するまたは促されること(たとえば、デバイスが様々なステージで音声プロンプトを提供することなど)を可能にする。さらに、物理的対話(物理的または仮想ボタンを押すこと、テキストプロンプトなど)もまた、対話の異なるステージで使用され得る。さらに、ユーザは、出力メッセージを記録すると(オプションの再生に続いて)、それらを編集するオプションを提供され得る。
[0034]プロセス200および300に含まれる動作は、例示を目的とする。音声対話型メッセージ交換は、より少ないまたは追加のステップを有する同様のプロセスによって、ならびに本明細書に記載の原理を使用して異なる順番の動作で、実装され得る。
[0035]図4は、通信を円滑に進めるための携帯型コンピューティングデバイスの例示的ユーザインターフェースを示す。前述のように、テキストメッセージングの音声対話は、通信を円滑に進める任意のデバイス内に実装することができる。略図300に示すユーザインターフェースは、単に、モバイル通信デバイスの例示的ユーザインターフェースである。実施形態は、この例示的ユーザインターフェースまたは前述の他のものに限定されない。
[0036]例示的モバイル通信デバイスは、ボタン、ノブ、キーなどのいくつかの物理的制御要素に加えて、スピーカ472およびマイクロフォンを含み得る。そのようなデバイスはまた、カメラ474、または異なる通信モダリティと併せて使用することができる同様の付属デバイスも含み得る。例示的ユーザインターフェースは、日付および時間と、電話アプリケーション476、メッセージングアプリケーション478、カメラアプリケーション480、ファイル編成アプリケーション482およびウェブブラウザ484などの異なるアプリケーションのいくつかのアイコンを表示する。ユーザインターフェースは、電話をかけるためのデュアルトーンマルチ周波数(DTMF)キーなどのいくつかの仮想ボタン(図示せず)をさらに含み得る。
[0037]例示的ユーザインターフェースの下の部分に、メッセージングアプリケーションと関連するアイコンおよびテキストが示される。たとえば、受信されたメッセージの送信者の画像(または表現アイコン)486が、メッセージ488に関するテキストのヒントおよび追加のアイコン490(たとえば、メッセージカテゴリ、送信者の存在状況などを指示する)とともに表示され得る。
[0038]異なる処理ステージで、通信デバイス/アプリケーションのユーザインターフェースはまた、視覚的フィードバックをユーザに提供することができる。たとえば、追加のアイコンおよび/またはテキストが表示され、実行されているアクションまたはその結果(たとえば、進行中の音声認識を指示するアニメーション化されたアイコン、または確認アイコン/テキスト)を指示することができる。
[0039]通信デバイスはまた、音声対話モードが使用されるべきか/使用可能であるかどうかを判定するために、装備され得る。前述のように、ロケーションおよび/または動きの判定システムは、グローバルポジショニングサービス(GPS)情報、セルラタワー三角測量、ワイヤレスデータネットワークノード検出、コンパス、および加速度センサ、知られているジオポジションフォトへのカメラ入力のマッチング、および同様の方法に基づいて、ユーザが移動しているかどうか(たとえば、車で)を検知することができる。別の手法は、ユーザのロケーション(たとえば、会議室または公共の場所)を判定することと、それに基づき音声対話を起動することとを含み得る。同様に、カレンダリングアプリケーションまたは現在実行されるアプリケーションなどからのユーザに関する情報が、音声対話についてのユーザの可用性を判定するために使用され得る。
[0040]音声対話を使用する通信は、デスクトップコンピュータ、ラップトップコンピュータ、ノートブックなどの任意のコンピューティングデバイス、スマートフォン、ハンドヘルドコンピュータ、ワイヤレスパーソナルデジタルアシスタント(PDA)、携帯電話、車載コンピューティングデバイスなどのモバイルデバイス、および同様のものを介して、円滑に進められ得る。
[0041]図1から図4で論じる異なるプロセスおよびシステムは、明確なハードウェアモジュール、ソフトウェアモジュール、またはハードウェアおよびソフトウェアの組合せを使用し、実装することができる。さらに、そのようなモジュールは、統合された形でそれらのプロセスのうちの2つ以上を実行することができる。いくつかの実施形態は音声対話型メッセージ交換の特定の例とともに提供されるが、実施形態はそれらに限定されない。実際には、実施形態は、様々な通信デバイスおよびアプリケーションを使用する様々な通信システム内に、本明細書に記載の原理を使用する追加のまたはより少ない特徴を有して、実装され得る。
[0042]図5は、実施形態が実装され得る例示的ネットワーク環境である。音声対話型メッセージ交換を有する通信サービスを提供するためのプラットフォームは、ホスト型サービスなどの1つまたは複数のサーバ514を介して実行されるソフトウェアを介して実装され得る。そのプラットフォームは、(1つまたは複数の)ネットワーク510を介してスマートフォン511、携帯電話512、または同様のデバイス(「クライアントデバイス」)などの個々のモバイルデバイス上のクライアントアプリケーションと通信することができる。
[0043]クライアントデバイス511から512のいずれかで実行されるクライアントアプリケーションは、サーバ514から、または個々のサーバ516上で、通信サービスを提供するホスト型サービスと対話することができる。そのホスト型サービスは、マルチモーダルサービス、および存在、ロケーションなどの付属サービスを提供することができる。マルチモーダルサービスの部分として、テキストメッセージ交換は、前述のような音声対話性とともにユーザ間で円滑に進められ得る。音声認識またはテキストトゥスピーチ変換などの音声対話性と関連する処理のいくつかまたはすべては、サーバ514または516のうちの1つまたは複数で実行され得る。音声認識、テキストトゥスピーチ変換、連絡先情報、および同様のデータなどの関連データは、直接に(1つまたは複数の)データストア519で/から、あるいは、データベースサーバ518を介して、記憶および/または検索され得る。
[0044](1つまたは複数の)ネットワーク510は、サーバ、クライアント、インターネットサービスプロバイダ、および通信媒体の任意のトポロジを備えることができる。実施形態によるシステムは、静的または動的トポロジを有し得る。(1つまたは複数の)ネットワーク510は、企業ネットワークなどの安全なネットワーク、ワイヤレスオープンネットワークなどの安全ではないネットワーク、またはインターネットを含み得る。(1つまたは複数の)ネットワーク510はまた、(特に、サーバとモバイルデバイスの間の)セルラネットワークを含み得る。さらに、(1つまたは複数の)ネットワーク510は、ブルートゥースまたは同様のものなどの短距離ワイヤレスネットワークを含み得る。(1つまたは複数の)ネットワーク510は、前述のノードの間で通信を提供する。例として、限定ではなく、(1つまたは複数の)ネットワーク510は、音波、RF、赤外線および他のワイヤレス媒体などのワイヤレス媒体を含み得る。
[0045]コンピューティングデバイス、アプリケーション、データソース、およびデータ分散型システムの多数の他の構成が、音声対話型メッセージ交換サービスを提供するプラットフォームを実装するために使用され得る。さらに、図5で論じるネットワーク環境は、説明のみを目的とする。実施形態は、例示的アプリケーション、モジュール、またはプロセスに限定されない。
[0046]図6および関連する考察は、その中で実施形態が実装され得る適切なコンピューティング環境の簡潔な概括的説明を提供するものである。図6を参照すると、コンピューティングデバイス600など、実施形態による適用例の例示的コンピューティング動作環境のブロック図が示される。基本構成で、コンピューティングデバイス600は、実施形態による音声対話性を有するテキストメッセージ交換を含むマルチモーダル通信を円滑に進める能力のあるモバイルコンピューティングデバイスでもよく、少なくとも1つの処理ユニット602およびシステムメモリ604を含む。コンピューティングデバイス600はまた、プログラムを実行する際に協働する複数の処理ユニットも含み得る。コンピューティングデバイスの正確な構成およびタイプに応じて、システムメモリ604は、揮発性(RAMなど)、非揮発性(ROM、フラッシュメモリなど)、またはその2つの何らかの組合せでもよい。システムメモリ604は、典型的には、WINDOWS MOBILE(登録商標)、WINDOWS PHONE(登録商標)、またはワシントン州レッドモンドのMICROSOFT CORPORATIONの同様のオペレーティングシステム、あるいは、同様のものなどのプラットフォームの動作を制御するのに適したオペレーティングシステム605を含む。システムメモリ604はまた、プログラムモジュール606、通信アプリケーション622、および音声対話機能モジュール624などの1つまたは複数のソフトウェアアプリケーションを含み得る。
[0047]通信アプリケーション622は、テキストメッセージングを含むマルチモーダル通信を可能にすることができる。音声対話機能モジュール624は、ユーザに対して入力メッセージを再生し、ユーザが音声認識、テキストトゥスピーチ(TTS)、および検出アルゴリズムの組合せによる音声入力を介して応答メッセージで送信者に応答することを可能にすることができる。通信アプリケーション622はまた、異なる通信モード(たとえば、通話)で応答するためのおよび他のアクションを実行するためのオプションをユーザに提供することができる。音声対話機能モジュール624はさらに、ユーザが自然言語を使用するメッセージ交換を開始することを可能にすることができる。この基本構成は、破線608内のそれらの構成要素によって図6に示される。
[0048]コンピューティングデバイス600は、追加の特徴または機能を有し得る。たとえば、コンピューティングデバイス600はまた、たとえば、磁気ディスク、光ディスク、またはテープなどの追加のデータ記憶装置(取外し式および/または非取外し式)を含み得る。そのような追加の記憶装置は、取外し式記憶装置609、および非取外し式記憶装置610によって図6に示される。コンピュータ可読記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報の記憶のための任意の方法または技術で実装される、揮発性および非揮発性、取外し式および非取外し式媒体を含み得る。システムメモリ604、取外し式記憶装置609および非取外し式記憶装置610は、すべて、コンピュータ可読記憶媒体の例である。コンピュータ可読記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)または他の光記憶装置、磁気テープ、磁気ディスク記憶装置または他の磁気記憶装置、あるいは、所望の情報を記憶するために使用可能なおよびコンピューティングデバイス600によってアクセス可能な任意の他の媒体を含むが、これらに限定されない。任意のそのようなコンピュータ可読記憶媒体は、コンピューティングデバイス600の部分でもよい。コンピューティングデバイス600はまた、キーボード、マウス、ペン、音声入力デバイス、タッチ入力デバイス、および同等の入力デバイスなどの(1つまたは複数の)入力デバイス612を含み得る。ディスプレイ、スピーカ、プリンタ、および他のタイプの出力デバイスなどの(1つまたは複数の)出力デバイス614もまた、含まれ得る。これらのデバイスは、当技術分野でよく知られており、本明細書で詳細に論じられる必要はない。
[0049]コンピューティングデバイス600はまた、分散型コンピューティング環境におけるワイヤードまたはワイヤレスネットワーク、衛星リンク、セルラリンク、短距離ネットワーク、および同等の機構など、他のデバイス618とデバイスが通信できるようにする通信接続616を含み得る。他のデバイス618は、通信アプリケーションを実行する(1つまたは複数の)コンピューティングデバイス、他のサーバ、および同等のデバイスを含み得る。(1つまたは複数の)通信接続616は、通信媒体の一例である。通信媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータをその中に含み得る。例として、限定ではなく、通信媒体は、ワイヤードネットワークまたは直接ワイヤード接続などのワイヤード媒体と、音波、RF、赤外線および他のワイヤレス媒体などのワイヤレス媒体とを含む。
[0050]前述の明細書、例、およびデータは、実施形態の構成要素の製造および使用の完全な説明を提供する。その主題は構造的特徴および/または方法論的動作に特有の言語で説明されているが、添付の特許請求の範囲で定義される主題は前述の特定の特徴または動作に必ずしも限定されないことが理解されよう。そうではなくて、前述の特定の特徴および動作は、本特許請求の範囲および実施形態を実装する例示的な形として開示される。

Claims (10)

  1. 音声対話型メッセージ交換を円滑に進めるためのコンピューティングデバイス内で少なくとも部分的に実行される方法であって、
    ユーザから指示を受信してメッセージを送信するステップと、
    前記ユーザが前記メッセージの受信者と前記メッセージの音声内容とを音声入力を介して提供できるようにするステップと、
    受信された前記音声入力に音声認識を実行するステップと、
    音声認識された前記音声入力から前記受信者を判定するステップと、
    テキストベースのメッセージとして前記受信者に前記メッセージの音声認識された前記内容を送信するステップと
    を含む、方法。
  2. 送信者からテキストベースのメッセージを受信するステップと、
    テキストトゥスピーチ変換によって受信された前記メッセージから音声内容を生成するステップと、
    前記ユーザに前記音声内容を再生するステップと、
    再生された前記音声内容と関連する少なくとも1つのオプションを前記ユーザに提供するステップと、
    前記ユーザからの別の音声入力の受信に応答して、前記少なくとも1つのオプションと関連するアクションを実行するステップと
    をさらに含む、請求項1に記載の方法。
  3. 前記ユーザが前記テキストベースのメッセージ送信するための指示と前記音声入力とを自然言語を用いて提供できるようにするステップ
    をさらに含む、請求項2に記載の方法。
  4. 前記音声入力を受信すると、受信された前記音声入力を再生するステップと、
    前記ユーザが提供された前記音声入力の編集および確認のうちの1つを行えるようにするステップと
    をさらに含む、請求項2に記載の方法。
  5. 前記アクションが、前記送信者との音声通信セッションの開始、前記送信者とのビデオ通信セッションの開始、テキストベースのメッセージでの応答、前のメッセージの再生および前記送信者と関連する情報の提供のセットからの1つを含む、請求項2に記載の方法。
  6. 音声対話型メッセージ交換を円滑に進める能力のあるコンピューティングデバイスであって、
    通信モジュールと、
    音声入力/出力モジュールと、
    メモリと、
    前記通信モジュール、前記音声入力/出力モジュールおよび前記メモリに結合されたプロセッサと
    を備え、前記プロセッサは、
    送信者からテキストベースのメッセージを受信し、
    テキストトゥスピーチ変換によって受信された前記メッセージから音声内容を生成し、
    前記ユーザに対して、前記音声内容と、前記送信者に関連する名前および識別子のうちの1つとを再生し、
    再生された前記音声内容と関連する少なくとも1つのオプションを前記ユーザに提供し、
    前記ユーザからの音声入力の受信に応答して、前記少なくとも1つのオプションに関連するアクションを実行する
    ように構成された通信アプリケーションを実行する、
    コンピューティングデバイス。
  7. 前記通信アプリケーションが、
    前記ユーザからの音声指示を受信してテキストベースのメッセージを送信し、
    前記ユーザが前記テキストベースのメッセージの受信者と前記メッセージの音声内容とを自然言語入力を介して提供できるようにし、
    受信された前記入力に音声認識を実行し、
    受信された前記入力を再生することによって前記メッセージを確認することおよび編集することのうちの1つを前記ユーザが行えるようにし、
    前記入力の音声認識された前記内容から前記受信者を判定し、
    前記受信者に前記テキストベースのメッセージの音声認識された前記内容を送信する
    ようにさらに構成されている、請求項6に記載のコンピューティングデバイス。
  8. ディスプレイをさらに備え、前記通信アプリケーションが、前記音声対話型メッセージ交換と関連する動作を表すテキスト、グラフィック、アニメーション化されたグラフィックおよびアイコンのうちの少なくとも1つを含む前記ディスプレイを介して前記ユーザに視覚的フィードバックを提供するようにさらに構成されている、請求項6に記載のコンピューティングデバイス。
  9. 音声対話型メッセージ交換を円滑に進めるために命令が記憶されているコンピュータ可読記憶媒体であって、前記命令が、
    前記メッセージ交換を円滑に進める通信デバイスの設定、ユーザのロケーション、前記ユーザの状況およびユーザ入力のセットからの少なくとも1つに基づいて、自動的に音声対話モードを起動することと、
    前記ユーザから音声指示を受信してテキストベースのメッセージを送信することと、
    前記ユーザが前記テキストベースのメッセージの受信者と前記メッセージの音声内容とを自然言語入力を介して提供できるようにすることと、
    受信された前記入力に音声認識を実行することと、
    前記入力の音声認識された前記内容から前記受信者を判定することと、
    テキストベースのメッセージとして前記受信者に前記メッセージの音声認識された前記内容を送信することと、
    送信者からテキストベースのメッセージを受信することと、
    テキストトゥスピーチ変換によって受信された前記メッセージから音声内容を生成することと、
    前記ユーザに前記音声内容を再生することと、
    再生された前記音声内容と関連する少なくとも1つのオプションを前記ユーザに提供することと、
    前記ユーザからの別の音声入力の受信に応答して、前記他の音声入力と関連するアクションを実行することと
    を含む、コンピュータ可読記憶媒体。
  10. 前記ユーザの前記状況が、前記ユーザの可動性状況、前記ユーザの可用性状況、前記通信デバイスのポジションおよび前記通信デバイスの構成のセットからの少なくとも1つを含む、請求項9に記載のコンピュータ可読媒体。
JP2014503705A 2011-04-07 2012-04-02 音声対話型メッセージ交換 Pending JP2014512049A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/081,679 US20120259633A1 (en) 2011-04-07 2011-04-07 Audio-interactive message exchange
US13/081,679 2011-04-07
PCT/US2012/031778 WO2012138587A2 (en) 2011-04-07 2012-04-02 Audio-interactive message exchange

Publications (1)

Publication Number Publication Date
JP2014512049A true JP2014512049A (ja) 2014-05-19

Family

ID=46966786

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014503705A Pending JP2014512049A (ja) 2011-04-07 2012-04-02 音声対話型メッセージ交換

Country Status (6)

Country Link
US (1) US20120259633A1 (ja)
EP (1) EP2695406A4 (ja)
JP (1) JP2014512049A (ja)
KR (1) KR20140022824A (ja)
CN (1) CN103443852A (ja)
WO (1) WO2012138587A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014102548A (ja) * 2012-11-16 2014-06-05 Honda Motor Co Ltd メッセージ処理装置
JP2016072665A (ja) * 2014-09-26 2016-05-09 京セラ株式会社 通信端末およびその制御方法

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170169700A9 (en) * 2005-09-01 2017-06-15 Simplexgrinnell Lp System and method for emergency message preview and transmission
US20100246571A1 (en) 2009-03-30 2010-09-30 Avaya Inc. System and method for managing multiple concurrent communication sessions using a graphical call connection metaphor
US9699632B2 (en) 2011-09-28 2017-07-04 Elwha Llc Multi-modality communication with interceptive conversion
US9794209B2 (en) 2011-09-28 2017-10-17 Elwha Llc User interface for multi-modality communication
US9788349B2 (en) 2011-09-28 2017-10-10 Elwha Llc Multi-modality communication auto-activation
US20130079029A1 (en) * 2011-09-28 2013-03-28 Royce A. Levien Multi-modality communication network auto-activation
US9906927B2 (en) 2011-09-28 2018-02-27 Elwha Llc Multi-modality communication initiation
US9204267B2 (en) * 2012-01-04 2015-12-01 Truvu Mobile, Llc Method and system for controlling mobile communication device interactions
US9961249B2 (en) * 2012-09-17 2018-05-01 Gregory Thomas Joao Apparatus and method for providing a wireless, portable, and/or handheld, device with safety features
CN103455530A (zh) * 2012-10-25 2013-12-18 河南省佰腾电子科技有限公司 随身携带式创建个性化语音对应文本文字数据库的装置
US20150302000A1 (en) * 2012-11-30 2015-10-22 Hongrui Shen A method and a technical equipment for analysing message content
CN103001858B (zh) * 2012-12-14 2015-09-09 上海量明科技发展有限公司 即时通信中回复消息的方法、客户端及系统
US9271111B2 (en) * 2012-12-14 2016-02-23 Amazon Technologies, Inc. Response endpoint selection
CN103001859B (zh) * 2012-12-14 2016-06-29 上海量明科技发展有限公司 即时通信中回复流媒体消息的方法及系统
JP6671379B2 (ja) 2014-10-01 2020-03-25 エクスブレイン・インコーポレーテッド 音声および接続プラットフォーム
US20160157074A1 (en) 2014-11-30 2016-06-02 Raymond Anthony Joao Personal monitoring apparatus and method
CN112152908A (zh) * 2015-02-16 2020-12-29 钉钉控股(开曼)有限公司 通讯方法
CN104869497B (zh) * 2015-03-24 2018-12-11 广东欧珀移动通信有限公司 一种wifi音箱的无线网络设置方法及装置
US9430949B1 (en) * 2015-03-25 2016-08-30 Honeywell International Inc. Verbal taxi clearance system
CN105427856B (zh) * 2016-01-12 2020-05-19 北京光年无限科技有限公司 一种面向智能机器人的约请数据处理方法和系统
US9912800B2 (en) 2016-05-27 2018-03-06 International Business Machines Corporation Confidentiality-smart voice delivery of text-based incoming messages
ES2644887B1 (es) * 2016-05-31 2018-09-07 Xesol I Mas D Mas I, S.L. Método de interacción mediante voz para comunicación durante conducción de vehículos y dispositivo que lo implementa
CN106230698A (zh) * 2016-08-07 2016-12-14 深圳市小马立行科技有限公司 一种基于车载智能终端的社交方法
US10580404B2 (en) 2016-09-01 2020-03-03 Amazon Technologies, Inc. Indicator for voice-based communications
US10453449B2 (en) 2016-09-01 2019-10-22 Amazon Technologies, Inc. Indicator for voice-based communications
CN109791764A (zh) * 2016-09-01 2019-05-21 亚马逊技术公司 基于话音的通信
US10074369B2 (en) 2016-09-01 2018-09-11 Amazon Technologies, Inc. Voice-based communications
US20180088969A1 (en) * 2016-09-28 2018-03-29 Lenovo (Singapore) Pte. Ltd. Method and device for presenting instructional content
CN106791015A (zh) * 2016-11-29 2017-05-31 维沃移动通信有限公司 一种消息播放和回复方法及装置
CN106601254B (zh) * 2016-12-08 2020-11-06 阿里巴巴(中国)有限公司 信息输入方法和装置及计算设备
KR20180101063A (ko) * 2017-03-03 2018-09-12 삼성전자주식회사 사용자 입력을 처리하는 전자 장치 및 그 방법
CN109725798B (zh) * 2017-10-25 2021-07-27 腾讯科技(北京)有限公司 智能角色的切换方法及相关装置
CN107734193A (zh) * 2017-11-22 2018-02-23 深圳悉罗机器人有限公司 智能设备系统及智能设备控制方法
CN110048928B (zh) * 2018-01-17 2022-07-05 阿里巴巴集团控股有限公司 信息提交、获取、交互方法、装置、设备及系统
KR102508677B1 (ko) 2018-03-08 2023-03-13 삼성전자주식회사 사용자 발화를 처리하는 시스템 및 그 시스템의 제어 방법
US10891939B2 (en) * 2018-11-26 2021-01-12 International Business Machines Corporation Sharing confidential information with privacy using a mobile phone
CN110211589B (zh) * 2019-06-05 2022-03-15 广州小鹏汽车科技有限公司 车载系统的唤醒方法、装置以及车辆、机器可读介质
US11765547B2 (en) 2019-07-30 2023-09-19 Raymond Anthony Joao Personal monitoring apparatus and methods
US11775780B2 (en) 2021-03-01 2023-10-03 Raymond Anthony Joao Personal monitoring apparatus and methods
CN114007130A (zh) * 2021-10-29 2022-02-01 维沃移动通信有限公司 数据传输方法、装置、电子设备及存储介质

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5475738A (en) * 1993-10-21 1995-12-12 At&T Corp. Interface between text and voice messaging systems
US7562392B1 (en) * 1999-05-19 2009-07-14 Digimarc Corporation Methods of interacting with audio and ambient music
CA2242065C (en) * 1997-07-03 2004-12-14 Henry C.A. Hyde-Thomson Unified messaging system with automatic language identification for text-to-speech conversion
FI115868B (fi) * 2000-06-30 2005-07-29 Nokia Corp Puhesynteesi
US6925154B2 (en) * 2001-05-04 2005-08-02 International Business Machines Corproation Methods and apparatus for conversational name dialing systems
ITFI20010199A1 (it) * 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
ES2228739T3 (es) * 2001-12-12 2005-04-16 Siemens Aktiengesellschaft Procedimiento para sistema de reconocimiento de lenguaje y procedimiento para el funcionamiento de un sistema asi.
KR100450319B1 (ko) * 2001-12-24 2004-10-01 한국전자통신연구원 가상 환경에서 참여자간의 의사전달 장치 및 방법
KR100788652B1 (ko) * 2002-02-19 2007-12-26 삼성전자주식회사 자동 음성 다이얼 장치 및 방법
DE10211777A1 (de) * 2002-03-14 2003-10-02 Philips Intellectual Property Erzeugung von Nachrichtentexten
US7917581B2 (en) * 2002-04-02 2011-03-29 Verizon Business Global Llc Call completion via instant communications client
US7123695B2 (en) * 2002-05-21 2006-10-17 Bellsouth Intellectual Property Corporation Voice message delivery over instant messaging
GB0327416D0 (en) * 2003-11-26 2003-12-31 Ibm Directory dialler name recognition
WO2005062976A2 (en) * 2003-12-23 2005-07-14 Kirusa, Inc. Techniques for combining voice with wireless text short message services
JP2007534278A (ja) * 2004-04-20 2007-11-22 ボイス シグナル テクノロジーズ インコーポレイテッド ショートメッセージサービスを通じる音声
US7583974B2 (en) * 2004-05-27 2009-09-01 Alcatel-Lucent Usa Inc. SMS messaging with speech-to-text and text-to-speech conversion
WO2006133547A1 (en) 2005-06-13 2006-12-21 E-Lane Systems Inc. Vehicle immersive communication system
US8224647B2 (en) * 2005-10-03 2012-07-17 Nuance Communications, Inc. Text-to-speech user's voice cooperative server for instant messaging clients
CA2527813A1 (en) * 2005-11-24 2007-05-24 9160-8083 Quebec Inc. System, method and computer program for sending an email message from a mobile communication device based on voice input
US7929672B2 (en) * 2006-04-18 2011-04-19 Cisco Technology, Inc. Constrained automatic speech recognition for more reliable speech-to-text conversion
US8015010B2 (en) * 2006-06-13 2011-09-06 E-Lane Systems Inc. Vehicle communication system with news subscription service
EP1879000A1 (en) * 2006-07-10 2008-01-16 Harman Becker Automotive Systems GmbH Transmission of text messages by navigation systems
US8781491B2 (en) * 2007-03-02 2014-07-15 Aegis Mobility, Inc. Management of mobile device communication sessions to reduce user distraction
US9066199B2 (en) * 2007-06-28 2015-06-23 Apple Inc. Location-aware mobile device
EP2229576B1 (en) * 2007-12-05 2016-04-13 Visteon Global Technologies, Inc. Vehicle user interface systems and methods
US8538376B2 (en) * 2007-12-28 2013-09-17 Apple Inc. Event-based modes for electronic devices
US8131118B1 (en) * 2008-01-31 2012-03-06 Google Inc. Inferring locations from an image
US8364486B2 (en) * 2008-03-12 2013-01-29 Intelligent Mechatronic Systems Inc. Speech understanding method and system
US8248237B2 (en) * 2008-04-02 2012-08-21 Yougetitback Limited System for mitigating the unauthorized use of a device
ATE544291T1 (de) 2009-02-27 2012-02-15 Research In Motion Ltd Mobile funkkommunikationsvorrichtung mit sprache- text-umwandlung und zugehörige verfahren
US20100222086A1 (en) 2009-02-28 2010-09-02 Karl Schmidt Cellular Phone and other Devices/Hands Free Text Messaging
US8417720B2 (en) * 2009-03-10 2013-04-09 Nokia Corporation Method and apparatus for accessing content based on user geolocation
US10540976B2 (en) * 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US9978272B2 (en) * 2009-11-25 2018-05-22 Ridetones, Inc Vehicle to vehicle chatting and communication system
CN102117614B (zh) * 2010-01-05 2013-01-02 索尼爱立信移动通讯有限公司 个性化文本语音合成和个性化语音特征提取
US8655965B2 (en) * 2010-03-05 2014-02-18 Qualcomm Incorporated Automated messaging response in wireless communication systems
CA2849718A1 (en) * 2010-09-21 2012-03-29 Cellepathy Ltd. System and method for sensor-based determination of user role, location, and/or state of one of more in-vehicle mobile devices and enforcement of usage thereof

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014102548A (ja) * 2012-11-16 2014-06-05 Honda Motor Co Ltd メッセージ処理装置
US9653077B2 (en) 2012-11-16 2017-05-16 Honda Motor Co., Ltd. Message processing device
JP2016072665A (ja) * 2014-09-26 2016-05-09 京セラ株式会社 通信端末およびその制御方法

Also Published As

Publication number Publication date
WO2012138587A3 (en) 2012-11-29
US20120259633A1 (en) 2012-10-11
EP2695406A2 (en) 2014-02-12
WO2012138587A2 (en) 2012-10-11
CN103443852A (zh) 2013-12-11
EP2695406A4 (en) 2014-09-03
KR20140022824A (ko) 2014-02-25

Similar Documents

Publication Publication Date Title
JP2014512049A (ja) 音声対話型メッセージ交換
KR102178896B1 (ko) 선택적으로 조종 가능한 상태 머신을 갖는 개인 보조 모듈 제공
US9111538B2 (en) Genius button secondary commands
JP5362034B2 (ja) 自動ボイスメールプレビューを介した高度なボイスメールの使用
EP3158464B1 (en) Use of a digital assistant in communications
CN108337380B (zh) 自动调整用户界面以用于免提交互
US20190392837A1 (en) Use of voice recognition to generate a transcript of conversation(s)
CN112470454A (zh) 使用话音和文本的同步通信
US10403272B1 (en) Facilitating participation in a virtual meeting using an intelligent assistant
AU2012212517A1 (en) Posting to social networks by voice
KR101891496B1 (ko) 사용자간 대화 세션에 대한 능동적 모니터링 및 개입을 제공하는 대화형 ai 에이전트 시스템, 방법 및 컴퓨터 판독가능 기록 매체
US9369587B2 (en) System and method for software turret phone capabilities
CN102045462B (zh) 用于异构会话管理的统一接口的方法和装置
US9881611B2 (en) System and method for providing voice communication from textual and pre-recorded responses
KR102017544B1 (ko) 메신저 플랫폼에 관계없이 복수의 메신저를 이용하는 사용자간 다양한 형식의 채팅 서비스를 제공하는 대화형 ai 에이전트 시스템, 방법 및 컴퓨터 판독가능 기록 매체
KR20190094080A (ko) 사용자간 대화 세션에 대한 모니터링에 기초하여 능동적으로 주문 또는 예약 서비스를 제공하는 대화형 ai 에이전트 시스템, 방법 및 컴퓨터 판독가능 기록 매체
TW202224385A (zh) 多媒體內容生成方法、系統及電腦可讀記錄介質
CN113726956A (zh) 一种来电接听控制方法、装置、终端设备及存储介质
KR102004092B1 (ko) 복수의 메신저를 이용하는 사용자간 심리스한 채팅 서비스를 제공하기 위해 관계 데이터베이스를 생성하는 방법 및 컴퓨터 판독가능 기록 매체
KR20190101591A (ko) 모바일 장치, 이를 포함하는 오디오 북 제작 시스템 및 이를 이용하는 오디오 북 제작 방법
KR20190103928A (ko) 대화 세션 내의 이전의 이력 정보를 이용하여, 사용자간 대화 세션에 대한 모니터링에 기초해서 능동적으로 주문 또는 예약 서비스를 제공하는 대화형 ai 에이전트 시스템, 방법 및 컴퓨터 판독가능 기록 매체
KR20190104853A (ko) 복수의 메신저를 이용하는 사용자간 심리스한 채팅 서비스를 제공하는 대화형 ai 에이전트 시스템, 방법 및 컴퓨터 판독가능 기록 매체
WO2015005938A1 (en) Interactive voicemail system