JP2007529831A - 音声対話型メッセージング方法及び装置 - Google Patents

音声対話型メッセージング方法及び装置 Download PDF

Info

Publication number
JP2007529831A
JP2007529831A JP2007504151A JP2007504151A JP2007529831A JP 2007529831 A JP2007529831 A JP 2007529831A JP 2007504151 A JP2007504151 A JP 2007504151A JP 2007504151 A JP2007504151 A JP 2007504151A JP 2007529831 A JP2007529831 A JP 2007529831A
Authority
JP
Japan
Prior art keywords
message
electronic device
voice
prompt
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007504151A
Other languages
English (en)
Inventor
京子 武田
ブース、シオドー、アール.サード
クレメント、ジェイソン、リー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2007529831A publication Critical patent/JP2007529831A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • H04M1/65Recording arrangements for recording a message from the calling party
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4931Directory assistance systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems
    • H04M3/53366Message disposing or creating aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/39Electronic components, circuits, software, systems or apparatus used in telephone systems using speech synthesis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/45Aspects of automatic or semi-automatic exchanges related to voicemail messaging
    • H04M2203/4536Voicemail combined with text-based messaging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/70Details of telephonic subscriber devices methods for entering alphabetical characters, e.g. multi-tap or dictionary disambiguation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Abstract

メッセージ作成方法は、メッセージを作成する要求を受信するステップと、メッセージの受信者を尋ねる第1のプロンプトを出力するステップと、メッセージの受信者を含む、第1のプロンプトに対する第1の可聴応答を受信するステップと、メッセージの本文を尋ねる第2のプロンプトを出力するステップと、メッセージの本文を含む、第2のプロンプトに対する第2の可聴応答を受信するステップと、メッセージを作成するステップとを有する。電子装置は、ユーザに受信者情報の入力を音声でプロンプトし、及びメッセージ情報の入力を音声でプロンプトする音声案内モジュールと、受信者情報の音声によるプロンプト及びメッセージ情報の音声によるプロンプトに対して受信した応答を解釈する音声認識モジュールと、受信者情報の音声によるプロンプト及びメッセージ情報の音声によるプロンプトに対する応答に基づき、メッセージを作成するメッセージコンプライアモジュールとを備える。

Description

本発明は、メッセージの作成に関する。詳しくは、本発明は、メッセージを作成するための対話型の音声メッセージングに関する。
携帯電話機を介してメッセージを送る場合、ユーザは、小さい画面に表示された文字を読み、押しづらい小さなキーパッドをタイプし、認識率が悪い手書き文字入力を行い、手書き文字入力の誤認識を修正し、携帯電話機上のハード/ソフトボタンを選択する等の操作を行わなくてはならない。携帯電話機でメッセージを送信するには、通常、単一のメッセージ送信タスクを遂行するために、異なるユーザインタラクション技術が必要である。
このため、メッセージを容易に作成し、送信できるシステム及び方法が望まれている。
本明細書に開示する異なる実施の形態は、音声対話型メッセージング方法及び装置を提供することによって、上述の課題及び他の課題を解決する。
一実施の形態においては、メッセージ作成方法は、メッセージを作成する要求を受信するステップと、メッセージの受信者を尋ねる第1のプロンプトを出力するステップと、メッセージの受信者を含む、第1のプロンプトに対する第1の可聴応答を受信するステップと、メッセージの本文を尋ねる第2のプロンプトを出力するステップと、メッセージの本文を含む、第2のプロンプトに対する第2の可聴応答を受信するステップと、メッセージを作成するステップとを有する。
他の実施の形態として示す電子装置は、ユーザに受信者情報の入力を音声でプロンプトし、及びメッセージ情報の入力を音声でプロンプトする音声案内モジュールと、受信者情報の音声によるプロンプト及びメッセージ情報の音声によるプロンプトに対して受信した応答を解釈する音声認識モジュールと、受信者情報の音声によるプロンプト及びメッセージ情報の音声によるプロンプトに対する応答に基づき、メッセージを作成するメッセージコンプライアモジュールとを備える。
更に他の実施の形態として示す電子装置は、メッセージを作成する要求を受信する作成要求受信手段と、メッセージの受信者を尋ねる第1のプロンプトを出力する第1の出力手段と、メッセージの受信者を含む、第1のプロンプトに対する第1の可聴応答を受信する第1の応答受信手段と、メッセージの本文を尋ねる第2のプロンプトを出力する第2の出力手段と、メッセージの本文を含む、第2のプロンプトに対する第2の可聴応答を受信する第2の応答受信手段と、メッセージを作成するメッセージ作成手段とを備える。
更に他の実施の形態として示す電子装置は、ユーザにメッセージ情報の入力を音声でプロンプトする音声案内モジュールと、メッセージ情報の音声によるプロンプトに対して受信した応答を解釈する音声認識モジュールと、メッセージ情報の音声によるプロンプトに対する応答に基づき、メッセージを作成するメッセージコンプライアモジュールとを備える。
添付の複数の図面に亘って対応する参照記号は、対応するコンポーネントを示している。図面に示す要素は、本発明を簡潔且つ明瞭に説明するために示されており、必ずしも同じ縮尺で描かれていないことは当業者には明らかである。例えば、本発明の様々な実施形態の理解を容易にするために、図内の幾つかの要素の寸法は、他の要素より大きく示している。また、商業的に実現可能な実施形態において有用又は必要である一般的によく知られた要素については、本発明の様々な実施形態の特徴を不明瞭にしないため、敢えて省略している。また、本明細書で用いる用語及び表現は、特に、本明細書で特別な断りがない限り、対応するそれぞれの産業及び研究の分野において、当業者が用いる用語及び表現に一致する通常の意味を有する。
以下の説明は、限定的な意味で解釈されるものではなく、本発明の一般的な原理を説明する目的のみで行う。本発明の範囲は、特許請求の範囲を参照して判断されるべきものである。
本発明に基づく音声メッセージングシステムの一実施の形態のブロック図を図1に示す。図1には、電子装置100と、音声レコーダ102と、音声データベース104と、比較モジュール106と、音声案内モジュール108と、記録案内モジュール110と、スピーカ112と、メッセージ作成器114と、コンタクトデータベース116と、マルチメディアデータベース118と、メッセージ120とが示されている。
電子装置100は、音声レコーダ102と、音声データベース104と、比較モジュール106と、音声案内モジュール108と、記録案内モジュール110と、スピーカ112と、メッセージ作成器114と、コンタクトデータベース116と、マルチメディアデータベース118とを備える。一実施の形態では、音声レコーダ102、音声データベース104、比較モジュール106、音声案内モジュール108、記録案内モジュール110、メッセージ作成器114、コンタクトデータベース116及びマルチメディアデータベース118は、プロセッサ及び1つ以上のメモリ装置を用いて実現される。プロセッサは、電子装置の動作を制御し、及び1つ以上のメモリ装置へのアクセス及び処理を制御する。
電子装置100は、ユーザによる電子装置100との音声でのインタラクションに応じて、異なるタイプのメッセージ(例えば、ボイスメール、電子メール及びインスタントメッセージ)を作成し、送信する。好ましくは、メッセージを作成するために、電子装置100は、ユーザに対し、音声により、メッセージのコンポーネント又は部分の入力をプロンプトする(入力を促す)。
実際の動作では、音声レコーダ102は、ボイス入力を受信し、音声入力を音声データに変換する。比較モジュール106は、この音声データと、音声データベース104に保存されているデータとを照合する。音声データベース104には、ユーザが以前に記録した単語又は語句が保存されている。これにより、電子装置100は、ユーザの音声パターンを認識するように、ユーザによって訓練される。このような手法は、特定話者音声認識(speaker dependent voice recognition)として知られている。ユーザは、オプションとして、トレーニング処理を行って音声データベース104にデータを登録してもよく、この場合、ユーザは、コマンドを発声し、音声データベース104に登録する。
音声データと、音声データベース104に保存されているデータとが一致すると、この一致を示す情報が音声案内モジュール108に供給される。音声案内モジュール108は、比較モジュール106から供給された情報を解析し、メッセージを作成するためにユーザに尋ねる次の情報を決定する。そして、音声案内モジュール108は、記録案内モジュール110に信号を供給する。記録案内モジュール110は、スピーカ112を介して、情報の要求を出力する。一実施の形態では、この出力は、メッセージの受信者に関する情報の要求である。そして、電子装置100は、ユーザからの応答を待機する。
音声レコーダ102は、次に、ユーザからの応答を音声データとして記録する。比較モジュール106は、記録された音声データと、音声データベース104の情報とを比較する。記録された音声データとは、例えば、受信者、サブジェクト、本文、メッセージタイプ又は添付ファイル等のメッセージを作成するために用いられる情報である。電子装置100は、ユーザからの応答を、先のプロンプトによって要求した情報に対応する情報として扱う。例えば、先の要求が、「誰にメッセージを送信しますか?」という質問であった場合、記録された音声データは、受信者情報として扱われ、コンタクトデータベース116から情報を検索するために用いられる。同様に、先の要求が、「どのファイルをメッセージに添付しますか?」という質問であった場合、記録された音声データは、マルチメディアデータベース118からのファイルを添付するために使用される。他の具体例として、先の要求が、「メッセージを発声して下さい」というプロンプトであった場合、記録された音声データは、メッセージ120の本文を作成するために使用される。この処理は、図3を用いて後に更に詳細に説明する。
メッセージの本文は、多くの異なる手法で受信者に配信できる。例えば、一実施の形態では、メッセージの本文を音声ファイルとして保存し、この音声ファイルを電子メールの添付ファイルとして送信してもよい。これに代えて、メッセージの本文をテキストに変換し、例えば、インスタントメッセージ又は電子メールとして受信者に配信してもよい。メッセージ作成器114は、情報の要求に対する応答の全てを用いて、最終的なメッセージを作成する。そして、このメッセージは、例えば、セルラ電話システム及びセルラネットワークを介して、ユーザに送信される。好ましい実施の形態では、電子装置100は、携帯電話機であるが、変形例では、電子装置100は、例えば、デスクトップコンピュータ、ラップトップコンピュータ、携帯情報端末(personal digital assistant:PDA)及びタブレットパーソナルコンピュータ(personal computer:PC)等であってもよい。
音声メッセージングシステムの変形例のブロック図を図2に示す。図2には、電子装置200と、音声レコーダ202と、音声データベース204と、メッセージングエンジン及び音声インタフェースモジュール206と、音声案内モジュール208と、記録案内モジュール210と、スピーカ212と、メッセージ作成器214と、コンタクトデータベース216と、マルチメディアデータベース218と、メッセージ220とが示されている。
電子装置200は、ユーザによる電子装置200との音声でのインタラクションに応じて、異なるタイプのメッセージ(例えば、ボイスメール、電子メール及びインスタントメッセージ)を作成し、送信する。好ましくは、メッセージを作成するために、電子装置200は、ユーザに対し、音声により、メッセージのコンポーネント又は部分の入力をプロンプトする。
実際の動作では、音声レコーダ202は、ボイス入力を受信し、音声入力を音声データに変換する。メッセージングエンジン及び音声インタフェースモジュール206は、音声データを解釈し、音声データの解析に基づいて、如何なる動作を実行するかを判定する。音声データベース204は、不特定話者音声認識システムに必要な情報を保存する。このように、電子装置200は、音声データを解析することによって、あらゆる音声入力を認識する能力を有するため、ユーザによって訓練する必要なく、ユーザの音声パターンを認識することができる。これは、不特定話者音声認識として知られている。
音声データ及び音声データベース204に保存されたデータを解析した後に、メッセージングエンジン及び音声インタフェースモジュール206は、ユーザ入力に対して、電子装置200がどのように応答するべきかを判定する。例えば、ユーザがメッセージの送信を望む場合、メッセージングエンジン及び音声インタフェースモジュール206は、音声案内モジュール208に対し、追加的な情報をユーザに要求するよう指示する。そして、音声案内モジュール208は、記録案内モジュール210から要求を検索し、この要求は、スピーカ212を介して出力される。一実施の形態では、この出力は、メッセージの受信者に関する情報の要求である。そして、電子装置200は、ユーザからの応答を待機する。音声レコーダ202は、次に、ユーザからの応答を音声データとして記録する。メッセージングエンジン及び音声インタフェースモジュール206は、記録された音声データを用いて、メッセージの受信者を判定する。メッセージ作成器214は、このメッセージの受信者に関する情報に基づき、メッセージを作成する。
電子装置200は、メッセージを作成するために必要なデータの全てについて、音声による要求を順次出力し、ユーザからの応答を音声データとして記録する。記録された音声データとは、例えば、受信者、サブジェクト、本文、メッセージタイプ、ファイル名又は添付ファイル等のメッセージを作成するために用いられる情報である。電子装置200は、ユーザからの応答を、先のプロンプトによって要求した情報に対応する情報として扱う。例えば、先の要求が、「誰にメッセージを送信しますか?」という質問であった場合、記録された音声データは、受信者情報として扱われる。同様に、先の要求が、「どのファイルをメッセージに添付しますか?」という質問であった場合、記録された音声データは、添付する適切なファイルを判定するために使用される。他の具体例として、先の要求が、「メッセージを発声して下さい」というプロンプトであった場合、記録された音声データは、メッセージ220の本文として使用される。
本発明に基づく音声メッセージング処理のフローチャートを図3A〜図3Cに示す。例示的な実施の形態では、この処理は、ユーザによる電子装置とのインタラクションを介して実行される。電子装置は、例えば、携帯電話機、PDA、デスクトップコンピュータ、ラップトップコンピュータ、タブレットPC等であってもよい。
ステップ300において、ユーザは、電子装置とインタラクトし、メッセージングアプリケーションを呼び出す。例えば、ユーザは、音声コマンドを発声し、又は電子装置のボタン(ソフトキー又はハードキー)を押す。ステップ302において、電子装置は、ユーザの要求を認識し、メッセージングアプリケーションを呼び出す。次に、電子装置は、ステップ304において、メッセージ作成セッションを介して、ユーザに音声案内を行う。
電子装置は、ステップ306において、メッセージの受信者に関する情報を要求する。例えば、電子装置は、「メッセージを誰に送りますか?」という音声を、例えば、電子装置のスピーカから出力する。そして、電子装置は、ユーザからの応答(例えば、「ジョンスミス」)を待機する。ユーザは、ステップ308において、受信者の名前(例えば、ジョンスミス)を発声し、電子装置は、この情報を受信し、記録する。電子装置は、ステップ310において、記録された応答について、アドレス帳を検索する。例えば、電子装置は、アドレス帳から「ジョンスミス」を検索する。「ジョンスミス」がメッセージの受信者であるこの具体例では、ステップ312において、電子装置は、ジョンスミスのアカウントの情報を取得し、次に、メッセージを作成するために必要な情報のタイプを判定する。例えば、電子装置は、ジョンスミスが受信できるメッセージのタイプを判定し、及びオプションとして、ジョンスミスがアクセスできる装置又は受信を望む装置を判定する。
次に、電子装置は、ステップ314において、音声データベースから音声データを取得し、音声によるプロンプトを生成する。例えば、「ジョンスミスは、現在、携帯電話機、オフィスの電子メール及びインスタントメッセージ(instant messenger:IM)を使用することができます。デフォルトメッセージは、IMです。よろしいですか?」といったプロンプトが出力される。そして、電子装置は、ユーザからの応答を待機する。変形例では、電子装置は、例えば、受信者が好むメッセージタイプに基づき、単にメッセージのタイプを選択する。この処理については、図4を参照して後に詳細に説明する。ステップ320において、ユーザは、例えば、「はい」又は「いいえ」で応答し、電子装置は、この応答を記録及び処理する。この具体例では、ユーザは、「いいえ」と応答している。次に、ステップ322において、電子装置は、所望のメッセージタイプを音声でユーザに案内する。ステップ324において、電子装置は、「メッセージの受信者を選択して下さい。選択する場合『はい』と答えて下さい」という音声によるプロンプトを出力することによってユーザインタラクションを指示する。ステップ326において、電子装置は、メッセージの受信者への第1のメッセージング方法を特定し、ステップ328において、音声によるプロンプトとして「携帯電話機」を出力する。ステップ330において、電子装置は、ユーザが「はい」と発声しなかったと判定し、受信者への第2のメッセージング方法を特定する。次に、電子装置は、ステップ332において、音声によるプロンプトとして、「オフィスの電子メール」を出力し、応答を待機する。ユーザは、ステップ334において、「はい」と発声し、電子装置は、ステップ336において、このユーザ応答を記録し、応答を音声データとして保存し、ユーザへの音声による確認を生成する。電子装置は、ステップ338において、「ジョンスミスのオフィスの電子メールにメッセージを送信します」という音声を出力する。
電子装置は、ステップ340において、ユーザにメッセージの本文の入力を促すことによって、ユーザを音声で案内し、ステップ342において、「メッセージを発声して下さい」という音声によるプロンプトを出力して、メッセージの本文を要求する。ステップ344では、ユーザがメッセージの本文を発声する。次に、電子装置は、ユーザからの応答を待機し、応答を記録する。ステップ346では、電子装置は、メッセージを記録し、メッセージの本文の入力が終了したことを示す指示を待機する(例えば、ステップ350において、2秒間無音であった場合、メッセージが終了したと判定する)。電子装置は、ステップ348及びステップ352において、「メッセージは終了しましたか?」という音声をスピーカから出力することによって、メッセージが終了したことを音声で確認する。電子装置は、ステップ356において、ユーザから「はい」の応答を受信すると、ステップ358において、メッセージが送信されることを伝える音声による確認を出力する。例えば、ステップ360において、電子装置は、「ジョンスミスのオフィスの電子メールにメッセージを送信します。」といった音声を出力し、メッセージを送信するために必要な、受信した全ての情報を確認する。
ステップ354において、メッセージが終了しなかった場合、電子装置は、メッセージの記録を再開する。次に、ステップ362において、電子装置は、ユーザから取得した受信者、メッセージのタイプ、メッセージの本文に関する情報に基づいてメッセージを作成する。一実施の形態においては、メッセージの本文(すなわち、記録された音声データ)は、テキストに変換され、他の実施の形態では、この応答は、オーディオファイル又は音声メッセージとして受信者に送信される。例えば、電子メールメッセージは、テキストメッセージによる本文を含んでいてもよく、又は電子メールにオーディオファイルを添付してもよい。そして、ステップ364において、電子装置は、メッセージが受信者に送信されたことを確認するために「メッセージをジョンスミスに送信しました」という音声を出力する。ユーザが応答を発声する都度、電子装置は、電子装置が不特定話者音声認識システムであるか、特定話者音声認識システムであるかに応じて、応答を処理する。例えば、特定話者システムの場合、ユーザの応答に基づく音声データは、ユーザが発声した、データベースに予め登録されている単語及び語句と比較される。
一実施の形態に基づく音声メッセージングの処理のフローチャートを図4に示す。
まず、ステップ400において、電子装置は、メッセージを作成する要求を受信する。例えば、ユーザは、メニューオプション又はメッセージングボタンを介して、電子装置のメッセージング機能を選択する。これに代えて、ユーザは、メッセージの送信を音声で要求することもできる。電子装置は、特定話者音声認識システム又は不特定話者音声認識システムのいずれかを採用する。特定話者システムの場合、電子装置は、メッセージを送信するための音声による要求(音声データに変換される)を事前に録音されている単語又は語句のデータベースに照合し、要求を認識する。不特定話者音声認識システムの場合、システムは、ユーザが固有のフレーズをデータベースに予め登録する必要なく、ユーザの発声内容を認識し、処理する。
次に、ステップ402において、電子装置は、メッセージの受信者に関する情報を要求する第1のプロンプトを出力する。好ましい実施の形態では、電子装置は、メッセージの受信者に関する情報を要求する音声によるプロンプトを出力する。これに代えて、電子装置の表示画面にプロンプトを表示することによって、受信者の情報の要求を出力してもよい。
ステップ404において、電子装置は、メッセージの受信者を含む、第1のプロンプトに対する第1の可聴応答を受信する。例えば、電子装置は、ユーザがマイクロホンに向かって発声した氏名「ジョンスミス」を受信し、この応答を音声データとして記録する。
ステップ406において、電子装置は、メッセージの本文を尋ねる第2のプロンプトを出力する。好ましい実施の形態では、電子装置は、メッセージの本文を要求する音声によるプロンプトを出力する。これに代えて、電子装置の表示画面にプロンプトを表示することによって、本文の要求を出力してもよい。電子装置は、ステップ408において、メッセージの本文を含む、第2のプロンプトに対する第2の可聴応答を受信する。
そして、ステップ410において、電子装置は、メッセージを作成する。例えば、意図された受信者に宛てたメッセージの本文を含むメッセージが作成される。一具体例においては、電子メールを作成し、受信者の電子メールアドレスに送信する。電子メールには、メッセージ本文の音声データを含む添付ファイルを添付することができ、又は電子メールは、電子装置が音声データをテキストに変換することによって生成したテキストを含んでいてもよい。これに代えて、電子装置は、受信者に音声メールを送ってもよく、又はインスタントメッセージを送ってもよい。
電子装置がメッセージのメッセージタイプを要求するプロンプトを出力するステップを設けてもよい。例えば、電子装置は、音声メッセージを送信するか、電子メールを送信するかに関する入力をユーザに促してもよい。そして、電子装置は、送信されるメッセージの種類を含む音声による応答を受信する。変形例においては、電子装置は、受信者の現在の状態又は受信者が好む連絡先に基づいて、送信するメッセージの種類を決定する。受信者の現在の状態又は受信者が好むメッセージの種類を判定する方法及びシステムの一例は、引用により全体が本願に援用される、2004年2月2日に出願された米国特許出願番号第10/872,993号、発明の名称「ユーザ装置所在自動登録システム(AUTOMATIC USER DEVICE PRESENCE REGISTRATION SYSTEM)」に開示されている。これにより、一実施の形態では、電子装置は、受信者に送信するメッセージの種類を自動的に決定し、したがって、この場合、ユーザにメッセージの種類を入力するよう要求する必要はない。
電子装置は、受信者に送信するメッセージの種類を自動的に決定する場合、電子装置は、メッセージの本文の最良の形式を自動的に判定してもよい。例えば、受信者が職場のコンピュータを使用中で、メッセージを電子メールメッセージで送信する場合、メッセージの本文をテキストに変換する。一方、受信者がPDAしか使えない状況にある場合、PDAの小さいスクリーン上では、テキストを読むことが困難な場合があるので、メッセージの本文は、ユーザが聞くことができるオーディオファイルとして添付してもよい。
本発明の他の側面では、電子装置を用いて、ユーザによる装置の使用可能性及び好ましい連絡の種類を更新してもよい。好ましくは、ユーザは、音声によって電子装置と対話し、使用可能性及び好ましい連絡の種類を更新する。上述のように、ユーザ装置所在自動登録システムは、米国特許出願番号第10/872,993号に開示されている。
以上、特定の実施の形態及びその適用例を用いて、本発明を説明したが、本発明を実施するために特に開示した上述の説明に基づき、添付の特許請求の範囲に定義されている本発明の精神及び範囲から逸脱することなく、この他の変更、変形及び構成を行うことができる。
一実施の形態に基づく音声メッセージングシステムのブロック図である。 変形例に基づく音声メッセージングシステムのブロック図である。 一実施の形態に基づく音声メッセージングの処理のフローチャートである。 図3Aの続きである。 図3Bの続きである。 他の実施の形態に基づく音声メッセージングの処理のフローチャートである。

Claims (20)

  1. メッセージを作成する要求を受信するステップと、
    上記メッセージの受信者を尋ねる第1のプロンプトを出力するステップと、
    上記メッセージの受信者を含む、上記第1のプロンプトに対する第1の可聴応答を受信するステップと、
    上記メッセージの本文を尋ねる第2のプロンプトを出力するステップと、
    上記メッセージの本文を含む、上記第2のプロンプトに対する第2の可聴応答を受信するステップと、
    上記メッセージを作成するステップとを有するメッセージ作成方法。
  2. 上記メッセージのタイプを尋ねる第3のプロンプトを出力するステップと、
    上記メッセージのタイプを含む、上記第3のプロンプトに対する第3の可聴応答を受信するステップを更に有する請求項1記載のメッセージ作成方法。
  3. 上記受信者の使用可能性に基づいて、上記メッセージのタイプを変更するステップを更に有する請求項2記載のメッセージ作成方法。
  4. 上記受信した応答をデータベースに照合するステップを更に有する請求項3記載のメッセージ作成方法。
  5. 上記受信した応答を音声データベースに照合するステップを更に有する請求項3記載のメッセージ作成方法。
  6. 上記メッセージに電子ファイルを添付するステップを更に有する請求項1記載のメッセージ作成方法。
  7. ユーザに受信者情報の入力を音声でプロンプトし、及びメッセージ情報の入力を音声でプロンプトする音声案内モジュールと、
    上記受信者情報の音声によるプロンプト及び上記メッセージ情報の音声によるプロンプトに対して受信した応答を解釈する音声認識モジュールと、
    上記受信者情報の音声によるプロンプト及び上記メッセージ情報の音声によるプロンプトに対する応答に基づき、メッセージを作成するメッセージコンプライアモジュールとを備える電子装置。
  8. 上記音声認識モジュールは、特定話者モジュールを備えることを特徴とする請求項7記載の電子装置。
  9. 上記音声認識モジュールは、不特定話者モジュールを備えることを特徴とする請求項7記載の電子装置。
  10. 上記音声案内モジュールは、上記メッセージのタイプの入力を音声でユーザにプロンプトすることを特徴とする請求項7記載の電子装置。
  11. 上記メッセージの意図された受信者を判定する受信者識別モジュールを更に備える請求項7記載の電子装置。
  12. 上記メッセージの意図された受信者をコンタクトブックから検索することを特徴とする請求項11記載の電子装置。
  13. メッセージを作成する要求を受信する作成要求受信手段と、
    上記メッセージの受信者を尋ねる第1のプロンプトを出力する第1の出力手段と、
    上記メッセージの受信者を含む、上記第1のプロンプトに対する第1の可聴応答を受信する第1の応答受信手段と、
    上記メッセージの本文を尋ねる第2のプロンプトを出力する第2の出力手段と、
    上記メッセージの本文を含む、上記第2のプロンプトに対する第2の可聴応答を受信する第2の応答受信手段と、
    上記メッセージを作成するメッセージ作成手段とを備える電子装置。
  14. 上記メッセージのタイプを尋ねる第3のプロンプトを出力する第3の出力手段と、
    上記メッセージのタイプを含む、上記第3のプロンプトに対する第3の可聴応答を受信する第3の応答受信手段とを更に備える請求項13記載の電子装置。
  15. 受信者の使用可能性に基づいて、上記メッセージのタイプを変更する変更手段を更に備える請求項14記載の電子装置。
  16. 上記受信した応答をデータベースに照合する照合手段を更に備える請求項15記載の電子装置。
  17. 上記受信した応答を音声データベースに照合する照合手段を更に備える請求項15記載の電子装置。
  18. 上記メッセージに電子ファイルを添付する添付手段を更に備える請求項13記載の電子装置。
  19. ユーザにメッセージ情報の入力を音声でプロンプトする音声案内モジュールと、
    上記メッセージ情報の音声によるプロンプトに対して受信した応答を解釈する音声認識モジュールと、
    上記メッセージ情報の音声によるプロンプトに対する応答に基づき、メッセージを作成するメッセージコンプライアモジュールとを備える電子装置。
  20. 上記メッセージ情報は、上記メッセージの受信者及び本文を含むことを特徴とする請求項19記載の電子装置。
JP2007504151A 2004-03-18 2005-03-18 音声対話型メッセージング方法及び装置 Withdrawn JP2007529831A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US55475504P 2004-03-18 2004-03-18
US10/916,745 US7570746B2 (en) 2004-03-18 2004-08-11 Method and apparatus for voice interactive messaging
PCT/US2005/009125 WO2005089485A2 (en) 2004-03-18 2005-03-18 Method and apparatus for voice interactive messaging

Publications (1)

Publication Number Publication Date
JP2007529831A true JP2007529831A (ja) 2007-10-25

Family

ID=34986284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007504151A Withdrawn JP2007529831A (ja) 2004-03-18 2005-03-18 音声対話型メッセージング方法及び装置

Country Status (6)

Country Link
US (3) US7570746B2 (ja)
EP (2) EP1726154A4 (ja)
JP (1) JP2007529831A (ja)
KR (1) KR101149135B1 (ja)
CN (1) CN1934848A (ja)
WO (1) WO2005089485A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014185503A1 (ja) * 2013-05-16 2014-11-20 京セラ株式会社 電子機器、制御方法、及び記録媒体
JP2014225796A (ja) * 2013-05-16 2014-12-04 京セラ株式会社 電子機器、制御方法、及び制御プログラム
JP2014225798A (ja) * 2013-05-16 2014-12-04 京セラ株式会社 電子機器、制御方法、及び制御プログラム

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7570746B2 (en) 2004-03-18 2009-08-04 Sony Corporation Method and apparatus for voice interactive messaging
US7756255B1 (en) * 2004-05-25 2010-07-13 Sprint Spectrum L.P. Method and system for delivering a voice message from a telephone to a group of recipients
US8379809B2 (en) * 2004-07-30 2013-02-19 Avaya Inc. One-touch user voiced message
US10025906B2 (en) * 2005-12-30 2018-07-17 LifeWIRE Corporation Mobile self-management compliance and notification method, system and computer program product
ES2331624T3 (es) * 2006-10-25 2010-01-11 Hans-Jorg Roth Procedimiento y equipo terminal de comunicaciones para transmitir mensajes de voz.
US8798249B2 (en) 2008-05-20 2014-08-05 Microsoft Corporation Communication reminders
US8903058B2 (en) * 2008-05-20 2014-12-02 Microsoft Corporation Conveying call subject matter with voice data
JP5049934B2 (ja) * 2008-09-22 2012-10-17 株式会社東芝 対話文生成装置及び方法
CN102375535B (zh) * 2010-08-25 2015-11-25 北京中星微电子有限公司 一种视频监控中的人机交互方法和装置、视频监控系统
CN102082855A (zh) * 2010-12-30 2011-06-01 东莞宇龙通信科技有限公司 一种在电子终端上实现闹钟提醒的方法以及电子终端
CN102695134B (zh) * 2011-03-22 2017-06-06 富泰华工业(深圳)有限公司 语音短信系统及其处理方法
US8924219B1 (en) 2011-09-30 2014-12-30 Google Inc. Multi hotword robust continuous voice command detection in mobile devices
US20130085753A1 (en) * 2011-09-30 2013-04-04 Google Inc. Hybrid Client/Server Speech Recognition In A Mobile Device
US20140236586A1 (en) * 2013-02-18 2014-08-21 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for communicating messages amongst a node, device and a user of a device
US9811991B2 (en) 2014-06-27 2017-11-07 Harman International Industries, Incorporated Do-not-disturb system and apparatus
US9876985B2 (en) 2014-09-03 2018-01-23 Harman International Industies, Incorporated Providing a log of events to an isolated user
US10048757B2 (en) 2015-03-08 2018-08-14 Apple Inc. Devices and methods for controlling media presentation
CN107623794A (zh) * 2017-10-27 2018-01-23 维沃移动通信有限公司 一种语音数据的处理方法、装置及移动终端
CN108766429B (zh) * 2018-06-05 2020-08-21 北京百度网讯科技有限公司 语音交互方法和装置
KR102195834B1 (ko) 2020-08-18 2020-12-28 배문준 지게차용 포크 포지셔너

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4856066A (en) * 1986-11-06 1989-08-08 Lemelson Jerome H Speech communication system and method
US5146487A (en) * 1990-06-26 1992-09-08 Intertel Entertainment, Inc. Method for creating and composing audio text message
US5652789A (en) * 1994-09-30 1997-07-29 Wildfire Communications, Inc. Network based knowledgeable assistant
JP3025189B2 (ja) * 1996-01-23 2000-03-27 健児 佐竹 自動車用ナビゲーション
US5864606A (en) * 1996-09-30 1999-01-26 At&T Corp. Toll free message response
WO1998056116A2 (en) * 1997-06-04 1998-12-10 Koninklijke Philips Electronics N.V. Data compression and expansion of an in-level information signal
US6961410B1 (en) * 1997-10-01 2005-11-01 Unisys Pulsepoint Communication Method for customizing information for interacting with a voice mail system
US6157924A (en) * 1997-11-07 2000-12-05 Bell & Howell Mail Processing Systems Company Systems, methods, and computer program products for delivering information in a preferred medium
US6075844A (en) * 1997-11-18 2000-06-13 At&T Corp. Messaging system with remote messaging recording device where the message is routed based on the spoken name of the recipient
KR100343172B1 (ko) * 1998-10-29 2002-08-22 삼성전자 주식회사 무선 데이터 전송 방법과 그 이동 단말기 및 이종신호간 연동장치
US6385586B1 (en) 1999-01-28 2002-05-07 International Business Machines Corporation Speech recognition text-based language conversion and text-to-speech in a client-server configuration to enable language translation devices
US6449496B1 (en) * 1999-02-08 2002-09-10 Qualcomm Incorporated Voice recognition user interface for telephone handsets
US6529737B1 (en) * 1999-03-01 2003-03-04 Nortel Networks Limited Apparatus and method for sending a customized message to a telephony subscriber and establishing a direct operative connection therewith within the same telephone call
US6477240B1 (en) * 1999-03-31 2002-11-05 Microsoft Corporation Computer-implemented voice-based command structure for establishing outbound communication through a unified messaging system
US7945451B2 (en) * 1999-04-16 2011-05-17 Cardiocom, Llc Remote monitoring system for ambulatory patients
US6385584B1 (en) * 1999-04-30 2002-05-07 Verizon Services Corp. Providing automated voice responses with variable user prompting
KR19990064930A (ko) * 1999-05-18 1999-08-05 이창호 엑스엠엘 태그를 이용한 전자메일 구현방법
US6633846B1 (en) * 1999-11-12 2003-10-14 Phoenix Solutions, Inc. Distributed realtime speech recognition system
US6446042B1 (en) * 1999-11-15 2002-09-03 Sharp Laboratories Of America, Inc. Method and apparatus for encoding speech in a communications network
AU2001250050A1 (en) * 2000-03-24 2001-10-08 Eliza Corporation Remote server object architecture for speech recognition
US6658389B1 (en) * 2000-03-24 2003-12-02 Ahmet Alpdemir System, method, and business model for speech-interactive information system having business self-promotion, audio coupon and rating features
US6865533B2 (en) * 2000-04-21 2005-03-08 Lessac Technology Inc. Text to speech
US6738740B1 (en) * 2000-05-31 2004-05-18 Kenneth Barash Speech recognition system for interactively gathering and storing verbal information to generate documents
US6779020B1 (en) * 2000-07-18 2004-08-17 Lucent Technologies Inc. Establishing communications between a calling server and a called server according to services subscribed by their respective calling and called parties
US7089184B2 (en) * 2001-03-22 2006-08-08 Nurv Center Technologies, Inc. Speech recognition for recognizing speaker-independent, continuous speech
US6996531B2 (en) * 2001-03-30 2006-02-07 Comverse Ltd. Automated database assistance using a telephone for a speech based or text based multimedia communication mode
US20020172331A1 (en) * 2001-05-18 2002-11-21 Barker Wade Jonathan David Telephone message delivering system and method
US20020172339A1 (en) * 2001-05-21 2002-11-21 Creswell Carroll W. Method for providing sequenced communications within a group
US6901364B2 (en) * 2001-09-13 2005-05-31 Matsushita Electric Industrial Co., Ltd. Focused language models for improved speech input of structured documents
US6650735B2 (en) * 2001-09-27 2003-11-18 Microsoft Corporation Integrated voice access to a variety of personal information services
JP3974419B2 (ja) * 2002-02-18 2007-09-12 株式会社日立製作所 音声入力を用いた情報取得方法及び情報取得システム
US7315613B2 (en) * 2002-03-11 2008-01-01 International Business Machines Corporation Multi-modal messaging
JP2003295893A (ja) * 2002-04-01 2003-10-15 Omron Corp 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
US7421390B2 (en) * 2002-09-13 2008-09-02 Sun Microsystems, Inc. Method and system for voice control of software applications
US7184523B2 (en) * 2002-10-31 2007-02-27 Comverse, Inc. Voice message based applets
US7428580B2 (en) 2003-11-26 2008-09-23 Aol Llc Electronic message forwarding
US7254417B2 (en) * 2004-01-29 2007-08-07 At&T Intellectual Property, Inc. Car-safe messaging interfaces for interactive pagers and related methods
US20050198545A1 (en) 2004-02-12 2005-09-08 Sony Corporation Automatic user device presence registration system
US7570746B2 (en) 2004-03-18 2009-08-04 Sony Corporation Method and apparatus for voice interactive messaging

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014185503A1 (ja) * 2013-05-16 2014-11-20 京セラ株式会社 電子機器、制御方法、及び記録媒体
JP2014225796A (ja) * 2013-05-16 2014-12-04 京セラ株式会社 電子機器、制御方法、及び制御プログラム
JP2014225798A (ja) * 2013-05-16 2014-12-04 京セラ株式会社 電子機器、制御方法、及び制御プログラム

Also Published As

Publication number Publication date
US20100020948A1 (en) 2010-01-28
US7570746B2 (en) 2009-08-04
KR101149135B1 (ko) 2012-05-29
WO2005089485A2 (en) 2005-09-29
CN1934848A (zh) 2007-03-21
US20050207543A1 (en) 2005-09-22
US8345830B2 (en) 2013-01-01
EP1726154A2 (en) 2006-11-29
US8755494B2 (en) 2014-06-17
EP2410722A1 (en) 2012-01-25
EP1726154A4 (en) 2007-08-01
WO2005089485A3 (en) 2005-12-29
KR20070026452A (ko) 2007-03-08
US20130136243A1 (en) 2013-05-30

Similar Documents

Publication Publication Date Title
JP2007529831A (ja) 音声対話型メッセージング方法及び装置
US9214154B2 (en) Personalized text-to-speech services
US7957975B2 (en) Voice controlled wireless communication device system
US6507643B1 (en) Speech recognition system and method for converting voice mail messages to electronic mail messages
US20110172989A1 (en) Intelligent and parsimonious message engine
US20100217591A1 (en) Vowel recognition system and method in speech to text applictions
US20060184369A1 (en) Voice activated instruction manual
US11776541B2 (en) Communicating announcements
US20100178956A1 (en) Method and apparatus for mobile voice recognition training
US20230005480A1 (en) Voice Filtering Other Speakers From Calls And Audio Messages
JP7095684B2 (ja) 情報処理装置、情報処理方法、プログラム
JPH10326176A (ja) 音声対話制御方法
JP2005151553A (ja) ボイス・ポータル
JP2020113150A (ja) 音声翻訳対話システム
KR100380829B1 (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
JP2006113439A (ja) 音声自動応答装置及びプログラム
JPH09258764A (ja) 通信装置および通信方法、並びに情報処理装置
JP2005123869A (ja) 通話内容書き起こしシステムおよび通話内容書き起こし方法
JP2000075891A (ja) 音声認識装置およびそれを用いた携帯電話機

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080603