JP2010505134A - 音声およびテキスト通信システム、方法および装置 - Google Patents

音声およびテキスト通信システム、方法および装置 Download PDF

Info

Publication number
JP2010505134A
JP2010505134A JP2009523030A JP2009523030A JP2010505134A JP 2010505134 A JP2010505134 A JP 2010505134A JP 2009523030 A JP2009523030 A JP 2009523030A JP 2009523030 A JP2009523030 A JP 2009523030A JP 2010505134 A JP2010505134 A JP 2010505134A
Authority
JP
Japan
Prior art keywords
speech
text
operable
mode
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009523030A
Other languages
English (en)
Other versions
JP5149292B2 (ja
Inventor
モロイ、スティーブン
エル−マレー、クハレド・ヘルミ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2010505134A publication Critical patent/JP2010505134A/ja
Application granted granted Critical
Publication of JP5149292B2 publication Critical patent/JP5149292B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Abstract

本開示はスピーチをテキストに変換し、およびその逆を行うためのシステム方法および装置に関する。一つの装置はボコーダ、スピーチをテキストに変換するエンジン、テキストからスピーチへの変換エンジン、およびユーザインタフェースを含む。ボコーダはスピーチ信号をパケットの中に変換するように動作可能である。スピーチ−テキスト変換エンジンは、スピーチをテキストに変換するように動作可能である。テキスト−スピーチ変換エンジンはテキストをスピーチに変換することが可能である。ユーザインタフェースは、複数のモードの中からユーザ選択を受信することが可能である。ここで、第1のモードはスピーチ−テキスト変換エンジンを使用可能にし、第2のモードは、テキスト−スピーチ変換エンジンを使用可能にし、そして第3のモードはスピーチ−テキスト変換エンジンおよびテキスト−スピーチ変換エンジンを使用可能にする。

Description

本開示は通信に関し、より特別には、音声およびテキスト通信システム、方法および装置に関する。
セルラ電話は、マイクロホンおよび/あるいはスピーチシンセサイザ(speech synthesizer)のようなオーディオ捕捉デバイス(audio capture device)、およびオーディオパケットあるいはフレームを発生するためのオーディオエンコーダ等を含むことが可能である。電話はパケットを無線通信チャネルを通してネットワークあるいは他の通信デバイスに送信するために通信プロトコルレイヤおよびモジュールを使用することができる。
一つの観点は、ボコーダ(vocoder)、スピーチ−テキスト変換エンジン(speech to text conversion engine)、テキスト−スピーチ変換エンジン(text to speech conversion engine)そしてユーザインタフェースに関する。ボコーダはスピーチ信号をパケットに変換し、そしてパケットをスピーチ信号に変換するように動作可能である。テキスト−スピーチ変換エンジンはテキストをスピーチに変換するように動作可能である。スピーチ−テキスト変換エンジンはスピーチをテキストに変換するように動作可能である。ユーザインタフェースは複数のモードの中からモードのユーザの選択を受信するように動作可能であり、ここで第1のモードはスピーチ−テキスト変換エンジンとして動作することが可能であり、第2のモードはテキスト−スピーチ変換エンジンとして動作することが可能であり、そして第3のモードはスピーチ−テキスト変換エンジンおよびテキスト−スピーチ変換エンジンとして動作することを可能にする。
他の観点は、スピーチ信号をパケットに変換しそしてパケットをスピーチ信号に変換するように動作が可能なボコーダ、スピーチをテキストに変換するように動作可能なスピーチ−テキスト変換エンジン、複数のモードの中からモードのユーザ選定を受信するように動作可能なユーザインタフェースとを含む装置に関係し、ここで第1のモードはボコーダを使用可能にし、そして第2のモードはスピーチ−テキスト変換エンジンを使用可能にし、そしてトランシーバは符号化されたスピーチパケットおよびテキストパケットを通信ネットワークに無線により送信するように動作可能にする。
他の観点は、パケットをスピーチ信号に変換するように動作可能なボコーダと、スピーチからテキストに変換するように動作可能なスピーチ−テキスト変換エンジンと、第1および第2のモード間で切り換えるように動作可能な選択ユニットとを含むネットワーク装置に関するものであり、ここで第1のモードはボコーダを使用可能にし、第2のモードはボコーダおよびスピーチ−テキスト変換エンジンを使用可能にし、そしてトランシーバが符号化されたスピーチパケットおよびテキストパケットを通信ネットワークに無線により送信するように動作可能にする。
方法に関する他の観点は、符号化されたスピーチパケットを受信し、受信され符号化されたスピーチパケットを受信すること、受信された符号化されたスピーチパケットをスピーチ信号に変換すること、そして複数のモードの中からモードのユーザ選択(user selection)を受信することを含む方法に関連し、ここで、第1のモードはスピーチからテキストへ変換を可能とし、第2のモードはテキストからスピーチへの変換を可能とし、そして第3のモードはスピーチからテキストおよびテキストからスピーチへの変換を可能とする。
一つあるいはそれより多くの実施例の詳細は、組み合わされた図面および以下の記述の中に示される。
図1は、第1の通信デバイス、ネットワーク、および第2の通信デバイスを含むシステムを説明している。 図2は、図1の第2のデバイスを使用している方法を示している。 図3は、図1の第1の通信デバイスの他の構成を示している。 図4は、図1のネットワークの他の構成を示している。
[詳細な記述]
会議、航空機、列車、レストラン、教会あるいは他の場所において、移動デバイス上で呼を受信することは、他に対して混乱を生じさせるかも知れない。もしユーザが移動デバイス上の他のモードを選択し呼を受信し/あるいは呼に応答するために他のモードを選択することが可能であれば、混乱を生じさせる程度は大いに少なくなるであろう。一つのモードにおいて、デバイスは呼を受信し、そして他端における発呼者に対しテキストの入力要求することなしにスピーチ/音声信号(speech/voice signal)をテキストに変換する。
図1は、第1の通信デバイス100、ネットワーク110および第2の通信デバイス120を含むシステムを示す。システムは他の構成要素を含むことができる。システムは移動通信のためのグローバルシステム(GSM)、符号分割多元接続(CDMA)、CDMA2000、CDMA2001 x EV−DO、広帯域CDMA(WCDMA)、直交周波数分割多元接続(OFDMA),ブルートウース、WiFi、Wimax等の無線通信の任意の形式を使用することが可能である。
第1の通信デバイス100は、ボイスコーダ(ボコーダ)(voice coder(vocoder))102およびトランシーバ104を含む。第1の通信デバイス100は図1に示されたコンポーネントに加えてあるいは代りに他のコンポーネントを含むことができる。第1の通信デバイス100は、ランドライン(無線ではない)電話機(landline phone)、無線通信デバイス、パーソナルデジタルアシスタント(PDA;personal digital assistant)、ハンドヘルドデバイス、ラップトップ計算機、デスクトップ計算機、デジタルカメラ、デジタル記録デバイス、地上をもととした無線電話(terrestrial-based radiotelephone)、直接2方向通信デバイス、(時としては、ウォーキートーキー(walkie-talkie)として参照される)カムコーダ(camcorder)、等で表されあるいは実行される。
ボコーダ102はスピーチ信号をパケットに符号化するためのエンコーダおよびパケットをスピーチ信号に復号するためのデコーダを含むことができる。ボコーダ102は、エンハンスド可変レートコーダ(EVRC;enhanced variable rate coder)、アダプティブマルチレート(AMR;Adaptive Multi Rate)、第4世代のボコーダ(4GV;Fourth Generation vocoder)等の任意の形式のボコーダとすることができる。ボコーダは、ともに出願された米国特許6,397,175、6,434,519、6,438,518、6,449,592、6,456,964、6,447,502、6,584,438、6,678,649、6,691,084、6,804,218、6,947,888に記載されており,それらは参照によってこの中に組入れられている、
トランシーバ104は符号化された言語を含むパケットを無線により送信し、そして受信することができる。
ネットワーク110は1個あるいはそれ以上の基地局、基地局コントローラ(BSCs;base station controller)、移動スイッチングセンタ(MSCs;mobile switching center)等を表す。もしも第1のデバイス100がランドライン電話機であれば、そこでネットワーク110は簡素な古い電話サービス(POTS;plain old telephone service)ネットワークにおけるコンポーネントを含むことができる。ネットワーク110は、ボコーダ112およびトランシーバ114を含むことができる。ネットワーク110は、図1に示したコンポーネントに附加されあるいは代りになる他のコンポーネントを含むことができる。
第2の通信デバイス120は、無線通信デバイス、パーソナルデジタルアシスタント(PDA;personal digital assistant)、ハンドヘルドデバイス、ラップトップ計算機、デスクトップ計算機、デジタルカメラ、デジタル記録デバイス、ネットワークイネーブルドデジタルテレビジョン、移動電話、セルラ電話機、衛星電話、カメラ電話、地上をもととした無線電話、直接2方向通信デバイス(時としてウォーキートーキーとして参照される)、カムコーダ等を表わしまたは実行することができる。
第2の通信デバイス120はトランシーバ124、スピーチおよびテキストユニット(speech and text unit)140、スピーカ142、ディスプレー128、ユーザ入力インターフェース、たとえばキーパッド(keypad)、およびマイクロホン146を含む。スピーチおよびテキストユニット140は、ボコーダ122、スピーチ−テキスト変換エンジン126、制御器144、テキスト−スピーチ変換エンジン132、および音声シンセサイザ134を含む。スピーチおよびテキストユニット140は図1に示されたコンポーネントに加えて、あるいは代りに他のコンポーネントを含むことができる。
スピーチおよびテキストユニット140の1個あるいはそれ以上のコンポーネントあるいは機能は、単一のモジュール、ユニット、コンポーネントあるいはソフトウェアに集積することができる。たとえば、スピーチ−テキスト変換エンジン126は、ボコーダ122と結合することができる。テキスト−スピーチ変換エンジン132は、テキストが符号化されたスピーチパケットに変換されるように、ボコーダ122と結合されることが可能である。音声シンセサイザー134はボコーダ122および/またはテキスト−スピーチ変換エンジン132と結合することができる。
スピーチ−テキスト変換エンジン126は、音声/スピーチをテキストに変換することができる。テキスト−スピーチ変換エンジン132は、テキストをスピーチに変換することが可能である。制御器144は、スピーチおよびテキストユニット140内の1個あるいはそれ以上のコンポーネントの動作やパラメータを制御することが可能である。
デバイス120はユーザにとって呼を受信しそして/あるいは呼に応答するため、下表あるいは図2に示されたように、通信のいくつかのモードを与えることができる。
Figure 2010505134
ノーマルモードにおいては(ブロック202および210)、第2のデバイス120のユーザは第1のデバイス100からの呼を受信し、スピーカ142からのスピーチを聞き、そしてマイクロホン146に話す。
図2は図1の第2のデバイス120を使用する方法を示している。第2のデバイス120が第1のデバイス100から呼を受信するときは、第2のデバイスのユーザ120は、ブロック200内のユーザインタフェース130を経由してモードの1個を選択することができる。代りにユーザは第2のデバイス120が他のデバイスから呼を受信する前に、ブロック200内のモード間で切り換えることが可能である。たとえば、もし第2のデバイス120のユーザが、会議、航空機、鉄道、劇場、レストラン、教会または他の場所に入った場合、そこでは到来呼が他に比して混乱するかも知れず、ユーザはノーマルモードから他の3つのモードの1つに切り換えることができる。
第2のモードにおいて(ブロック204および212)、第2のデバイス130のユーザは、イヤピース、ヘッドセット、あるいはヘッドホンを使用する等により第1のデバイス100からのスピーチを聞くことができるが、しかし話はしない。代りに、第2のデバイス130のユーザは、キーパッド130上でタイプすることができるか、あるいはディスプレイ128上の手書きテキスト(handwritten text)に入力するために書き込みペン(writing stylus)を使用することができる。ディスプレイ128またはスピーチ変換エンジン132は、手書きテキストあるいは文字を認識するモジュール有することができる。デバイス120は、(a)第1のデバイス100にテキストを送付しあるいは、(b)テキスト−スピーチ変換エンジン132を用いてテキストをスピーチに変換する。
音声シンセサイザ134は、ユーザの自然の音声に実質的に適合するように個人的スピーチ信号を生成するためにスピーチを合成することができる。音声シンセサイザ134は、ピッチ(pitch)のようなユーザの音声の特性(characteristics)を保存するためにメモリを含むことができる。音声シンセサイザは、共に付与された米国特許6,950,799に記述され、そしてそれは参照によって組込まれる。他の音声シンセサイザは共に付与された米国特許出願11/398.364.に記述されており、そしてそれは参照によって組み込まれる。
ボコーダ122はパケット中にスピーチを符号化する。短い遅延があるかもしれず、あるいはないかもしれない。一つの構成において、短時間の遅延以外は、第2のデバイス120との通信は、第1のデバイス100のユーザにとってシームレス(seamless)に見えるかも知れない。もしも第2のデバイス120のユーザは会議に参加していれば、会話はシームレスではなくよりメッセージベースであるかもしれない。
第3および第4のモードにおいて(ブロック206、208、214、および216)、デバイス120は呼を受信し、そしてスピーチ−テキスト変換エンジン126は、ディスプレー128上へのディスプレーのために、スピーチ/音声信号をテキストに変換する。一つの構成において、第3および第4のモードは、第1のデバイス100のユーザが会話を継続しそして第1のデバイス100のユーザがテキスト入力モードに切換えることを要求しないことを可能にすることができる。スピーチ−テキスト変換エンジン126は、ワードとサウンド(word and sound)を認識するため、これらをテキストに変換するための音声認識モジュールを含むことができる。
第3のモードにおいては、デバイス120はユーザがマイクロホン146に話すことを可能にし、そしてそれはスピーチをパケットに符号化するためボコーダ122に通す。
第4のモードにおいては、第2のデバイス130のユーザはキーパッド130の上でタイプすることが可能であり、あるいは、ディスプレー128上で手書きのテキストを入力するために書き込みペン(writing stylus)を使用することができる。デバイス120は、(a)テキストを第1のデバイス100に送信すること、あるいは(b)テキスト−スピーチ変換エンジン132を用いてテキストからスピーチへ変換することができる。音声シンセサイザ134は、実質的にユーザの自然な音声に適合するように、個人化されたスピーチ信号を生成するためにスピーチを合成することができる。ボコーダ122は、スピーチをパケット内に符号化する。
第2および第4のモードにおいて、第2のデバイス120がテキストをスピーチに変更しそしてスピーチを合成するようにセットされている場合、第2のデバイス120が第1のデバイス100から呼を受入れる時と、そして第1のデバイス100がスピーチパケットを受信するときとの間には遅延時間が存在する。第2のデバイス120は、第1のデバイス100に、第2のデバイス120のユーザがミーティング中でありそしてスピーチ変換に対するテキストを使用して応答するであろうことを報告するために、ユーザによって予め記録されたメッセージをプレイするように形成されることが可能である。
第2および第4のモードは、バックグランド雑音のないスピーチを送信すること、エコーキャンセレーションの必要がないかあるいは少ない、雑音圧縮の必要性が無いか少ない、より速い符号化、より少ない処理等の、1個あるいはそれ以上の利点を与えることが可能である。
図1は、変更(新しい機能および/あるいはエレメント)が、第2の通信デバイス120のみの、どこで実行され得るかの例を示す。通信の新しいモード(第2、3、および第4のモード)を実現するために、第2の通信デバイス120はボコーダ122、スピーチからテキストへのエンジン126、テキストからスピーチへのエンジン132等を有する。このデバイス120を用いて、システムは新しいモードを、ネットワーク110および従来の電話100(ランドライン、移動電話等)において、いかなる変更もなしにサポートすることが可能である。デバイス120は、ユーザによって選択されたモードに関係なく音声パケットを受信しS9おして送信することができる。
図3は、図1の第1の通信デバイス100の他の配列100Aを示す。図3において、第1の通信デバイス100Aはスピーチ−テキスト変換エンジン300、エンコーダ302、トランシーバ104、デコーダ304、およびユーザインタフェース330を含む。スピーチ−テキスト変換エンジン300は、音声/スピーチから、トランシーバ104によってネットワーク110に送信されるべきテキストに変換することができる。図3の第1の通信デバイス100Aは、第2のデバイス120が、スピーチ−テキスト変換エンジン126なしにデザインされることを可能にする。図3における第1の通信デバイス100Aはスピーチの代りにテキストをネットワーク110に送ることによって帯域幅を節減することが可能である。ユーザインタフェース330は複数のユーザモードの中からモードのユーザ選択を受信するように動作可能であり、ここで第1のモードはボコーダ302、304を動作可能にし、そして第2のモードはスピーチ−テキスト変換エンジン300を動作可能にする。
図4は図1のネットワーク110の他の構成110Aを示す。図4において、ネットワーク110Aは音声コーダ/デコーダ400、トランシーバ114およびスピーチ−テキスト変換エンジン402を含む。他の構成において、ネットワーク110Aはさらにテキスト−スピーチ変換エンジン404、ボイスシンセサイザ402および制御器444を含むことができる。ボコーダ400は、スピーチ信号を与えるためにスピーチパケットを復号する。スピーチ−テキスト変換エンジン402は、トランシーバ114によって第2のデバイス120に送信されるべき音声/スピーチをテキストに変換することが可能である。図4のネットワーク110Aは、第2のデバイス120がスピーチ−テキスト変換エンジン126なしに設計されることを可能にし、あるいはスピーチ−テキスト変換エンジン126が非活性にされることを可能にする。図4のネットワーク110Aはスピーチの代りに第2のデバイス120にテキストを送ることによって帯域幅を節減することが可能である。
図4におけるネットワーク110Aは、受信デバイス120の形状(configuration)、状態(situation)および優先性(preference)に関する知識を取得することができる。もしもネットワーク110Aが、受信デバイス120が音声パケットを受信することから利益を受けないであろうことを認識するならば、(たとえば、ユーザの呼の優先性または位置を検出し、例えば、過度に雑音の多い環境、および受信されたスピーチを聞くに困難であること)そこでネットワーク110Aは、音声パケットをテキストパケットに変更するであろう。たとえ、受信デバイス120が音声パケットをテキストパケットに変更する能力を有しているとしても(音声からテキストへのエンジン126を使用して)、このことは、もしもユーザがテキスト受信モード(ミーティング、あるいは一般的に無音の通信)にある場合は、帯域幅の損失およびこの変換をするために(音声からテキストへ)デバイス電力の損失がある。
このようにして図4におけるネットワーク110Aは、変化(新しい特性および/あるいはエレメント)がネットワーク110Aの中でのみ実行されるシステム、すなわち通信デバイスあるいは組立部品においては変化しない、においてに使用されるかもしれない。移動ハンドセットがスピーチ−テキスト変換ユニットを有していない場合、ネットワーク110Aは、音声パケットをテキストに変換しそして反対について注意を払うことができ、あるいは移動ハンドセットがスピーチ−テキスト変換ユニットを有している場合、ハンドセットは変換することを委託しないか、あるいは計算機処理上のリソース、電池の電力等の不足のため変換を行なうことができない。
例えば、図1における第1のデバイス100が音声パケットを送信しあるいは受信する(すなわち第1のモード)ことが可能であり、他方第2のデバイス120はテキスト(すなわち第4モード)を送信する。第2のデバイス120はユニット140を有することができない(あるいは、ボコーダ122のみを有する)か、あるいは不活性にされているユニット140を有する。第2のデバイス120が第4のモードで動作することを可能にするために、図4におけるネットワーク110Aは、第2のデバイス120に送信するために(スピーチ−テキストエンジン402を使用して)第1デバイスの音声パケットをテキストパケットに変更し、そして第1のデバイス100に送信するため(テキスト−スピーチエンジン404を使用して)第2のデバイス120からのテキストパケットを音声パケットに変換するであろう。
第2のデバイス120がユニット140を有していない場合、第2のデバイス120は必要とするモードをネットワーク110Aに信号により伝え(例えば帯域内で)、そしてその結果ネットワーク110Aにスピーチおよびテキストの間を変換すること、すなわちユニット140の機能を実行することを求める。
個性化されたスピーチの合成(personalized speech synthesis)はネットワーク110A内で行うことができる。上に記述されたように、図1におけるユニット140は、テキスト−スピーチエンジン132の出力を個性化されたスピーチ(ユーザの音声)に変換するための音声シンセサイザ134を有する。図4のネットワーク110Aを有するシステムにおいて、第2のデバイス120のユーザの声紋(voice signature)を運ぶ音声パケットを生成するため、第2のデバイス120は(第2あるいは第4のモードを使用する初めに) ネットワーク110Aに対しユーザのスペクトルパラメータおよびピッチ情報(pitch information)を有する記憶された音声パケットを送信することができる。これらのごく少数の送信された音声パケット(テキストパケットに先立つ)は個性化された音声パケットを生成するためにネットワーク110Aにより使用されることができる。
第2のデバイス120からネットワーク110Aに対する第2あるいは第4のモードに関する送信パケットの例が記述される。第2のデバイス120は、ネットワーク110Aに対し、これらの「テキストモード」(第2あるいは第4のモード)を使用するに先立って、ユーザが予め記憶した音声パケット(Nパケット)に加え動作モード(1,2,3あるいは4;変換を行うことの要求)を送信する。第2のデバイス120は続いてテキストパケットを送信するであろう。
2つの構成の組み合わせ(図1および図4)がまた可能である。これらのモードの1つを使用する場合、変換を行なう、またはネットワーク110Aにさせる、または受信デバイス100Aが変換をおこなう、受信デバイス120の能力を判定した後(すなわち信号送信により要求を受信する)、ネットワーク110Aはテキスト/スピーチ変換を動作可能にする。
上に記述した1個あるいはそれ以上のコンポーネントおよび特性は、プッシュツートーク(PTT;push to talk)あるいはプッシュツーリード(push to read)通信デバイスによって実行されるであろう。PTTデバイスはユーザがデバイス上のプッシュボタンを押しそして通話することを可能にし、一方デバイスはスピーチをテキストに変換し、そしてテキストパケットをネットワークにまたは直接に他の通信デバイスに送信する。PTT通信は、標準の音声呼のように、連続というよりは「メッセージに基づく”message based”」ものである。ユーザがデバイス上のPTTボタンを押し下げている期間は、続いてテキストその他に変換されるメッセージをうまく組立てることができる。
デバイス120は、インストラクションおよびデータを保存するために、専用化されたハードウェア、ソホトウェア、ファームウェアあるいはそれらの組み合わせと同様に、専用のメモリを有することができる。ソフトウェア内で実行される場合は、この技術は、ランダムアクセスメモリ(RAM)、読出専用メモリ(ROM)、非揮発性ランダムメモリ(NVRAM)、電気的に消去可能なプログラマブル読出専用メモリ(EPROM)、フラッシュメモリ、または同様の、計算機により読出可能な媒体上の命令として具体化することができる。この命令は1個あるいはそれ以上の処理装置に、この開示の中に記述された機能における特定の側面を実行させるようにする。
この開示のなかに記述された技術は、汎用マイクロ処理装置、デジタル信号処理装置(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FMGA)あるいはその他の等価的論理デバイスの中で実行されることが可能である。たとえば、スピーチおよびテキストユニット140および組み合わされたコンポーネントおよびモジュールは、デジタルシグナルプロセッサ(DSP)または他の処理デバイス上で動作することによってエンコーディングプロセス(encoding process)またはコーディング/デコーディング(coding/decoding)プロセスに関する部品として実行することが可能である。したがって、モジュールとして記述されたコンポーネントは、このようなプロセスまたは分離されたプロセスのプロブラマブル特性を形成することができる。
スピーチおよびテキストユニット140は、専用化されたハードウェア、ソフトウェア、ファームウェアあるいはそれらの組み合わせと同様に、インストラクションおよびデータを保存するための専用化されたメモリを有することができる。ソフトウェアによって実行された場合は、この技術は1個あるいはそれ以上のプロセッサによって実行可能な命令として具体化されるであろう。命令は、ランダムアクセスメモリ(RAM)、呼び出し専用メモリ(ROM)非揮発性ランダムアクセスメモリ(NVRAM)、電気的に読出可能なプログラマブル読出専用メモリ(EEPROM)、フラッシュメモリ、磁気的あるいは光学的データ保存デバイス、または同様のもののような計算機によって読出可能な媒体上に保存されることができる。命令は、1個あるいはそれ以上の処理装置にこの開示の中に記述された特定の側面を実行させるようにする。
種々の実施例について記述した。これらおよび他の実施例はつぎの請求項の範囲内にある。

Claims (21)

  1. 装置であって、
    スピーチ信号をパケットへ変換し、そしてパケットをスピーチ信号へ変換するように動作することが可能なボコーダと、
    スピーチをテキストに変換するように動作可能なスーピーチ−テキスト変換エンジンと、
    テキストからスピーチに変換するように動作可能なテキスト−スピーチ変換エンジンと、そして
    複数のモードの中からモードのユーザ選択を受信するように動作可能なユーザインタフェースとを含み、なお、第1のモードがスピーチ−テキスト変換エンジンを使用可能にし、第2のモードがテキスト−スピーチ変換エンジンを使用可能にし、そして第3のモードがスピーチ−テキスト変換エンジンおよびテキスト−スピーチ変換エンジンを使用可能にする、
    装置。
  2. 該スピーチ−テキスト変換エンジンからのテキストを表示するディスプレーをさらに含む請求項1記載の装置。
  3. ユーザからの入力テキストを受信するためのキーパッドを含む請求項1記載の装置。
  4. 該ユーザインタフェースは、該装置が他の装置から呼を受信する前に、モードのユーザ選択を受信するように動作可能である請求項1記載の装置。
  5. 該ユーザインタフェースは、該装置が他の装置からの呼を受信した後に、モードのユーザ選択を受信するように動作可能である請求項1記載の装置。
  6. ユーザの音声を合成するための音声シンセサイザを含む請求項1記載の装置。
  7. 無線により送信された符号化されたスピーチパケットおよびテキストパケットを、通信ネットワークに無線により送信するように動作可能であるトランシーバをさらに含む請求項1記載の装置。
  8. 装置であって、
    スピーチ信号をパケットに変換し、そしてパケットをスピーチ信号に変換するように動作可能なボコーダと、
    スピーチをテキストに変換するように動作可能なスピーチ−テキスト変換エンジンと、
    複数のモードの中からモードのユーザ選択を受信するように動作可能なユーザインタフェースとを含み、なお、第1のモードはボコーダを使用可能にし、そして第2のモードは該スピーチ−テキスト変換エンジンを使用可能にし、そして
    符号化されたスピーチパケットおよびテキストパケットを通信ネットワークへ無線により送信するように動作可能なトランシーバと
    を含む装置。
  9. 該スピーチ−テキスト変換エンジンからのテキストを表示するためのディスプレーをさらに含む請求項8記載の装置。
  10. ユーザからの入力テキストを受信するためのキーパッドをさらに含む請求項8記載の装置。
  11. 該ユーザインタフェースは該装置が他の装置からの呼を受信する前にモードのユーザ選択を受信するように動作可能である請求項8記載の装置。
  12. 該ユーザインタフェースは該装置が他の装置から呼を受信した後にモードのユーザ選択を受信するように動作可能である請求項8記載の装置。
  13. ネットワーク装置であって、
    パケットをスピーチ信号に変換するように動作可能なボコーダと、
    スピーチをテキストに変換するように動作可能なスピーチ−テキスト変換エンジンと、
    第1と第2のモード間で切り換えるように動作可能な選択ユニットと、なお該第1のモードはボコーダを使用可能にし、そして第2のモードは該ボコーダおよび該スピーチ−テキスト変換エンジンを使用可能にし、そして、
    符号化されたスピーチパケットおよびテキストパケットを通信ネットワークに無線により送信するように動作可能なトランシーバとを
    含むネットワーク装置。
  14. テキストからスピーチへ変換するように動作可能なテキスト−スピーチ変換エンジンをさらに含み、なお該選択ユニットは該ボコーダおよび両方の変換エンジンが使用可能にされる第3のモードに切り換えるように動作可能である請求項13記載のネットワーク装置。
  15. スピーチへ変換されたテキストからユーザの音声を合成するように動作可能な音声シンセサイザをさらに含む請求項14記載のネットワーク装置。
  16. 該音声シンセサイザはユーザの音声の音声特性を受信しそして保存するように動作可能である請求項15記載のネットワーク装置。
  17. スピーチからテキストに変換するために通信デバイスからの要求を受信するように動作可能である制御器をさらに含む請求項13記載のネットワーク装置。
  18. テキストからスピーチに変換のために通信デバイスからの要求を受信するように動作可能である制御器をさらに含む請求項13記載のネットワーク装置。
  19. 方法であって、
    符号化されたスピーチパケットを受信し、
    該受信された符号化されたスピーチパケットをスピーチ信号に変換し、そして
    複数のモードの中からユーザのモード選択を受信することを含み、なお第1のモードはスピーチからテキストへの変換を使用可能にし、第2のモードはテキストからスピーチへの変換を使用可能にし、そして第3のモードはスピーチからテキストへの、そしてテキストからスピーチへの変換を可能にする方法。
  20. 到来する呼を受信する前に、モードに対するユーザ選択を受信することをさらに含む請求項19記載の方法。
  21. 到来する呼を受信した後に、モードに対するユーザ選択を受信することをさらに含む請求項19記載の方法。
JP2009523030A 2006-07-31 2007-07-31 音声およびテキスト通信システム、方法および装置 Expired - Fee Related JP5149292B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/497,011 2006-07-31
US11/497,011 US20100030557A1 (en) 2006-07-31 2006-07-31 Voice and text communication system, method and apparatus
PCT/US2007/074902 WO2008016949A2 (en) 2006-07-31 2007-07-31 Voice and text communication system, method and apparatus

Publications (2)

Publication Number Publication Date
JP2010505134A true JP2010505134A (ja) 2010-02-18
JP5149292B2 JP5149292B2 (ja) 2013-02-20

Family

ID=38871584

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009523030A Expired - Fee Related JP5149292B2 (ja) 2006-07-31 2007-07-31 音声およびテキスト通信システム、方法および装置

Country Status (6)

Country Link
US (2) US20100030557A1 (ja)
EP (1) EP2047459A2 (ja)
JP (1) JP5149292B2 (ja)
KR (1) KR101136769B1 (ja)
CN (1) CN101496096B (ja)
WO (1) WO2008016949A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017538327A (ja) * 2014-10-23 2017-12-21 ゼットティーイー コーポレーションZte Corporation 通話処理方法及び装置

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7127271B1 (en) 2001-10-18 2006-10-24 Iwao Fujisaki Communication device
US7107081B1 (en) 2001-10-18 2006-09-12 Iwao Fujisaki Communication device
US7466992B1 (en) 2001-10-18 2008-12-16 Iwao Fujisaki Communication device
US8229512B1 (en) 2003-02-08 2012-07-24 Iwao Fujisaki Communication device
US8241128B1 (en) 2003-04-03 2012-08-14 Iwao Fujisaki Communication device
US8090402B1 (en) 2003-09-26 2012-01-03 Iwao Fujisaki Communication device
US8121635B1 (en) 2003-11-22 2012-02-21 Iwao Fujisaki Communication device
US8041348B1 (en) 2004-03-23 2011-10-18 Iwao Fujisaki Communication device
US8208954B1 (en) 2005-04-08 2012-06-26 Iwao Fujisaki Communication device
US20100030557A1 (en) 2006-07-31 2010-02-04 Stephen Molloy Voice and text communication system, method and apparatus
US8559983B1 (en) 2007-05-03 2013-10-15 Iwao Fujisaki Communication device
US7890089B1 (en) 2007-05-03 2011-02-15 Iwao Fujisaki Communication device
US8676273B1 (en) 2007-08-24 2014-03-18 Iwao Fujisaki Communication device
US8639214B1 (en) 2007-10-26 2014-01-28 Iwao Fujisaki Communication device
US8472935B1 (en) 2007-10-29 2013-06-25 Iwao Fujisaki Communication device
US8744720B1 (en) 2007-12-27 2014-06-03 Iwao Fujisaki Inter-vehicle middle point maintaining implementer
CN101237489A (zh) * 2008-03-05 2008-08-06 北京邮电大学 基于语音通信内容的处理方法和装置
US8856003B2 (en) * 2008-04-30 2014-10-07 Motorola Solutions, Inc. Method for dual channel monitoring on a radio device
US8543157B1 (en) 2008-05-09 2013-09-24 Iwao Fujisaki Communication device which notifies its pin-point location or geographic area in accordance with user selection
US8312660B1 (en) 2008-05-09 2012-11-20 Iwao Fujisaki Firearm
US8340726B1 (en) 2008-06-30 2012-12-25 Iwao Fujisaki Communication device
US8452307B1 (en) 2008-07-02 2013-05-28 Iwao Fujisaki Communication device
US20110007732A1 (en) * 2009-07-08 2011-01-13 John Ward Unified Communication System
US8611876B2 (en) * 2009-10-15 2013-12-17 Larry Miller Configurable phone with interactive voice response engine
KR20110051385A (ko) * 2009-11-10 2011-05-18 삼성전자주식회사 통신 단말기 및 그의 통신 방법
US9106672B2 (en) * 2009-12-31 2015-08-11 Nokia Technologies Oy Method and apparatus for performing multiple forms of communications in one session
CN102984672A (zh) * 2011-09-07 2013-03-20 比亚迪股份有限公司 移动终端及其通信方法
US9699632B2 (en) 2011-09-28 2017-07-04 Elwha Llc Multi-modality communication with interceptive conversion
US9477943B2 (en) 2011-09-28 2016-10-25 Elwha Llc Multi-modality communication
US9002937B2 (en) 2011-09-28 2015-04-07 Elwha Llc Multi-party multi-modality communication
US9906927B2 (en) 2011-09-28 2018-02-27 Elwha Llc Multi-modality communication initiation
US9762524B2 (en) 2011-09-28 2017-09-12 Elwha Llc Multi-modality communication participation
US9503550B2 (en) * 2011-09-28 2016-11-22 Elwha Llc Multi-modality communication modification
US9788349B2 (en) 2011-09-28 2017-10-10 Elwha Llc Multi-modality communication auto-activation
CN103108092A (zh) * 2011-11-15 2013-05-15 希姆通信息技术(上海)有限公司 通信终端以及通信终端之间的信息传送方法
US8423366B1 (en) * 2012-07-18 2013-04-16 Google Inc. Automatically training speech synthesizers
US10129340B2 (en) 2012-08-07 2018-11-13 Nokia Technologies Oy Method and apparatus for performing multiple forms of communications in one session
KR101398806B1 (ko) * 2012-11-21 2014-05-27 오준수 모바일 단말기 간의 p2p 통신방법 및 그 기록매체
CN103973542B (zh) * 2013-02-01 2017-06-13 腾讯科技(深圳)有限公司 一种语音信息处理方法及装置
US9767802B2 (en) * 2013-08-29 2017-09-19 Vonage Business Inc. Methods and apparatus for conducting internet protocol telephony communications
CA2934298C (en) * 2014-01-14 2023-03-07 Interactive Intelligence Group, Inc. System and method for synthesis of speech from provided text
US20150220512A1 (en) * 2014-02-05 2015-08-06 Marco Álvarez Heinemeyer Language interface system, method and computer readable medium
WO2015178715A1 (en) 2014-05-23 2015-11-26 Samsung Electronics Co., Ltd. System and method of providing voice-message call service
KR102225401B1 (ko) * 2014-05-23 2021-03-09 삼성전자주식회사 음성 문자 통화 서비스를 제공하는 시스템 및 방법
CN104123932B (zh) * 2014-07-29 2017-11-07 科大讯飞股份有限公司 一种语音转换系统及方法
US9558747B2 (en) * 2014-12-10 2017-01-31 Honeywell International Inc. High intelligibility voice announcement system
EP3107090B1 (en) * 2015-06-18 2023-01-11 Airbus Operations GmbH Announcement signalling on board an aircraft
US9491270B1 (en) * 2015-11-13 2016-11-08 Motorola Solutions, Inc. Method and apparatus for muting an audio output interface of a portable communications device
US11449868B2 (en) 2016-10-03 2022-09-20 Paypal, Inc. Voice activated remittances
US20180096334A1 (en) * 2016-10-03 2018-04-05 Paypal, Inc. Voice activated remittances
WO2018117565A1 (en) 2016-12-19 2018-06-28 Samsung Electronics Co., Ltd. Methods and apparatus for managing control data
CN109600307A (zh) * 2019-01-29 2019-04-09 北京百度网讯科技有限公司 即时通讯方法、终端、设备、计算机可读介质
US11468896B2 (en) * 2019-06-12 2022-10-11 Nvoq Incorporated Systems, methods, and apparatus for real-time dictation and transcription with multiple remote endpoints
CN112967719A (zh) * 2019-12-12 2021-06-15 上海棋语智能科技有限公司 一种标准电台手咪的电脑端接入设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6173250B1 (en) * 1998-06-03 2001-01-09 At&T Corporation Apparatus and method for speech-text-transmit communication over data networks
EP1511286A1 (en) * 2003-08-28 2005-03-02 Alcatel Multimode voice/screen simultaneous communication device
US20050058075A1 (en) * 2003-09-12 2005-03-17 Gorday Robert M. Apparatus and method for mixed-media call formatting
WO2005109661A1 (en) * 2004-05-10 2005-11-17 Sk Telecom Co., Ltd. Mobile communication terminal for transferring and receiving of voice message and method for transferring and receiving of voice message using the same

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0776240B2 (ja) * 1983-05-06 1995-08-16 ベロス グル−プ エンドトキシンコア−と反応性のモノクロ−ナル抗体
US5917405A (en) * 1993-06-08 1999-06-29 Joao; Raymond Anthony Control apparatus and methods for vehicles
US5881142A (en) * 1995-07-18 1999-03-09 Jetstream Communications, Inc. Integrated communications control device for a small office configured for coupling within a scalable network
JP3102335B2 (ja) * 1996-01-18 2000-10-23 ヤマハ株式会社 フォルマント変換装置およびカラオケ装置
JP3781213B2 (ja) * 1996-06-20 2006-05-31 ソニー株式会社 電子メールシステム、コンピユータ装置及び着信通知方法
GB2323246B (en) * 1997-03-15 2002-03-20 Ibm Internet telephony signal conversion
US5786768A (en) * 1997-04-16 1998-07-28 Patrick Plastics Inc. Clock radio gas detector apparatus and method for alerting residents to hazardous gas concentrations
US6178170B1 (en) * 1997-05-13 2001-01-23 Sprint Communications Company, L. P. System and method for transporting a call
US5983190A (en) * 1997-05-19 1999-11-09 Microsoft Corporation Client server animation system for managing interactive user interface characters
US6366651B1 (en) * 1998-01-21 2002-04-02 Avaya Technology Corp. Communication device having capability to convert between voice and text message
US6094681A (en) * 1998-03-31 2000-07-25 Siemens Information And Communication Networks, Inc. Apparatus and method for automated event notification
US7009990B1 (en) * 1998-04-23 2006-03-07 Nortel Networks Limited Methods and systems for a telephone e-mail interface
JP2000023253A (ja) * 1998-06-26 2000-01-21 Nec Corp マルチモード移動無線装置及びマルチモード無線装置、並びにマルチモード移動無線装置及びマルチモード無線装置における着信通知方法
IL142363A0 (en) 1998-10-02 2002-03-10 Ibm System and method for providing network coordinated conversational services
JP3842913B2 (ja) * 1998-12-18 2006-11-08 富士通株式会社 文字通信方法及び文字通信システム
US6456964B2 (en) * 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms
WO2000058949A1 (en) * 1999-03-25 2000-10-05 Kent Ridge Digital Labs Low data transmission rate and intelligible speech communication
US6836761B1 (en) * 1999-10-21 2004-12-28 Yamaha Corporation Voice converter for assimilation by frame synthesis with temporal alignment
US6745024B1 (en) * 2000-01-10 2004-06-01 Qualcomm Incorporated System and method for preparing and sending an electronic mail communication using a wireless communications device
JP3322262B2 (ja) * 2000-12-22 2002-09-09 日本電気株式会社 無線携帯端末通信システム
US6775360B2 (en) * 2000-12-28 2004-08-10 Intel Corporation Method and system for providing textual content along with voice messages
US6845359B2 (en) * 2001-03-22 2005-01-18 Motorola, Inc. FFT based sine wave synthesis method for parametric vocoders
US7406421B2 (en) * 2001-10-26 2008-07-29 Intellisist Inc. Systems and methods for reviewing informational content in a vehicle
JP2002334086A (ja) * 2001-05-10 2002-11-22 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP2002333895A (ja) * 2001-05-10 2002-11-22 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びにプログラム
KR20020091920A (ko) * 2001-06-01 2002-12-11 엘지전자 주식회사 이동통신 단말기에서의 음성 및 문자 통화 장치
US7251252B2 (en) * 2001-06-13 2007-07-31 Qwest Communications International Inc. Negotiated cell delivery capability
US7668718B2 (en) * 2001-07-17 2010-02-23 Custom Speech Usa, Inc. Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile
US7085259B2 (en) * 2001-07-31 2006-08-01 Comverse, Inc. Animated audio messaging
US7233655B2 (en) * 2001-10-03 2007-06-19 Accenture Global Services Gmbh Multi-modal callback
JP3733322B2 (ja) * 2001-11-21 2006-01-11 キヤノン株式会社 マルチモーダル文書受信装置及びマルチモーダル文書送信装置、マルチモーダル文書送受信システム及びそれらの制御方法、プログラム
US7483832B2 (en) 2001-12-10 2009-01-27 At&T Intellectual Property I, L.P. Method and system for customizing voice translation of text to speech
US6950799B2 (en) * 2002-02-19 2005-09-27 Qualcomm Inc. Speech converter utilizing preprogrammed voice profiles
JP2003289380A (ja) * 2002-03-28 2003-10-10 Nec Corp 音声符号化方式の変更方法、通信システム、通信網および通信端末
US7136811B2 (en) * 2002-04-24 2006-11-14 Motorola, Inc. Low bandwidth speech communication using default and personal phoneme tables
JP2004020613A (ja) * 2002-06-12 2004-01-22 Canon Inc サーバ、受信端末
US20040098266A1 (en) 2002-11-14 2004-05-20 International Business Machines Corporation Personal speech font
US7227847B2 (en) * 2004-03-11 2007-06-05 Ixi Mobile (R&D) Ltd. Power management system and method for a wireless communications device
US20050266829A1 (en) * 2004-04-16 2005-12-01 Lg Elcectronics, Inc. Speech-to-text messaging system and method
KR100617826B1 (ko) * 2004-05-11 2006-08-28 삼성전자주식회사 음성메시지를 문자메시지로 변환하는 이동단말기 및 방법
DE102004041330B3 (de) * 2004-08-26 2006-03-16 Infineon Technologies Ag Speicherschaltung mit ein Widerstandsspeicherelement aufweisenden Speicherzellen
US20060136226A1 (en) * 2004-10-06 2006-06-22 Ossama Emam System and method for creating artificial TV news programs
JP4025355B2 (ja) 2004-10-13 2007-12-19 松下電器産業株式会社 音声合成装置及び音声合成方法
US7693719B2 (en) * 2004-10-29 2010-04-06 Microsoft Corporation Providing personalized voice font for text-to-speech applications
US7333014B2 (en) * 2004-11-04 2008-02-19 International Business Machines Corporation Notifying users of device events in a networked environment
US7296740B2 (en) * 2004-11-04 2007-11-20 International Business Machines Corporation Routing telecommunications to a user in dependence upon location
US7324476B2 (en) * 2004-11-04 2008-01-29 International Business Machines Corporation Establishing user accounts for RFID-based telecommunications routing
US20060122840A1 (en) * 2004-12-07 2006-06-08 David Anderson Tailoring communication from interactive speech enabled and multimodal services
EP1694044B1 (en) * 2005-02-17 2008-06-04 Sony Ericsson Mobile Communications AB Method and communication system for transferring messages containing audio and/or voice information
US7917178B2 (en) * 2005-03-22 2011-03-29 Sony Ericsson Mobile Communications Ab Wireless communications device with voice-to-text conversion
US7394405B2 (en) * 2005-06-01 2008-07-01 Gm Global Technology Operations, Inc. Location-based notifications
US20070036086A1 (en) * 2005-08-09 2007-02-15 Sbc Knowledge Ventures, L.P. System and method of providing communications based on a predetermined device status
US7792253B2 (en) * 2005-10-27 2010-09-07 International Business Machines Corporation Communications involving devices having different communication modes
US7830408B2 (en) * 2005-12-21 2010-11-09 Cisco Technology, Inc. Conference captioning
US20100030557A1 (en) 2006-07-31 2010-02-04 Stephen Molloy Voice and text communication system, method and apparatus
EP2119205A2 (en) * 2007-01-09 2009-11-18 Spinvox Limited Detection of unanswered call in order to give calling party the option to alternatively dictate a text message for delivery to the called party
US8914290B2 (en) * 2011-05-20 2014-12-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6173250B1 (en) * 1998-06-03 2001-01-09 At&T Corporation Apparatus and method for speech-text-transmit communication over data networks
EP1511286A1 (en) * 2003-08-28 2005-03-02 Alcatel Multimode voice/screen simultaneous communication device
US20050058075A1 (en) * 2003-09-12 2005-03-17 Gorday Robert M. Apparatus and method for mixed-media call formatting
JP2007505564A (ja) * 2003-09-12 2007-03-08 モトローラ・インコーポレイテッド ミクストメディア通話フォーマッティングのための装置及び方法
WO2005109661A1 (en) * 2004-05-10 2005-11-17 Sk Telecom Co., Ltd. Mobile communication terminal for transferring and receiving of voice message and method for transferring and receiving of voice message using the same

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017538327A (ja) * 2014-10-23 2017-12-21 ゼットティーイー コーポレーションZte Corporation 通話処理方法及び装置

Also Published As

Publication number Publication date
WO2008016949A3 (en) 2008-03-20
US9940923B2 (en) 2018-04-10
JP5149292B2 (ja) 2013-02-20
CN101496096A (zh) 2009-07-29
US20160111082A1 (en) 2016-04-21
KR20090036141A (ko) 2009-04-13
KR101136769B1 (ko) 2012-04-19
EP2047459A2 (en) 2009-04-15
WO2008016949A2 (en) 2008-02-07
CN101496096B (zh) 2012-11-07
US20100030557A1 (en) 2010-02-04

Similar Documents

Publication Publication Date Title
JP5149292B2 (ja) 音声およびテキスト通信システム、方法および装置
EP3090531B1 (en) Smart bluetooth headset for speech command
US7792675B2 (en) System and method for automatic merging of multiple time-stamped transcriptions
US20040267527A1 (en) Voice-to-text reduction for real time IM/chat/SMS
CN101510917B (zh) 一种移动终端无声通话的方法
JP2013519334A (ja) 音声テキスト変換機能を備えた同時電話会議
CN110663244B (zh) 一种通信系统和便携通信终端
GB2503922A (en) A transcription device configured to convert speech into text data in response to a transcription request from a receiving party
CN102131305A (zh) 一种语音业务的实现方法和系统
CN100454937C (zh) 移动通信终端的通话录音方法
KR20100094529A (ko) 신호음 데이터와 오디오를 믹싱하기 위한 시스템 및 방법
KR101367722B1 (ko) 휴대단말기의 통화 서비스 방법
JP2007235810A (ja) 携帯電話システムおよび携帯電話装置
US20110235632A1 (en) Method And Apparatus For Performing High-Quality Speech Communication Across Voice Over Internet Protocol (VoIP) Communications Networks
JP2001272998A (ja) 通信方法とワイヤレス呼接続装置
JP3165585U (ja) 音声合成装置
JP4655008B2 (ja) 携帯端末装置による録音通知方法及び携帯端末装置及び通信システム
CN111385780A (zh) 一种蓝牙音频信号传输方法和装置
JP2006014216A (ja) 通信端末及び辞書作成方法
JP2005222410A (ja) 車載用ハンドフリーメール装置
JP5177476B2 (ja) 無線通信端末、無線通信システム及び無線通信プログラム
WO2019119406A1 (zh) 一种缩短呼叫建立时间的方法、装置及对讲机
TW201027972A (en) A real-time select text input and voice auxiliary response method for applying in mobile communication device
JP2004343443A (ja) 携帯通信装置、通信方法
JP2008005028A (ja) 映像音声会議システムおよび端末装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111031

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111108

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111202

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111209

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120104

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120417

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120713

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120723

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120918

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120925

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121002

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121129

R150 Certificate of patent or registration of utility model

Ref document number: 5149292

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151207

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees