JP5149292B2 - 音声およびテキスト通信システム、方法および装置 - Google Patents

音声およびテキスト通信システム、方法および装置 Download PDF

Info

Publication number
JP5149292B2
JP5149292B2 JP2009523030A JP2009523030A JP5149292B2 JP 5149292 B2 JP5149292 B2 JP 5149292B2 JP 2009523030 A JP2009523030 A JP 2009523030A JP 2009523030 A JP2009523030 A JP 2009523030A JP 5149292 B2 JP5149292 B2 JP 5149292B2
Authority
JP
Japan
Prior art keywords
speech
text
mode
user
packets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009523030A
Other languages
English (en)
Other versions
JP2010505134A (ja
Inventor
モロイ、スティーブン
エル−マレー、クハレド・ヘルミ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2010505134A publication Critical patent/JP2010505134A/ja
Application granted granted Critical
Publication of JP5149292B2 publication Critical patent/JP5149292B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Description

本開示は通信に関し、より特別には、音声およびテキスト通信システム、方法および装置に関する。
セルラ電話は、マイクロホンおよび/あるいはスピーチシンセサイザ(speech synthesizer)のようなオーディオ捕捉デバイス(audio capture device)、およびオーディオパケットあるいはフレームを発生するためのオーディオエンコーダ等を含むことが可能である。電話はパケットを無線通信チャネルを通してネットワークあるいは他の通信デバイスに送信するために通信プロトコルレイヤおよびモジュールを使用することができる。
一つの観点は、ボコーダ(vocoder)、スピーチ−テキスト変換エンジン(speech to text conversion engine)、テキスト−スピーチ変換エンジン(text to speech conversion engine)そしてユーザインタフェースに関する。ボコーダはスピーチ信号をパケットに変換し、そしてパケットをスピーチ信号に変換するように動作可能である。テキスト−スピーチ変換エンジンはテキストをスピーチに変換するように動作可能である。スピーチ−テキスト変換エンジンはスピーチをテキストに変換するように動作可能である。ユーザインタフェースは複数のモードの中からモードのユーザの選択を受信するように動作可能であり、ここで第1のモードはスピーチ−テキスト変換エンジンとして動作することが可能であり、第2のモードはテキスト−スピーチ変換エンジンとして動作することが可能であり、そして第3のモードはスピーチ−テキスト変換エンジンおよびテキスト−スピーチ変換エンジンとして動作することを可能にする。
他の観点は、スピーチ信号をパケットに変換しそしてパケットをスピーチ信号に変換するように動作が可能なボコーダ、スピーチをテキストに変換するように動作可能なスピーチ−テキスト変換エンジン、複数のモードの中からモードのユーザ選定を受信するように動作可能なユーザインタフェースとを含む装置に関係し、ここで第1のモードはボコーダを使用可能にし、そして第2のモードはスピーチ−テキスト変換エンジンを使用可能にし、そしてトランシーバは符号化されたスピーチパケットおよびテキストパケットを通信ネットワークに無線により送信するように動作可能にする。
他の観点は、パケットをスピーチ信号に変換するように動作可能なボコーダと、スピーチからテキストに変換するように動作可能なスピーチ−テキスト変換エンジンと、第1および第2のモード間で切り換えるように動作可能な選択ユニットとを含むネットワーク装置に関するものであり、ここで第1のモードはボコーダを使用可能にし、第2のモードはボコーダおよびスピーチ−テキスト変換エンジンを使用可能にし、そしてトランシーバが符号化されたスピーチパケットおよびテキストパケットを通信ネットワークに無線により送信するように動作可能にする。
方法に関する他の観点は、符号化されたスピーチパケットを受信し、受信され符号化されたスピーチパケットを受信すること、受信された符号化されたスピーチパケットをスピーチ信号に変換すること、そして複数のモードの中からモードのユーザ選択(user selection)を受信することを含む方法に関連し、ここで、第1のモードはスピーチからテキストへ変換を可能とし、第2のモードはテキストからスピーチへの変換を可能とし、そして第3のモードはスピーチからテキストおよびテキストからスピーチへの変換を可能とする。
一つあるいはそれより多くの実施例の詳細は、組み合わされた図面および以下の記述の中に示される。
図1は、第1の通信デバイス、ネットワーク、および第2の通信デバイスを含むシステムを説明している。 図2は、図1の第2のデバイスを使用している方法を示している。 図3は、図1の第1の通信デバイスの他の構成を示している。 図4は、図1のネットワークの他の構成を示している。
[詳細な記述]
会議、航空機、列車、レストラン、教会あるいは他の場所において、移動デバイス上で呼を受信することは、他に対して混乱を生じさせるかも知れない。もしユーザが移動デバイス上の他のモードを選択し呼を受信し/あるいは呼に応答するために他のモードを選択することが可能であれば、混乱を生じさせる程度は大いに少なくなるであろう。一つのモードにおいて、デバイスは呼を受信し、そして他端における発呼者に対しテキストの入力要求することなしにスピーチ/音声信号(speech/voice signal)をテキストに変換する。
図1は、第1の通信デバイス100、ネットワーク110および第2の通信デバイス120を含むシステムを示す。システムは他の構成要素を含むことができる。システムは移動通信のためのグローバルシステム(GSM)、符号分割多元接続(CDMA)、CDMA2000、CDMA2001 x EV−DO、広帯域CDMA(WCDMA)、直交周波数分割多元接続(OFDMA),ブルートウース、WiFi、Wimax等の無線通信の任意の形式を使用することが可能である。
第1の通信デバイス100は、ボイスコーダ(ボコーダ)(voice coder(vocoder))102およびトランシーバ104を含む。第1の通信デバイス100は図1に示されたコンポーネントに加えてあるいは代りに他のコンポーネントを含むことができる。第1の通信デバイス100は、ランドライン(無線ではない)電話機(landline phone)、無線通信デバイス、パーソナルデジタルアシスタント(PDA;personal digital assistant)、ハンドヘルドデバイス、ラップトップ計算機、デスクトップ計算機、デジタルカメラ、デジタル記録デバイス、地上をもととした無線電話(terrestrial-based radiotelephone)、直接2方向通信デバイス、(時としては、ウォーキートーキー(walkie-talkie)として参照される)カムコーダ(camcorder)、等で表されあるいは実行される。
ボコーダ102はスピーチ信号をパケットに符号化するためのエンコーダおよびパケットをスピーチ信号に復号するためのデコーダを含むことができる。ボコーダ102は、エンハンスド可変レートコーダ(EVRC;enhanced variable rate coder)、アダプティブマルチレート(AMR;Adaptive Multi Rate)、第4世代のボコーダ(4GV;Fourth Generation vocoder)等の任意の形式のボコーダとすることができる。ボコーダは、ともに出願された米国特許6,397,175、6,434,519、6,438,518、6,449,592、6,456,964、6,447,502、6,584,438、6,678,649、6,691,084、6,804,218、6,947,888に記載されており,それらは参照によってこの中に組入れられている、
トランシーバ104は符号化された言語を含むパケットを無線により送信し、そして受信することができる。
ネットワーク110は1個あるいはそれ以上の基地局、基地局コントローラ(BSCs;base station controller)、移動スイッチングセンタ(MSCs;mobile switching center)等を表す。もしも第1のデバイス100がランドライン電話機であれば、そこでネットワーク110は簡素な古い電話サービス(POTS;plain old telephone service)ネットワークにおけるコンポーネントを含むことができる。ネットワーク110は、ボコーダ112およびトランシーバ114を含むことができる。ネットワーク110は、図1に示したコンポーネントに附加されあるいは代りになる他のコンポーネントを含むことができる。
第2の通信デバイス120は、無線通信デバイス、パーソナルデジタルアシスタント(PDA;personal digital assistant)、ハンドヘルドデバイス、ラップトップ計算機、デスクトップ計算機、デジタルカメラ、デジタル記録デバイス、ネットワークイネーブルドデジタルテレビジョン、移動電話、セルラ電話機、衛星電話、カメラ電話、地上をもととした無線電話、直接2方向通信デバイス(時としてウォーキートーキーとして参照される)、カムコーダ等を表わしまたは実行することができる。
第2の通信デバイス120はトランシーバ124、スピーチおよびテキストユニット(speech and text unit)140、スピーカ142、ディスプレー128、ユーザ入力インターフェース、たとえばキーパッド(keypad)、およびマイクロホン146を含む。スピーチおよびテキストユニット140は、ボコーダ122、スピーチ−テキスト変換エンジン126、制御器144、テキスト−スピーチ変換エンジン132、および音声シンセサイザ134を含む。スピーチおよびテキストユニット140は図1に示されたコンポーネントに加えて、あるいは代りに他のコンポーネントを含むことができる。
スピーチおよびテキストユニット140の1個あるいはそれ以上のコンポーネントあるいは機能は、単一のモジュール、ユニット、コンポーネントあるいはソフトウェアに集積することができる。たとえば、スピーチ−テキスト変換エンジン126は、ボコーダ122と結合することができる。テキスト−スピーチ変換エンジン132は、テキストが符号化されたスピーチパケットに変換されるように、ボコーダ122と結合されることが可能である。音声シンセサイザー134はボコーダ122および/またはテキスト−スピーチ変換エンジン132と結合することができる。
スピーチ−テキスト変換エンジン126は、音声/スピーチをテキストに変換することができる。テキスト−スピーチ変換エンジン132は、テキストをスピーチに変換することが可能である。制御器144は、スピーチおよびテキストユニット140内の1個あるいはそれ以上のコンポーネントの動作やパラメータを制御することが可能である。
デバイス120はユーザにとって呼を受信しそして/あるいは呼に応答するため、下表あるいは図2に示されたように、通信のいくつかのモードを与えることができる。
Figure 0005149292
ノーマルモードにおいては(ブロック202および210)、第2のデバイス120のユーザは第1のデバイス100からの呼を受信し、スピーカ142からのスピーチを聞き、そしてマイクロホン146に話す。
図2は図1の第2のデバイス120を使用する方法を示している。第2のデバイス120が第1のデバイス100から呼を受信するときは、第2のデバイスのユーザ120は、ブロック200内のユーザインタフェース130を経由してモードの1個を選択することができる。代りにユーザは第2のデバイス120が他のデバイスから呼を受信する前に、ブロック200内のモード間で切り換えることが可能である。たとえば、もし第2のデバイス120のユーザが、会議、航空機、鉄道、劇場、レストラン、教会または他の場所に入った場合、そこでは到来呼が他に比して混乱するかも知れず、ユーザはノーマルモードから他の3つのモードの1つに切り換えることができる。
第2のモードにおいて(ブロック204および212)、第2のデバイス130のユーザは、イヤピース、ヘッドセット、あるいはヘッドホンを使用する等により第1のデバイス100からのスピーチを聞くことができるが、しかし話はしない。代りに、第2のデバイス130のユーザは、キーパッド130上でタイプすることができるか、あるいはディスプレイ128上の手書きテキスト(handwritten text)に入力するために書き込みペン(writing stylus)を使用することができる。ディスプレイ128またはスピーチ変換エンジン132は、手書きテキストあるいは文字を認識するモジュール有することができる。デバイス120は、(a)第1のデバイス100にテキストを送付しあるいは、(b)テキスト−スピーチ変換エンジン132を用いてテキストをスピーチに変換する。
音声シンセサイザ134は、ユーザの自然の音声に実質的に適合するように個人的スピーチ信号を生成するためにスピーチを合成することができる。音声シンセサイザ134は、ピッチ(pitch)のようなユーザの音声の特性(characteristics)を保存するためにメモリを含むことができる。音声シンセサイザは、共に付与された米国特許6,950,799に記述され、そしてそれは参照によって組込まれる。他の音声シンセサイザは共に付与された米国特許出願11/398.364.に記述されており、そしてそれは参照によって組み込まれる。
ボコーダ122はパケット中にスピーチを符号化する。短い遅延があるかもしれず、あるいはないかもしれない。一つの構成において、短時間の遅延以外は、第2のデバイス120との通信は、第1のデバイス100のユーザにとってシームレス(seamless)に見えるかも知れない。もしも第2のデバイス120のユーザは会議に参加していれば、会話はシームレスではなくよりメッセージベースであるかもしれない。
第3および第4のモードにおいて(ブロック206、208、214、および216)、デバイス120は呼を受信し、そしてスピーチ−テキスト変換エンジン126は、ディスプレー128上へのディスプレーのために、スピーチ/音声信号をテキストに変換する。一つの構成において、第3および第4のモードは、第1のデバイス100のユーザが会話を継続しそして第1のデバイス100のユーザがテキスト入力モードに切換えることを要求しないことを可能にすることができる。スピーチ−テキスト変換エンジン126は、ワードとサウンド(word and sound)を認識するため、これらをテキストに変換するための音声認識モジュールを含むことができる。
第3のモードにおいては、デバイス120はユーザがマイクロホン146に話すことを可能にし、そしてそれはスピーチをパケットに符号化するためボコーダ122に通す。
第4のモードにおいては、第2のデバイス130のユーザはキーパッド130の上でタイプすることが可能であり、あるいは、ディスプレー128上で手書きのテキストを入力するために書き込みペン(writing stylus)を使用することができる。デバイス120は、(a)テキストを第1のデバイス100に送信すること、あるいは(b)テキスト−スピーチ変換エンジン132を用いてテキストからスピーチへ変換することができる。音声シンセサイザ134は、実質的にユーザの自然な音声に適合するように、個人化されたスピーチ信号を生成するためにスピーチを合成することができる。ボコーダ122は、スピーチをパケット内に符号化する。
第2および第4のモードにおいて、第2のデバイス120がテキストをスピーチに変更しそしてスピーチを合成するようにセットされている場合、第2のデバイス120が第1のデバイス100から呼を受入れる時と、そして第1のデバイス100がスピーチパケットを受信するときとの間には遅延時間が存在する。第2のデバイス120は、第1のデバイス100に、第2のデバイス120のユーザがミーティング中でありそしてスピーチ変換に対するテキストを使用して応答するであろうことを報告するために、ユーザによって予め記録されたメッセージをプレイするように形成されることが可能である。
第2および第4のモードは、バックグランド雑音のないスピーチを送信すること、エコーキャンセレーションの必要がないかあるいは少ない、雑音圧縮の必要性が無いか少ない、より速い符号化、より少ない処理等の、1個あるいはそれ以上の利点を与えることが可能である。
図1は、変更(新しい機能および/あるいはエレメント)が、第2の通信デバイス120のみの、どこで実行され得るかの例を示す。通信の新しいモード(第2、3、および第4のモード)を実現するために、第2の通信デバイス120はボコーダ122、スピーチからテキストへのエンジン126、テキストからスピーチへのエンジン132等を有する。このデバイス120を用いて、システムは新しいモードを、ネットワーク110および従来の電話100(ランドライン、移動電話等)において、いかなる変更もなしにサポートすることが可能である。デバイス120は、ユーザによって選択されたモードに関係なく音声パケットを受信しS9おして送信することができる。
図3は、図1の第1の通信デバイス100の他の配列100Aを示す。図3において、第1の通信デバイス100Aはスピーチ−テキスト変換エンジン300、エンコーダ302、トランシーバ104、デコーダ304、およびユーザインタフェース330を含む。スピーチ−テキスト変換エンジン300は、音声/スピーチから、トランシーバ104によってネットワーク110に送信されるべきテキストに変換することができる。図3の第1の通信デバイス100Aは、第2のデバイス120が、スピーチ−テキスト変換エンジン126なしにデザインされることを可能にする。図3における第1の通信デバイス100Aはスピーチの代りにテキストをネットワーク110に送ることによって帯域幅を節減することが可能である。ユーザインタフェース330は複数のユーザモードの中からモードのユーザ選択を受信するように動作可能であり、ここで第1のモードはボコーダ302、304を動作可能にし、そして第2のモードはスピーチ−テキスト変換エンジン300を動作可能にする。
図4は図1のネットワーク110の他の構成110Aを示す。図4において、ネットワーク110Aは音声コーダ/デコーダ400、トランシーバ114およびスピーチ−テキスト変換エンジン402を含む。他の構成において、ネットワーク110Aはさらにテキスト−スピーチ変換エンジン404、ボイスシンセサイザ402および制御器444を含むことができる。ボコーダ400は、スピーチ信号を与えるためにスピーチパケットを復号する。スピーチ−テキスト変換エンジン402は、トランシーバ114によって第2のデバイス120に送信されるべき音声/スピーチをテキストに変換することが可能である。図4のネットワーク110Aは、第2のデバイス120がスピーチ−テキスト変換エンジン126なしに設計されることを可能にし、あるいはスピーチ−テキスト変換エンジン126が非活性にされることを可能にする。図4のネットワーク110Aはスピーチの代りに第2のデバイス120にテキストを送ることによって帯域幅を節減することが可能である。
図4におけるネットワーク110Aは、受信デバイス120の形状(configuration)、状態(situation)および優先性(preference)に関する知識を取得することができる。もしもネットワーク110Aが、受信デバイス120が音声パケットを受信することから利益を受けないであろうことを認識するならば、(たとえば、ユーザの呼の優先性または位置を検出し、例えば、過度に雑音の多い環境、および受信されたスピーチを聞くに困難であること)そこでネットワーク110Aは、音声パケットをテキストパケットに変更するであろう。たとえ、受信デバイス120が音声パケットをテキストパケットに変更する能力を有しているとしても(音声からテキストへのエンジン126を使用して)、このことは、もしもユーザがテキスト受信モード(ミーティング、あるいは一般的に無音の通信)にある場合は、帯域幅の損失およびこの変換をするために(音声からテキストへ)デバイス電力の損失がある。
このようにして図4におけるネットワーク110Aは、変化(新しい特性および/あるいはエレメント)がネットワーク110Aの中でのみ実行されるシステム、すなわち通信デバイスあるいは組立部品においては変化しない、においてに使用されるかもしれない。移動ハンドセットがスピーチ−テキスト変換ユニットを有していない場合、ネットワーク110Aは、音声パケットをテキストに変換しそして反対について注意を払うことができ、あるいは移動ハンドセットがスピーチ−テキスト変換ユニットを有している場合、ハンドセットは変換することを委託しないか、あるいは計算機処理上のリソース、電池の電力等の不足のため変換を行なうことができない。
例えば、図1における第1のデバイス100が音声パケットを送信しあるいは受信する(すなわち第1のモード)ことが可能であり、他方第2のデバイス120はテキスト(すなわち第4モード)を送信する。第2のデバイス120はユニット140を有することができない(あるいは、ボコーダ122のみを有する)か、あるいは不活性にされているユニット140を有する。第2のデバイス120が第4のモードで動作することを可能にするために、図4におけるネットワーク110Aは、第2のデバイス120に送信するために(スピーチ−テキストエンジン402を使用して)第1デバイスの音声パケットをテキストパケットに変更し、そして第1のデバイス100に送信するため(テキスト−スピーチエンジン404を使用して)第2のデバイス120からのテキストパケットを音声パケットに変換するであろう。
第2のデバイス120がユニット140を有していない場合、第2のデバイス120は必要とするモードをネットワーク110Aに信号により伝え(例えば帯域内で)、そしてその結果ネットワーク110Aにスピーチおよびテキストの間を変換すること、すなわちユニット140の機能を実行することを求める。
個性化されたスピーチの合成(personalized speech synthesis)はネットワーク110A内で行うことができる。上に記述されたように、図1におけるユニット140は、テキスト−スピーチエンジン132の出力を個性化されたスピーチ(ユーザの音声)に変換するための音声シンセサイザ134を有する。図4のネットワーク110Aを有するシステムにおいて、第2のデバイス120のユーザの声紋(voice signature)を運ぶ音声パケットを生成するため、第2のデバイス120は(第2あるいは第4のモードを使用する初めに) ネットワーク110Aに対しユーザのスペクトルパラメータおよびピッチ情報(pitch information)を有する記憶された音声パケットを送信することができる。これらのごく少数の送信された音声パケット(テキストパケットに先立つ)は個性化された音声パケットを生成するためにネットワーク110Aにより使用されることができる。
第2のデバイス120からネットワーク110Aに対する第2あるいは第4のモードに関する送信パケットの例が記述される。第2のデバイス120は、ネットワーク110Aに対し、これらの「テキストモード」(第2あるいは第4のモード)を使用するに先立って、ユーザが予め記憶した音声パケット(Nパケット)に加え動作モード(1,2,3あるいは4;変換を行うことの要求)を送信する。第2のデバイス120は続いてテキストパケットを送信するであろう。
2つの構成の組み合わせ(図1および図4)がまた可能である。これらのモードの1つを使用する場合、変換を行なう、またはネットワーク110Aにさせる、または受信デバイス100Aが変換をおこなう、受信デバイス120の能力を判定した後(すなわち信号送信により要求を受信する)、ネットワーク110Aはテキスト/スピーチ変換を動作可能にする。
上に記述した1個あるいはそれ以上のコンポーネントおよび特性は、プッシュツートーク(PTT;push to talk)あるいはプッシュツーリード(push to read)通信デバイスによって実行されるであろう。PTTデバイスはユーザがデバイス上のプッシュボタンを押しそして通話することを可能にし、一方デバイスはスピーチをテキストに変換し、そしてテキストパケットをネットワークにまたは直接に他の通信デバイスに送信する。PTT通信は、標準の音声呼のように、連続というよりは「メッセージに基づく”message based”」ものである。ユーザがデバイス上のPTTボタンを押し下げている期間は、続いてテキストその他に変換されるメッセージをうまく組立てることができる。
デバイス120は、インストラクションおよびデータを保存するために、専用化されたハードウェア、ソホトウェア、ファームウェアあるいはそれらの組み合わせと同様に、専用のメモリを有することができる。ソフトウェア内で実行される場合は、この技術は、ランダムアクセスメモリ(RAM)、読出専用メモリ(ROM)、非揮発性ランダムメモリ(NVRAM)、電気的に消去可能なプログラマブル読出専用メモリ(EPROM)、フラッシュメモリ、または同様の、計算機により読出可能な媒体上の命令として具体化することができる。この命令は1個あるいはそれ以上の処理装置に、この開示の中に記述された機能における特定の側面を実行させるようにする。
この開示のなかに記述された技術は、汎用マイクロ処理装置、デジタル信号処理装置(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FMGA)あるいはその他の等価的論理デバイスの中で実行されることが可能である。たとえば、スピーチおよびテキストユニット140および組み合わされたコンポーネントおよびモジュールは、デジタルシグナルプロセッサ(DSP)または他の処理デバイス上で動作することによってエンコーディングプロセス(encoding process)またはコーディング/デコーディング(coding/decoding)プロセスに関する部品として実行することが可能である。したがって、モジュールとして記述されたコンポーネントは、このようなプロセスまたは分離されたプロセスのプロブラマブル特性を形成することができる。
スピーチおよびテキストユニット140は、専用化されたハードウェア、ソフトウェア、ファームウェアあるいはそれらの組み合わせと同様に、インストラクションおよびデータを保存するための専用化されたメモリを有することができる。ソフトウェアによって実行された場合は、この技術は1個あるいはそれ以上のプロセッサによって実行可能な命令として具体化されるであろう。命令は、ランダムアクセスメモリ(RAM)、呼び出し専用メモリ(ROM)非揮発性ランダムアクセスメモリ(NVRAM)、電気的に読出可能なプログラマブル読出専用メモリ(EEPROM)、フラッシュメモリ、磁気的あるいは光学的データ保存デバイス、または同様のもののような計算機によって読出可能な媒体上に保存されることができる。命令は、1個あるいはそれ以上の処理装置にこの開示の中に記述された特定の側面を実行させるようにする。
種々の実施例について記述した。これらおよび他の実施例はつぎの請求項の範囲内にある。

Claims (17)

  1. 装置であって、
    送信の場合には、入力スピーチ信号を送信され符号化されたスピーチパケットへ変換し、受信の場合には、受信された符号化されたスピーチパケットを出力スピーチ信号へ変換するボコーダと、
    該出力スピーチ信号をテキストに変換するスピーチ−テキスト変換エンジンと、
    入力テキストスピーチに変換するテキスト−スピーチ変換エンジンと、
    複数のモードの中からモードのユーザ選択を受信するユーザインタフェースと、
    なお、第1のモードが該スピーチ−テキスト変換エンジンを使用可能にし、第2のモードが該テキスト−スピーチ変換エンジンを使用可能にし、そして第3のモードが該スピーチ−テキスト変換エンジンおよび該テキスト−スピーチ変換エンジンを使用可能にし、
    第2または第3のモードが選択された場合に、該テキスト−スピーチ変換エンジンの出力から、ユーザの音声の特性に適合するスピーチを生成する音声シンセサイザと、生成されたスピーチは、送信のために該ボコーダに入力される、
    を含み、
    なお、該符号化されたスピーチパケット、第1、第2および第3モードが該ユーザ選択により選択されることに関係なく、該装置により送信されそして受信される装置。
  2. 該スピーチ−テキスト変換エンジンからのテキストを表示するディスプレーをさらに含む請求項1記載の装置。
  3. ユーザからの入力テキストを受信するためのキーパッドをさらに含む請求項1記載の装置。
  4. 該ユーザインタフェースは、該装置が他の装置から呼を受信する前に、モードのユーザ選択を受信する請求項1記載の装置。
  5. 該ユーザインタフェースは、該装置が他の装置からの呼を受信した後に、モードのユーザ選択を受信する請求項1記載の装置。
  6. 無線により送信された符号化されたスピーチパケットおよびテキストパケットを、通信ネットワークに無線により送信するトランシーバをさらに含む請求項1記載の装置。
  7. ネットワーク装置であって、
    符号化されたスピーチパケットをスピーチ信号に変換するボコーダと、
    スピーチ信号をテキストに変換するスピーチ−テキスト変換エンジンと、
    テキストをスピーチに変換するテキスト−スピーチ変換エンジンと、
    第1と第2のモード間で切り換える選択ユニットと、なお該第1のモードは該ボコーダを使用可能にし、そして第2のモードは該ボコーダおよび該スピーチ−テキスト変換エンジンを使用可能にし、
    該符号化されたスピーチパケットを無線により受信し、テキストパケットを通信ネットワークに無線により送信するトランシーバと、
    該テキスト−スピーチ変換エンジンの出力から、ユーザの音声の特性に適合するスピーチを生成する音声シンセサイザと、
    受信装置または該通信ネットワークの少なくとも1つに関連する条件が検知された場合、条件に基づき、該第1または第2のモード選択されることに関係なく、該トランシーバに該テキストパケットを送信させる制御器、ここで該条件は該通信ネットワークの節減帯域幅、計算機処理上のリソースの不足、および電池の電力のうちの1つである、
    を含むネットワーク装置。
  8. 選択ユニットは、該ボコーダおよび両方の変換エンジンが使用可能にされる第3のモードに切り換える、請求項7記載のネットワーク装置。
  9. 該音声シンセサイザはユーザの音声の音声特性を受信しそして保存する請求項7記載のネットワーク装置。
  10. 制御器はスピーチからテキストに変換するために通信デバイスからの要求を受信する請求項7記載のネットワーク装置。
  11. 制御器はテキストからスピーチに変換のために通信デバイスからの要求を受信する請求項7記載のネットワーク装置。
  12. 方法であって、
    通信ネットワークから符号化されたスピーチパケットを受信することと
    該受信された符号化されたスピーチパケットをスピーチ信号に変換することと
    ユーザからテキスト入力を受信することと
    複数のモードの中からユーザのモード選択を受信することと、第1のモードはスピーチからテキストへの変換を使用可能にし、第2のモードはテキストからスピーチへの変換を使用可能にし、そして第3のモードはスピーチからテキストへの、そしてテキストからスピーチへの変換を可能にし、
    該第2または第3のモードが選択された場合、該ユーザからの入力テキストからスピーチへの変換により得られたスピーチから、ユーザの音声の特性に適合するスピーチを生成することと
    を備え、
    符号化されたスピーチパケットは該ユーザ選択により該第1、第2、そして第3のモードが選択されることに関係なく、該通信ネットワークにおいて通信される方法。
  13. 到来する呼を受信する前に、モードに対するユーザ選択を受信することをさらに含む請求項12記載の方法。
  14. 到来する呼を受信した後に、モードに対するユーザ選択を受信することをさらに含む請求項12記載の方法。
  15. 装置であって、
    送信の場合には、入力スピーチ信号を送信され符号化されたスピーチパケットへ変換し、受信の場合には、受信された符号化されたスピーチパケットを出力スピーチ信号へ変換する第1の手段
    該出力スピーチ信号をテキストに変換する第2の手段
    入力テキストをスピーチに変換する第3の手段
    複数のモードの中からモードのユーザ選択を受信する第4の手段、なお、第1のモードは該第2の手段を動作可能にし、第2のモードは該第3の手段を動作可能にし、第3のモードは該第2の手段及び第3の手段を動作可能にし、
    該第2または第3モードが選択された場合、該第3の手段の出力から、ユーザの音声の特性に適合するスピーチを生成する第5の手段生成されたスピーチは、送信のために該第1の手段に入力される、
    を備え、
    なお、該符号化されたスピーチパケットは、第1、第2および第3モードが該ユーザ選択により選択されることに関係なく、該装置により送信されそして受信される装置。
  16. その上に実行可能な命令を記憶するコンピュータ可読記憶媒体であって、
    該命令は、
    コンピュータに、送信の場合には、入力スピーチ信号を送信され符号化されたスピーチパケットへ変換し、受信の場合には、受信された符号化されたスピーチパケットを出力スピーチ信号へ変換するボコーダとして機能させるコード
    該コンピュータに、該出力スピーチ信号をテキストに変換するスピーチ−テキスト変換エンジンコードとして機能させるコードと
    該コンピュータに、入力テキストをスピーチに変換するテキスト−スピーチ変換エンジンとして機能させるコードと
    該コンピュータに、複数のモードの中からモードのユーザ選択を受信させるコード、なお、第1のモードは該スピーチ−テキスト変換エンジンを動作可能にし、第2のモードは該テキスト−スピーチ変換エンジンを動作可能にし、第3のモードは該スピーチ−テキスト変換エンジンおよび該テキスト−スピーチ変換エンジンを動作可能にし、
    該コンピュータに、該第2または第3モードが選択された場合、該テキスト−スピーチ変換エンジンの出力から、ユーザの音声の特性に適合するスピーチを生成させるコードと、生成されたスピーチは、送信のために該ボコーダに入力される
    を含み、
    符号化されたスピーチパケットは、第1、第2および第3モードが該ユーザ選択により選択されることに関係なく、該コンピュータにより送信されそして受信されるコンピュータ可読記憶媒体。
  17. 該ユーザインターフェイスは、第2の装置がテキストからスピーチへのモードで動作することをユーザに通知する予め記憶されたメッセージとしてプレイする、請求項1記載の装置。
JP2009523030A 2006-07-31 2007-07-31 音声およびテキスト通信システム、方法および装置 Expired - Fee Related JP5149292B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/497,011 US20100030557A1 (en) 2006-07-31 2006-07-31 Voice and text communication system, method and apparatus
US11/497,011 2006-07-31
PCT/US2007/074902 WO2008016949A2 (en) 2006-07-31 2007-07-31 Voice and text communication system, method and apparatus

Publications (2)

Publication Number Publication Date
JP2010505134A JP2010505134A (ja) 2010-02-18
JP5149292B2 true JP5149292B2 (ja) 2013-02-20

Family

ID=38871584

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009523030A Expired - Fee Related JP5149292B2 (ja) 2006-07-31 2007-07-31 音声およびテキスト通信システム、方法および装置

Country Status (6)

Country Link
US (2) US20100030557A1 (ja)
EP (1) EP2047459A2 (ja)
JP (1) JP5149292B2 (ja)
KR (1) KR101136769B1 (ja)
CN (1) CN101496096B (ja)
WO (1) WO2008016949A2 (ja)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7127271B1 (en) 2001-10-18 2006-10-24 Iwao Fujisaki Communication device
US7466992B1 (en) 2001-10-18 2008-12-16 Iwao Fujisaki Communication device
US7107081B1 (en) 2001-10-18 2006-09-12 Iwao Fujisaki Communication device
US8229512B1 (en) 2003-02-08 2012-07-24 Iwao Fujisaki Communication device
US8241128B1 (en) 2003-04-03 2012-08-14 Iwao Fujisaki Communication device
US8090402B1 (en) 2003-09-26 2012-01-03 Iwao Fujisaki Communication device
US8121635B1 (en) 2003-11-22 2012-02-21 Iwao Fujisaki Communication device
US8041348B1 (en) 2004-03-23 2011-10-18 Iwao Fujisaki Communication device
US8208954B1 (en) 2005-04-08 2012-06-26 Iwao Fujisaki Communication device
US20100030557A1 (en) 2006-07-31 2010-02-04 Stephen Molloy Voice and text communication system, method and apparatus
US7890089B1 (en) 2007-05-03 2011-02-15 Iwao Fujisaki Communication device
US8559983B1 (en) 2007-05-03 2013-10-15 Iwao Fujisaki Communication device
US8676273B1 (en) 2007-08-24 2014-03-18 Iwao Fujisaki Communication device
US8639214B1 (en) 2007-10-26 2014-01-28 Iwao Fujisaki Communication device
US8472935B1 (en) 2007-10-29 2013-06-25 Iwao Fujisaki Communication device
US8744720B1 (en) 2007-12-27 2014-06-03 Iwao Fujisaki Inter-vehicle middle point maintaining implementer
CN101237489A (zh) * 2008-03-05 2008-08-06 北京邮电大学 基于语音通信内容的处理方法和装置
US8856003B2 (en) * 2008-04-30 2014-10-07 Motorola Solutions, Inc. Method for dual channel monitoring on a radio device
US8312660B1 (en) 2008-05-09 2012-11-20 Iwao Fujisaki Firearm
US8543157B1 (en) 2008-05-09 2013-09-24 Iwao Fujisaki Communication device which notifies its pin-point location or geographic area in accordance with user selection
US8340726B1 (en) 2008-06-30 2012-12-25 Iwao Fujisaki Communication device
US8452307B1 (en) 2008-07-02 2013-05-28 Iwao Fujisaki Communication device
US20110007732A1 (en) * 2009-07-08 2011-01-13 John Ward Unified Communication System
US8611876B2 (en) * 2009-10-15 2013-12-17 Larry Miller Configurable phone with interactive voice response engine
KR20110051385A (ko) * 2009-11-10 2011-05-18 삼성전자주식회사 통신 단말기 및 그의 통신 방법
CN102687583B (zh) 2009-12-31 2016-02-24 诺基亚技术有限公司 用于在一个会话中执行多个通信形式的方法和装置
CN102984672A (zh) * 2011-09-07 2013-03-20 比亚迪股份有限公司 移动终端及其通信方法
US9762524B2 (en) 2011-09-28 2017-09-12 Elwha Llc Multi-modality communication participation
US9002937B2 (en) 2011-09-28 2015-04-07 Elwha Llc Multi-party multi-modality communication
US9477943B2 (en) 2011-09-28 2016-10-25 Elwha Llc Multi-modality communication
US9906927B2 (en) 2011-09-28 2018-02-27 Elwha Llc Multi-modality communication initiation
US9788349B2 (en) 2011-09-28 2017-10-10 Elwha Llc Multi-modality communication auto-activation
US9699632B2 (en) 2011-09-28 2017-07-04 Elwha Llc Multi-modality communication with interceptive conversion
US9503550B2 (en) * 2011-09-28 2016-11-22 Elwha Llc Multi-modality communication modification
CN103108092A (zh) * 2011-11-15 2013-05-15 希姆通信息技术(上海)有限公司 通信终端以及通信终端之间的信息传送方法
US8423366B1 (en) * 2012-07-18 2013-04-16 Google Inc. Automatically training speech synthesizers
US10129340B2 (en) 2012-08-07 2018-11-13 Nokia Technologies Oy Method and apparatus for performing multiple forms of communications in one session
KR101398806B1 (ko) * 2012-11-21 2014-05-27 오준수 모바일 단말기 간의 p2p 통신방법 및 그 기록매체
CN103973542B (zh) * 2013-02-01 2017-06-13 腾讯科技(深圳)有限公司 一种语音信息处理方法及装置
US9767802B2 (en) * 2013-08-29 2017-09-19 Vonage Business Inc. Methods and apparatus for conducting internet protocol telephony communications
US9911407B2 (en) * 2014-01-14 2018-03-06 Interactive Intelligence Group, Inc. System and method for synthesis of speech from provided text
US20150220512A1 (en) * 2014-02-05 2015-08-06 Marco Álvarez Heinemeyer Language interface system, method and computer readable medium
KR102225401B1 (ko) * 2014-05-23 2021-03-09 삼성전자주식회사 음성 문자 통화 서비스를 제공하는 시스템 및 방법
EP3393112B1 (en) 2014-05-23 2020-12-30 Samsung Electronics Co., Ltd. System and method of providing voice-message call service
CN104123932B (zh) * 2014-07-29 2017-11-07 科大讯飞股份有限公司 一种语音转换系统及方法
CN105530351B (zh) * 2014-10-23 2019-09-10 中兴通讯股份有限公司 通话处理方法及装置
US9558747B2 (en) * 2014-12-10 2017-01-31 Honeywell International Inc. High intelligibility voice announcement system
EP3107090B1 (en) * 2015-06-18 2023-01-11 Airbus Operations GmbH Announcement signalling on board an aircraft
US9491270B1 (en) * 2015-11-13 2016-11-08 Motorola Solutions, Inc. Method and apparatus for muting an audio output interface of a portable communications device
US20180096334A1 (en) * 2016-10-03 2018-04-05 Paypal, Inc. Voice activated remittances
US11449868B2 (en) 2016-10-03 2022-09-20 Paypal, Inc. Voice activated remittances
EP3556121B1 (en) 2016-12-19 2022-03-02 Samsung Electronics Co., Ltd. Methods and apparatus for managing control data
CN109600307A (zh) * 2019-01-29 2019-04-09 北京百度网讯科技有限公司 即时通讯方法、终端、设备、计算机可读介质
US11468896B2 (en) * 2019-06-12 2022-10-11 Nvoq Incorporated Systems, methods, and apparatus for real-time dictation and transcription with multiple remote endpoints
CN112967719A (zh) * 2019-12-12 2021-06-15 上海棋语智能科技有限公司 一种标准电台手咪的电脑端接入设备

Family Cites Families (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0286099A3 (en) * 1983-05-06 1988-12-21 Velos Group Monoclonal antibodies reactive with endotoxin core
US5917405A (en) * 1993-06-08 1999-06-29 Joao; Raymond Anthony Control apparatus and methods for vehicles
US5881142A (en) * 1995-07-18 1999-03-09 Jetstream Communications, Inc. Integrated communications control device for a small office configured for coupling within a scalable network
JP3102335B2 (ja) * 1996-01-18 2000-10-23 ヤマハ株式会社 フォルマント変換装置およびカラオケ装置
JP3781213B2 (ja) * 1996-06-20 2006-05-31 ソニー株式会社 電子メールシステム、コンピユータ装置及び着信通知方法
GB2323246B (en) * 1997-03-15 2002-03-20 Ibm Internet telephony signal conversion
US5786768A (en) * 1997-04-16 1998-07-28 Patrick Plastics Inc. Clock radio gas detector apparatus and method for alerting residents to hazardous gas concentrations
US6178170B1 (en) * 1997-05-13 2001-01-23 Sprint Communications Company, L. P. System and method for transporting a call
US5983190A (en) * 1997-05-19 1999-11-09 Microsoft Corporation Client server animation system for managing interactive user interface characters
US6366651B1 (en) * 1998-01-21 2002-04-02 Avaya Technology Corp. Communication device having capability to convert between voice and text message
US6094681A (en) * 1998-03-31 2000-07-25 Siemens Information And Communication Networks, Inc. Apparatus and method for automated event notification
US7009990B1 (en) * 1998-04-23 2006-03-07 Nortel Networks Limited Methods and systems for a telephone e-mail interface
US6173250B1 (en) * 1998-06-03 2001-01-09 At&T Corporation Apparatus and method for speech-text-transmit communication over data networks
JP2000023253A (ja) * 1998-06-26 2000-01-21 Nec Corp マルチモード移動無線装置及びマルチモード無線装置、並びにマルチモード移動無線装置及びマルチモード無線装置における着信通知方法
IL142363A0 (en) 1998-10-02 2002-03-10 Ibm System and method for providing network coordinated conversational services
JP3842913B2 (ja) * 1998-12-18 2006-11-08 富士通株式会社 文字通信方法及び文字通信システム
US6456964B2 (en) * 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms
WO2000058949A1 (en) * 1999-03-25 2000-10-05 Kent Ridge Digital Labs Low data transmission rate and intelligible speech communication
US6836761B1 (en) * 1999-10-21 2004-12-28 Yamaha Corporation Voice converter for assimilation by frame synthesis with temporal alignment
US6745024B1 (en) * 2000-01-10 2004-06-01 Qualcomm Incorporated System and method for preparing and sending an electronic mail communication using a wireless communications device
JP3322262B2 (ja) * 2000-12-22 2002-09-09 日本電気株式会社 無線携帯端末通信システム
US6775360B2 (en) * 2000-12-28 2004-08-10 Intel Corporation Method and system for providing textual content along with voice messages
US6845359B2 (en) * 2001-03-22 2005-01-18 Motorola, Inc. FFT based sine wave synthesis method for parametric vocoders
US7406421B2 (en) * 2001-10-26 2008-07-29 Intellisist Inc. Systems and methods for reviewing informational content in a vehicle
JP2002334086A (ja) * 2001-05-10 2002-11-22 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP2002333895A (ja) * 2001-05-10 2002-11-22 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びにプログラム
KR20020091920A (ko) * 2001-06-01 2002-12-11 엘지전자 주식회사 이동통신 단말기에서의 음성 및 문자 통화 장치
US7251252B2 (en) * 2001-06-13 2007-07-31 Qwest Communications International Inc. Negotiated cell delivery capability
US7668718B2 (en) * 2001-07-17 2010-02-23 Custom Speech Usa, Inc. Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile
US7085259B2 (en) * 2001-07-31 2006-08-01 Comverse, Inc. Animated audio messaging
US7233655B2 (en) * 2001-10-03 2007-06-19 Accenture Global Services Gmbh Multi-modal callback
JP3733322B2 (ja) * 2001-11-21 2006-01-11 キヤノン株式会社 マルチモーダル文書受信装置及びマルチモーダル文書送信装置、マルチモーダル文書送受信システム及びそれらの制御方法、プログラム
US7483832B2 (en) 2001-12-10 2009-01-27 At&T Intellectual Property I, L.P. Method and system for customizing voice translation of text to speech
US6950799B2 (en) * 2002-02-19 2005-09-27 Qualcomm Inc. Speech converter utilizing preprogrammed voice profiles
JP2003289380A (ja) * 2002-03-28 2003-10-10 Nec Corp 音声符号化方式の変更方法、通信システム、通信網および通信端末
US7136811B2 (en) * 2002-04-24 2006-11-14 Motorola, Inc. Low bandwidth speech communication using default and personal phoneme tables
JP2004020613A (ja) * 2002-06-12 2004-01-22 Canon Inc サーバ、受信端末
US20040098266A1 (en) 2002-11-14 2004-05-20 International Business Machines Corporation Personal speech font
US20050048992A1 (en) 2003-08-28 2005-03-03 Alcatel Multimode voice/screen simultaneous communication device
US7519042B2 (en) * 2003-09-12 2009-04-14 Motorola, Inc. Apparatus and method for mixed-media call formatting
US7227847B2 (en) * 2004-03-11 2007-06-05 Ixi Mobile (R&D) Ltd. Power management system and method for a wireless communications device
US20050266829A1 (en) * 2004-04-16 2005-12-01 Lg Elcectronics, Inc. Speech-to-text messaging system and method
WO2005109661A1 (en) 2004-05-10 2005-11-17 Sk Telecom Co., Ltd. Mobile communication terminal for transferring and receiving of voice message and method for transferring and receiving of voice message using the same
KR100617826B1 (ko) * 2004-05-11 2006-08-28 삼성전자주식회사 음성메시지를 문자메시지로 변환하는 이동단말기 및 방법
DE102004041330B3 (de) * 2004-08-26 2006-03-16 Infineon Technologies Ag Speicherschaltung mit ein Widerstandsspeicherelement aufweisenden Speicherzellen
US20060136226A1 (en) * 2004-10-06 2006-06-22 Ossama Emam System and method for creating artificial TV news programs
CN1842702B (zh) 2004-10-13 2010-05-05 松下电器产业株式会社 声音合成装置和声音合成方法
US7693719B2 (en) * 2004-10-29 2010-04-06 Microsoft Corporation Providing personalized voice font for text-to-speech applications
US7333014B2 (en) * 2004-11-04 2008-02-19 International Business Machines Corporation Notifying users of device events in a networked environment
US7324476B2 (en) * 2004-11-04 2008-01-29 International Business Machines Corporation Establishing user accounts for RFID-based telecommunications routing
US7296740B2 (en) * 2004-11-04 2007-11-20 International Business Machines Corporation Routing telecommunications to a user in dependence upon location
US20060122840A1 (en) * 2004-12-07 2006-06-08 David Anderson Tailoring communication from interactive speech enabled and multimodal services
EP1694044B1 (en) * 2005-02-17 2008-06-04 Sony Ericsson Mobile Communications AB Method and communication system for transferring messages containing audio and/or voice information
US7917178B2 (en) * 2005-03-22 2011-03-29 Sony Ericsson Mobile Communications Ab Wireless communications device with voice-to-text conversion
US7394405B2 (en) * 2005-06-01 2008-07-01 Gm Global Technology Operations, Inc. Location-based notifications
US20070036086A1 (en) * 2005-08-09 2007-02-15 Sbc Knowledge Ventures, L.P. System and method of providing communications based on a predetermined device status
US7792253B2 (en) * 2005-10-27 2010-09-07 International Business Machines Corporation Communications involving devices having different communication modes
US7830408B2 (en) * 2005-12-21 2010-11-09 Cisco Technology, Inc. Conference captioning
US20100030557A1 (en) 2006-07-31 2010-02-04 Stephen Molloy Voice and text communication system, method and apparatus
WO2008084215A2 (en) * 2007-01-09 2008-07-17 Spinvox Limited Detection of unanswered call in order to give calling party the option to alternatively dictate a text message for delivery to the called party
US8914290B2 (en) * 2011-05-20 2014-12-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment

Also Published As

Publication number Publication date
EP2047459A2 (en) 2009-04-15
US20160111082A1 (en) 2016-04-21
CN101496096A (zh) 2009-07-29
WO2008016949A2 (en) 2008-02-07
JP2010505134A (ja) 2010-02-18
US20100030557A1 (en) 2010-02-04
CN101496096B (zh) 2012-11-07
KR20090036141A (ko) 2009-04-13
KR101136769B1 (ko) 2012-04-19
WO2008016949A3 (en) 2008-03-20
US9940923B2 (en) 2018-04-10

Similar Documents

Publication Publication Date Title
JP5149292B2 (ja) 音声およびテキスト通信システム、方法および装置
EP3090531B1 (en) Smart bluetooth headset for speech command
US7792675B2 (en) System and method for automatic merging of multiple time-stamped transcriptions
US20040267527A1 (en) Voice-to-text reduction for real time IM/chat/SMS
US20080151786A1 (en) Method and apparatus for hybrid audio-visual communication
CN101510917B (zh) 一种移动终端无声通话的方法
JP2013519334A (ja) 音声テキスト変換機能を備えた同時電話会議
CN110663244B (zh) 一种通信系统和便携通信终端
JP2008534999A (ja) 音声−テキスト変換機能を有する無線通信装置
GB2503922A (en) A transcription device configured to convert speech into text data in response to a transcription request from a receiving party
CN102131305A (zh) 一种语音业务的实现方法和系统
WO2005096530A1 (ja) 通信方法、送信方法及び装置ならびに受信方法及び装置
KR20100094529A (ko) 신호음 데이터와 오디오를 믹싱하기 위한 시스템 및 방법
KR101367722B1 (ko) 휴대단말기의 통화 서비스 방법
JP2007235810A (ja) 携帯電話システムおよび携帯電話装置
JP2001272998A (ja) 通信方法とワイヤレス呼接続装置
CN100446519C (zh) 一种在通话过程中播放音乐的手机及其方法
JP3165585U (ja) 音声合成装置
CN111510555A (zh) 一种dect基站通信方法、装置及系统
CN111385780A (zh) 一种蓝牙音频信号传输方法和装置
JP2002237877A (ja) ハンズフリーシステム、携帯電話およびハンズフリー装置
JP5177476B2 (ja) 無線通信端末、無線通信システム及び無線通信プログラム
WO2019119406A1 (zh) 一种缩短呼叫建立时间的方法、装置及对讲机
JP2004343443A (ja) 携帯通信装置、通信方法
JP2008005028A (ja) 映像音声会議システムおよび端末装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111031

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111108

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111202

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111209

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120104

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120417

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120713

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120723

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120918

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120925

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121002

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121129

R150 Certificate of patent or registration of utility model

Ref document number: 5149292

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151207

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees