JP2007102787A - インスタント・メッセージを可聴音信号によって注釈付けする方法、システム及びプログラム - Google Patents
インスタント・メッセージを可聴音信号によって注釈付けする方法、システム及びプログラム Download PDFInfo
- Publication number
- JP2007102787A JP2007102787A JP2006270009A JP2006270009A JP2007102787A JP 2007102787 A JP2007102787 A JP 2007102787A JP 2006270009 A JP2006270009 A JP 2006270009A JP 2006270009 A JP2006270009 A JP 2006270009A JP 2007102787 A JP2007102787 A JP 2007102787A
- Authority
- JP
- Japan
- Prior art keywords
- text
- writer
- speech
- message
- instant message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000005236 sound signal Effects 0.000 title description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 39
- 238000003786 synthesis reaction Methods 0.000 claims description 37
- 238000004590 computer program Methods 0.000 claims 2
- 239000000284 extract Substances 0.000 abstract description 4
- 230000005540 biological transmission Effects 0.000 abstract description 2
- 238000012512 characterization method Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 3
- 238000001308 synthesis method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000013316 polymer of intrinsic microporosity Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- MQJKPEGWNLWLTK-UHFFFAOYSA-N Dapsone Chemical compound C1=CC(N)=CC=C1S(=O)(=O)C1=CC=C(N)C=C1 MQJKPEGWNLWLTK-UHFFFAOYSA-N 0.000 description 1
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 210000002105 tongue Anatomy 0.000 description 1
- 208000029257 vision disease Diseases 0.000 description 1
- 230000004393 visual impairment Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Transfer Between Computers (AREA)
- Telephonic Communication Services (AREA)
Abstract
【解決手段】メッセージの書き手の音声は語形成型または調音型のテキストから音声への合成エンジンに合わせたパラメータに特徴付けられる。その結果、受け手のクライアント装置は、メッセージ・テキストから書き手の音声の特徴に従った可聴音信号を発生する。代替例として、書き手はサーバーに、実際の音声のサンプルを記憶することができる。その結果、書き手がメッセージを受け手に送ると、サーバーはそのテキスト・メッセージ中の語を合成するためのサンプルを抽出し、そのサンプルを受け手のクライアント装置に送る。そのサンプルはクライアント側の連結合成的なテキストから音声への合成エンジンが書き手の実際の音声に似た可聴音信号を発生する。
【選択図】図1
Description
従来の、テキストから音声へ(「テキスト読み上げ」あるいはtext-to-speech 即ち「TTS」と称する)の合成方法は大別すると二つの段階、すなわち高レベル合成および低レベル合成に分けられる。 高レベル合成は、語(ワード)及びこれらの語の文法的用法(例えば、句(フレーズ)の開始もしくは終了、ピリオド(終了符)やクエスチョンマーク(疑問符)などの句読点)を考慮するものである。 典型的には、テキスト分析をして入力テキストを音声その他の言語表示に書き換えることができ、音声情報が波形での音声発生を生じる。
技術の利用が今日のように進んでくると、一人もしくは複数の仲間とコンピュータを介しほぼリアルタイムでコミュニケーション(意思伝達)する手段として、もっと多くの人々がリアルタイムのメッセージング・システム、例えば、アメリカン・オンライン(「AOL」)のインスタント・メッセージング(「AIM」、商標)やインターナショナル・ビジネス・マシーンズ(「IBM」)SameTime(商標)を使用するようになっている。
図4には、音声注釈付きのインスタント・メッセージング・システムのユーザーが、テキストを通常はタイプすることによってテキスト・メッセージを書く(ステップ30)。その書き手は、音声注釈付きメッセージ即ちVAMを、予定のあるいは意図した受け手が受取れるようにする(ステップ31)。そして、その書き手はその特別に制御されたメッセージを、音声注釈付きメッセージ・サーバーと協働するインスタント・メッセージ・サーバーに差し出す、あるいは「送る」(ステップ32)。
前述のとおり、本発明の第1の実施例は、LFOベースのTTS機能を採用するクライアント・サーバーと相互運用する。 図1について、書き手若しくは送り手のための一組の音声合成パラメータ11が音声注釈付きメッセージング(「VAM」)サーバー48により記憶される。このVAMサーバー48は、IBM Sametime(商標)ベース・サーバーなどのようなインスタント・メッセージング・サーバー47と協働する。書き手がテキスト部分を含むインスタント・メッセージ46を作成し、送ると、VAMサーバー48はまた、書き手のLFO合成パラメータを非クライアントの記憶部11から書き手のLFO合成パラメータ12を抽出し、そしてクライアント側のLFO TTSエンジン45にこれらの抽出されたパラメータ12を提供する(401)。 これらのパラメータを提供する方法(401)は本発明を実現する際、以下に限定されないが、いろいろと変えることが出来る。
(b)クライアントがアクセス可能な記憶部でパラメータの記憶箇所を指し示すポインタまたはハイパー・リンクをメッセージ中に置く。
先に説明したように、本発明の他の実施例は、図6に詳細に示すように、サンプル・ベースTTS技法を用いたクライアント装置と相互運用できる。この実施例では、フルセットのユーザー音素サンプルがVAMサーバー48により記憶部49に記憶される。IMテキスト・メッセージ46がそのようなユーザーにより作成され送られると、VAMサーバー48がメッセージ46のテキスト内容を解析し、そのメッセージの音声読み上げを合成するのにどの音素が必要とされるかを決定し、そしてその特定のテキスト・メッセージ46に対し、どの音素がTTSエンジンにより使用されないかを決定する。必要とされる音素サンプルのサブセット400がVAMサーバー48によって記憶部49から抽出され、クライアント側のサンプル・ベースTTS記憶部42に提供される(401)。先に説明したLFOベースの実施例と同様に、クライアント側のTTSエンジンに音素サンプルのサブセットを提供する(401)のに使用されるこの方法は、実際に使用される特定のネットワーク及び技法に従って変えることができる。以下は、これに限定されるものではないが、その方法に含まれ得る変形例である。
(b)クライアントのアクセス可能な媒体にサンプルが記憶される。これによって図7に示すように、必要時にTTSエンジンがサンプルを取り出すことができる。
図10には、音声注釈付きメッセージを作成し、送りたいユーザー毎にシステムを初期化する、本発明による一般的なプロセスを示す。メッセージの書き手81はウエブ・ページにログインし、音声応答ユニット(「VRU」)を呼び出すか、あるいは初期化(または維持)プロセス80を開始させるための類似のアクションを取る(ステップ81)。そして、LFOまたはサンプル・ベース動作、またはその両方を初期化するため、選択する(ステップ82)。
本発明は、パーソナル・コンピュータ、ウエブ・サーバー及びウエブ・ブラウザなどの良く知られたコンピューティング・プラットフォーム上に今日すでに見出されているソフトウエアの一つの特徴としてあるいは追加版として好適には実現される。これらの共通のコンピューティング・プラットフォームはパーソナル・コンピュータならびにパーソナル・デジタル・アシスタント(PDA)、ウエブを利用できるワイヤレス電話、及び他のタイプのパーソナル情報マネージメント(PIM)装置などのポータブル・コンピューテイング・プラットフォームを含むことができる。
本発明を幾つかの実施例とともに説明してきたが、当業者には理解されるように、これらの実施例が本発明の範囲全体を示しているわけではない。別の実施例を選択することもできる。別のプログラミング言語若しくは方法論を使用すること、別のコンピューティング・プラットフォームを使用すること、別のコミュニケーション・プロトコル及びネットワークを使用することも本発明に含まれる。本発明の範囲は、特許請求の範囲により決定されたい。
12 ユーザー音声パラメータ
41 強化されたIM(インスタント・メッセージ)クライアント
42 サンプル・ベースTTS(テキストから音声への合成)記憶部
43 ユーザー表示
44 オーディオ出力
45 LFO(低周波発信器)ベースTTS
46 テキスト・メッセージ
47 IM(インスタント・メッセージ)サーバー
48 VAM(音声注釈付きメッセージ)サーバー
Claims (8)
- インスタント・メッセージを可聴音信号によって注釈付けする方法であって、
インスタント・メッセージの作成中、音声注釈付けオプションのために1個若しくは複数個のテキストから音声への合成用制御パラメータを、書き手により確立するステップと、
前記インスタント・パラメータ及び前記制御パラメータを、受け手の装置に送るステップと、
前記書き手により確立された前記制御パラメータを、前記受け手の装置が受取るステップと、
前記インスタント・メッセージをレビューするとともに、
前記インスタント・メッセージのテキスト部分を表す音声が前記書き手の確立した前記制御パラメータに従って可聴音として生じるように、前記書き手が確立した前記制御パラメータに従って前記受け手の装置によりテキストから音声への合成を行うステップと
を含む方法。 - 前記1個若しくは複数個のテキストから音声への合成用制御パラメータを確立するステップが、語形成型のテキストから音声への合成用エンジンと互換性のある1個若しくは複数個の音声特性パラメータを確立するステップを含み、前記制御パラメータがサーバーによって記憶されている、請求項1に記載の方法。
- 前記1個若しくは複数個のテキストから音声への合成用制御パラメータを確立するステップが、調音型のテキストから音声への合成用エンジンと互換性のある1個若しくは複数個の特性パラメータを含む、請求項1の方法。
- 前記1個若しくは複数個のテキストから音声への合成用制御パラメータを確立するステップは、前記書き手の実際の音声の1個若しくは複数個の音素サンプルであって、サーバーによって記憶され、連結合成的なテキストから音声への合成用エンジンと互換性のある前記1個若しくは複数個の音素サンプルを確立するステップを含む、請求項1に記載の方法。
- 前記インスタント・メッセージ及び前記制御パラメータを、受け手の装置に送るステップが、送る前に、前記制御パラメータを前記インスタント・メッセージに関連付けるステップを含む、請求項1に記載の方法。
- 前記インスタント・メッセージ及び前記制御パラメータを、受け手の装置に送るステップが、送る前に、前記制御パラメータへの一組のハイパー・リンクを前記インスタント・メッセージと関連付けるステップを含む、請求項1に記載の方法。
- インスタント・メッセージを可聴音信号によって注釈付けするシステムであって、
インスタント・メッセージの作成中、音声注釈付けオプションのための、書き手により確立される1個若しくは複数個のテキストから音声への合成用制御パラメータと、
前記インスタント・パラメータ及び前記制御パラメータを、受け手の装置に送るように適用されたメッセージ・トランスミッタと、
前記書き手により確立された前記制御パラメータを前記受け手の装置により受け取るように適用されたメッセージ・レシーバと、
前記インスタント・メッセージをレビューするとともに、
前記インスタント・メッセージのテキスト部分を表す音声が前記書き手の確立した前記制御パラメータに従って可聴音として生じるように、前記書き手が確立した前記制御パラメータに従ってテキストから音声への合成を行うように適用された、前記受け手の装置のテキストから音声への合成用エンジンと
を含むシステム。 - インスタント・メッセージを可聴音信号によって注釈付けするためのコンピュータ・プログラムであって、
インスタント・メッセージの作成中、音声注釈付けオプションのために1個若しくは複数個のテキストから音声への合成用制御パラメータを、書き手により確立するステップと、
前記インスタント・パラメータ及び前記制御パラメータを、受け手の装置に送るステップと、
前記書き手により確立された前記制御パラメータを、前記受け手の装置が受取るステップと、
前記インスタント・メッセージをレビューするとともに、
前記インスタント・メッセージのテキスト部分を表す音声が前記書き手の確立した前記制御パラメータに従って可聴音として生じるように、前記書き手が確立した前記制御パラメータに従って前記受け手の装置によりテキストから音声への合成を行うステップと
をコンピュータに実行させる、コンピュータ・プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/242,661 US8224647B2 (en) | 2005-10-03 | 2005-10-03 | Text-to-speech user's voice cooperative server for instant messaging clients |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007102787A true JP2007102787A (ja) | 2007-04-19 |
Family
ID=37902930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006270009A Pending JP2007102787A (ja) | 2005-10-03 | 2006-09-29 | インスタント・メッセージを可聴音信号によって注釈付けする方法、システム及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (3) | US8224647B2 (ja) |
JP (1) | JP2007102787A (ja) |
CN (1) | CN1946065B (ja) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8224647B2 (en) | 2005-10-03 | 2012-07-17 | Nuance Communications, Inc. | Text-to-speech user's voice cooperative server for instant messaging clients |
US8600753B1 (en) * | 2005-12-30 | 2013-12-03 | At&T Intellectual Property Ii, L.P. | Method and apparatus for combining text to speech and recorded prompts |
EP2095250B1 (en) * | 2006-12-05 | 2014-11-12 | Nuance Communications, Inc. | Wireless server based text to speech email |
US8478598B2 (en) * | 2007-08-17 | 2013-07-02 | International Business Machines Corporation | Apparatus, system, and method for voice chat transcription |
US20090055186A1 (en) * | 2007-08-23 | 2009-02-26 | International Business Machines Corporation | Method to voice id tag content to ease reading for visually impaired |
US8103506B1 (en) * | 2007-09-20 | 2012-01-24 | United Services Automobile Association | Free text matching system and method |
US8285548B2 (en) | 2008-03-10 | 2012-10-09 | Lg Electronics Inc. | Communication device processing text message to transform it into speech |
US20120069974A1 (en) * | 2010-09-21 | 2012-03-22 | Telefonaktiebolaget L M Ericsson (Publ) | Text-to-multi-voice messaging systems and methods |
EA201001550A1 (ru) * | 2010-10-25 | 2012-02-28 | Висконти Груп Менеджмент Лтд. | Способ преобразования текстов, способ поиска, способ автоматизированного перевода и способ автоматизированного озвучивания текстов |
US20120259633A1 (en) * | 2011-04-07 | 2012-10-11 | Microsoft Corporation | Audio-interactive message exchange |
JP2013072903A (ja) * | 2011-09-26 | 2013-04-22 | Toshiba Corp | 合成辞書作成装置および合成辞書作成方法 |
US9240180B2 (en) * | 2011-12-01 | 2016-01-19 | At&T Intellectual Property I, L.P. | System and method for low-latency web-based text-to-speech without plugins |
US9020818B2 (en) * | 2012-03-05 | 2015-04-28 | Malaspina Labs (Barbados) Inc. | Format based speech reconstruction from noisy signals |
KR102023157B1 (ko) * | 2012-07-06 | 2019-09-19 | 삼성전자 주식회사 | 휴대 단말기의 사용자 음성 녹음 및 재생 방법 및 장치 |
PL401347A1 (pl) * | 2012-10-25 | 2014-04-28 | Ivona Software Spółka Z Ograniczoną Odpowiedzialnością | Spójny interfejs do lokalnej i oddalonej syntezy mowy |
CN104050962B (zh) * | 2013-03-16 | 2019-02-12 | 广东恒电信息科技股份有限公司 | 基于语音合成技术的多功能阅读器 |
GB2516942B (en) * | 2013-08-07 | 2018-07-11 | Samsung Electronics Co Ltd | Text to Speech Conversion |
KR101703214B1 (ko) * | 2014-08-06 | 2017-02-06 | 주식회사 엘지화학 | 문자 데이터의 내용을 문자 데이터 송신자의 음성으로 출력하는 방법 |
US10176798B2 (en) * | 2015-08-28 | 2019-01-08 | Intel Corporation | Facilitating dynamic and intelligent conversion of text into real user speech |
CN106547511B (zh) | 2015-09-16 | 2019-12-10 | 广州市动景计算机科技有限公司 | 一种语音播读网页信息的方法、浏览器客户端及服务器 |
US9830903B2 (en) * | 2015-11-10 | 2017-11-28 | Paul Wendell Mason | Method and apparatus for using a vocal sample to customize text to speech applications |
CN105721292A (zh) * | 2016-03-31 | 2016-06-29 | 宇龙计算机通信科技(深圳)有限公司 | 一种信息读取方法、装置及终端 |
US10083684B2 (en) | 2016-08-22 | 2018-09-25 | International Business Machines Corporation | Social networking with assistive technology device |
US10339925B1 (en) * | 2016-09-26 | 2019-07-02 | Amazon Technologies, Inc. | Generation of automated message responses |
CN109213466B (zh) * | 2017-06-30 | 2022-03-25 | 北京国双科技有限公司 | 庭审信息的显示方法及装置 |
CN108366302B (zh) * | 2018-02-06 | 2020-06-30 | 南京创维信息技术研究院有限公司 | Tts播报指令优化方法、智能电视、系统及存储装置 |
CN111261139B (zh) * | 2018-11-30 | 2023-12-26 | 上海擎感智能科技有限公司 | 文字拟人化播报方法及系统 |
CN110415678A (zh) * | 2019-06-13 | 2019-11-05 | 百度时代网络技术(北京)有限公司 | 自定义语音播报客户端、服务器、系统及方法 |
CN110337030B (zh) * | 2019-08-08 | 2020-08-11 | 腾讯科技(深圳)有限公司 | 视频播放方法、装置、终端和计算机可读存储介质 |
US11270702B2 (en) | 2019-12-07 | 2022-03-08 | Sony Corporation | Secure text-to-voice messaging |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000122941A (ja) * | 1998-10-14 | 2000-04-28 | Matsushita Electric Ind Co Ltd | 電子メールを用いた情報転送方法 |
JP2001034280A (ja) * | 1999-07-21 | 2001-02-09 | Matsushita Electric Ind Co Ltd | 電子メール受信装置および電子メールシステム |
JP2005031919A (ja) * | 2003-07-10 | 2005-02-03 | Ntt Docomo Inc | 通信システム |
JP2005535012A (ja) * | 2002-07-31 | 2005-11-17 | インチェーン プロプライエタリー リミテッド | アニメーション化したメッセージング |
Family Cites Families (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5278943A (en) * | 1990-03-23 | 1994-01-11 | Bright Star Technology, Inc. | Speech animation and inflection system |
US5444768A (en) * | 1991-12-31 | 1995-08-22 | International Business Machines Corporation | Portable computer device for audible processing of remotely stored messages |
JPH05260082A (ja) | 1992-03-13 | 1993-10-08 | Toshiba Corp | テキスト読み上げ装置 |
US5559927A (en) * | 1992-08-19 | 1996-09-24 | Clynes; Manfred | Computer system producing emotionally-expressive speech messages |
US5860064A (en) * | 1993-05-13 | 1999-01-12 | Apple Computer, Inc. | Method and apparatus for automatic generation of vocal emotion in a synthetic text-to-speech system |
US6035273A (en) * | 1996-06-26 | 2000-03-07 | Lucent Technologies, Inc. | Speaker-specific speech-to-text/text-to-speech communication system with hypertext-indicated speech parameter changes |
JP3349905B2 (ja) * | 1996-12-10 | 2002-11-25 | 松下電器産業株式会社 | 音声合成方法および装置 |
US5812126A (en) * | 1996-12-31 | 1998-09-22 | Intel Corporation | Method and apparatus for masquerading online |
US5890115A (en) * | 1997-03-07 | 1999-03-30 | Advanced Micro Devices, Inc. | Speech synthesizer utilizing wavetable synthesis |
US7027568B1 (en) * | 1997-10-10 | 2006-04-11 | Verizon Services Corp. | Personal message service with enhanced text to speech synthesis |
JPH11265195A (ja) * | 1998-01-14 | 1999-09-28 | Sony Corp | 情報配信システム、情報送信装置、情報受信装置、情報配信方法 |
KR100629672B1 (ko) | 1998-01-23 | 2006-09-29 | 상꾜 가부시키가이샤 | 스피로피페리딘 유도체 |
KR100259918B1 (ko) * | 1998-03-05 | 2000-06-15 | 윤종용 | 핸즈프리키트의 쇼트메시지 음성합성 장치 및 방법 |
US5995590A (en) * | 1998-03-05 | 1999-11-30 | International Business Machines Corporation | Method and apparatus for a communication device for use by a hearing impaired/mute or deaf person or in silent environments |
US6023678A (en) * | 1998-03-27 | 2000-02-08 | International Business Machines Corporation | Using TTS to fill in for missing dictation audio |
US6100461A (en) * | 1998-06-10 | 2000-08-08 | Advanced Micro Devices, Inc. | Wavetable cache using simplified looping |
EP1045372A3 (en) * | 1999-04-16 | 2001-08-29 | Matsushita Electric Industrial Co., Ltd. | Speech sound communication system |
US6611802B2 (en) * | 1999-06-11 | 2003-08-26 | International Business Machines Corporation | Method and system for proofreading and correcting dictated text |
US6557026B1 (en) * | 1999-09-29 | 2003-04-29 | Morphism, L.L.C. | System and apparatus for dynamically generating audible notices from an information network |
US20030028380A1 (en) * | 2000-02-02 | 2003-02-06 | Freeland Warwick Peter | Speech system |
US6865533B2 (en) * | 2000-04-21 | 2005-03-08 | Lessac Technology Inc. | Text to speech |
US6810379B1 (en) * | 2000-04-24 | 2004-10-26 | Sensory, Inc. | Client/server architecture for text-to-speech synthesis |
US7277855B1 (en) * | 2000-06-30 | 2007-10-02 | At&T Corp. | Personalized text-to-speech services |
US6801931B1 (en) * | 2000-07-20 | 2004-10-05 | Ericsson Inc. | System and method for personalizing electronic mail messages by rendering the messages in the voice of a predetermined speaker |
JP2002149560A (ja) * | 2000-08-28 | 2002-05-24 | Sharp Corp | 電子メール装置及び電子メールシステム |
US6862568B2 (en) * | 2000-10-19 | 2005-03-01 | Qwest Communications International, Inc. | System and method for converting text-to-voice |
US6978239B2 (en) * | 2000-12-04 | 2005-12-20 | Microsoft Corporation | Method and apparatus for speech synthesis without prosody modification |
US6876968B2 (en) * | 2001-03-08 | 2005-04-05 | Matsushita Electric Industrial Co., Ltd. | Run time synthesizer adaptation to improve intelligibility of synthesized speech |
CN1159702C (zh) | 2001-04-11 | 2004-07-28 | 国际商业机器公司 | 具有情感的语音-语音翻译系统和方法 |
US6570983B1 (en) * | 2001-07-06 | 2003-05-27 | At&T Wireless Services, Inc. | Method and system for audibly announcing an indication of an identity of a sender of a communication |
JP3589216B2 (ja) * | 2001-11-02 | 2004-11-17 | 日本電気株式会社 | 音声合成システム及び音声合成方法 |
US6816578B1 (en) * | 2001-11-27 | 2004-11-09 | Nortel Networks Limited | Efficient instant messaging using a telephony interface |
US20060069567A1 (en) * | 2001-12-10 | 2006-03-30 | Tischer Steven N | Methods, systems, and products for translating text to speech |
US7483832B2 (en) * | 2001-12-10 | 2009-01-27 | At&T Intellectual Property I, L.P. | Method and system for customizing voice translation of text to speech |
KR100450319B1 (ko) * | 2001-12-24 | 2004-10-01 | 한국전자통신연구원 | 가상 환경에서 참여자간의 의사전달 장치 및 방법 |
US7123695B2 (en) * | 2002-05-21 | 2006-10-17 | Bellsouth Intellectual Property Corporation | Voice message delivery over instant messaging |
US20050043951A1 (en) * | 2002-07-09 | 2005-02-24 | Schurter Eugene Terry | Voice instant messaging system |
FR2843479B1 (fr) * | 2002-08-07 | 2004-10-22 | Smart Inf Sa | Procede de calibrage d'audio-intonation |
US20040054534A1 (en) * | 2002-09-13 | 2004-03-18 | Junqua Jean-Claude | Client-server voice customization |
US8666747B2 (en) * | 2002-10-31 | 2014-03-04 | Verizon Business Global Llc | Providing information regarding interactive voice response sessions |
US7280968B2 (en) * | 2003-03-25 | 2007-10-09 | International Business Machines Corporation | Synthetically generated speech responses including prosodic characteristics of speech inputs |
JP4130190B2 (ja) * | 2003-04-28 | 2008-08-06 | 富士通株式会社 | 音声合成システム |
US8005677B2 (en) * | 2003-05-09 | 2011-08-23 | Cisco Technology, Inc. | Source-dependent text-to-speech system |
US20050027539A1 (en) * | 2003-07-30 | 2005-02-03 | Weber Dean C. | Media center controller system and method |
US8886538B2 (en) * | 2003-09-26 | 2014-11-11 | Nuance Communications, Inc. | Systems and methods for text-to-speech synthesis using spoken example |
US20050096909A1 (en) * | 2003-10-29 | 2005-05-05 | Raimo Bakis | Systems and methods for expressive text-to-speech |
US7454349B2 (en) * | 2003-12-15 | 2008-11-18 | Rsa Security Inc. | Virtual voiceprint system and method for generating voiceprints |
FR2865846A1 (fr) * | 2004-02-02 | 2005-08-05 | France Telecom | Systeme de synthese vocale |
US7877259B2 (en) * | 2004-03-05 | 2011-01-25 | Lessac Technologies, Inc. | Prosodic speech text codes and their use in computerized speech systems |
US7865365B2 (en) * | 2004-08-05 | 2011-01-04 | Nuance Communications, Inc. | Personalized voice playback for screen reader |
US7693719B2 (en) * | 2004-10-29 | 2010-04-06 | Microsoft Corporation | Providing personalized voice font for text-to-speech applications |
US7706510B2 (en) * | 2005-03-16 | 2010-04-27 | Research In Motion | System and method for personalized text-to-voice synthesis |
US7269561B2 (en) * | 2005-04-19 | 2007-09-11 | Motorola, Inc. | Bandwidth efficient digital voice communication system and method |
US8224647B2 (en) | 2005-10-03 | 2012-07-17 | Nuance Communications, Inc. | Text-to-speech user's voice cooperative server for instant messaging clients |
US8886537B2 (en) * | 2007-03-20 | 2014-11-11 | Nuance Communications, Inc. | Method and system for text-to-speech synthesis with personalized voice |
-
2005
- 2005-10-03 US US11/242,661 patent/US8224647B2/en active Active
-
2006
- 2006-06-26 CN CN200610093555.0A patent/CN1946065B/zh active Active
- 2006-09-29 JP JP2006270009A patent/JP2007102787A/ja active Pending
-
2012
- 2012-06-12 US US13/494,164 patent/US8428952B2/en active Active
-
2013
- 2013-03-20 US US13/847,850 patent/US9026445B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000122941A (ja) * | 1998-10-14 | 2000-04-28 | Matsushita Electric Ind Co Ltd | 電子メールを用いた情報転送方法 |
JP2001034280A (ja) * | 1999-07-21 | 2001-02-09 | Matsushita Electric Ind Co Ltd | 電子メール受信装置および電子メールシステム |
JP2005535012A (ja) * | 2002-07-31 | 2005-11-17 | インチェーン プロプライエタリー リミテッド | アニメーション化したメッセージング |
JP2005031919A (ja) * | 2003-07-10 | 2005-02-03 | Ntt Docomo Inc | 通信システム |
Also Published As
Publication number | Publication date |
---|---|
US9026445B2 (en) | 2015-05-05 |
US8428952B2 (en) | 2013-04-23 |
US20130218569A1 (en) | 2013-08-22 |
US20070078656A1 (en) | 2007-04-05 |
US20120253816A1 (en) | 2012-10-04 |
US8224647B2 (en) | 2012-07-17 |
CN1946065B (zh) | 2012-01-11 |
CN1946065A (zh) | 2007-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9026445B2 (en) | Text-to-speech user's voice cooperative server for instant messaging clients | |
KR102582291B1 (ko) | 감정 정보 기반의 음성 합성 방법 및 장치 | |
US8594995B2 (en) | Multilingual asynchronous communications of speech messages recorded in digital media files | |
JP3224000B2 (ja) | テキスト−音声変換システム | |
Taylor | Text-to-speech synthesis | |
US9761219B2 (en) | System and method for distributed text-to-speech synthesis and intelligibility | |
US8036894B2 (en) | Multi-unit approach to text-to-speech synthesis | |
US6308151B1 (en) | Method and system using a speech recognition system to dictate a body of text in response to an available body of text | |
JP2003289387A (ja) | ボイスメッセージ処理システムおよび方法 | |
US20070124142A1 (en) | Voice enabled knowledge system | |
KR20050122274A (ko) | 휴대용 장치에서 텍스트 음성 변환 처리를 위한 시스템 및방법 | |
US20080162559A1 (en) | Asynchronous communications regarding the subject matter of a media file stored on a handheld recording device | |
US20040098266A1 (en) | Personal speech font | |
US20090177473A1 (en) | Applying vocal characteristics from a target speaker to a source speaker for synthetic speech | |
JPH0981174A (ja) | 音声合成システムおよび音声合成方法 | |
JP2003271182A (ja) | 音響モデル作成装置及び音響モデル作成方法 | |
JP3691773B2 (ja) | 文章解析方法とその方法を利用可能な文章解析装置 | |
US20030216921A1 (en) | Method and system for limited domain text to speech (TTS) processing | |
US11335321B2 (en) | Building a text-to-speech system from a small amount of speech data | |
JPH09258785A (ja) | 情報処理方法および情報処理装置 | |
US20230335111A1 (en) | Method and system for text-to-speech synthesis of streaming text | |
Rajole et al. | Voice Based E-Mail System for Visually Impaired Peoples Using Computer Vision Techniques: An Overview | |
Mishra et al. | Voice Based Email System for Visually Impaired | |
HIX | H. REX HARTSON | |
Scholar | Andriod Based Punjabi TTS System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090928 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20090928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20090930 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20091217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120330 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121225 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130107 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20130125 |