JP2006517037A - 韻律的模擬語合成方法および装置 - Google Patents
韻律的模擬語合成方法および装置 Download PDFInfo
- Publication number
- JP2006517037A JP2006517037A JP2006502907A JP2006502907A JP2006517037A JP 2006517037 A JP2006517037 A JP 2006517037A JP 2006502907 A JP2006502907 A JP 2006502907A JP 2006502907 A JP2006502907 A JP 2006502907A JP 2006517037 A JP2006517037 A JP 2006517037A
- Authority
- JP
- Japan
- Prior art keywords
- prosodic
- pronounced
- utterance
- word
- nominal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
Abstract
Description
すでに簡単に説明したように、人の音声は、(語または音を構成している)本質的な内容ばかりでなく、語および音が生成される方法についての情報も含む。通常、一組のパラメータ(韻律的パラメータ)が、話された語または発声がどのようにして音声化されたのか、またどんなふうな音なのかを少なくとも部分的に記述する。韻律的パラメータの例としては、ピッチ、エネルギーおよびタイミングがある。韻律的内容をもっとよく使用すれば、もっと自然でもっと分かりやすい合成音声、すなわち、合成したオーディオ・インタフェースを使用する携帯電話のような現代の通信システムで役に立つ機能を生成することができる。
る。このシステムは、入力、出力、処理および記憶構成要素を含む。
オーディオ入力装置1000は発音した発声を受信する。オーディオ入力装置は、マイクロフォンである。より詳細に説明すると、携帯電話デバイス10による通信に使用するマイクロフォンである。
ームの長さが長すぎると、音声の合成が不正確になり品質が悪くなる恐れがある。一方、フレームの長さが短すぎると、もっと多くの計算リソース(処理、記憶装置等)が必要になる。上記実施形態の場合には、フレームの持続時間は約10〜20ミリ秒である。
韻律的模擬語発生器は、ステップ260において名目的フレームを受信し、また捕捉した実際のフレーム224、整合情報236、フレーム毎のピッチ・データ212、および名目的整合を含む名目的フレーム252を受信する。韻律的模擬語発生器は、発音した入力句102からのタイミング、エネルギーおよびピッチを有する一組の名目的フレームを出力する。これは韻律的模擬句262である。
ーソナル・プラナー、玩具、自動ナビゲーション装置、ホーム・エレクトロニクス、家庭用品、および通常のコンピューティング・デバイスを含むすべての音声駆動電子デバイスでも使用することができる。
Claims (14)
- 音声を合成するための方法であって、
発音した発声を受信するステップと、
前記発音した発声から1つまたは複数の韻律的パラメータを抽出するステップと、
認識した語を供給するために前記発音した発声を復号するステップと、
前記認識した語に対応する名目的語を合成するステップと、
前記名目的語および前記1つまたは複数の韻律的パラメータにより、韻律的模擬語を生成するステップと、を含む方法。 - 1つまたは複数の韻律的パラメータがピッチを含む請求項1に記載の方法。
- 1つまたは複数の韻律的パラメータがタイミングを含む請求項1に記載の方法。
- 1つまたは複数の韻律的パラメータがエネルギーを含む請求項1に記載の方法。
- 前記発音した発声と前記名目的語との一時的整合をさらに含む請求項1に記載の方法。
- 前記発音した発声の単音と前記名目的語の単音との一時的整合をさらに含む請求項1に記載の方法。
- 前記韻律的模擬語の対応するオーディオ信号への変換をさらに含む請求項1に記載の方法。
- 前記発音した発声が電話入力装置により受信され、前記韻律的模擬語が電話出力装置に供給される請求項1に記載の方法。
- 音声を合成するためのシステムであって、
発音した発声を受信するオーディオ入力装置と、
前記発音した発声の1つまたは複数の韻律的パラメータを決定する信号プロセッサと、
前記発音した発声を認識し、対応する認識した語を供給する復号装置と、
前記認識した語に対応する名目的語を合成する音声合成装置と、
前記名目的語と前記1つまたは複数の韻律的パラメータを受信し、韻律的模擬語を生成する韻律的模擬語発生器と、を備えるシステム。 - 前記復号装置が音声認識エンジンを備える請求項8に記載のシステム。
- 前記システムが携帯電話デバイス上に位置する請求項8に記載のシステム。
- 音声分析および処理のために実行することができる命令を含む記憶装置をさらに備える請求項8に記載のシステム。
- プロセッサ上で実行することができる記憶している命令を含むコンピュータ読み取り可能媒体であって、
発音した発声を受信するための命令と、
前記発音した発声から韻律的パラメータを抽出するための命令と、
認識した語を供給するために前記発音した発声を復号するための命令と、
前記認識した語に対応する名目的語を合成するための命令と、
前記名目的語および前記韻律的パラメータにより韻律的模擬語を生成するための命令と、を含むコンピュータ読み取り可能媒体。 - 前記媒体が、携帯電話装置内に配置され、ユーザ・インタフェースと一緒に動作する請求項12に記載のコンピュータ読み取り可能媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US44226703P | 2003-01-24 | 2003-01-24 | |
US10/657,421 US8768701B2 (en) | 2003-01-24 | 2003-09-08 | Prosodic mimic method and apparatus |
PCT/US2004/001520 WO2004068466A1 (en) | 2003-01-24 | 2004-01-21 | Prosodic mimic synthesis method and apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006517037A true JP2006517037A (ja) | 2006-07-13 |
Family
ID=32738387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006502907A Pending JP2006517037A (ja) | 2003-01-24 | 2004-01-21 | 韻律的模擬語合成方法および装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8768701B2 (ja) |
JP (1) | JP2006517037A (ja) |
CN (1) | CN1742321B (ja) |
DE (1) | DE112004000187T5 (ja) |
WO (1) | WO2004068466A1 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US7392185B2 (en) | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US7050977B1 (en) | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
US9076448B2 (en) | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
JP4483450B2 (ja) * | 2004-07-22 | 2010-06-16 | 株式会社デンソー | 音声案内装置、音声案内方法およびナビゲーション装置 |
JP4456537B2 (ja) * | 2004-09-14 | 2010-04-28 | 本田技研工業株式会社 | 情報伝達装置 |
US7558389B2 (en) * | 2004-10-01 | 2009-07-07 | At&T Intellectual Property Ii, L.P. | Method and system of generating a speech signal with overlayed random frequency signal |
US7533018B2 (en) * | 2004-10-19 | 2009-05-12 | Motorola, Inc. | Tailored speaker-independent voice recognition system |
US20060122834A1 (en) * | 2004-12-03 | 2006-06-08 | Bennett Ian M | Emotion detection device & method for use in distributed systems |
TWI277947B (en) * | 2005-09-14 | 2007-04-01 | Delta Electronics Inc | Interactive speech correcting method |
KR100690243B1 (ko) * | 2006-06-07 | 2007-03-12 | 삼성전자주식회사 | 휴대 단말기의 카메라 제어 장치 및 방법 |
JP4859642B2 (ja) * | 2006-11-30 | 2012-01-25 | 富士通株式会社 | 音声情報管理装置 |
US10019995B1 (en) | 2011-03-01 | 2018-07-10 | Alice J. Stiebel | Methods and systems for language learning based on a series of pitch patterns |
US11062615B1 (en) | 2011-03-01 | 2021-07-13 | Intelligibility Training LLC | Methods and systems for remote language learning in a pandemic-aware world |
JP5954348B2 (ja) * | 2013-05-31 | 2016-07-20 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
EP3007165B1 (en) | 2013-05-31 | 2018-08-01 | Yamaha Corporation | Technology for responding to remarks using speech synthesis |
JP5807921B2 (ja) * | 2013-08-23 | 2015-11-10 | 国立研究開発法人情報通信研究機構 | 定量的f0パターン生成装置及び方法、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
JP6446993B2 (ja) | 2014-10-20 | 2019-01-09 | ヤマハ株式会社 | 音声制御装置およびプログラム |
US10339925B1 (en) * | 2016-09-26 | 2019-07-02 | Amazon Technologies, Inc. | Generation of automated message responses |
US10586079B2 (en) | 2016-12-23 | 2020-03-10 | Soundhound, Inc. | Parametric adaptation of voice synthesis |
DE102016125606A1 (de) * | 2016-12-23 | 2018-06-28 | Miele & Cie. Kg | Verfahren und Vorrichtung zum Betreiben eines Haushaltgeräts und Haushaltgerät |
US10600404B2 (en) * | 2017-11-29 | 2020-03-24 | Intel Corporation | Automatic speech imitation |
US10706347B2 (en) | 2018-09-17 | 2020-07-07 | Intel Corporation | Apparatus and methods for generating context-aware artificial intelligence characters |
US20190051302A1 (en) * | 2018-09-24 | 2019-02-14 | Intel Corporation | Technologies for contextual natural language generation in a vehicle |
CN113516963B (zh) * | 2020-04-09 | 2023-11-10 | 菜鸟智能物流控股有限公司 | 音频数据的生成方法、装置、服务器和智能音箱 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0511794A (ja) * | 1991-07-01 | 1993-01-22 | Ricoh Co Ltd | 音声合成装置 |
JPH09152884A (ja) * | 1995-11-30 | 1997-06-10 | Fujitsu Ten Ltd | 音声合成装置 |
JPH11112633A (ja) * | 1997-10-07 | 1999-04-23 | Nec Saitama Ltd | 携帯電話 |
JPH11143483A (ja) * | 1997-08-15 | 1999-05-28 | Hiroshi Kurita | 音声発生システム |
JPH11175082A (ja) * | 1997-12-10 | 1999-07-02 | Toshiba Corp | 音声対話装置及び音声対話用音声合成方法 |
JP2000066694A (ja) * | 1998-08-21 | 2000-03-03 | Sanyo Electric Co Ltd | 音声合成装置および音声合成方法 |
JP2000231396A (ja) * | 1999-02-09 | 2000-08-22 | Matsushita Electric Ind Co Ltd | セリフデータ作成装置、セリフ再生装置、音声分析合成装置及び音声情報転送装置 |
JP2001184099A (ja) * | 1999-12-22 | 2001-07-06 | Yamaha Corp | 音声変換装置及び音声変換方法 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2729487B2 (ja) | 1988-07-20 | 1998-03-18 | ライオン株式会社 | 集塵材 |
US5796916A (en) * | 1993-01-21 | 1998-08-18 | Apple Computer, Inc. | Method and apparatus for prosody for synthetic speech prosody determination |
GB2290684A (en) * | 1994-06-22 | 1996-01-03 | Ibm | Speech synthesis using hidden Markov model to determine speech unit durations |
JPH0878778A (ja) * | 1994-09-07 | 1996-03-22 | Mitsubishi Electric Corp | 半導体レーザ装置,及びその製造方法 |
US5842168A (en) * | 1995-08-21 | 1998-11-24 | Seiko Epson Corporation | Cartridge-based, interactive speech recognition device with response-creation capability |
DE19610019C2 (de) * | 1996-03-14 | 1999-10-28 | Data Software Gmbh G | Digitales Sprachsyntheseverfahren |
JPH10153998A (ja) * | 1996-09-24 | 1998-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置 |
JPH10260692A (ja) * | 1997-03-18 | 1998-09-29 | Toshiba Corp | 音声の認識合成符号化/復号化方法及び音声符号化/復号化システム |
US5884266A (en) * | 1997-04-02 | 1999-03-16 | Motorola, Inc. | Audio interface for document based information resource navigation and method therefor |
DE19751123C1 (de) | 1997-11-19 | 1999-06-17 | Deutsche Telekom Ag | Vorrichtung und Verfahren zur sprecherunabhängigen Sprachnamenwahl für Telekommunikations-Endeinrichtungen |
US6081780A (en) * | 1998-04-28 | 2000-06-27 | International Business Machines Corporation | TTS and prosody based authoring system |
JP4367808B2 (ja) * | 1999-12-03 | 2009-11-18 | 富士通株式会社 | 音声データ圧縮・解凍装置及び方法 |
JP4296714B2 (ja) | 2000-10-11 | 2009-07-15 | ソニー株式会社 | ロボット制御装置およびロボット制御方法、記録媒体、並びにプログラム |
JP4867076B2 (ja) * | 2001-03-28 | 2012-02-01 | 日本電気株式会社 | 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法 |
CN1156819C (zh) * | 2001-04-06 | 2004-07-07 | 国际商业机器公司 | 由文本生成个性化语音的方法 |
WO2002097590A2 (en) | 2001-05-30 | 2002-12-05 | Cameronsound, Inc. | Language independent and voice operated information management system |
EP1262954A1 (en) * | 2001-05-30 | 2002-12-04 | Telefonaktiebolaget L M Ericsson (Publ) | Method and apparatus for verbal entry of digits or commands |
EP1271469A1 (en) | 2001-06-22 | 2003-01-02 | Sony International (Europe) GmbH | Method for generating personality patterns and for synthesizing speech |
US20030093280A1 (en) * | 2001-07-13 | 2003-05-15 | Pierre-Yves Oudeyer | Method and apparatus for synthesising an emotion conveyed on a sound |
EP1298647B1 (en) * | 2001-09-28 | 2005-11-16 | Alcatel | A communication device and a method for transmitting and receiving of natural speech, comprising a speech recognition module coupled to an encoder |
US7321854B2 (en) * | 2002-09-19 | 2008-01-22 | The Penn State Research Foundation | Prosody based audio/visual co-analysis for co-verbal gesture recognition |
US20040073428A1 (en) * | 2002-10-10 | 2004-04-15 | Igor Zlokarnik | Apparatus, methods, and programming for speech synthesis via bit manipulations of compressed database |
US7124082B2 (en) * | 2002-10-11 | 2006-10-17 | Twisted Innovations | Phonetic speech-to-text-to-speech system and method |
WO2004049304A1 (ja) * | 2002-11-25 | 2004-06-10 | Matsushita Electric Industrial Co., Ltd. | 音声合成方法および音声合成装置 |
US7280968B2 (en) * | 2003-03-25 | 2007-10-09 | International Business Machines Corporation | Synthetically generated speech responses including prosodic characteristics of speech inputs |
US8886538B2 (en) * | 2003-09-26 | 2014-11-11 | Nuance Communications, Inc. | Systems and methods for text-to-speech synthesis using spoken example |
-
2003
- 2003-09-08 US US10/657,421 patent/US8768701B2/en active Active
-
2004
- 2004-01-21 DE DE112004000187T patent/DE112004000187T5/de not_active Ceased
- 2004-01-21 WO PCT/US2004/001520 patent/WO2004068466A1/en active Application Filing
- 2004-01-21 CN CN2004800026542A patent/CN1742321B/zh not_active Expired - Fee Related
- 2004-01-21 JP JP2006502907A patent/JP2006517037A/ja active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0511794A (ja) * | 1991-07-01 | 1993-01-22 | Ricoh Co Ltd | 音声合成装置 |
JPH09152884A (ja) * | 1995-11-30 | 1997-06-10 | Fujitsu Ten Ltd | 音声合成装置 |
JPH11143483A (ja) * | 1997-08-15 | 1999-05-28 | Hiroshi Kurita | 音声発生システム |
JPH11112633A (ja) * | 1997-10-07 | 1999-04-23 | Nec Saitama Ltd | 携帯電話 |
JPH11175082A (ja) * | 1997-12-10 | 1999-07-02 | Toshiba Corp | 音声対話装置及び音声対話用音声合成方法 |
JP2000066694A (ja) * | 1998-08-21 | 2000-03-03 | Sanyo Electric Co Ltd | 音声合成装置および音声合成方法 |
JP2000231396A (ja) * | 1999-02-09 | 2000-08-22 | Matsushita Electric Ind Co Ltd | セリフデータ作成装置、セリフ再生装置、音声分析合成装置及び音声情報転送装置 |
JP2001184099A (ja) * | 1999-12-22 | 2001-07-06 | Yamaha Corp | 音声変換装置及び音声変換方法 |
Also Published As
Publication number | Publication date |
---|---|
DE112004000187T5 (de) | 2005-12-01 |
US20040148172A1 (en) | 2004-07-29 |
US8768701B2 (en) | 2014-07-01 |
CN1742321B (zh) | 2010-08-18 |
WO2004068466A1 (en) | 2004-08-12 |
CN1742321A (zh) | 2006-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006517037A (ja) | 韻律的模擬語合成方法および装置 | |
US10789290B2 (en) | Audio data processing method and apparatus, and computer storage medium | |
JP7244665B2 (ja) | エンドツーエンドの音声変換 | |
US7739113B2 (en) | Voice synthesizer, voice synthesizing method, and computer program | |
TWI281146B (en) | Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition | |
JP4246792B2 (ja) | 声質変換装置および声質変換方法 | |
JPH10507536A (ja) | 言語認識 | |
JP2002304190A (ja) | 発音変化形生成方法及び音声認識方法 | |
WO2002097590A2 (en) | Language independent and voice operated information management system | |
CN101901598A (zh) | 一种哼唱合成方法和系统 | |
US10143027B1 (en) | Device selection for routing of communications | |
WO2008147649A1 (en) | Method for synthesizing speech | |
EP1899955B1 (en) | Speech dialog method and system | |
JP2001034280A (ja) | 電子メール受信装置および電子メールシステム | |
US20070055524A1 (en) | Speech dialog method and device | |
CN113421571B (zh) | 一种语音转换方法、装置、电子设备和存储介质 | |
EP1271469A1 (en) | Method for generating personality patterns and for synthesizing speech | |
WO2018173295A1 (ja) | ユーザインタフェース装置及び方法、並びに音操作システム | |
US11172527B2 (en) | Routing of communications to a device | |
JP2005208394A (ja) | 歌声生成装置、そのプログラム並びに歌声生成機能を有する携帯通信端末 | |
CN114464151B (zh) | 修音方法及装置 | |
JP2004271620A (ja) | 携帯端末 | |
JP6911398B2 (ja) | 音声対話方法、音声対話装置およびプログラム | |
JP2004004182A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
CN113870828A (zh) | 音频合成方法、装置、电子设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100506 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100513 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100802 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100831 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110426 |