JP4884212B2 - 音声合成装置 - Google Patents
音声合成装置 Download PDFInfo
- Publication number
- JP4884212B2 JP4884212B2 JP2006511572A JP2006511572A JP4884212B2 JP 4884212 B2 JP4884212 B2 JP 4884212B2 JP 2006511572 A JP2006511572 A JP 2006511572A JP 2006511572 A JP2006511572 A JP 2006511572A JP 4884212 B2 JP4884212 B2 JP 4884212B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- unit
- data
- voice
- synthesizer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
- G10L13/07—Concatenation rules
Description
α2、α3…組込みマイコン
β、β2、β3…パーソナルコンピュータ
γ…音声合成システム
1…音声データベース
2…テキスト解析部
3…韻律予測部
3A…韻律知識ベース
4…音声単位抽出部
5…波形接続部
6…データ入力部
7…音声変換処理部
8…話速変換部
11…CPU
12…ROM
13…RAM
14…メモリカード
15…シリアルインタフェース
16…D/Aコンバータ
21…入力手段
22…スピーカ
まず、図1は、本発明の一形態例に係る音声合成装置の機能構成図である。
System)と、テキスト解析部2、韻律予測部3、音声単位抽出部4、波形接続部5の各機能を音声合成装置αのCPU11に実行させるための処理プログラム等が記録されるとよい。
まず、構成例1としては上記形態例にて説明した、図1の機能構成図に示す各機能部1〜7全てをマイコンに組込んだ音声合成装置αを機能構成例1とする。
さらに、構成例1の音声合成装置αに合成音声の読み上げ速度調節機能である話速変換部8を付加し、構成例1と同様に図2に記載される全機能部1〜8を一個のケースに一体装備した音声合成装置α2を機能構成例2とする。
次に図5は、図1に示す音声合成装置αにおける波形接続部5、音声変換処理部7を抽出選択し組込みマイコンα2に搭載し、他の各機能部を別途設置したパーソナルコンピュータに組み込むことにより一連の音声合成処理を実行する音声合成システムγの構成例を示す機能構成図である。
次に、図6は、図5と同様に図1に示す音声合成装置αの機能部1と3〜5、7を一部抽出選択した組込みマイコンα3の機能構成図である。
Claims (2)
- 所定文章を人間の肉声にて録音し音声文章化したものを収録し当該音声文章をデジタルデータとして変換したものである音声データの中から利用者の利用用途に応じた所定の音声単位毎に音声素片波形データとして抽出可能に複数を選択蓄積した音声データベースを搭載することにより、任意のテキストデータに対して前記音声データベースを利用してコーパスベース音声合成を行うための音声合成装置であって、
シリアルデータからテキストデータを取得するデータ入力部と、
当該テキストデータ中の前記任意の文章に対応する音を母音と子音で示す表音記号を表音記号データとして生成処理するテキスト解析部と、
事前に設定された文脈に基づく語句の韻律の規則性をアルゴリズム化した韻律知識ベースに従って、解析された当該テキストデータ中の任意の文章の文脈から前記表音記号データのそれぞれに対応する前記韻律を決定し、当該韻律を示す韻律パラメータを生成する韻律予測部と、
当該音声合成装置の用途に応じた所要の前記音声単位のみを有するよう事前に選択収録された所定の前記音声データのみを複数蓄積する前記音声データベースに基づき、当該韻律予測部にて生成した前記韻律パラメータのそれぞれに最も近い前記所定の音声単位部分を有した前記音声データのそれぞれから、該当する当該所定の音声単位部分の前記音声素片波形データの全てを抽出する音声単位抽出部と、
当該音声単位抽出部にて抽出した前記音声素片波形データ群を、前記文章順に、当該音声素片波形データ群の示す音声波形が連続となるよう順次波形接続することで合成音声データを生成する波形接続部と、
当該合成音声データをアナログ音声に変換出力する音声変換処理部と、
当該音声変換処理部に前置した、前記データ入力部により前記任意の文章とともに取得した速度のパラメータを前記波形接続部より生成された前記音声合成データに反映させ、当該合成音声データの読み上げ速度を調整する話速変換部と、を具備し、
前記音声データベースは、前記音声合成装置に着脱可能なメモリカード上に構築され、当該音声合成装置に当該メモリカードが装着されたときに、前記音声単位抽出部から読み取り可能とし、
前記データ入力部は、当該音声合成装置が組込み搭載された他の機器と接続されて、当該機器からテキストデータであるシリアルデータを受信するとともに、
前記波形接続部及び前記音声変換処理部は、抽出選択されて組込みマイコンに搭載され、当該組込みマイコンが、前記データ入力部、前記テキスト解析部、前記韻律予測部、前記音声単位抽出部及び前記話速変換部を備えた他の機器にネットワーク接続または組込み搭載されるよう、構成される、
ことを特徴とする音声合成装置。 - 前記所定の音声単位は、
音素、単語、フレーズ、シラブルのうち1以上である、
ことを特徴とする請求項1に記載の音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006511572A JP4884212B2 (ja) | 2004-03-29 | 2005-03-29 | 音声合成装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004094071 | 2004-03-29 | ||
JP2004094071 | 2004-03-29 | ||
PCT/JP2005/005815 WO2005093713A1 (ja) | 2004-03-29 | 2005-03-29 | 音声合成装置 |
JP2006511572A JP4884212B2 (ja) | 2004-03-29 | 2005-03-29 | 音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2005093713A1 JPWO2005093713A1 (ja) | 2008-07-31 |
JP4884212B2 true JP4884212B2 (ja) | 2012-02-29 |
Family
ID=35056415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006511572A Expired - Fee Related JP4884212B2 (ja) | 2004-03-29 | 2005-03-29 | 音声合成装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20070203703A1 (ja) |
JP (1) | JP4884212B2 (ja) |
WO (1) | WO2005093713A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070203705A1 (en) * | 2005-12-30 | 2007-08-30 | Inci Ozkaragoz | Database storing syllables and sound units for use in text to speech synthesis system |
JP2007240988A (ja) * | 2006-03-09 | 2007-09-20 | Kenwood Corp | 音声合成装置、データベース、音声合成方法及びプログラム |
JP2007240987A (ja) * | 2006-03-09 | 2007-09-20 | Kenwood Corp | 音声合成装置、音声合成方法及びプログラム |
JP2007240989A (ja) * | 2006-03-09 | 2007-09-20 | Kenwood Corp | 音声合成装置、音声合成方法及びプログラム |
JP2007240990A (ja) * | 2006-03-09 | 2007-09-20 | Kenwood Corp | 音声合成装置、音声合成方法及びプログラム |
US8510113B1 (en) * | 2006-08-31 | 2013-08-13 | At&T Intellectual Property Ii, L.P. | Method and system for enhancing a speech database |
US8175879B2 (en) * | 2007-08-08 | 2012-05-08 | Lessac Technologies, Inc. | System-effected text annotation for expressive prosody in speech synthesis and recognition |
RU2421827C2 (ru) * | 2009-08-07 | 2011-06-20 | Общество с ограниченной ответственностью "Центр речевых технологий" | Способ синтеза речи |
TWI413105B (zh) | 2010-12-30 | 2013-10-21 | Ind Tech Res Inst | 多語言之文字轉語音合成系統與方法 |
US10469623B2 (en) * | 2012-01-26 | 2019-11-05 | ZOOM International a.s. | Phrase labeling within spoken audio recordings |
JP6214435B2 (ja) * | 2014-03-12 | 2017-10-18 | 東京テレメッセージ株式会社 | 地域に設置された複数の屋外拡声器により音声メッセージを同報するシステムにおける聴き取りやすさの改善 |
US10192541B2 (en) * | 2014-06-05 | 2019-01-29 | Nuance Communications, Inc. | Systems and methods for generating speech of multiple styles from text |
JP6695069B2 (ja) * | 2016-05-31 | 2020-05-20 | パナソニックIpマネジメント株式会社 | 電話装置 |
CN110782871B (zh) | 2019-10-30 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 一种韵律停顿预测方法、装置以及电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11143483A (ja) * | 1997-08-15 | 1999-05-28 | Hiroshi Kurita | 音声発生システム |
JP2000231395A (ja) * | 1999-02-08 | 2000-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法及び装置 |
JP2001296878A (ja) * | 2000-04-14 | 2001-10-26 | Fujitsu Ltd | 音声合成用辞書作成装置及び方法 |
JP2002328694A (ja) * | 2001-03-02 | 2002-11-15 | Matsushita Electric Ind Co Ltd | 携帯端末装置及び読み上げシステム |
JP2003036089A (ja) * | 2001-07-24 | 2003-02-07 | Matsushita Electric Ind Co Ltd | テキスト音声合成方法とテキスト音声合成装置 |
JP2003114692A (ja) * | 2001-10-05 | 2003-04-18 | Toyota Motor Corp | 音源データの提供システム、端末、玩具、提供方法、プログラム、および媒体 |
JP2003186489A (ja) * | 2001-12-14 | 2003-07-04 | Omron Corp | 音声情報データベース作成システム,録音原稿作成装置および方法,録音管理装置および方法,ならびにラベリング装置および方法 |
WO2003065349A2 (en) * | 2002-01-29 | 2003-08-07 | Lessac Technology, Inc. | Text to speech |
JP2003223181A (ja) * | 2002-01-29 | 2003-08-08 | Yamaha Corp | 文字−音声変換装置およびそれを用いた携帯端末装置 |
JP2003271200A (ja) * | 2002-03-18 | 2003-09-25 | Matsushita Electric Ind Co Ltd | 音声合成方法および音声合成装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1138989A (ja) * | 1997-07-14 | 1999-02-12 | Toshiba Corp | 音声合成装置及び方法 |
JP3450237B2 (ja) * | 1999-10-06 | 2003-09-22 | 株式会社アルカディア | 音声合成装置および方法 |
JP3728172B2 (ja) * | 2000-03-31 | 2005-12-21 | キヤノン株式会社 | 音声合成方法および装置 |
US20020156630A1 (en) * | 2001-03-02 | 2002-10-24 | Kazunori Hayashi | Reading system and information terminal |
-
2005
- 2005-03-29 US US10/592,071 patent/US20070203703A1/en not_active Abandoned
- 2005-03-29 JP JP2006511572A patent/JP4884212B2/ja not_active Expired - Fee Related
- 2005-03-29 WO PCT/JP2005/005815 patent/WO2005093713A1/ja active Application Filing
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11143483A (ja) * | 1997-08-15 | 1999-05-28 | Hiroshi Kurita | 音声発生システム |
JP2000231395A (ja) * | 1999-02-08 | 2000-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法及び装置 |
JP2001296878A (ja) * | 2000-04-14 | 2001-10-26 | Fujitsu Ltd | 音声合成用辞書作成装置及び方法 |
JP2002328694A (ja) * | 2001-03-02 | 2002-11-15 | Matsushita Electric Ind Co Ltd | 携帯端末装置及び読み上げシステム |
JP2003036089A (ja) * | 2001-07-24 | 2003-02-07 | Matsushita Electric Ind Co Ltd | テキスト音声合成方法とテキスト音声合成装置 |
JP2003114692A (ja) * | 2001-10-05 | 2003-04-18 | Toyota Motor Corp | 音源データの提供システム、端末、玩具、提供方法、プログラム、および媒体 |
JP2003186489A (ja) * | 2001-12-14 | 2003-07-04 | Omron Corp | 音声情報データベース作成システム,録音原稿作成装置および方法,録音管理装置および方法,ならびにラベリング装置および方法 |
WO2003065349A2 (en) * | 2002-01-29 | 2003-08-07 | Lessac Technology, Inc. | Text to speech |
JP2003223181A (ja) * | 2002-01-29 | 2003-08-08 | Yamaha Corp | 文字−音声変換装置およびそれを用いた携帯端末装置 |
JP2005516262A (ja) * | 2002-01-29 | 2005-06-02 | レサック テクノロジー インコーポレイテッド | 音声合成 |
JP2003271200A (ja) * | 2002-03-18 | 2003-09-25 | Matsushita Electric Ind Co Ltd | 音声合成方法および音声合成装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2005093713A1 (ja) | 2005-10-06 |
JPWO2005093713A1 (ja) | 2008-07-31 |
US20070203703A1 (en) | 2007-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4884212B2 (ja) | 音声合成装置 | |
CN105788589B (zh) | 一种音频数据的处理方法及装置 | |
Theune et al. | Generating expressive speech for storytelling applications | |
US5774854A (en) | Text to speech system | |
Kuligowska et al. | Speech synthesis systems: disadvantages and limitations | |
EP2704092A2 (en) | System for creating musical content using a client terminal | |
Qian et al. | A cross-language state sharing and mapping approach to bilingual (Mandarin–English) TTS | |
JP5507260B2 (ja) | 発話音声プロンプトを作成するシステム及び技法 | |
CN101156196A (zh) | 混合语音合成器、方法和使用 | |
KR101097186B1 (ko) | 대화체 앞뒤 문장정보를 이용한 다국어 음성합성 시스템 및 방법 | |
US20230148275A1 (en) | Speech synthesis device and speech synthesis method | |
Campbell | Evaluation of speech synthesis: from reading machines to talking machines | |
EP1271469A1 (en) | Method for generating personality patterns and for synthesizing speech | |
Ni et al. | Quantitative and structural modeling of voice fundamental frequency contours of speech in Mandarin | |
Damper | Speech technology—implications for biomedical engineering | |
JP4409279B2 (ja) | 音声合成装置及び音声合成プログラム | |
Shiga et al. | Multilingual speech synthesis system | |
Henton | Challenges and rewards in using parametric or concatenative speech synthesis | |
JPH1152987A (ja) | 話者適応機能を持つ音声合成装置 | |
JP2003029774A (ja) | 音声波形辞書配信システム、音声波形辞書作成装置、及び音声合成端末装置 | |
KR100806287B1 (ko) | 문말 억양 예측 방법 및 이를 기반으로 하는 음성합성 방법및 시스템 | |
JPH0950286A (ja) | 音声合成装置及びこれに使用する記録媒体 | |
Narendra et al. | Development of Bengali screen reader using Festival speech synthesizer | |
Bharadwaj et al. | Analysis of Prosodic features for the degree of emotions of an Assamese Emotional Speech | |
JP4056647B2 (ja) | 波形接続型音声合成装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061227 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070302 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100405 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101221 |
|
AA91 | Notification that invitation to amend document was cancelled |
Free format text: JAPANESE INTERMEDIATE CODE: A971091 Effective date: 20110118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110128 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110502 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111130 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141216 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |