JP2014021136A - 音声合成システム - Google Patents
音声合成システム Download PDFInfo
- Publication number
- JP2014021136A JP2014021136A JP2012156123A JP2012156123A JP2014021136A JP 2014021136 A JP2014021136 A JP 2014021136A JP 2012156123 A JP2012156123 A JP 2012156123A JP 2012156123 A JP2012156123 A JP 2012156123A JP 2014021136 A JP2014021136 A JP 2014021136A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- unit
- speech synthesis
- voice
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
- G10L13/047—Architecture of speech synthesisers
Abstract
【解決手段】公開されたインターフェイス部と、インターフェイス部を介して外部端末から音声の入力を受付ける音声入力受付部と、インターフェイス部を介して外部端末から音声所有者に関する情報を受付ける登録用情報受付部と、前記音声から作成する音声辞書セットをその音声の入力者に関する登録用情報と関連付けて保持する音声辞書セット保持部と、インターフェイス部を介して外部端末から音声辞書セットを選択できる音声辞書セット選択部とを有するサーバ装置を含む音声合成システムなどを提案する。
【選択図】図1
Description
<<実施形態1>>
<概要>
<機能的構成>
このように、インターフェイス部は、基本的に不特定多数からのアクセスを受けて、音声の登録と、登録された音声の利用を可能とする市場創設機能を実現する。つまり、インターフェイス部によって音声があたかも商品であるかのように取り引きされ、今まで広く取引の対象足り得なかった音声という情報を誰でも自由に商品として販売し、商品として購入することを可能とした。
<サーバ装置の具体的な構成>
CPUは、「インターフェイスプログラム」を実行し、サーバ装置の音声入力受付部や音声辞書セット選択部などをネットワーク上で外部端末に対し公開するためのインターフェイスを構成する処理を行う。
CPUは、「音声入力受付プログラム」を実行し、インターフェイスを介して話者の音声情報を外部端末から取得する処理を行い、当該情報をメインメモリの所定のアドレスに格納する。ここで、音声情報は、外部端末装置にてAD変換されたデジタル信号として取得する。音声情報の入力時間が予め指定された時間に満たない場合には、当該時点までの音声情報を記憶装置の所定のアドレスに格納し、音声情報の入力が再開される際に記憶装置の前記所定のアドレスから未完成の音声情報を読み出し、さらに音声情報の入力を受ける。
CPUは、「登録用情報受付プログラム」を実行し、インターフェイスを介して外部端末から出力された登録用情報を受付ける処理を行い、当該情報をメインメモリの所定のアドレスに格納する。
CPUは「音声辞書セット保持プログラム」を実行し、所定のアドレスに格納した前記音声情報及び登録用情報を読み出したうえで、当該情報から韻律モデルと音声データとを抽出する処理を行い、当該処理により得られた情報と登録用情報とを音声辞書セットとしてメインメモリの所定のアドレスに格納する。
CPUは「音声辞書セット選択プログラム」を実行し、外部端末からインターフェイスを介してなされる指示に基づき保持する複数の音声辞書セットのうち当該指示内容に適合する音声辞書セットを選択する処理を行い、処理結果をメインメモリの所定のアドレスに格納する。
<処理の流れ>
<効果>
<<実施形態2>>
<概要>
<機能的構成>
<サーバ装置の具体的な構成>
(読上用テキスト入力受付部の具体的な処理)
<処理の流れ>
<効果>
<<実施形態3>>
<概要>
<機能的構成>
<サーバ装置の具体的な構成>
(第一禁止テキストリスト保持手段の具体的な処理)
(第一比較手段の具体的な処理)
(第一禁止処理手段の具体的な処理)
<処理の流れ>
<効果>
<<実施形態4>>
<概要>
<機能的構成>
<サーバ装置の具体的な構成>
(中間言語セット作成部の具体的な処理)
<処理の流れ>
<効果>
<<実施形態5>>
<概要>
<機能的構成>
<サーバ装置の具体的な構成>
(第二禁止テキストリスト保持手段の具体的な処理)
(第二比較手段の具体的な処理)
(第二禁止処理手段の具体的な処理)
<処理の流れ>
<効果>
<<実施形態6>>
<概要>
<機能的構成>
<サーバ装置の具体的な構成>
CPUは、「中間言語セット出力プログラム」を実行し、生成した中間言語セットをインターフェイスを介して外部端末に対して出力する処理を行う。
<処理の流れ>
<効果>
<<実施形態7>>
<概要>
<機能的構成>
<音声合成端末の具体的な構成>
(選択命令出力部の具体的な処理)
(音声辞書セット取得部の具体的な処理)
(音声合成部の具体的処理)
<処理の流れ>
<効果>
<<実施形態8>>
<概要>
<機能的構成>
<音声合成端末の具体的な構成>
CPUは、「読上用テキスト出力プログラム」を実行し、通信装置を介し、読上用テキストをサーバ装置の読上用テキスト入力受付部に対して送信する。
CPUは、「中間言語セット取得プログラム」を実行し、通信装置を介し、前記読上用テキスト出力プログラムを実行して送信した読上用テキストに対応した中間言語セットをサーバ装置の中間言語セット出力部から取得し、メインメモリ上の所定のアドレスに格納する。
CPUは、「中間言語セット送出プログラム」を実行し、メインメモリの所定のアドレスから中間言語セットを読み出し、音声合成部に出力する処理を行う。
<処理の流れ>
<効果>
<<実施形態9>>
<概要>
<機能的構成>
<音声合成端末の具体的な構成>
(アプリケーション動作部の具体的な処理)
(音声辞書セット切替部の具体的な処理)
<処理の流れ>
<効果>
<<実施形態10>>
<概要>
<機能的構成>
<音声合成端末の具体的な構成>
(同期部の具体的な処理)
<処理の流れ>
<効果>
1901・・・インターフェイス部
1902・・・音声入力受付部
1903・・・登録用情報受付部
1904・・・音声辞書セット保持部
1905・・・音声辞書セット選択部
1906・・・読上用テキスト入力受付部
1907・・・中間言語セット作成部
1908・・・中間言語セット出力部
2100・・・サーバ装置
2101・・・インターフェイス部
2102・・・音声入力受付部
2103・・・登録用情報受付部
2104・・・音声辞書セット保持部
2105・・・音声辞書セット選択部
2300・・・サーバ装置
2301・・・インターフェイス部
2302・・・音声入力受付部
2303・・・登録用情報受付部
2304・・・音声辞書セット保持部
2305・・・音声辞書セット選択部
Claims (10)
- 読上用テキストと音声辞書セットとを用いて音声合成をする音声合成システムであって、
公開されたインターフェイス部と、
前記インターフェイス部を介して外部端末から音声辞書セット作成用の音声の入力を受付ける音声入力受付部と、
前記インターフェイス部を介して外部端末から音声の入力者である音声所有者に関する登録用情報を受付ける登録用情報受付部と、
前記入力を受付けた音声から作成する音声辞書セットをその音声の入力者に関する登録用情報と関連付けて保持する音声辞書セット保持部と、
前記インターフェイス部を介して外部端末から音声辞書セット保持部に保持された音声辞書セットを選択できる音声辞書セット選択部と、
を有するサーバ装置を含む音声合成システム。 - 前記サーバ装置は、
前記インターフェイス部を介して読上用テキストの入力を受付ける読上用テキスト入力受付部をさらに有する請求項1に記載の音声合成システム。 - 前記読上用テキスト入力受付部は、
禁止処理をすべきテキストのリストである第一禁止テキストリスト保持手段と、
入力された読上用テキストと第一禁止テキストリストとを比較する第一比較手段と、
比較の結果に応じて禁止テキストが音声合成に用いられないための禁止処理をする第一禁止処理手段と、
をさらに有する請求項2に記載の音声合成システム。 - 前記サーバ装置は、
前記読上用テキストから音声辞書セットを用いて音声合成をするために用いる中間言語セットを作成する中間言語セット作成部をさらに有する請求項2または3に記載の音声合成システム。 - 前記中間言語セット作成部は、
禁止処理をすべきテキストのリストである第二禁止テキストリスト保持手段と、
中間言語を作成するために用いられる読上用テキストと、禁止テキストリストとを比較する第二比較手段と、
比較の結果に応じてその禁止テキストが音声合成に用いられないための禁止処理をする第二禁止処理手段と、
をさらに有する請求項4に記載の音声合成システムのうち請求項2に従属する音声合成システム。 - 前記サーバ装置は、
前記インターフェイス部を介して生成された中間言語セットを外部端末に対して出力する中間言語セット出力部をさらに有する請求項4又は5に記載の音声合成システム。 - 前記インターフェイス部を介して音声辞書セット選択部にて音声辞書セットを選択するための選択命令を出力する選択命令出力部と、
出力された選択命令に応じて選択された音声辞書セットを前記インターフェイス部を介して取得する音声辞書セット取得部と、
選択された音声辞書セットを用いて音声合成をする音声合成部と、
を有する外部端末である音声合成端末をさらに有する請求項1から6のいずれか一に記載の音声合成システム。 - 前記音声合成端末は、読上用テキストを前記インターフェイス部を介して前記読上用テキスト入力受付部に対して出力する読上用テキスト出力部と、
読上用テキスト出力部から出力された読上用テキストに対応して中間言語セットを前記インターフェイス部を介して中間言語セット出力部から取得する中間言語セット取得部と、
取得した中間言語セットを前記音声合成部に出力する中間言語セット送出部と、
をさらに有する請求項7に記載の音声合成システムのうち請求項2ないし請求項6に従属する音声合成システム。 - 前記音声合成端末は、音声合成部にて合成される合成音声を利用するアプリケーションを動作させるアプリケーション動作部と、
動作しているアプリケーションに応じて音声合成部にて利用する音声辞書セットを選択する音声辞書セット切替部と、
をさらに有する請求項7又は8に記載の音声合成システム。 - 前記音声合成端末は、前記アプリケーション動作部で動作するアプリケーションが発声アニメーションである場合にはアニメーションと音声合成部で合成された合成音声との出力タイミングを同期させる同期部をさらに有する請求項9に記載の音声合成システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012156123A JP2014021136A (ja) | 2012-07-12 | 2012-07-12 | 音声合成システム |
US13/939,735 US20140019137A1 (en) | 2012-07-12 | 2013-07-11 | Method, system and server for speech synthesis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012156123A JP2014021136A (ja) | 2012-07-12 | 2012-07-12 | 音声合成システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014021136A true JP2014021136A (ja) | 2014-02-03 |
Family
ID=49914723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012156123A Pending JP2014021136A (ja) | 2012-07-12 | 2012-07-12 | 音声合成システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20140019137A1 (ja) |
JP (1) | JP2014021136A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016110151A (ja) * | 2014-12-04 | 2016-06-20 | 悠之介 北 | 音声管理サーバー装置、会話音声提供方法、会話音声提供システム |
JP2017107198A (ja) * | 2015-12-02 | 2017-06-15 | 悠之介 北 | 音声採取方法および音声移植方法 |
JP2017162006A (ja) * | 2016-03-07 | 2017-09-14 | ヤフー株式会社 | 配信装置、配信方法及び配信プログラム |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9311912B1 (en) * | 2013-07-22 | 2016-04-12 | Amazon Technologies, Inc. | Cost efficient distributed text-to-speech processing |
WO2015129302A1 (ja) * | 2014-02-26 | 2015-09-03 | 日本碍子株式会社 | 半導体用複合基板のハンドル基板 |
JP6413263B2 (ja) * | 2014-03-06 | 2018-10-31 | 株式会社デンソー | 報知装置 |
CN104992703B (zh) * | 2015-07-24 | 2017-10-03 | 百度在线网络技术(北京)有限公司 | 语音合成方法和系统 |
US11783524B2 (en) * | 2016-02-10 | 2023-10-10 | Nitin Vats | Producing realistic talking face with expression using images text and voice |
WO2020060151A1 (en) * | 2018-09-19 | 2020-03-26 | Samsung Electronics Co., Ltd. | System and method for providing voice assistant service |
US11822885B1 (en) * | 2019-06-03 | 2023-11-21 | Amazon Technologies, Inc. | Contextual natural language censoring |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002221981A (ja) * | 2001-01-25 | 2002-08-09 | Canon Inc | 音声合成装置および音声合成方法 |
JP2003114692A (ja) * | 2001-10-05 | 2003-04-18 | Toyota Motor Corp | 音源データの提供システム、端末、玩具、提供方法、プログラム、および媒体 |
JP2004221746A (ja) * | 2003-01-10 | 2004-08-05 | Yamaha Corp | 発声機能を有する携帯端末装置 |
JP2005300783A (ja) * | 2004-04-08 | 2005-10-27 | Zyyx:Kk | 音声変換装置 |
JP2006018133A (ja) * | 2004-07-05 | 2006-01-19 | Hitachi Ltd | 分散型音声合成システム、端末装置及びコンピュータ・プログラム |
JP2007163875A (ja) * | 2005-12-14 | 2007-06-28 | Advanced Telecommunication Research Institute International | 音声合成装置および音声合成プログラム |
JP2009217846A (ja) * | 2009-06-23 | 2009-09-24 | Seiko Epson Corp | 音声データ作成装置および音声データ作成方法 |
JP2010528372A (ja) * | 2007-05-24 | 2010-08-19 | マイクロソフト コーポレーション | パーソナリティベース装置 |
JP2010237307A (ja) * | 2009-03-30 | 2010-10-21 | Nippon Telegr & Teleph Corp <Ntt> | 音声学習・合成システム及び音声学習・合成方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030028380A1 (en) * | 2000-02-02 | 2003-02-06 | Freeland Warwick Peter | Speech system |
JP2002023777A (ja) * | 2000-06-26 | 2002-01-25 | Internatl Business Mach Corp <Ibm> | 音声合成システム、音声合成方法、サーバ、記憶媒体、プログラム伝送装置、音声合成データ記憶媒体、音声出力機器 |
US7085719B1 (en) * | 2000-07-13 | 2006-08-01 | Rockwell Electronics Commerce Technologies Llc | Voice filter for normalizing an agents response by altering emotional and word content |
US20020156630A1 (en) * | 2001-03-02 | 2002-10-24 | Kazunori Hayashi | Reading system and information terminal |
JP2003058180A (ja) * | 2001-06-08 | 2003-02-28 | Matsushita Electric Ind Co Ltd | 合成音販売システムおよび音素の著作権認定システム |
AU2003226192A1 (en) * | 2002-04-02 | 2003-10-20 | Worldcom, Inc. | Billing system for communications services involving telephony and instant communications |
JP2007058509A (ja) * | 2005-08-24 | 2007-03-08 | Toshiba Corp | 言語処理システム |
-
2012
- 2012-07-12 JP JP2012156123A patent/JP2014021136A/ja active Pending
-
2013
- 2013-07-11 US US13/939,735 patent/US20140019137A1/en not_active Abandoned
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002221981A (ja) * | 2001-01-25 | 2002-08-09 | Canon Inc | 音声合成装置および音声合成方法 |
JP2003114692A (ja) * | 2001-10-05 | 2003-04-18 | Toyota Motor Corp | 音源データの提供システム、端末、玩具、提供方法、プログラム、および媒体 |
JP2004221746A (ja) * | 2003-01-10 | 2004-08-05 | Yamaha Corp | 発声機能を有する携帯端末装置 |
JP2005300783A (ja) * | 2004-04-08 | 2005-10-27 | Zyyx:Kk | 音声変換装置 |
JP2006018133A (ja) * | 2004-07-05 | 2006-01-19 | Hitachi Ltd | 分散型音声合成システム、端末装置及びコンピュータ・プログラム |
JP2007163875A (ja) * | 2005-12-14 | 2007-06-28 | Advanced Telecommunication Research Institute International | 音声合成装置および音声合成プログラム |
JP2010528372A (ja) * | 2007-05-24 | 2010-08-19 | マイクロソフト コーポレーション | パーソナリティベース装置 |
JP2010237307A (ja) * | 2009-03-30 | 2010-10-21 | Nippon Telegr & Teleph Corp <Ntt> | 音声学習・合成システム及び音声学習・合成方法 |
JP2009217846A (ja) * | 2009-06-23 | 2009-09-24 | Seiko Epson Corp | 音声データ作成装置および音声データ作成方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016110151A (ja) * | 2014-12-04 | 2016-06-20 | 悠之介 北 | 音声管理サーバー装置、会話音声提供方法、会話音声提供システム |
JP2017107198A (ja) * | 2015-12-02 | 2017-06-15 | 悠之介 北 | 音声採取方法および音声移植方法 |
JP2017162006A (ja) * | 2016-03-07 | 2017-09-14 | ヤフー株式会社 | 配信装置、配信方法及び配信プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20140019137A1 (en) | 2014-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2014021136A (ja) | 音声合成システム | |
US10991360B2 (en) | System and method for generating customized text-to-speech voices | |
US8682671B2 (en) | Method and apparatus for generating synthetic speech with contrastive stress | |
US8594995B2 (en) | Multilingual asynchronous communications of speech messages recorded in digital media files | |
US8712776B2 (en) | Systems and methods for selective text to speech synthesis | |
US8396714B2 (en) | Systems and methods for concatenation of words in text to speech synthesis | |
US8355919B2 (en) | Systems and methods for text normalization for text to speech synthesis | |
US8352268B2 (en) | Systems and methods for selective rate of speech and speech preferences for text to speech synthesis | |
Eide et al. | A corpus-based approach to< ahem/> expressive speech synthesis | |
JP4516863B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
US20130085760A1 (en) | Training and applying prosody models | |
US8914291B2 (en) | Method and apparatus for generating synthetic speech with contrastive stress | |
JPWO2005093713A1 (ja) | 音声合成装置 | |
US20080243510A1 (en) | Overlapping screen reading of non-sequential text | |
US20050144015A1 (en) | Automatic identification of optimal audio segments for speech applications | |
JP2007086309A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP4287785B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP2005018036A (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP2020204683A (ja) | 電子出版物視聴覚システム、視聴覚用電子出版物作成プログラム、及び利用者端末用プログラム | |
Grůber et al. | Czech expressive speech synthesis in limited domain: Comparison of unit selection and HMM-based approaches | |
JP2010048959A (ja) | 音声出力システム及び車載装置 | |
JP4173404B2 (ja) | 文セット自動生成装置、文セット自動生成プログラム、記憶媒体 | |
JP4244661B2 (ja) | 音声データ提供システムならびに音声データ作成装置および音声データ作成プログラム | |
KR102446300B1 (ko) | 음성 기록을 위한 음성 인식률을 향상시키는 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체 | |
JP2004294577A (ja) | 文字情報音声変換方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20131129 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20131217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140306 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140331 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20140530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140630 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140708 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20140829 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150424 |