JP6127371B2 - 音声合成装置および音声合成方法 - Google Patents
音声合成装置および音声合成方法 Download PDFInfo
- Publication number
- JP6127371B2 JP6127371B2 JP2012074858A JP2012074858A JP6127371B2 JP 6127371 B2 JP6127371 B2 JP 6127371B2 JP 2012074858 A JP2012074858 A JP 2012074858A JP 2012074858 A JP2012074858 A JP 2012074858A JP 6127371 B2 JP6127371 B2 JP 6127371B2
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- unit
- sound
- information
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 21
- 238000003786 synthesis reaction Methods 0.000 title claims description 21
- 238000001308 synthesis method Methods 0.000 title 1
- 239000002131 composite material Substances 0.000 claims description 10
- 230000006837 decompression Effects 0.000 claims description 7
- 230000002085 persistent effect Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000002459 sustained effect Effects 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- MQJKPEGWNLWLTK-UHFFFAOYSA-N Dapsone Chemical compound C1=CC(N)=CC=C1S(=O)(=O)C1=CC=C(N)C=C1 MQJKPEGWNLWLTK-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/027—Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
- G10L2013/105—Duration
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Auxiliary Devices For Music (AREA)
- Processing Or Creating Images (AREA)
Description
図1は、本発明の第1実施形態に係る音声合成装置100のブロック図である。音声合成装置100は、素片接続型の音声合成で歌唱音の音声信号Sを生成する信号処理装置であり、図1に示すように、演算処理装置12と記憶装置14と表示装置22と入力装置24と放音装置26とを具備するコンピュータシステムで実現される。例えば据置型の情報処理装置(パーソナルコンピュータ)や携帯型の情報処理装置(携帯電話機や携帯情報端末)で音声合成装置100が実現される。
本発明の第2実施形態を説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を適宜に併合することも可能である。
Claims (5)
- 継続長と発音内容とを音符毎に指定する合成情報を取得する情報取得手段と、
前記各音符の発音内容に対応する複数の音素の各々の伸長の許否を利用者からの指示に応じて音素毎に個別に設定する伸長設定手段と、
前記各音符の発音内容に対応する複数の音声素片を接続することで前記合成情報に応じた合成音を生成する手段であって、前記各音符の発音内容に対応する複数の音素のうち前記伸長設定手段が伸長を許可した音素に対応する音声素片を当該音符の継続長に応じて伸長する音声合成手段と
を具備する音声合成装置。 - 前記合成情報が指定する複数の音符のうち利用者が選択した音符の発音内容に対応する複数の音素を提示して各音素の伸長の許否の指示を利用者から受付ける設定画像を表示させる第1表示制御手段
を具備する請求項1の音声合成装置。 - 前記各音符の発音内容に対応する複数の音素の各々の音素記号を、前記伸長設定手段が伸長を許可した音素と前記伸長設定手段が伸長を禁止した音素とで表示態様が相違するように表示装置に表示させる第2表示制御手段
を具備する請求項1または請求項2の音声合成装置。 - 前記伸長設定手段は、前記各音符の発音内容に対応する複数の音素のうち経時的に持続可能な持続音素について伸長の許否を設定する
請求項1から請求項3の何れかの音声合成装置。 - コンピュータシステムが、
継続長と発音内容とを音符毎に指定する合成情報を取得し、
前記各音符の発音内容に対応する複数の音素の各々の伸長の許否を利用者からの指示に応じて音素毎に個別に設定し、
前記各音符の発音内容に対応する複数の音声素片を接続することで前記合成情報に応じた合成音を生成する一方、
前記合成音の生成においては、前記各音符の発音内容に対応する複数の音素のうち前記伸長が許可された音素に対応する音声素片を、当該音符の継続長に応じて伸長する
音声合成方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012074858A JP6127371B2 (ja) | 2012-03-28 | 2012-03-28 | 音声合成装置および音声合成方法 |
US13/777,994 US9552806B2 (en) | 2012-03-28 | 2013-02-26 | Sound synthesizing apparatus |
EP13158187.8A EP2645363B1 (en) | 2012-03-28 | 2013-03-07 | Sound synthesizing apparatus and method |
CN201310104780.XA CN103366730B (zh) | 2012-03-28 | 2013-03-28 | 声音合成设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012074858A JP6127371B2 (ja) | 2012-03-28 | 2012-03-28 | 音声合成装置および音声合成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013205638A JP2013205638A (ja) | 2013-10-07 |
JP6127371B2 true JP6127371B2 (ja) | 2017-05-17 |
Family
ID=47843125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012074858A Active JP6127371B2 (ja) | 2012-03-28 | 2012-03-28 | 音声合成装置および音声合成方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9552806B2 (ja) |
EP (1) | EP2645363B1 (ja) |
JP (1) | JP6127371B2 (ja) |
CN (1) | CN103366730B (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9916295B1 (en) * | 2013-03-15 | 2018-03-13 | Richard Henry Dana Crawford | Synchronous context alignments |
JP6569246B2 (ja) * | 2015-03-05 | 2019-09-04 | ヤマハ株式会社 | 音声合成用データ編集装置 |
WO2016196041A1 (en) * | 2015-06-05 | 2016-12-08 | Trustees Of Boston University | Low-dimensional real-time concatenative speech synthesizer |
JP6784022B2 (ja) | 2015-12-18 | 2020-11-11 | ヤマハ株式会社 | 音声合成方法、音声合成制御方法、音声合成装置、音声合成制御装置およびプログラム |
JP6523998B2 (ja) * | 2016-03-14 | 2019-06-05 | 株式会社東芝 | 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム |
EP3602539A4 (en) * | 2017-03-23 | 2021-08-11 | D&M Holdings, Inc. | SYSTEM FOR PROVIDING EXPRESSIVE AND EMOTIONAL TEXT-TO-LANGUAGE |
JP6988343B2 (ja) * | 2017-09-29 | 2022-01-05 | ヤマハ株式会社 | 歌唱音声の編集支援方法、および歌唱音声の編集支援装置 |
CN113421548B (zh) * | 2021-06-30 | 2024-02-06 | 平安科技(深圳)有限公司 | 语音合成方法、装置、计算机设备和存储介质 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4034344C2 (de) | 1990-10-29 | 2003-11-27 | Philips Broadcast Television S | Anordnung zur Wiedergabe breitbandiger Signale für ein magnetisches Aufzeichnungs/Wiedergabe-Gerät |
DE69228211T2 (de) * | 1991-08-09 | 1999-07-08 | Koninkl Philips Electronics Nv | Verfahren und Apparat zur Handhabung von Höhe und Dauer eines physikalischen Audiosignals |
CA2221762C (en) * | 1995-06-13 | 2002-08-20 | British Telecommunications Public Limited Company | Ideal phonetic unit duration adjustment for text-to-speech system |
US5799279A (en) * | 1995-11-13 | 1998-08-25 | Dragon Systems, Inc. | Continuous speech recognition of text and commands |
US6240384B1 (en) * | 1995-12-04 | 2001-05-29 | Kabushiki Kaisha Toshiba | Speech synthesis method |
JP2000305582A (ja) * | 1999-04-23 | 2000-11-02 | Oki Electric Ind Co Ltd | 音声合成装置 |
JP3728172B2 (ja) * | 2000-03-31 | 2005-12-21 | キヤノン株式会社 | 音声合成方法および装置 |
JP2001343987A (ja) * | 2000-05-31 | 2001-12-14 | Sanyo Electric Co Ltd | 音声合成方法、および音声合成装置 |
JP3589972B2 (ja) * | 2000-10-12 | 2004-11-17 | 沖電気工業株式会社 | 音声合成装置 |
US7031922B1 (en) * | 2000-11-20 | 2006-04-18 | East Carolina University | Methods and devices for enhancing fluency in persons who stutter employing visual speech gestures |
US7546241B2 (en) * | 2002-06-05 | 2009-06-09 | Canon Kabushiki Kaisha | Speech synthesis method and apparatus, and dictionary generation method and apparatus |
US20040102973A1 (en) * | 2002-11-21 | 2004-05-27 | Lott Christopher B. | Process, apparatus, and system for phonetic dictation and instruction |
JP3843953B2 (ja) | 2003-02-27 | 2006-11-08 | ヤマハ株式会社 | 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置 |
WO2004109659A1 (ja) * | 2003-06-05 | 2004-12-16 | Kabushiki Kaisha Kenwood | 音声合成装置、音声合成方法及びプログラム |
EP1726005A4 (en) * | 2004-03-05 | 2007-06-20 | Lessac Technologies Inc | CODES FOR THE SYNTHESIS OF TEXT SPEECH, USE OF THEM IN COMPUTERIZED SPEECH SYSTEMS |
JP4265501B2 (ja) | 2004-07-15 | 2009-05-20 | ヤマハ株式会社 | 音声合成装置およびプログラム |
JP4298612B2 (ja) * | 2004-09-01 | 2009-07-22 | 株式会社フュートレック | 音楽データ加工方法、音楽データ加工装置、音楽データ加工システム及びコンピュータプログラム |
JP5029167B2 (ja) | 2007-06-25 | 2012-09-19 | 富士通株式会社 | 音声読み上げのための装置、プログラム及び方法 |
JP5029168B2 (ja) * | 2007-06-25 | 2012-09-19 | 富士通株式会社 | 音声読み上げのための装置、プログラム及び方法 |
US8370151B2 (en) * | 2009-01-15 | 2013-02-05 | K-Nfb Reading Technology, Inc. | Systems and methods for multiple voice document narration |
JP5482042B2 (ja) * | 2009-09-10 | 2014-04-23 | 富士通株式会社 | 合成音声テキスト入力装置及びプログラム |
JP5423375B2 (ja) * | 2009-12-15 | 2014-02-19 | ヤマハ株式会社 | 音声合成装置 |
JP5257856B2 (ja) | 2010-09-27 | 2013-08-07 | Toto株式会社 | 燃料電池セルスタックユニット |
JP2012163721A (ja) * | 2011-02-04 | 2012-08-30 | Toshiba Corp | 読み記号列編集装置および読み記号列編集方法 |
-
2012
- 2012-03-28 JP JP2012074858A patent/JP6127371B2/ja active Active
-
2013
- 2013-02-26 US US13/777,994 patent/US9552806B2/en active Active
- 2013-03-07 EP EP13158187.8A patent/EP2645363B1/en not_active Not-in-force
- 2013-03-28 CN CN201310104780.XA patent/CN103366730B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
EP2645363B1 (en) | 2014-12-03 |
JP2013205638A (ja) | 2013-10-07 |
CN103366730A (zh) | 2013-10-23 |
US9552806B2 (en) | 2017-01-24 |
EP2645363A1 (en) | 2013-10-02 |
US20130262121A1 (en) | 2013-10-03 |
CN103366730B (zh) | 2016-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6127371B2 (ja) | 音声合成装置および音声合成方法 | |
JP6070010B2 (ja) | 音楽データ表示装置および音楽データ表示方法 | |
JP4973337B2 (ja) | 音声読み上げのための装置、プログラム及び方法 | |
JP6507579B2 (ja) | 音声合成方法 | |
JP6728754B2 (ja) | 発音装置、発音方法および発音プログラム | |
JP2013137520A (ja) | 音楽データ編集装置 | |
JP2009003395A (ja) | 音声読み上げのための装置、プログラム及び方法 | |
JP5423375B2 (ja) | 音声合成装置 | |
JP6044284B2 (ja) | 音声合成装置 | |
JP5157922B2 (ja) | 音声合成装置、およびプログラム | |
JP7124870B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP2015011146A (ja) | 音響処理装置 | |
JP2015011147A (ja) | 楽曲表示装置 | |
JP6413220B2 (ja) | 合成情報管理装置 | |
JP5552797B2 (ja) | 音声合成装置および音声合成方法 | |
JP5935831B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP6372066B2 (ja) | 合成情報管理装置および音声合成装置 | |
JP5982942B2 (ja) | 音声合成装置 | |
JP6149373B2 (ja) | 音声合成データ編集装置および音声合成データ編集方法 | |
WO2019239972A1 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP5641266B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP2013238664A (ja) | 音声素片切出装置 | |
JP2015079063A (ja) | 合成情報管理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150122 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170314 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170327 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6127371 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |