JP4643914B2 - 音声合成方法および装置 - Google Patents
音声合成方法および装置 Download PDFInfo
- Publication number
- JP4643914B2 JP4643914B2 JP2004048933A JP2004048933A JP4643914B2 JP 4643914 B2 JP4643914 B2 JP 4643914B2 JP 2004048933 A JP2004048933 A JP 2004048933A JP 2004048933 A JP2004048933 A JP 2004048933A JP 4643914 B2 JP4643914 B2 JP 4643914B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- boundary
- speech
- pitch
- right unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001308 synthesis method Methods 0.000 title claims description 14
- 238000013213 extrapolation Methods 0.000 claims description 10
- 238000005562 fading Methods 0.000 claims description 7
- 239000011295 pitch Substances 0.000 description 44
- 230000015572 biosynthetic process Effects 0.000 description 33
- 238000003786 synthesis reaction Methods 0.000 description 33
- 238000000034 method Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000009499 grossing Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
- G10L13/07—Concatenation rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Machine Translation (AREA)
Description
20 境界拡張部
30 ピッチマーク整列部
40 ピッチトラック内挿部
50 ユニット重畳部
Claims (8)
- データベースを用いて音声ユニットを接続する音声合成方法において、
(a)接続される前記音声ユニットを決定して左側ユニットと右側ユニットとに区切る段階と、
(b)前記左側ユニットと前記右側ユニットとの内挿される所定領域を可変的に決定する段階と、
(c)前記左側ユニットの境界部及び前記右側ユニットの境界部の夫々に拡張部を連結する段階と、
(d)前記内挿される所定領域を基準に、前記左側ユニット及び前記右側ユニット夫々の拡張部のピッチマークを同期化させる段階と、
(e)前記左側ユニットおよび前記右側ユニットを重畳する段階と、を含み、
前記(c)段階は、
(c1)前記データベース内に前記左側ユニットと前記右側ユニットとの前記境界部に連結されるセグメントデータが存在するか否かを判断する段階と、
(c2)前記データベース内に前記セグメントデータが存在する場合に、該セグメントデータを用いて境界部を拡張する段階と、
(c3)前記セグメントデータが存在していない場合に、外挿法によって境界部を拡張する段階と、を含むことを特徴とする音声合成方法。 - 前記接続される音声ユニットは有声音の音素単位であることを特徴とする請求項1に記載の音声合成方法。
- 前記(e)段階は、
前記左側ユニットをフェード・アウトして前記右側ユニットをフェード・インした後、前記左側ユニットと前記右側ユニットとを重畳することを特徴とする請求項1に記載の音声合成方法。 - (f)前記(d)段階後に、重畳される前記所定領域のピッチトラックを等比率的に内挿して前記(e)段階に進む段階をさらに含むことを特徴とする請求項1に記載の音声合成方法。
- データベースを用いて音声ユニットを接続する音声合成装置において、
接続される前記音声ユニットを決定して左側ユニットと右側ユニットとに区切り、前記左側ユニットと前記右側ユニットとの内挿される所定領域を可変的に決定する接続領域決定部と、
前記左側ユニットの境界部及び前記右側ユニットの境界部の夫々に拡張部を連結して出力する境界部拡張部と、
前記内挿される所定領域を基準に、前記左側ユニット及び前記右側ユニット夫々の拡張部のピッチマークを同期化させ出力するピッチマーク整列部と、
ピッチマークが整列された前記左側ユニットおよび前記右側ユニットを重畳するユニット重畳部と、を含み、
前記境界部拡張部は、
前記データベース内に前記左側ユニットと前記右側ユニットとの前記境界部に連結されるセグメントデータが存在するか否かを判断して、前記データベース内に前記セグメントデータが存在する場合に該セグメントデータを用いて境界部を拡張し、前記セグメントデータが存在していない場合に外挿法によって境界部を拡張する、ことを特徴とする音声合成装置。 - 前記接続される音声ユニットは有声音の音素単位であることを特徴とする請求項5に記載の音声合成装置。
- 前記ユニット重畳部は、
前記左側ユニットをフェード・アウトして前記右側ユニットをフェード・インした後、前記左側ユニットと前記右側ユニットとを重畳することを特徴とする請求項5に記載の音声合成装置。 - 前記ピッチマーク整列部からピッチマークを入力され、重畳される前記所定領域のピッチトラックを等比率的に内挿して前記ユニット重畳部に出力するピッチトラック内挿部をさらに含むことを特徴とする請求項5に記載の音声合成装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2003-0011786A KR100486734B1 (ko) | 2003-02-25 | 2003-02-25 | 음성 합성 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004258660A JP2004258660A (ja) | 2004-09-16 |
JP4643914B2 true JP4643914B2 (ja) | 2011-03-02 |
Family
ID=36314088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004048933A Expired - Fee Related JP4643914B2 (ja) | 2003-02-25 | 2004-02-25 | 音声合成方法および装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7369995B2 (ja) |
EP (1) | EP1453036B1 (ja) |
JP (1) | JP4643914B2 (ja) |
KR (1) | KR100486734B1 (ja) |
DE (1) | DE602004000656T2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4963345B2 (ja) * | 2004-09-16 | 2012-06-27 | 株式会社国際電気通信基礎技術研究所 | 音声合成方法及び音声合成プログラム |
FR2884031A1 (fr) * | 2005-03-30 | 2006-10-06 | France Telecom | Concatenation de signaux |
US20070106513A1 (en) * | 2005-11-10 | 2007-05-10 | Boillot Marc A | Method for facilitating text to speech synthesis using a differential vocoder |
US7953600B2 (en) * | 2007-04-24 | 2011-05-31 | Novaspeech Llc | System and method for hybrid speech synthesis |
KR20110006004A (ko) * | 2009-07-13 | 2011-01-20 | 삼성전자주식회사 | 결합인식단위 최적화 장치 및 그 방법 |
KR101650739B1 (ko) * | 2015-07-21 | 2016-08-24 | 주식회사 디오텍 | 음성 합성 방법, 서버 및 컴퓨터 판독가능 매체에 저장된 컴퓨터 프로그램 |
CN118098236B (zh) * | 2024-04-23 | 2024-08-06 | 深圳市友杰智新科技有限公司 | 确定语音识别窗口左右边界的方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10257596A (ja) * | 1997-03-14 | 1998-09-25 | Nippon Hoso Kyokai <Nhk> | 話速変換方法およびその装置 |
JPH10307586A (ja) * | 1997-05-02 | 1998-11-17 | Yamaha Corp | 楽音発生装置および方法 |
JPH11503535A (ja) * | 1995-04-12 | 1999-03-26 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 波形言語合成 |
JPH11307586A (ja) * | 1998-04-23 | 1999-11-05 | Matsushita Electric Works Ltd | 半導体装置とその製造方法、実装方法および用途 |
JP2000122666A (ja) * | 1997-09-30 | 2000-04-28 | Yamaha Corp | 波形生成装置及び方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR940002854B1 (ko) * | 1991-11-06 | 1994-04-04 | 한국전기통신공사 | 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치 |
AU3154893A (en) * | 1992-12-21 | 1994-07-19 | Stackpole Limited | Method of producing bearings |
US5642466A (en) * | 1993-01-21 | 1997-06-24 | Apple Computer, Inc. | Intonation adjustment in text-to-speech systems |
US5490234A (en) | 1993-01-21 | 1996-02-06 | Apple Computer, Inc. | Waveform blending technique for text-to-speech system |
US5592585A (en) * | 1995-01-26 | 1997-01-07 | Lernout & Hauspie Speech Products N.C. | Method for electronically generating a spoken message |
US5978764A (en) * | 1995-03-07 | 1999-11-02 | British Telecommunications Public Limited Company | Speech synthesis |
US6175821B1 (en) * | 1997-07-31 | 2001-01-16 | British Telecommunications Public Limited Company | Generation of voice messages |
JP4183346B2 (ja) * | 1999-09-13 | 2008-11-19 | 株式会社神戸製鋼所 | 粉末冶金用混合粉末ならびに鉄系焼結体およびその製造方法 |
US6514307B2 (en) * | 2000-08-31 | 2003-02-04 | Kawasaki Steel Corporation | Iron-based sintered powder metal body, manufacturing method thereof and manufacturing method of iron-based sintered component with high strength and high density |
AU2001290882A1 (en) | 2000-09-15 | 2002-03-26 | Lernout And Hauspie Speech Products N.V. | Fast waveform synchronization for concatenation and time-scale modification of speech |
US6978239B2 (en) | 2000-12-04 | 2005-12-20 | Microsoft Corporation | Method and apparatus for speech synthesis without prosody modification |
-
2003
- 2003-02-25 KR KR10-2003-0011786A patent/KR100486734B1/ko not_active IP Right Cessation
-
2004
- 2004-02-24 EP EP04251008A patent/EP1453036B1/en not_active Expired - Lifetime
- 2004-02-24 DE DE602004000656T patent/DE602004000656T2/de not_active Expired - Lifetime
- 2004-02-25 JP JP2004048933A patent/JP4643914B2/ja not_active Expired - Fee Related
- 2004-02-25 US US10/785,113 patent/US7369995B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11503535A (ja) * | 1995-04-12 | 1999-03-26 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 波形言語合成 |
JPH10257596A (ja) * | 1997-03-14 | 1998-09-25 | Nippon Hoso Kyokai <Nhk> | 話速変換方法およびその装置 |
JPH10307586A (ja) * | 1997-05-02 | 1998-11-17 | Yamaha Corp | 楽音発生装置および方法 |
JP2000122666A (ja) * | 1997-09-30 | 2000-04-28 | Yamaha Corp | 波形生成装置及び方法 |
JPH11307586A (ja) * | 1998-04-23 | 1999-11-05 | Matsushita Electric Works Ltd | 半導体装置とその製造方法、実装方法および用途 |
Also Published As
Publication number | Publication date |
---|---|
DE602004000656D1 (de) | 2006-05-24 |
KR100486734B1 (ko) | 2005-05-03 |
EP1453036B1 (en) | 2006-04-19 |
US20040167780A1 (en) | 2004-08-26 |
KR20040076440A (ko) | 2004-09-01 |
DE602004000656T2 (de) | 2007-04-26 |
US7369995B2 (en) | 2008-05-06 |
JP2004258660A (ja) | 2004-09-16 |
EP1453036A1 (en) | 2004-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS62160495A (ja) | 音声合成装置 | |
JP4112613B2 (ja) | 波形言語合成 | |
JPH031200A (ja) | 規則型音声合成装置 | |
US20090157397A1 (en) | Voice Rule-Synthesizer and Compressed Voice-Element Data Generator for the same | |
JP4643914B2 (ja) | 音声合成方法および装置 | |
JP2009109805A (ja) | 音声処理装置及びその方法 | |
JP2001282278A (ja) | 音声情報処理装置及びその方法と記憶媒体 | |
JP2623586B2 (ja) | 音声合成におけるピッチ制御方式 | |
JP2003108178A (ja) | 音声合成装置及び音声合成用素片作成装置 | |
JP3576800B2 (ja) | 音声分析方法、及びプログラム記録媒体 | |
JP4274852B2 (ja) | 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体 | |
JPH07319497A (ja) | 音声合成装置 | |
JP4454780B2 (ja) | 音声情報処理装置とその方法と記憶媒体 | |
JP5387410B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2005321520A (ja) | 音声合成装置及びそのプログラム | |
JP4414864B2 (ja) | 録音編集・テキスト音声合成併用型音声合成装置、録音編集・テキスト音声合成併用型音声合成プログラム、記録媒体 | |
JP2577372B2 (ja) | 音声合成装置および方法 | |
JP5089473B2 (ja) | 音声合成装置及び音声合成方法 | |
JP2987089B2 (ja) | 音声素片作成方法および音声合成方法とその装置 | |
JP3426957B2 (ja) | 映像中への音声録音支援表示方法及び装置及びこの方法を記録した記録媒体 | |
JP3561654B2 (ja) | 音声合成方法 | |
JPS63208099A (ja) | 音声合成装置 | |
JP3292218B2 (ja) | 音声メッセージ作成装置 | |
JP3283657B2 (ja) | 音声規則合成装置 | |
JP2000099094A (ja) | 時系列信号処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20061107 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20061113 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100309 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100601 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100629 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100924 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101109 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101203 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |