JP5155836B2 - 収録テキスト生成装置、その方法、そのプログラム - Google Patents
収録テキスト生成装置、その方法、そのプログラム Download PDFInfo
- Publication number
- JP5155836B2 JP5155836B2 JP2008307679A JP2008307679A JP5155836B2 JP 5155836 B2 JP5155836 B2 JP 5155836B2 JP 2008307679 A JP2008307679 A JP 2008307679A JP 2008307679 A JP2008307679 A JP 2008307679A JP 5155836 B2 JP5155836 B2 JP 5155836B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- speech
- scale
- distortion value
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Description
この発明は、追加する音声データをできるだけ少量にしつつ、できるだけ音声品質を向上させる収録テキスト生成装置、音声データベース生成装置である。
本発明は上述の実施の形態に限定されるものではない。また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、本実施例で説明した収録テキスト生成装置100は、CPU(Central Processing Unit)、入力部、出力部、補助記憶装置、RAM(Random Access Memory)、ROM(Read Only Memory)及びバスを有している(何れも図示せず)。
CPUは、読み込まれた各種プログラムに従って様々な演算処理を実行する。補助記憶装置は、例えば、ハードディスク、MO(Magneto-Optical disc)、半導体メモリ等であり、RAMは、SRAM(Static Random Access Memory)、DRAM (Dynamic Random Access Memory)等である。また、バスは、CPU、入力部、出力部、補助記憶装置、RAM及びROMを通信可能に接続している。
本実施例の単語追加装置は、上述のようなハードウェアに所定のプログラムが読み込まれ、CPUがそれを実行することによって構築される。以下、このように構築される各装置の機能構成を説明する。
収録テキスト生成装置100の合成部6、話者正規化部10、対象検索部20、歪み値計算部24、収録重要度リスト作成部28、収録テキスト決定部34は、所定のプログラムがCPUに読み込まれ、実行されることによって構築される演算部である。収録テキスト生成装置100の各記憶部は上記補助記憶装置として機能する。
Claims (5)
- 音声データベースが記憶されている音声データベース記憶部と、
前記音声データベースを用いて合成対象テキストに含まれる各テキストについて音声合成を行うことで、合成音声を出力する合成部と、
大規模音声データが記憶されている大規模音声データ記憶部と、
前記大規模音声データに対応する大規模テキストが記憶されている大規模テキスト記憶部と、
前記大規模テキストから前記合成対象テキストを検索し、検索された共通テキストと対応する音声データを前記大規模音声データから取り出し、照合音声として求める対象検索部と、
前記合成音声と前記照合音声との歪み値を合成単位ごとに計算する歪み計算部と、
予め定められた閾値より歪み値が高い高歪み値合成単位の高歪み値属性値と、当該高歪み値属性値と対応する歪み値が示された収録重要度リストを作成する収録重要度リスト作成部と、
収録候補テキストが記憶されている収録候補テキスト記憶部と、
前記収録候補テキストから、前記歪み値の降順に、前記高歪み値属性値を多く含む収録テキストから順番に取り出し、出力する収録テキスト決定部と、を具備する収録テキスト生成装置。 - 請求項1記載の収録テキスト生成装置であって、
更に、
前記合成音声および前記大規模音声データに対し、話者正規化を行うことで、話者正規化済合成音声および話者正規化済大規模音声データを求める話者正規化部を有し、
前記対象検索部は、前記共通テキストと対応する音声データを前記大規模音声データから取り出し、照合音声として求めるものであり、
前記歪み計算部は、前記話者正規化済合成音声と前記照合音声との歪み値を合成単位ごとに計算するものであることを特徴とする収録テキスト生成装置。 - 請求項1または2に記載の収録テキスト生成装置であって、
前記大規模テキストは、前記大規模音声データの音声を書き起こしたものであることを特徴とする収録テキスト生成装置。 - 音声データベース記憶部に記憶されている音声データベースを用いて合成対象テキストに含まれる各テキストについて音声合成を行うことで、合成音声を出力する合成過程と、
大規模テキスト記憶部に記憶されている大規模テキストから前記合成対象テキストを検索し、検索された共通テキストと対応する音声データを前記大規模テキストに対応する大規模音声データから取り出し、照合音声として求める対象検索過程と、
前記合成音声と前記照合音声との歪み値を合成単位ごとに計算する歪み計算部と、
予め定められた閾値より歪み値が高い高歪み値合成単位の高歪み値属性値と、当該高歪み値属性値と対応する歪み値が示された収録重要度リストを作成する収録重要度リスト作成過程と、
収録候補テキストが記憶されている収録候補テキスト記憶過程と、
収録候補テキスト記憶部に記憶されている前記収録候補テキストから、前記歪み値の降順に、前記高歪み値属性値を多く含む収録テキストから順番に取り出し、出力する収録テキスト決定過程と、を具備する収録テキスト生成方法。 - 請求項1〜3何れかに記載の収録テキスト生成装置としてコンピュータを動作させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008307679A JP5155836B2 (ja) | 2008-12-02 | 2008-12-02 | 収録テキスト生成装置、その方法、そのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008307679A JP5155836B2 (ja) | 2008-12-02 | 2008-12-02 | 収録テキスト生成装置、その方法、そのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010134040A JP2010134040A (ja) | 2010-06-17 |
JP5155836B2 true JP5155836B2 (ja) | 2013-03-06 |
Family
ID=42345411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008307679A Expired - Fee Related JP5155836B2 (ja) | 2008-12-02 | 2008-12-02 | 収録テキスト生成装置、その方法、そのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5155836B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6170384B2 (ja) * | 2013-09-09 | 2017-07-26 | 株式会社日立超エル・エス・アイ・システムズ | 音声データベース生成システム、音声データベース生成方法、及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008056604A1 (fr) * | 2006-11-06 | 2008-05-15 | Nec Corporation | Système de collecte de son, procédé de collecte de son et programme de traitement de collecte |
-
2008
- 2008-12-02 JP JP2008307679A patent/JP5155836B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010134040A (ja) | 2010-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11605371B2 (en) | Method and system for parametric speech synthesis | |
JP5665780B2 (ja) | 音声合成装置、方法およびプログラム | |
JP4213755B2 (ja) | 音声翻訳装置、方法およびプログラム | |
US6961705B2 (en) | Information processing apparatus, information processing method, and storage medium | |
US20080177543A1 (en) | Stochastic Syllable Accent Recognition | |
US20080243508A1 (en) | Prosody-pattern generating apparatus, speech synthesizing apparatus, and computer program product and method thereof | |
JP5175325B2 (ja) | 音声認識用wfst作成装置とそれを用いた音声認識装置と、それらの方法とプログラムと記憶媒体 | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
US20080288256A1 (en) | Reducing recording time when constructing a concatenative tts voice using a reduced script and pre-recorded speech assets | |
US20100250254A1 (en) | Speech synthesizing device, computer program product, and method | |
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
JP6680933B2 (ja) | 音響モデル学習装置、音声合成装置、音響モデル学習方法、音声合成方法、プログラム | |
JP6631883B2 (ja) | クロスリンガル音声合成用モデル学習装置、クロスリンガル音声合成用モデル学習方法、プログラム | |
JP2009128490A (ja) | 学習データ選択装置、学習データ選択方法、プログラムおよび記録媒体、音響モデル作成装置、音響モデル作成方法、プログラムおよび記録媒体 | |
Gutkin et al. | Building statistical parametric multi-speaker synthesis for bangladeshi bangla | |
Bernard et al. | Shennong: A Python toolbox for audio speech features extraction | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP4648878B2 (ja) | 様式指定型音声合成方法、及び様式指定型音声合成装置とそのプログラムと、その記憶媒体 | |
JP5155836B2 (ja) | 収録テキスト生成装置、その方法、そのプログラム | |
JP4528540B2 (ja) | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 | |
JP5722295B2 (ja) | 音響モデル生成方法と音声合成方法とそれらの装置とプログラム | |
JP5840075B2 (ja) | 音声波形データベース生成装置、方法、プログラム | |
EP1589524B1 (en) | Method and device for speech synthesis | |
JP2014228580A (ja) | 音声モデル生成装置、方法、プログラム | |
US12020687B2 (en) | Method and system for a parametric speech synthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110228 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120502 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120515 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121207 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5155836 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |