JP4968036B2 - 韻律語グルーピング方法及び装置 - Google Patents
韻律語グルーピング方法及び装置 Download PDFInfo
- Publication number
- JP4968036B2 JP4968036B2 JP2007322494A JP2007322494A JP4968036B2 JP 4968036 B2 JP4968036 B2 JP 4968036B2 JP 2007322494 A JP2007322494 A JP 2007322494A JP 2007322494 A JP2007322494 A JP 2007322494A JP 4968036 B2 JP4968036 B2 JP 4968036B2
- Authority
- JP
- Japan
- Prior art keywords
- grid
- prosodic
- word
- deleted
- prosodic word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
Description
ある/v 日/m、 私たち/q は/m 、/w 他/q の/v 学校/n の/c 学生/ と/一緒に/ 山/ 登り に/ 行った/ 。/ 私たち/ は/
、/ 誰も/ 遅れる/ こと/ なく/ 素早く/ 山/ 頂/ に/ 登った/
ステップS3において、以下の韻律構造の予測が得られる。
ある/v 日/m、||| 私たち/q は/m || 、/w 他/q の/v | 学校/n の/c ||| 学生/ と/一緒に/ || 山/ | 登り/ 行った/ 。/ 私たち/ は/ 、/ 誰も/ 遅れる/ こと/ なく/ 素早く/ 山/ 頂/ に/ 登った/ |||
ここで、一本の縦棒線「|」は韻律語の境界を示し、二本の縦棒線「||」は韻律フレーズの境界を示し、三本の縦棒線「|||」はイントネーション・フレーズの境界を示す。
また、韻律語グルーピング装置20は、言語テキストに対して分語及び語特性標記の結果を記憶する記憶装置を有する。この分語及び語特性標記の結果に基づき初期の韻律語列を生成する。
(1)バイナリ韻律ツリーに基づく韻律語グルーピング法である。当該方法は、大規模な記号言語資料から学習した言語モデルに基づいて、入力されたテキストに対して、再帰バイナリサーチ(recursive binary search)により、最も確率の高い言語音中断挿入点をサーチし、当該文に対応する最適な言語音中断バイナリツリーを構築する。バイナリツリーの構造に、階層状の言語音中断挿入点の情報が含まれているので、このバイナリツリーをバイナリ韻律ツリーに用いることができる。このバイナリ韻律ツリーはグリッド削除に基づく韻律語グルーピングに用いることができる。同じ親ノードを有する任意の2つの子ノードの間の韻律語グリッドに削除可の記号が付される。
(2)統計確率に基づく韻律語グルーピング法である。この方法は、語の特性(part of speech(POS))及び語の長さ情報が韻律語の境界の予測に用いられる。この方法は、韻律語の境界を予測する際に、語の特性と語の長さは相互独立して無関係であると仮定する。よって、任意2つの言語学の単語は一つの韻律語を形成する確率は、この2つの単語の特性に基づき韻律語を形成する確率と、この2つの単語の長さに基づき韻律語を形成する確率とを含む。
(3)規則に基づく韻律語グルーピング法である。即ち、常用韻律語附属語について、対応する韻律語グルーピング規則を事前に設定する。例えば、中国語では、接尾語「子、系、了」など、助詞「的、得」、方位語「左右、以後、以前、以下、以上、以外」、その他動作の傾向を表す単語などは、頻繁に文書に現れる。これらの単語は通常固定された韻律語グルーピング方式を有し、或いは、一定の条件のもとで、固定された韻律語グルーピング方式を有する。これらの単語は適切に韻律語グルーピングされないと、合成言語音は非常に不自然に聞こえる。よって、以上の常用韻律語附属語について、それぞれの特別な韻律語グルーピング規則を設定し、これらの韻律語附属語を正しく韻律語グルーピングする。
11 分語及び語特性標記部
12 韻律語グリッド挿入部
13 韻律語グリッド削除部
14 韻律語生成部
20 韻律語グルーピング装置
101 入力テキスト
103 記憶装置
104 韻律語グルーピング部
201 韻律語初期化部
202 第1の韻律語グルーピング部
203 グリッド削除記号表示部
204 第2の韻律語グルーピング部
206 第Nの韻律語グルーピング部
401 グリッド削除可能性評価手段
Claims (5)
- 言語テキストを入力するステップと、
前記言語テキストに対して単語分割及び品詞標記を行い、全ての単語境界に韻律語境界を表す区切りであるグリッドを挿入することにより、初期のグリッド韻律語列を生成するステップと、
前記グリッド韻律語列において削除しようとするグリッドに記号を付することを複数の方法により行い、複数の記号付け結果を得るステップと、
前記複数の記号付け結果のうち少なくとも一つが削除すべきであると記号付けしているグリッドを削除すべきと判断する、または、前記複数の記号付け結果のうち半分以上が削除すべきであると記号付けしているグリッドを削除すべきと判断することによって、前記グリッド韻律語列において実際に削除すべきグリッドを判断するステップと、
前記実際に削除すべきグリッドを削除し、残りのグリッドのうち、各2つのグリッドの間の単語をグルーピングし、韻律語を生成するステップと、
を含む
韻律語グルーピング方法。 - 言語テキストを入力する入力部と、
前記言語テキストに対して単語分割及び品詞標記を行い、全ての単語境界に韻律語境界を表す区切りであるグリッドを挿入することにより、初期のグリッド韻律語列を生成する手段と、
前記グリッド韻律語列において削除しようとするグリッドに記号を付することを複数の韻律語グルーピング手段により行い、複数の記号付け結果を得、前記複数の記号付け結果のうち少なくとも一つが削除すべきであると記号付けしているグリッドを削除すべきと判断する、または、前記複数の記号付け結果のうち半分以上が削除すべきであると記号付けしているグリッドを削除すべきと判断することによって実際に削除すべきグリッドを判断し、前記実際に削除すべきグリッドを削除する韻律語グリッド削除部と、
残りのグリッドのうち、各2つのグリッドの間の単語をグルーピングし、韻律語列を生成する韻律語生成部と、
を含む、
韻律語グルーピング装置。 - 前記韻律語生成部により生成された韻律語を分析し、韻律語グルーピング結果を生成する韻律語グルーピング結果分析部を有する
請求項2に記載の韻律語グルーピング装置。 - コンピュータに
言語テキストを入力するステップと、
前記言語テキストに対して単語分割及び品詞標記を行い、全ての単語境界に韻律語境界を表す区切りであるグリッドを挿入することにより、初期のグリッド韻律語列を生成するステップと、
前記グリッド韻律語列において削除しようとするグリッドに記号を付することを複数の方法により行い、複数の記号付け結果を得るステップと、
前記複数の記号付け結果のうち少なくとも一つが削除すべきであると記号付けしているグリッドを削除すべきと判断する、または、前記複数の記号付け結果のうち半分以上が削除すべきであると記号付けしているグリッドを削除すべきと判断することによって、前記グリッド韻律語列において実際に削除すべきグリッドを判断するステップと、
前記実際に削除すべきグリッドを削除し、残りのグリッドのうち、各2つのグリッドの間の単語をグルーピングし、韻律語を生成するステップと、
を実行させるための
韻律語グルーピングプログラム。 - 韻律語グルーピングプログラムを記憶したコンピュータ読み出し可能な記憶媒体であって、
前記韻律語グルーピングプログラムはコンピュータに
言語テキストを入力するステップと、
前記言語テキストに対して単語分割及び品詞標記を行い、全ての単語境界に韻律語境界を表す区切りであるグリッドを挿入することにより、初期のグリッド韻律語列を生成するステップと、
前記グリッド韻律語列における削除しようとするグリッドに記号を付することを複数の方法により行い、複数の記号付け結果を得るステップと、
前記複数の記号付け結果のうち少なくとも一つが削除すべきであると記号付けしているグリッドを削除すべきと判断する、または、前記複数の記号付け結果のうち半分以上が削除すべきであると記号付けしているグリッドを削除すべきと判断することによって、前記グリッド韻律語列における実際に削除すべきグリッドを判断するステップと、
前記実際に削除すべきグリッドを削除し、残りのグリッドのうち、各2つのグリッドの間の単語をグルーピングし、韻律語を生成するステップと、
を実行させる
読み出し可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200610167040.0 | 2006-12-13 | ||
CN2006101670400A CN101202041B (zh) | 2006-12-13 | 2006-12-13 | 一种汉语韵律词组词方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008152260A JP2008152260A (ja) | 2008-07-03 |
JP4968036B2 true JP4968036B2 (ja) | 2012-07-04 |
Family
ID=39517175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007322494A Active JP4968036B2 (ja) | 2006-12-13 | 2007-12-13 | 韻律語グルーピング方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8392191B2 (ja) |
JP (1) | JP4968036B2 (ja) |
CN (1) | CN101202041B (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101430680B (zh) | 2008-12-31 | 2011-01-19 | 阿里巴巴集团控股有限公司 | 一种无词边界标记语言文本的分词序列选择方法及系统 |
US8775341B1 (en) | 2010-10-26 | 2014-07-08 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US9015093B1 (en) | 2010-10-26 | 2015-04-21 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US9484015B2 (en) * | 2013-05-28 | 2016-11-01 | International Business Machines Corporation | Hybrid predictive model for enhancing prosodic expressiveness |
CN104142909B (zh) * | 2014-05-07 | 2016-04-27 | 腾讯科技(深圳)有限公司 | 一种汉字注音方法及装置 |
CN104021784B (zh) * | 2014-06-19 | 2017-06-06 | 百度在线网络技术(北京)有限公司 | 基于大语料库的语音合成方法和装置 |
CN107038163A (zh) * | 2016-02-03 | 2017-08-11 | 常州普适信息科技有限公司 | 一种面向海量互联网信息的文本语义建模方法 |
CN107039034B (zh) * | 2016-02-04 | 2020-05-01 | 科大讯飞股份有限公司 | 一种韵律预测方法及系统 |
US11195513B2 (en) * | 2017-09-27 | 2021-12-07 | International Business Machines Corporation | Generating phonemes of loan words using two converters |
CN111354333B (zh) * | 2018-12-21 | 2023-11-10 | 中国科学院声学研究所 | 一种基于自注意力的汉语韵律层级预测方法及系统 |
CN110534087B (zh) * | 2019-09-04 | 2022-02-15 | 清华大学深圳研究生院 | 一种文本韵律层级结构预测方法、装置、设备及存储介质 |
CN111105780B (zh) * | 2019-12-27 | 2023-03-31 | 出门问问信息科技有限公司 | 一种韵律纠正方法、装置以及计算机可读存储介质 |
CN112131878B (zh) * | 2020-09-29 | 2022-05-31 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置以及计算机设备 |
CN114707503B (zh) * | 2022-02-14 | 2023-04-07 | 慧言科技(天津)有限公司 | 基于多任务学习的前端文本分析方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995010832A1 (en) | 1993-10-15 | 1995-04-20 | At & T Corp. | A method for training a system, the resulting apparatus, and method of use thereof |
JPH0962286A (ja) | 1995-08-22 | 1997-03-07 | Sony Corp | 音声合成装置および音声合成方法 |
US5850629A (en) | 1996-09-09 | 1998-12-15 | Matsushita Electric Industrial Co., Ltd. | User interface controller for text-to-speech synthesizer |
AU2931600A (en) | 1999-03-15 | 2000-10-04 | British Telecommunications Public Limited Company | Speech synthesis |
US6978239B2 (en) | 2000-12-04 | 2005-12-20 | Microsoft Corporation | Method and apparatus for speech synthesis without prosody modification |
US7263488B2 (en) * | 2000-12-04 | 2007-08-28 | Microsoft Corporation | Method and apparatus for identifying prosodic word boundaries |
US7136802B2 (en) * | 2002-01-16 | 2006-11-14 | Intel Corporation | Method and apparatus for detecting prosodic phrase break in a text to speech (TTS) system |
-
2006
- 2006-12-13 CN CN2006101670400A patent/CN101202041B/zh active Active
-
2007
- 2007-12-10 US US12/000,178 patent/US8392191B2/en active Active
- 2007-12-13 JP JP2007322494A patent/JP4968036B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008152260A (ja) | 2008-07-03 |
CN101202041B (zh) | 2011-01-05 |
CN101202041A (zh) | 2008-06-18 |
US8392191B2 (en) | 2013-03-05 |
US20080147405A1 (en) | 2008-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4968036B2 (ja) | 韻律語グルーピング方法及び装置 | |
KR100996817B1 (ko) | 문자 대 음성 변환을 위한 상호 정보 기준을 이용한 큰 그라포넴 단위의 생성 | |
JP5071373B2 (ja) | 言語処理装置、言語処理方法および言語処理用プログラム | |
CN105336322A (zh) | 多音字模型训练方法、语音合成方法及装置 | |
JP2006031228A (ja) | 形態素解析装置、方法及びプログラム | |
CN104021784A (zh) | 基于大语料库的语音合成方法和装置 | |
JP5180800B2 (ja) | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム | |
JP6941494B2 (ja) | エンドツーエンド日本語音声認識モデル学習装置およびプログラム | |
JP6810580B2 (ja) | 言語モデル学習装置およびそのプログラム | |
Hifny | Open vocabulary Arabic diacritics restoration | |
WO2009107441A1 (ja) | 音声合成装置、テキスト生成装置およびその方法並びにプログラム | |
CN111128181B (zh) | 背诵题评测方法、装置以及设备 | |
JP6276516B2 (ja) | 辞書作成装置、及び辞書作成プログラム | |
JP2005092682A (ja) | 翻字装置、及び翻字プログラム | |
Vu et al. | Vietnamese automatic speech recognition: The flavor approach | |
Wang et al. | Integrating conditional random fields and joint multi-gram model with syllabic features for grapheme-to-phone conversion. | |
Saychum et al. | Efficient Thai Grapheme-to-Phoneme Conversion Using CRF-Based Joint Sequence Modeling. | |
JP2002258884A (ja) | 音声合成方法および装置並びにプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
WO2008038994A1 (en) | Method for converting pronunciation using boundary pause intensity and text-to-speech synthesis system based on the same | |
TWI635483B (zh) | Method and system for generating prosody by using linguistic features inspired by punctuation | |
JP2008181537A (ja) | 情報処理装置および方法、プログラム、並びに記録媒体 | |
Hasegawa-Johnson et al. | Fast transcription of speech in low-resource languages | |
JP2005345846A (ja) | 入力テキストのポーズ位置予測装置 | |
JP6125991B2 (ja) | 発音辞書変換モデル作成装置と発音辞書変換装置とそれらの方法と、プログラムとその記録媒体 | |
JP2024001922A (ja) | 情報処理システム、情報処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100715 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120306 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120319 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150413 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4968036 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |