JP4262077B2 - 情報処理装置及びその制御方法、プログラム - Google Patents
情報処理装置及びその制御方法、プログラム Download PDFInfo
- Publication number
- JP4262077B2 JP4262077B2 JP2003415426A JP2003415426A JP4262077B2 JP 4262077 B2 JP4262077 B2 JP 4262077B2 JP 2003415426 A JP2003415426 A JP 2003415426A JP 2003415426 A JP2003415426 A JP 2003415426A JP 4262077 B2 JP4262077 B2 JP 4262077B2
- Authority
- JP
- Japan
- Prior art keywords
- pronunciation
- partial character
- word
- character string
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 36
- 230000010365 information processing Effects 0.000 title claims description 11
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Description
表記と発音が関連付けられた複数の単語を含む単語辞書から処理対象の単語を順に取得して、処理対象の単語の表記を、母音字・子音字の並びを用いた、以下の4つの分割規則として、
分割規則(1)語頭および語末の子音字はその直後あるいは直前の母音字と同じ部分文字列に含める
分割規則(2)母音字に挟まれた1つの子音字は後ろの部分文字列に含める
分割規則(3)母音字に挟まれた2つの子音字はその間を部分文字列の区切りとする
分割規則(4)3つ以上の子音字が連続するときは最後の子音字の前を部分文字列の区切りとする、
分割規則を用いて、複数の部分文字列に分割する第1分割手段と、
前記分割手段で分割された複数の部分文字列の内、隣接した部分文字列を連結して新しい部分文字列を生成する連結手段と、
前記分割手段で分割された部分文字列及び前記連結手段によって連結して生成された新しい部分文字列のそれぞれについて、処理対象の単語の発音の中で該部分文字列が対応する部分の発音を決定し、その部分文字列と決定した対応する発音の組を発音規則として発音規則保持部に登録する登録手段と、
発音推定対象の単語の表記を取得する取得手段と、
前記4つの分割規則(1)乃至(4)を用いて、前記発音推定対象の単語の表記を複数の部分文字列に分割する第2分割手段と、
前記第2分割手段によって、表記の先頭から順に、前記発音推定対象の単語の表記を分割した部分文字列の区切り位置に合い、かつ最も部分文字列が長い発音規則を、前記発音規則保持部から選択する選択手段と、
前記選択手段で選択された発音規則の発音を順に結合したものを発音推定対象の単語の発音と推定する推定手段と
を備える。
表記と発音が関連付けられた複数の単語を含む単語辞書から処理対象の単語を順に取得して、処理対象の単語の表記を、母音字・子音字の並びを用いた、以下の4つの分割規則として、
分割規則(1)語頭および語末の子音字はその直後あるいは直前の母音字と同じ部分文字列に含める
分割規則(2)母音字に挟まれた1つの子音字は後ろの部分文字列に含める
分割規則(3)母音字に挟まれた2つの子音字はその間を部分文字列の区切りとする
分割規則(4)3つ以上の子音字が連続するときは最後の子音字の前を部分文字列の区切りとする、
分割規則を用いて、複数の部分文字列に分割する第1分割工程と、
前記分割工程で分割された複数の部分文字列の内、隣接した部分文字列を連結して新しい部分文字列を生成する連結工程と、
前記分割工程で分割された部分文字列及び前記連結工程によって連結して生成された新しい部分文字列のそれぞれについて、処理対象の単語の発音の中で該部分文字列が対応する部分の発音を決定し、その部分文字列と決定した対応する発音の組を発音規則として発音規則保持部に登録する登録工程と、
発音推定対象の単語の表記を取得する取得工程と、
前記4つの分割規則(1)乃至(4)を用いて、前記発音推定対象の単語の表記を複数の部分文字列に分割する第2分割工程と、
前記第2分割工程によって、表記の先頭から順に、前記発音推定対象の単語の表記を分割した部分文字列の区切り位置に合い、かつ最も部分文字列が長い発音規則を、前記発音規則保持部から選択する選択工程と、
前記選択工程で選択された発音規則の発音を順に結合したものを発音推定対象の単語の発音と推定する推定工程と
を備える。
処理対象の発音を推定する情報処理装置の制御をコンピュータに実行させるためのプログラムであって、
表記と発音が関連付けられた複数の単語を含む単語辞書から処理対象の単語を順に取得して、処理対象の単語の表記を、母音字・子音字の並びを用いた、以下の4つの分割規則として、
分割規則(1)語頭および語末の子音字はその直後あるいは直前の母音字と同じ部分文字列に含める
分割規則(2)母音字に挟まれた1つの子音字は後ろの部分文字列に含める
分割規則(3)母音字に挟まれた2つの子音字はその間を部分文字列の区切りとする
分割規則(4)3つ以上の子音字が連続するときは最後の子音字の前を部分文字列の区切りとする、
分割規則を用いて、複数の部分文字列に分割する第1分割工程と、
前記分割工程で分割された複数の部分文字列の内、隣接した部分文字列を連結して新しい部分文字列を生成する連結工程と、
前記分割工程で分割された部分文字列及び前記連結工程によって連結して生成された新しい部分文字列のそれぞれについて、処理対象の単語の発音の中で該部分文字列が対応する部分の発音を決定し、その部分文字列と決定した対応する発音の組を発音規則として発音規則保持部に登録する登録工程と、
発音推定対象の単語の表記を取得する取得工程と、
前記4つの分割規則(1)乃至(4)を用いて、前記発音推定対象の単語の表記を複数の部分文字列に分割する第2分割工程と、
前記第2分割工程によって、表記の先頭から順に、前記発音推定対象の単語の表記を分割した部分文字列の区切り位置に合い、かつ最も部分文字列が長い発音規則を、前記発音規則保持部から選択する選択工程と、
前記選択工程で選択された発音規則の発音を順に結合したものを発音推定対象の単語の発音と推定する推定工程と
をコンピュータに実行させることを特徴とする。
図1は本発明の実施形態1に係る発音推定装置の機能構成を示すブロック図である。
実施形態1では、単語の発音を推定するための発音規則を生成する処理について説明したが、実施形態2では、この生成された発音規則を用いて、単語の発音を推定する処理について説明する。
実施形態1の図2のステップSS202や実施形態2の図7のステップS701において、表記文字列分割部102は、単語の表記を母音字・子音字の並びで部分文字列に分割していたが、音節(シラブル)を部分文字列としてもよい。
102 表記文字列分割部
103 部分文字列連結部
104 発音規則生成部
105 発音規則保持部
106 発音規則削除部
601 表記入力部
602 発音規則選択部
603 発音出力部
Claims (3)
- 表記と発音が関連付けられた複数の単語を含む単語辞書から処理対象の単語を順に取得して、処理対象の単語の表記を、母音字・子音字の並びを用いた、以下の4つの分割規則として、
分割規則(1)語頭および語末の子音字はその直後あるいは直前の母音字と同じ部分文字列に含める
分割規則(2)母音字に挟まれた1つの子音字は後ろの部分文字列に含める
分割規則(3)母音字に挟まれた2つの子音字はその間を部分文字列の区切りとする
分割規則(4)3つ以上の子音字が連続するときは最後の子音字の前を部分文字列の区切りとする、
分割規則を用いて、複数の部分文字列に分割する第1分割手段と、
前記分割手段で分割された複数の部分文字列の内、隣接した部分文字列を連結して新しい部分文字列を生成する連結手段と、
前記分割手段で分割された部分文字列及び前記連結手段によって連結して生成された新しい部分文字列のそれぞれについて、処理対象の単語の発音の中で該部分文字列が対応する部分の発音を決定し、その部分文字列と決定した対応する発音の組を発音規則として発音規則保持部に登録する登録手段と、
発音推定対象の単語の表記を取得する取得手段と、
前記4つの分割規則(1)乃至(4)を用いて、前記発音推定対象の単語の表記を複数の部分文字列に分割する第2分割手段と、
前記第2分割手段によって、表記の先頭から順に、前記発音推定対象の単語の表記を分割した部分文字列の区切り位置に合い、かつ最も部分文字列が長い発音規則を、前記発音規則保持部から選択する選択手段と、
前記選択手段で選択された発音規則の発音を順に結合したものを発音推定対象の単語の発音と推定する推定手段と
を備えることを特徴とする情報処理装置。 - 表記と発音が関連付けられた複数の単語を含む単語辞書から処理対象の単語を順に取得して、処理対象の単語の表記を、母音字・子音字の並びを用いた、以下の4つの分割規則として、
分割規則(1)語頭および語末の子音字はその直後あるいは直前の母音字と同じ部分文字列に含める
分割規則(2)母音字に挟まれた1つの子音字は後ろの部分文字列に含める
分割規則(3)母音字に挟まれた2つの子音字はその間を部分文字列の区切りとする
分割規則(4)3つ以上の子音字が連続するときは最後の子音字の前を部分文字列の区切りとする、
分割規則を用いて、複数の部分文字列に分割する第1分割工程と、
前記分割工程で分割された複数の部分文字列の内、隣接した部分文字列を連結して新しい部分文字列を生成する連結工程と、
前記分割工程で分割された部分文字列及び前記連結工程によって連結して生成された新しい部分文字列のそれぞれについて、処理対象の単語の発音の中で該部分文字列が対応する部分の発音を決定し、その部分文字列と決定した対応する発音の組を発音規則として発音規則保持部に登録する登録工程と、
発音推定対象の単語の表記を取得する取得工程と、
前記4つの分割規則(1)乃至(4)を用いて、前記発音推定対象の単語の表記を複数の部分文字列に分割する第2分割工程と、
前記第2分割工程によって、表記の先頭から順に、前記発音推定対象の単語の表記を分割した部分文字列の区切り位置に合い、かつ最も部分文字列が長い発音規則を、前記発音規則保持部から選択する選択工程と、
前記選択工程で選択された発音規則の発音を順に結合したものを発音推定対象の単語の発音と推定する推定工程と
を備えることを特徴とする情報処理装置の制御方法。 - 処理対象の発音を推定する情報処理装置の制御をコンピュータに実行させるためのプログラムであって、
表記と発音が関連付けられた複数の単語を含む単語辞書から処理対象の単語を順に取得して、処理対象の単語の表記を、母音字・子音字の並びを用いた、以下の4つの分割規則として、
分割規則(1)語頭および語末の子音字はその直後あるいは直前の母音字と同じ部分文字列に含める
分割規則(2)母音字に挟まれた1つの子音字は後ろの部分文字列に含める
分割規則(3)母音字に挟まれた2つの子音字はその間を部分文字列の区切りとする
分割規則(4)3つ以上の子音字が連続するときは最後の子音字の前を部分文字列の区切りとする、
分割規則を用いて、複数の部分文字列に分割する第1分割工程と、
前記分割工程で分割された複数の部分文字列の内、隣接した部分文字列を連結して新しい部分文字列を生成する連結工程と、
前記分割工程で分割された部分文字列及び前記連結工程によって連結して生成された新しい部分文字列のそれぞれについて、処理対象の単語の発音の中で該部分文字列が対応する部分の発音を決定し、その部分文字列と決定した対応する発音の組を発音規則として発音規則保持部に登録する登録工程と、
発音推定対象の単語の表記を取得する取得工程と、
前記4つの分割規則(1)乃至(4)を用いて、前記発音推定対象の単語の表記を複数の部分文字列に分割する第2分割工程と、
前記第2分割工程によって、表記の先頭から順に、前記発音推定対象の単語の表記を分割した部分文字列の区切り位置に合い、かつ最も部分文字列が長い発音規則を、前記発音規則保持部から選択する選択工程と、
前記選択工程で選択された発音規則の発音を順に結合したものを発音推定対象の単語の発音と推定する推定工程と
をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003415426A JP4262077B2 (ja) | 2003-12-12 | 2003-12-12 | 情報処理装置及びその制御方法、プログラム |
US11/000,060 US20050131674A1 (en) | 2003-12-12 | 2004-12-01 | Information processing apparatus and its control method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003415426A JP4262077B2 (ja) | 2003-12-12 | 2003-12-12 | 情報処理装置及びその制御方法、プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2005173391A JP2005173391A (ja) | 2005-06-30 |
JP2005173391A5 JP2005173391A5 (ja) | 2006-02-09 |
JP4262077B2 true JP4262077B2 (ja) | 2009-05-13 |
Family
ID=34650581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003415426A Expired - Fee Related JP4262077B2 (ja) | 2003-12-12 | 2003-12-12 | 情報処理装置及びその制御方法、プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20050131674A1 (ja) |
JP (1) | JP4262077B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080177548A1 (en) * | 2005-05-31 | 2008-07-24 | Canon Kabushiki Kaisha | Speech Synthesis Method and Apparatus |
US9275633B2 (en) * | 2012-01-09 | 2016-03-01 | Microsoft Technology Licensing, Llc | Crowd-sourcing pronunciation corrections in text-to-speech engines |
JP6245846B2 (ja) * | 2013-05-30 | 2017-12-13 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 音声認識における読み精度を改善するシステム、方法、およびプログラム |
CN105893414A (zh) * | 2015-11-26 | 2016-08-24 | 乐视致新电子科技(天津)有限公司 | 筛选发音词典有效词条的方法及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5949961A (en) * | 1995-07-19 | 1999-09-07 | International Business Machines Corporation | Word syllabification in speech synthesis system |
US6076060A (en) * | 1998-05-01 | 2000-06-13 | Compaq Computer Corporation | Computer method and apparatus for translating text to sound |
US6347295B1 (en) * | 1998-10-26 | 2002-02-12 | Compaq Computer Corporation | Computer method and apparatus for grapheme-to-phoneme rule-set-generation |
US6470347B1 (en) * | 1999-09-01 | 2002-10-22 | International Business Machines Corporation | Method, system, program, and data structure for a dense array storing character strings |
JP2005031259A (ja) * | 2003-07-09 | 2005-02-03 | Canon Inc | 自然言語処理方法 |
-
2003
- 2003-12-12 JP JP2003415426A patent/JP4262077B2/ja not_active Expired - Fee Related
-
2004
- 2004-12-01 US US11/000,060 patent/US20050131674A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20050131674A1 (en) | 2005-06-16 |
JP2005173391A (ja) | 2005-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100403293B1 (ko) | 음성합성방법, 음성합성장치 및 음성합성프로그램을기록한 컴퓨터판독 가능한 매체 | |
CN109389968B (zh) | 基于双音节混搭的波形拼接方法、装置、设备及存储介质 | |
US7228270B2 (en) | Dictionary management apparatus for speech conversion | |
JP3372532B2 (ja) | 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体 | |
JP4738847B2 (ja) | データ検索装置および方法 | |
CA2275391C (en) | File processing method, data processing device, and storage medium | |
JP4262077B2 (ja) | 情報処理装置及びその制御方法、プログラム | |
JP2005031259A (ja) | 自然言語処理方法 | |
JP6619932B2 (ja) | 形態素解析装置およびプログラム | |
JP2019095603A (ja) | 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法 | |
JP7124358B2 (ja) | 出力プログラム、情報処理装置及び出力制御方法 | |
JP4173404B2 (ja) | 文セット自動生成装置、文セット自動生成プログラム、記憶媒体 | |
JPH1115497A (ja) | 氏名読み音声合成装置 | |
JP4971732B2 (ja) | 自然言語処理装置、およびプログラム | |
JP3958908B2 (ja) | 書き起こしテキスト自動生成装置、音声認識装置および記録媒体 | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
JP3379643B2 (ja) | 形態素解析方法および形態素解析プログラムを記録した記録媒体 | |
JP2007316916A (ja) | 形態素解析装置、形態素解析方法及び形態素解析プログラム | |
WO2023073886A1 (ja) | 情報処理システム、情報処理装置、情報処理方法、及び記録媒体 | |
JP2007127994A (ja) | 音声合成方法及び音声合成装置並びにプログラム | |
JP2007178692A (ja) | 文字入力装置および方法 | |
JPH09258763A (ja) | 音声合成装置 | |
JP2003132052A (ja) | 読みがな付与装置およびプログラム | |
JP7200474B2 (ja) | 変換補助装置、変換補助システム、変換補助方法及びコンピュータプログラム | |
JP4344195B2 (ja) | 音声合成用リスト生成装置及び音声合成用リスト生成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051219 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090130 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140220 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |