JP5533377B2 - 音声合成装置、音声合成プログラムおよび音声合成方法 - Google Patents
音声合成装置、音声合成プログラムおよび音声合成方法 Download PDFInfo
- Publication number
- JP5533377B2 JP5533377B2 JP2010158842A JP2010158842A JP5533377B2 JP 5533377 B2 JP5533377 B2 JP 5533377B2 JP 2010158842 A JP2010158842 A JP 2010158842A JP 2010158842 A JP2010158842 A JP 2010158842A JP 5533377 B2 JP5533377 B2 JP 5533377B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- word
- analysis result
- analysis
- program
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 36
- 238000003786 synthesis reaction Methods 0.000 title claims description 20
- 238000001308 synthesis method Methods 0.000 title claims description 4
- 238000000034 method Methods 0.000 claims description 49
- 230000000877 morphologic effect Effects 0.000 claims description 48
- 230000008569 process Effects 0.000 claims description 43
- 150000001875 compounds Chemical class 0.000 claims description 12
- 230000014509 gene expression Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 36
- 239000002245 particle Substances 0.000 description 19
- 230000006870 function Effects 0.000 description 11
- 235000010746 mayonnaise Nutrition 0.000 description 8
- 239000008268 mayonnaise Substances 0.000 description 8
- 239000000284 extract Substances 0.000 description 5
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 208000003251 Pruritus Diseases 0.000 description 1
- 206010049633 Shoshin beriberi Diseases 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Description
普通名詞「小心者(ショーションモノ)」
接尾語「夫(フ)」
格助詞「が(ガ)」
普通名詞「逆襲(ギャクシュー)」
句読点「!(.)」である。なお、()内は、各単語の読みとアクセントを示している。
普通名詞「世界(セ’カイ)」
普通名詞「終末(シューマツ)」
普通名詞「予言(ヨゲン)」
→「世界終末予言(セカイシューマツヨ’ゲン)」
普通名詞「一致(イッチ)」
普通名詞「徹底(テッテー)」
普通名詞「追跡(ツイセキ)」
→「一致徹底追跡(イッチテッテーツ’イセキ)」
以下、本実施形態にかかる音声合成装置を、コンピュータ装置を用いて構成する場合の例について説明する。なお、本実施形態にかかる音声合成装置を、例えば、各種メディアを用いた録画再生装置、携帯電話またはPDA(Personal Digital Assistance)等の装置を用いて構成してもよい。
図1は、本実施形態にかかる音声合成装置1における各機能部の関係の一例を示す図である。図1に示す音声合成装置1は、EPGデータ受信部2、詳細テキスト取得部3、概要テキスト取得部4、第1解析部5、第2解析部6、単語辞書データ保持部7、表音文字生成部8および音声合成部9を備える。
図3は、図1に示した音声合成装置1を、CPUを用いて実現したハードウェア構成の例を示す図である。上記音声合成装置1は、ディスプレイ31、CPU32、メモリ33、キーボード/マウス34、ハードディスク35、通信回路36およびスピーカ37を少なくとも備える。
上述の図1〜図3に加え、図4〜図10Cを用いて、上記音声合成装置1における音声合成プログラム35aの処理内容について説明する。図4は、音声合成装置1のCPU32で実行される音声合成プログラム35aに基づく音声合成処理のオペレーションチャートの一例を示す図である。
次に、CPU32は、概要テキストの読み特定処理をサブルーチンで実行する(Op412)。図6は、概要テキストの読み特定処理のオペレーションチャートの一例を示す図である。CPU32は、単語辞書データ35bから、概要テキストを構成する文字列と表記が部分一致する単語を全て抽出する(Op601)。
図7は、概要テキストの原形特定処理のオペレーションチャートの一例を示す図である。概要テキストの原形特定処理は、図2Bの時間枠213(「4チャンネル」の「20時」からの番組タイトル「お笑い」についての番組概要「大爆笑!チョート・ブルマヨ・エンジャ!」、図2Aに示す番組レコード24)の例を用いて説明する。
図9は、概要テキストのアクセント結合判定処理のオペレーションチャートの一例を示す図である。概要テキストのアクセント結合判定処理(Op415)は、図2Bの時間枠214(「1チャンネル」の「21時」からの番組タイトル「ドキュメント」についての番組概要「世界終末予言と奇妙な一致徹底追跡」、図2Aに示す番組レコード25)の例を用いて説明する。
以上に説明したとおり、上記の音声合成装置1においては、詳細テキストを形態素解析した第1の解析結果と、当該詳細テキストが示す情報と同一の番組について表現が異なる情報を示す概要テキストを形態素解析し、前記第1の解析結果を参照して第2の解析結果を出力して概要テキストに関する合成音声を生成するための表音文字列を生成する。このため、前記概要テキストが、助詞や助動詞等を省略したり、固有名詞等を略称で表記したりすることによって作成されたテキストであっても、読み上げ精度を向上させ、聞き手が判りやすい自然な読み上げ音声を生成することが可能となる。
本実施形態にかかる音声合成装置も、第1の実施形態と同様に、パーソナルコンピュータ、各種メディアを用いた録画再生装置、携帯電話またはPDA等の装置を用いて構成可能である。本実施形態においては、音声読み上げ機能つきウェブブラウザの例について説明する。
本実施形態の音声合成装置1における各機能部の関係の一例は、図1と基本的に同様である。本実施形態の音声合成装置1は、図1のEPGデータ受信部2に代えて、ニュース一覧データおよび記事テキストを受信するニュースデータ受信部を備えている。例えば、ニュースデータ受信部は、ウェブブラウザを用いて所定のニュースサイト(URL)にアクセスすることによって実現可能である。
本実施形態の音声合成装置1におけるハードウェア構成の例は、図2と基本的に同様である。本実施形態の音声合成装置1においては、ハードディスク35にブラウザプログラムが記録される。ニュースデータ受信部は、CPU32上において音声合成プログラム35aおよびウェブブラウザプログラムを実行することによって実現される。例えば、音声合成プログラム35aをウェブブラウザプログラムのプラグインとしてインストールしてもよい。
図12は、音声合成装置1のCPU32で実行される音声合成プログラム35aに基づく音声合成処理のオペレーションチャートの一例を示す図である。図12の音声合成処理において、先ずCPU32は、ニュースサイトにアクセスしてニュース一覧データを取得する(Op1201)。続いてCPU32は、受信したニュース一覧データに基づいて、図11Aに示したニュース一覧画面を生成して、これをディスプレイ31に表示する(Op1202)。ニュース一覧画面においては、URLリンクとしてのニュースタイトルがニュース毎に表示される。
以上に説明したとおり、上記の音声合成装置1は、ウェブブラウザのニュース記事タイトルを読み上げる際に、そのタイトルにリンクされている記事テキストの内容を参照して、タイトルの読み上げ精度を向上させることができる。
[3−1.実施形態の組合せ]
上記第1および第2の実施形態において説明した構成の一部または全部を、2以上組合せた構成としてもよい。
上記第1の実施形態においては、図1のEPGデータ受信部2において受信したデータ(図2A)に基づいて、詳細テキストおよび概要テキストを取得する例について説明した。しかし、詳細テキストおよび概要テキストをそれぞれ別のデータに基づいて取得してもよい。
上記実施形態においては、図1に示す各機能ブロックを、ソフトウェアを実行するCPUの処理によって実現している。しかし、その一部もしくは全てを、ロジック回路等のハードウェアによって実現してもよい。なお、プログラムの一部の処理をさらに、オペレーティング・システム(OS)にさせるようにしてもよい。
2 EPGデータ受信部
3 詳細テキスト取得部
4 概要テキスト取得部
5 第1解析部
6 第2解析部
7 単語辞書データ保持部
8 表音文字生成部
9 音声合成部
Claims (9)
- 任意の対象についての情報を示す第1のテキストを形態素解析して第1の解析結果を出力する第1解析部と、
前記第1のテキストが示す情報と同一の対象について表現が異なる情報を示す第2のテキストを形態素解析し、前記第1の解析結果を参照して第2の解析結果を出力する第2解析部と、
前記第2の解析結果に基づいて、前記第2のテキストに関する合成音声を生成するための表音文字列を生成する表音文字列生成部とを備え、
前記第2解析部は、前記第1のテキストに含まれる第1の単語と前記第2のテキストに含まれる第2の単語が一致または部分一致するとき、前記第2の単語の解析結果として前記第1の単語の解析結果を優先して採用することを特徴とする音声合成装置。 - 前記第2解析部は、前記第2の単語に対して複数の解析結果の候補が出力され、その一個が前記第1の単語と一致した場合に、前記第2の単語の解析結果として前記第1の単語の解析結果を出力する、請求項1に記載の音声合成装置。
- 前記第2解析部は、前記第2の単語が解析不能な単語であり、前記第2の単語が前記第1の単語に部分一致する場合、前記第1の単語の解析結果を前記第2の単語の解析結果として出力する、請求項1または2に記載の音声合成装置。
- 前記第2解析部は、前記第2のテキスト中に複合単語が含まれており、かつ、前記複合単語が前記第1のテキスト中にも含まれている場合には、前記複合単語を一つのアクセント句として前記複合単語を構成する単語についての解析結果を出力する、請求項1〜3のいずれか一項に記載の音声合成装置。
- 前記表音文字列は、前記第2のテキストについての読み、アクセントまたは境界情報を含む、請求項1〜4のいずれか一項に記載の音声合成装置。
- 前記第1のテキストは、番組表データに基づく番組情報の詳細テキストであり、
前記第2のテキストは、番組表データに基づく番組情報の概要テキストであり、
前記表音文字列生成部は、前記概要テキストに関する合成音声を生成するための表音文字列を生成する、請求項1〜5のいずれか一項に記載の音声合成装置。 - 前記第2のテキストは、ニュース記事の見出しデータに基づくテキストであり、
前記第1のテキストは、前記ニュース記事の本文データに基づくテキストであり、
前記表音文字列生成部は、前記見出しデータに関する合成音声を生成するための表音文字列を生成する、請求項1〜5のいずれか一項に記載の音声合成装置。 - 音声合成装置をコンピュータを用いて実現するための音声合成プログラムであって、
任意の対象についての情報を示す第1のテキストを形態素解析して第1の解析結果を出力する第1解析処理と、
前記第1のテキストが示す情報と同一の対象について表現が異なる情報を示す第2のテキストを形態素解析し、前記第1の解析結果を参照して第2の解析結果を出力する第2解析処理と、
前記第2の解析結果に基づいて、前記第2のテキストに関する合成音声を生成するための表音文字列を生成する表音文字列生成処理とをコンピュータに実行させ、
前記第2解析処理は、前記第1のテキストに含まれる第1の単語と前記第2のテキストに含まれる第2の単語が一致または部分一致するとき、前記第2の単語の解析結果として前記第1の単語の解析結果を優先して採用することを特徴とする音声合成プログラム。 - 任意の対象についての情報を示す第1のテキストを形態素解析して第1の解析結果を出力する第1解析工程と、
前記第1のテキストが示す情報と同一の対象について表現が異なる情報を示す第2のテキストを形態素解析し、前記第1の解析結果を参照して第2の解析結果を出力する第2解析工程と、
前記第2の解析結果に基づいて、前記第2のテキストに関する合成音声を生成するための表音文字列を生成する表音文字列生成工程とを含み、
前記第2解析工程は、前記第1のテキストに含まれる第1の単語と前記第2のテキストに含まれる第2の単語が一致または部分一致するとき、前記第2の単語の解析結果として前記第1の単語の解析結果を優先して採用することを特徴とする音声合成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010158842A JP5533377B2 (ja) | 2010-07-13 | 2010-07-13 | 音声合成装置、音声合成プログラムおよび音声合成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010158842A JP5533377B2 (ja) | 2010-07-13 | 2010-07-13 | 音声合成装置、音声合成プログラムおよび音声合成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012022447A JP2012022447A (ja) | 2012-02-02 |
JP5533377B2 true JP5533377B2 (ja) | 2014-06-25 |
Family
ID=45776708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010158842A Expired - Fee Related JP5533377B2 (ja) | 2010-07-13 | 2010-07-13 | 音声合成装置、音声合成プログラムおよび音声合成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5533377B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6232724B2 (ja) * | 2013-03-29 | 2017-11-22 | 富士通株式会社 | 音声合成装置及び言語辞書登録方法 |
MY188845A (en) | 2014-07-14 | 2022-01-09 | Sony Corp | Transmission device, transmission method, reception device, and reception method |
CA2958531C (en) * | 2014-10-03 | 2019-02-26 | Sharp Kabushiki Kaisha | Methods for phonetic information signaling |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2643363B2 (ja) * | 1988-09-29 | 1997-08-20 | 国際電信電話株式会社 | 複合語のアクセント句境界付与方式 |
JPH04130578A (ja) * | 1990-09-20 | 1992-05-01 | Fujitsu Ltd | 未登録語検索方法および装置 |
JPH06168265A (ja) * | 1992-11-30 | 1994-06-14 | Matsushita Electric Ind Co Ltd | 言語処理装置および音声合成装置 |
JP2855409B2 (ja) * | 1994-11-17 | 1999-02-10 | 日本アイ・ビー・エム株式会社 | 自然言語処理方法及びシステム |
JP3580760B2 (ja) * | 2000-05-26 | 2004-10-27 | シャープ株式会社 | 自動編集装置及び方法並びにこれに利用される記憶媒体 |
JP5029167B2 (ja) * | 2007-06-25 | 2012-09-19 | 富士通株式会社 | 音声読み上げのための装置、プログラム及び方法 |
-
2010
- 2010-07-13 JP JP2010158842A patent/JP5533377B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012022447A (ja) | 2012-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8355919B2 (en) | Systems and methods for text normalization for text to speech synthesis | |
US8712776B2 (en) | Systems and methods for selective text to speech synthesis | |
US8396714B2 (en) | Systems and methods for concatenation of words in text to speech synthesis | |
US8352268B2 (en) | Systems and methods for selective rate of speech and speech preferences for text to speech synthesis | |
US8583418B2 (en) | Systems and methods of detecting language and natural language strings for text to speech synthesis | |
US8352272B2 (en) | Systems and methods for text to speech synthesis | |
US20100082328A1 (en) | Systems and methods for speech preprocessing in text to speech synthesis | |
US20100082327A1 (en) | Systems and methods for mapping phonemes for text to speech synthesis | |
JP4923604B2 (ja) | 情報処理装置および方法、並びにプログラム | |
US8793133B2 (en) | Systems and methods document narration | |
US8359202B2 (en) | Character models for document narration | |
US20140289226A1 (en) | System and Method For Search and Display of Content in the Form of Audio, Video or Audio-Video | |
US20080005656A1 (en) | Apparatus, method, and file format for text with synchronized audio | |
JP2013072957A (ja) | 文書読み上げ支援装置、方法及びプログラム | |
JP2009080579A (ja) | 検索装置、方法及びプログラム | |
JP5106608B2 (ja) | 読み上げ支援装置、方法、およびプログラム | |
JP5533377B2 (ja) | 音声合成装置、音声合成プログラムおよび音声合成方法 | |
JP2004334409A (ja) | データ閲覧支援装置、データ閲覧方法及びデータ閲覧プログラム | |
US20110022378A1 (en) | Translation system using phonetic symbol input and method and interface thereof | |
JP4200874B2 (ja) | 感性情報推定方法および文字アニメーション作成方法、これらの方法を用いたプログラム、記憶媒体、感性情報推定装置、文字アニメーション作成装置 | |
JP2005038014A (ja) | 情報提示装置及び情報提示方法 | |
WO2019069997A1 (ja) | 情報処理装置、画面出力方法及びプログラム | |
JP5125404B2 (ja) | 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置 | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
JP6567372B2 (ja) | 編集支援装置、編集支援方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130507 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130701 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130702 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140311 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5533377 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140414 |
|
LAPS | Cancellation because of no payment of annual fees |