JP5142920B2 - 読み上げ情報生成装置、読み上げ情報生成方法及びプログラム - Google Patents
読み上げ情報生成装置、読み上げ情報生成方法及びプログラム Download PDFInfo
- Publication number
- JP5142920B2 JP5142920B2 JP2008249949A JP2008249949A JP5142920B2 JP 5142920 B2 JP5142920 B2 JP 5142920B2 JP 2008249949 A JP2008249949 A JP 2008249949A JP 2008249949 A JP2008249949 A JP 2008249949A JP 5142920 B2 JP5142920 B2 JP 5142920B2
- Authority
- JP
- Japan
- Prior art keywords
- reading
- input
- mora
- voice
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Description
図1は、本発明の第1の実施形態に係る読み上げ情報生成装置の構成例を示すブロック図である。
・読み1モーラ分の入力開始時刻
・読み1モーラ分の入力が確定した時刻のnミリ秒前、またはnミリ秒後の時刻
・次の読み1モーラ分の入力開始時刻
・手書き文字入力の場合、読み1モーラ分が決定する文字の最後の1筆を書き、ペン先が入力板から離れた時刻
本発明によれば、1モーラ分のテキスト入力に併せて1モーラに対応する音声を発声して入力し、読み1モーラ分の入力と入力確定時刻と、読みに同期して入力された音声とその入力時刻とに基づいて1モーラ毎の音声の高低を得ることにより、モーラ毎の音声の継続長が一定でなくても、読みとそれに対応する音声の高低を同期させることができ、単語単位に囚われることなく、また、1モーラ毎の入力音声の継続長の異なりにも影響されず、ユーザーの意図する音声の高低変化を正確に再現した読み上げ情報(読みと高低のセット)を生成することができる。
第2の実施形態について、第1の実施形態と相違する点を中心に説明する。
第3の実施形態では、第1又は第2の実施形態において、高低判定に高低境界値を用いる場合に、読み上げ情報生成装置に高低境界値を設定する機能を付加したものである。
第4の実施形態について、第1〜第3の実施形態と相違する点を中心に説明する。
結果として、Enterキーが打鍵された位置で一定のポーズが設定される。異なる長さのポーズを入れたい場合は、Enterキーを必要な回数打鍵する。Enterキー1打鍵につき1秒のポーズが入る場合、3秒のポーズを設定したければ3回打鍵する。
また、本実施形態は、コンピュータに所定の手順を実行させるための、あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるためのプログラムとして実施することもできる。加えて該プログラムを記録したコンピュータ読取り可能な記録媒体として実施することもできる。
Claims (9)
- 第1の入力デバイスから入力された音声を、その音声が該第1の入力デバイスから入力された時刻である音声入力時刻とともに記憶する第1の記憶部と、
前記第1の入力デバイスからの前記音声の入力と並行して第2の入力デバイスから入力された読みを、モーラ毎の読みが該第2の入力デバイスから入力された時刻をそれぞれ示すモーラ毎読み入力時刻とともに記憶する第2の記憶部と、
前記第1の記憶部に記憶された音声から基本周波数を抽出する基本周波数抽出部と、
前記モーラ毎の読みのそれぞれについて、当該モーラ毎の読みに対する前記モーラ毎読み入力時刻の前後の一定期間を含むように前記音声入力時刻について設定される対象期間内における、前記音声の基本周波数に基づいて、当該モーラ毎の読みに対するアクセントの高低を判定する高低判定部と、
少なくとも、読みと、その読みのモーラ毎のアクセントの高低を示す高低情報とのセットの系列である読み上げ情報を生成する生成部と、
を備えることを特徴とする読み上げ情報生成装置。 - 前記読み入力時刻は、読み1モーラ分の入力が確定した時刻であることを特徴とする請求項1に記載の読み上げ情報生成装置。
- 前記高低判定部は、対象とする音声に対応する読みが促音である場合、その音声の高低を直前又は直後の読みに対応する音声の高低と同じであるものとすることを特徴とする請求項1に記載の読み上げ情報生成装置。
- 前記高低判定部は、高低の境界に相当する基本周波数を示す高低境界値に基づいて前記判定を行うものであり、
前記読み上げ情報生成装置は、前記高低境界値を記憶する第3の記憶部と、
入力された音声をもとに前記高低境界値を決め、この値によって前記第3の記憶部に記憶されている値を更新する更新部とを更に備えたことを特徴とする請求項1に記載の読み上げ情報生成装置。 - 入力された前記読みには、読み以外の環境情報が含まれ、
前記生成部は、前記読み上げ情報に、前記環境情報を含めて生成するものであり、
前記環境情報は、ポーズを示す情報、アクセント区切りを示す情報、文末を示す情報又は感情を示す情報のうちの少なくとも一つを含むことを特徴とする請求項1に記載の読み上げ情報生成装置。 - 前記読みは、キー入力されたものであることを特徴とする請求項1に記載の読み上げ情報生成装置。
- 前記読みと前記音声とは、1モーラ分の読みが入力されるのに併せて発声された該1モーラに対応する音声が入力されることによって、同期して入力されたものであることを特徴とする請求項1に記載の読み上げ情報生成装置。
- 第1の記憶部、第2の記憶部、基本周波数抽出部、高低判定部及び生成部を備えた読み上げ情報生成装置の読み上げ情報生成方法であって、
前記第1の記憶部が、第1の入力デバイスから入力された音声を、その音声が該第1の入力デバイスから入力された時刻である音声入力時刻とともに記憶するステップと、
前記第2の記憶部が、前記第1の入力デバイスからの前記音声の入力と並行して第2の入力デバイスから入力された読みを、モーラ毎の読みが該第2の入力デバイスから入力された時刻をそれぞれ示すモーラ毎読み入力時刻とともに記憶するステップと、
前記基本周波数抽出部が、前記第1の記憶部に記憶された音声から基本周波数を抽出するステップと、
前記高低判定部が、前記モーラ毎の読みのそれぞれについて、当該モーラ毎の読みに対する前記モーラ毎読み入力時刻の前後の一定期間を含むように前記音声入力時刻について設定される対象期間内における、前記音声の基本周波数に基づいて、当該モーラ毎の読みに対するアクセントの高低を判定するステップと、
前記生成部が、少なくとも、読みと、その読みのモーラ毎のアクセントの高低を示す高低情報とのセットの系列である読み上げ情報を生成するステップと、
を含むことを特徴とする読み上げ情報生成方法。 - 第1の記憶部、第2の記憶部、抽出部、判定部及び生成部を備えた読み上げ情報生成装置としてコンピュータを機能させるためのプログラムであって、
前記第1の記憶部が、第1の入力デバイスから入力された音声を、その音声が該第1の入力デバイスから入力された時刻である音声入力時刻とともに記憶するステップと、
前記第2の記憶部が、前記第1の入力デバイスからの前記音声の入力と並行して第2の入力デバイスから入力された読みを、モーラ毎の読みが該第2の入力デバイスから入力された時刻をそれぞれ示すモーラ毎読み入力時刻とともに記憶するステップと、
前記基本周波数抽出部が、前記第1の記憶部に記憶された音声から基本周波数を抽出するステップと、
前記高低判定部が、前記モーラ毎の読みのそれぞれについて、当該モーラ毎の読みに対する前記モーラ毎読み入力時刻の前後の一定期間を含むように前記音声入力時刻について設定される対象期間内における、前記音声の基本周波数に基づいて、当該モーラ毎の読みに対するアクセントの高低を判定するステップと、
前記生成部が、少なくとも、読みと、その読みのモーラ毎のアクセントの高低を示す高低情報とのセットの系列である読み上げ情報を生成するステップと、
をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008249949A JP5142920B2 (ja) | 2008-09-29 | 2008-09-29 | 読み上げ情報生成装置、読み上げ情報生成方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008249949A JP5142920B2 (ja) | 2008-09-29 | 2008-09-29 | 読み上げ情報生成装置、読み上げ情報生成方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010079168A JP2010079168A (ja) | 2010-04-08 |
JP5142920B2 true JP5142920B2 (ja) | 2013-02-13 |
Family
ID=42209645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008249949A Expired - Fee Related JP5142920B2 (ja) | 2008-09-29 | 2008-09-29 | 読み上げ情報生成装置、読み上げ情報生成方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5142920B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3070127B2 (ja) * | 1991-05-07 | 2000-07-24 | 株式会社明電舎 | 音声合成装置のアクセント成分制御方式 |
JP3303428B2 (ja) * | 1993-05-20 | 2002-07-22 | 株式会社明電舎 | 音声合成装置のアクセント成分基本テーブルの作成方法 |
JP2008134475A (ja) * | 2006-11-28 | 2008-06-12 | Internatl Business Mach Corp <Ibm> | 入力された音声のアクセントを認識する技術 |
-
2008
- 2008-09-29 JP JP2008249949A patent/JP5142920B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010079168A (ja) | 2010-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7500020B2 (ja) | 多言語テキスト音声合成方法 | |
US6778962B1 (en) | Speech synthesis with prosodic model data and accent type | |
US7983912B2 (en) | Apparatus, method, and computer program product for correcting a misrecognized utterance using a whole or a partial re-utterance | |
JP5198046B2 (ja) | 音声処理装置及びそのプログラム | |
Bettayeb et al. | Speech synthesis system for the holy quran recitation. | |
KR20170057623A (ko) | 언어장애인을 위한 다언어 어휘의 발음 합성 및 문자화 장치 | |
JPWO2016103652A1 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
CN112002304B (zh) | 语音合成方法及装置 | |
JP2003271194A (ja) | 音声対話装置及びその制御方法 | |
Aida–Zade et al. | The main principles of text-to-speech synthesis system | |
JP4296290B2 (ja) | 音声認識装置、音声認識方法及びプログラム | |
JP5142920B2 (ja) | 読み上げ情報生成装置、読み上げ情報生成方法及びプログラム | |
JPH08335096A (ja) | テキスト音声合成装置 | |
JP3366253B2 (ja) | 音声合成装置 | |
JP4428093B2 (ja) | ピッチパターン生成装置、ピッチパターン生成方法及びピッチパターン生成プログラム | |
JP2009042509A (ja) | アクセント情報抽出装置及びその方法 | |
JP2001337688A (ja) | 音声合成装置及び音声合成方法並びに記憶媒体 | |
JP6340839B2 (ja) | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム | |
JP2014215396A (ja) | 発音付与方法とその装置とプログラム | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
JP2009258369A (ja) | 音声認識辞書生成装置及び音声認識処理装置 | |
KR100611894B1 (ko) | 음성 인식기의 단어 모델 생성 방법 | |
JP3308875B2 (ja) | 音声合成方法および装置 | |
JP2003108170A (ja) | 音声合成学習方法および音声合成学習装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120625 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121023 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121120 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151130 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |