JP3838193B2 - Text-to-speech device, program for the device, and recording medium - Google Patents
Text-to-speech device, program for the device, and recording medium Download PDFInfo
- Publication number
- JP3838193B2 JP3838193B2 JP2002343275A JP2002343275A JP3838193B2 JP 3838193 B2 JP3838193 B2 JP 3838193B2 JP 2002343275 A JP2002343275 A JP 2002343275A JP 2002343275 A JP2002343275 A JP 2002343275A JP 3838193 B2 JP3838193 B2 JP 3838193B2
- Authority
- JP
- Japan
- Prior art keywords
- reading
- text
- speech
- change
- speed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明は文章読み上げ装置、文章を読み上げるためのプログラム及び同プログラムを記録した記録媒体に関するものである。
【0002】
【従来の技術】
電子書籍などのテキストデータを基に音声信号を合成して音声出力を行う文章読み上げ装置において、読み上げ文章の読み上げ中に音量や速度を調整できるようにしたものは既に知られている。
【0003】
例えば、特許文献1には、透明なタッチパネルがディスプレイの画面上に一体に構成された表示入力デバイスを用い、操作者が指などでタッチパネルをなぞるトレース動作を行うことで、発音速度、音量を表すパラメータを反映して音声合成を行い、それによって操作者の意図に沿った了解性の高い合成音声を得ることができるテキスト読み上げ装置が記載されている。
【0004】
また、読み上げ中の読み上げ条件の変更は上記以外にも例えば、トーンの変更、声質の変更、男女の変更などが挙げられる。
【0005】
【特許文献1】
特開平9−265299号公報(要約、段落(0009)、段落(0010)、図1,図2)
【0006】
ところで、文章読み上げ中に読み上げの条件を変更する場合、その変更操作がリアルタイムで読み上げに反映できる場合と、変更してもそれが出力に反映するのに時間がかかる、即ち入出力に時間差が生じる場合とがある。
【0007】
例えば、音量制御の場合は、音声出力用のアンプのゲインを調整するだけで済むため音声変換処理後に調整することができるが、速度調整を行う場合、それを出力に反映させるためにはその変更速度に基づく音声変換処理を要するから、音声変換処理以前に行わないと出力される音声に反映させることはできない。
【0008】
このように、文章読み上げ装置における読み上げ条件の変更は、音声変換処理後に調整できるものとできないものがある。例えば、音量の変更、エフェクト(トーン(高低)、エコー、周波数等)の変更は音声変換処理後でも調整できるが、速度の変更、声質(男女(性別)、話手)の変更はその変更に基づく音声変換処理を要するから、音声変換処理前でないと出力される音声には反映されない。
【0009】
図4は読み上げ装置において、音声変換処理と実際に音声が出力されるタイミングを示したタイミングチャートである。図示のように、音声変換処理と実際に音声が出力されるタイミングに時間的な差が生じている。これは文章読み上げ中に例えば読み上げ速度の変更を行うと、その変更がされた速度での読み上げ出力までに時間差がでるため、読み上げが不自然になることを表している。
【0010】
この点について図5、図6を参照して更に説明する。
【0011】
図5は、先行技術文献によるものではないが、本発明の文章読み上げ装置の前提技術となる読み上げ装置の1例を示す正面図である。文章読み上げ装置1の画面には、読上用(読み上げの開始)及び停止用のボタン3と共に速度、速度変更用及び音量変更用のスライドバー4、及びスピーカ5等が表示されている。その画面の全面には透明なタッチパネル2が配置されており、そのタッチパネル2と画面の表示内容とは対応がとられている。
【0012】
図6は、図5に示す文章読み上げ装置1の構成を概略的に示したブロック図である。
【0013】
文章読み上げ装置1のCPU10には、タッチパネル2、例えば液晶ディスプレイ6のような表示手段50と、読み上げを行う電子書籍データや、音量値、速度値等を記録したRAM30と、音声合成用のプログラム、音声合成のための文書の解析や音声合成に使用する単語辞書データ、合成音素データ等を格納したROM40とが接続されている。またCPU10は、タッチパネル2からの入力を受けその操作内容をチェックして特定するタップ部11と、そのタップ部11からの信号を受けそれぞれRAM30に記録された速度値を読み出して変更し、変更した速度値を音声変換処理部14に渡すと共に、RAM30の速度値を変更した速度値に更新する速度制御部12と,同様にタップ部11からの信号を受けそれぞれRAM30に記録された音量値を読み出して変更し、変更した音量値でアンプ60を制御しスピーカ5から出力すると共にRAM30の音量値を変更された音量値で更新する音量制御部13と、RAM30に記録された電子書籍データを読み出し、ROM40に格納された音声合成プログラムや辞書データを用いて、音声合成を行い、速度制御部12からの出力信号に基づく音声速度でアンプ60に出力する音声変換処理部14と、並びに、RAM30に格納されている書籍データから読み上げる文章データを液晶ディスプレイ6等の表示手段50に表示するよう制御をする表示制御部15とからなっている。
【0014】
ここで、音声変換処理部14における音声合成処理手順について図7に示すフロー図に従って説明する。
【0015】
ステップS101において、CPU10は、RAM30に格納された電子書籍データから読み上げ用に抽出された抽出文に対して逆かな漢字変換を行う。つまり、抽出文に対して読みを付与する。例えば、抽出文が“昔々、・・・・”であれば、逆かな漢字変換によって“ムカシムカシ、・・・・”が得られる。続いて、ステップS102において、逆かな漢字変換されたものに対してアクセント型を付与する(アクセント処理)。例えば、“ムカシムカシ”に対してはアクセント型として0(ゼロ)型が付与される。
【0016】
ステップS103において、ステップS102でアクセント型が付与された後の夫々の音節の継続時間長Tを発声速度係数αとROM40に格納されているその音節の継続長Lとを乗算することによって算出する(T=α×L)。
【0017】
ステップS104において、夫々の音節の基本周波数を算出し、続いてステップS105において、夫々の音節の音量を算出する。例えば、アクセントが高くなる音節に対して、その音節の基本周波数が高くなるように基本周波数を制御する(ステップS104)とともに、音量が大きくなるように音量を制御する(ステップS105)。これらの処理はアクセントに対応して文章の読み上げに抑揚をつけるために行う処理である。
【0018】
ステップS106において、ステップS102で抽出された抽出文(液晶ディスプレイ6の表示画面に表示されている文章の中の最後の文)の先頭の文字から液晶ディスプレイ6に表示されている最後の文字(改ページタグの直前の文字)までのステップS103で算出された夫々の継続時間長を加算することによって想定時間(頁切り換えまでに要する時間)を算出する。
【0019】
ステップS107において、ROM40に記憶されている言語処理用の辞書や音声合成用の音声データ、ステップS103で算出された夫々の音節の継続時間長、ステップS104で算出された夫々の音節の基本周波数、ステップS105で算出された夫々の音量を利用して、ステップS102で抽出された抽出文の、所望の速度及び音量の音声合成データを作成して、アンプ60を介してスピーカ5等の音声出力装置に出力する。
【0020】
このようにして、液晶ディスプレイ6の表示画面に表示されている1又は複数の文章の中から表示画面に表示されている最後の文が抽出された場合に、その最後の文の先頭から液晶ディスプレイ6の表示画面に表示されている最後の文字までを読み上げるのに要する時間を想定し、その最後の文の読み上げが開始されてから想定された時間が経過したときに、液晶ディスプレイ6の表示画面の表示内容を切り換え、液晶ディスプレイ6の表示画面の表示内容を切り換えるタイミングをその表示内容の読み上げの終了のタイミングに合わせる制御を行っている。
【0021】
以上で示した文章読み上げ装置1において、図5の例で下方のスライドバー4を操作して音量調整を行った場合は、そのタッチパネル2の操作からタップ部11がその操作が音量調整であると特定して音量制御部13に伝え、音量制御部13は指示に従いRAM30から音量値を読み出して変更し、変更後の音量値に基づき直接アンプ60を制御して音量を調整し、同時にRAM30の音量値の領域に変更した音量値を書き込む。このように、音量変更操作は音声変換処理部14を介在させずに行うことができるから、出力にリアルタイムで反映することができる。
【0022】
これに対し、読み上げ速度の変更の場合は、タッチパネル2の上方のスライドバー4の操作からタップ部11がその操作が速度調整であると特定して速度制御部12に伝え、速度制御部12はRAM30から読み出した速度値を変更して音声変換処理部14に送り、同時に変更された速度をRAM30に記録する。音声変換処理部14は変更した信号に基づき音声変換処理を行ってアンプ60を制御し、スピーカ5から変更した速度で音声を出力する。
【0023】
以上の処理動作において、読み上げ速度を変更するときは既に説明したように、音声変換入力と出力に時間差があって、速度変更がリアルタイムで出力に反映されず読み上げたとき違和感が残る。そのため一旦、停止用ボタン3を操作して音声変換処理を停止させた上で変更を行うということが行われている。
【0024】
そのため、ユーザは文章読み上げ中に読み上げ条件を変更したい場合(機能設定も含む)には、その変更を音声変換処理を止めて行うべきか否かその都度判断し、かつその判断に従って読上用又は停止用ボタン3を操作しなければならない。具体的には、ユーザにとって現在の読み上げの速度が適切ではない(例えば、聞きづらい)ために、ユーザがその読み上げの速度を変更しようと思った場合には、読み上げを停止するため停止用ボタン3を操作し、次に、速度変更用のスライドバー4を操作し、更に、読み上げを開始するための読上用ボタン3を操作する。あるいは、読み上げを行っていない状態の時に音量を変更しようとユーザが思った場合には、音量変更用のスライドバー4を操作し、更に読み上げを開始するための読上用ボタン3を操作する。このような多数の操作は煩雑で不便なため問題であった。
【0025】
【発明が解決しようとする課題】
上述したようなユーザの操作は煩雑で不便という問題点があった。
【0026】
本発明は、以上の問題(煩雑で不便な操作)を解決するためになされたもので、その目的は、ユーザが読み上げ条件を容易に変更できるようにすることである。
【0027】
【課題を解決するための手段】
請求項1の発明は、文章読み上げ条件が変更可能な文章読み上げ装置において、文章読み上げ条件を変更するための変更情報を入力するための手段と、前記変更情報による文章読み上げ条件の変更が音声出力に遅延して反映されるものであるときは読み上げ停止制御して変更処理し、前記変更情報による文章読み上げ条件の変更が音声出力に遅延せずに反映されるものであるときは読み上げ停止制御しないで変更処理する文章読み上げ条件変更手段と、変更された文章読み上げ条件に基づき読み上げを制御する手段とを備えたことを特徴とする文章読み上げ装置である。即ち、文章読み上げ条件の変更が音声出力に遅延して反映されるか否かということと、読み上げ停止制御とが関連付けられている。
【0028】
請求項2の発明は、請求項1に記載された文章読み上げ装置において、前記文章読み上げ条件変更手段は、前記変更情報による文章読み上げ条件の変更が音声出力に遅延せずに反映されるものであり、且つ文章読み上げが停止中であるときは、読み上げ開始制御して変更処理することを特徴とするものであり、文章読み上げ条件の変更が音声出力に遅延し て反映されるか否かということ、及び文章読み上げ中か否かということと、読み上げ開始又は停止制御とが関連付けられている。
【0029】
請求項3の発明は、請求項1又は2に記載された文章読み上げ装置において、前記文章読み上げ条件変更手段は、前記変更情報が読み上げ音量又はトーンの変更情報であるとき、文章読み上げ装置が読み上げ中であるか否かを判断し、読み上げ中でなければ読み上げ開始制御して変更処理することを特徴とするものであり、音量又はトーンといった特定の変更と読み上げ開始制御とが関連付けられている。
【0030】
請求項4の発明は、請求項1〜3のいずれかに記載された文章読み上げ装置において、前記文章読み上げ条件変更手段により停止制御したとき、読み上げ文章の先頭から読み上げるよう制御することを特徴とするものであり、文章読み上げ条件の変更があれば、文章の先頭から読み上げられる。
【0031】
請求項5の発明は、文章読み上げ条件が変更可能に文章を読み上げるためにコンピュータに、入力された変更情報による文章読み上げ条件の変更が音声出力に遅延して反映されるものであるときは読み上げ停止制御して変更処理し、前記変更情報による文章読み上げ条件の変更が音声出力に遅延せずに反映されるものであるときは読み上げ停止制御しないで変更処理する手順と、変更された文章読み上げ条件に基づき読み上げを制御する手順と、を実行させることを特徴とするプログラムである。即ち、文章読み上げ条件の変更が音声出力に遅延して反映されるか否かということと、読み上げ停止制御とが関連付けられている。
【0032】
請求項6の発明は、請求項5に記載されたプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体である。この請求項6の発明によれば、請求項5と同様の作用を奏する。
【0033】
【0034】
【発明の実施の形態】
本発明の実施の形態について添付図面を参考に説明する。
【0035】
図1は本発明に係る文章読み上げ装置1の実施の形態を示している。
【0036】
この実施の形態は、図6に示した文章読み上げ装置1のCPU10に読み上げ開始制御部16と読み上げ停止制御部17とを付加した構成である。
【0037】
読み上げ開始制御部16及び読み上げ停止制御部17は共にタップ部11からの信号を受けて、読み上げ開始制御部16は文章読み上げ装置1が読み上げ中でないときに音声変換処理部14を開始制御し、また読み上げ停止制御部17は、文章読み上げ中に音声変換処理部14を停止制御する。更に、RAM30には、文章読み上げ中か否かを示すための読み上げ中フラグのための記憶領域が設けられている。その他の構成機能は図7について説明したものと同様である。
【0038】
次に、以上で説明した文章読み上げ装置1による読み上げ中における文章読み上げ条件の変更(設定をも含む)について、読み上げの音量と速度を例に採って説明する。
【0039】
図2は前記文章読み上げ装置における処理の手順(第1の実施の形態)を説明するためのフロー図である。
【0040】
文章読み上げ装置1の音量、速度を変更する場合、まず、ユーザによってタッチパネル2の一部がタップされたことを検出する(S201、YES)。タップ部11はタッチパネル2からの信号を受けてその内容をチェックし、それが読上用のボタン3による読み上げ(再生)の開始のための操作であると判断(特定)したときは(S202、YES)、ROM30に記憶された文章の先頭から読み上げ(再生)を開始し(S203)そのまま読み上げを行う。
【0041】
タップ部11が読上(再生)の開始のための操作でなく(S202、NO)、音量変更スライドバー4による音量変更制御のための操作であると判断(特定)したときは(S204、YES)、読み上げ開始制御部16はRAM30に記録された読み上げ中(読み上げモード)であるか否かを示す「読み上げ中フラグ」をチェックし(S205)、読み上げ停止中(フラグが0)であれば(S206、YES)RAM30に記憶された文章の先頭から読み上げを開始し(S207)、また、読み上げ中であれば(S206、NO)そのまま読み上げ中の状態で、それぞれ音量制御部13はRAM30から音量値を読み出して変更した音量値で音量調節を行い(S208)、変更した音量値をRAM30に書き込む(S209)と共にアンプ60を介してスピーカ5から変更された音量で音声出力する。ここで、ユーザは読み上げ音量を聞きながら音量調節を音量変更用のスライドバー4によって行い、必要な設定が終了するまでステップS208、S209の処理を繰り返し、設定が終われば(S210、YES)処理を終了する。
【0042】
ステップS204において、タッチパネル2へのタップ操作が音量変更のための操作でなく(S204、NO)、速度変更用のスライドバー4による速度変更のための操作であると、タップ部11が特定(判断)したとき(S211、YES)、読み上げ停止制御部17はRAM30に記録された「読み上げ中フラグ」をチェックし(S212)、読み上げ中(読み上げモード)であれば(S213、YES)読み上げを停止すると共にRAM30に記録された「読み上げ中フラグ」をリセット(例えば「1」から「0」に変更)する(S214)。読み上げ中(読み上げモード)でなければ(S213、NO)そのまま、速度制御部12はRAM30から速度値を読み出し、入力された速度値で速度調節を行い(S215)、変更した速度値を持った合成音声をアンプ60を介してスピーカ5から出力し、かつ変更(調節)した速度値をRAM30に書き込む(S216)。
【0043】
ステップS215〜S216の手順は速度設定が終了するまで行われ、設定が終了すれば(S218、YES)、読み上げ位置を文章の先頭(つまり、読み上げ途中であればその文章の頭)に戻して(S218)、新しく設定された読み上げ速度で読み上げを開始し、同時にRAM30に保存されている「読み上げ中フラグ」をセット(例えば「0」から「1」に変更)する(S219)。これによって速度制御の処理手順を終了して、読み上げる文章がまだあれば、読み上げを変更された条件で継続する。
【0044】
なお、ステップS211において速度制御でない場合(S211,NO)については説明を省略するが、例えば速度変更用のスライドバー4以外の読み上げ音声の変更、男女声の変更等、一旦読み上げを停止した後に変更を実施した方がよい場合における処理手順は速度制御と同様であり、また、読み上げ中でないと適切に調節できないおそれがあるトーンの変更等は音量の変更と同様の手順で処理が実行される。
【0045】
文章読み上げ中に読み上げ条件を変更するための操作がなされたとき、その変更又は設定を行うのに、例えば音量やトーンの変更や設定のように読み上げを止める必要のないものについては読み上げを止めず、止める必要のあるものは自動的に読み上げを止めるようにし、また、音量やトーンの変更や設定のように、読み上げ中でないと設定できない、つまり実際の音量やトーンを聞きいてみなければ設定ができないものについては、読み上げ停止中であっても自動的に読み上げを開始できるようにすることで、それによってユーザが読み上げ条件を変更する際の操作の負担軽減を図ることができる。
【0046】
図3は、上記文章読み上げ装置1における別の処理手順(第2の実施の形態)を説明するためのフロー図である。
【0047】
文章読み上げ装置1の音量、速度を変更する場合、まず、ユーザによってタッチパネル2の一部がタップされたことを検出し(S301、YES)、タップ部11はそのタップの内容をチェックし、それが読上用のボタン3による読み上げ(再生)の開始のための操作であると判断したときは(S302、YES)、読み上げを開始し(S303)RAM30に記憶された文章の先頭から読み上げを行う。
【0048】
読み上げの開始のための操作でなく(S302、NO)、音量変更用のスライドバー4による速度変更のための操作であると判断(特定)したときは(S304、YES)、読み上げ開始制御部16はRAM30に記録された「読み上げ中フラグ」をチェックし(S305)、その結果、読み上げ停止中であれば(S306、YES)、読み上げないと音量調節は不可能あるいは、適切にできないおそれがあるのでRAM30に記憶された文章の先頭から読み上げを開始し(S307)、RAM30中の「読み上げ中フラグ」をセットする(S308)。ステップS306において、読み上げ中であれば(S306、NO)そのまま読み上げ中の状態で、それぞれ音量制御部13はRAM30から音量値を読み出して入力された音量値に変更することで音量調節を行い(S309)アンプ60を介してスピーカ5から音声出力し、かつ変更(調節)後の音量値をRAM30に書き込む(S310)。
【0049】
ここで、ユーザが読み上げ音量を聞きながら音変更用のスライドバー4により音量調節を行い、必要な設定が終了するまでステップS309、S310の処理を繰り返し、調節(設定)が終われば(S311、YES)処理を終了する。
【0050】
ステップS304において、タップ部11により、タッチパネル2のタップ操作が音量変更のための操作でなく(S304、NO)、速度変更用のスライドバー4の操作による速度変更のためであるとタップ部11が判断されたときは(S312、YES)、ユーザが速度調節操作を行うと(S313)、タッチパネル2の入力はタップ部11で特定され、速度制御部12はRAM30から速度値を読み出して変更された速度を音声変換処理部14に渡すと共に変更した速度値をRAM30に書き込む(S314)。この段階で、読み上げ停止制御部17はRAM30に記録された読み上げ中フラグをチェックし(S315)、チェックの結果、「読み上げフラグ」がセット状態(例えばフラグが1)で読み上げ中(読み上げモード)であると判断されたときは(S316,YES)、読み上げを一旦停止し(S317)「読み上げフラグ」をリセットする。その後読み上げを開始し、変更された速度の合成音声をアンプ60を介してスピーカ5から出力すると共に「読み上げフラグ」をセットする(S318)。以下ステップS313〜S318の処理を設定が終了するまで実行し、設定が終われば(S319、YES)処理を終了して、読み上げる文章がまだあれば、読み上げを変更された条件で継続する。
【0051】
ステップS316において、読み上げ中でなければ(S316、NO)、設定終了後(S319、YES)に処理を終了する。
【0052】
なお、ステップ312において速度変更用のスライドバー4でないとき(S312、NO)の処理は第1実施の形態と同様である。即ち、例えば速度変更用のスライドバー4以外の読み上げ音声の変更について、男女、相手などの声質の変更等、一旦読み上げを停止した後に変更を実施した方がよい場合における処理手順は速度制御と同様であり、また、読み上げ中でないと調節できないトーン、エコー、周波数などのエフェクトの変更等は音量の変更と同様の手順で処理が実行される。
【0053】
上述した実施の形態では、いずれも合成音声を発生するためのスピーカ5を備える1つの装置において、図2、図3に示す処理全て行っているが、各処理や処理の一部を別々の装置で処理して、最終的にスピーカ5から変更された条件に沿った合成音声を生じさせ、文章の読み上げを行うようにしても良い。例えば、第1のコンピュータはユーザーの入力を受けるのみで、その他の実質的な処理は別の第2のコンピュータが行う。更に、装置は文章読み上げのための専用の装置に限らず、読み上げ以外の機能を有するPDA、パソコン、携帯電話、カーナビゲーションの端末、TV等であっても良い。
【0054】
尚、読み上げられる文章は書籍に限らず手紙(電子メールを含む)、道案内、宣伝並びに歌詞などであっても良い。また、RAM30に記憶されたデータは装置の電源が落されると消失するが、装置の電源が落されても継続して記憶されても良い。
【0055】
上述した実施の形態では、いずれも読み上げ条件の変更に伴って、読み上げの自動的な開始と停止との両方を行うが、自動的な開始か、自動的な停止かの一方を行う構成であっても良い。また、読み上げの開始位置は、文章の先頭としているが、文章の途中でも良い。更に、条件変更が完了するまでの間に読み上げられる対象は、その条件変更時に用いられる専用の文章であっても良い。
【0056】
以上で説明した処理は、該処理の手順を記述したプログラムにより文章読み取り装置1のCPU10で実行させることができる。また、本プログラムは、FD(フレキシブルディスク)、CD-ROM、MO、DVD-ROM等のプログラムを記録する周知の記録媒体に記録されて提供される他、インターネット等のネットワーク網を介して提供することができる。
【0057】
【発明の効果】
本願の請求項1に記載の発明によれば、文章読み上げ中に読み上げ条件の変更を行う場合、ユーザは読み上げ開始又は停止のための操作を従来のように行うことなく、自動で読み上げを止める必要のないものについては読み上げを止めず、あるいは止める必要のあるものは読み上げを止めるようにすることができ、文章読み上げ条件の変更が読み上げ中に行うべきものであるときは、装置が読み上げ中でないときは自動で読み上げ開始を行うことができる。そのため、従来のようにユーザがタッチパネル等の操作を行う煩雑さがなく、読み上げ条件の変更を容易に行うことができる。また、ユーザは読み上げ速度等の変更情報の入力から出力までに時間差のある読み上げ条件変更を行っても、その時間差を意識することなく合成音声による読み上げを自然に聞くことができる。
【0058】
本願の請求項2に記載の発明によれば、請求項1に記載の発明の効果を奏し、文章を読み上げ中か否かということと、読み上げ開始又は停止制御とが関連付けられており、良好な読み上げが可能である。
【0059】
本願の請求項3に記載の発明によれば、請求項1又は2に記載の発明の効果を奏し、音量又はトーンといった特定の変更と読み上げ開始制御とが関連付けられており、迅速な読み上げが可能である。
【0060】
本願の請求項4に記載の発明によれば、請求項1〜3のいずれかに記載の発明の効果を奏し、文章読み上げ条件の変更があれば、文章が頭書から読み上げられるため、良好な読み上げが可能である。
【0061】
本願の請求項5に記載の発明によれば、従来のようにユーザがタッチパネル等の操作を行う煩雑さがなく、読み上げ条件の変更を容易に行うことができる。また、読み上げ速度 等の変更情報の入力から出力までに時間差のある読み上げ条件変更を行っても、その時間差を意識することなく合成音声による読み上げを自然に聞くことができる。
【0062】
本願の請求項6に記載の発明によれば、請求項5に記載の発明と同様の効果を奏し、そのプログラムを携帯端末その他の情報機器のコンピュータに読み取らせることにより、任意の情報機器において上記効果を実現することができる。
【0063】
【図面の簡単な説明】
【図1】本発明の文章読み上げ装置の第1実施の形態に係る構成を示したブロック図である。
【図2】読み取り条件変更手順を説明するためのフロー図である。
【図3】他の読み取り条件変更手順を説明するためのフロー図である。
【図4】音声変換処理と音声出力の時間差を示すタイムチャートである。
【図5】従来の文章読み上げ装置の1例を示す正面図である。
【図6】図5に示す文章読み上げ装置の概略構成を示すブロック図である。
【図7】図5に示す文章読み上げ装置の音声変換処理を説明するフロー図である。
【符号の説明】
1・・・文章読み上げ装置、2・・・タッチパネル、3・・・読み上げ及び停止用のボタン、4・・・速度及び音量変更用のスライドバー、5・・・スピーカ、6・・・液晶ディスプレイ、10・・・CPU、30・・・RAM、40・・・ROM、50・・・表示手段、60・・・アンプ。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a text reading device, a program for reading a text, and a recording medium on which the program is recorded.
[0002]
[Prior art]
We have already known a text-to-speech device that synthesizes speech signals based on text data such as e-books, and that can adjust the volume and speed while reading aloud text.Ising.
[0003]
For example, in Patent Document 1, a display input device in which a transparent touch panel is integrally formed on a display screen is used, and the operator performs a tracing operation of tracing the touch panel with a finger or the like, thereby expressing the sound production speed and volume. A text-to-speech device is described that can synthesize speech by reflecting parameters and thereby obtain a highly understandable synthesized speech in accordance with the operator's intention.
[0004]
In addition to the above, changes in reading conditions during reading include, for example, tone changes, voice quality changes, and gender changes.
[0005]
[Patent Document 1]
JP-A-9-265299 (abstract, paragraph (0009), paragraph (0010), FIGS. 1 and 2)
[0006]
By the way, when changing the reading condition during reading aloud, it takes time to reflect the change operation on the reading in real time and even if it is changed, that is, there is a time difference between input and output. There are cases.
[0007]
For example, in the case of volume control, it is only necessary to adjust the gain of the amplifier for audio output, so it can be adjusted after the audio conversion process, but when speed adjustment is performed, the change is made to reflect it in the output Since voice conversion processing based on speed is required, it cannot be reflected in the output voice unless it is performed before the voice conversion processing.
[0008]
As described above, there are some changes in the reading conditions in the text-to-speech device that can be adjusted after the speech conversion process. For example, changes in volume and effects (tone (high / low), echo, frequency, etc.) can be adjusted even after the voice conversion process, but changes in speed, voice quality (gender (sex), speaker) Since the voice conversion processing based on this is required, it is not reflected in the output voice unless it is before the voice conversion processing.
[0009]
FIG. 4 is a timing chart showing the voice conversion process and the actual voice output timing in the reading apparatus. As shown in the figure, there is a time difference between the voice conversion process and the actual voice output timing. This means that if, for example, the reading speed is changed during the text reading, a time difference occurs until the reading is output at the changed speed, so that the reading becomes unnatural.
[0010]
This point will be further described with reference to FIGS.
[0011]
FIG. 5 is a front view showing an example of a reading device which is not based on the prior art document but is a prerequisite technology of the text reading device of the present invention. On the screen of the text-to-speech reading apparatus 1, a
[0012]
FIG. 6 is a block diagram schematically showing the configuration of the text-to-speech device 1 shown in FIG.
[0013]
The
[0014]
Here, the speech synthesis processing procedure in the speech
[0015]
In step S <b> 101, the
[0016]
In step S103, the duration time T of each syllable after the accent type is given in step S102 is calculated by multiplying the utterance speed coefficient α by the syllable duration length L stored in the ROM 40 ( T = α × L).
[0017]
In step S104, the fundamental frequency of each syllable is calculated, and then the step.TheIn S105, the volume of each syllable is calculated. For example, for a syllable with higher accent, the fundamental frequency is controlled so that the fundamental frequency of the syllable becomes higher (step S104), and the volume is controlled so that the volume becomes larger (step S105). These processes are used to accentuate text reading in response to accents.DoIt is processing.
[0018]
In step S106, the last character (modified) displayed on the
[0019]
In step S107, the language processing dictionary and speech synthesis speech data stored in the
[0020]
In this way, when the last sentence displayed on the display screen is extracted from one or a plurality of sentences displayed on the display screen of the
[0021]
In the text-to-speech reading device 1 shown above, when the volume adjustment is performed by operating the
[0022]
On the other hand, in the case of changing the reading speed, the
[0023]
In the above processing operation, when the reading speed is changed, as described above, there is a time difference between the voice conversion input and the output, and when the speed change is read out without being reflected in the output in real time, a sense of incongruity remains. Therefore, once the
[0024]
Therefore, when the user wants to change the reading conditions during the text reading (including function setting), the user determines whether or not the change should be made by stopping the voice conversion process, and for the reading or according to the determination. The
[0025]
[Problems to be solved by the invention]
The above-described user operations are complicated and inconvenient.
[0026]
The present invention solves the above problems (complex and inconvenient operations).InThe purpose is to allow the user to easily change the reading conditions.
[0027]
[Means for Solving the Problems]
The invention of claim 1 is a sentence reading apparatus capable of changing a sentence reading condition, and means for inputting change information for changing the sentence reading condition;When the change in the text-to-speech reading condition due to the change information is reflected in the voice output with a delay, the change processing is performed by controlling the reading stop so that the change in the text-to-speech reading condition based on the change information is not delayed in the voice output. Change the text-to-speech condition to be changed without controlling the reading stop when it is reflectedA sentence reading apparatus comprising: means; and means for controlling reading based on the changed sentence reading condition. That is,Whether changes in text-to-speech reading conditions are delayed and reflected in the audio outputRead aloudStop systemAre associated with each other.
[0028]
The invention of
[0029]
The invention of
[0030]
The invention of
[0031]
The invention of claim 5In order to read the text so that the text-to-speech reading condition can be changed, if the change in the text-to-speech condition due to the input change information is delayed and reflected in the voice output, it is controlled to stop reading and change processing, When the change of the text-to-speech reading condition by the change information is reflected without delay in the voice output, a procedure for performing the change processing without controlling the reading stop, and a procedure for controlling the reading based on the changed text-to-speech condition , Is a program characterized by being executed. That is, whether or not the change in the text-to-speech condition is delayed and reflected in the voice output is associated with the reading-out stop control.
[0032]
The invention of claim 6A computer-readable recording medium on which the program according to
[0033]
[0034]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described with reference to the accompanying drawings.
[0035]
FIG. 1 shows an embodiment of a text-to-speech device 1 according to the present invention.
[0036]
In this embodiment, a reading
[0037]
Both the reading
[0038]
Next, the change (including the setting) of the text reading condition during reading by the text reading apparatus 1 described above will be described taking the reading volume and speed as an example.
[0039]
FIG. 2 is a flowchart for explaining a processing procedure (first embodiment) in the text-to-speech reading apparatus.
[0040]
When changing the volume and speed of the text-to-speech reading device 1, first, it is detected that a part of the
[0041]
When it is determined (specified) that the
[0042]
In step S204, the
[0043]
Steps S215 to S216 are performed until the speed setting is completed, and when the setting is completed (S218, YES), the reading position is returned to the head of the sentence (that is, the head of the sentence if reading is in progress) ( In step S218, reading is started at the newly set reading speed, and at the same time, the “reading flag” stored in the
[0044]
In addition, although explanation is omitted about the case where it is not speed control in Step S211 (S211, NO), for example, change of reading voice other than the
[0045]
When an operation to change the reading condition is made during reading aloud, it is necessary to change or set the reading condition. If there is a need to stop it, it will automatically stop reading, and it can only be set during reading, like changing or setting the volume or tone. For those that cannot be read out, even when reading is stopped, reading can be started automatically, thereby reducing the burden on the user when changing the reading conditions.
[0046]
FIG. 3 is a flowchart for explaining another processing procedure (second embodiment) in the text-to-speech reading apparatus 1.
[0047]
When changing the volume and speed of the text-to-speech reading device 1, first, it is detected that a part of the
[0048]
When it is determined (specified) that the operation is not the operation for starting the reading (S302, NO) but the speed changing by the
[0049]
Here, the user adjusts the volume with the sound-changing
[0050]
In step S304, the
[0051]
In step S316, if reading is not in progress (S316, NO), the process is terminated after the setting is completed (S319, YES).
[0052]
Note that the processing in step 312 when it is not the speed-changing slide bar 4 (S312: NO) is the same as in the first embodiment. That is, for example, regarding the change of the reading voice other than the
[0053]
In the above-described embodiments, all the processes shown in FIGS. 2 and 3 are performed in one apparatus including the
[0054]
The text to be read out is not limited to books, but may be letters (including e-mails), directions, advertisements, and lyrics. The data stored in the
[0055]
In the above-described embodiments, both of the automatic start and stop of the reading are performed in accordance with the change of the reading conditions. However, either of the automatic starting or the automatic stopping is performed. May be. The starting position of reading is at the beginning of the sentence, but it may be in the middle of the sentence. Furthermore, the object read out until the condition change is completed may be a dedicated sentence used when the condition is changed.
[0056]
The processing described above can be executed by the
[0057]
【The invention's effect】
According to the invention described in claim 1 of the present application, when changing the reading condition while reading a sentence, the user needs to automatically stop reading without performing the operation for starting or stopping the reading as usual. If you do not want to stop reading, you can stop reading what you need to stop, and if the change in text-to-speech conditions should be done while reading, when the device is not reading Can automatically start reading. Therefore, the user does not have the trouble of operating the touch panel and the like, and the reading conditions can be easily changed.Further, even when the user changes the reading condition with a time difference from the input to the output of the change information such as the reading speed, the user can naturally hear the reading by the synthesized voice without being aware of the time difference.
[0058]
According to the invention described in
[0059]
According to invention of
[0060]
According to the invention of
[0061]
According to the invention described in
[0062]
According to the invention described in
[0063]
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration according to a first embodiment of a text-to-speech device of the present invention.
FIG. 2 is a flowchart for explaining a reading condition changing procedure;
FIG. 3 is a flowchart for explaining another reading condition changing procedure;
FIG. 4 is a time chart showing a time difference between audio conversion processing and audio output.
FIG. 5 is a front view showing an example of a conventional text-to-speech device.
6 is a block diagram showing a schematic configuration of the text-to-speech device shown in FIG. 5. FIG.
FIG. 7 is a flowchart for explaining speech conversion processing of the text-to-speech device shown in FIG. 5;
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 ... Text-to-speech device, 2 ... Touch panel, 3 ... Button for reading and stopping, 4 ... Slide bar for speed and volume change, 5 ... Speaker, 6 ... Liquid crystal display DESCRIPTION OF
Claims (6)
文章読み上げ条件を変更するための変更情報を入力するための手段と、
前記変更情報による文章読み上げ条件の変更が音声出力に遅延して反映されるものであるときは読み上げ停止制御して変更処理し、前記変更情報による文章読み上げ条件の変更が音声出力に遅延せずに反映されるものであるときは読み上げ停止制御しないで変更処理する文章読み上げ条件変更手段と、
変更された文章読み上げ条件に基づき読み上げを制御する手段と、
を備えたことを特徴とする文章読み上げ装置。In a text-to-speech device that can change text-to-speech conditions,
Means for inputting change information for changing the text-to-speech condition;
When the change in the text-to-speech reading condition due to the change information is reflected in the voice output with a delay, the change processing is performed by controlling the reading stop so that the change in the text-to-speech reading condition based on the change information is not delayed in the voice output. A text-to-speech reading condition changing means for performing a change process without reading stop control when it is reflected ,
Means for controlling reading based on the changed text reading conditions;
A text-to-speech device characterized by comprising:
前記文章読み上げ条件変更手段は、前記変更情報による文章読み上げ条件の変更が音声出力に遅延せずに反映されるものであり、且つ文章読み上げが停止中であるときは、読み上げ開始制御して変更処理することを特徴とする文章読み上げ装置。In the text-to-speech device according to claim 1,
The text-to-speech condition changing means reflects the change of the text-to-speech reading condition based on the change information without delay in the voice output, and when the text-to-speech reading is stopped, the reading process is controlled to perform a change process. A text-to-speech device characterized by:
前記文章読み上げ条件変更手段は、前記変更情報が読み上げ音量又はトーンの変更情報であるとき、文章読み上げ装置が読み上げ中であるか否かを判断し、読み上げ中でなければ読み上げ開始制御して変更処理することを特徴とする文章読み上げ装置。In the text-to-speech device according to claim 1 or 2,
The text-to-speech reading condition changing means determines whether or not the text-to-speech device is reading aloud when the change information is a reading volume or tone change information. A text-to-speech device characterized by:
前記文章読み上げ条件変更手段により停止制御したとき、読み上げ文章の先頭から読み上げるよう制御することを特徴とする文章読み上げ装置。In the text-to-speech device according to any one of claims 1 to 3 ,
A text-to-speech device that controls to read out from the head of the text to be read when the text-to-speech condition changing means controls the stop .
入力された変更情報による文章読み上げ条件の変更が音声出力に遅延して反映されるものであるときは読み上げ停止制御して変更処理し、前記変更情報による文章読み上げ条件の変更が音声出力に遅延せずに反映されるものであるときは読み上げ停止制御しないで変更処理する手順と、
変更された文章読み上げ条件に基づき読み上げを制御する手順と、
を実行させることを特徴とするプログラム。 In order to read out the text, the text-to-speech conditions can be changed.
If the change in the text-to-speech reading condition due to the input change information is reflected in the voice output with a delay, it is controlled to stop reading, and the change in the text-to-speech reading condition based on the change information is delayed in the voice output. If it is reflected without change, the procedure for change processing without reading stop control ,
A procedure to control reading based on the changed text-to-speech conditions;
A program characterized by having executed .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002343275A JP3838193B2 (en) | 2002-11-27 | 2002-11-27 | Text-to-speech device, program for the device, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002343275A JP3838193B2 (en) | 2002-11-27 | 2002-11-27 | Text-to-speech device, program for the device, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004177635A JP2004177635A (en) | 2004-06-24 |
JP3838193B2 true JP3838193B2 (en) | 2006-10-25 |
Family
ID=32705086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002343275A Expired - Fee Related JP3838193B2 (en) | 2002-11-27 | 2002-11-27 | Text-to-speech device, program for the device, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3838193B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5978461B2 (en) * | 2012-08-08 | 2016-08-24 | パナソニックIpマネジメント株式会社 | Operation display device for washing machine |
CN111241588B (en) * | 2016-10-08 | 2020-11-10 | 创新先进技术有限公司 | Method and device for realizing auxiliary function in application |
JP2023043552A (en) * | 2021-09-16 | 2023-03-29 | 三和書籍有限会社 | Electronic book reading device and electronic book reading program |
-
2002
- 2002-11-27 JP JP2002343275A patent/JP3838193B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004177635A (en) | 2004-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4785381B2 (en) | Speech synthesis (TTS) for handheld devices | |
JP5029167B2 (en) | Apparatus, program and method for reading aloud | |
JP4973337B2 (en) | Apparatus, program and method for reading aloud | |
JP3248981B2 (en) | calculator | |
US20030200858A1 (en) | Mixing MP3 audio and T T P for enhanced E-book application | |
JPH1091389A (en) | Synthesizer for converting text into voice | |
JP5029168B2 (en) | Apparatus, program and method for reading aloud | |
US20180018957A1 (en) | Sound control device, sound control method, and sound control program | |
JP2016090916A (en) | Voice synthesizer | |
JPH10326176A (en) | Voice conversation control method | |
JP3838193B2 (en) | Text-to-speech device, program for the device, and recording medium | |
JPH11161298A (en) | Method and device for voice synthesizer | |
JPH06337876A (en) | Sentence reader | |
JP2006139162A (en) | Language learning system | |
JPH08272388A (en) | Device and method for synthesizing voice | |
JP2002268664A (en) | Voice converter and program | |
KR20020048357A (en) | Method and apparatus for providing text-to-speech and auto speech recognition on audio player | |
JPH10254676A (en) | Voice synthesizer and method therefor | |
JP2007256815A (en) | Voice-reproducing apparatus, voice-reproducing method, and voice reproduction program | |
JP2003167502A (en) | Portable type language learning device | |
JP2003167507A (en) | Portable type language learning device | |
JPH04243299A (en) | Voice output device | |
JPH10222192A (en) | Substitute reader | |
JP2003122384A (en) | Portable terminal device | |
JP2005208163A (en) | Device and method for supporting presentation, and control program therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040913 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060614 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060711 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060724 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100811 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110811 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |