JP2008009221A

JP2008009221A - 音声再生制御装置及び音声再生制御プログラム

Info

Publication number: JP2008009221A
Application number: JP2006180910A
Authority: JP
Inventors: Koji Toriyama; 康治鳥山
Original assignee: Casio Computer Co Ltd
Current assignee: Casio Computer Co Ltd
Priority date: 2006-06-30
Filing date: 2006-06-30
Publication date: 2008-01-17

Abstract

【課題】聞き取りを容易化しつつ再生速度を変化させる。
【解決手段】電子辞書装置１において再生完了モードで例文を再生させると、ＣＰＵ６は、再生内容の予定再生時間と、電源残量に基づく再生可能時間とを検出し、再生可能時間よりも予定再生時間の方が長い場合に、音声出力部３による再生速度を加速していくことにより再生時間を再生可能時間内に納める。
【選択図】図９

Description

本発明は、音声の再生を制御する音声再生制御装置及び音声再生制御プログラムに関する。

従来、映像や音声などの再生装置として、光ディスク装置や電子辞書装置などがある。このうち、特に光ディスク装置の分野においては、近年、電源残量を検知して再生可能な時間内に映像を早送り再生する技術が開発されている（例えば、特許文献１参照）。
特開２００５−２３５３４３号公報

しかしながら、電子辞書装置など、語学学習用の再生装置においては、一律に単語や例文の再生速度を加速すると、再生の開始時から高速で再生されることとなり、出だし部分の聞き取りが難しくなる結果、再生内容全体の理解が妨げられてしまう。

本発明の課題は、聞き取りを容易化しつつ再生速度を変化させることができる音声再生制御装置及び音声再生制御プログラムを提供することである。

請求項１記載の発明は、
記憶された再生内容の音声再生を制御する音声再生制御装置（例えば、図３のＣＰＵ６及び音声再生プログラム８３）であって、
前記再生内容の予定再生時間を検出する予定再生時間検出手段（例えば、図３のＣＰＵ６及び音声再生プログラム８３；図５のステップＳ４）と、
当該音声再生制御装置に対して電力を供給する電源手段（例えば、図３の電源部５）と、
前記電源手段の電源残量を検出する残量検出手段（例えば、図３の電源監視部５０）と、
この残量検出手段により検出された電源残量に基づいて、再生可能時間を検出する再生可能時間検出手段（例えば、図３のＣＰＵ６及び音声再生プログラム８３；図５のステップＳ３）と、
前記再生可能時間よりも前記予定再生時間の方が長い場合に、再生速度を加速していくことにより、当該再生内容の再生時間を前記再生可能時間以内に納める再生加速制御手段（例えば、図３のＣＰＵ６及び音声再生プログラム８３；図５のステップＳ１２，Ｓ１３）と、
を備えることを特徴とする。

請求項９記載の発明は、音声再生制御プログラム（例えば、図３の音声再生プログラム８３）であって、
記憶された再生内容の音声再生を制御するコンピュータ（例えば、図３のＣＰＵ６）に、
前記再生内容の予定再生時間を検出する予定再生時間検出機能（例えば、図５のステップＳ４）と、
当該コンピュータに対して電力を供給する電源の電源残量を検出する残量検出機能と、
この残量検出機能により検出された電源残量に基づいて、再生可能時間を検出する再生可能時間検出機能（例えば、図５のステップＳ３）と、
前記再生可能時間よりも前記予定再生時間の方が長い場合に、再生速度を加速していくことにより、当該再生内容の再生時間を前記再生可能時間以内に納める再生加速制御機能（例えば、図５のステップＳ１２，Ｓ１３）と、
を実現させることを特徴とする

ここで、再生速度を加速していくとは、例えば、再生時間の経過に応じて速度を加速することを意味し、速度を連続的に加速する場合と、段階的に加速する場合とを含む。
また、再生内容の記憶は、音声データの形式で行われていても良いし、テキストデータの形式で行われていても良い。

請求項２記載の発明は、請求項１記載の音声再生制御装置において、
前記再生加速制御手段は、再生速度を段階的に加速していくことを特徴とする。

請求項３記載の発明は、請求項１または２記載の音声再生制御装置において、
再生内容中の文節を検出する文節検出手段（例えば、図３のＣＰＵ６及び音声再生プログラム８３Ａ；図１０のステップＶ２）を備え、
前記再生加速制御手段は、各文節内で再生速度を加速していくことを特徴とする。

請求項４記載の発明は、請求項３記載の音声再生制御装置において、
前記文節検出手段は、再生内容中の関係代名詞、前置詞、句読点及び区切り記号の少なくとも１つを、文節の区切り位置として検出することを特徴とする。

請求項５記載の発明は、請求項４記載の音声再生制御装置において、
テキストデータを、音声で再生可能な音声データに変換するデータ変換手段（例えば、図３のＣＰＵ６及び音声合成プログラム８２；図５のステップＳ１０）を備え
前記文節検出手段は、再生されるテキストデータ中で所定の前置詞と対応付けされた区切りデータを検出し、当該区切りデータを文節の区切り位置として検出することを特徴とする。

請求項６記載の発明は、請求項１〜５の何れか一項に記載の音声再生制御装置において、
ユーザ操作に基づいて初期再生速度を設定する初期再生速度設定手段（例えば、図３のＣＰＵ６及び音声再生プログラム８３；図５のステップＳ９）を備え、
前記再生加速制御手段は、前記初期再生速度から再生速度を加速することを特徴とする。

請求項７記載の発明は、請求項１〜６の何れか一項に記載の音声再生制御装置において、
再生速度を所定の上限値以下に制限する速度制限手段（例えば、図３のＣＰＵ６及び音声再生プログラム８３；図６のステップＴ９）を備えることを特徴とする。

請求項８記載の発明は、請求項１〜７の何れか一項に記載の音声再生制御装置において、
前記再生加速制御手段は、再生速度を加速していくモードと、再生速度を一定とするモードとを切り替える再生モード切替手段（例えば、図３のＣＰＵ６及び音声再生プログラム８３；図５のステップＳ１１）を有することを特徴とする。

請求項１，９記載の発明によれば、再生内容の予定再生時間と、電源残量に基づく再生可能時間とが検出され、再生可能時間よりも予定再生時間の方が長い場合に、再生速度を加速していくことにより再生時間が再生可能時間内に納められるので、確実に再生内容の全体を再生することができる。また、再生速度を加速していくことにより、自然に音声が加速されるため、容易に再生内容全体の聞き取りをすることができる。

請求項２記載の発明によれば、再生速度が段階的に加速されるので、連続的に加速される場合と比較して制御を容易化することができる。

請求項３記載の発明によれば、各文節内で再生速度が加速されるので、文節の出だし部分で聞き取り易さを維持して文節全体の聞き取りを容易化するとともに、自然なリズムで再生速度を変化させることができる。また、２番目以降の文節では、再び低い速度から再生速度が加速されるので、再生速度が上がり過ぎるのを防止することができる。

請求項４記載の発明によれば、請求項３記載の発明と同様の効果を得ることができる。
請求項５記載の発明によれば、請求項４記載の発明と同様の効果を得ることができる。
請求項６記載の発明によれば、請求項１〜５の何れか一項に記載の発明と同様の効果を得ることができる。

請求項７記載の発明によれば、再生速度が所定の上限値以下に制限されるので、再生速度が上がりすぎて聞き取り難くなるのを防止することができる。
請求項８記載の発明によれば、再生速度を加速していくモードと、再生速度を一定とするモードとが切り替えられるので、再生速度を一定とすることが可能となる。

以下、図面を参照して、本発明に係る音声再生制御装置を適用した電子辞書装置の実施形態について説明する。

＜第１実施形態＞
まず、第１実施形態における電子辞書装置の構成を説明する。
［外観構成］
図１（ａ）は本実施形態における電子辞書装置１の斜視外観図である。
この図に示すように、電子辞書装置１は、ディスプレイ１０、スピーカ１１及びキー群１２を備えている。

ディスプレイ１０は、ユーザによるキー群１２の操作に応じた文字や符号等、各種データを表示する部分であり、ＬＣＤ（Liquid Crystal Display）やＥＬＤ（Electronic Luminescent Display）等によって構成されている。
スピーカ１１は、ユーザによるキー群１２の操作に応じた見出語や例文の音声を出力する部分である。

キー群１２は、ユーザが電子辞書装置１を操作するための各種キーを有している。具体的には、図１（ｂ）に示すように、キー群１２は、電源キー１２ａと、訳／決定キー１２ｂと、文字キー１２ｃと、辞書選択キー１２ｄと、カーソルキー１２ｅと、シフトキー１２ｆと、戻るキー１２ｇと、単語音声出力キー１２ｈと、例文読み上げキー１２ｉと、メニューキー１２ｊと、速度設定キー１２ｋ等とを有している。

電源キー１２ａは、電源のＯＮ／ＯＦＦを切り替えるためのキーである。訳／決定キー１２ｂは、検索の実行や、見出語の決定等に使用されるキーである。文字キー１２ｃは、ユーザによる文字の入力等に使用されるキーであり、本実施の形態においては“Ａ”〜“Ｚ”キーを備えている。辞書選択キー１２ｄは、後述の辞書データベースの選択に使用されるキーである。

カーソルキー１２ｅは、画面内の反転表示位置、つまりカーソル位置の移動等に使用されるキーである。シフトキー１２ｆは、日本語の単語を検索対象に設定するとき等に使用されるキーである。戻るキー１２ｇは、前回表示した画面に戻るとき等に使用されるキーである。

単語音声出力キー１２ｈは、見出語を音声出力させるとき等に使用されるキーである。例文読み上げキー１２ｉは、例文を構成する単語の音声を、先頭の単語から順次出力させるとき等に使用されるキーである。

メニューキー１２ｊは各種のモード設定を行うためのキーであり、本実施の形態においては、このメニューキー１２ｊの操作により２種類の音声再生モード、即ち、一定の速度で再生を行う通常モードと、再生内容を複数の区間に分割し、区間が切り替わるごとに段階的に速度を上げて再生を行うリスニング学習モードとを選択可能となっている。

速度設定キー１２ｋは、音声の再生速度や再生の上限速度を設定するとき等に使用されるキーであり、例えばカーソルキー１２ｅと組み合わせて使用されるようになっている。

ここで、本実施の形態においては、図２に示すように、再生速度は「更に速い」，「速い」，「標準」，「遅い」，「更に遅い」の５段階で設定可能となっている。そして、再生速度の設定が「標準」の場合には、音声再生モードが通常モードであると、再生速度は例えば２００word/minや、音声データ内で規定されるビットレート（１６Ｋｂｐｓなど）となるようになっている。また、再生速度の設定が「更に速い」の場合には、音声再生モードが通常モード及びリスニング学習モードの何れの場合であっても、例文全体の再生時間が、「標準」の場合での再生対象の再生時間、つまり標準再生時間に対して８０％となるようになっている。同様に、「速い」の場合での再生時間は当該標準再生時間に対して９０％となり、「遅い」の場合での再生時間は１１０％となり、「更に遅い」の場合での再生時間は１２０％となるようになっている。

［内部構成］
図３は、電子辞書装置１の概略構成を示すブロック図である。
この図に示すように、電子辞書装置１は、表示部２、音声出力部３、入力部４、電源部５、電源監視部５０、ＣＰＵ６、ＲＡＭ７及びフラッシュＲＯＭ８を備えている。

表示部２は、上述のディスプレイ１０を備えており、ＣＰＵ６から入力される表示信号に基づいて各種情報をディスプレイ１０に表示するようになっている。
音声出力部３は、上述のスピーカ１１を備えており、ＣＰＵ６から入力される音声出力信号に基づいて音声データをスピーカ１１に再生させるようになっている。

入力部４は、上述のキー群１２を備えており、押下されたキーに対応する信号をＣＰＵ６に出力するようになっている。

電源部５は、電子辞書装置１の各部に電力を供給する内蔵電池である。
電源監視部５０は、電源部５の電圧値などに基づいて、電源残量を検出するようになっている。

ＣＰＵ６は、入力される指示に応じて所定のプログラムに基づいた処理を実行し、各機能部への指示やデータの転送等を行い、電子辞書装置１を統括的に制御するようになっている。具体的には、ＣＰＵ６は、入力部４から入力される操作信号等に応じてフラッシュＲＯＭ８に格納された各種プログラムを読み出し、当該プログラムに従って処理を実行する。そして、ＣＰＵ６は、処理結果をＲＡＭ７に保存するとともに、当該処理結果を表示するための表示信号を適宜表示部２や音声出力部３に出力して、対応した内容を表示，再生させる。

フラッシュＲＯＭ８は、電子辞書装置１の各種機能を実現するためのプログラムやデータを記憶するメモリである。本実施の形態においては、フラッシュＲＯＭ８は、情報出力プログラム８１と、音声合成プログラム８２と、本発明に係る音声再生プログラム８３と、辞書データベース群８４と、短縮時間記憶領域８５と、再生速度記憶領域８６と、速度制御用テーブル８７等とを記憶している。

情報出力プログラム８１は、従来より公知の辞書検索処理、即ち、ユーザから入力された見出語に対応する説明情報を検索して表示する処理を、ＣＰＵ６に実行させるためのプログラムである。

音声合成プログラム８２は、例文などのテキストデータを音声再生可能な音声データに変換する処理を、ＣＰＵ６に実行させるプログラムである。なお、このような処理としては、従来より公知のＴＴＳ（Text to Speech）処理を用いることができる。

音声再生プログラム８３は、音声データを再生する音声再生処理（後述の図５〜図７参照）を、ＣＰＵ６に実行させるためのプログラムである。

辞書データベース群８４は、少なくとも１種類の辞書データベースを有しており、本実施の形態においては、英和辞書の辞書データベース８４ａを有している。

この辞書データベース８４ａは、例えば図４に１例を示すように、複数の見出語と、この見出語を詳細に説明する説明情報とを対応付けて格納している。ここで、説明情報には、見出語を含む例文が含まれる。また、この辞書データベース８４ａには、少なくとも１部の例文に対応する圧縮音声データが格納されている。

短縮時間記憶領域８５には、後述の速度変換処理（図６，図７等参照）によって速度を変換する場合の再生時間の短縮時間が記憶されるようになっている。

再生速度記憶領域８６には、音声出力部３による音声再生の設定速度や上限速度が記憶されるようになっている。
速度制御用テーブル８７には、上述の図２に示すように、通常モード及びリスニング学習モードでの再生時間などが、再生速度の設定内容と対応付けされて記憶されるようになっている。

また、上述の図３に示すように、ＲＡＭ７は、ＣＰＵ６が実行する各種プログラムや、これらプログラムの実行に係るデータ等を一時的に保持するメモリであり、本実施の形態においては、指定見出語記憶領域７１、再生モード記憶領域７２及び音声データ記憶領域７３を備えている。

指定見出語記憶領域７１には、辞書引きする対象の見出語としてユーザにより指定された指定見出語が記憶され、辞書検索処理で用いられるようになっている。この指定見出語は、本実施の形態においては、入力文字や指定文字に前方一致するようアルファベット順或いは五十音順に辞書データベースから読み出された見出語の一覧から選択されるようになっている。

再生モード記憶領域７２には、現在設定されている音声再生モードの種類が記憶されるようになっている。ここで、本実施の形態においては、音声再生モードとして、上述の通常モード及びリスニング学習モードの他、電源部５の電源残量に対応する再生可能時間Ｔｚ内に音声再生を完了する再生完了モードの何れかの種類が記憶されるようになっている。なお、この再生完了モードは、電源部５の電源残量が少ない場合に自動で設定されるようになっている（図５のステップＳ６参照）。

音声データ記憶領域７３には、後述の音声再生処理（図５〜図７等参照）で再生される音声データが記憶されるようになっており、より詳細には、音声データが複数の区間に分割されて再生される場合には、区間ごとに分割された状態で音声データが記憶されるようになっている。

［音声再生処理］
続いて、電子辞書装置１の動作について説明する。図５〜図７は、ＣＰＵ６がフラッシュＲＯＭ８から音声再生プログラム８１を読み出して実行する音声再生処理の動作を説明するためのフローチャートである。なお、本実施の形態においては、例文を再生する場合について説明するが、単語を再生することとしても良い。

まず、図５に示すように、従来より公知の辞書検索処理によって辞書データベース８４ａにおける所定の見出語の説明情報が表示された状態で当該説明情報中の例文がカーソルで指定された後（ステップＳ１）、例文読み上げキー１２ｉが操作されると（ステップＳ２）、ＣＰＵ６は、電源監視部５０によって電源部５の電源残量を検出した後、当該電源残量に対応する再生可能時間Ｔｚを算出する（ステップＳ３）。ここで、再生可能時間Ｔｚの算出には、例えば、電源監視部５０から得られた電源残量値や、音声再生時の平均電力データ、電源部の容量、放電カーブなどを用いることができる。

次に、ＣＰＵ６は、例文の予定再生時間Ｔｙを算出する（ステップＳ４）。なお、指定された例文に対応する圧縮音声データが辞書データベース８４ａに記憶されている場合には、予定再生時間Ｔｙは、当該音声データのヘッダーにおける単語数情報や文字数情報、ファイル量情報などに加え、再生モード及び再生速度の設定内容などから得ることができる。一方、指定された例文に対応する圧縮音声データが辞書データベース８４ａに記憶されていない場合には、予定再生時間Ｔｙは、当該例文の単語数や文字数、テキストデータのデータ量などに加え、再生モード及び再生速度の設定内容などから得ることができる。

次に、ＣＰＵ６は、再生可能時間Ｔｚと予定再生時間Ｔｙとを比較して、Ｔｚ≧Ｔｙであるか否かを判定する（ステップＳ５）。

このステップＳ５においてＴｚ≧Ｔｙと判定した場合（ステップＳ５；Ｙｅｓ）、つまり、再生可能時間Ｔｚ内に再生が可能であると判定した場合には、ＣＰＵ６は、後述のステップＳ９の処理に移行する。

一方、ステップＳ５においてＴｚ＜Ｔｙと判定した場合（ステップＳ５；Ｎｏ）、つまり、設定されている再生モード及び再生速度で再生可能時間Ｔｚ内に再生ができないと判定した場合には、ＣＰＵ６は音声再生モードを再生完了モードに設定する（ステップＳ６）。

次に、ＣＰＵ６は、予め速度設定キー１２ｋ等の操作によって設定された設定内容に基づいて再生速度を仮設定した後（ステップＳ９）、指定された例文の圧縮音声データに対してデコード処理を開始することにより、複数のフレームからなるＰＣＭデータを音声データとして生成し（ステップＳ１０）、音声データ記憶領域７３に順次記憶させる。なお、このとき、指定された例文に対応する圧縮音声データがない場合には、ＣＰＵ６は、音声合成プログラム８２を実行し、指定された例文のテキストデータを音声データに変換して、音声データ記憶領域７３に記憶させる。

次に、ＣＰＵ６は、再生モード記憶領域７２内の情報に基づいて、現在設定されている音声再生モードを検出し（ステップＳ１１）、通常モードが設定されていると判定した場合（ステップＳ１１；通常モード）には、後述のステップＳ１４の処理に移行する。

一方、ステップＳ１１において再生完了モードが設定されていると判定した場合（ステップＳ１１；再生完了モード）には、ＣＰＵ６は、再生完了モードでの速度変換処理を行う（ステップＳ１２）。

具体的には、図６に示すように、まずＣＰＵ６は、上述の再生可能時間Ｔｚ及び予定再生時間Ｔｙに基づいて、再生時間の目標短縮時間Ｔを算出し（ステップＴ１）、短縮時間記憶領域８５に記憶させる。なお、本実施の形態においては、目標短縮時間Ｔは、予定再生時間Ｔｙから再生可能時間Ｔｚを減算することにより算出される。

次に、ＣＰＵ６は、指定された例文の音声データを複数の区間、本実施の形態においては５つの区間に分割し（ステップＴ２）、先頭の区間から順に第１区間，第２区間，…第５区間とする。なお、本実施の形態においては、予定再生時間Ｔｙを５で割った値に基づいて音声データを分割することにより、音声データを５つの区間に分割している。但し、音声データの分割は、フレームを最小単位として行うことが好ましい。また、この場合、音声データのフレーム数を等分することができない場合には、最終区間のフレーム数を増減させることが好ましい。

次に、ＣＰＵ６は、再生速度の設定内容で通常モードにより各区間を再生した場合の再生時間に対する各短縮時間を、第１区間では０、第２区間ではＴ×０．１、第３区間ではＴ×０．２、第４区間ではＴ×０．３、第５区間ではＴ×０．４にそれぞれ設定して短縮時間記憶領域８５に記憶させた後（ステップＴ３〜ステップＴ７）、各区間の再生短縮時間に基づいて当該区間の再生速度を算出する（ステップＴ８）。これにより、音声出力部３での再生速度が、再生速度の設定内容に対応する初期再生速度から段階的に加速していくように算出される。また、例文の再生時間が再生可能時間Ｔｚ内に納められる。なお、ステップＴ３〜ステップＴ７の処理においては、ステップＳ６の処理前に設定されていた音声再生モード（通常モードorリスニング学習モード）によって再生速度の設定内容で各区間を再生した場合の再生時間に対する短縮時間を設定することとしても良い。また、ステップＴ８の処理においては、基準速度として、再生速度の設定内容に対応する速度が用いられる。

次に、ＣＰＵ６は、各区間での再生速度が再生速度記憶領域８６内の上限速度以下であるか否かを判定し（ステップＴ９）、何れかの区間での再生速度が上限速度より大きいと判定した場合（ステップＴ９；Ｎｏ）には、図５，図６に示すように、速度変換や音声再生を行わずに、再生完了モードでの速度変換処理及び音声再生処理を終了する。これにより、再生速度が上限速度以下に制限される。

一方、ステップＴ９において各区間での再生速度が上限速度以下であると判定した場合（ステップＴ９；Ｙｅｓ）には、ＣＰＵ６は、算出した再生速度を各区間の再生速度として設定して再生速度記憶領域８６に記憶させた後（ステップＴ１０）、再生完了モードでの速度変換処理を終了して後述のステップＳ１４の処理に移行する。

一方、ステップＳ１１においてリスニング学習モードが設定されていると判定した場合（ステップＳ１１；リスニング学習モード）には、ＣＰＵ６は、リスニング学習モードでの速度変換処理を行う（ステップＳ１２）。

具体的には、図７に示すように、まずＣＰＵ６は、上述の速度制御用テーブル８７に基づいて、再生速度の設定内容に対応する再生時間の目標短縮時間Ｔを算出する（ステップＵ１）。

次に、ＣＰＵ６は、指定された例文の音声データを複数の区間、本実施の形態においては５つの区間に分割し（ステップＵ２）、先頭の区間から順に第１区間，第２区間，…第５区間とする。

次に、ＣＰＵ６は、再生速度の設定内容で通常モードにより各区間を再生した場合の再生時間に対する各短縮時間を、第１区間では０、第２区間ではＴ×０．１、第３区間ではＴ×０．２、第４区間ではＴ×０．３、第５区間ではＴ×０．４にそれぞれ設定して短縮時間記憶領域８５に記憶させた後（ステップＵ３〜ステップＵ７）、各区間の再生短縮時間に基づいて当該区間の再生速度を算出する（ステップＵ８）。これにより、音声出力部３での再生速度が、再生速度の設定内容に対応する初期再生速度から段階的に加速していくように算出される。

次に、ＣＰＵ６は、各区間での再生速度が再生速度記憶領域８６内の上限速度以下であるか否かを判定し、（ステップＵ９）、何れかの区間での再生速度が上限速度より大きいと判定した場合（ステップＵ９；Ｎｏ）には、図５，図７に示すように、速度変換や音声再生を行わずに、リスニング学習モードでの速度変換処理及び音声再生処理を終了する。これにより、再生速度が上限速度以下に制限される。

一方、ステップＵ９において各区間での再生速度が上限速度以下であると判定した場合（ステップＵ９；Ｙｅｓ）には、ＣＰＵ６は、算出した再生速度を各区間の再生速度として設定して再生速度記憶領域８６に記憶させ（ステップＵ１０）、リスニング学習モードでの速度変換処理を終了する。

そして、図５に示すように、ＣＰＵ６は、圧縮音声データ全体のデコード処理が終了したか否かを判定し（ステップＳ１４）、終了していないと判定した場合（ステップＳ１４；Ｎｏ）には、上述のステップＳ１０の処理に移行する。

一方、ステップＳ１４においてデコード処理が終了していると判定した場合（ステップＳ１４；Ｙｅｓ）には、ＣＰＵ６は、再生速度記憶領域８６内の再生速度、つまりステップＳ９、ステップＳ１２またはステップＳ１３で設定された再生速度で音声データ記憶領域７３における音声データの各区間の再生を連続して行った後（ステップＳ１５）、音声再生処理を終了する。

次に、これまでの処理の具体例として、上述のステップＳ１において、図８に示すような例文「Noun a system ….」が指定され、再生完了モードで音声再生が行われる場合について説明する。なお、この例文は４５wordであるので、再生速度「標準」（２００word/min），通常モードでの予定再生時間Ｔｙは約１３秒（＝４５／２００分）である。また、本動作例では、音声データの１フレームを再生速度「標準」で再生した場合の再生時間は６４ｍｓとなっている。

この場合、再生可能時間Ｔｚが１０秒であるとすると（ステップＳ５；Ｎｏ）、再生完了モードが設定された後（ステップＳ６）、再生完了モードの速度変換処理において目標短縮時間Ｔが３秒と算出される（ステップＴ１）。

次に、２．６秒（＝１３／５）に対応する４０フレーム（≒２．６／０．０６４）単位で音声データが分割された後（ステップＴ２）、第１区間の短縮時間が０、第２区間の短縮時間が０．３秒（＝３×０．１）、第３区間の短縮時間が０．６秒（＝３×０．２）、第４区間の短縮時間が０．９秒（＝３×０．３）、第５区間の短縮時間が１．２秒（＝３×０．４）に設定される（ステップＴ３〜ステップＴ７）。

そして、第１区間の再生速度が１．０倍速、第２区間の再生速度が約１．１３倍（≒２．６／（２．６−０．３））、第３区間の再生速度が１．３倍（＝２．６／（２．６−０．６））、第４区間の再生速度が約１．５３倍（≒２．６／（２．６−０．９））、第５区間の再生速度が約１．８６倍（≒２．６／（２．６−１．２））と算出された後（ステップＴ８）、図９に示すように、これらの速度で各区間が連続して再生される（ステップＳ１５）。

以上の電子辞書装置１によれば、図６のステップＴ３〜ステップＴ８や図７のステップＵ３〜ステップＵ８に示したように、例文の再生速度が加速していくので、出だし部分で聞き取り易さを維持して再生内容全体の聞き取りを容易化するとともに、再生速度を変化させることができる。また、再生速度が段階的に加速していくので、連続的に上がる場合と比較して制御を容易化することができる。

また、図６のステップＴ１〜ステップＴ７に示したように、再生可能時間Ｔｚよりも予定再生時間Ｔｙの方が長い場合にも、再生内容の再生時間が再生可能時間Ｔｚ内に納まるので、音声再生の途中で電子辞書装置１がオフになるのを防止し、再生内容の全体を確実に再生させることができる。

また、図６のステップＴ９に示したように、再生速度が所定の上限値以下に制限されるので、再生速度が上がりすぎて聞き取り難くなるのを防止することができる。

また、図５のステップＳ１１に示したように、再生速度を加速するリスニング学習モードや再生完了モードと、再生速度を一定とする通常モードとが切り替えられるので、再生速度を一定とすることが可能となる。

＜第２実施形態＞
続いて、第２実施形態における電子辞書装置について説明する。なお、上記第１実施形態と同様の構成要素には同一の符号を付し、その説明を省略する。

上述の図３に示すように、本実施形態における電子辞書装置１Ａは、フラッシュＲＯＭ８Ａを備えており、このフラッシュＲＯＭ８Ａは、本発明に係る音声再生プログラム８３Ａを記憶している。

この音声再生プログラム８３Ａは、音声データを再生する音声再生処理（図５及び後述の図１０参照）をＣＰＵ６に実行させるためのプログラムである。

続いて、電子辞書装置１Ａの動作について説明する。図５，図１０は、ＣＰＵ６がフラッシュＲＯＭ８Ａから音声再生プログラム８３Ａを読み出して実行する音声再生処理の動作を説明するためのフローチャートである。なお、電子辞書装置１Ａの動作は、上述の電子辞書装置１の動作と比較してステップＳ１２，ステップＳ１３の速度変換処理（図６，図７参照）のみが異なっているため、主にこの速度変換処理について説明する。

まず、図１１，図５に示すように、ＣＰＵ６は、指定された例文の圧縮音声データＤａに対してデコード処理を開始することにより、複数のフレームＦからなるＰＣＭデータを音声データとして生成し、音声データ記憶領域７３に順次記憶させる（ステップＳ１０）。なお、図１１では、１フレーム内の単語数は１０２４個となっている。

次に、ＣＰＵ６は、再生完了モードまたはリスニング学習モードが設定されていると判定した場合（ステップＳ１１；再生完了モード，リスニング学習モード）には、速度変換処理を行う（ステップＳ１２）。

この速度変換処理において、まずＣＰＵ６は、図１０に示すように、再生時間の目標短縮時間Ｔを算出する（ステップＶ１）。なお、目標短縮時間Ｔの算出方法は、上述のステップＴ１またはステップＵ１と同様である。

次に、ＣＰＵ６は、指定された例文の音声データまたはテキストデータ中の文節を検出し（ステップＶ２）、音声データを文節単位で分割する（ステップＶ３）。但し、本実施の形態においては、分割後の文節の単語数には、例えば８語などの下限値が設定されている。また、音声データの分割は、フレームを最小単位として行うことが好ましい。また、例文が複数の文章からなる場合には、文節単位ではなく、文章単位に分割することとしても良い。

ここで、文節を検出する手法としては、例えば、再生内容中の関係代名詞や前置詞、句読点、区切り記号などを文節の区切り位置として検出する手法がある。なお、前置詞を文節の区切り位置として検出する場合には、所定の前置詞と対応付けされた区切りデータを検出し、当該区切りデータを文節の区切り位置として検出することが好ましい。また、再生内容中の区切り記号としては、例えば、テキストデータ中のコロン「：」やセミコロン「；」、スラッシュ「／」、ハイフン「−」、括弧「（」，「）」、クオーテーションマーク「“」などがある。但し、これらの方法によらず、従来より公知の構文解析手段によって文節の区切り位置を検出することとしても良い。

これにより、図１１，図１２に示すように、例えば図８に示すような例文の音声データは４つのフレーム群Ｆ１〜Ｆ４に分割され、例文は４つの文節（１）〜（４）に分割されることとなる。なお、図１１では、図示の便宜上、各フレーム群Ｆ１〜Ｆ４のフレーム数を３個としているが、複数個であっても良い。

次に、図１０，図１１に示すように、ＣＰＵ６は、各文節の音声データを３区間に分割し（ステップＶ４）、先頭の区間から順に第１区間，第２区間，第３区間とする。なお、音声データを分割する手法は、上述のステップＴ２，ステップＵ２と同様である。

次に、ＣＰＵ６は、再生速度の設定内容で通常モードにより各区間を再生した場合の再生時間に対する各短縮時間をそれぞれ設定して短縮時間記憶領域８５に記憶させた後（ステップＶ５〜ステップＶ７）、各区間の再生短縮時間に基づいて当該区間の再生速度を算出する（ステップＶ８）。これにより、各文節内で再生速度が、再生速度の設定内容に対応する初期再生速度から段階的に加速していくように算出される。また、再生完了モードの場合には、例文の再生時間が再生可能時間Ｔｚ内に納められる。

次に、ＣＰＵ６は、各区間での再生速度が再生速度記憶領域８６内の上限速度以下であるか否かを判定し（ステップＶ９）、何れかの区間での再生速度が上限速度より大きいと判定した場合（ステップＶ９；Ｎｏ）には、図５，図１０に示すように、速度変換や音声再生を行わずに、速度変換処理及び音声再生処理を終了する。これにより、再生速度が上限速度以下に制限される。

一方、ステップＶ９において各区間での再生速度が上限速度以下であると判定した場合（ステップＶ９；Ｙｅｓ）には、ＣＰＵ６は、算出した再生速度を各区間の再生速度として設定して再生速度記憶領域８６に記憶させ（ステップＶ１０）、速度変換処理を終了する。なお、図１１では、第１区間の再生速度を１．０倍、第２区間の最正速度を１．４倍、第３区間の再生速度を１．６倍として設定している。

以上の電子辞書装置１Ａによれば、上記第１実施形態と同様の効果を得ることができるのは勿論のこと、図１０のステップＶ２〜ステップＶ１０に示したように、各文節内で再生速度が加速していくので、文節の出だし部分で聞き取り易さを維持して文節全体の聞き取りを容易化するとともに、自然なリズムで再生速度を変化させることができる。また、２番目以降の文節では、再び低い速度から再生速度が加速していくので、再生速度が上がり過ぎるのを防止することができる。

また、図１０のステップＶ３においては、文節の単語数の下限値が設定されているので、あまりにも短い文節が検出されるのが防止され、不自然な速度変換を防止することができる。

尚、本発明を適用可能な実施形態は、上述した実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲で適宜変更可能である。

例えば、速度変換処理においては、再生速度を段階的に加速することとして説明したが、リニアまたは所定の特性カーブで連続的に加速することとしても良い。

また、音声再生を開始した後にはそのまま再生を終了することとして説明したが、ユーザにより速度の再設定があった場合や、電源部５における電力消費量が変化した場合に、これらの状況に応じて目標短縮時間Ｔを再生途中に変更し、この目標短縮時間Ｔに基づいて上述の速度変換処理を行うこととしても良い。

また、圧縮音声データが辞書データベース８４ａに記憶されていない場合には、テキストデータを音声データに変換した後に速度変換処理を行い、再生することとして説明したが、例えば図１３に示すように、再生速度を指定するインラインコマンドをテキストデータ内に挿入することで速度変換処理を行い、当該テキストデータを音声データに変更してそのまま再生することとしても良い。ここで、例えば、図中のインラインコマンド「＊rate 200」は、当該コマンド後のテキストの再生速度をビットレート２００の速度にすることを指示している。

また、電源残量が不足して電圧が低い場合には、再生速度を加速することによって再生時間を再生可能時間Ｔｚ内に納めることとして説明したが、音声再生に必要な電圧に電源部５の電圧が復帰するまで再生を待機することとしても良い。また、電源残量が少ない場合には再生速度を加速することとして説明したが、再生可能な箇所まで一定速度で再生を行うこととしても良いし、再生を行わないこととしても良い。

また、本発明に係る音声再生制御装置を電子辞書装置１，１Ａに適用されるものとして説明したが、例えばパソコンやＰＤＡ（Personal Digital Assistance）等、他の電子機器に適用されることとしても良い。

本発明に係る音声再生制御装置を適用した電子辞書装置の概略構成を示す図であり、（ａ）は斜視図、（ｂ）は部分平面図である。速度制御用テーブルを示す図である。本発明に係る音声再生制御装置を適用した電子辞書装置の概略構成を示すブロック図である。辞書データベースの構造を示す図である。音声再生処理を示すフローチャートである。再生完了モードでの速度変換処理を示すフローチャートである。リスニング学習モードでの速度変換処理を示すフローチャートである。音声再生される例文の１例を示す図である。図８の例文と再生速度との対応を示す図である。第２実施形態における速度変換処理を示すフローチャートである。第２実施形態における速度変換処理を説明するための概念図である。図８の例文が文節に分解された状態を示す図である。図８の例文と再生速度との対応を示す図である。

符号の説明

５電源部（電源手段）
６ＣＰＵ（コンピュータ、音声再生制御装置、予定再生時間検出手段、
再生可能時間検出手段、再生加速度制御手段、文節検出手段、
データ変換手段、初期再生速度設定手段、速度制限手段、
再生モード切替手段）
５０電源監視部（残量検出手段）
８３音声再生プログラム（音声再生制御プログラム）

Claims

記憶された再生内容の音声再生を制御する音声再生制御装置であって、
前記再生内容の予定再生時間を検出する予定再生時間検出手段と、
当該音声再生制御装置に対して電力を供給する電源手段と、
前記電源手段の電源残量を検出する残量検出手段と、
この残量検出手段により検出された電源残量に基づいて、再生可能時間を検出する再生可能時間検出手段と、
前記再生可能時間よりも前記予定再生時間の方が長い場合に、再生速度を加速していくことにより、当該再生内容の再生時間を前記再生可能時間以内に納める再生加速制御手段と、
を備えることを特徴とする音声再生制御装置。
請求項１記載の音声再生制御装置において、
前記再生加速制御手段は、再生速度を段階的に加速していくことを特徴とする音声再生制御装置。
請求項１または２記載の音声再生制御装置において、
再生内容中の文節を検出する文節検出手段を備え、
前記再生加速制御手段は、各文節内で再生速度を加速していくことを特徴とする音声再生制御装置。
請求項３記載の音声再生制御装置において、
前記文節検出手段は、再生内容中の関係代名詞、前置詞、句読点及び区切り記号の少なくとも１つを、文節の区切り位置として検出することを特徴とする音声再生制御装置。
請求項４記載の音声再生制御装置において、
テキストデータを、音声で再生可能な音声データに変換するデータ変換手段を備え、
前記文節検出手段は、再生されるテキストデータ中で所定の前置詞と対応付けされた区切りデータを検出し、当該区切りデータを文節の区切り位置として検出することを特徴とする音声再生制御装置。
請求項１〜５の何れか一項に記載の音声再生制御装置において、
ユーザ操作に基づいて初期再生速度を設定する初期再生速度設定手段を備え、
前記再生加速制御手段は、前記初期再生速度から再生速度を加速することを特徴とする音声再生制御装置。
請求項１〜６の何れか一項に記載の音声再生制御装置において、
再生速度を所定の上限値以下に制限する速度制限手段を備えることを特徴とする音声再生制御装置。
請求項１〜７の何れか一項に記載の音声再生制御装置において、
再生速度を加速していくモードと、再生速度を一定とするモードとを切り替える再生モード切替手段を有することを特徴とする音声再生制御装置。
記憶された再生内容の音声再生を制御するコンピュータに、
前記再生内容の予定再生時間を検出する予定再生時間検出機能と、
当該コンピュータに対して電力を供給する電源の電源残量を検出する残量検出機能と、
この残量検出機能により検出された電源残量に基づいて、再生可能時間を検出する再生可能時間検出機能と、
前記再生可能時間よりも前記予定再生時間の方が長い場合に、再生速度を加速していくことにより、当該再生内容の再生時間を前記再生可能時間以内に納める再生加速制御機能と、
を実現させることを特徴とする音声再生制御プログラム。