JP2008009221A - 音声再生制御装置及び音声再生制御プログラム - Google Patents

音声再生制御装置及び音声再生制御プログラム Download PDF

Info

Publication number
JP2008009221A
JP2008009221A JP2006180910A JP2006180910A JP2008009221A JP 2008009221 A JP2008009221 A JP 2008009221A JP 2006180910 A JP2006180910 A JP 2006180910A JP 2006180910 A JP2006180910 A JP 2006180910A JP 2008009221 A JP2008009221 A JP 2008009221A
Authority
JP
Japan
Prior art keywords
reproduction
playback
speed
time
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006180910A
Other languages
English (en)
Inventor
Koji Toriyama
康治 鳥山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2006180910A priority Critical patent/JP2008009221A/ja
Publication of JP2008009221A publication Critical patent/JP2008009221A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

【課題】聞き取りを容易化しつつ再生速度を変化させる。
【解決手段】電子辞書装置1において再生完了モードで例文を再生させると、CPU6は、再生内容の予定再生時間と、電源残量に基づく再生可能時間とを検出し、再生可能時間よりも予定再生時間の方が長い場合に、音声出力部3による再生速度を加速していくことにより再生時間を再生可能時間内に納める。
【選択図】図9

Description

本発明は、音声の再生を制御する音声再生制御装置及び音声再生制御プログラムに関する。
従来、映像や音声などの再生装置として、光ディスク装置や電子辞書装置などがある。このうち、特に光ディスク装置の分野においては、近年、電源残量を検知して再生可能な時間内に映像を早送り再生する技術が開発されている(例えば、特許文献1参照)。
特開2005−235343号公報
しかしながら、電子辞書装置など、語学学習用の再生装置においては、一律に単語や例文の再生速度を加速すると、再生の開始時から高速で再生されることとなり、出だし部分の聞き取りが難しくなる結果、再生内容全体の理解が妨げられてしまう。
本発明の課題は、聞き取りを容易化しつつ再生速度を変化させることができる音声再生制御装置及び音声再生制御プログラムを提供することである。
請求項1記載の発明は、
記憶された再生内容の音声再生を制御する音声再生制御装置(例えば、図3のCPU6及び音声再生プログラム83)であって、
前記再生内容の予定再生時間を検出する予定再生時間検出手段(例えば、図3のCPU6及び音声再生プログラム83;図5のステップS4)と、
当該音声再生制御装置に対して電力を供給する電源手段(例えば、図3の電源部5)と、
前記電源手段の電源残量を検出する残量検出手段(例えば、図3の電源監視部50)と、
この残量検出手段により検出された電源残量に基づいて、再生可能時間を検出する再生可能時間検出手段(例えば、図3のCPU6及び音声再生プログラム83;図5のステップS3)と、
前記再生可能時間よりも前記予定再生時間の方が長い場合に、再生速度を加速していくことにより、当該再生内容の再生時間を前記再生可能時間以内に納める再生加速制御手段(例えば、図3のCPU6及び音声再生プログラム83;図5のステップS12,S13)と、
を備えることを特徴とする。
請求項9記載の発明は、音声再生制御プログラム(例えば、図3の音声再生プログラム83)であって、
記憶された再生内容の音声再生を制御するコンピュータ(例えば、図3のCPU6)に、
前記再生内容の予定再生時間を検出する予定再生時間検出機能(例えば、図5のステップS4)と、
当該コンピュータに対して電力を供給する電源の電源残量を検出する残量検出機能と、
この残量検出機能により検出された電源残量に基づいて、再生可能時間を検出する再生可能時間検出機能(例えば、図5のステップS3)と、
前記再生可能時間よりも前記予定再生時間の方が長い場合に、再生速度を加速していくことにより、当該再生内容の再生時間を前記再生可能時間以内に納める再生加速制御機能(例えば、図5のステップS12,S13)と、
を実現させることを特徴とする
ここで、再生速度を加速していくとは、例えば、再生時間の経過に応じて速度を加速することを意味し、速度を連続的に加速する場合と、段階的に加速する場合とを含む。
また、再生内容の記憶は、音声データの形式で行われていても良いし、テキストデータの形式で行われていても良い。
請求項2記載の発明は、請求項1記載の音声再生制御装置において、
前記再生加速制御手段は、再生速度を段階的に加速していくことを特徴とする。
請求項3記載の発明は、請求項1または2記載の音声再生制御装置において、
再生内容中の文節を検出する文節検出手段(例えば、図3のCPU6及び音声再生プログラム83A;図10のステップV2)を備え、
前記再生加速制御手段は、各文節内で再生速度を加速していくことを特徴とする。
請求項4記載の発明は、請求項3記載の音声再生制御装置において、
前記文節検出手段は、再生内容中の関係代名詞、前置詞、句読点及び区切り記号の少なくとも1つを、文節の区切り位置として検出することを特徴とする。
請求項5記載の発明は、請求項4記載の音声再生制御装置において、
テキストデータを、音声で再生可能な音声データに変換するデータ変換手段(例えば、図3のCPU6及び音声合成プログラム82;図5のステップS10)を備え
前記文節検出手段は、再生されるテキストデータ中で所定の前置詞と対応付けされた区切りデータを検出し、当該区切りデータを文節の区切り位置として検出することを特徴とする。
請求項6記載の発明は、請求項1〜5の何れか一項に記載の音声再生制御装置において、
ユーザ操作に基づいて初期再生速度を設定する初期再生速度設定手段(例えば、図3のCPU6及び音声再生プログラム83;図5のステップS9)を備え、
前記再生加速制御手段は、前記初期再生速度から再生速度を加速することを特徴とする。
請求項7記載の発明は、請求項1〜6の何れか一項に記載の音声再生制御装置において、
再生速度を所定の上限値以下に制限する速度制限手段(例えば、図3のCPU6及び音声再生プログラム83;図6のステップT9)を備えることを特徴とする。
請求項8記載の発明は、請求項1〜7の何れか一項に記載の音声再生制御装置において、
前記再生加速制御手段は、再生速度を加速していくモードと、再生速度を一定とするモードとを切り替える再生モード切替手段(例えば、図3のCPU6及び音声再生プログラム83;図5のステップS11)を有することを特徴とする。
請求項1,9記載の発明によれば、再生内容の予定再生時間と、電源残量に基づく再生可能時間とが検出され、再生可能時間よりも予定再生時間の方が長い場合に、再生速度を加速していくことにより再生時間が再生可能時間内に納められるので、確実に再生内容の全体を再生することができる。また、再生速度を加速していくことにより、自然に音声が加速されるため、容易に再生内容全体の聞き取りをすることができる。
請求項2記載の発明によれば、再生速度が段階的に加速されるので、連続的に加速される場合と比較して制御を容易化することができる。
請求項3記載の発明によれば、各文節内で再生速度が加速されるので、文節の出だし部分で聞き取り易さを維持して文節全体の聞き取りを容易化するとともに、自然なリズムで再生速度を変化させることができる。また、2番目以降の文節では、再び低い速度から再生速度が加速されるので、再生速度が上がり過ぎるのを防止することができる。
請求項4記載の発明によれば、請求項3記載の発明と同様の効果を得ることができる。
請求項5記載の発明によれば、請求項4記載の発明と同様の効果を得ることができる。
請求項6記載の発明によれば、請求項1〜5の何れか一項に記載の発明と同様の効果を得ることができる。
請求項7記載の発明によれば、再生速度が所定の上限値以下に制限されるので、再生速度が上がりすぎて聞き取り難くなるのを防止することができる。
請求項8記載の発明によれば、再生速度を加速していくモードと、再生速度を一定とするモードとが切り替えられるので、再生速度を一定とすることが可能となる。
以下、図面を参照して、本発明に係る音声再生制御装置を適用した電子辞書装置の実施形態について説明する。
<第1実施形態>
まず、第1実施形態における電子辞書装置の構成を説明する。
[外観構成]
図1(a)は本実施形態における電子辞書装置1の斜視外観図である。
この図に示すように、電子辞書装置1は、ディスプレイ10、スピーカ11及びキー群12を備えている。
ディスプレイ10は、ユーザによるキー群12の操作に応じた文字や符号等、各種データを表示する部分であり、LCD(Liquid Crystal Display)やELD(Electronic Luminescent Display)等によって構成されている。
スピーカ11は、ユーザによるキー群12の操作に応じた見出語や例文の音声を出力する部分である。
キー群12は、ユーザが電子辞書装置1を操作するための各種キーを有している。具体的には、図1(b)に示すように、キー群12は、電源キー12aと、訳/決定キー12bと、文字キー12cと、辞書選択キー12dと、カーソルキー12eと、シフトキー12fと、戻るキー12gと、単語音声出力キー12hと、例文読み上げキー12iと、メニューキー12jと、速度設定キー12k等とを有している。
電源キー12aは、電源のON/OFFを切り替えるためのキーである。訳/決定キー12bは、検索の実行や、見出語の決定等に使用されるキーである。文字キー12cは、ユーザによる文字の入力等に使用されるキーであり、本実施の形態においては“A”〜“Z”キーを備えている。辞書選択キー12dは、後述の辞書データベースの選択に使用されるキーである。
カーソルキー12eは、画面内の反転表示位置、つまりカーソル位置の移動等に使用されるキーである。シフトキー12fは、日本語の単語を検索対象に設定するとき等に使用されるキーである。戻るキー12gは、前回表示した画面に戻るとき等に使用されるキーである。
単語音声出力キー12hは、見出語を音声出力させるとき等に使用されるキーである。例文読み上げキー12iは、例文を構成する単語の音声を、先頭の単語から順次出力させるとき等に使用されるキーである。
メニューキー12jは各種のモード設定を行うためのキーであり、本実施の形態においては、このメニューキー12jの操作により2種類の音声再生モード、即ち、一定の速度で再生を行う通常モードと、再生内容を複数の区間に分割し、区間が切り替わるごとに段階的に速度を上げて再生を行うリスニング学習モードとを選択可能となっている。
速度設定キー12kは、音声の再生速度や再生の上限速度を設定するとき等に使用されるキーであり、例えばカーソルキー12eと組み合わせて使用されるようになっている。
ここで、本実施の形態においては、図2に示すように、再生速度は「更に速い」,「速い」,「標準」,「遅い」,「更に遅い」の5段階で設定可能となっている。そして、再生速度の設定が「標準」の場合には、音声再生モードが通常モードであると、再生速度は例えば200word/minや、音声データ内で規定されるビットレート(16Kbpsなど)となるようになっている。また、再生速度の設定が「更に速い」の場合には、音声再生モードが通常モード及びリスニング学習モードの何れの場合であっても、例文全体の再生時間が、「標準」の場合での再生対象の再生時間、つまり標準再生時間に対して80%となるようになっている。同様に、「速い」の場合での再生時間は当該標準再生時間に対して90%となり、「遅い」の場合での再生時間は110%となり、「更に遅い」の場合での再生時間は120%となるようになっている。
[内部構成]
図3は、電子辞書装置1の概略構成を示すブロック図である。
この図に示すように、電子辞書装置1は、表示部2、音声出力部3、入力部4、電源部5、電源監視部50、CPU6、RAM7及びフラッシュROM8を備えている。
表示部2は、上述のディスプレイ10を備えており、CPU6から入力される表示信号に基づいて各種情報をディスプレイ10に表示するようになっている。
音声出力部3は、上述のスピーカ11を備えており、CPU6から入力される音声出力信号に基づいて音声データをスピーカ11に再生させるようになっている。
入力部4は、上述のキー群12を備えており、押下されたキーに対応する信号をCPU6に出力するようになっている。
電源部5は、電子辞書装置1の各部に電力を供給する内蔵電池である。
電源監視部50は、電源部5の電圧値などに基づいて、電源残量を検出するようになっている。
CPU6は、入力される指示に応じて所定のプログラムに基づいた処理を実行し、各機能部への指示やデータの転送等を行い、電子辞書装置1を統括的に制御するようになっている。具体的には、CPU6は、入力部4から入力される操作信号等に応じてフラッシュROM8に格納された各種プログラムを読み出し、当該プログラムに従って処理を実行する。そして、CPU6は、処理結果をRAM7に保存するとともに、当該処理結果を表示するための表示信号を適宜表示部2や音声出力部3に出力して、対応した内容を表示,再生させる。
フラッシュROM8は、電子辞書装置1の各種機能を実現するためのプログラムやデータを記憶するメモリである。本実施の形態においては、フラッシュROM8は、情報出力プログラム81と、音声合成プログラム82と、本発明に係る音声再生プログラム83と、辞書データベース群84と、短縮時間記憶領域85と、再生速度記憶領域86と、速度制御用テーブル87等とを記憶している。
情報出力プログラム81は、従来より公知の辞書検索処理、即ち、ユーザから入力された見出語に対応する説明情報を検索して表示する処理を、CPU6に実行させるためのプログラムである。
音声合成プログラム82は、例文などのテキストデータを音声再生可能な音声データに変換する処理を、CPU6に実行させるプログラムである。なお、このような処理としては、従来より公知のTTS(Text to Speech)処理を用いることができる。
音声再生プログラム83は、音声データを再生する音声再生処理(後述の図5〜図7参照)を、CPU6に実行させるためのプログラムである。
辞書データベース群84は、少なくとも1種類の辞書データベースを有しており、本実施の形態においては、英和辞書の辞書データベース84aを有している。
この辞書データベース84aは、例えば図4に1例を示すように、複数の見出語と、この見出語を詳細に説明する説明情報とを対応付けて格納している。ここで、説明情報には、見出語を含む例文が含まれる。また、この辞書データベース84aには、少なくとも1部の例文に対応する圧縮音声データが格納されている。
短縮時間記憶領域85には、後述の速度変換処理(図6,図7等参照)によって速度を変換する場合の再生時間の短縮時間が記憶されるようになっている。
再生速度記憶領域86には、音声出力部3による音声再生の設定速度や上限速度が記憶されるようになっている。
速度制御用テーブル87には、上述の図2に示すように、通常モード及びリスニング学習モードでの再生時間などが、再生速度の設定内容と対応付けされて記憶されるようになっている。
また、上述の図3に示すように、RAM7は、CPU6が実行する各種プログラムや、これらプログラムの実行に係るデータ等を一時的に保持するメモリであり、本実施の形態においては、指定見出語記憶領域71、再生モード記憶領域72及び音声データ記憶領域73を備えている。
指定見出語記憶領域71には、辞書引きする対象の見出語としてユーザにより指定された指定見出語が記憶され、辞書検索処理で用いられるようになっている。この指定見出語は、本実施の形態においては、入力文字や指定文字に前方一致するようアルファベット順或いは五十音順に辞書データベースから読み出された見出語の一覧から選択されるようになっている。
再生モード記憶領域72には、現在設定されている音声再生モードの種類が記憶されるようになっている。ここで、本実施の形態においては、音声再生モードとして、上述の通常モード及びリスニング学習モードの他、電源部5の電源残量に対応する再生可能時間Tz内に音声再生を完了する再生完了モードの何れかの種類が記憶されるようになっている。なお、この再生完了モードは、電源部5の電源残量が少ない場合に自動で設定されるようになっている(図5のステップS6参照)。
音声データ記憶領域73には、後述の音声再生処理(図5〜図7等参照)で再生される音声データが記憶されるようになっており、より詳細には、音声データが複数の区間に分割されて再生される場合には、区間ごとに分割された状態で音声データが記憶されるようになっている。
[音声再生処理]
続いて、電子辞書装置1の動作について説明する。図5〜図7は、CPU6がフラッシュROM8から音声再生プログラム81を読み出して実行する音声再生処理の動作を説明するためのフローチャートである。なお、本実施の形態においては、例文を再生する場合について説明するが、単語を再生することとしても良い。
まず、図5に示すように、従来より公知の辞書検索処理によって辞書データベース84aにおける所定の見出語の説明情報が表示された状態で当該説明情報中の例文がカーソルで指定された後(ステップS1)、例文読み上げキー12iが操作されると(ステップS2)、CPU6は、電源監視部50によって電源部5の電源残量を検出した後、当該電源残量に対応する再生可能時間Tzを算出する(ステップS3)。ここで、再生可能時間Tzの算出には、例えば、電源監視部50から得られた電源残量値や、音声再生時の平均電力データ、電源部の容量、放電カーブなどを用いることができる。
次に、CPU6は、例文の予定再生時間Tyを算出する(ステップS4)。なお、指定された例文に対応する圧縮音声データが辞書データベース84aに記憶されている場合には、予定再生時間Tyは、当該音声データのヘッダーにおける単語数情報や文字数情報、ファイル量情報などに加え、再生モード及び再生速度の設定内容などから得ることができる。一方、指定された例文に対応する圧縮音声データが辞書データベース84aに記憶されていない場合には、予定再生時間Tyは、当該例文の単語数や文字数、テキストデータのデータ量などに加え、再生モード及び再生速度の設定内容などから得ることができる。
次に、CPU6は、再生可能時間Tzと予定再生時間Tyとを比較して、Tz≧Tyであるか否かを判定する(ステップS5)。
このステップS5においてTz≧Tyと判定した場合(ステップS5;Yes)、つまり、再生可能時間Tz内に再生が可能であると判定した場合には、CPU6は、後述のステップS9の処理に移行する。
一方、ステップS5においてTz<Tyと判定した場合(ステップS5;No)、つまり、設定されている再生モード及び再生速度で再生可能時間Tz内に再生ができないと判定した場合には、CPU6は音声再生モードを再生完了モードに設定する(ステップS6)。
次に、CPU6は、予め速度設定キー12k等の操作によって設定された設定内容に基づいて再生速度を仮設定した後(ステップS9)、指定された例文の圧縮音声データに対してデコード処理を開始することにより、複数のフレームからなるPCMデータを音声データとして生成し(ステップS10)、音声データ記憶領域73に順次記憶させる。なお、このとき、指定された例文に対応する圧縮音声データがない場合には、CPU6は、音声合成プログラム82を実行し、指定された例文のテキストデータを音声データに変換して、音声データ記憶領域73に記憶させる。
次に、CPU6は、再生モード記憶領域72内の情報に基づいて、現在設定されている音声再生モードを検出し(ステップS11)、通常モードが設定されていると判定した場合(ステップS11;通常モード)には、後述のステップS14の処理に移行する。
一方、ステップS11において再生完了モードが設定されていると判定した場合(ステップS11;再生完了モード)には、CPU6は、再生完了モードでの速度変換処理を行う(ステップS12)。
具体的には、図6に示すように、まずCPU6は、上述の再生可能時間Tz及び予定再生時間Tyに基づいて、再生時間の目標短縮時間Tを算出し(ステップT1)、短縮時間記憶領域85に記憶させる。なお、本実施の形態においては、目標短縮時間Tは、予定再生時間Tyから再生可能時間Tzを減算することにより算出される。
次に、CPU6は、指定された例文の音声データを複数の区間、本実施の形態においては5つの区間に分割し(ステップT2)、先頭の区間から順に第1区間,第2区間,…第5区間とする。なお、本実施の形態においては、予定再生時間Tyを5で割った値に基づいて音声データを分割することにより、音声データを5つの区間に分割している。但し、音声データの分割は、フレームを最小単位として行うことが好ましい。また、この場合、音声データのフレーム数を等分することができない場合には、最終区間のフレーム数を増減させることが好ましい。
次に、CPU6は、再生速度の設定内容で通常モードにより各区間を再生した場合の再生時間に対する各短縮時間を、第1区間では0、第2区間ではT×0.1、第3区間ではT×0.2、第4区間ではT×0.3、第5区間ではT×0.4にそれぞれ設定して短縮時間記憶領域85に記憶させた後(ステップT3〜ステップT7)、各区間の再生短縮時間に基づいて当該区間の再生速度を算出する(ステップT8)。これにより、音声出力部3での再生速度が、再生速度の設定内容に対応する初期再生速度から段階的に加速していくように算出される。また、例文の再生時間が再生可能時間Tz内に納められる。なお、ステップT3〜ステップT7の処理においては、ステップS6の処理前に設定されていた音声再生モード(通常モードorリスニング学習モード)によって再生速度の設定内容で各区間を再生した場合の再生時間に対する短縮時間を設定することとしても良い。また、ステップT8の処理においては、基準速度として、再生速度の設定内容に対応する速度が用いられる。
次に、CPU6は、各区間での再生速度が再生速度記憶領域86内の上限速度以下であるか否かを判定し(ステップT9)、何れかの区間での再生速度が上限速度より大きいと判定した場合(ステップT9;No)には、図5,図6に示すように、速度変換や音声再生を行わずに、再生完了モードでの速度変換処理及び音声再生処理を終了する。これにより、再生速度が上限速度以下に制限される。
一方、ステップT9において各区間での再生速度が上限速度以下であると判定した場合(ステップT9;Yes)には、CPU6は、算出した再生速度を各区間の再生速度として設定して再生速度記憶領域86に記憶させた後(ステップT10)、再生完了モードでの速度変換処理を終了して後述のステップS14の処理に移行する。
一方、ステップS11においてリスニング学習モードが設定されていると判定した場合(ステップS11;リスニング学習モード)には、CPU6は、リスニング学習モードでの速度変換処理を行う(ステップS12)。
具体的には、図7に示すように、まずCPU6は、上述の速度制御用テーブル87に基づいて、再生速度の設定内容に対応する再生時間の目標短縮時間Tを算出する(ステップU1)。
次に、CPU6は、指定された例文の音声データを複数の区間、本実施の形態においては5つの区間に分割し(ステップU2)、先頭の区間から順に第1区間,第2区間,…第5区間とする。
次に、CPU6は、再生速度の設定内容で通常モードにより各区間を再生した場合の再生時間に対する各短縮時間を、第1区間では0、第2区間ではT×0.1、第3区間ではT×0.2、第4区間ではT×0.3、第5区間ではT×0.4にそれぞれ設定して短縮時間記憶領域85に記憶させた後(ステップU3〜ステップU7)、各区間の再生短縮時間に基づいて当該区間の再生速度を算出する(ステップU8)。これにより、音声出力部3での再生速度が、再生速度の設定内容に対応する初期再生速度から段階的に加速していくように算出される。
次に、CPU6は、各区間での再生速度が再生速度記憶領域86内の上限速度以下であるか否かを判定し、(ステップU9)、何れかの区間での再生速度が上限速度より大きいと判定した場合(ステップU9;No)には、図5,図7に示すように、速度変換や音声再生を行わずに、リスニング学習モードでの速度変換処理及び音声再生処理を終了する。これにより、再生速度が上限速度以下に制限される。
一方、ステップU9において各区間での再生速度が上限速度以下であると判定した場合(ステップU9;Yes)には、CPU6は、算出した再生速度を各区間の再生速度として設定して再生速度記憶領域86に記憶させ(ステップU10)、リスニング学習モードでの速度変換処理を終了する。
そして、図5に示すように、CPU6は、圧縮音声データ全体のデコード処理が終了したか否かを判定し(ステップS14)、終了していないと判定した場合(ステップS14;No)には、上述のステップS10の処理に移行する。
一方、ステップS14においてデコード処理が終了していると判定した場合(ステップS14;Yes)には、CPU6は、再生速度記憶領域86内の再生速度、つまりステップS9、ステップS12またはステップS13で設定された再生速度で音声データ記憶領域73における音声データの各区間の再生を連続して行った後(ステップS15)、音声再生処理を終了する。
次に、これまでの処理の具体例として、上述のステップS1において、図8に示すような例文「Noun a system ….」が指定され、再生完了モードで音声再生が行われる場合について説明する。なお、この例文は45wordであるので、再生速度「標準」(200word/min),通常モードでの予定再生時間Tyは約13秒(=45/200分)である。また、本動作例では、音声データの1フレームを再生速度「標準」で再生した場合の再生時間は64msとなっている。
この場合、再生可能時間Tzが10秒であるとすると(ステップS5;No)、再生完了モードが設定された後(ステップS6)、再生完了モードの速度変換処理において目標短縮時間Tが3秒と算出される(ステップT1)。
次に、2.6秒(=13/5)に対応する40フレーム(≒2.6/0.064)単位で音声データが分割された後(ステップT2)、第1区間の短縮時間が0、第2区間の短縮時間が0.3秒(=3×0.1)、第3区間の短縮時間が0.6秒(=3×0.2)、第4区間の短縮時間が0.9秒(=3×0.3)、第5区間の短縮時間が1.2秒(=3×0.4)に設定される(ステップT3〜ステップT7)。
そして、第1区間の再生速度が1.0倍速、第2区間の再生速度が約1.13倍(≒2.6/(2.6−0.3))、第3区間の再生速度が1.3倍(=2.6/(2.6−0.6))、第4区間の再生速度が約1.53倍(≒2.6/(2.6−0.9))、第5区間の再生速度が約1.86倍(≒2.6/(2.6−1.2))と算出された後(ステップT8)、図9に示すように、これらの速度で各区間が連続して再生される(ステップS15)。
以上の電子辞書装置1によれば、図6のステップT3〜ステップT8や図7のステップU3〜ステップU8に示したように、例文の再生速度が加速していくので、出だし部分で聞き取り易さを維持して再生内容全体の聞き取りを容易化するとともに、再生速度を変化させることができる。また、再生速度が段階的に加速していくので、連続的に上がる場合と比較して制御を容易化することができる。
また、図6のステップT1〜ステップT7に示したように、再生可能時間Tzよりも予定再生時間Tyの方が長い場合にも、再生内容の再生時間が再生可能時間Tz内に納まるので、音声再生の途中で電子辞書装置1がオフになるのを防止し、再生内容の全体を確実に再生させることができる。
また、図6のステップT9に示したように、再生速度が所定の上限値以下に制限されるので、再生速度が上がりすぎて聞き取り難くなるのを防止することができる。
また、図5のステップS11に示したように、再生速度を加速するリスニング学習モードや再生完了モードと、再生速度を一定とする通常モードとが切り替えられるので、再生速度を一定とすることが可能となる。
<第2実施形態>
続いて、第2実施形態における電子辞書装置について説明する。なお、上記第1実施形態と同様の構成要素には同一の符号を付し、その説明を省略する。
上述の図3に示すように、本実施形態における電子辞書装置1Aは、フラッシュROM8Aを備えており、このフラッシュROM8Aは、本発明に係る音声再生プログラム83Aを記憶している。
この音声再生プログラム83Aは、音声データを再生する音声再生処理(図5及び後述の図10参照)をCPU6に実行させるためのプログラムである。
続いて、電子辞書装置1Aの動作について説明する。図5,図10は、CPU6がフラッシュROM8Aから音声再生プログラム83Aを読み出して実行する音声再生処理の動作を説明するためのフローチャートである。なお、電子辞書装置1Aの動作は、上述の電子辞書装置1の動作と比較してステップS12,ステップS13の速度変換処理(図6,図7参照)のみが異なっているため、主にこの速度変換処理について説明する。
まず、図11,図5に示すように、CPU6は、指定された例文の圧縮音声データDaに対してデコード処理を開始することにより、複数のフレームFからなるPCMデータを音声データとして生成し、音声データ記憶領域73に順次記憶させる(ステップS10)。なお、図11では、1フレーム内の単語数は1024個となっている。
次に、CPU6は、再生完了モードまたはリスニング学習モードが設定されていると判定した場合(ステップS11;再生完了モード,リスニング学習モード)には、速度変換処理を行う(ステップS12)。
この速度変換処理において、まずCPU6は、図10に示すように、再生時間の目標短縮時間Tを算出する(ステップV1)。なお、目標短縮時間Tの算出方法は、上述のステップT1またはステップU1と同様である。
次に、CPU6は、指定された例文の音声データまたはテキストデータ中の文節を検出し(ステップV2)、音声データを文節単位で分割する(ステップV3)。但し、本実施の形態においては、分割後の文節の単語数には、例えば8語などの下限値が設定されている。また、音声データの分割は、フレームを最小単位として行うことが好ましい。また、例文が複数の文章からなる場合には、文節単位ではなく、文章単位に分割することとしても良い。
ここで、文節を検出する手法としては、例えば、再生内容中の関係代名詞や前置詞、句読点、区切り記号などを文節の区切り位置として検出する手法がある。なお、前置詞を文節の区切り位置として検出する場合には、所定の前置詞と対応付けされた区切りデータを検出し、当該区切りデータを文節の区切り位置として検出することが好ましい。また、再生内容中の区切り記号としては、例えば、テキストデータ中のコロン「:」やセミコロン「;」、スラッシュ「/」、ハイフン「−」、括弧「(」,「)」、クオーテーションマーク「“」などがある。但し、これらの方法によらず、従来より公知の構文解析手段によって文節の区切り位置を検出することとしても良い。
これにより、図11,図12に示すように、例えば図8に示すような例文の音声データは4つのフレーム群F1〜F4に分割され、例文は4つの文節(1)〜(4)に分割されることとなる。なお、図11では、図示の便宜上、各フレーム群F1〜F4のフレーム数を3個としているが、複数個であっても良い。
次に、図10,図11に示すように、CPU6は、各文節の音声データを3区間に分割し(ステップV4)、先頭の区間から順に第1区間,第2区間,第3区間とする。なお、音声データを分割する手法は、上述のステップT2,ステップU2と同様である。
次に、CPU6は、再生速度の設定内容で通常モードにより各区間を再生した場合の再生時間に対する各短縮時間をそれぞれ設定して短縮時間記憶領域85に記憶させた後(ステップV5〜ステップV7)、各区間の再生短縮時間に基づいて当該区間の再生速度を算出する(ステップV8)。これにより、各文節内で再生速度が、再生速度の設定内容に対応する初期再生速度から段階的に加速していくように算出される。また、再生完了モードの場合には、例文の再生時間が再生可能時間Tz内に納められる。
次に、CPU6は、各区間での再生速度が再生速度記憶領域86内の上限速度以下であるか否かを判定し(ステップV9)、何れかの区間での再生速度が上限速度より大きいと判定した場合(ステップV9;No)には、図5,図10に示すように、速度変換や音声再生を行わずに、速度変換処理及び音声再生処理を終了する。これにより、再生速度が上限速度以下に制限される。
一方、ステップV9において各区間での再生速度が上限速度以下であると判定した場合(ステップV9;Yes)には、CPU6は、算出した再生速度を各区間の再生速度として設定して再生速度記憶領域86に記憶させ(ステップV10)、速度変換処理を終了する。なお、図11では、第1区間の再生速度を1.0倍、第2区間の最正速度を1.4倍、第3区間の再生速度を1.6倍として設定している。
以上の電子辞書装置1Aによれば、上記第1実施形態と同様の効果を得ることができるのは勿論のこと、図10のステップV2〜ステップV10に示したように、各文節内で再生速度が加速していくので、文節の出だし部分で聞き取り易さを維持して文節全体の聞き取りを容易化するとともに、自然なリズムで再生速度を変化させることができる。また、2番目以降の文節では、再び低い速度から再生速度が加速していくので、再生速度が上がり過ぎるのを防止することができる。
また、図10のステップV3においては、文節の単語数の下限値が設定されているので、あまりにも短い文節が検出されるのが防止され、不自然な速度変換を防止することができる。
尚、本発明を適用可能な実施形態は、上述した実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲で適宜変更可能である。
例えば、速度変換処理においては、再生速度を段階的に加速することとして説明したが、リニアまたは所定の特性カーブで連続的に加速することとしても良い。
また、音声再生を開始した後にはそのまま再生を終了することとして説明したが、ユーザにより速度の再設定があった場合や、電源部5における電力消費量が変化した場合に、これらの状況に応じて目標短縮時間Tを再生途中に変更し、この目標短縮時間Tに基づいて上述の速度変換処理を行うこととしても良い。
また、圧縮音声データが辞書データベース84aに記憶されていない場合には、テキストデータを音声データに変換した後に速度変換処理を行い、再生することとして説明したが、例えば図13に示すように、再生速度を指定するインラインコマンドをテキストデータ内に挿入することで速度変換処理を行い、当該テキストデータを音声データに変更してそのまま再生することとしても良い。ここで、例えば、図中のインラインコマンド「*rate 200」は、当該コマンド後のテキストの再生速度をビットレート200の速度にすることを指示している。
また、電源残量が不足して電圧が低い場合には、再生速度を加速することによって再生時間を再生可能時間Tz内に納めることとして説明したが、音声再生に必要な電圧に電源部5の電圧が復帰するまで再生を待機することとしても良い。また、電源残量が少ない場合には再生速度を加速することとして説明したが、再生可能な箇所まで一定速度で再生を行うこととしても良いし、再生を行わないこととしても良い。
また、本発明に係る音声再生制御装置を電子辞書装置1,1Aに適用されるものとして説明したが、例えばパソコンやPDA(Personal Digital Assistance)等、他の電子機器に適用されることとしても良い。
本発明に係る音声再生制御装置を適用した電子辞書装置の概略構成を示す図であり、(a)は斜視図、(b)は部分平面図である。 速度制御用テーブルを示す図である。 本発明に係る音声再生制御装置を適用した電子辞書装置の概略構成を示すブロック図である。 辞書データベースの構造を示す図である。 音声再生処理を示すフローチャートである。 再生完了モードでの速度変換処理を示すフローチャートである。 リスニング学習モードでの速度変換処理を示すフローチャートである。 音声再生される例文の1例を示す図である。 図8の例文と再生速度との対応を示す図である。 第2実施形態における速度変換処理を示すフローチャートである。 第2実施形態における速度変換処理を説明するための概念図である。 図8の例文が文節に分解された状態を示す図である。 図8の例文と再生速度との対応を示す図である。
符号の説明
5 電源部(電源手段)
6 CPU(コンピュータ、音声再生制御装置、予定再生時間検出手段、
再生可能時間検出手段、再生加速度制御手段、文節検出手段、
データ変換手段、初期再生速度設定手段、速度制限手段、
再生モード切替手段)
50 電源監視部(残量検出手段)
83 音声再生プログラム(音声再生制御プログラム)

Claims (9)

  1. 記憶された再生内容の音声再生を制御する音声再生制御装置であって、
    前記再生内容の予定再生時間を検出する予定再生時間検出手段と、
    当該音声再生制御装置に対して電力を供給する電源手段と、
    前記電源手段の電源残量を検出する残量検出手段と、
    この残量検出手段により検出された電源残量に基づいて、再生可能時間を検出する再生可能時間検出手段と、
    前記再生可能時間よりも前記予定再生時間の方が長い場合に、再生速度を加速していくことにより、当該再生内容の再生時間を前記再生可能時間以内に納める再生加速制御手段と、
    を備えることを特徴とする音声再生制御装置。
  2. 請求項1記載の音声再生制御装置において、
    前記再生加速制御手段は、再生速度を段階的に加速していくことを特徴とする音声再生制御装置。
  3. 請求項1または2記載の音声再生制御装置において、
    再生内容中の文節を検出する文節検出手段を備え、
    前記再生加速制御手段は、各文節内で再生速度を加速していくことを特徴とする音声再生制御装置。
  4. 請求項3記載の音声再生制御装置において、
    前記文節検出手段は、再生内容中の関係代名詞、前置詞、句読点及び区切り記号の少なくとも1つを、文節の区切り位置として検出することを特徴とする音声再生制御装置。
  5. 請求項4記載の音声再生制御装置において、
    テキストデータを、音声で再生可能な音声データに変換するデータ変換手段を備え、
    前記文節検出手段は、再生されるテキストデータ中で所定の前置詞と対応付けされた区切りデータを検出し、当該区切りデータを文節の区切り位置として検出することを特徴とする音声再生制御装置。
  6. 請求項1〜5の何れか一項に記載の音声再生制御装置において、
    ユーザ操作に基づいて初期再生速度を設定する初期再生速度設定手段を備え、
    前記再生加速制御手段は、前記初期再生速度から再生速度を加速することを特徴とする音声再生制御装置。
  7. 請求項1〜6の何れか一項に記載の音声再生制御装置において、
    再生速度を所定の上限値以下に制限する速度制限手段を備えることを特徴とする音声再生制御装置。
  8. 請求項1〜7の何れか一項に記載の音声再生制御装置において、
    再生速度を加速していくモードと、再生速度を一定とするモードとを切り替える再生モード切替手段を有することを特徴とする音声再生制御装置。
  9. 記憶された再生内容の音声再生を制御するコンピュータに、
    前記再生内容の予定再生時間を検出する予定再生時間検出機能と、
    当該コンピュータに対して電力を供給する電源の電源残量を検出する残量検出機能と、
    この残量検出機能により検出された電源残量に基づいて、再生可能時間を検出する再生可能時間検出機能と、
    前記再生可能時間よりも前記予定再生時間の方が長い場合に、再生速度を加速していくことにより、当該再生内容の再生時間を前記再生可能時間以内に納める再生加速制御機能と、
    を実現させることを特徴とする音声再生制御プログラム。
JP2006180910A 2006-06-30 2006-06-30 音声再生制御装置及び音声再生制御プログラム Pending JP2008009221A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006180910A JP2008009221A (ja) 2006-06-30 2006-06-30 音声再生制御装置及び音声再生制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006180910A JP2008009221A (ja) 2006-06-30 2006-06-30 音声再生制御装置及び音声再生制御プログラム

Publications (1)

Publication Number Publication Date
JP2008009221A true JP2008009221A (ja) 2008-01-17

Family

ID=39067494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006180910A Pending JP2008009221A (ja) 2006-06-30 2006-06-30 音声再生制御装置及び音声再生制御プログラム

Country Status (1)

Country Link
JP (1) JP2008009221A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010035138A (ja) * 2008-07-03 2010-02-12 Denso It Laboratory Inc 通信処理装置
JP2010164785A (ja) * 2009-01-16 2010-07-29 Konami Digital Entertainment Co Ltd 刻限通知装置、刻限通知方法、ならびに、プログラム
JP2010230992A (ja) * 2009-03-27 2010-10-14 Denso It Laboratory Inc 音声データ再生装置及び音声データ再生方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010035138A (ja) * 2008-07-03 2010-02-12 Denso It Laboratory Inc 通信処理装置
JP2013132067A (ja) * 2008-07-03 2013-07-04 Denso It Laboratory Inc 通信処理装置
JP2010164785A (ja) * 2009-01-16 2010-07-29 Konami Digital Entertainment Co Ltd 刻限通知装置、刻限通知方法、ならびに、プログラム
JP2010230992A (ja) * 2009-03-27 2010-10-14 Denso It Laboratory Inc 音声データ再生装置及び音声データ再生方法

Similar Documents

Publication Publication Date Title
JP5172682B2 (ja) 音素のnグラムを使用した単語および名前の生成
JP2007206317A (ja) オーサリング方法、オーサリング装置およびプログラム
US7099828B2 (en) Method and apparatus for word pronunciation composition
CN110740275A (zh) 一种非线性编辑系统
CN110781649A (zh) 一种字幕编辑方法、装置及计算机存储介质、电子设备
JP2011030224A (ja) マルチメディア字幕表示システム及びマルチメディア字幕表示方法
JP5083155B2 (ja) 辞書機能を備えた電子装置およびプログラム
KR100830689B1 (ko) 청킹을 이용한 언어학습용 멀티미디어 재생방법 및 상기 재생방법이 실행되는 프로그램이 기록된 기록매체
JP2008009221A (ja) 音声再生制御装置及び音声再生制御プログラム
JP2008175851A (ja) 録音時間算出装置、発音練習装置および録音時間算出方法、発音練習処理方法、ならびにそのプログラム、電子辞書
JP2016012315A (ja) テキストデータの分かち書き単位分割プログラム及び電子図書再生装置
JP2004325905A (ja) 外国語学習装置および外国語学習プログラム
JP4591481B2 (ja) 表示制御装置および表示制御処理プログラム
JP4407119B2 (ja) 命令コード作成装置
JP2005077678A (ja) テキスト音声同期装置およびテキスト音声同期処理プログラム
JP2006284645A (ja) 音声再生装置およびその再生プログラムならびにその再生方法
JP7236570B1 (ja) システム、通信端末、及び方法
JP4636842B2 (ja) 情報処理装置およびその文書表示方法
JP2008058678A (ja) 音声出力装置及び音声出力プログラム
JPH0527787A (ja) 音楽再生装置
JP5057764B2 (ja) 音声合成装置及び音声合成プログラム
JP2007248750A (ja) 音声再生装置
JP4604742B2 (ja) 電子機器およびその制御プログラム
JP2007219219A (ja) 語学学習用電子機器および学習用文章リスト作成方法
JP2007256815A (ja) 音声再生装置、音声再生方法、音声再生プログラム