WO2004097800A1

WO2004097800A1 - 音声再生プログラム、音声再生方法及び音声再生装置

Info

Publication number: WO2004097800A1
Application number: PCT/JP2004/005651
Authority: WO
Inventors: Takahito Uenishi; Makoto Yamakawa
Original assignee: Konami Corporation
Priority date: 2003-05-02
Filing date: 2004-04-20
Publication date: 2004-11-11
Also published as: TW200507676A; KR20050122280A; KR100651527B1; EP1650747A1; EP1650747A4; HK1088109A1; CN1784718A; TWI257821B; JP4133559B2; US20070032894A1; EP1650747B1; CN100399421C; DE602004025578D1; JP2004333679A

Abstract

音声データを用いて音声を再生するための音声再生プログラムであって、所定の音声を複数の異なる再生速度で再生するために予め準備され、各再生速度に対応する複数の各音声データａ１，ａ２を記憶する音声記憶手段１０２と、音声データａ１，ａ２を出力可能な状態にする再生手段１１２と、前記各再生速度のうちいずれかの速度で音声を出力する場合に、該再生速度に対応する音声データによる音声を出力する音声出力手段１０１としてコンピュータを機能させる。

Description

音声再生プログラム、音声再生方法及び音声再生装置技術分野

本発明は、音声データを用いて音声を再生するための音声再生プログラム、音声再生方法及び音声再生装置に関する。

明

背景技術

従来の音声再生装置としては、例えば、カ書セットテープレコーダ等があり、力セットテープレコーダ等のアナログ音声を再生する機器では、カセットテープ等の記録媒体を所定速度（記録時の速度）で駆動して、カセットテープに記録された音声信号を再生することによって、標準速度（1倍速）で音声を再生する。また、上記のカセットテープの駆動速度を変化させて、標準速度より速い速度や遅い速度で音声を再生することも行われている。

一方、上記のようなアナログ音声ではなく、デジタル音声を再生する機器として、 C Dプレイヤ、 D V Dプレイヤ等があり、これらの機器では、 C D等に記録された音声データを所定の再生周波数で再生することによって、標準速度で音声を再生することができ、また、再生周波数を変化させることによって、標準速度より速い速度や遅い速度で音声を再生することもできる。また、 C D、 D V D等のコンピュータ読み取り可能な記録媒体を用レヽる家庭用ビデオゲーム機等のビデォゲーム装置も、上記の C Dドライブ等の再生原理と同様の再生原理を用い、標準速度、該速度より速い速度又は遅い速度でデジタル音声を再生している。

しかしながら、従来の音声再生装置では、標準速度で記録されているアナログ音声又はデジタル音声を標準速度以外の速度で再生する場合、再生される音声の周波数が元の音声の周波数である基本周波数と相違することとなる。例えば、標準速度に対して 2倍速い速度である早聞速度で音声を再生すると、早聞速度で再生された音声は上記の基本周波数の倍になってしまう。ゆえに、音声の音程が通常の音声より 1オクターブ高くなつてしまい、ユーザにとって聞きづらかったり、又は聞き取れない場合があつた。

このため、再生速度の切り替えによる音声の周波数の変動をアナログ信号処理によって、基本周波数と同じ再生周波数で、かつ早聞速度で再生される音声となるように修正することが行われているが、自然な音声に修正することは困難であつた。また、ソフトウェア等を用いたデジタル処理によってより自然な音声に修正することも行われているが、 C P U (中央演算処理装置）等の処理能力によつては、視聴者であるユーザの操作に瞬時に応答して違和感なく再生速度を切り替えることはできなかった。特に、音声処理だけでなく、画像処理を主体とするビデォゲーム装置では、複雑な画像処理に C P Uの処理能力を配分する必要があり、視聴者であるユーザの操作に瞬時に応答して違和感なく再生速度を切り替えることはできなかった。発明の開示

本発明は、上記の課題を解決するためになされたもので、 C P U等のハードウエアに過度な負担をかけることなく、音声の再生速度を瞬時に違和感なく切り替えることができるとともに、より自然な音声を切り替え前後ともに出力することができる音声再生プログラム、音声再生方法及び音声再生装置を提供することを目的とするものである。

請求項 1に記載の本発明は、音声データを用いて音声を再生するための音声再生プログラムであって、

所定の音声を複数の異なる再生速度で再生するために予め準備され、各再生速度にそれぞれ対応する複数の音声データを記憶する音声記憶手段と、

前記音声データを出力可能な状態にする再生手段と、

前記各再生速度のうちいずれかの速度で音声を出力する場合に、該再生速度に対応する音声データによる音声を出力する音声出力手段としてコンピュータを機能させることを特徴とする。

請求項 1に記載の本発明に従えば、音声データを用いて音声を再生するための音声再生プログラムであって、音声再生プログラムは、所定の音声を複数の異なる再生速度で再生するために予め準備され各再生速度にそれぞれ対応する複数の音声データを記憶する音声記憶手段と、音声データを出力可能な状態にする再生手段と、各再生速度のうちいずれかの速度で音声を出力する場合に再生速度に対応する音声データによる音声を出力する音声出力手段としてコンピュータを機能させる。

すなわち、 .音声記憶手段は、所定の音声を複数の異なる再生速度で再生するために予め準備され、各再生速度にそれぞれ対応する複数の音声データが記憶される。音声出力手段は、各再生速度のうちいずれかの速度で音声を出力する場合に、該再生速度に対応する音声データによる音声が再生され出力される。これにより、再生速度変更時に、異なる再生速度に対応する音声データを作成する等の音声処理が不要になる。

請求項 2に記載の本発明は、前記音声記憶手段は、所定の音声を第 1の再生速度で再生するために予め準備された第 1の音声データと、前記所定の音声を前記第 1の再生速度と異なる第 2の再生速度で再生するために予め準備された第 2の音声データとを記憶し

前記再生手段は、前記音声記憶手段から読み出した第 1及び第 2の音声データの再生位置を対応付けて第 1及び第 2の音声データを再生し、前記第 1及び第 2 の音声データによる音声を出力可能な状態にし、

前記音声出力手段は、前記第 1の再生速度で音声を出力する場合に前記再生手段によって再生されている第 1の音声データによる第 1の音声を出力し、前記第 2の再生速度で音声を出力する場合に前記再生手段によって再生されている前記第 2の音声データによる第 2の音声を出力することを特徴とする。

請求項 2に記載の発明に従えば、音声記憶手段は、所定の音声を第 1の再生速度で再生するために予め準備された第 1の音声データと、前記所定の音声を第 1 の再生速度と異なる第 2の再生速度で再生するために予め準備された第 2の音声データとを記憶する。再生手段は、音声記憶手段から読み出した第 1及ぴ第 2の音声データの再生位置を対応付けて第 1及び第 2の音声データを再生し、第 1及ぴ第 2の音声データによる音声を出力可能な状態にする。音声出力手段は、第 1 の再生速度で音声を出力する場合に再生手段によって再生されている第 1の音声データによる第 1の音声を出力し、第 2の再生速度で音声を出力する場合に再生手段によって再生されている第 2の音声データによる第 2の音声を出力する。すなわち、第 1の再生速度で音声を出力する場合には、第 1の再生速度で再生するために予め準備された第 1の音声データを再生した第 1の音声が、再生手段により出力される。第 2の再生速度で音声を出力する場合には、第 2の再生速度で再生するために予め準備された第 2の音声データを再生した第 2の音声が、再生手段により出力される。ゆえに、第 2の再生速度で音声を出力する場合には、第 2の音声データは第 2の再生速度で再生するために予め準備されているので、第 1の音声データの基本周波数を変更して第 2の音声データを作成する等の音声処理が不要になる。

また、所定の音声を第 1の再生速度で再生するために予め準備された第 1の音 • 声データと、所定の音声を第 1の再生速度と異なる第 2の再生速度で再生するために予め準備された第 2の音声データとが同期して再生されるので、音声の再生速度を切り替えても、同じ所定の音声（同じ内容の音声）を出力することができる。

請求項 3に記載の本発明は、前記音声出力手段による音声の出力を前記第 1の再生速度で再生するための第 1の再生速度モードと、前記音声出力手段による音声の出力を前記第 2の再生速度で再生するための第 2の再生速度モードとのいずれか一方をユーザが選択する操作を受け付ける操作手段として前記コンピュータをさらに機能させ、

前記音声出力手段は、前記操作手段によって受け付けられた再生速度モードに応じて前記第 1及び第 2の音声データによる音声のうちのいずれか一方を出力することを特徴とする。

請求項 3に記載の本発明に従えば、操作手段は、音声出力手段による音声の出力を第 1の再生速度で再生するための第 1の再生速度モードと音声出力手段による音声の出力を第 2の再生速度で再生するための第 2の再生速度モードとのいずれか一方をユーザが選択したときの操作を受け付ける。音声出力手段は、操作手段によって受け付けられた再生速度モードに応じて、第 1及び第 2の音声データによる音声のうちのいずれか一方を出力する。

すなわち、ユーザが第 1の音声速度モードと第 2の音声速度モードとのいずれか一方を選択したときの操作が操作手段に受け付けられ、操作手段に受け付けられた再生速度モードに応じて第 1及び第 2の音声のうちの一方が音声出力手段により出力される。これにより、ユーザは、所望の再生速度で音声を聞くことができるとともに、一方の音声の出力途中で他方の音声に切り替えることができる。請求項 4に記載の本発明は、前記音声記憶手段は、前記第 1の音声データとして、所定の音声を標準速度で再生するために予め準備された通常音声データを記憶するとともに、前記第 2の音声データとして、前記通常音声データを用いて再生される音声と同じ音声を標準速度より速レ、再生速度で再生するために予め準備された高速音声データを記憶し、

前記音声出力手段は、標準速度で音声を出力する場合に前記通常音声データによる標準速度の音声を出力し、高速で音声を出力する場合に前記高速音声データによる高速の音声を出力することを特徴とする。

請求項 4に記載の本発明に従えば、音声記憶手段は、第 1の音声データとして、所定の音声を標準速度で再生するために予め準備された通常音声データを記憶するとともに、第 2の音声データとして、通常音声データを用いて再生される音声と同じ音声を標準速度より速い再生速度で再生するために予め準備された高速音声データを記憶する。このとき、音声出力手段は、標準速度で音声を出力する場合に通常音声データによる標準速度の音声を出力し、高速で音声を出力する場合に高速音声データによる高速の音声を出力する。

すなわち、標準速度で音声を出力する場合には、，標準速度で再生するために予め準備された通常音声データを再生した標準速度の音声が出力される。高速で音声を出力する場合には、高速で再生するために予め準備された高速音声データを再生した高速の音声が出力される。これにより、標準速度又は高速の各再生速度に応じて予め作成された音声データを用いて音声を出力することができ、ユーザは標準速度及び高速のうち所望の速度で自然な音声を聞くことができる。

請求項 5に記載の本発明は、前記再生手段は、前記第 1及び第 2の音声データの再生済み時間又は残り再生時間に基づいて、前記第 1及ぴ第 2の音声データの再生位置を対応付けて第 1及び第 2の音声データを再生することを特徴とする。請求項 5に記載の本発明に従えば、再生手段は、第 1及び第 2の音声データの再生済み時間又は残り再生時間に基づいて、第 1及び第 2の音声データの再生位置を対応付けて前記第 1及び第 2の音声データを再生する。

すなわち、再生済み時間又は残り再生時間が同じになるように第 1及び第 2の音声データを再生することによって、第 1及ぴ第 2の音声データの再生位置を対応付けている。これにより、チェックフラグ等の同期処理専用のデータを音声データに付加することなく、第 1及び第 2の音声データの同期処理を行うことがでさる。

請求項 6に記載の本発明は、前記音声記憶手段は、再生される音声の所定の区切りごとにチェックフラグが揷入された前記第 1及び第 2の音声データを記憶し、前記再生手段は、前記第 1及び第 2の音声データのチヱックフラグの再生タイミングに基づいて前記第 1及び第 2の音声データの再生位置を対応付けて前記第 1及び第 2の音声データを再生することを特徴とする。

請求項 6に記載の本発明に従えば、音声記憶手段は、再生される音声の所定の区切りごとにチヱックフラグが揷入された第 1及び第 2の音声データを記憶する。再生手段は、第 1及び第 2の音声データのチェックフラグの再生タイミングに基づいて、第 1及び第 2の音声データの再生位置を対応付けて、第 1及び第 2の音声データを再生する。

すなわち、音声の所定の区切りごとに挿入されたチェックフラグの再生タイミングを基準に第 1及び第 2の音声データを同期させているので、第 1及び第 2の音声データを、再生される音声の所定の区切りごとに高精度に同期させて再生することができる。

請求項 7に記載の本発明は、前記再生手段は、前記第 1及び第 2の音声データの再生位置がずれた場合において、前記第 1の再生速度で音声が出力されているときには、前記第 1の音声データの再生位置と対応するように前記第 2の音声データの再生速度を調整し、前記第 2の再生速度で音声が出力されているときには、前記第 2の音声データの再生位置と対応するように前記第 1の音声データの再生速度を調整することを特徴とする。

請求項 7に記載の本発明に従えば、再生手段は、第 1及び第 2の音声データの再生位置がずれた場合において、第 1の再生速度で音声が出力されているときには第 1の音声データの再生位置と対応するように第 2の音声データの再生速度を調整し、第 2の再生速度で音声が出力されているときには第 2の音声データの再生位置と対応するように第 1の音声データの再生速度を調整する。

すなわち、第 1及び第 2の音声データの再生位置がずれた場合に、現在出力されている音声の再生に用いられる音声データを基準にして、他方の音声データの再生速度を調整する。これにより、現在出力されている音声に影響を与えることなく、同期ずれを補正することができる。

請求項 8に記載の本発明は、前記第 1及ぴ第 2の音声データによつて再生される音声を表記する文字を生成するための文字データを記憶する文字記憶手段と、前記文字記憶手段から読み出した文字データによって表される文字を前記音声出力手段によって出力されている第 1及び第 2の音声のうち少なくともいずれか一方に同期させて表示する表示手段として前記コンピュータをさらに機能させることを特徴とする。

請求項 8に記載の本発明に従えば、文字記憶手段は、第 1及び第 2の音声データによって再生される音声を表記する文字を生成するための文字データを記憶する。表示手段は、文字記憶手段から読み出した文字データによって表される文字を、音声出力手段によって出力されている第 1及び第 2の音声のうち少なくとも V、ずれか一方に同期させて表示する。

すなわち、文字記憶手段から読み出した文字データによって表される文字が、音声出力手段によって出力されている音声に同期して表示されるので、再生されている音声に同期させて表示画面上に文字を表示することができる。

請求項 9に記載の本発明は、前記表示手段は、前記文字データによって表される文字に対応する前記第 1又は第 2の音声データの再生時間に基づいて、前記文字記憶手段から読み出した文字データによって表される文字を前記音声出力手段によって出力されている第 1及ぴ第 2の音声のうち少なくともいずれか一方に同期させて表示することを特徴とする。

請求項 9に記載の本発明に従えば、表示手段は、文字データによって表される文字に対応する第 1又は第 2の音声データの再生時間に基づいて、文字記憶手段から読み出した文字データによって表される文字を、音声出力手段によって出力されている第 1及び第 2の音声のうち少なくともいずれか一方に同期させて表示する。

すなわち、文字に対応する音声データの再生時間を基に文字を音声に同期させて表示しているので、チェックフラグ等の同期処理専用のデータを文字データに付加することなく、文字と音声との同期処理を行うことができる。

請求項 1 0に記載の本癸明は、前記表示手段は、前記再生時間を文字ごとに予め記憶し、表示される文字に対して記憶されている再生時間を参照して当該文字を音声に同期させて表示することを特徴とする。

請求項 1◦に記載の本発明に従えば、表示手段は、再生時間を文字ごとに予め記憶し、表示される文字に対して記憶されている再生時間を参照して、当該文字を音声に同期させて表示する。

すなわち、表示される文字に対して記憶されている再生時間を参照して当該文字を音声に同期させて表示しているので、再生時間を計算することなく、文字と音声との同期処理を行うことができる。

請求項 1 1に記載の本発明は、前記表示手段は、前記文字データによって表される文字に対応する前記第 1又は第 2の音声データのデータ量に基づいて、前記文字記憶手段から読み出した文字データによって表される文字を前記音声出力手段によって出力されている第 1及び第 2の音声のうち少なくともいずれか一方に同期させて表示することを特徴とする。

請求項 1 1に記載の本発明に従えば、表示手段は、文字データによって表される文字に対応する第 1又は第 2の音声データのデータ量に基づいて、文字記憶手段から読み出した文字データによって表される文字を音声出力手段によって出力されている第 1及び第 2の音声のうち少なくともいずれか一方に同期させて表示する。

すなわち、文字に対応する音声データのデータ量を基に文字を音声に同期させて表示しているので、チェックフラグ等の同期処理専用のデータを文字データに付加することなく、文字と音声との同期処理を行うことができる。

請求項 1 2に記載の本発明は、音声データを用いてコンピュータにより音声を再生する音声再生方法であって、所定の音声を複数の異なる再生速度で再生するために予め準備され各再生速度それぞれ対応する複数の音声データによる音声を出力可能な状態にするステップと、

前記各再生速度のうちいずれかの速度で音声を出力する場合に、該再生速度に対応する音声データによる音声を出力するステップとを含むことを特徴とする。請求項 1 2に記載の本発明に従えば、音声データを用いてコンピュータにより音声を再生する音声再生方法であって、音声再生方法は、所定の音声を複数の異なる再生速度で再生するために予め準備され各再生速度にそれぞれ対応する複数の音声データによる音声を出力可能な状態にするステップと、前記各再生速度のうちいずれかの速度で音声を出力する場合に、該再生速度に対応する音声データによる音声を出力するステップとを含む。

すなわち、第 1ステップは、所定の音声を複数の異なる再生速度で再生するために予め準備され、各再生速度にそれぞれ対応する複数の音声データによる音声を出力可能な状態にする。第 2ステップは、前記各再生速度のうちいずれかの速度で音声を出力する場合に、該再生速度に対応する音声データによる音声を出力する。

請求項 1 3に記載の本発明は、音声データを用いて音声を再生する音声再生装置であって、

所定の音声を複数の異なる再生速度で再生するために予め準備され各再生速度にそれぞれ対応する複数の音声データを記憶する音声記憶手段と、

前記音声データを出力可能な状態にする再生手段と、

前記各再生速度のうちいずれかの速度で音声を出力する場合に、該再生速度に対応する音声データによる音声を出力する音声出力手段とを備えることを特徴とする。

請求項 1 3に記載の本発明に従えば、音声データを用いて音声を再生する音声再生装置であって、音声記憶手段は、所定の音声を複数の異なる再生速度で再生するために予め準備され、各再生速度にそれぞれ対応する複数の音声データを記憶する。再生手段は、音声データを出力可能な状態にする。音声出力手段は、各再生速度のうちいずれかの速度で音声を出力する場合に、該再生速度に対応する音声データによる音声を出力する。

すなわち、音声記憶手段には、所定の音声を複数の異なる再生速度で再生するために、予め準備された該再生速度に対応する複数の同じ内容の音声データが記憶される。再生手段および音声出力手段では、各再生速度のうちいずれかの速度で音声を出力する場合に、該再生速度に対応する音声データによる音声が出力可能な状態に再生され出力される。これにより、再生速度変更時に基本周波数と同じ再生周波数で当該再生速度に対応する音声データを作成する等の音声処理が不要になる。図面の簡単な説明

図 1は、本発明の第 1の実施の形態のビデオゲーム装置の構成を示すプロック図である。

図 2は、図 1に示すビデオゲーム装置の主要機能を示す機能ブロック図である。図 3は、 1倍速用音声データ a 1を用いて 1倍速で再生される 1倍速用音声信号 A 1と 2倍速用音声データ a 2を用いて 2倍速で再生される 2倍速用音声信号

A 2とを示す波形図である。

図 4は、図 2に示すビデオゲーム装置が実行する音声再生処理の一例を示すフローチャートである。

図 5は、標準速度再生モード及ぴ倍速再生モードにおいて再生される音声を説明するための模式図である。

図 6は、図 4に示す同期補正処理の一例を示すフローチャートである。

図 7は、第 2の実施の形態によるビデオゲーム装置の主要機能を示す機能プロック図である。

図 8は、図 7に示すビデオゲーム装置が実行する音声再生処理の一例を示すフローチャートである。

図 9は、再生時間テーブルのデータ構造の一例を示す模式図である。

図 1 0は、音声データ量テーブルのデータ構造の一例を示す模式図である。

図 1 1は、本発明の第 3の実施の形態による音声再生装置の構成を示すプロック図である。発明を実施するための最良の形態

(第 1の実施の形態）

以下、本発明の第 1の実施の形態によるビデオゲーム装置について図面を参照しながら説明する。

図 1は本発明の第 1の実施の形態のビデオゲーム装置の構成を示すプロック図である。なお、以下の説明では、ビデオゲーム装置の一例として家庭用ビデオゲ一ム機を家庭用テレビジョンに接続することによって構成される家庭用ビデオゲーム装置について説明するが、本発明はこの例に特に限定されず、モニタが一体に構成された業務用ビデオゲーム装置、ビデオゲームプログラムを実行することによってビデオゲーム装置として機能するパーソナルコンピュータ等にも同様に適用することができる。

図 1に示すビデオゲーム装置は家庭用ゲーム機 1 0 0及ぴ家庭用テレビジョン 2 0 0を備える。家庭用ゲーム機 1 0 0には、ビデオゲームプログラム及びゲームデータが記録されたコンピュータ読み出し可能な記録媒体 3 0 0が装填され、ビデオゲームプログラム及びゲームデータが適宜読み出されてゲームが実行される。

家庭用ゲーム機 1 0 0は、 C P U (Central Processing Unit) 1、パスライン 2、グラフィックスデータ生成プロセッサ 3、インターフェース回路（ I Z F ) 4、メインメモリ 5、 R OM (Read Only Memory) 6、伸張回路 7、パラレルポート 8、シリアルポート 9、描画プロセッサ 1 0、音声プロセッサ 1 1、 I /Oプロセッサ 1 2、バッファ 1 3〜1 5、記録媒体ドライブ 1 6、メモリ 1 7及びコントローラ 1 8を含む。家庭用テレビジョン 2 0 0はテレビジョンモニタ 2 1、増幅回路 2 2及ぴスピー力 2 3を含む。

C P U 1はパスライン 2およびグラフィックスデータ生成プロセッサ 3に接続されている。パスライン 2はアドレスパス、データパス及ぴコントロールバス等を含み、 C P U 1、インターフェース回路 4、メインメモリ 5、 R OM 6、伸張回路 7、パラレルポート 8、シリアルポート 9、描画プロセッサ 1 0、音声プロセッサ 1 1及び I /Oプロセッサ 1 2を相互に接続している。

描画プロセッサ 1 0はバッファ 1 3に接続される。音声プロセッサ 1 1はバッファ 1 4及び増幅回路 2 2に接続される。 I /Oプロセッサ 1 2はバッファ 1 5、記録媒体ドライブ 1 6、メモリ 1 7及びコントローラ 1 8に接続される。

家庭用テレビジョン 2 0 0のテレビジョンモニタ 2 1は、描画プロセッサ 1 0 に接続される。スピーカ 2 3は増幅回路 2 2に接続される。なお、業務用ビデオゲーム装置の場合、テレビジョンモニタ 2 1、増幅回路 2 2及ぴスピーカ 2 3は、家庭用ゲーム機 1 0 0を構成する各ブロックとともに 1つの筐体に収納される場合がある。

また、ビデオゲーム装置がパーソナルコンピュータやワークステーション等を核として構成されている場合、テレビジョンモニタ 2 1等はコンピュータ用のデイスプレイに対応する。また、伸張回路 7、描画プロセッサ 1 0、音声プロセッサ 1 1及び I ZOプロセッサ 1 2等は、それぞれ記録媒体 3 0 0に記録されているプログラムデータの一部又はコンピュータの拡張スロットに搭載される拡張ボード上のハードウェアに対応する。

また、インターフェース回路 4、パラレルポート 8及びシリアルポート 9は、コンピュータの拡張スロットに搭載される拡張ボード上のハードウェアに対応する。また、バッファ 1 3〜1 5はそれぞれメインメモリ又は拡張メモリの各記憶エリアに対応する。

次に、図 1に示す各構成要素について説明する。グラフィックスデータ生成プ口セッサ 3は C P U 1のいわばコプロセッサとしての役割を果たす。すなわち、グラフィックスデータ生成プロセッサ 3は座標変換や光源計算、例えば固定小数点形式の行列やべクトルの演算を並列処理によって行う。

グラフィックスデータ生 J¾¾プロセッサ 3が行う主な処理としては、 C P U 1から供給される画像データの 2次元又は仮想 3次元空間内における各頂点の座標データ、移動量データ、回転量データ等に基づいて、所定の表示エリア上における処理対象画像のアドレスデータを求めて C P U 1に返す処理、仮想的に設定された光源からの距離に応じて画像の輝度を計算する処理等がある。

ィンターフェース回路 4は周辺デバイス、例えばマウスやトラックポール等のポインティングデバイス等のインターフェース用に用いられる。メインメモリ 5 は R AM (Random Access Memory) 等で構成される。 R OM 6にはビデオゲ —ム装置のオペレーテイングシステムとなるプログラムデータが記憶されている。このプログラムはパーソナルコンピュータの B I O S (Basic Input Output System)に相当する。

伸張回路 7は動画に対する M P E G (Moving Picture Experts Group)規格ゃ静止画に対する J P E G(Joint Photographic Experts Group)規格に準拠したィントラ符号化によって圧縮された圧縮画像に対して伸張処理を施す。伸張処理はデコード処理 (VLC： Variable Length Codeによってェンコ一ドされたデータのデコード）、逆量子化処理、 I D C T(lnverse Discrete Cosine Transform)処理、イントラ画像の復元処理等を含む。

描画プロセッサ 1 0は所定時間 T (例えば、 1フレームで T = 1/60秒）ごとに C P U 1が発行する描画命令に基づいてバッファ 1 3に対する描画処理を行う, バッファ 1 3は例えば R AMで構成され、表示エリア（フレームバッファ）と非表示エリアとに分けられる。表示エリアはテレビジョンモニタ 2 1の表示面上に表示するデータの展開ェリァで構成される。非表示ェリァはスケルトンを定義するデータ、ポリゴンを定義するモデルデータ、モデルに動きを行わせるアニメ一シヨンデータ、各アニメーションの内容を示すパターンデータ、テクスチャデータ及ぴカラーパレットデータ等の記憶ェリァで構成される。

ここで、テクスチャデータは 2次元の画像データである。カラーパレットデータはテクスチャデータ等の色を指定するためのデータである。 C P U 1は、これらのデータを記録媒体 3 0 0から一度に又はゲームの進行状況に応じて複数回に分けて、予めバッファ 1 3の非表示エリアに記録する。

また、描画命令としては、ポリゴンを用いて立体的な画像を描画するための描画命令、通常の 2次元画像を描画するための描画命令がある。ここで、ポリゴンは多角形の 2次元仮想図形であり、例えば、三角形や四角形が用いられる。

ポリゴンを用いて立体的な画像を描画するための描画命令は、ポリゴン頂点座標データのバッファ 1 3の表示エリア上における記憶位置を示すポリゴン頂点ァドレスデータ、ポリゴンに貼り付けるテクスチャのバッファ 1 3上における記憶位置を示すテクスチャアドレスデータ、テクスチャの色を示すカラーパレツトデータのバッファ 1 3上における記憶位置を示すカラーパレツトアドレスデータ及びテクスチャの輝度を示す輝度データのそれぞれに対して行われるものである。上記のデータのうち表示エリア上のポリゴン頂点ァドレスデータは、グラフィックスデータ生成プロセッサ 3が C P U 1からの仮想 3次元空間上におけるポリゴン頂点座標データを移動量データ及び回転量データに基づいて座標変換することによって 2次元上でのポリゴン頂点座標データに置換されたものである。輝度データは C P U 1からの上記座標変換後のポリゴン頂点座標データによって示される位置から仮想的に配置された光源までの距離に基づいてダラフィックスデータ生成プロセッサ 3によって決定される。

ポリゴン頂点ァドレスデータはバッファ 1 3の表示エリア上のァドレスを示す。描画プロセッサ 1 0は 3個のポリゴン頂点ァドレスデータで示されるバッファ 1 3の表示ェリァの範囲に対応するテクスチャデータを書き込む処理を行う。

ゲーム空間内におけるキャラクタ等の物体は、複数のポリゴンで構成される。 C P U 1は各ポリゴンの仮想 3次元空間上の座標データを対応するスケルトンのベクトルデータと関連させてバッファ 1 3に記憶する。そして、後述するコントローラ 1 8の操作によって、テレビジョンモニタ 2 1の表示画面上でキャラクタを移動させる等の場合において、キャラクタの動きを表現したり、キャラクタを見ている視点位置を変えるときに、以下の処理が行われる。

すなわち、 C P U 1はグラフィックスデータ生成プロセッサ 3に対してパッファ 1 3の非表示エリア内に保持している各ポリゴンの頂点の 3次元座標データと、スケルトンの座標及ぴその回転量のデータから求められた各ポリゴンの移動量データ及び回転量データとを与える。

グラフィックスデータ生成プロセッサ 3は各ポリゴンの頂点の 3次元座標データと各ポリゴンの移動量データ及ぴ回転量データとに基づいて各ポリゴンの移動後及ぴ回転後の 3次元座標データを順次求める。

このようにして求められた各ポリゴンの 3次元座標データのうち水平及ぴ垂直方向の座標データは、バッファ 1 3の表示エリア上のアドレスデータ、すなわちポリゴン頂点ァドレスデータとして描画プロセッサ 1 0に供給される。

描画プロセッサ 1 0は 3個のポリゴン頂点ァドレスデータによって示されるパッファ 1 3の表示エリア上に予め割り当てられているテクスチャァドレスデータによって示されるテクスチャデータを書き込む。これによつて、テレビジョンモユタ 2 1の表示画面上には、多数のポリゴンにテクスチャの貼り付けられた物体が表示される。

通常の 2次元画像を描画するための描画命令は、頂点アドレスデータ、テクスチヤァドレスデータ、テクスチャデータの色を示すカラーパレツトデータのパッファ 1 3上における記憶位置を示すカラーパレツトァドレスデータ及ぴテクスチャの輝度を示す輝度データに対して行われる。これらのデータのうち頂点ァドレスデータは、 C P U 1からの 2次元平面上における頂点座標データを C P U 1力らの移動量データ及ぴ回転量データに基づいてダラフィックスデータ生成プロセッサ 3が座標変換することによって得られる。

音声プロセッサ 1 1は記録媒体 3 0 0から読み出された A D P C M (Adaptive Differential Pulse Code Modulation) データをパッファ 1 4に記憶させ、バッファ 1 4に記憶された AD P CMデータが音源となる。また、音声プ口セッサ 1 1は、例えば、周波数 4 4 . 1 k H zのクロック信号に基づき、パッファ 1 4から AD P CMデータを読み出す。

音声プロセッサ 1 1は、読み出した AD P CMデータに対して、ノイズの付加、エンベロープの設定、レベルの設定及びリパーブの付加等の処理を施す。このとき、音声プロセッサ 1 1は、読み出した AD P CMデータを元の音声データに復号ィ匕し、後述するように I /Oプロセッサによって設定された音量及び再生周波数で音声データを音声信号に変換して増幅回路 2 2へ出力する。その後、増幅回路 2 2は音声信号を増幅してスピーカ 2 3へ出力し、スピーカ 2 3は再生された音声を出力する。

記録媒体 3 0 0から読み出される音声データが C D— D A(Compact Disk Digital Audio)等の P CM (Pulse Code Modulation) データの場合、音声プロセッサ 1 1はこの音声データを AD P CMデータに変換する。また、 P CMデータに対するプログラムによる処理は、メインメモリ 5上において直接行われる。メインメモリ 5上において処理された P CMデータは、音声プロセッサ 1 1に供給されて AD P CMデータに変換される。その後、上述した各種処理が施され、音声が再生される。

I /Oプロセッサ 1 2は、入出力制御だけでなく、デコーダとしても機能し、記憶媒体ドライブ 1 7によって送信された画像データ、音声データ及びプロダラムデータ等の各種データを作業領域であるバッファ 1 5に格納し、バッファ 1 5 から読み出した各種データに対して E C C (Error Correction Code)によるエラー訂正処理を施し、エラー訂正処理を施した各種データをメインメモリ 5又は音声プロセッサ 1 lに供給する。

メインメモリ 5又は音声プロセッサ 11は、供給された音声データをバッファ 14に格納する。また、 I/Oプロセッサ 12は、コントローラ 18を介してュ一ザによって指示された再生モード等に応じてバッファ 14から読み出した該音声データが再生されるように、音声プロセッサ 11に対して音量及び再生周波数の設定を行う。

記録媒体ドライブ 16は記録媒体 300から画像データ、音声データ及びプログラムデータを読み出し、読み出したデータを I/Oプロセッサ 12に供給する。記録媒体ドライブ 16としては、例えば、 DVD— ROMドライブ、 CD— RO Mドライブ、ハードディスクドライブ、光ディスクドライブ、フレキシブルディスクドライブ、シリコンディスクドライブ、カセット媒体読み取り機等が用いられる。この場合、記録媒体 300としては、 DVD— ROM、 CD-ROM, ノヽードディスク、光ディスク、フレキシブルディスク、半導体メモリ等が用いられる。

メモリ 17としては、例えばカード型のメモリが用いられる。カード型のメモリは、例えばゲームを中断した場合において中断時点での状態を保持する等のように、中断時点での各種ゲームパラメータを保持するため等に用いられる。

コントローラ 18はユーザが種々の操作指令を入力するために使用する操作装置であり、ユーザの操作に応じた操作信号を CPU 1に送出する。コントローラ 18には、第 1ボタン 18 a、第 2ポタン 18 b、第 3ボタン 18 c、第 4ボタン 18 d、上方向キー 18U、下方向キー 18D、左方向キー 18 L、右方向キ一 18R、 L 1ボタン 18 L 1、 L 2ポタン 18 L2、 R1ボタン 18R1、 R 2ボタン 18 R 2、スタートボタン 18 e、セレクトポタン 18 f 、左スティック 18 S L及ぴ右スティック 18 SRがけられている。

上方向キー 18 U、下方向キー 18 D、左方向キー 18 L及び右方向キー 18 Rは、例えば、キャラクタやカーソルをテレビジョンモニタ 21の画面上で上下左右に移動させるコマンドを C PU 1に与えるために使用される。

スタートボタン 18 eは記録媒体 300からゲームプログラムをロードするように CPU 1に指示するため等に使用される。セレクトポタン 18 f は記録媒体 300からメインメモリ 5にロードされるゲームプログラムに関する各種選択を CPU1に指示するため等に使用される。

左スティック 18 S L及ぴ右スティック 18 SRを除くコントローラ 18の各ポタン及び各キーは、外部からの押圧力によって中立位置から押圧されるとオンになり、押圧力が解除されると上記中立位置に復帰してオフになるオンオフスィツチで構成される。

左スティック 18 S L及び右スティック 18 S Rは、いわゆるジョイスティックとほぼ同一構成のスティック型コントローラである。このスティック型コントローラは直立したスティックを有し、このスティックの所定位置を支点として前後左右を含む 360° 方向に亘つて傾倒可能な構成になっている。左スティック 18 S L及ぴ右スティック 18 SRは、スティックの傾倒方向及ぴ傾倒角度に応じて、直立位置を原点とする左右方向の X座標及び前後方向の y座標の値を操作信号として I /Oプロセッサ 12を介して C PU 1に送出する。

なお、第 1ボタン 18 a、第 2ボタン 18 b、第 3ボタン 18 c、第 4ボタン 18 d、 L 1ポタン 18 L 1、 L2ボタン 18 L 2、 1ボタン181 1及び1 2ボタン 18 R 2は、記録媒体 300からロードされるゲームプログラムに応じて種々の機能に使用される。

次に、上記のビデオゲーム装置の概略動作について説明する。記録媒体 300 が記録媒体ドライブ 16に装填されている場合、電源スィッチ（図示省略）がォンされてビデオゲーム装置に電源が投入される。すると、 CPU1は、 ROM6 に記憶されているオペレーティングシステムに基づいて、記録媒体 300からゲームプログラムを読み出すように記録媒体ドライブ 16に指示する。この指示により、記録媒体ドライブ 16は、記録媒体 300から画像データ、音声データ及ぴプログラムデータを読み出す。読み出された画像データ、音声データ及びプログラムデータは、 I/Oプロセッサ 12に供給され、 1 〇プロセッサ 12によつてエラ一訂正処理が各データに施される。

I/Oプロセッサ 12によってエラー訂正処理が施された画像データは、パスライン 2を介して伸張回路 7に供給される。伸張回路 7によって上述した伸張処理が行われた画像データは、描画プロセッサ 10に供給され、描画プロセッサ 1 0によってバッファ 1 3の非表示エリアに書き込まれる。 1 0プロセッサ 1 2 によってエラー訂正処理が施された音声データは、メインメモリ 5又は音声プロセッサ 1 1を介してバッファ 1 4に書き込まれる。また、 I /Oプロセッサ 1 2 によってエラ一訂正処理が施されたプログラムデータはメインメモリ 5に書き込まれる。

以降、 C P U 1は、メインメモリ 5に記憶されているゲームプログラム及びュ一ザがコントローラ 1 8を用いて指示する内容に基づいてビデオゲームを進行させる。すなわち、ユーザがコントローラ 1 8を用いて指示する内容に基づいて、 C P U 1は画像処理の制御、音声処理の制御及び内部処理の制御等を適宜行う。画像処理の制御として、例えば、キャラクタに指示されるアニメーションに該当するパターンデータから各スケルトンの座標の計算又はポリゴンの頂点座標デ一タの計算、得られた 3次元座標データや視点位置データのグラフィックスデータ生成プロセッサ 3への供給、グラフィックスデータ生成プロセッサ 3が求めたバッファ 1 3の表示エリア上のアドレスデータや輝度データを含む描画命令の発行等が行われる。

音声処理の制御として、例えば、音声プロセッサ 1 1に対する音声出力コマンドの発行、レベル、リパーブ等の指定がある。内部処理の制御として、例えばコントローラ 1 8の操作に応じた演算等が行われる。

図 2は、図 1に示すビデオゲーム装置の主要機能を示す機能プロック図である。ビデオゲーム装置は、音声出力部 1 0 1、記憶部 1 0 2、操作部 1 0 3、プログラム実行部 1 0 4及びプログラム記憶部 1 0 5を有する。音声出力部 1 0 1は、図 1に示す増幅回路 2 2やスピーカ 2 3等によって実現される。記憶部 1 0 2は図 1に示すメインメモリ 5やバッファ 1 3〜1 5によって実現される。

記憶部 1 0 2は、所定の音声を複数の異なる再生速度で再生するために予め準備され、各音声速度にそれぞれ対応する複数の音声データを格納する（ここでは、記録媒体 3 0 0から読み出された 1倍速用音声データ a 1を第 1チャンネル用の音声データとして格納し、 2倍速用音声データ a 2を第 2チャンネル用の音声データとして格納する）。ここで、 1倍速用音声データ a 1は、所定の音声（記録時の速度）を標準速度すなわち 1倍速で再生するために予め準備された音声データであり、 2倍速用音声データ a 2は、所定の音声（標準速度で再生される音声と同じ内容を表す音声）を早聞速度で再生するために予め準備された音声データである。早聞速度とは、標準速度より高速の速度のことであり、ここでは 2倍の速度のことである。なお、標準音声とは標準速度で再生された音声である、早聞音声とは早聞速度で再生された音声のことである。「所定の音声」は、表現内容、伝達内容が同一の音声であり、例えば各データに基づき再生される言葉（語）は一言一句異ならない。

操作部 1 0 3は、図 1に示すコントローラ 1 8等によって実現され、ユーザからの音声再生速度モード指示コマンドを受け付ける。音声再生速度モード指示コマンドとは、ビデオゲーム装置にユーザの所望の再生速度で音声を再生させるコマンドである。音声再生速度モード指示コマンドには、標準速度再生モード指示コマンドと早聞速度再生モードコマンドがある。標準速度再生モード指示コマンドが操作部 1 0 3に受け付けられた場合には、 1倍速用音声データ a 1を標準速度で再生した音声が出力され、ユーザは標準速度で再生された音声を聞くことができる。一方、早聞速度再生モード指示コマンドが操作部 1 0 3に受け付けられた場合には、 2倍速用音声データ a 2を早聞速度で再生した音声が出力され、ュ一ザは早聞速度で再生された音声を聞くことができる。

プログラム実行部 1 0 4は、 C P U 1、描画プロセッサ 1 0、音声プロセッサ 1 1及び I /Oプロセッサ 1 2等によって実現される。プログラム実行部 1 0 4 は、再生条件決定部 1 1 1及び音声再生部 1 1 2を含む。

再生条件決定部 1 1 1は、主に 1ノ0プロセッサ 1 2等によって実現され、操作部 1 0 3によって受け付けられた音声再生速度モード指示コマンドに応じた速度で 1倍速用音声データ a 1及び 2倍速用音声データ a 2が同期して再生されるように、 1倍速用音声データ a 1及び 2倍速用音声データ a 2の再生周波数を音声再生部 1 1 2に設定する。また、再生条件決定部 1 1 1は、上記の 1倍速用音声データ a 1に基づく 1倍速用音声及び 2倍速用音声データ a 2に基づく 2倍速用音声のうち音声再生速度モードに応じた一方のみをユーザが聴取可能となるように、 1倍速用音声データ a 1及び 2倍速用音声データ a 2の音量を音声再生部 1 1 2に設定する。音声再生部 1 12は、主に音声プロセッサ 11等によって実現され、再生条件決定部 1 1 1によって設定された再生周波数及び音量で、 1倍速用音声データ a 1及び 2倍速用音声データ a 2を同期させて出力可能な状態にする。すなわち、音声再生部 1 1 2は、 1倍速用音声データ a 1及び 2倍速用音声データ a 2の再生位置を対応させて再生し、出力可能な状態にする。このとき、音声再生部 1 1 2は、 1倍速用音声及び 2倍速用音声のうち音声再生速度モード指示コマンドに応じた一方のみをユーザが聴取可能となるように、 1倍速用音声データ a 1及び 2倍速用音声データ a 2の音量を設定している。これにより、ユーザは一方の音声のみを聞くことができる。 '

プログラム記憶部 105は、コンピュータ読み取り可能な記録媒体 300が装填された記録媒体ドライブ 16等で実現され、記録媒体 300には、音声再生プログラムを含むビデオゲームプログラムが記録されている。なお、記録媒体 30 0から音声再生プログラムが読み取られ、当該プログラムがメインメモリ 5に記憶されている場合、メインメモリ 5がプログラム記憶部 105として機能する。次に、 1倍速用音声データ a 1及び 2倍速用音声データ a 2について詳細に説明する。図 3は、 1倍速用音声データ a 1を用いて標準速度で再生される 1倍速用音声信号 A 1と 2倍速用音声データ a 2を用いて早聞速度で再生される 2倍速用音声信号 A 2とを示す波形図である。なお、図 3では、縦軸は振幅、横軸は時間を表している。

1倍速用音声データ a 1は、標準速度の音声としてユーザに聴取させる音声を記録した音声データであり、例えば、ビデオゲームに関する説明等を行うナレーター等の実際の人間が発声した音声をそのまま記録した音声データを用いることができる。一方、 2倍速用音声データ a 2は、早聞速度で再生した場合に標準速度と同じ音程で自然な音声を再生できるように、 1倍速用音声データ a 1に対して音程変換処理等の音声変換処理を施した音声データである。

すなわち、 2倍速用音声データ a 2は、早聞速度で再生した場合に 1倍速用音声データ a 1と同じピッチで再生されるように、 1倍速用音声データ a 1を編集して予め作成された音声データであり、例えば B e r k l e y I n t e g r a t e d Au d i o S o f we a r社の波形編集ソフトである「P e a k」における「Ch a n g e Du r a t i o n という機能を用いる等して、 1倍速用音声データ a 1を音程を保ったまま再生時間を 1/2にして生成される。なお、「 P e a k」以外にも、 Av i d Te c hn o l o g y社の「 P r o t o o 1 s s o f t we r e」におりる「Ί i me C o m p r e s s i o n / E x p a n s i o n」を用いて、上記の 2倍速用音声データ a 2を生成することもできる。

なお、 2倍速用音声データは、上記に限られず、 1倍速音声データと同じ言葉を早口で別途録音したものでもよいし、同じ楽曲を早く演奏して別途録音したものでもよい。

例えば、上記の 1倍速用音声データ a 1を標準速度で再生した場合、 1倍速用音声信号 A 1は、図 3の上段に示す波形を有する。一方、 1倍速用音声データ a 1と同じ内容を表す 2倍速用音声データ a 2を早聞速度で再生した場合、 2倍速用音声信号 A 2は、図 3の下段に示す波形を有し、 1倍速用音声信号 A 1を時間軸上で 2分の 1に圧縮したような波形を有する。

このとき、 2倍速用音声データ a 2を早聞速度で再生した場合の再生時間 X 2 は、 1倍速用音声データ a 1を標準速度で再生した場合の再生時間 X 1の 2分の 1となるが、上記のピッチ変換処理等が施されているため、音程は変化せず、 1 倍速用音声信号 A 1の音声と同様に非常に聞き取り易い音声を再生することがでさる。

次に、図 2に示すビデオゲーム装置が記録媒体 300に格納される音声再生プログラムを実行することによって実現される音声再生処理を説明する。図 4は、図 2に示すビデオゲーム装置が実行する音声再生処理の一例を示すフローチヤ一トである。

まず、ステップ 1において、再生条件決定部 1 1 1は、記録媒体 300に記憶されている 1倍速用音声データ a 1及び 2倍速用音声データ a 2を読み出し、記憶部 102に格納させる。

次に、ステップ 2において、再生条件決定部 1 1 1は、音声再生速度モード指示コマンドに基づいて、 1倍速用音声データ a 1及ぴ 2倍速用音声データ a 2の再生周波数及び音量を音声再生部 1 1 2に設定する。この場合の音声再生速度モ一ド指示コマンドは、予め定められている初期設定時の音声再生速度モード指示コマンド、又はユーザが操作部 1 0 3を用いて既に設定した音声再生速度モード指示コマンドである。

具体的には、標準速度再生モード指示コマンドが受け付けられて標準速度再生モードに設定されている場合、再生条件決定部 1 1 1は、 1倍速用音声データ a 1の再生周波数及び音量を、 1倍速用音声データ a 1の基本周波数と同じ再生周波数及び標準音量（例えば、音量調整範囲の中間量）に設定するとともに、 2倍速用音声データ a 2の再生周波数及び音量を、 2倍速用音声データ a 2の基本周波数の半分の再生周波数及び無音量（音量 0 ) に設定する。なお、基本周波数は、再生速度を変更するために再生周波数を調整することなく各音声データ a 1， a 2を再生した場合の再生周波数である。

一方、早聞速度再生モード指示コマンドが受け付けられて早聞速度再生モードに設定されている場合、再生条件決定部 1 1 1は、 1倍速用音声データ a 1の再生周波数及び音量を 1倍速用音声データ a 1の基本周波数の倍の再生周波数及び無音量に設定するとともに、 2倍速用音声データ a 2の再生周波数及び音量を 2 倍速用音声データ a 2の基本周波数と同じ再生周波数及び標準音量に設定する。次に、ステップ S 3において、音声再生部 1 1 2は、記憶部 1 0 2から 1倍速用音声データ _a 1及び 2倍速用音声データ a 2を読み出し、ステップ S 2で設定された再生周波数及び音量で 1倍速用音声データ a 1及び 2倍速用音声データ a 2を再生し、音声出力部 1 0 1は、再生された音声を出力する。

具体的には、標準速度再生モードの場合、音声再生部 1 1 2は、 1倍速用音声データ a 1を 1倍速用音声データ a 1の基本周波数と同じ再生周波数及び標準音量で再生するとともに、 2倍速用音声データ a 2を 2倍速用音声データ a 2の基本周波数の半分の再生周波数及び無音量で再生し、音声出力部 1 0 1は、 1倍速用音声データ a 1を用いて再生された 1倍速用音声のみを出力する。

一方、早聞速度再生モードの場合、音声再生部 1 1 2は、 1倍速用音声データ a 1を 1倍速用音声データ a 1の基本周波数の倍の再生周波数及び無音量で再生するとともに、 2倍速用音声データ a 2を 2倍速用音声データ a 2の基本周波数と同じ再生周波数及び標準音量で再生し、音声出力部 1 0 1は、 2倍速用音声データ a 2を用いて再生された 2倍速用音声のみを出力する。ここで、標準速度再生モード及び早聞速度再生モードにおいて再生される音声について詳細に説明する。図 5は、標準速度再生モード及び早聞速度再生モードにおいて再生される音声を説明するための模式図である。

なお、図 5では、説明を容易にするため、 1倍速用音声データ a 1の一例として、 1倍速用音声データ A l ~ J 1から音声「こんにちは」を出力するための 1 倍速用音声データが構成され、 1倍速用音声データ A 1， B 1が再生されると音声「こ」が出力され、 1倍速用音声データ C l， D 1が再生されると音声「ん」が出力され、 1倍速用音声データ E l， F 1が再生されると音声「に」が出力され、 1倍速用音声データ G l， H Iが再生されると音声「ち」が出力され、 1倍速用音声データ I 1， J 1が再生されると音声「は」が出力されるものとする。また、 2倍速用音声データ a 2の一例として、 2倍速用音声データ A 2〜E 2 から音声「こんにちは」を出力するための 2倍速用音声データが構成され、 2倍速用音声データ A 2が再生されると音声「こ」が出力され、音声データ B 2が再生されると音声「ん」が出力され、 2倍速用音声データ C 2が再生されると音声「に」が出力され、 2倍速用音声データ D 2が再生されると音声「ち」が出力され、 2倍速用音声データ E 2が S生されると音声「は」が出力されるものとして説明する。

まず、標準速度再生モードの場合、図 5の（a ) に示すように、 1倍速用音声データ A 1 ~ J 1が再生周期 t 1 ( 1倍用音声データ a 1の基本周波数の逆数）で順次再生され、再生時間 T 1で音声「こんにちは」が通常の音程でかつ標準音量で出力される。一方、図 5の（b ) に示すように、 2倍速用音声データ A 2〜 E 2が再生周期 2 X t 1 ( 2倍速用音声データ a 2の基本周波数の半分の逆数）で同期して順次再生され、再生時間 T 1で音声「こんにちは」が通常の音程より 1オクターブ低い音程でかつ無音量で出力される。

このように、標準速度再生モードでは、 1倍速用音声データ A l〜 J 1及ぴ 2 倍速用音声データ A 2〜E 2が同期して再生されるが、 2倍速用音声データ A 2 〜E 2による 1オクターブ低い音程で再生される 2倍速用音声は、無音量で出力されるため、ユーザには聞こえず、 1倍速用音声データ A l ~ J 1による通常の音程の音声のみをユーザは通常の速度で聞くことができる。

次に、早聞速度再生モードの場合、図 5の（c ) に示すように、 2倍速用音声データ A 2〜E 2が再生周期 t 1 ( 2倍速用音声データ a 2の基本周波数の逆数）で順次再生され、再生時間 T 1 Z 2で音声「こんにちは」が通常の音程でかつ標準音量で出力される。一方、図 5の（d ) に示すように、 1倍速用音声データ A 1〜 J 1が再生周期 t 1 / 2 ( 1倍速用音声データ a 1の基本周波数の倍の逆数）で同期して順次再生され、再生時間 T 1 / 2で音声「こんにちは」が通常のピッチより 1オクターブ高い音程でかつ無音量で出力される。

このように、早聞速度再生モードでは、 1倍速用音声データ A 1〜 J 1及び 2 倍速用音声データ A 2〜E 2が同期して再生されるが、 1倍速用音声データ A 1 〜J 2による 1オクターブ高い音声は、無音量で出力されるため、ユーザには聞こえず、 2倍速用音声データ A 2〜E 2による通常の音程の音声のみをユーザは倍速で聞くことができる。

再び、図 4を参照して、ステップ S 4において、音声再生部 1 1 2は、後述する同期捕正処理を行う。この同期捕正処理は、同期して再生されるべき 1倍速用音声データ a 1と 2倍速用音声データ a 2との再生タイミング（再生位置）がずれた場合に、ステップ S 2において設定された再生周波数を補正して 1倍速用音声データ a 1と 2倍速用音声データ a 2との再生タイミングを再び同期させるための処理である。

図 6は、図 4に示す同期捕正処理の一例を示すフローチャートである。まず、ステップ S 1 1において、音声再生部 1 1 2は、 1倍速用音声データ a 1と 2倍速用音声データ a 2との再生タイミングがずれているか否かを判断する。再生タイミングがずれていないと判断されない場合には（ステップ S 1 1で N O) 、音声再生部 1 1 2は、ステップ S 2で設定された 1倍速用音声データ a 1及ぴ 2倍速用音声データ a 2の再生周波数を変更することなく、図 4に示すステップ 5に戻る。

一方、再生タイミングがずれていると判断された場合（ステップ S 1 1で Y E S ) 、ステップ S 1 2において、音声再生部 1 1 2は、 1倍速用音声データ a 1 及ぴ 2倍速用音声データ a 2のうち再生位置が先行している音声データが通常の音量で出力されている力否かを判断する（S 1 2 ) 。

先行している音声データが通常の音量で出力されていると判断された場合（ステツプ S 1 2で Y E S ) 、ステップ S 1 3において、音声再生部 1 1 2は、再生位置が遅れている音声データ（無音量で出力されている音声データ）が先行している音声データに追いつくように、遅れている音声データの再生周波数を既設定の再生周波数より高くなるように変更し、図 4に示すステツプ 5に戻る。

一方、先行している音声データが通常の音量で出力されていない、すなわち遅れている音声データが通常の音量で出力されていると判断された場合（ステップ S 1 2で N O) 、ステップ S 1 4において、音声再生部 1 1 2は、先行している音声データ（無音量で出力されている音声データ）が遅れている音声データに合うように、先行している音声データの再生周波数を既設定の再生周波数より低くなるように変更し、図 4に示すステップ 5に戻る。

上記の同期補正処理によって、同期して再生されるべき 1倍速用音声データ a 1と 2倍速用音声データ a 2との再生タイミングがずれた場合に、ステップ S 2 において設定された再生周波数を補正して 1倍速用音声データ a 1と 2倍速用音声データ a 2との再生タイミングを再ぴ同期させることができる。

なお、上記の例では、再生周波数を変更して同期補正処理を行っているが、この例に特に限定されず、ステップ S 1 3において、遅れている音声データの再生位置が先行している音声データの再生位置に一致するように、遅れている音声データの再生位置を変更したり、ステップ S 1 4において、先行している音声データの再生位置が遅れている音声データの再生位置に一致するように、先行している音声データの再生位置を変更してもよい。

再び、図 4を参照して、ステップ S 5において、再生条件決定部 1 1 1は、再生されていない 1倍速用音声データ a 1及び 2倍速用音声データ a 2が記憶部 1 0 2に存在するか否かを判断する。再生されていない 1倍速用音声データ a 1及ぴ 2倍速用音声データ a 2が存在しないと判断された場合（ステップ S 5で N O) 、音声再生処理を終了する。

一方、再生されていない 1倍速用音声データ a 1及び 2倍速用音声データ a 2 が存在すると判断された場合（ステップ S 5で Y E S ) 、ステップ S 6において、再生条件決定部 1 1 1は、操作部 1 0 3がユーザによる音声再生速度モード指示コマンドを新たに受け付けたか否かを判断する。音声再生速度モード指示コマンドを新たに受け付けていないと判断された場合（ステップ S 6で N O) 、ステツプ S 3に戻って以降の処理を継続する。

音声再生速度モード指示コマンドを新たに受け付けたと判断された場合（ステップ S 6で Y E S ) 、ステップ 7において、再生条件決定部 1 1 1は、受け付けられた音声再生速度モード指示コマンドに応じた再生周波数及び音量を音声再生部 1 1 2に設定し、その後、ステップ S 3に戻って以降の処理を継続する。このように、音声再生速度モードが切り替えられた場合、 1倍速用音声データ a 1及ぴ 2倍速用音声データ a 2の再生周波数及び音量が音声再生速度モードに応じた再生周波数及び音量に変更される。

例えば、標準速度再生モードから早聞速度再生モードに切り替えられた場合、再生条件決定部 1 1 1は、音声再生部 1 1 2における 1倍速用音声データ a 1の再生周波数及び音量を、 1倍速用音声データ a 1の基本周波数と同じ再生周波数及び標準音量から 1倍速用音声データ a 1の基本周波数の倍の再生周波数及び無音量に変更する。そして、再生条件決定部 1 1 1は、音声再生部 1 1 2における 2倍速用音声データ a 2の再生周波数及ぴ音量を 2倍速用音声データ a 2の基本周波数の半分の再生周波数及び無音量から 2倍速用音声データ a 2の基本周波数と同じ再生周波数及び標準音量に変更する。この結果、 1倍速用音声が標準速度で出力されている途中で音声再生速度モードが切り替えられると、音程が変更されることなく、 2倍速用音声が早聞速度で出力されることとなる。

一方、早聞速度再生モードから標準速度再生モードに切り替えられた場合、再生条件決定部 1 1 1は、音声再生部 1 1 2における 1倍速用音声データ a 1の再生周波数及び音量を、 1倍速用音声データ a 1の基本周波数の倍の再生周波数及び無音量から 1倍速用音声データ a 1の基本周波数と同じ再生周波数及び標準音量に変更する。そして、再生条件決定部 1 1 1は、音声再生部 1 1 2における 2 倍速用音声データ a 2の再生周波数及び音量を、 2倍速用音声データ a 2の基本周波数と同じ再生周波数及び標準音量から 2倍速用音声データ a 2の基本周波数の半分の再生周波数及び無音量に変更する。この結果、 2倍速用音声が早聞速度で出力されている途中で音声再生速度モードが切り替えられると、音程が変更されることなく、 1倍速用音声が標準速度で出力されることとなる。

上記のように、本実施の形態では、早聞速度用の音声データである 2倍速用音声データ a 2を記録媒体 3 0 0に予め格納しておき、早聞速度再生モードにおいて 2倍速用音声データ a 2を再生して出力している。これにより、音程が通常の音声より 1 オクターブ高くなることなく、ユーザが聴取可能な早聞音声を自然に再生することができる。また、 1倍速用音声データ a 1と 2倍速用音声データ a 2とは常に同期して再生されている。このため、標準音声又は早聞音声が出力されている途中でも、ユーザは、音声再生速度モードを切り替えることによって、違和感を感じることなく所望の速度で再生される音声を聴取することができる。これにより、ユーザは、聞きたくない音声を倍速で再生し、聞きたい音声だけを等速で再生すること等ができる。

上記の説明では、標準音声及び早聞音声を切り替えるために再生速度が同じである 2つの音声データを同期して再生する場合について説明したが、本発明が適用される再生速度はこの例に特に限定されず、再生速度の異なる種々の音声データを同期して再生することもできる。

以下に再生速度の異なる 2つの音声データを同期して再生する方法について説明する。例えば、各音声データの再生総時間に対する再生済み時間の比が両音声データで同じになるように両音声データを再生したり、両音声データの再生済み時間の再生総時間からの割合を比較して両音声データを再生することによって、再生速度の異なる 2つの音声データを同期して再生することができる。

または、各音声データの再生総時間に対する残り再生時間（再生総時間から再生済み時間を減算した時間）の比が両音声データで同じになるように両音声データを再生したり、両音声データの残り再生時間の再生総時間の割合を比較して両音声データを再生することによつても、再生速度の異なる 2つの音声データを同期して再生することができる。

あるいは、所定データ量ごと、例えば、単位時間ごと、音節ごと、単語ごと、又は一文字ごとに、音声データと区別可能な所定のチヱックフラグを両音声データに揷入したチェックフラグ付音声データを用いて、両音声データのチェックフラグの再生タイミングを比較して両音声データを再生することによつても、再生速度の異なる 2つの音声データを同期して再生することができる。

上記のような再生方法により、種々の再生速度の音声データに本発明を同様に適用することができ、例えば、 2倍速用音声データの代わりに或いはこれに加えて、スロー再生するための 1 Z 2倍速用音声データ、さらに高速再生するための 3倍速用音声データ等の F倍速再生（Fは実数）するための F倍速用音声データにも同様に適用することができる。また、上記のような F倍速用音声データは、そのまま F倍速再生に用いられることが好ましいが、必ずしもこれには限定されず、 F倍速と近似の F 1倍速、例えば、 0 . 8 X F〜1 . 2 倍速に倍速音声データを用いてもよい。この場合、再生周波数は、 F倍速用音声データの再生周波数 X F ÷ F 1で求めた値等に設定される。

(第 2の実施の形態）

次に、本発明の第 2の実施の形態によるビデオゲーム装置はついて説明する。本実施の形態は、第 1の実施の形態における 1倍速用音声及び 2倍速用音声の同期再生に加え、出力される音声に当該音声を表す文字等を同期させて表示するものである。ここでは、記録媒体 3 0 0に記録される音声再生プログラムを含むゲームプログラムは変更されるものの、ビデオゲーム装置の構成は図 1に示したものと同様であるので、ハードウェア構成の図示及び説明は省略することとする。図 7は、本発明の第 2の実施の形態によるビデオゲーム装置の主要機能を示す機能プロック図である。なお、図 7に示すビデオゲーム装置では、図 2に示すビデォゲーム装置と同様の機能を有する部分については同一符号を付して詳細な説明を省略し、以下本実施の形態の特徴的部分について説明する。

図 7に示すビデオゲーム装置は、文字を表示するための表示部 1 0 6をさらに備え、プログラム実行部 1 0 4 aは、文字表示制御部 1 1 3をさらに含み、記憶部 1 0 2 aは、文字データ a 3をさらに格納する。文字表示制御部 1 1 3は、表示部 1 0 6に表示する文字を記憶部 1 0 2に記憶される文字データ a 3に基づいて生成し、この生成した文字を上述の 1倍速用音声及び 2倍速用音声の再生に同期させて表示部 1 0 6に表示する。

次に、図 7 に示すビデオゲーム装置が記録媒体 3 0 0 aに格納される音声再生プログラムを実行することによって実現される音声再生処理を説明する。図 8 は、図 7に示すビデオゲーム装置が実行する音声再生処理の一例を示すフローチヤートである。なお、図 8に示すフローチャートの各ステップのうち図 4に示すフローチャートの各ステップと同様の処理が実行されるステップについては、同一符号を付与して詳細な説明を省略する。

まず、ステップ 2 1において、再生条件決定部 1 1 1は、記録媒体 3 0 0 aに記憶されている 1倍速用音声データ a 1及び 2倍速用音声データ a 2を記録媒体 3 0 0 aから読み出し記憶部 1 0 2 aに格納する。また、文字表示制御部 1 1 3 は、再生条件決定部 1 1 1によって読み込まれた 1倍速用音声データ a 1及ぴ 2 倍速用音声データ a 2に対応する文字データ a 3を、記録媒体 3 0 0 aから読み込み記憶部 1 0 2 aに格納する。ここで、文字データ a 3は、 1倍速用音声データ a 1及び 2倍速用音声データ a 2を用いて再生される音声を表記した文字列を描画するためのデータである。本実施の形態では、 1倍速用音声データ a 1、 2 倍速用音声データ a 2及び文字データ a 3は、 1文節を一単位とするデータから構成されている。

次に、第 1の実施の形態と同様にステップ S 2， S 3の処理が実行された後、ステップ S 2 2において、文字表示制御部 1 1 3は、ステップ S 3において再生されている 1倍速用音声データ a 1又は 2倍速用音声データ a 2の再生時間を 1 文節に含まれる文字数で除算して、 1文字当りの描画時間を算出する。

次に、ステップ 2 3において、文字表示制御部 1 1 3は、記憶部 1 0 2 aから文字データ a 3を読み出し、ステップ S 2 2において算出された描画時間に応じて文字を順次表示部 1 0 6に表示させる。その後、第 1の実施の形態と同様にステツプ S 4 ~ S 7の処理が実行された後にステップ S 3に戻り、処理が継続される。

このように、本実施の形態では、文字データ a 3を用いて描画される文字が、 1倍速用音声データ a 1及び 2倍速用音声データ a 2を用いて出力される音声のうち少なくともいずれか一方に同期して順次表示される。これにより、音声の出力と文字の表示とを同期させることができ、ユーザは視覚と聴覚の双方で情報を受け取ることができる。なお、上記の説明では、 1文字当りの描画時間を算出したが、この例に特に限定されず、 1分節を構成する文字数を、 1文節に対応する 1倍速用音声データ a 1又は 2倍速用音声データ a 2の再生時間で除算して単位時間あたりの描画文字数つまり描画速度を求め、この描画速度に応じて文字を所定方向、例えば、左から右へ又は上から下へ描画するようにしてもよい。

また、以下に説明する再生時間テーブル又は音声データ量テーブルを予め作成して記憶部 1 0 2 aに予め記憶させ、これらのテーブルを用いて文字を音声に同期させて表示するようにしてもよい。

図 9は、再生時間テーブルのデータ構造の一例を示す模式図である。図 9に示す再生時間テーブル 1 3 1には、 1分節（「こんにちは。」）を構成する文字データ a 3の各文字ごとに標準速度時の再生時間 Q 1〜Q 6 ( s e c ) が設定され記憶されている。例えば、標準速度時すなわち標準速度再生モードの場合、文字表示制御部 1 1 3は、記憶部 1 0 2 aに記憶されている再生時間テーブル 1 3 1 を参照する。そして、文字表示制御部 1 1 3は、文字「こ」に対応する 1倍速用音声データ a 1が再生時間 Q 1で再生されているときに、文字「こ」に対応する文字データ a 3を用いることにより、文字「こ」を、再生時間 Q 1の間、表示部 1 0 6に表示する。同様にして、文字表示制御部 1 1 3は、文字「ん」、「に」、「ち」、「は」、「。」を、再生時間 Q 2， Q 3， Q 4 , Q 5 , Q 6の間、順次表示部 1 0 6に表示させる。一方、早聞速度で再生時すなわち早聞速度再生モードの場合、文字表示制御部 1 1 3は、再生時間 Q 1〜Q 6を 2分の 1 にし、上記と同様にして各文字を順次表示部 1 0 6に表示する。

なお、上記の例では、標準速度時の再生時間を基準として再生時間テーブルを設定したが、この例に特に限定されず、早聞速度時の再生時間を基準として再生時間テーブルを設定したり、標準速度時および早聞速度時ごとに再生時間を基準として再生時間テーブルを設定するようにしてもよい。また、上記の各場合において、各再生時間内で表示可能な描画速度に応じて文字を所定方向、例えば、左から右へ又は上から下へ描画するようにしてもよい。

図 1 0は、音声データ量テーブルのデータ構造の一例を示す模式図である。図 1 0に示す音声データ量テーブル 1 4 1は、 1分節 ( 「こんにちは。」）を構成する文字データ a 3の各文字ごとに対応する 1倍速用音声データ a 1の音声データ量 R1〜R6 (b i t) を記憶している。例えば、文字表示制御部 113は、記憶部 102 aに記憶されている音声データ量テーブル 141を参照する。そして、文字表示制御部 113は、現在再生されている 1倍速用音声データ a 1の音声データ量が音声データ量 R 1内の場合、文字「こ」に対応する文字データ a 3 を用いることにより、文字「こ」を表示部 106に表示する。同様にして、文字表示制御部 1 13は、現在再生されている 1倍速用音声データ a 1の音声データ量と各音声データ量 R 2， R 3, R 4, R 5, R 6と比較して、文字「ん J 、「に」、「ち」、「は」、「。」を順次表示部 106に表示する。一方、早聞速度時すなわち早聞再生モードの場合、文字表示制御部 113は、音声データ量 R 1〜R 6を 2倍速用音声データ a 2の音声データ量に換算し、上記と同様にして各文字を順次表示部 106に表示する。

なお、上記の例では、 1倍速用音声データ a 1の音声データ量を基準として音声データ量テーブルを設定したが、この例に特に限定されず、 2倍速用音声データ a 2の音声データ量を基準として音声データ量テーブルを設定したり、各音声データごとの音声データ量を基準として音声データ量テーブルを設定するようにしてもよい。また、上記の各場合において、各音声データ量に対応する再生時間内で表示可能な描画速度に応じて文字を所定方向、例えば、左から右へ又は上から下へ描画するようにしてもよい。

(実施の形態 3 )

次に、本発明の第 3の実施の形態による音声再生装置について説明する。図 1 1は、本発明の第 3の実施の形態による音声再生装置の構成を示すプロック図である。なお、本実施の形態による音声再生装置としては、例えば、 CD (Com p a c t D i s c) プレイヤ、 MD (Mi n i— D i s c) プレイヤ、 DVD (D i g i t a l Ve r s a t i l e D i s c) プレイヤ等が該当し、主としてハードウエアによって音声再生処理が実行される。

図 11に示す音声再生装置は、操作部 201、再生条件決定部 202、記憶部 203、音声再生部 204、音声選択部 205及ぴスピー力 206を備える。記憶部 203は、 CD等の記憶媒体駆動装置等から構成され、音声再生部 20 4の指示に応じて記憶媒体に記憶されている 1倍速用音声データ a 1及び 2倍速用音声データ _a 2を音声再生部 2 0 4へ出力する。操作部 2 0 3は、ユーザからの音声再生速度モード指示コマンドを受け付ける。なお、音声再生速度モード指示コマンドは、第 1の実施の形態と同様である。また、 1倍速用音声データ a 1 及び 2倍速用音声データ a 2のデータ形式は特に限定されず、例えば、図 3に示す 1倍速用音声データ a 1及び 2倍速用音声データ a 2を用いることができる。 ' 再生条件決定部 2 0 2は、操作部 2 0 1によって受け付けられた音声再生速度モード指示コマンドに応じた速度で 1倍速用音声データ a 1及び 2倍速用音声データ a 2が同期して再生されるように 1倍速用音声データ a 1及び 2倍速用音声データ a 2の再生周波数を音声再生部 2 0 4に設定する。また、再生条件決定部 2 0 2は、 1倍速用音声及び 2倍速用音声のうち音声再生速度モード指示コマンドに応じた一方のみをユーザが聴取可能となるように音声選択部 2 0 5を制御する。

音声再生部 2 0 4は、再生条件決定部 2 0 2によって設定された再生周波数で 1倍速用音声データ a 1及び 2倍速用音声データ a 2を同期させて再生し、 1倍速用音声信号及び 2倍速用音声信号を音声選択部 2 0 5へ出力する。音声選択部 2 0 5は、再生条件決定部 2 0 2の指示に応じて、 1倍速用音声信号及び 2倍速用音声信号のうちの一方をスピーカ 2 0 6へ出力する。スピーカ 6は、入力された音声信号に応じた音声を出力する。

上記の構成により、ユーザが操作部 2 0 1を用いて標準速度再生モードを選択した場合、音声再生部 2 0 4は、 1倍速用音声データ a 1及び 2倍速用音声データ a 2を記憶部 2 0 3から読み出し、 1倍速用音声データ a 1を 1倍速用音声データ a 1の基本周波数と同じ再生周波数で順次再生して標準速度の 1倍速用音声信号を出力する。そして、音声再生部 2 0 4は、 2倍速用音声データ a 2を 2倍速用音声データ a 2の半分の再生周波数で 1倍速用音声データ a 1に同期して順次再生して標準速度の 2倍速用音声信号を出力する。このとき、音声選択部 2 0 5は、 1倍速用音声信号のみをスピーカ 2 0 6へ出力し、ユーザは、 1倍速用音声データ a 1による通常の音程の音声のみを標準速度で聞くことができる。

一方、ユーザが操作部 2 0 1を用いて早聞速度再生モードを選択した場合、音声再生部 2 0 4は、 1倍速用音声データ a 1及び 2倍速用音声データ a 2を記憶部 2 0 3から読み出し、 2倍速用音声データ a 2を当該 2倍速用音声データ a 2 と同じ再生周波数で順次再生して早聞速度の 2倍速用音声信号を出力する。そして、音声再生部 2 0 4は、 1倍速用音声データ a 1を当該 1倍速用音声データ a 1の倍の再生周波数で 2倍速用音声データ a 2に同期して順次再生して 2倍速の 1倍速用音声信号を出力する。このとき、音声選択部 2 0 5は、 2倍速用音声信号のみをスピーカ 2 0 6へ出力し、ユーザは、 2倍速用音声データ a 2による通常の音程の音声のみを倍速で聞くことができる。

なお、上記の各実施の形態では、音声を再生するためのデータとして 1倍速用音声データ及び 2倍速用音声データを説明したが、この例に特に限定されず、音楽を再生するための音声データ等にも本発明を同様に適用することができる。また、上記の各実施の形態では、 1倍速用音声データと 2倍速用音声データとが予め記録媒体等に格納される場合について説明したが、この例に限定されず、インターネットゃイントラネット等を用いたネットワーク配信によって配信されるようにしてもよい。産業上の利用可能性

請求項 1に記載の本発明によれば、再生速度変更時に当該再生速度に対応する音声データを作成する等の音声処理が不要になるため、再生速度を瞬時に違和感なく切り替えることができる。また、事前に充分な処理時間をかけて再生速度に対応した音声データを作成することができるので、再生速度を変更した場合に音程等の変動のない自然な音声を出力することができる。

請求項 2に記載の本発明によれば、各再生速度に応じて予め作成された音声データを用いて音声を出力することができる。このとき、音声の再生速度を切り替えても、同じ内容の音声を出力することができる。また、第 1の音声データから第 2の音声データを作成する等の音声処理が不要になり、第 2の再生速度で再生した場合、第 2の音声データを用いて音程等の変動のない自然な音声を再生することができる。これらのことから、 C P U等のハードウェアに過度な負担をかけることなく、音声の再生速度を違和感なく切り替えることができる。特に、音声処理だけでなく、画像処理を主体とするビデオゲーム装置に本発明を用いた場合には、複雑な画像処理に C P Uの処理能力を充分に配分することができるので、種々の再生速度で自然な音声を再生しながら、種々の画像をリアルタイムに表示することができる。

請求項 3に記載の本発明によれば、ユーザは所望の再生速度で音声を聞くことができるとともに、一方の音声の出力途中で他方の音声に切り替えることができる。このとき、音声の出力途中で音声を切り替えた場合でも、第 1の音声速度モードで出力される音声と第 2の音声速度モードで出力される音声とではピッチ等の変動がないため、切り替え前後で違和感のない聞きやすい自然な音声を再生できる。

請求項 4に記載の本発明によれば、ユーザは標準速度及び高速のうち所望の速度で自然な音声を聞くことができるので、聞きたい音声のみを標準速度で再生させて聞いたり、聞きたくない音声を高速で再生して聞き飛ばしたり、又は、時間がない場合等において高速で音声を聞く等することができ、種々の使用方法で音声を聞くことができる。

請求項 5に記載の本発明によれば、チヱックフラグ等の同期処理専用のデータを第 1及び第 2の音声データに付加することなく、第 1及び第 2の音声データの同期処理を行うことができる。これにより、音声データのデータ量を必要最低限に抑制することができるとともに、種々の形式の音声データを加工することなく第 1及び第 2の音声データとして直接的に用いることができる。

請求項 6に記載の本発明によれば、第 1及び第 2の音声データを再生される音声の所定の区切りごとに高精度に同期させて再生することができるので、再生される音声が聞き取りやすい状態で 2つの音声を高精度に同期させて再生することができる。

請求項 7に記載の本発明によれば、出力されている音声に影響を与えることなく、同期ずれを捕正することができるので、切り替え前後で違和感のない聞きやすい自然な音声を安定して再生することができる。

請求項 8に記載の本発明によれば、再生されている音声に同期させて表示画面上に文字を表示させることができるので、視覚と聴覚とによってユーザに伝達することができ、わかりやすい演出を行うことができる。

請求項 9に記載の本発明によれば、チェックフラグ等の同期処理専用のデータを文字データに付加することなく、文字と音声との同期処理を行うことができるので、文字データのデータ量を必要最低限に抑制することができるとともに、種々の形式の文字データを加工することなく文字データとして直接的に用いることができる。

請求項 1 0に記載の本発明によれば、再生時間を計算することなく、文字と音声との同期処理を行うことができるので、 C P U等のハードウエアに過度な負担をかけることなく、同期処理を高速に行うことができる。

請求項 1 1に記載の本発明によれば、チェックフラグ等の同期処理専用のデータを文字データに付加することなく、文字と音声との同期処理を行うことができるので、文字データのデータ量を必要最低限に削減できるとともに、文字データとして種々の形式の文字データをそのまま用いることができる。

請求項 1 2に記載の本発明によれば、再生速度変更時に当該再生速度に対応する音声データを作成する等の音声処理が不要になり、音声の再生速度を瞬時に違和感なく変えることができる。また、事前に充分な処理時間をかけて再生速度に対応した音声データを作成することができる。これらのことから、再生速度を変更する場合、 C P U等のハードウェアは、比較的小さな処理負担で、音程等の変動のない自然な音声を出力することができる。

請求項 1 3に記載の本発明によれば、再生速度変更時に当該再生速度に対応する音声データを作成する等の音声処理が不要になり、音声の再生速度を瞬時に違和感なく変えることができる。また、事前に充分な処理時間をかけて再生速度に対応した音声データを作成することができる。これらのことから、再生速度を変更した場合、 C P U等のハードウェアは、比較的小さな処理負担で、音程等の変動のない自然な音声を出力することができる。

Claims

請求の範囲

1 . 音声データを用いて音声を再生するための音声再生プログラムであって、所定の音声を複数の異なる再生速度で再生するために予め準備され各再生速度にそれぞれ対応する複数の音声データを記憶する音声記憶手段と、

前記音声データを出力可能な状態にする再生手段と、

前記各再生速度のうちいずれかの速度で音声を出力する場合に、該再生速度に対応する音声データによる音声を出力する音声出力手段としてコンピュータを機能させることを特徴とする音声再生プログラム。

2 . 前記音声記憶手段は、所定の音声を第 1の再生速度で再生するために予め準備された第 1の音声データと、前記所定の音声を前記第 1の再生速度と異なる第 2の再生速度で再生するために予め準備された第 2の音声データとを記憶し、前記再生手段は、音声記憶手段から読み出した第 1及び第 2の音声データの再生位置を対応付けて前記第 1及び第 2の音声データを再生し、前記第 1及び第 2 の音声データによる音声を出力可能な状態にし、

前記音声出力手段は、前記第 1の再生速度で音声を出力する場合に前記再生手段によって再生されている第 1の音声データによる第 1の音声を出力し、前記第 2の再生速度で音声を出力する場合に前記再生手段によって再生されている前記第 2の音声データによる第 2の音声を出力することを特徴とする請求項 1に記載の音声再生プログラム。

3 . 前記音声出力手段による音声の出力を前記第 1の再生速度で再生するための第 1の再生速度モードと、前記音声出力手段による音声の出力を前記第 2の再生速度で再生するための第 2の再生速度モードとのいずれか一方をユーザが選択する操作を受け付ける操作手段として前記コンピュータをさらに機能させ、

前記音声出力手段は、前記操作手段によって受け付けられた再生速度モードに応じて前記第 1及ぴ第 2の音声データによる音声のうちのいずれか一方を出力することを特徴とする請求項 2に記載の音声再生プログラム。

4 . 前記音声記憶手段は、前記第 1の音声データとして、所定の音声を標準速度で再生するために予め準備された通常音声データを記憶するとともに、前記第 2 の音声データとして、前記通常音声データを用いて再生される音声と同じ内容の音声を標準速度より速!/、再生速度で再生するために予め準備された高速音声データを記憶し、

前記音声出力手段は、標準速度で音声を出力する場合に前記通常音声データによる標準速度の音声を出力し、高速で音声を出力する場合に前記高速音声データによる高速の音声を出力することを特徴とする請求項 2又は 3の何れかに記載の音声再生プログラム。

5 . 前記再生手段は、前記第 1及び第 2の音声データの再生済み時間又は残り再生時間に基づいて、前記第 1及び第 2の音声データの再生位置を対応付けて前記第 1及ぴ第 2の音声データを再生することを特徴とする請求項 2〜 4の何れかに記載の音声再生プログラム。

6 . 前記音声記憶手段は、再生される音声の所定の区切りごとにチェックフラグが挿入された前記第 1及び第 2の音声データを記憶し、

前記再生手段は、前記第 1及び第 2の音声データのチヱックフラグの再生タイミングに基づいて前記第 1及び第 2の音声データの再生位置を対応付けて再生することを特徴とする請求項 2〜 4のいずれかに記載の音声再生プログラム。

7 . 前記再生手段は、前記第 1及び第 2の音声データの再生位置がずれた場合において、前記第 1の再生速度で音声が出力されているときには、前記第 1の音声データの再生位置と対応するように前記第 2の音声データの再生速度を調整し、前記第 2の再生速度で音声が出力されているときには、前記第 2の音声データの再生位置と対応するように前記第 1の音声データの再生速度を調整することを特徴とする請求項 2〜 6のいずれかに記載の音声再生プログラム。

8 . 前記第 1及び第 2の音声データによって再生される音声の内容を表記する文字を生成するための文字データを記憶する文字記憶手段と、

前記文字記憶手段から読み出した文字データによって表される文字を前記音声出力手段によって出力されている第 1及び第 2の音声のうち少なくともいずれか一方に同期させて表示する表示手段として前記コンピュータをさらに機能させることを特徴とする請求項 2〜 7のいずれかに記載の音声再生プログラム。

9 . 前記表示手段は、前記文字データによって表される文字に対応する前記第 1 又は第 2の音声データの再生時間に基づいて、前記文字記憶手段から読み出した文字データによって表される文字を前記音声出力手段によって出力されている第 1及び第 2の音声のうち少なくともいずれか一方に同期させて表示することを特徴とする請求項 8に記載の音声再生プログラム。

1 0 . 前記表示手段は、前記再生時間を文字ごとに予め記憶し、表示される文字に対して記憶されている再生時間を参照して当該文字を音声に同期させて表示することを特徴とする請求項 9に記載の音声再生プログラム。

1 1 . 前記表示手段は、前記文字データによって表される文字に対応する前記第 1又は第 2の音声データのデータ量に基づいて、前記文字記憶手段から読み出した文字データによって表される文字を前記音声出力手段によって出力されている第 1及び第 2の音声のうち少なくともいずれか一方に同期させて表示することを特徴とする請求項 8に記載の音声再生プログラム。

1 2 . 音声データを用いてコンピュータにより音声を再生する音声再生方法であつて、

所定の音声を複数の異なる再生速度で再生するために予め準備され各再生速度にそれぞれ対応する複数の音声データによる音声を出力可能な状態にするステツプと、

前記各再生速度のうちいずれかの速度で音声を出力する場合に、該再生速度に対応する音声データによる音声を出力するステップとを含むことを特徴とする音声再生方法。

1 3 . 音声データを用いて音声を再生する音声再生装置であって、

前記音声データを出力可能な状態にする再生手段と、

前記各再生速度のうちいずれかの速度で音声を出力する場合に、該再生速度に対応する音声データによる音声を出力する音声出力手段とを備えることを特徴とする音声再生装置。