JP2007163801A - コンテンツ再生装置 - Google Patents

コンテンツ再生装置 Download PDF

Info

Publication number
JP2007163801A
JP2007163801A JP2005359498A JP2005359498A JP2007163801A JP 2007163801 A JP2007163801 A JP 2007163801A JP 2005359498 A JP2005359498 A JP 2005359498A JP 2005359498 A JP2005359498 A JP 2005359498A JP 2007163801 A JP2007163801 A JP 2007163801A
Authority
JP
Japan
Prior art keywords
data
reproduction
subtitle
key
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005359498A
Other languages
English (en)
Inventor
Akane Noguchi
あかね 野口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2005359498A priority Critical patent/JP2007163801A/ja
Publication of JP2007163801A publication Critical patent/JP2007163801A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

【課題】映画などのコンテンツを利用して語学学習ができると共に、発音の良否を学習者が確認できるようにする。
【解決手段】語学学習装置は、映画コンテンツが記録されたDVDから字幕を読み出し、読み出した字幕を表示する。ユーザが入力部を操作して字幕を選択すると、選択された字幕が表示される場面から映画を再生し、ユーザに字幕のセンテンスの発音を促す。語学学習装置はユーザの音声が入力されると、入力された音声と選択された字幕の再生中に再生される音声との差異に基づいて、ユーザの発音の良否を判定し、判定結果をユーザに報知する。
【選択図】図1

Description

本発明は、映像中に表示される字幕を利用して語学学習を行う技術に関する。
外国映画のセリフは、外国語の日常会話を多く含んでいるため、外国映画を記録したビデオテープやDVD(Digital Versatile Disc)は、単に映画を楽しむだけでなく語学学習の教材としても利用されている。特に、近年普及しているDVDは、ビデオテープと比較して巻きもどしや早送り、繰返し再生等を容易に行うことができ、また、これらの動作を繰返し行ってもビデオテープのように記録媒体が劣化しない。このため、繰返し再生が頻繁に行われる語学学習用として注目されており、DVDを利用して語学学習を行う技術も考案されている。
例えば、特許文献1には、映画のセリフのリストを表示し、選択されたセリフが発音される場面を再生するシステムが開示されている。このシステムにおいては、学習したいセリフが選択されると、そのセリフが再生される場面が頭出しされ、学習したいセリフの音声が再生される。特許文献1に開示されたシステムにおいては、再生される映像に映画を使用すれば、日常会話等が自然な速さで発音されるので、この発音を聞いてシャドウイングやリスニングを行えば、効果的な語学学習を行うことができる。
特開2001−22265号公報
ところで、人間を相手にして会話の練習を行う場合には、相手に発音をチェックしてもらうことができるため、発音の間違いを認識してすぐに発音を修正することができる。しかしながら、特許文献1に開示されているようなシステムを利用し、一人で発音練習を行う場合には、発音している本人は正しく発音しているか判断できないため、間違った発音を身に付けてしまう虞がある。
本発明は、上述した背景の下になされたものであり、その目的は、映画などのコンテンツを利用して語学学習ができると共に、発音の良否を学習者が確認できるようにすることにある。
上述した課題を解決するために本発明は、再生時間軸に沿って記録されている映像データと、音声データと、字幕データと、前記字幕データの再生開始時刻を示す再生時刻データとを有するコンテンツを再生するコンテンツ再生装置において、前記映像データ、音声データおよび字幕データを前記再生時間軸に沿って読み出し、読み出した各データを再生する読出再生手段と、ユーザによって操作される操作手段と、前記操作手段が操作されたときに前記読出再生手段によって再生されている字幕データの再生開始時刻を示す再生時刻データを参照し、前記読出再生手段に対して当該時刻データが示すタイミングからの再生を指示する再生位置指示手段と、ユーザの音声が入力される音声入力手段と、前記再生位置指示手段によって指示されたタイミングから前記読出再生手段が再生した音声データの音声と、前記音声入力手段に入力された音声とを比較して差異を求める差異取得手段と、前記差異取得手段によって求められた差異に応じて予め定められたアルゴリズムに応じた評価を行う評価手段とを有することを特徴とするコンテンツ再生装置を提供する。
また本発明は、再生時間軸に沿って記録されている映像データと、音声データと、字幕データと、前記字幕データの再生開始時刻を示す再生時刻データとを有するコンテンツを再生するコンテンツ再生装置において、前記字幕データから再生される字幕のリストを生成するリスト生成手段と、前記リスト生成手段が生成したリストを表示する表示手段と、ユーザによって操作される操作手段と、前記操作手段の操作に応じて前記表示手段に表示されている字幕を選択する選択手段と、前記映像データ、音声データおよび字幕データを読み出し、読み出した各データを再生する読出再生手段と、前記選択手段によって選択された字幕の再生開始時刻を示す再生時刻データを参照し、前記読出再生手段に対して当該再生時刻データが示すタイミングからの再生を指示する再生位置指示手段と、ユーザの音声が入力される音声入力手段と、前記再生位置指示手段によって指示されたタイミングから前記読出再生手段が再生した音声データの音声と、前記音声入力手段に入力された音声とを比較して差異を求める差異取得手段と、前記差異取得手段によって求められた差異に応じて予め定められたアルゴリズムに応じた評価を行う評価手段とを有することを特徴とするコンテンツ再生装置を提供する。
好ましい態様においては、上記コンテンツ再生装置は、前記再生位置指示手段によって前記読出再生手段への再生の指示がされた後、ユーザに発音を促す発音要求手段を備えるようにしてもよい。
本発明によれば、映画などのコンテンツを利用して語学学習ができると共に、発音の良否を学習者が確認することができる。
[第1実施形態]
(実施形態の構成)
以下、図面を参照して本発明の実施形態について説明する。図1は、本発明の実施形態に係る語学学習装置のハードウェア構成を示したブロック図である。図1に示したように、語学学習装置の各部は、バス101に接続されており、このバス101を介して各部間で信号やデータの授受を行う。
光学ドライブ部109は、デジタルデータとしてDVDに記録されているコンテンツを読み出すものである。ここで、コンテンツが映画コンテンツの場合、光学ドライブ部109はCPU102の制御の下、デジタルデータである映像データや音響データ、字幕データ等を含むパケットをDVDから読み出し、読み出したパケットを信号処理部107へ出力する。ここで、映像データや音響データ、字幕データはMPEG−2フォーマットでDVDに記録されている。信号処理部107は、光学ドライブ部109から出力されたパケットをデコードするものである。信号処理部107は、パケットに含まれている音響データをデコードし、音響データが表す音のアナログ信号(音響信号)を生成して音響再生部108と音声処理部110へ出力する。また、信号処理部107は、パケットに含まれている映像データと字幕データとをデコードし、これらのデータが示す画像の映像信号を生成して表示部106へ出力する。
音響再生部108は、アンプおよびスピーカを備えており(いずれも図示略)、信号処理部107から出力された音響信号を増幅し、音響信号が表す音をスピーカから出力する。
表示部106は、例えば、液晶ディスプレイ等の表示デバイスを備えており、信号処理部107から出力された映像信号に従って、映像や字幕を表示する。また、表示部106はCPU102の制御の下、各種メッセージや語学学習装置を操作するためのメニュー画面等を表示する。
入力部105は、図2に例示したように、ユーザの音声を電気信号に変換するマイクロホン201と、語学学習装置を操作するための各種キーとを備えている。マイクロホン201は、入力される音声に対応した電気信号(以下、音声信号と称する)を音声処理部110へ出力する。
また、入力部105は、図2に示した各種キーが押下されると、押下されたキーを示すキー信号をCPU102へ出力する。
キー210〜キー212は、DVDに記録されている映像・音声の再生、早送り、巻き戻しを行う際に使用されるキーである。キー210(プレイキー)が押下されると、CPU102により各部が制御され、DVDに記録されている映像や音声の再生が行われる。また、キー211(早送りキー)が押下されると映像や音声の早送り再生が行われ、キー212(巻き戻しキー)が押下されると映像や音声の巻き戻し再生が行われる。
キー230およびキー231は、DVDの再生のモードを切替える際に使用されるキーである。キー231(練習モードキー)は、DVDの再生モードを発音の練習を行う練習モードに移行させる際に使用され、キー230(通常再生モードキー)は、DVDの通常再生を行う通常再生モードに移行させる際に使用される。
キー221〜キー224は、ユーザが発音の練習を行う際に使用されるキーである。キー221(前文キー)およびキー222(次文キー)は、映像や字幕および音声の早送りや巻き戻しを行う際に使用される。また、キー223(再生キー)は、字幕に対応した音声が出力される場面の再生をする際に使用され、キー224(採点キー)は、字幕に対応した音声と、ユーザの音声とを比較する際に使用される。
音声処理部110は、マイクロホン201から出力された音声信号が表す音声と、信号処理部107から出力された音響信号が表す音声とを比較するものであり、比較結果をCPU102へ出力する。
ROM(Read Only Memory)103は、語学学習装置に各種機能を実現させる制御プログラムを記憶している。CPU102は、ROM103から制御プログラムを読出し、RAM(Random Access Memory)104を作業エリアとして制御プログラムを実行する。
CPU102は、一定の周期で実行するタイマー割り込み処理により、入力部105から出力されたキー信号が入力されたか否かを検知する。CPU102は、キー信号が入力されたことを割り込み処理のタイミングにおいて検知すると、入力されたキー信号に基づいて、入力部105において押下されたキーを特定し、特定したキーおよびDVDの再生のモードに応じて、図3〜図11に示した各種キーに対応した処理を実行する。
また、CPU102が制御プログラムを実行すると、DVDを再生する機能や、ユーザの音声とDVDに記録されている音声とを比較して比較結果を表示する機能等の各種機能が語学学習装置において実現する。
[実施形態の動作]
次にコンテンツ再生装置の動作について説明する。
ユーザが字幕入りの映画コンテンツが記録されたDVDを光学ドライブ部109に挿入すると、DVDの再生モードが通常再生モードとなる。ここで、ユーザがキー210(プレイキー)を押下すると、キー210が押下されたことを示すキー信号が入力部105から出力される。CPU102は、一定の周期で実行する割り込み処理により、入力部105から出力されたキー信号を検知する。そして、CPU102は、キー信号を検知すると、押下されたキーがキー210であることを入力されたキー信号に基づいて特定し、図3に示した処理を実行する。具体的には、まずCPU102は再生モードが通常再生モードであるか発音練習モードであるかを判断する。ここでCPU102は、再生モードが発音練習モードである場合には何もせず(図3:ステップSA1;NO)、再生モードが通常再生モードである場合には(ステップSA1;YES)、DVDに記録されているコンテンツ(映像や字幕および音声)の再生を行う。具体的には、CPU102によって光学ドライブ部109が制御され、映像データや音声データ、字幕データを含むパケットがDVDから読み出されて信号処理部107へ出力される。信号処理部107は、読み出されたパケットに含まれている音響データをデコードし、音響データが表す音に対応した音響信号を音響再生部108へ出力する。また、信号処理部107は、読み出されたパケットに含まれている映像データと字幕データとをデコードし、デコードされた画像を示す映像信号を表示部106へ出力する。映像信号が表示部106へ出力されると共に、音響信号が音響再生部108へ出力されると、音響データが表す音がスピーカから出力され、映像データが表す画像と字幕データが表す字幕とが表示部106に表示される。また、信号処理部107は、再生中の字幕画像と該字幕の再生開始時刻を示す時刻管理情報とをパケットから抽出し、この抽出した字幕と時刻管理情報とをRAM104に記憶する。
この後、ユーザがキー211(早送りキー)を押下し、キー211が押下されたことを示すキー信号が入力部105からCPU102に入力されると、CPU102は、押下されたキーを入力されたキー信号に基づいて特定し、図4に示した処理を実行する。まずCPU102は再生モードが通常再生モードであるか発音練習モードであるかを判断する。ここでCPU102は、再生モードが発音練習モードである場合には何もせず(図4:ステップSB1;NO)、再生モードが通常再生モードである場合には(ステップSB1;YES)、DVDに記録されているコンテンツ(映像や字幕および音声)の早送り再生を行う(ステップSB2)。
また、ユーザがキー212(巻き戻しキー)を押下し、キー212が押下されたことを示すキー信号がCPU102に入力されると、CPU102は、押下されたキーを入力されたキー信号に基づいて特定し、図5に示した処理を実行する。まず、CPU102は再生モードが通常再生モードであるか発音練習モードであるかを判断する。ここでCPU102は、再生モードが発音練習モードである場合には何もせず(図5:ステップSC1;NO)、再生モードが通常再生モードである場合には(ステップSC1;YES)、DVDに記録されているコンテンツ(映像や字幕および音声)の巻き戻し再生を行う(ステップSC2)。
ユーザは、再生されている画像を視聴し、学習したいと思うセリフの字幕が表示された場合、キー231(練習モードキー)を押下する。CPU102は、キー231が押下されると、図6に示した処理を実行する。具体的には、まず、CPU102は、DVDの再生モードが通常再生モードであるか否かを判断する。CPU102は、再生モードが通常再生モードでない場合には何もしない(図6:ステップSD1;NO)。一方、再生モードが通常再生モードである場合(ステップSD1;YES)、再生モードを通常再生モードから発音練習モードへ移行させる(ステップSD2)。そしてCPU102は、キー231が押下された時に表示されていた字幕の再生時点まで映像と字幕および音声の再生が行われるように、光学ドライブ部109と信号処理部107とを制御する。CPU102は、キー231が押下された時に表示されていた字幕の再生が終了すると、映像と字幕および音声の再生を一時停止する(ステップSD3)。ここでRAM104には、キー231が押下された時に再生されていた字幕の再生開始時刻を示す時刻管理情報が記憶される。
再生モードが発音練習モードに移行した後、ユーザがキー223(再生キー)を押下すると、CPU102は図7に示した処理を実行する。具体的には、まず、CPU102は、DVDの再生モードが発音練習モードであるか否かを判断する。CPU102は、再生モードが発音練習モードでない場合には何もしない(図7:ステップSE1;NO)。一方、再生モードが発音練習モードである場合(ステップSE1;YES)、CPU102は、RAM104に記憶されている時刻管理情報を読み出し(ステップSE2)、この時刻管理情報が示す再生開始時刻の場面から映像と字幕および音声の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSE3)。この後、CPU102は、キー231が押下された時に表示されている字幕の再生が終了すると、光学ドライブ部109と信号処理部107とを制御して、映像と字幕および音声の再生を一時停止する(ステップSE4)。これにより、ユーザは、発音練習モードにおいては練習したいセリフを繰り返し聞くことができる。
また、ユーザがキー224(採点キー)を押下すると、CPU102は図8に示した処理を実行する。具体的には、まず、CPU102は、DVDの再生モードが発音練習モードであるか否かを判断する。CPU102は、再生モードが発音練習モードでない場合には何もしない(図8:ステップSF1;NO)。一方、再生モードが発音練習モードである場合(ステップSF1;YES)、CPU102は、RAM104に記憶されている時刻管理情報を読み出し(ステップSF2)、この時刻管理情報が示す再生開始時刻の場面から映像と字幕および音声の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSF3)。ここで、音響信号は音声処理部110へも出力される。音声処理部110は、音響信号が入力されると、入力された音響信号をデジタル化し、発音の手本となる基準データとして一時記憶する。CPU102は、キー231が押下された時に表示されていた字幕の再生が終了すると、映像と字幕および音声の再生を一時停止する(ステップSF4)。
CPU102は、映像と字幕および音声の再生を一時停止させた後、表示部106を制御し、ユーザに発音を促すメッセージを表示する(ステップSF5)。このメッセージに促されてユーザが発音すると、ユーザの発した音声に対応した音声信号がマイクロホン201から音声処理部110へ出力される。音声処理部110は、マイクロホン201から出力された音声信号をデジタル化し、ユーザの発音を示すユーザデータとして一時記憶する。次に音声処理部110は、一時記憶されている基準データとユーザデータとを比較する。例えば、音声処理部110は、基準データが表す音声波形をフーリエ変換して得られた振幅スペクトルの対数を求め、それをフーリエ逆変換して手本となる音声のスペクトル包絡を得る。また、音声処理部110は、ユーザデータが表す音声波形をフーリエ変換して得られた振幅スペクトルの対数を求め、それをフーリエ逆変換してユーザの音声のスペクトル包絡を得る。
次に音声処理部110は、基準データが表す音声のスペクトル包絡と、ユーザデータが表す音声のスペクトル包絡とを比較する。そして、基準データが表す音声のスペクトル包絡と、ユーザデータが表す音声のスペクトル包絡との差異が、予め決められたしきい値を超えた場合は、ユーザの発音が悪いものと判断し、予め決められたしきい値を超えていない場合には、ユーザの発音が良いものであると判断する。そして、判断結果を示す判断データをCPU102へ出力する。なお、基準データが表す音声とユーザデータが表す音声との差異は、例えば、特徴的なフォルマントの周波数とスペクトル密度とをスペクトル密度−周波数図に表したときの2点間の距離によって求めてもよいし、特定の周波数においてスペクトル密度を比較することによって求めてもよい。
CPU102は、判断結果を示す判断データが入力されると(ステップSF6;YES)、入力された判断データに応じて基準データとユーザデータの比較結果を表示する(ステップSF7)。例えば、入力された判断データがユーザの発音が悪いことを示している場合には、CPU102は表示部106を制御して「bad」というメッセージを表示し、ユーザの発音が悪いことを示している場合には、CPU102は表示部106を制御して「good」というメッセージを表示する。ユーザは、学習したいと思うセリフを繰り返し練習する場合、再度キー224を押下する。キー224が押下されると、上述したステップSF1〜ステップSF7の処理が再度実行される。
また、ユーザがキー221(前文キー)を押下すると、CPU102は図9に示した処理を実行する。具体的には、まず、CPU102は、DVDの再生モードが発音練習モードであるか否かを判断する。CPU102は、再生モードが発音練習モードでない場合には何もしない(図9:ステップSG1;NO)。一方、再生モードが発音練習モードである場合(ステップSG1;YES)、CPU102は、RAM104に記憶されている時刻管理情報を読み出す(ステップSG2)。そして、CPU102は、RAM104から読み出した時刻管理情報が示す再生開始時刻より前に再生される字幕の時刻管理情報をDVDから抽出してRAM104に記憶する(ステップSG3)。この後、CPU102は、RAM104に記憶されている時刻管理情報を読み出し、この時刻管理情報が示す再生開始時刻の場面から映像と字幕および音声の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSG4)。CPU102は、字幕の再生が終了すると、映像と字幕および音声の再生を一時停止する(ステップSG5)。
また、ユーザがキー222(次文キー)を押下すると、CPU102は図10に示した処理を実行する。具体的には、まず、CPU102は、DVDの再生モードが発音練習モードであるか否かを判断する。CPU102は、再生モードが発音練習モードでない場合には何もしない(図10:ステップSH1;NO)。一方、再生モードが発音練習モードである場合(ステップSH1;YES)、CPU102は、RAM104に記憶されている時刻管理情報を読み出す(ステップSH2)。そして、CPU102は、RAM104から読み出した時刻管理情報が示す再生開始時刻より後に再生される字幕の時刻管理情報をDVDから抽出してRAM104に記憶する(ステップSH3)。この後、CPU102は、RAM104に記憶されている時刻管理情報を読み出し、この時刻管理情報が示す再生開始時刻の場面から映像と字幕および音声の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSH4)。CPU102は、字幕の再生が終了すると、映像と字幕および音声の再生を一時停止する(ステップSH5)。
また、ユーザがキー230(通常再生モードキー)を押下すると、CPU102は図11に示した処理を実行する。具体的には、まずCPU102は、CPU102は、DVDの再生モードが発音練習モードであるか否かを判断する。CPU102は、再生モードが発音練習モードでない場合には何もしない(ステップSJ1;NO)。一方、再生モードが発音練習モードである場合(ステップSJ1;YES)、再生モードを発音練習モードから通常再生モードへ移行させる(ステップSJ2)。そしてCPU102は、RAM104に記憶されている時刻管理情報を読み出し(ステップSJ3)、この時刻管理情報が示す再生開始時刻の場面から映画の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSJ4)。
以上説明したように本実施形態によれば、映画コンテンツに含まれている音声を手本として、ユーザの発音をチェックすることができる。また、本実施形態では、一般に市販される映画コンテンツをそのまま語学学習の教材として使用することができるため、コンテンツを楽しみつつ、語学の学習を行うことができる。また、本実施形態では、DVDに記録されている音声を発音の基準とし、記録されている音声の波形とユーザの音声の波形とを比較するので、言語解析の必要がなく、どのような言語であってもユーザの発音の良否を判断することができる。また、方言などについても練習することができる。
[第2実施形態]
(実施形態の構成)
以下、図面を参照して本発明の第2実施形態について説明する。
本実施形態に係わる語学学習装置のハードウェア構成は、第1実施形態に係わる語学学習装置と略同じとなっている。このため、ハードウェア構成に係わる説明を行う際には、図1を用いて説明を行う。
本実施形態においては、入力部の構成が第1実施形態と異なっている。図12は、本実施形態に係わる入力部105が具備するキーおよびマイクロホンの配置を例示した図である。
入力部105は、図12に例示したように、ユーザの音声を電気信号に変換するマイクロホン201と、語学学習装置を操作するための各種キーとを備えている。マイクロホン201は、入力される音声に対応した電気信号(以下、音声信号と称する)を音声処理部110へ出力する。
キー210〜キー212は、DVDに記録されている映像・音声の再生、早送り、巻き戻しを行う際に使用されるキーであり、キー220〜キー214は、DVDに記録されている字幕のリストの表示や、表示されたリスト中の字幕の選択を行う際に使用されるキーである。キー210(プレイキー)が押下されると、CPU102により各部が制御され、DVDに記録されている映像や音声の再生が行われる。また、キー211(早送りキー)が押下されると映像や音声の早送り再生が行われ、キー212(巻き戻しキー)が押下されると映像や音声の巻き戻し再生が行われる。キー220(リスト表示キー)は、DVDに記録されている字幕のリストを表示部106に表示させる際に使用されるキーである。また、キー221(前文キー)およびキー222(次文キー)は、字幕のリストに表示された字幕の選択を行う際に使用されるキーである。キー223(再生キー)は、キー221,222によって選択された字幕が発音される場面を再生させる際に使用されるキーであり、キー224(採点キー)は、選択された字幕に対応した音声と、ユーザの音声とを比較する際に使用されるキーである。
ROM(Read Only Memory)103は、語学学習装置に各種機能を実現させる制御プログラムを記憶している。CPU102は、ROM103から制御プログラムを読出し、RAM(Random Access Memory)104を作業エリアとして制御プログラムを実行する。CPU102が制御プログラムを実行すると、DVDを再生する機能や、DVDに記録されている字幕のリストを表示する機能、ユーザの音声とDVDに記録されている音声とを比較して比較結果を表示する機能等の各種機能が実現する。
(実施形態の動作)
次に、語学学習装置の動作について説明する。
字幕入りの映画コンテンツが記録されたDVDが光学ドライブ部109に挿入されると、CPU102によって光学ドライブ部109が制御され、映像データや音声データ、字幕データを含むパケットがDVDから読み出されて信号処理部107へ出力される。信号処理部107は、光学ドライブ部109から出力されたパケットをデコードし、字幕と字幕の再生時刻を示す時刻管理情報とをパケットから抽出する。この抽出された字幕は時刻管理情報に対応付けされ、字幕が再生される順番に従って、例えば図18に示したようにRAM104に記憶される。
次にユーザがキー220(リスト表示キー)を押下すると、CPU102はRAM104に記憶された字幕を読み出し(図13:ステップSK1)、RAM104に記憶された字幕のリスト(図19参照)が表示されるように表示部106を制御する(ステップSK2)。
ユーザは、字幕のリストが表示された後、キー221(前文キー)またはキー222(次文キー)を使用して字幕を選択する。キー221が押下されると、CPU102は、図14に示した処理を実行する。具体的には、まずCPU102は、字幕のリストが表示中であるか否かを判断する。CPU102は、字幕のリストが表示されていない場合には(図14:ステップSL1;NO)、何もしない。一方、字幕のリストが表示されている場合には(ステップSL1;YES)、リスト中のカーソルCを上方へ移動させる(ステップSL2)。
一方、CPU102はキー222が押下されると、図15に示した処理を実行する。具体的には、まずCPU102は、字幕のリストが表示中であるか否かを判断する。CPU102は、字幕のリストが表示されていない場合には(図15:ステップSM1;NO)、何もしない。一方、字幕のリストが表示されている場合には(ステップSM1;YES)、リスト中のカーソルCを下方へ移動させる(ステップSM2)。
次にユーザは字幕の発音を確認したい場合、発音を確認したい字幕の位置へカーソルCを移動させた後、キー223(再生キー)を押下する。キー223が押下されると、CPU102は、図16に示した処理を実行する。具体的には、まずCPU102は、字幕のリストが表示中であるか否かを判断する。CPU102は、字幕のリストが表示されていない場合には(図16:ステップSN1;NO)、何もしない。一方、字幕のリストが表示されている場合には(ステップSN1;YES)、字幕リスト中においてカーソルCがある位置の字幕を特定し(ステップSN2)、この特定した字幕をRAM104に格納されている字幕の中から検索する。CPU102は、特定した字幕と同じ字幕を見つけると、見つけた字幕に対応付けて格納されている時刻管理情報を読み出す(ステップSN3)。次にCPU102は、この時刻管理情報が示す再生時刻の場面から映画の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSN4)。光学ドライブ部109が制御され、映像データや音声データ、字幕データを含むパケットが読み出されると、読み出されたパケットが信号処理部107へ出力される。信号処理部107では、読み出されたパケットに含まれている音響データがデコードされ、音響データが表す音に対応した音響信号が音響再生部108へ出力される。また、読み出されたパケットに含まれている映像データと字幕データとがデコードされ、デコードされた画像を示す映像信号が表示部106へ出力される。映像信号が表示部106へ出力されると共に、音響信号が音響再生部108へ出力されると、音響データが表す音がスピーカから出力されると共に、映像データが表す画像と字幕データが表す字幕とが表示部106に表示され、選択された字幕が再生される場面から、映像および音声の再生が行われる。CPU102は、選択された字幕の再生が終了すると、映像と字幕および音声の再生を一時停止する(ステップSN5)。
次に、選択された字幕に対応した音声と、字幕のセンテンスを発音した時のユーザの音声とを比較する時の動作について説明する。上述したように、DVDを光学ドライブ部109に挿入した後、ユーザがキー220を押下すると、DVDに記録されている字幕のリストが表示される。ユーザは選択した字幕に対応した音声と、字幕のセンテンスを発音した時の音声とを比較したい場合、キー224(採点キー)を押下する。
キー224が押下されると、CPU102は、図17に示した処理を実行する。具体的には、まずCPU102は、字幕のリストが表示中であるか否かを判断する。CPU102は、字幕のリストが表示されていない場合には(図17:ステップSP1;NO)、何もしない。一方、字幕のリストが表示されている場合には(ステップSP1;YES)、CPU102は字幕リスト中においてカーソルCがある位置の字幕を特定し(ステップSP2)、この特定した字幕をRAM104に格納されている字幕の中から検索する。CPU102は、特定した字幕と同じ字幕を見つけると、見つけた字幕に対応付けて格納されている時刻管理情報を読み出す(ステップSP3)。
次にCPU102は、この時刻管理情報が示す再生時刻の場面から映画の再生が行われるように、光学ドライブ部109および信号処理部107を制御する(ステップSP4)。これにより、選択された字幕が再生される場面から、映像および音声の再生が行われる。なお、ここで、信号処理部107から出力される音響信号は音声処理部110へも出力される。音声処理部110は、音響信号が入力されると、入力された音響信号をデジタル化し、発音の手本となる基準データとして一時記憶する。次に、CPU102は、光学ドライブ部109と信号処理部107とを制御し、選択された字幕の再生が終了すると、再生を一時停止する(ステップSP5)。この後、CPU102は、表示部106を制御し、発音を促すメッセージを表示する(ステップSP6)。
次にユーザが再生された音声を真似て、選択した字幕のセンテンスをマイクロホン201に向かって発音すると、ユーザの発した音声に対応した音声信号がマイクロホン201から音声処理部110へ出力される。音声処理部110は、マイクロホン201から出力された音声信号をデジタル化し、ユーザの発音を示すユーザデータとして一時記憶する。次に音声処理部110は、一時記憶されている基準データとユーザデータとを比較する。例えば、音声処理部110は、基準データが表す音声波形をフーリエ変換して得られた振幅スペクトルの対数を求め、それをフーリエ逆変換して手本となる音声のスペクトル包絡を得る。また、音声処理部110は、ユーザデータが表す音声波形をフーリエ変換して得られた振幅スペクトルの対数を求め、それをフーリエ逆変換してユーザの音声のスペクトル包絡を得る。
次に音声処理部110は、基準データが表す音声のスペクトル包絡と、ユーザデータが表す音声のスペクトル包絡とを比較する。そして、基準データが表す音声のスペクトル包絡と、ユーザデータが表す音声のスペクトル包絡との差異が、予め決められたしきい値を超えた場合は、ユーザの発音が悪いものと判断し、予め決められたしきい値を超えていない場合には、ユーザの発音が良いものであると判断する。そして、判断結果を示す判断データをCPU102へ出力する。なお、基準データが表す音声とユーザデータが表す音声との差異は、例えば、特徴的なフォルマントの周波数とスペクトル密度とをスペクトル密度−周波数図に表したときの2点間の距離によって求めてもよいし、特定の周波数においてスペクトル密度を比較することによって求めてもよい。
CPU102は、判断結果を示す判断データが入力されると(ステップSP7;YES)、入力された判断データに応じて基準データとユーザデータの比較結果を表示する(ステップSP8)。例えば、入力された判断データがユーザの発音が悪いことを示している場合には、CPU102は表示部106を制御して「bad」というメッセージを表示し、ユーザの発音が悪いことを示している場合には、CPU102は表示部106を制御して「good」というメッセージを表示する。
以上説明したように本実施形態によれば、映画コンテンツに含まれている音声を手本として、ユーザの発音をチェックすることができる。また、本実施形態では、一般に市販される映画コンテンツをそのまま語学学習の教材として使用することができるため、コンテンツを楽しみつつ、語学の学習を行うことができる。また、本実施形態では、DVDに記録されている音声を発音の基準とし、記録されている音声とユーザの音声とを比較するので、どのような言語であってもユーザの発音の良否を判断することができる。
[変形例]
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、以下のように、他の様々な形態で実施可能である。
上述した実施形態においては、基準データとユーザデータの比較の際、基準データが表す音声と、ユーザデータが表す音声とを交互に再生するようにしてもよい。また、ユーザデータが表す音声を再生する際には、発音に問題がある箇所を特定し、問題のある発音の前後に無音区間を挿入したり、問題のある発音の部分のピッチを変えたりして、問題のある発音をユーザが認識できるようにしてもよい。
上述した実施形態においては、音声処理部110の機能をソフトウェアにより実現するようにしてもよい。近年のパーソナルコンピュータ装置は、音声信号を入力してデジタルデータに変換することや、DVDの再生をすることが可能である。このため、音声処理部110の機能、即ち、DVDから読み出された音声データが示す音声のスペクトル包絡と、ユーザの音声のスペクトル包絡とを比較し、スペクトル包絡との差異を求める機能をソフトウェアにより実現するようにすれば、パーソナルコンピュータ装置によって語学学習を行うことが可能となる。
上述した実施形態は、映画コンテンツがDVDに記録されている場合を想定しているが、語学学習装置に通信機能を持たせ、通信ネットワークを介してサーバ装置から映像コンテンツを取得するようにしてもよい。
また、上述した実施形態においては、語学学習装置は、DVD以外の光ディスク媒体や、磁気記録媒体等、DVDだけでなく様々な記録媒体から映画コンテンツを読み出して再生するようにしてもよい。
また、上述した実施形態においては、サーバ装置がコンテンツを端末装置へ提供し、端末装置において、セリフの選択および音声の入力を行い、選択されたセリフと、入力された音声との比較・評価をサーバ装置において行うようにしてもよい。
上述した実施形態においては、キー224が押下された際、選択された字幕が再生される場面の音声を再生しているが、音声は再生しないようにしてもよい。また、上述した実施形態においては、ユーザの音声が入力された後に、選択された字幕が再生される場面の音声を再生するようにしてもよい。
上述した実施形態においては、語学学習装置は、表示部106を一体化して備えるのではなく、別体で後付けできるようにしてもよい。
上述した実施形態においては、CPU102が実行するプログラム、即ち、コンピュータを、再生時間軸に沿って記録されている映像データと、音声データと、字幕データと、前記字幕データの再生開始時刻を示す再生時刻データとを有するコンテンツを再生するコンテンツ再生装置として機能させるプログラムであって、コンピュータを、前記映像データ、音声データおよび字幕データを前記再生時間軸に沿って読み出し、読み出した各データを再生する読出再生手段と、ユーザによって操作される操作手段と、前記操作手段が操作されたときに前記読出再生手段によって再生されている字幕データの再生開始時刻を示す再生時刻データを参照し、前記読出再生手段に対して当該時刻データが示すタイミングからの再生を指示する再生位置指示手段と、ユーザの音声が入力される音声入力手段と、前記再生位置指示手段によって指示されたタイミングから前記読出再生手段が再生した音声データの音声と、前記音声入力手段に入力された音声とを比較して差異を求める差異取得手段と、前記差異取得手段によって求められた差異に応じて予め定められたアルゴリズムに応じた評価を行う評価手段として機能させるプログラムをサーバ装置からダウンロードしてROM103に記憶させるようにしてもよい。
また、コンピュータを、再生時間軸に沿って記録されている映像データと、音声データと、字幕データと、前記字幕データの再生開始時刻を示す再生時刻データとを有するコンテンツを再生するコンテンツ再生装置として機能させるプログラムであって、コンピュータを、前記字幕データから再生される字幕のリストを生成するリスト生成手段と、前記リスト生成手段が生成したリストを表示する表示手段と、ユーザによって操作される操作手段と、前記操作手段の操作に応じて前記表示手段に表示されている字幕を選択する選択手段と、前記映像データ、音声データおよび字幕データを読み出し、読み出した各データを再生する読出再生手段と、前記選択手段によって選択された字幕の再生開始時刻を示す再生時刻データを参照し、前記読出再生手段に対して当該再生時刻データが示すタイミングからの再生を指示する再生位置指示手段と、ユーザの音声が入力される音声入力手段と、前記再生位置指示手段によって指示されたタイミングから前記読出再生手段が再生した音声データの音声と、前記音声入力手段に入力された音声とを比較して差異を求める差異取得手段と、前記差異取得手段によって求められた差異に応じて予め定められたアルゴリズムに応じた評価を行う評価手段として機能させるプログラムをサーバ装置からダウンロードしてROM103に記憶させるようにしてもよい。
上述した実施形態においては、入力された音声とDVDに記録されている音声との差異に基づいて、入力された音声を、予め定めた評価用のアルゴリズムに従って点数化し、この点数を表示するようにしてもよい。
上述した実施形態においては、データを永続的に記憶する記憶部を設け、練習したセリフの再生開始時刻を示す時刻管理情報を記憶部に記憶させるようにしてもよい。
また、記憶した時刻管理情報をリスト化して表示するようにしてもよい。また、リストに表示された再生開始時刻を選択し、選択した再生開始時刻に再生されるセリフについて再練習を行うようにしてもよい。また、記録した時刻管理情報が表す場面のみをつないでコンテンツを再生するようにしてもよい。
本発明の実施形態に係る語学学習装置のハードウェ構成を示すブロック図である。 同語学学習装置の入力部105が備えるマイクロホンとキーの配置を例示した図である。 キー210が押下された時の処理の流れを示したフローチャートである。 キー211が押下された時の処理の流れを示したフローチャートである。 キー212が押下された時の処理の流れを示したフローチャートである。 キー231が押下された時の処理の流れを示したフローチャートである。 キー223が押下された時の処理の流れを示したフローチャートである。 キー224が押下された時の処理の流れを示したフローチャートである。 キー221が押下された時の処理の流れを示したフローチャートである。 キー222が押下された時の処理の流れを示したフローチャートである。 キー230が押下された時の処理の流れを示したフローチャートである。 第2実施形態に係わる入力部105が備えるマイクロホンとキーの配置を例示した図である。 第2実施形態においてキー220が押下された時の処理の流れを示したフローチャートである。 第2実施形態においてキー221が押下された時の処理の流れを示したフローチャートである。 第2実施形態においてキー222が押下された時の処理の流れを示したフローチャートである。 第2実施形態においてキー223が押下された時の処理の流れを示したフローチャートである。 第2実施形態においてキー224が押下された時の処理の流れを示したフローチャートである。 第2実施形態においてRAM104に記憶された字幕と時刻管理情報とを例示した図である。 第2実施形態において表示部106に表示される字幕のリストを例示した図である。
符号の説明
102・・・CPU、103・・・ROM、104・・・RAM、105・・・入力部、106・・・表示部、107・・・信号処理部、108・・・音響再生部、109・・・光学ドライブ部、110・・・音声処理部、201・・・マイクロホン。

Claims (3)

  1. 再生時間軸に沿って記録されている映像データと、音声データと、字幕データと、前記字幕データの再生開始時刻を示す再生時刻データとを有するコンテンツを再生するコンテンツ再生装置において、
    前記映像データ、音声データおよび字幕データを前記再生時間軸に沿って読み出し、読み出した各データを再生する読出再生手段と、
    ユーザによって操作される操作手段と、
    前記操作手段が操作されたときに前記読出再生手段によって再生されている字幕データの再生開始時刻を示す再生時刻データを参照し、前記読出再生手段に対して当該時刻データが示すタイミングからの再生を指示する再生位置指示手段と、
    ユーザの音声が入力される音声入力手段と、
    前記再生位置指示手段によって指示されたタイミングから前記読出再生手段が再生した音声データの音声と、前記音声入力手段に入力された音声とを比較して差異を求める差異取得手段と、
    前記差異取得手段によって求められた差異に応じて予め定められたアルゴリズムに応じた評価を行う評価手段と
    を有することを特徴とするコンテンツ再生装置。
  2. 再生時間軸に沿って記録されている映像データと、音声データと、字幕データと、前記字幕データの再生開始時刻を示す再生時刻データとを有するコンテンツを再生するコンテンツ再生装置において、
    前記字幕データから再生される字幕のリストを生成するリスト生成手段と、
    前記リスト生成手段が生成したリストを表示する表示手段と、
    ユーザによって操作される操作手段と、
    前記操作手段の操作に応じて前記表示手段に表示されている字幕を選択する選択手段と、
    前記映像データ、音声データおよび字幕データを読み出し、読み出した各データを再生する読出再生手段と、
    前記選択手段によって選択された字幕の再生開始時刻を示す再生時刻データを参照し、前記読出再生手段に対して当該再生時刻データが示すタイミングからの再生を指示する再生位置指示手段と、
    ユーザの音声が入力される音声入力手段と、
    前記再生位置指示手段によって指示されたタイミングから前記読出再生手段が再生した音声データの音声と、前記音声入力手段に入力された音声とを比較して差異を求める差異取得手段と、
    前記差異取得手段によって求められた差異に応じて予め定められたアルゴリズムに応じた評価を行う評価手段と
    を有することを特徴とするコンテンツ再生装置。
  3. 前記再生位置指示手段によって前記読出再生手段への再生の指示がされた後、ユーザに発音を促す発音要求手段を備えることを特徴とする請求項1または請求項2に記載のコンテンツ再生装置。
JP2005359498A 2005-12-13 2005-12-13 コンテンツ再生装置 Withdrawn JP2007163801A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005359498A JP2007163801A (ja) 2005-12-13 2005-12-13 コンテンツ再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005359498A JP2007163801A (ja) 2005-12-13 2005-12-13 コンテンツ再生装置

Publications (1)

Publication Number Publication Date
JP2007163801A true JP2007163801A (ja) 2007-06-28

Family

ID=38246759

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005359498A Withdrawn JP2007163801A (ja) 2005-12-13 2005-12-13 コンテンツ再生装置

Country Status (1)

Country Link
JP (1) JP2007163801A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013037251A (ja) * 2011-08-10 2013-02-21 Casio Comput Co Ltd 音声学習装置及び音声学習プログラム
JP2016048390A (ja) * 2015-11-18 2016-04-07 カシオ計算機株式会社 情報表示装置及び情報表示プログラム
JP2022125393A (ja) * 2021-02-17 2022-08-29 ゲシピ株式会社 言語学習装置及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013037251A (ja) * 2011-08-10 2013-02-21 Casio Comput Co Ltd 音声学習装置及び音声学習プログラム
US9483953B2 (en) 2011-08-10 2016-11-01 Casio Computer Co., Ltd. Voice learning apparatus, voice learning method, and storage medium storing voice learning program
JP2016048390A (ja) * 2015-11-18 2016-04-07 カシオ計算機株式会社 情報表示装置及び情報表示プログラム
JP2022125393A (ja) * 2021-02-17 2022-08-29 ゲシピ株式会社 言語学習装置及びプログラム
JP7452867B2 (ja) 2021-02-17 2024-03-19 ゲシピ株式会社 言語学習装置及びプログラム

Similar Documents

Publication Publication Date Title
JP4946874B2 (ja) 再生装置および再生方法
JP2008546016A (ja) マルチメディア信号で自動的なダビングを実行する方法及び装置
JPWO2009025155A1 (ja) 音声再生方法、音声再生装置およびコンピュータ・プログラム
US20080113326A1 (en) Encoding and Decoding System for Making and Using Interactive Language Training and Entertainment Materials
JP2010283605A (ja) 映像処理装置及び方法
JP2007264569A (ja) 検索装置、制御方法及びプログラム
JP2007163801A (ja) コンテンツ再生装置
JP2006133521A (ja) 語学学習機
JP2005321706A (ja) 電子書籍の再生方法及びその装置
JP2007149163A (ja) コンテンツ再生装置
JP4543298B2 (ja) 再生装置および方法、記録媒体、並びにプログラム
KR100242337B1 (ko) 기록매체를 이용한 어학 학습 장치 및 재생방법
JP2006023758A (ja) 発音評価装置
JP4048651B2 (ja) 発音採点装置
JP2007174074A (ja) 再生装置
JP2010107926A (ja) 語学ヒアリング能力およびシャドーイング能力を向上させる学習教材及びその作成方法
JP2006048073A (ja) 発音評価装置
JP4581052B2 (ja) 録音再生装置、録音再生方法、およびプログラム
JP3978465B2 (ja) 録音再生装置
JP2005352330A (ja) 音声分割記録装置
JP2873830B2 (ja) 自動会話練習装置
KR20150055921A (ko) 동영상 재생 제어 방법 및 장치
JP7288530B1 (ja) システムおよびプログラム
KR20110020128A (ko) 멀티미디어 재생기 콘텐츠 재생방법 및 멀티미디어 재생기기
JP2001312288A (ja) 音楽データ処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081120

A761 Written withdrawal of application

Effective date: 20090128

Free format text: JAPANESE INTERMEDIATE CODE: A761