JP2008299032A - 語学教材および文字データ再生装置 - Google Patents
語学教材および文字データ再生装置 Download PDFInfo
- Publication number
- JP2008299032A JP2008299032A JP2007144457A JP2007144457A JP2008299032A JP 2008299032 A JP2008299032 A JP 2008299032A JP 2007144457 A JP2007144457 A JP 2007144457A JP 2007144457 A JP2007144457 A JP 2007144457A JP 2008299032 A JP2008299032 A JP 2008299032A
- Authority
- JP
- Japan
- Prior art keywords
- data
- character data
- character
- signal
- foreign language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
【課題】 英会話の英単語を埋め込んだ英会話音声信号から、文字データ再生装置を文字データ再生装置として使い利用者の語学力に合わせて早出し又は遅早出し表示する語学教材を提供する。
【解決手段】 音楽媒体としては、音楽データと文字データとを記録し、前記音楽データと文字データとは同時に再生可能となるように音楽データに文字データを埋め込んだ複合音響信号として記録され、且つこの複合音響信号には音楽データと文字データとを相対的に同期させて再生する相対位置同期信号が含まれているようにした。再生時には、前記相対位置同期信号を使って、英会話教師が発音するタイミングと同時だけでなく、選択により早出し又は遅早出し表示することにより初心者から上級者まで同じ複合音響信号で語学が学べるようにした。
【選択図】 図3
【解決手段】 音楽媒体としては、音楽データと文字データとを記録し、前記音楽データと文字データとは同時に再生可能となるように音楽データに文字データを埋め込んだ複合音響信号として記録され、且つこの複合音響信号には音楽データと文字データとを相対的に同期させて再生する相対位置同期信号が含まれているようにした。再生時には、前記相対位置同期信号を使って、英会話教師が発音するタイミングと同時だけでなく、選択により早出し又は遅早出し表示することにより初心者から上級者まで同じ複合音響信号で語学が学べるようにした。
【選択図】 図3
Description
本発明は、外国語音声データ、この外国語音声データの文字データ、これら外国語音声データと文字データとの相対位置同期信号が含まれる前記複合音響信号を使うことにより文字データ表示と発音を相対的に同期させて画面表示する語学教材および文字データ再生装置に関する。
語学を学習する者にとって、授業中に先生の発音を全員でリピートしたりする時、注意力が鈍ると教科書のどのセンテンスを読んでいるのかわからなくなってしまうことがある。もしモニターテレビなどのディスプレイに読んでいる文章が表示され、今読んでいる単語だけ色が変わったりする教材があれば便利であるが、これとても前記モニターテレビの遠くに座っている人にとってはあまり役に経たないことがある。
特許文献1(段落0040)には、オーディオ信号を記録したオーディオトラックと、音源を駆動するための演奏データを前記オーディオ信号と同期して記録した演奏データトラックとを備えたオーディオメディアについて開示されている。
特許文献2(段落0030)には、電子透かし技術を利用して、文字データ再生装置にラジオやTVで流されている音楽の曲名、演奏者名等を表示する内容が開示されている。
特許文献3には、インターネットにアクセス可能な文字データ再生装置を用いた学習方法において、学習情報提供者により作成された学習スケジュール情報および該学習に係わる文字情報および音声情報を上記インターネット上のサーバーに予め登録し、上記学習スケジュール情報に基づき上記学習に係わる文字情報を上記サーバーのアクセス番号とともにメールとして学習対象者の携帯する文字データ再生装置へ定期的に配信し、上記学習対象者は、上記文字データ再生装置へ配信されたメールに含まれるアクセス番号に基づき上記サーバーにアクセスすることにより上記文字情報に対応する音声情報を取得する文字データ再生装置を用いた学習方法が開示されている。
特許文献4には、プラグインである動画再生部と文字表示部が組み込まれた端末のブラウザを使い、事業者システムは、ユーザの端末に英会話学習用のコンテンツを配信する。動画再生部は、事業者システムが配信する動画を英会話音声と共にストリーミング再生するモジュールであり、文字表示部は、動画が再生されている場面の会話例を文字で表示すると共に、文字表示部が事業者システムからダウンロードしたプログラムにより、動画で発話されている部分を動画の文字表示部に、動画再生部からコールバック関数で取得したポジションとステイタスを用いることにより同期させてハイライト表示する技術が開示されている。
特許文献1には、演奏データトラックや歌詞表示データトラックはPCM録音のオーディオトラックに対して、いわゆる電子透かしの技術で埋め込むようにしてもよいと記載されているが、演奏データのトラック番号に歌詞表示データを紐付けした構成であり、絶対番地によるポジション情報しか存在しない。したがって、この技術を外国語の学習などに応用したとしても、外国語の音声データ(演奏データに相当)とその文字データ(歌詞データ)とがずれることなく再生され、外国語学習の効率は従来と変わらない。
特許文献2には、電子音楽配信システムにおいて、曲情報埋め込み手段によって曲名、演奏者名、各コンテンツを識別するための曲ID等の曲情報を電子透かしとしてコンテンツの音声信号自体に埋め込む記載があるだけで、流れる音声の中の特定フレーズ/単語部分と表示される前記特定フレーズ/単語部分の文字情報との時間的な関係についての考慮は何らなされていない。したがって、この技術を外国語の学習などに応用したとしても、せいぜい今しゃべっている会話の表題程度を表示することになるので、外国語の学習には役立たない。
特許文献3で開示されている文字データ再生装置を用いた学習方法においては、WWWサーバーから各顧客の携帯する文字データ再生装置に、各顧客別に設定登録された内容の有用な英会話表現を表す英文(文字情報)を含むレッスン情報を定期的に配信し、各顧客がこのレッスン情報に応答して、このレッスン情報に含まれるアクセス番号を各文字データ再生装置から入力することで、WWWサーバーから前記英文(文字情報)に対応する該英文の発音を示す音声情報を取得することが出来るが、文字データ再生装置の台数が増えると管理が大変になることと、文字データ再生装置を使う人が局地的に数多く存在した場合に、電波が使えなって学習に支障を来す可能性があり、安価で安定的に質の高い学習環境を提供することが難しい。
また、特許文献3では英文(文字情報)と発音(音声情報)を単なる再生の対象として捉えてるだけで、学習させる上での別々の要素と考えておらず、これらをどのようなタイミングで学習する者に提供すべきかなどについては何ら考慮されていない。
また、特許文献3では英文(文字情報)と発音(音声情報)を単なる再生の対象として捉えてるだけで、学習させる上での別々の要素と考えておらず、これらをどのようなタイミングで学習する者に提供すべきかなどについては何ら考慮されていない。
特許文献4には、タイムコードを動画と文字の共通の位置情報として管理する手法が開示されているが、図13の説明にあるように、文字情報は英語と日本語の両方の文字データを含むスクリプト再生プログラムを一括ダウンロードする必要があるので例えば一般的な文字データ再生装置のワーキングメモリーRAM容量では不十分であり、また米国リアルネットワーク社製のReal Player(登録商標)を使って動画を再生し、米国マクロメディア社が開発したShock Wave(登録商標)を使ってスクリプト再生プログラムを構成する記載があるがこれも文字データ再生装置のCPUで動作させるには能力を超えてしまい、結果的に高額なシステムとなってしまうので、安価かつ安定的に質の高い学習環境を提供することが難しい。
上記のいずれの特許文献においても、外国語の音声データとその文字データとを、互いに関連づけて再生を制御する点についての開示がない。そこで本発明に係る語学教材においては、音声再生装置によって再生される複合音響信号が記録された本発明の語学教材の前記複合音響信号に外国語音声データと、この外国語音声データの文字データと、前記外国語音声データに対してその文字データを時間的にずらして再生するための相対位置同期信号とを含むようにした。これにより、前記外国語音声データと文字データを任意の相対的なタイミング、例えば英会話の特定発音部分に同期させた前出し/後出しといった文字データのタイミングで再生できるようになる。
また、本発明に係る音声再生装置から出力される複合音響信号に含まれる文字データを再生する文字データ再生装置は、前記複合音響信号には外国語音声データ、この外国語音声データの文字データ、前記外国語音声データに対してその文字データを時間的にずらして再生するための相対位置同期信号が含まれ、前記文字データ再生装置は前記複合音響信号中の文字データと相対位置同期信号を蓄積するメモリーを備え、前記外国語音声データの相対位置同期信号と前記文字データの相対位置同期信号を比較することにより前記文字データを前記音声データに対して設定した時間または語数だけ先または後に表示するようにした。
更に上記の文字データ再生装置においては、音声再生装置の再生速度を変化させた時に、再生速度だけ変化させる音声ピッチコントロールを使って再生すること、前記文字データ再生装置に文字データ再生装置を使うことも考えられる。
本発明による語学教材は、外国語音声データに対してその文字データを時間的にずらして再生するための相対位置同期信号を使うことにより、モノラル音声データに文字データを埋め込んだモノラルの複合音響信号が音波として空気中を伝搬させ、これを文字データ再生装置のマイクロフォンで受け取り再生することにより、正確に発音される単語の文字表示と聞こえる音声の同期が取れ、前記音声を実際の発音に対して既定時間又は既定単語数だけ早く表示させることが出来るので、初級の学習者の学習に使う場合、あらかじめ単語を認識してから先生の発音を聞くことが出来るので理解が早くなる効果が期待出来る。
また、本発明による文字データ再生装置は、前記とは逆に、前記文字表示を学習者が耳で聞く発音に対して既定時間又は既定単語数だけ遅く表示させることが出来るので、上級の学習者の学習に使う場合、あらかじめ先生の単語を聞いてから単語を確認出来るので、単語を誤認した場合のフォローアップが出来て、学習効果が上がる効果が期待出来る。
前記の文字データ再生装置においては、例えば、安価なモノラルスピーカーでしか再生できないAMラジオを通じて提供される語学講座において、当該ラジオから提供されるモノラル音声に予め音響透かしによって文字データを重畳しておき、表示手段を持つ安価な複合音響信号再生装置を用意すれば、ラジオを通して聞こえる外人講師の発音する単語が前記表示手段によって視覚的に同期をとりながら文字データ再生装置で実際に発音される文字を確認出来るので、従来のように「では何頁の何行目から読みますからテキストを見て後について発音して下さい。」といった漫然と音声とテキストだけを使う場合と比較して語学習得レベルの向上が期待できる。
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明するが、同一機能を有するものは同一の符号とし、その繰り返しの説明は省略する。
図1は、本発明に係る吹き込みシステムの概要図である。吹き込み者1は、マイクロフォン2に向かって文章3を吹き込んでいる。文章の番号は再生時の画面番号を表していて、吹き込み者1は、各画面番号に相当する単語を読む時にタイミングボタン4を押すことにより、相対位置同期信号発生装置5から相対位置同期信号を発生させ、マイクロフォン2からの音声信号を拡声装置6で適宜のレベルに拡声して記録装置7において前記相対位置同期信号と音声信号を合成して複合音響信号8を生成する。
ここで、前記記録装置7は、例えば埋め込み信号生成部、埋め込み処理部および文字データ再生装置における埋め込み信号検出部で構成されることが考えられ、これは、例えば特開2006−251676号公報に記載の「音響信号に電子透かし情報を埋め込む前記電子透かし埋込装置において、前記音響信号を帯域通過フィルタ群によって帯域分割したときの対となる隣接する帯域通過信号にそれぞれ逆位相の振幅変調を与えて、その連続的な変化の中および他の離れた帯域に与える振幅変調との位相差および変調強度差の中、および時間的に離れた区間に与える振幅変調の位相差および変調強度差の中に前記電子透かし情報を埋め込む手段と、あらかじめ前記帯域通過信号に含まれている振幅変動量と前記帯域通過信号の強度とを元に知覚されにくい振幅変調強度を決定するための手段と、付与する振幅変調の帯域間位相差に電子透かし抽出時の鍵となる位相差を与える手段と、電子透かしの埋め込まれた帯域通過信号およびそうでない帯域通過信号の全てを加算することによって電子透かし情報の埋め込まれた音響信号を出力する手段とを具備する電子透かし埋込装置」などを用いれば容易に実現できる。
図2は、複合音声信号に含まれる複合音声信号のデータフレーム構造を図示したものである。前記複合音声信号8bには外国語音声データ、この外国語音声データの文字データ、及びこれら外国語音声データと文字データとのIDデータが含まれる。ここで、IDデータとは前記外国語音声データに対してその文字データを時間的にずらして再生するための同期信号を意味する。
このデータフレーム構造9は、プリアンプル部10、SFD部11、宛先データ部12、送信元データ部13、タイプデータ部14、本文データ部15、エラー検出部16の7つの部分に分かれている。以下に、それぞれのデータについて個別説明をする。
最初のプリアンプル部10は、同期のための信号で、イーサネット(登録商標)においてフレームの先頭を意味するポイントとして使われているプリアンプルと同じ役割を持っている。
次のSFD部11は、これ以降に宛先アドレスが開始されることを通知するフレームである。このフレームは、イーサネット(登録商標)などでも使われているSFDフィールドと同じものが使える。この場合は、送信先アドレス部の開始を示す1オクテット(8ビット)長のフィールドとなり、パターン例としては“10101011”などが使われ、簡易的には、オクテットパターンの検出ではなく、最後の連続した“1”の検出でその代用とすることも可能である。
宛先データ部12は、例えば、イーサネット(登録商標)に準拠して6バイト(48ビット)の領域とすることが考えられる。これはイーサネット(登録商標)ではMACアドレスと呼ばれるアドレス表記と同じものが使え,イーサネット(登録商標)においては固定的に割り当てられている固有の番号であり、本発明においてもイーサネット(登録商標)に準拠して番号管理をしている。
送付先データ部13も、宛先データと同様に、イーサネット(登録商標)に準拠して6バイト(48ビット)のMACアドレスを使うことも可能であるし、また後続のデータを暗号化する場合の秘密鍵を格納しても良い。
次のタイプデータ部14は2バイトのデータで構成されている。イーサネット(登録商標)のDIX規格では,そのフレーム内に格納しているデータの種別を指定していて、例えば,IPv4やUPv6、AppleTalk,IPXなどを伝えるビット列(コード)が入り、IEEE802.3規格のフレームではデータ部分の長さに関する情報が入るが、本発明の複合音響信号においては、暗号の有無や秘密鍵の数などを既定する目的で使っている。
本実施例のように、文字データ再生装置を用いて英単語表示サービスを提供するためには、文字データ再生装置からサービス利用の手続きを行う必要がある。この場合には、複合音響信号に埋め込まれた情報を復号化するために復号鍵が必要であり、この復号鍵は文字データ再生装置にあらかじめ入力しておく必要がある。
この復号鍵の提示端末への通知には、既存の鍵暗号化システムを用いて、暗号化復号鍵情報として通知することができる。また、異なる復号鍵によって異なる情報を同一の音響信号に同時に埋め込むことも可能であり、利用者の必要な情報に応じて、その情報を復号化する鍵を通知することとする。
前記復号鍵を複数使用することにより、複合音響信号中に複数のデータを入れることが考えられる。これは、例えば、音声で発音している英単語のスペリングと、その日本語訳といったものが考えられ、利用者が再生装置の表示ボタンを切り替えるだけで、簡単に使用する秘密鍵の変更が可能なので、学習効果を高めることが出来る。
次の本文データ部15の部分が,実際にやりとりするデータを格納する領域である。この領域は可変長となっており,例えば、最小は46バイトで最大は1500バイトとすることが考えられる。イーサネット(登録商標)と同様に、TCPやIPで使うヘッダー部分があれば、該部分もこの本文データ部15に含まれる。
本発明においては、スピーカーから流れる複合音響信号には外国語音声データ、この外国語音声データの文字データ、及びこれら外国語音声データと文字データとの相対位置同期信号が含まれ、これらのデータ全てが前記本文データ部15に含まれている。
前記のように複数の復号鍵を使うことにより、前記本文データ部15に複数のデータ、例えば音声で発音している単語のスペリングと、その訳語を格納しておくことが出来る。
もしデータ長が46バイトに満たないようなサイズのデータの場合は,パディングデータと呼ぶ無意味なダミーのデータを付加して46バイトになるように調節するが、実体的にデータ量が少ない運用であれば46バイトよりも少ないデータ量を最低データ量としてフレーム設計することも可能である。
エラー検出部16は,受け取ったフレーム全体が送信時の内容と全く同じものであるかどうかを判断するための検査用データを入れる領域である。ここには,例えば、FCSと呼ぶ、宛先アドレス12,送信元アドレス13,タイプ14,本文データ15の4つの領域に格納したデータを一定の計算式に当てはめて算出した4バイトの値を格納する。そして,フレームを受け取った側で同じ計算を実行してみて,付加してあるFCSの値と一致すれば,データの誤りや入れ替わりといったエラーが発生していないと判断する。逆に,値が異なっていれば,データの一部に誤り(ビットの値が変わってしまうこと)が生じているエラーチェック機能を持つ。
なお、データフレーム構造は上記の構造1に限定せず、他の構成によるフレームを使っても良いし、データ間が空いていて、フレーム転送しなくともデータの混同が無い場合には、例えばテレビ信号のように相対位置同期信号にデータだけを付加する方法で通信しても良い。
図3は、本発明に係る受信システムの機能説明図である。この構成は、従来からの複合音響信号処理と似ているが、文字データを先送りして、音声と同期させて文字を表示させるための時間制御部およびメモリー部が追加されている点で従来とは異なる構成となっている。
利用者18が文字データ再生装置19のマイクロフォン20によって受けた前記複合音響信号8は音響信号受信部21に入力される。次に、埋め込み信号検出部22によって、埋め込まれた複合音響信号が検出される。
前述した通り、前記複合音響信号中には、外国語音声データ、この外国語音声データの文字データ、これら外国語音声データと文字データとの相対位置同期信号が含まれているが、この中の文字データおよびこの文字データの相対位置同期信号は実際に音として聞こえる外国語音声データで発音される文字データよりも前の文字データが先に送られて来ていて、これら文字データおよびこの文字データの相対位置同期信号は、同期情報算出部23を通過してメモリー部25に蓄積される。
一方、前記複合音響信号に埋め込まれた前記外国語音声データの相対位置同期信号は、同期情報算出部23によって検出され、前記外国語音声データの相対位置同期信号のデータに合わせて時間制御部24によって計算された相対位置同期信号を持つ文字データがメモリー部25から読み出されて、文字情報提示部26に提示される。
時間制御部25は、前記音響信号はメモリー25に格納された前記音響信号をFATにより管理しながら決められた基準時間に対する遅延時間分だけ遅延させたタイミングで前記文字データを文字情報提示部26に送出し、文字データ再生装置19の表示手段27によって音声に同期した文字を表示する。
ここで、前記基準時間とは、データ部15を持たない短いダミーフレームを2個連続で作って、2個目のダミーフレームにおける前記ダミーフレームのSFD部11の次、即ち宛先アドレス部12の開始タイミングを基準とすることも出来るし、叉例えば、複合音響信号の持つ振幅変動波形の位相を利用することも考えられる。
また、サブディスプレイを備えた文字データ再生装置の場合には、メインディスプレイに文章全体を表示し、サブディスプレイに発音される単語だけを表示する、或いはその逆の表示方法も考えられる。
同じ画面に文章全体と発音される単語を並記して表示する場合には、文字データ再生装置19のデータ保存用メモリーをRAMディスクとして使い、一時的に前記メモリーを作業領域として使うことにより、発音される単語が替わる前に前記メモリー上で画面合成を行ってから画面表示システムのグラフィックRAMに転送すると良い。
なお、前述したように、文字データは外国語音声データよりも前に送られて来るので、複数の秘密鍵を使って複数言語対応にする場合には、メモリー部25に全ての秘密鍵に対応する文字データを蓄積しておく必要があり、時間制御部24は文字データ再生装置19で選択された秘密鍵に対応する文字データを音声データの相対位置同期信号に対応させてメモリー部25から出力させる。
図4は、文字データ再生装置19に再生された文字データを表示した例である。画面27の上部には読まれる文章全体が表示され、画面下部には今読まれている単語が表示されている。なお、後述する遅出し画面においては、前記文章全体を表示すると学習効果が減る可能性があるので、表示させないことが望ましい。
図5(a)〜(c)は本発明に係る音声信号と画面表示のタイミングが同時である場合の例である。図5(a)には、例えば英会話テープにおいてひとつのレッスンの開始から02分00秒から02分30秒までの5秒毎の時間フレームが示されている。また、図5(b)には、前記時間フレーム内の発音情報を文字情報として複合音響信号に埋め込むタイミングが示されている。更に、図5(c)には、前記複合音響信号を前記文字データ再生装置19で受信して表示手段27に文字データを表示するタイミングが示されている。
以下の説明において、タイミングは処理する文字データの量、送信側および受信側のハードウェアおよびソフトウェアに依存するので、必ずしも実施例の時間で全てのデータが処理されるとは限らない。処理の遅いシステムにおいては、あらかじめ処理時間を考慮して前もって文字データを送信しておく必要がある。安全を考えれば、早く文字データを送っておいた方が良いが、文字データの送出タイミングを早めると、それだけ受信側のバッファメモリが必要となるので、むやみに早く文字データを送ることは出来ない。経験値としては、例えば10文字を複合音響信号として送る場合には、実際の音声開始タイミングよりも5秒、望ましくは10秒早めて送出すると良い。
図5(a)においては、前記英会話テープの開始から02分10秒から02分15秒までのタイミングで第1フレーム28が、02分20秒から02分25秒までのタイミングで第2フレーム29が英会話の先生によって発音される。図5(b)において、前記第1フレーム28の文字データ30は01分40秒から01分45秒までのタイミングで、前記第2フレームの文字データ31は01分50秒から01分55秒までのタイミングでそれぞれ複合音響信号として送出される。
次に、前記複合音響信号が文字データ再生装置19のマイクロフォンによって捕らえられると信号処理され、前述の通り図3のプロセスで文字が再生され、図5(c)の第1表示画面32および第2表示画面33に分けて表示される。このとき、第1表示画面32および第2表示画面33には、図4に示した様に、共通して合成文章34の内容が画面の上側に全文表示され、画面下側には02分10秒から02分15秒までのタイミングで第1フレーム28の単語が、02分20秒から02分25秒までのタイミングで第2フレーム29の単語がそれぞれ合成画面内に表示される。
図6(a)〜(c)は、本発明に係る音声信号よりも画面表示が後になるタイミングの例である。図6(a)には、例えば英会話テープにおいてひとつのレッスンの開始から02分00秒から02分30秒までの5秒毎の時間フレームが示されている。また、図6(b)には、前記時間フレーム内の発音情報を文字情報として複合音響信号に埋め込むタイミングが示されている。更に、図6(c)には、前記複合音響信号を前記文字データ再生装置19で受信して表示手段27に文字データを表示するタイミングが示されている。
図6(a)においては、前記英会話テープの開始から02分10秒から02分15秒までのタイミングで第1フレーム28が、02分20秒から02分25秒までのタイミングで第2フレーム29が収録されている。
図6(b)において、前記第1フレーム28の第1文字データ30は01分40秒から01分45秒までのタイミングで、前記第2フレームの第2文字データ31は01分50秒から01分55秒までのタイミングでそれぞれ複合音響信号として送出される。
前記複合音響信号が文字データ再生装置19のマイクロフォンによって捕らえられ、信号処理されると、前述の通り図3のプロセスで文字が再生されて、図6(a)における英会話の先生の音声ではフレーム28として02分10秒から02分15秒まで発音されたフレーム28の内容が、図6(c)では、02分15秒から02分20秒のタイミングでフレーム32として遅延して画面表示される。更に、英会話の先生の音声では図6(a)のフレーム29として02分20秒から02分25秒まで発音された内容が、図6(c)では02分25秒から02分30秒のタイミングでフレーム33として遅延して画面表示される。
図7(a)〜(c)は、本発明に係る音声信号よりも画面表示が先になるタイミングの例である。図7(a)には、例えば英会話テープにおいてひとつのレッスンの開始から02分00秒から02分30秒までの5秒毎の時間フレームが示されている。また、図7(b)には、前記時間フレーム内の発音情報を文字情報として複合音響信号に埋め込むタイミングが示されている。更に、図7(c)には、前記複合音響信号を前記文字データ再生装置19で受信して表示手段27に文字データを表示するタイミングが示されている。
図7(a)においては、前記英会話テープの開始から02分10秒から02分15秒までのタイミングで第1フレーム28が、02分20秒から02分25秒までのタイミングで第2フレーム29が英会話の先生によって収録されている。
図7(b)において、前記第1フレーム28の文字データ30は01分40秒から01分45秒までのタイミングで、前記第2フレームの文字データ31は01分50秒から01分55秒までのタイミングでそれぞれ複合音響信号として送出される。
更に、図7(c)は、前記文字データ再生装置19の表示手段27に表示される文字データを時系列で示していて、前記フレーム28の内容“To be”が、前記英会話の先生が発音する前のタイミング、つまり時系列で02分05秒から02分10秒までのフレーム32と、前記英会話の先生が実際に発音するタイミング、つまり時系列で02分10秒から02分15秒までのフレーム32の2回連続で文字表示される。
その後、前記フレーム29の内容“or not to be”が、前記英会話の先生が発音する前のタイミング、つまり時系列で02分15秒から02分20秒までのフレーム33と、前記英会話の先生が実際に発音するタイミング、つまり時系列で02分20秒から02分25秒までのフレーム33の2回連続で文字表示される。
本発明による語学教材を字幕の入った映画に使えば、例えば映画では英語が話され、字幕では日本語が見られ、複合音響信号再生機の画面には英語の台詞がリアルタイムあるいは語学力によって早出し又は遅早出しでも見られるようになるので、映画を利用して楽しく学習することが出来るようになる。
なお、ハードウェアの能力的に余裕があるのであれば、受信した文字データを文字データ表示端末に蓄積データとして、画面で発音された文字群だけでなく、例えば、前記蓄積データも画面下部に上記画面で発音された文字群とは異なる色で表示しておくことにより、文章全体を把握し易くすることが可能である。
また、文字データ再生装置に、文字及び画像を表示する表示手段と、外国語の音声データとその訳文の文字データとこれらの相対位置同期信号が重畳された複合音響信号を受信する手段と、前記表示手段に前記外国語の音声データに対し訳文の文字データを設定した時間または語数だけ先に(または後に)表示するアプリケーションを組み込むことも考えられる。
更に、例えばDVDやブルーレイなどの記録媒体に保存された映画タイトルやテレビ放送などで受信した映画タイトルなどにおいて、これらの映画タイトルに字幕が入っていない場合でも、前記映画タイトルの音声と同じ外国語音声データと、この外国語音声データに対して音響透かしによって重畳された前記外国語音声データに対応する文字データと、前記外国語音声データに対してその字幕文字データを時間的にずらして再生するための相対位置同期信号を含む字幕の語学教材を字幕表示の補助システムとして使うことも考えられる。
前述した様に、該語学教材はCDやテープなどに記録したメディアを使っても良いし、インターネットを使ってWebサイトから音声データとしてダウンロードしながら字幕表示を同期させても良い。時間データを持つDVDなどのメディアを使う場合は、前記映画タイトルの外国語音声データなどと同じ音声データを使い、チャプター内の時間データと共に同期させた字幕を文字データとして埋め込むことにより、文字データ再生装置の表示画面に前記映画タイトルに同期させた字幕表示が可能となる。
前記メディアにDVDなどの時間情報を持つメディアを使う場合以外、つまり映像と音声のみからなる放送番組などには時間データが含まれていないので、前記映画タイトルの最初から見る場合には手操作で映像と字幕を同期させることは容易であるが、映画タイトルの途中から見る場合においてもチャプターの立ち上がりを基準として、プログラム内のストップウォッチをスタートさせてチャプター内の時間を計測すると共に、音声や音楽の特徴を音響学的に検知することにより前記映画タイトルの場所を検知できるので音声に同期させて字幕を画面表示することが可能となる。また更に、例えば任意のチャプターから前記映画タイトルを再生させた場合に、チャプターの開始位置を検出したタイミングを時間的なスタートポイントとして最初に音声が検出できるまでの時間を測定し、あらかじめ作成しておいたデーターベースを使うことにより、今見ているチャプターに該当するチャプターを検索することが出来る。
前記データーベースは、Web経由で入手しても良いし、複合音響信号の最初の部分に挿入しておいても良い。また、文字データ再生装置のプログラム内にストップウォッチ機能を持たせ、前記映画タイトルのチャプターが開始した時点から最初の台詞までの時間をストップウォッチで時間を計測する機能を持たせれば、前記データーベースと併用することにより短時間で適切なチャプターの字幕を表示できるようになる。
また、もし時間データを持たない映像を再生する場合にチャプターの映画の実演されているチャプターと再生している字幕の属するチャプターが異なることが判断できれば、チャプターを検出した時点でプログラム内の前記ストップウォッチをリセットし、画面操作に設けられたチャプターサーチ機能でチャプターを変更することも可能である。これにより、映画のチャプタースタート時間はプログラム内のリアルタイムクロックに同期させている間に、チャプター単位でチャプターだけスキップさせて任意のチャプター内のリアルタイムクロックに同期させた時間に該当する字幕を表示することが出来る。
更に、文字データ再生装置の文字データ表示時間も任意に設定可能とし、音声は次の台詞になっても気に入った台詞が画面表示された状態で画面上に静止させることも可能である。また、今何を話したかを聞き取れなかった場合には、相対位置同期信号を使うことにより、文字表示だけを前の画面に戻して直前あるいは更に前の台詞字幕を表示することもできる。これらの操作中も、DVDなどの時間情報を持つメディアを使わなくとも、前記ストップウォッチを動作させておくことにより、いつもで画面に合った字幕表示に戻すことや、戻った後に映像再生場面の台詞字幕を画面表示することが可能である。
上記の字幕表示方法のメリットは、映画の外国語音声データに対応する文字データを別の言語に翻訳すれば翻訳可能な任意の言語に対応できる点である。従来からパソコンを使ってDVDに記録された映画タイトルに後から制作した字幕をPC画面表示するサービスはあったが、DVDの再生出来るパソコンを使わなければならない不便さがあった。コンピューターを使えばDVDから字幕だけを取り出すことは容易であり、字幕が表示されるタイミングをチャプター内の時間情報として付加し、字幕の文字データと前記時間情報で構成されるテキストファイルを翻訳して生成した文字データをオリジナルの音声データに埋め込むことにより複合音響信号を生成できるので、複数言語に対応した複合音響信号の生成は容易である。
音響透かしを埋め込んだ英会話音楽は、例えばカセットテープなどの安価な記憶媒体でも記録再生が可能であり、例えば文字データ再生装置のアプリケーションとして文字提示機能を用意すれば、テープレコーダーと該文字データ再生装置だけで英会話が楽しめるし、また、見えるラジオ(登録商標)など文字多重受信機能の有る高価なラジオを使わなくとも、普通のラジオでも複合音響信号から文字データを抽出して文字データ再生装置などの文字データ再生装置で再生することが出来る。しかも、文字表示のタイミングを選択出来るので、語学の初心者から上級者まで同じ複合音響信号を使って自分の語学力に合わせた学習を遂行することができるので、利用者に大きな設備負担を強いることなく様々なラジオリスナーに対して語学教育の振興を啓蒙できる。
1…吹き込み者、 2…マイクロフォン、 3…文章、 4…タイミングボタン、 5…相対位置同期信号発生装置、 6…拡声装置、 7…記録装置、 8a…オリジナルの音声、 8b…複合音響信号、 9…データフレーム構造、 10…プリアンプル部、 11…SFD部、 12…宛先データ部、 13…送信元データ部、 14…タイプデータ部、 15…本文データ部、 16…エラー検出部、 17…複合音響信号、 18…利用者、 19…文字データ再生装置、 20…マイクロフォン、 21…音響信号受信部、 22…埋め込み信号検出部、 23…同期情報算出部、 24…時間制御部、 25…メモリー部、 26…文字情報提示部、 27…表示手段、 28…第1フレーム、 29…第2フレーム、 30…第1文字データ、 31…第2文字データ、 32…フレーム、 33…フレーム、 34…合成文章。
Claims (3)
- 音声再生装置によって再生される複合音響信号が記録された語学教材であって、前記複合音響信号には外国語音声データと、この外国語音声データに対して音響透かしによって重畳された前記外国語音声データに対応する文字データと、前記外国語音声データに対してその文字データを時間的にずらして再生するための相対位置同期信号とが含まれることを特徴とする語学教材。
- 音声再生装置から出力される複合音響信号に含まれる文字データを再生する文字データ再生装置において、前記複合音響信号には外国語音声データ、この外国語音声データの文字データ、前記外国語音声データに対してその文字データを時間的にずらして再生するための相対位置同期信号が含まれ、前記文字データ再生装置は前記複合音響信号中の文字データと相対位置同期信号を蓄積するメモリーを備え、前記外国語音声データの相対位置同期信号と前記文字データの相対位置同期信号を比較することにより前記文字データを前記音声データに対して設定した時間または語数だけ先または後に表示することを特徴とする文字データ再生装置。
- 請求項2に記載の文字データ再生装置において、前記音声再生装置の再生速度を変化させた時に、再生速度だけ変化させる音声ピッチコントロールを使って音声データを再生することを特徴とする文字データ再生装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007144457A JP2008299032A (ja) | 2007-05-31 | 2007-05-31 | 語学教材および文字データ再生装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007144457A JP2008299032A (ja) | 2007-05-31 | 2007-05-31 | 語学教材および文字データ再生装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008299032A true JP2008299032A (ja) | 2008-12-11 |
Family
ID=40172615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007144457A Pending JP2008299032A (ja) | 2007-05-31 | 2007-05-31 | 語学教材および文字データ再生装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008299032A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017037656A (ja) * | 2016-09-12 | 2017-02-16 | ヤマハ株式会社 | 情報提供システム |
US20180098164A1 (en) | 2014-08-26 | 2018-04-05 | Yamaha Corporation | Reproduction system, terminal device, method thereof, and non-transitory storage medium, for providing information |
US10139241B2 (en) | 2015-01-23 | 2018-11-27 | Yamaha Corporation | Information provision system, information provision method, and management device |
JP2019211743A (ja) * | 2018-06-08 | 2019-12-12 | 博樹 市川 | 台詞練習システム |
JP2020071782A (ja) * | 2018-11-01 | 2020-05-07 | カシオ計算機株式会社 | 情報提供システム、音声出力装置、表示装置、情報提供方法、およびプログラム |
US10691400B2 (en) | 2014-07-29 | 2020-06-23 | Yamaha Corporation | Information management system and information management method |
US10733386B2 (en) | 2014-07-29 | 2020-08-04 | Yamaha Corporation | Terminal device, information providing system, information presentation method, and information providing method |
-
2007
- 2007-05-31 JP JP2007144457A patent/JP2008299032A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10691400B2 (en) | 2014-07-29 | 2020-06-23 | Yamaha Corporation | Information management system and information management method |
US10733386B2 (en) | 2014-07-29 | 2020-08-04 | Yamaha Corporation | Terminal device, information providing system, information presentation method, and information providing method |
US20180098164A1 (en) | 2014-08-26 | 2018-04-05 | Yamaha Corporation | Reproduction system, terminal device, method thereof, and non-transitory storage medium, for providing information |
US10433083B2 (en) | 2014-08-26 | 2019-10-01 | Yamaha Corporation | Audio processing device and method of providing information |
US10542360B2 (en) | 2014-08-26 | 2020-01-21 | Yamaha Corporation | Reproduction system, terminal device, method thereof, and non-transitory storage medium, for providing information |
US10139241B2 (en) | 2015-01-23 | 2018-11-27 | Yamaha Corporation | Information provision system, information provision method, and management device |
JP2017037656A (ja) * | 2016-09-12 | 2017-02-16 | ヤマハ株式会社 | 情報提供システム |
JP2019211743A (ja) * | 2018-06-08 | 2019-12-12 | 博樹 市川 | 台詞練習システム |
JP7340784B2 (ja) | 2018-06-08 | 2023-09-08 | 博樹 市川 | 台詞練習システム |
JP2020071782A (ja) * | 2018-11-01 | 2020-05-07 | カシオ計算機株式会社 | 情報提供システム、音声出力装置、表示装置、情報提供方法、およびプログラム |
JP7314498B2 (ja) | 2018-11-01 | 2023-07-26 | カシオ計算機株式会社 | 学習支援装置、学習支援システム、学習支援方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4170808B2 (ja) | 情報表示装置、情報表示方法及びプログラム | |
US8497939B2 (en) | Method and process for text-based assistive program descriptions for television | |
US20050180462A1 (en) | Apparatus and method for reproducing ancillary data in synchronization with an audio signal | |
JP2008299032A (ja) | 語学教材および文字データ再生装置 | |
US20060134590A1 (en) | Video-based music learning tool | |
JP2005064600A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2010136067A (ja) | データ処理装置、データ処理方法、及び、プログラム | |
JP2007067595A (ja) | 番組情報の通知方法 | |
US7035531B2 (en) | Device and method for supplying commentary information | |
JP2006324779A (ja) | 字幕配信システム、字幕送信装置、字幕合成装置及び字幕配信方法 | |
JP2006337490A (ja) | コンテンツ配信システム | |
JP3651067B2 (ja) | 言語学習装置およびその処理方法 | |
JP3976779B1 (ja) | 音楽データに文字データを埋め込んだ複合音響信号を再生する文字データ再生装置 | |
WO2013038636A1 (ja) | 表示装置及び録画再生装置 | |
JP2013097240A (ja) | 聴覚障がい者支援装置およびその動作方法 | |
JPH04170875A (ja) | 記録媒体および画像・文字情報再生装置 | |
JP2006074514A (ja) | 映像編集装置、映像再生装置、ファイルデータベース、ファイル配信サーバ、映像編集方法、映像編集プログラム、映像再生方法、映像再生プログラム、およびコンピュータ読み取り可能な記録媒体 | |
JP7051923B2 (ja) | 動画生成装置、動画生成方法、動画生成プログラム、再生装置、動画配信装置、及び動画システム | |
JP7139766B2 (ja) | 端末装置、端末装置の動作方法およびプログラム | |
JP4422538B2 (ja) | 音付映像の再生装置 | |
JP4105975B2 (ja) | 映像音声再生装置 | |
JP2006133672A (ja) | 携帯型語学学習装置及び携帯型語学学習システム | |
JP6529116B2 (ja) | 送信装置、受信装置およびプログラム | |
JP2015065556A (ja) | 映像出力装置、映像出力方法および映像出力プログラム | |
KR20220161665A (ko) | 학습 영상을 이용한 유아용 영어 학습 방법 |