JP3976779B1 - 音楽データに文字データを埋め込んだ複合音響信号を再生する文字データ再生装置 - Google Patents

音楽データに文字データを埋め込んだ複合音響信号を再生する文字データ再生装置 Download PDF

Info

Publication number
JP3976779B1
JP3976779B1 JP2007024696A JP2007024696A JP3976779B1 JP 3976779 B1 JP3976779 B1 JP 3976779B1 JP 2007024696 A JP2007024696 A JP 2007024696A JP 2007024696 A JP2007024696 A JP 2007024696A JP 3976779 B1 JP3976779 B1 JP 3976779B1
Authority
JP
Japan
Prior art keywords
character data
information
signal
data
music
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007024696A
Other languages
English (en)
Other versions
JP2008015469A (ja
Inventor
明 西村
真一 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OTODESIGNERS CO Ltd
Original Assignee
OTODESIGNERS CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OTODESIGNERS CO Ltd filed Critical OTODESIGNERS CO Ltd
Priority to JP2007024696A priority Critical patent/JP3976779B1/ja
Priority to PCT/JP2007/060802 priority patent/WO2007142064A1/ja
Application granted granted Critical
Publication of JP3976779B1 publication Critical patent/JP3976779B1/ja
Publication of JP2008015469A publication Critical patent/JP2008015469A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • G10H1/365Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems the accompaniment information being stored on a host computer and transmitted to a reproducing terminal by means of a network, e.g. public telephone lines
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2220/00Input/output interfacing specifically adapted for electrophonic musical tools or instruments
    • G10H2220/005Non-interactive screen display of musical or status data
    • G10H2220/011Lyrics displays, e.g. for karaoke applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2220/00Input/output interfacing specifically adapted for electrophonic musical tools or instruments
    • G10H2220/155User input interfaces for electrophonic musical instruments
    • G10H2220/441Image sensing, i.e. capturing images or optical patterns for musical purposes or musical control purposes
    • G10H2220/451Scanner input, e.g. scanning a paper document such as a musical score for automated conversion into a musical file format
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/171Transmission of musical instrument data, control or status information; Transmission, remote access or control of music data for electrophonic musical instruments
    • G10H2240/201Physical layer or hardware aspects of transmission to or from an electrophonic musical instrument, e.g. voltage levels, bit streams, code words or symbols over a physical link connecting network nodes or instruments
    • G10H2240/241Telephone transmission, i.e. using twisted pair telephone lines or any type of telephone network
    • G10H2240/251Mobile telephone transmission, i.e. transmitting, accessing or controlling music data wirelessly via a wireless or mobile telephone receiver, analogue or digital, e.g. DECT, GSM, UMTS
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/325Synchronizing two or more audio tracks or files according to musical features or musical timings

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Telephone Function (AREA)

Abstract

【課題】 カラオケ歌詞を埋め込んだ複合音響信号から、例えば携帯電話機を文字データ再生装置として使える文字データ再生装置を提供する。
【解決手段】 空気中を伝播する音を受信する受信部と、記憶手段としてのバッファと、文字データを再生するアプリケーションとを備えた文字データ再生装置において、前記受信部はカラオケの音楽データに歌詞を表する文字データが埋め込まれた複合音響信号を受信し、この複合音響信号を構成する音楽データおよび文字データには夫々を同期させるための時間情報が含まれ、前記バッファは前記複合音響信号から取り出した文字データを予め一定量記憶し、前記アプリケーションは前記バッファで記憶した文字データを前記時間情報によって前記音楽データに同期して再生表示するようにした。
【選択図】 図1

Description

本発明は、カラオケの音楽データに歌詞を表す文字データを埋め込んだ複合音響信号を再生する文字データ再生装置に関する。
カラオケは8トラック、カセットテープ、LDやVHD、更に通信カラオケや携帯カラオケなどとカラオケ音楽媒体は様々なフォーマットで広がっている。しかし、音楽と歌詞だけのシンプルな組合せを安価に求めようとすると、例えば歌詞テロップの入った画像入りビデオテープが考えられるが、ビデオデッキとTVモニターが必要なので、いつでもどこでも使える音楽媒体とは言えない。
特許文献1には、オーディオ信号を記録したオーディオトラックと、音源を駆動するための演奏データを前記オーディオ信号と同期して記録した演奏データトラックとを備えたオーディオメディアにおいて、歌詞を表示するための歌詞表示データをオーディオ信号と同期して記録した歌詞表示データトラックを備えたオーディオメディアが記載され、また歌詞表示データトラックはPCM録音のオーディオトラックに対して、いわゆる電子透かしの技術で埋め込むようにしてもよいと記載されている。
特許文献2には、音楽コンテンツの曲情報を知るための端末装置に関して、曲名、演奏者名、各コンテンツを識別するための曲IDなどの曲情報が電子透かしで埋め込まれたコンテンツの中から前記曲情報を端末装置で抽出する技術についての記載がある。
特開2000−156049号公報 特開2002−091455号公報
カラオケボックスにおいて、演奏されている音楽の歌詞を読めるのは、モニターの前に立っている利用者か、或いは角度的にモニターを見ることができる者に限られ、人の後、壁際、コーナ或いはトイレの中に入っている者は歌詞を暗記していない限り、いっしょに歌うことができない。
特許文献1では、同期信号について記載はされているが、もともとCDの中には音楽データと歌詞データの全てが入っており、携帯電話機のようにデータ処理に余裕のないCPUしか搭載していない機器にこの技術を使おうとするとハードウェア的に上記の問題を解決することはできない。
また、特許文献2では、前記端末装置の具備すべき必須の要素として、音楽コンテンツを入力するためのマイクロフォンと、音楽コンテンツに埋め込まれている曲情報を検出するための埋め込み情報検出手段と、検出された曲情報を表示する表示装置と、記憶手段と、前記音楽コンテンツの購入を発注することのできる発注手段とが記載されているだけで、上記の問題を解決することはできない。
上記の課題を解決するために、本発明に係る文字データ再生装置は、空気中を伝播する音を受信する受信部と、記憶手段としてのバッファと、文字データを再生するアプリケーションとを備えた文字データ再生装置において、前記受信部はカラオケの音楽データに歌詞を表する文字データが埋め込まれた複合音響信号を受信し、この複合音響信号を構成する音楽データおよび文字データには夫々を同期させるための時間情報が含まれ、前記バッファは前記複合音響信号から取り出した文字データを予め一定量記憶し、前記アプリケーションは前記バッファで記憶した文字データを前記時間情報によって前記音楽データに同期して再生表示するようにした。
また、前記文字データを予め一定量記憶するタイミングに曲の前奏時または間奏時を含むようにすることや、前記文字データ再生装置に携帯電話機を使うことも考えられる。
本発明の文字データ再生装置は、カラオケルーム内において、テレビモニターの歌詞が確認し難い位置、例えば部屋の隅の位置になった人でも、前記テレビモニター画面を見なくても自分の携帯電話の画面を見ることで、音楽に同期した歌詞を自分の携帯電話などの画面で確認できる。
また、本発明の文字データ再生装置は、カラオケ利用者の居場所に届く前記複合音響信号に同期して、携帯電話機の画面などにカラオケ歌詞を表す文字データを表示できるので、音波遅延のある広い場所で使っても前記利用者の場所における音像に同期したカラオケ文字データを画面で見てカラオケを楽しむことが出来る。
更に、既存のカラオケ装置などの音声チャンネルに、複合音響信号受信部、埋め込み信号検出部、同期情報算出部及び文字情報提示部とを備えた再生装置を追加するだけで簡単に前記複合音響信号が生成できるので、既存のカラオケ設備を更新することなく、音楽データに同期して再生できるように文字データが埋め込まれた音楽データに同期して再生できるように同期させるための時間情報とともに埋め込まれた複合音響信号から文字データを再生してカラオケ歌詞を携帯電話機などの画面に表示することが出来るようになる。
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明する。なお、以下の説明において、同一機能を有するものは同一の符号とし、その繰り返しの説明は省略する。
図1は、本発明の実施形態におけるシステムのブロック図であり、カラオケ等の音楽信号に歌詞を表す文字データが埋め込まれた信号を出力する複合音響信号出力装置1と、複合音響信号6を受信し、その中から埋め込まれた歌詞を表す文字データを表示する文字データ再生装置7から構成されている。
複合音響信号出力装置1は、カラオケの音楽などからなる音楽データ信号入力部2と、歌詞を表す歌詞データ信号入力部2aに入力される文字データを前記音響信号に埋め込める情報に変換する埋め込み信号生成部3と、前記音響信号に前記埋め込み信号を埋め込む処理を行って音楽データと文字データとが合成された複合音響信号を生成する埋め込み処理部4と、音響信号出力部5から成る。ここで、後述するように前記複合音響信号を構成する音楽データおよび文字データには夫々を同期させるための時間情報を含ませている。
文字データ再生装置7は、複合音響信号出力装置1から発せられた複合音響信号6を受信する音響信号受信部8と、受信した音響信号の中から歌詞を表す文字データの埋め込み信号を検出し、文字データ情報に復号化する埋め込み信号検出部9と、音響信号に同期して文字データ情報を提示するための同期情報を算出する為の同期情報算出部10と、復号化した文字データ情報を一定量蓄積するバッファメモリmと、このバッファメモリmに蓄積された埋め込み信号の中に含まれる文字データを表示する文字情報提示部11から成る。
ここで、複合音響信号出力装置1における埋め込み信号生成部3、埋め込み処理部4および文字データ再生装置7における埋め込み信号検出部9は、例えば、以下の構成とする。
即ち、埋め込み信号検出部9は、音響信号を帯域通過フィルタ群によって帯域分割したときの対となる隣接する帯域通過信号にそれぞれ逆位相の振幅変調を与えて、その連続的な変化の中および他の離れた帯域に与える振幅変調との位相差および変調強度差の中、および時間的に離れた区間に与える振幅変調の位相差および変調強度差の中に前記電子透かし情報を埋め込む手段と、あらかじめ前記帯域通過信号に含まれている振幅変動量と前記帯域通過信号の強度とを元に知覚されにくい振幅変調強度を決定するための手段と、付与する振幅変調の帯域間位相差に電子透かし抽出時の鍵となる位相差を与える手段と、電子透かしの埋め込まれた帯域通過信号およびそうでない帯域通過信号の全てを加算することによって電子透かし情報の埋め込まれた音響信号を出力する手段とを具備する電子透かし埋込装置を用いる。
ここで、電子透かし(音響透かし)の概略を説明すると、電子透かし技術とは、画像や音などのデジタルコンテンツに対して、そのデジタルコンテンツとはまったく別の情報を、人間に知覚されないように埋め込む技術であって、本発明においてはカラオケの音楽データに埋めこむ歌詞データをその対象とする。電子透かし技術は、不正コピー防止などの著作権保護に有効であり、様々な方法で活用されているが、埋め込み内容は埋め込み元の音楽データとは時間的な繋がりが無いもので同期をとるという発想が今まで無かった。しかし、本発明においては、音楽データと文字データに同期させるための時間情報を持たせることにより音楽データと文字データの同期をとることとした。
本実施例では、文字データ再生装置7として携帯電話を使用することとしている。この場合、音響信号受信部8と文字情報提示部11は、それぞれ、携帯電話に具備されたマイクロフォンとディスプレイで構成され、埋め込み信号検出部9と同期情報算出部10は、携帯電話に具備されたCPU上で動作するように専用のファームウェアを組み込んでも良いし、またiアプリ(登録商標)などのアプリケーションソフトウェア(携帯アプリ)でも実現される。
複合音響信号出力装置1において、上述した電子透かし埋込装置を用いた電子透かし方法で音響信号にカラオケの歌詞などの情報を透かし情報として埋め込む、あるいは文字データ再生装置の埋め込み信号検出部で埋め込まれた情報を復号化するためには、一定時間長の音響信号を一つのフレームとして、そのフレーム毎に情報の埋め込み、あるいは埋め込まれた情報の復号化処理を行うようにしてもよい。
このフレーム時間長をT秒とし、このフレーム内の音響信号を分析して埋め込まれた情報を復号化するのに必要な時間長を D秒とすると、T は透かし情報の埋め込み時に定められており、D <T を満たすような復号化ハードウェア(携帯電話)あるいはソフトウェアを用いることとする。また、用いる復号化ハードウェアあるいはソフトウェアによって D の値は定まる。
あらかじめ携帯電話の機種ごとにDの値を算出しておき、これを機種情報として用いれば、使用者がハードウェアの性能に気を使うことなく、本発明の技術を使用することができる。
図2は、フレームに埋め込む透かし情報(レコード)のビット構成図である。この構成においては、全体で n0 bit の情報を持つ。それらは、n1 bitの継続フラグ(flg)、n2 bit の同期させるための時間情報ptmの同期情報と、残り n0-n1-n2 bit は歌詞などの文字情報とし、ここでは文字列15と呼ぶ。
n2 bitの同期させるための時間情報ptmは、さらに n20 bit の保持フラグ(mfg)、n21 bitの提示開始相対フレーム番号情報(stf)と、n22 bit のフレーム内提示開始時刻情報(fstf)、n23 bit の提示終了相対フレーム番号情報(enf)と、n24 bit のフレーム内提示終了時刻情報(fenf)に分けられている。
図3は、文字データ再生装置の同期情報算出部と文字情報提示部の処理のフローチャートを示している。ステップAで初期設定をした後、ステップBで音響信号をフレームごとに受信し、ステップCで継続フラグ(flg)の値を抽出する。ステップDで、flg= 0 の場合は、そのフレームより文字データが開始されることを意味するので、ステップFにおいて、提示開始相対フレーム番号情報(stf)、フレーム内提示開始時刻情報(fstf)、フレーム番号情報(enf)、フレーム内提示終了時刻情報(fenf)が読み出され、ステップGで文字データはバッファに読み込まれる。
前記ステップHで、全ての文字データが読み込まれた場合はステップIで提示開始相対フレーム番号情報(stf)、フレーム内提示開始時刻情報(fstf)、フレーム番号情報(enf)、フレーム内提示終了時刻情報(fenf)はバッファへ送出される。
ステップHでNULLにならなければ、ステップJで、バッファ内の全てのレコードに対して、str=stf−1、enf=enf−1の演算をしてから、ステップKでパラメータswの値を確認する。パラメータswが0の場合は、ステップLで提示開始相対フレーム番号情報(stf)が0のレコードがあるかどうかを確認する。提示開始相対フレーム番号情報(stf)が0のレコードが無ければステップBに戻り、該レコードがあればステップMでfstfから1を減算処理する。この減算結果でfstfが0でなければステップMに戻り、0になったらステップOで提示を開始し、パラメータswに1を代入してステップBに戻る。
ステップKで、パラメータswが0でなければ、ステップQでフレーム番号情報(enf)の値を確認し、enfが0でなければステップBに戻り、0であればステップRでfenfの値を1減らす。その後、ステップSでfenfの値が0でなければステップRに戻り、0であればステップTで提示を終了し、パラメータswに0を代入し、ステップVで提示開始相対フレーム番号情報(stf)、フレーム内提示開始時刻情報(fstf)、フレーム番号情報(enf)、フレーム内提示終了時刻情報(fenf)をバッファから読み出してステップBに戻る。
同期させるための時間情報ptmは、提示開始相対フレーム番号情報(stf)によって、現在のフレームより何フレーム後のフレーム内で、このフレームで復号化される文字データが提示されるかが相対的に指定される。同期させるための時間情報ptmのうち、n22 bit のフレーム内提示開始時刻情報(fstf)は、提示されるフレームの時間を 2^n22 個のセグメントに分割した時に、その何番目のセグメントの開始時刻に提示が行われるかを指定する。
同様に、n23 bit の提示終了相対フレーム番号情報(enf)は、提示開始後何フレーム後に提示終了するかを表し、n24 bit のフレーム内提示終了時刻情報(fenf)は、そのフレーム内での提示終了時刻を表す。
また、文字データ内に NULL文字が表れ、かつNULL文字以降のビット数がn2 bit を上回るとき、それ以降はn2 bit の次の文字データのための同期させるための時間情報ptmとなり、n2 bit を差し引いた残りのビットは次の文字データに割り当てられているので、一旦バッファされ、前の文字データの提示が終了した時点でバッファより読み出される。
ステップEで継続フラグ(flg)の値が 1 の場合は、n2 bit の同期させるための時間情報ptmは含まれず、残りの n0-n1 bit によって、直前のフレームに含まれていた文字データの継続される部分の情報が表現される。
ここで、本実施例では、n2 bit の文字データは相対的な時刻としているが、絶対的な提示開始時刻(日時)と提示終了時刻を表現する形式を用いてもよい。
なお、本実施例では、複合化される情報として、歌詞などの文字情報を用いているが、これは画像、URL情報、インデックス情報などであってもよい。
URL情報の場合は、URLの指し示すインターネットアドレス上のコンテンツをすぐさま有線あるいは無線接続によりダウンロードして表示可能な情報の形態でバッファメモリに保存する。
復号化される文字データが、提示端末が保持している情報へのインデックスである場合は、あらかじめ提示端末の記憶領域に表示される情報を複写しておく必要がある。同期させるための時間情報ptmは、現在時刻が進むとデータフレームが経過する毎に更新される。指定された提示フレーム時刻が到来した文字データから順番に提示デバイスにおいて提示が行われる。
さらに、n2 bit の同期させるための時間情報ptmに含まれる n20 bit の保持フラグmfgは、提示された情報の保存などに用いることが出来る。例えば、mfg= 1 の時には、提示された後の情報は提示端末の記憶領域に保存される。この記憶領域が文字データで満たされると、古い文字データから順に消去されていく。保持フラグが 0の場合には、提示された後の情報は提示端末から消去される。
本実施例では、一連の文字データに関する処理のみが記載されているが、表示装置の面積と解像度が充分な場合は、複数の文字データに対して本フローチャートの処理を並列に実行し、表示装置の様々な場所に並行して、それぞれの文字データに応じた提示時間の間、文字データを表示することも可能である。
また、提示したい情報量が多い場合には、情報をあらかじめ送信しておいて、複数の文字データをバッファに蓄積しておくことも可能である。例えば、歌詞の情報量が多い場合には、前奏や間奏にも情報を埋め込んでおくことも可能である。
本実施例のように、携帯電話等の装置を用いて歌詞表示サービスを提供するためには、携帯からサービス利用の手続きを行う必要がある。この場合には、複合音響信号に埋め込まれた情報を復号化するために復号鍵が必要であり、この復号鍵は文字データ再生装置にあらかじめ入力しておく必要がある。
この復号鍵の提示端末への通知には、既存の鍵暗号化システムを用いて、暗号化復号鍵情報として通知することができる。また、異なる復号鍵によって異なる情報を同一の音響信号に同時に埋め込むことも可能であり、利用者の必要な情報に応じて、その情報を復号化する鍵を通知することとする。
次に、鍵暗号化システムを用いて文字データの復号化鍵を通知するシステムの具体例を説明する。
文字データ再生装置上で文字データ復号化ソフトウェアあるいはハードウェアを最初に動作させる際に生成した疑似乱数を基に算出される鍵ペアFとG を文字データ再生装置の不揮発記憶領域に保存しておく。
ここで、公開鍵G によってメッセージ x を暗号化して得られる暗号化メッセージを G(x)とし、秘密鍵F によって暗号化メッセージ y を復号化して得られる復号化メッセージをF(y) とした時に、下記の関係が満たされるような公開鍵暗号システムを用いる。
F(G(x)) = x
前記のような公開鍵暗号システムとしては、RSA(Rivest Shamir Adleman)方式などが知られている。文字データ再生装置から、文字データ提供者に公開鍵Gを通知し、文字データ提供者は文字データ復号化の鍵kを暗号化したメッセージG(k)を文字データ再生装置利用者に通知する。
このG(k)を通知する際、あるいは通知後に、通知の通信路あるいは利用者から GあるいはG(k)の情報が第三者に洩れたとしても、G(k)から文字データ復号化の鍵であるkを復号するために必要な文字データ再生装置固有の秘密鍵である F を第三者は入手することが不可能なので、文字データ提供者は文字データ再生装置利用者のみに文字データを提供することが可能になる。
つまり、文字データ提供者は、G(k)の提供と引換に各利用者毎から不正利用無しに確実に情報提供料金を徴収することが可能となる。
異なる復号鍵によって異なる情報を同一の音響信号に同時に埋め込む実施例としては、カラオケの歌詞情報を多言語でカラオケ音楽信号に同時に埋め込む場合、各言語毎に復号化の鍵を異ならしめることによって、文字データ利用者の要求にあった歌詞情報を復号化鍵によって与えることが可能となり、かつ各言語毎に歌詞提供サービス料金を徴収することが可能になる。
また、カラオケ歌詞データ提供の際にカラオケ再生装置に通知している鍵毎に異なる情報を与えることが可能となる。具体的には、店内放送等に情報を埋め込む場合、顧客向け情報と従業員向け情報を同時に送信することが可能となる。
なお、本実施例では、音響出力装置における埋め込み信号生成部および埋め込み処理部および文字データ再生装置における埋め込み信号検出部に、特願2005−071245に記載の音響透かし技術を用いているが、これは、音楽等の音響信号に付加情報を埋め込むことが可能な技術であれば良いので、例えば、音響OFDMのような技術を用いても同様の効果が得られる。
更に、携帯電話機がデフォルトとして文字再生機能を備えていなくとも、携帯電話機が外部との通信用に備えているインターフェースを利用して、文字提示機能を持つ外部装置と携帯電話機を接続しても良いし、BLUETOOTH(登録商標)や国際標準規格ISO/IEC 18092として承認されているNearFieldCommunication(NFCIP−1)などの電波を使ってマイクロフォンを備えた外部機器から携帯電話機の表示手段で歌詞を表示されることも考えられる。
また、iPod(登録商標)などの既存の音楽プレーヤやPDAにおいても、表示手段を持ち、アプリケーションをインストールすることが出来る機種であれば、この音楽プレーヤやPDAを文字データ再生装置として使うことも出来るが、サイズ的に邪魔にならなければ通常のノートブックパソコンやデスクトップパソコンを文字データ再生装置とすることは言うまでもない。
更に、見えるラジオ(登録商標)など文字多重受信機能の有る高価なラジオを使わなくとも、携帯電話機などの文字データ再生装置を複合音響信号をラジオから流すことでラジオの音から文字データを抽出することが出来る。更に、ラジオでBGMとして流している音楽に前記複合音響信号を使えば、前記携帯電話機を用意すれば、カラオケを楽しみたい人だけが手軽にカラオケが楽しめる
また、もし安価に文字データ再生装置を提供する必要がある場合には、例えばマイクロフォン、スピーカー(あるいはイアホン)と表示手段を持ったトランシーバー(送受信が可能な装置という意味)を使えば、マイクロフォンで拾ったカラオケ歌詞あるいは文字情報などを複合音響信号として埋め込んだ音楽などを電波でサーバーに送り、サーバーから文字情報として前記トランシーバーにフィードバックすることにより、前記トランシーバーの表示手段に文字を表示するという方法も考えられる。この場合、多くの利用者が同時に前記サーバーにアクセスすることも考えられるが、周波数ホッピングやパケット通信技術を使えば、利用者にひどく不便をかけることなくサービスを提供することが可能となる。
図4は、背景画面にカラオケ歌詞が挿入されていて、音声信号にはカラオケ歌詞などの文字が埋め込まれていない既存のカラオケ装置を使う場合の実施例である。
まずステップS1では、カラオケ再生装置12が再生され、ステップS2ではカラオケ装置のビデオ端子から、カラオケ歌詞が字幕として挿入された画面13が出力され、ステップS3ではオーディオ端子からはカラオケ音楽14が出力される。
更にステップS4では、前記カラオケ歌詞が字幕として挿入された画面13から文字列15だけが抽出される。この抽出処理には、OCR機能を持った画像処理装置などが使える。この処理には、例えばハードウェアとしてはRvsiInspectionLLC社のVisonscape(登録商標)4000やMatrox社のMatroxOdysseyXCLなどが使え、ソフトウェアとしてはStemmer(登録商標)社のCommonVisionBloxやMatroxImagingLibraryなどが使える。
ステップS4にて、文字列15としての歌詞データがOCR機能で抽出される。更にステップS5において、電子透かし埋め込み装置16によって、所定の時間的遅延τを持つカラオケ音楽14に、遅延された画像18との同期させるための時間情報と文字列15とが音響透かしデータとして埋め込まれて複合音声信号6を生成する。前記の通り、複合音響信号6を生成する際の埋め込み処理時間などで、カラオケ歌詞が字幕として挿入された画面13との時間的な遅延τが生じる。
そこで、ステップS6において、カラオケ歌詞が字幕として挿入された画面13に対して時間的な遅延τをかけて、最終的に文字データ再生装置20の画面上に歌詞が文字表示された時に、カラオケA/V表示装置19の画面上に表示される遅延画面18との間に時間的な違和感が生じることを軽減する。これにより、例えば遠距離で遅延された画面18を鑑賞しながらカラオケに参加する場合で、映像18と複合音声信号6との間に時間的な差が生じても、文字データ再生装置20を持っている人は、遠くの画面18を見なくとも、聞こえるカラオケ音楽と文字データ再生装置20の画面上に表示されるカラオケ歌詞とは同期しているのでカラオケを楽しむことが出来る。
出力されるカラオケ歌詞の挿入された画面にインデックス信号を付加してから遅延手段で遅延させる。一方、これとは別に該画面からOCRなどの文字認識手段を使ってカラオケ歌詞を文字データとして抽出し、前記カラオケ歌詞データを前記カラオケ装置のオーディオ端子から出力されるカラオケ音楽に埋め込んで生成した複合音響信号に、前記インデックス信号を同期させるための時間情報として使うことにより前記遅延させた画面と複合音響信号とを同期させてテレビ受像器などに出力することも考えられる。これにより、カラオケを唄う人以外でテレビ画面18のカラオケ歌詞が見難い状況にあっても、携帯電話機などの表示提示装置20を使えば間近の画面でカラオケ歌詞が確認できるのでカラオケ合唱への参加が楽になる。
上記において、遅延時間τを持つ遅延された画面18は、オリジナルのカラオケ歌詞が字幕として挿入された画面13と同一コンテントでも良いが、間欠静止画で間引きした映像信号を使えば、比較的小規模の遅延用画像メモリーを使った遅延回路での構成が可能となり、装置の価格を安価に抑えることが可能である。
音響信号に同期させるための時間情報を付加する方法としては次の3つが考えられる。
(第1の同期信号付加方法)
スタート信号を音楽データの同期させるための時間情報として使い、文字データには同期させるための時間情報には図2の埋め込み情報、Gコード(商標登録)、あるいは赤外線リモコンの規格に準拠した信号を使って電子透かし技術によって組み込み、該文字データを含む音響信号受け取ったタイミングを共有化して音楽データの受信タイミングとする方法。
(第2の同期信号付加方法)
スタート信号を文字データの同期させるための時間情報として使い、音楽データの前記時間情報にはGコード(商標登録)あるいは赤外線リモコン信号規格の準拠した信号を使って電子透かし技術によって組み込み、該文字データを含む音響信号受け取ったタイミングを共有化して音楽データの受信タイミングとする方法。
(第3の同期信号付加方法)
文字データと音楽データの両方に電子透かしで同期させるための時間情報を埋め込む方法。
図5(a)は、音響信号に同期させるための時間情報を付加する第1の方法の1例を示している。この方法によれば、前記音楽データに組み込まれる前記時間情報はスタート信号となる。文字データと音楽データを同期させるための時間情報としては、図2に示される前記文字データが組み込まれている。
文字データ信号21には、継続フラグflgと同期させるための時間情報ptmと文字列15が含まれる。前記文字データ信号21は、埋め込み処理部4によってカラオケ音楽14に所定のタイミングで埋め込まれ、複合音響信号出力部5から出力される。
再生される時は、カラオケ音楽14が受信された時間を基準として、時間上方を含む同期信号ptmを使って文字列15の表示タイミングが制御される。
図5(b)は、音楽データ信号に同期させるための時間情報を付加する第1の方法の別例を示している。この場合にも、前記音楽データに組み込まれる前記時間情報はスタート信号となる。しかし、文字データと音楽データを同期させるための時間情報には赤外線リモコンの規格に準拠したリモコンコード23を使っている。
埋め込み信号生成部3には、リモコンコード23と文字列15で構成される文字データ信号21が入力され、音楽データ信号入力部2に入力されて処理された音楽データ信号14と埋め込み処理部4で合成されて複合音響信号出力部5から出力される。
文字データと音楽データを同期させるための時間情報には赤外線リモコンの規格に準拠したリモコンコード23を使うメリットとしては、コード自体にフラグの機能を持つリーダーコードが含まれているので図2におけるフラグflgが不要になる点である。また、リモコンコードはデーターコードの後に反転コードが付加されているので読み取り間違いを容易に検出できるメリットもある。
リモコン信号を使って音声に同期させるための時間情報を含む時間情報を挿入するには、例えば特定周波数に周期的なパルス群を“0”又は“1”のデータとして挿入することになる。この場合、受信側では前記特定周波数をバンドパスフィルターで抜き出して、前記パルス群から時間データを抽出すれば特定周波数帯のパルスだけを抽出できる。但し、この場合は前記パルス群が音として聞こえるのでオリジナルのカラオケ音声に雑音が混じる形になるが、カラオケボックスのような騒音レベルの高い場所であれば許容範囲となる。
赤外線リモコンのコードとしては、例えばNEC(登録商標)フォーマットのコードが使える。これは、リーダーコード、カスタムコード、データーコード、およびデーターコードの反転コードをシリアル通信するもので、リモコンコード23はひとつのフレーム全体で108msの送信時間を使うものが考えられる。通信に際しては、赤外線リモコンと同様にキャリア変調したパルスを使い、キャリア周波数としては38kHzを使うことが考えられる。
時間情報を含むリモコンコード23は、埋め込み信号生成部3で埋め込み信号として生成され、オリジナル音楽データ信号入力部2から入力されるカラオケ音楽データ信号14に対して埋め込み処理部4で埋めこまれ、複合音響信号出力部5から第2の方法による出力波形24として出力される。前記第2の方法による出力波形24にはリモコンコード23が重畳されているので、受信側ではバンドパスフィルターなどにより特定周波数を抜き出すことによって前記第2の方法による出力波形24からリモコンコード23を抽出することが出来る。
図6は、音楽データ信号に同期させるための時間情報を付加する第2の方法を示している。これは、文字データに組み込まれる前記時間情報をスタート信号とし、文字データと音楽データを同期させるための時間情報としては、図2に示される音楽データに組み込んでいる。
文字データ信号21には、継続フラグflgと文字列15が含まれ、埋め込み信号生成部3で電子透かし技術により文字データ信号21が埋め込み信号として生成される。
一方、音楽データ信号17には、時間情報を含む前記リモコンコード23が電子透かし技術で埋め込まれ、この合成信号が音楽データ信号入力部2に入力される。
前記音楽信号入力部2の出力信号と埋め込み信号生成部3の出力信号は、埋め込み処理部4によって電子透かし技術で埋め込まれ、複合音響信号出力部5から出力される。
図7は、音楽データ信号に同期させるための時間情報を付加する第3の方法を示している。これは、音楽データに文字データを埋めこんだ複合音響信号において、前記文字データと音楽データ信号の両方に同期させるための時間情報を組み込む方法で、前記第1の方法において、音楽データ信号14の代わりに、同期信号を埋めこんだ音楽データ信号14aを使うことによって埋め込み処理部4の出力には音楽データと文字データの両方に同期させるための時間情報を組み込んだ第3の方法による出力の周波数分布を持った複合音響信号を生成することが出来る。
上記の方法によれば、音楽データに文字データを埋めこんだ複合音響信号において、前記文字データと音楽データ信号の両方に同期させるための時間情報を組み込む必要があるが、別の方法としては、複合音響信号にひとつの同期させるための時間情報を組み込み、文字データを抽出した後も、音楽データ信号に同期させるための時間情報を残すことにより文字データと音楽データ信号の両方に同期させるための時間情報を付与することも考えられる。
なお、上記とは別に、文字データにスタート情報などのタイミングデータだけを暗示的に付加し、音楽データに同期させるための時間情報を電子透かしとして埋めこむことも考えられる。音楽データに同期させるための時間情報をリアルタイムでデコードして文字情報とリンクさせることが出来るので、前記文字データを取り込むバッファメモリに対する負荷を減らすことができるので、同容量のバッファメモリに多くの文字データを格納することができるようになる。
音響透かしを埋め込んだカラオケ音楽は、例えばカセットテープなどの安価な記憶媒体でも記録再生が可能であり、例えば携帯電話機のアプリケーションとして文字提示機能を用意すれば、テープレコーダーと該携帯電話機だけでカラオケが楽しめるし、また、見えるラジオ(登録商標)など文字多重受信機能の有る高価なラジオを使わなくとも、携帯電話機などの文字データ再生装置を複合音響信号をラジオから流すことでラジオの音から文字データを抽出出来るので社会的なインフラ整備にも貢献出来る。更に、ラジオでBGMとして流している音楽に前記複合音響信号を使えば、前記携帯電話機を用意すれば、カラオケを楽しみたい人だけが手軽にカラオケが楽しめるので、利用者に大きな設備負担を強いることなく様々なラジオリスナーに対して音楽振興を啓蒙できる。
本発明の実施形態におけるシステムのブロック図 埋め込み情報のビット構成図 文字データ再生装置の同期情報算出部と文字情報提示部の処理のフローチャート 既存のカラオケ装置から複合音響信号を生成する場合の実施例 複合音響信号に同期させるための時間情報を付加する第1の方法の第1例 複合音響信号に同期させるための時間情報を付加する第1の方法の第2例 複合音響信号に同期させるための時間情報を付加する第2の方法 複合音響信号に同期させるための時間情報を付加する第3の方法
符号の説明
1…音響出力装置、 2…音楽データ信号入力部、 2a…歌詞データ信号入力部、 3…埋め込み信号生成部、 4…埋め込み処理部、 5…複合音響信号出力部、 6…複合音響信号、 7…文字データ再生装置、 8…複合音響信号受信部、 9…埋め込み信号検出部、 10…同期情報算出部、 11…文字情報提示部、 12…カラオケ再生装置、 13…カラオケ歌詞が字幕として挿入された画面、 14…音楽データ信号、 14a…同期信号を埋めこんだ音楽データ信号、 15…文字列、 16…電子透かし埋め込み装置、 17…音楽データの周波数特性、 18…遅延された画面、 19…カラオケA/V表示装置、 20…文字データ再生装置、 21…文字データ、 22…第1の方法による出力周波数分布、 23…リモコンコード、 24…第2の方法による出力波形、 25…音響透かし信号、 26…第3の方法による出力の周波数分布。

Claims (3)

  1. 空気中を伝播する音を受信する受信部と、記憶手段としてのバッファと、文字データを再生するアプリケーションとを備えた文字データ再生装置であって、前記受信部はカラオケの音楽データに歌詞を表する文字データが埋め込まれた複合音響信号を受信し、この複合音響信号を構成する音楽データおよび文字データには夫々を同期させるための時間情報が含まれ、前記バッファは前記複合音響信号から取り出した文字データを予め一定量記憶し、前記アプリケーションは前記バッファで記憶した文字データを前記時間情報によって前記音楽データに同期して再生表示することを特徴とする文字データ再生装置。
  2. 請求項1に記載の文字データ再生装置において、前記文字データを予め一定量記憶するタイミングに曲の前奏時または間奏時を含むことを特徴とする文字データ再生装置。
  3. 請求項1または請求項2に記載の文字データ再生装置において、この文字データ再生装置は携帯電話機であることを特徴とする文字データ再生装置。
JP2007024696A 2006-06-05 2007-02-02 音楽データに文字データを埋め込んだ複合音響信号を再生する文字データ再生装置 Active JP3976779B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007024696A JP3976779B1 (ja) 2006-06-05 2007-02-02 音楽データに文字データを埋め込んだ複合音響信号を再生する文字データ再生装置
PCT/JP2007/060802 WO2007142064A1 (ja) 2006-06-05 2007-05-28 音楽データに文字データを埋め込んだ複合音響信号を再生する文字データ再生装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006155525 2006-06-05
JP2007024696A JP3976779B1 (ja) 2006-06-05 2007-02-02 音楽データに文字データを埋め込んだ複合音響信号を再生する文字データ再生装置

Publications (2)

Publication Number Publication Date
JP3976779B1 true JP3976779B1 (ja) 2007-09-19
JP2008015469A JP2008015469A (ja) 2008-01-24

Family

ID=38595902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007024696A Active JP3976779B1 (ja) 2006-06-05 2007-02-02 音楽データに文字データを埋め込んだ複合音響信号を再生する文字データ再生装置

Country Status (2)

Country Link
JP (1) JP3976779B1 (ja)
WO (1) WO2007142064A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5440828B2 (ja) * 2008-06-03 2014-03-12 株式会社Nttドコモ 処理装置および処理制御方法
JP5800155B2 (ja) * 2013-01-31 2015-10-28 ブラザー工業株式会社 カラオケ装置
WO2017221968A1 (ja) * 2016-06-22 2017-12-28 日本電気株式会社 処理装置、信号処理システム、処理方法、および記憶媒体
CN106128440A (zh) * 2016-06-22 2016-11-16 北京小米移动软件有限公司 一种歌词显示处理方法、装置、终端设备及系统
JP2020018381A (ja) * 2018-07-30 2020-02-06 株式会社三洋物産 遊技機

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000156049A (ja) * 1998-11-20 2000-06-06 Yamaha Corp オーディオメディアおよびメディア再生装置
JP2002091455A (ja) * 2000-09-19 2002-03-27 Matsushita Electric Ind Co Ltd 端末装置及び電子音楽配信システム

Also Published As

Publication number Publication date
JP2008015469A (ja) 2008-01-24
WO2007142064A1 (ja) 2007-12-13

Similar Documents

Publication Publication Date Title
JP5949068B2 (ja) 情報提供システム、識別情報解決サーバおよび携帯端末装置
JP3822224B1 (ja) 情報提供システム
JP3834579B1 (ja) 情報提供システム
JP2007235586A (ja) 広告視聴確認システム、放送受信端末、広告視聴確認端末、広告視聴確認方法およびプログラム
JP2002116976A (ja) データ記録媒体、データ記録方法及び装置、データ再生方法及び装置、データ送信方法及び装置、データ受信方法及び装置、データ蓄積媒体並びにデータ配信方法及び装置
JP3976779B1 (ja) 音楽データに文字データを埋め込んだ複合音響信号を再生する文字データ再生装置
US20150201155A1 (en) Advertisement distribution system and method for controlling operations of mobile electronic device thereof
US11012757B1 (en) Timely addition of human-perceptible audio to mask an audio watermark
JP4295781B2 (ja) 情報提供システム
KR100838900B1 (ko) 재생 시스템과 재생 방법, 데이터 송신 장치와 데이터 송신 방법, 및 원격 제어 장치와 원격 제어 방법
WO2016104672A1 (ja) 情報配信システム、放音装置、携帯端末装置、プログラム、および情報処理方法
US20070282750A1 (en) Distributing quasi-unique codes through a broadcast medium
JP2008299032A (ja) 語学教材および文字データ再生装置
JP5176287B2 (ja) コンテンツ再生システム、コンテンツ再生装置及びコンテンツ再生方法
JP4030440B2 (ja) メッセージ再生装置、メッセージ記録および再生方法、およびプログラム
JP2008089755A (ja) 文字データ再生装置
JP2006295367A (ja) デジタルサラウンドシステム、サーバ装置およびアンプ装置
KR100974052B1 (ko) 멀티미디어 디스플레이 장치 및 이를 이용한 멀티미디어 시스템 및 그 제어방법
JP2017182468A (ja) コンテンツ視聴者分類情報生成システム、コンテンツ視聴者分類情報生成方法及びプログラム
KR101003612B1 (ko) 가라오케 기기의 재생장치, 시스템 및 방법
JP2004128855A (ja) 放送システム、放送装置、および放送受信装置
JP2004128836A (ja) 同期再生方法、同期再生システム、受信装置及びプログラム
KR20010081330A (ko) 오디오데이터 처리시스템 및 그 처리방법
JP2005236706A (ja) 映像音声再生システム、装置及び端末
JP2006292916A (ja) 時系列コンテンツ作成支援システム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070619

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070619

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150