JP2008122888A - Karaoke machine - Google Patents
Karaoke machine Download PDFInfo
- Publication number
- JP2008122888A JP2008122888A JP2006336357A JP2006336357A JP2008122888A JP 2008122888 A JP2008122888 A JP 2008122888A JP 2006336357 A JP2006336357 A JP 2006336357A JP 2006336357 A JP2006336357 A JP 2006336357A JP 2008122888 A JP2008122888 A JP 2008122888A
- Authority
- JP
- Japan
- Prior art keywords
- image
- karaoke
- data
- cpu
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
この発明はカラオケ装置に関し、特にカラオケ伴奏ならびにユーザが歌った音に応じてテレビ画面の映像を変化させるカラオケ装置に関する。 The present invention relates to a karaoke apparatus, and more particularly, to a karaoke apparatus that changes an image on a television screen according to a karaoke accompaniment and a sound sung by a user.
この種の従来技術が特許文献1に開示されている。This type of prior art is disclosed in
特許文献1の従来技術は、歌唱者をカメラで撮像し、その映像をマイクの音声出力信号に応じて変化させるものである。
上記の従来技術は、人の顔を撮影した映像を変化させるものであったので、画像表現に限界があった。Since the above-described conventional technique is to change an image obtained by photographing a human face, there is a limit to image expression.
それゆえに、この発明の主たる目的は、カラオケ伴奏楽譜データ、ユーザの音声、ユーザの楽器演奏に含まれる様々なパラメータに応じて、画像オブジェクトを生成するためのパラメータを変化させ、その結果生成された画像オブジェクトをカラオケの背景画像として表示可能なカラオケ装置を提供することである。また、拡張性のある、画像表現豊かなカラオケ装置を提供することである。Therefore, the main object of the present invention is to change the parameters for generating the image object according to various parameters included in the karaoke accompaniment score data, the user's voice, and the user's musical instrument performance, and the result is generated as a result. A karaoke apparatus capable of displaying an image object as a background image of karaoke is provided. Another object of the present invention is to provide an expandable karaoke apparatus rich in image expression.
請求項1の発明は、家庭用テレビ装置などに映像信号ならびに音声信号を出力可能なカラオケ装置であって、カラオケ装置に内蔵、または着脱可能なマイクロフォン、カラオケ装置に内蔵、または着脱可能なメモリ、および二次元および/または三次元で表現される画像オブジェクトを生成し、1または複数の画像オブジェクトから構成される画像をカラオケの背景画像として生成し、かつカラオケの歌詞を示す歌詞画像と合成し、映像信号として出力する画像処理手段を含み、画像処理手段は、「メモリに格納されたカラオケ伴奏楽譜データ」に含まれる「楽器の種類」、「音の高さ(ピッチ)」、「音の持続時間」、「発音の強さ(ベロシティ)」、「音像の位置(パンポット)」、ならびに「マイクロフォンから入力されたユーザの音声をアナログ−デジタル変換して得られたデータ」を解析して得られる「平均レベル」、「ピークレベル」、「最もエネルギーの大きな周波数成分」、「特定の周波数成分のエネルギー」のうちの1または複数に応じて、画像オブジェクトの「種類」、「大きさ」、「色」、「形状」、「座標」の1または複数のパラメータを動的に変化させることを特徴とするカラオケ装置である。The invention of
請求項1の発明によれば、カラオケ伴奏楽譜データならびにユーザの音声に同期した映像がカラオケの背景画像として生成されるので、ユーザは、カラオケを楽しむ際に音楽と映像の一体感を感じることができ、これによりカラオケの新たな楽しみを提供できる。また、カラオケの曲ごとに背景画像を用意する必要が無く、カラオケのコンテンツ制作のための労力を少なくすることができる。According to the first aspect of the present invention, since the karaoke accompaniment score data and the video synchronized with the user's voice are generated as the background image of karaoke, the user may feel a sense of unity between music and video when enjoying karaoke. This can provide a new karaoke experience. Also, it is not necessary to prepare a background image for each karaoke song, and the labor for producing karaoke content can be reduced.
請求項2の発明は、カラオケ装置が、さらに電子楽器を接続可能な接続ポートを備え、
「接続ポートからMIDIまたはMIDIに類似の形式で入力される楽器演奏データ」に含まれる「楽器の種類」、「音の高さ(ピッチ)」、「音の持続時間」、「発音の強さ(ベロシティ)」、「音像の位置(パンポット)」のうちの1または複数のパラメータに応じて、画像オブジェクトの「種類」、「大きさ」、「色」、「形状」、「座標」の1または複数のパラメータを動的に変化させることを特徴とするカラオケ装置である。In the invention of
"Musical instrument performance data input from the connection port in a format similar to MIDI or MIDI""Musical instrument type", "Pitch", "Sound duration", "Sounding intensity" (Velocity), “Position of sound image (Panpot)”, and “Type”, “Size”, “Color”, “Shape”, “Coordinate” of the image object according to one or more parameters A karaoke apparatus characterized by dynamically changing one or more parameters.
請求項2の発明によれば、さらにユーザの楽器演奏に同期した映像がカラオケの背景画像として生成されるので、ユーザは、カラオケを楽しむ際に楽器演奏と映像の一体感を感じることができ、これによりカラオケの新たな楽しみを提供できる。According to the invention of
この発明によれば、カラオケの新たな楽しみを提供することが可能になる。According to the present invention, it is possible to provide new enjoyment of karaoke.
この発明の上述の目的,その他の目的,特徴および利点は、図面を参照して行う以下の実施例の詳細な説明から一層明らかとなろう。The above object, other objects, features and advantages of the present invention will become more apparent from the following detailed description of embodiments with reference to the drawings.
図1を参照して、この発明の実施例であるカラオケ装置1のカラオケ装置構成図を説明する。
図1は、カラオケ装置1ならびにカラオケ装置1に接続される機器を含むシステムの構成図です。カラオケ装置1は、家庭用テレビ3に接続されます。家庭用テレビ3の画面に歌詞字幕画像ならびに背景画像が表示され、テレビのスピーカーからカラオケの伴奏音楽ならびにマイクロフォン11から入力されたユーザの音声が再生されます。また、カラオケ装置1は、マイクロフォン11、キースイッチ13、メモリカートリッジコネクタ12、拡張ポート17等を備えており、ハウジングの形状は、例えばマイクロフォン型をしている。
以下に各部の機能について記します。With reference to FIG. 1, the karaoke apparatus block diagram of the
FIG. 1 is a configuration diagram of a system including a
The function of each part is described below.
マイクロフォン11
ユーザの声をアナログ音声信号に変換します。Microphone 11
The user's voice is converted into an analog voice signal.
キースイッチ13
カラオケ装置1を操作するための複数のキーから構成されます。本実施例では、「Slowキー」、「Fastキー」、「b(フラット)キー」、「#(シャープ)キー」、「+(プラス)キー」、「−(マイナス)キー」、「キャンセルキー」、「決定キー」の8つのキーより構成されます。以下に各キーの機能を示します。
・Slowキー:再生中の曲のテンポを遅くします。1回押すごとにテンポが一段階遅くなります。但し、既に最も遅いテンポで曲が再生されている場合には、このキーを押しても何も起こりません。
・Fastキー:再生中の曲のテンポを速くします。1回押すごとにテンポが一段階速くなります。但し、既に最も早いテンポで曲が再生されている場合には、このキーを押しても何も起こりません。
・♭キー:再生中の曲のピッチ(音の高さ)を低くします。1回押すごとにピッチが一段階低くなります。但し、既に最も低いピッチで曲が再生されている場合には、このキーを押しても何も起こりません。
・#キー:再生中の曲のピッチを高くします。1回押すごとにピッチが一段階高くなります。但し、既に最も高いピッチで曲が再生されている場合には、このキーを押しても何も起こりません。
・+キー:マイクロフォン11から入力されたユーザの音声のボリューム(音量)を大きくします。1回押すごとにボリュームが一段階大きくなります。但し、既に最も大きいボリュームで音声が再生されている場合には、このキーを押しても何も起こりません。
・−キー:マイクロフォン11から入力されたユーザの音声のボリューム(音量)を小さくします。1回押すごとにボリュームが一段階大きくなります。但し、既に最も小さいボリュームで音声が再生されている場合には、このキーを押しても何も起こりません。
・キャンセルキー:メニュー画面、曲選択画面においては、選択中の項目の解除を行ったり、一段階上位のメニューに移動したりするために用いられます。曲の再生中にこのキーが押されると、曲の再生が中断され、曲選択画面に戻ります。
・決定キー:メニュー画面、曲選択画面において、選択中の項目の決定を行うために用いられます。
「♭(フラット)キー」、「#(シャープ)キー」、「+(プラス)キー」、「−(マイナス)キー」の4つのキーは、それぞれ左、右、上、下を示す矢印のように十字に配置され、メニュー画面、曲選択画面において、選択中の項目を上下左右に移動させる目的にも用いられます。
It consists of a number of keys for operating the
• Slow key: Decreases the tempo of the song being played. Each time you press the key, the tempo is lowered by one step. However, if the song is already playing at the slowest tempo, nothing happens when you press this key.
・ Fast key: Increases the tempo of the song being played. Each press will increase the tempo by one step. However, if the song is already playing at the fastest tempo, nothing happens when you press this key.
• ♭ key: Decreases the pitch (pitch) of the song being played. Each time you press it, the pitch is lowered by one step. However, if the song is already playing at the lowest pitch, nothing will happen even if you press this key.
• # key: Increases the pitch of the song being played. Each press increases the pitch by one step. However, if the song is already playing at the highest pitch, nothing will happen even if you press this key.
• + key: Increases the volume of the user's voice input from the
-Key: Decreases the volume of the user's voice input from the
・ Cancel key: Used to cancel the currently selected item or move to the menu one level higher on the menu screen or song selection screen. If this key is pressed during song playback, song playback is interrupted and the song selection screen reappears.
・ Determination key: Used to determine the currently selected item on the menu screen and song selection screen.
The four keys “♭ (flat) key”, “# (sharp) key”, “+ (plus) key”, and “-(minus) key” are arrows indicating left, right, up, and down, respectively. It is also used for the purpose of moving the selected item up, down, left and right on the menu screen and song selection screen.
メモリカートリッジ2
デコード前動画データ、デコード前音声データ、楽譜データ、画像オブジェクトデータ、CPU102が実行するプログラムコード、DSP103が実行するプログラムコード等をNAND型フラッシュメモリまたはマスクROMなどに格納しています。
Video data before decoding, audio data before decoding, musical score data, image object data, program code executed by
メモリカートリッジコネクタ12
メモリカートリッジ2を接続するためのコネクタです。
A connector for connecting the
拡張ポート17
電子楽器等4を接続するためのコネクタです。UARTをベースにしています。
A connector for connecting electronic musical instruments. Based on UART.
外部マイクロフォン5
複数のユーザがカラオケを楽しむ場合、装置本体のマイクロフォン11から音声を入力するユーザとは別のユーザの声をアナログ音声信号に変換し、出力します。
When multiple users enjoy karaoke, the voice of a user other than the user who inputs voice from the
外部マイクロフォン入力端子18
外部マイクロフォン5からアナログ音声信号を入力するための端子です。External
A terminal for inputting analog audio signals from the
映像出力端子14
カラオケ装置1が生成したコンポジットビデオ信号を家庭用テレビ3に出力するための端子です。
This terminal is used to output the composite video signal generated by the
音声出力端子15,16
カラオケ装置1が生成したアナログオーディオ信号を家庭用テレビ3に出力するための端子です。左チャンネルの信号を出力するための音声出力端子(左)15と、右チャンネルの信号を出力するための音声出力端子(右)16から構成されます。
This terminal is used to output the analog audio signal generated by the
次に、図2を参照して、本発明のカラオケ装置1の映像出力端子14から出力される画像信号によって、テレビ画面に描写される画面イメージの説明をする。Next, with reference to FIG. 2, the screen image drawn on the television screen by the image signal output from the
図2の(A)
カラオケの背景画像として、動画を表示する場合の画面イメージです。動画データはMPEG−4やH.264(MPEG−4/AVC)等の形式で圧縮され、メモリカートリッジ2に格納されています。デコード(解凍)された動画データは、後述するディスプレイコントローラ109が扱うビデオスクリーンに表示されます。カラオケの字幕画像は、後述するグラフィックスプロセッサ107がフレームバッファに描画し、ディスプレイコントローラ109がフレームバッファに格納された画像をビデオスクリーンにオーバーレイして表示します。(A) of FIG.
This is a screen image for displaying a movie as a background image for karaoke. The moving image data is MPEG-4 or H.264. It is compressed in a format such as H.264 (MPEG-4 / AVC) and stored in the
図2の(B)
カラオケの背景画像として、伴奏ならびにユーザの声に応じてリアルタイムに変化する3DCG(三次元コンピュータグラフィックス)で描画された画像オブジェクトを表示する場合の画面イメージです。この例では、伴奏に合わせて「人」を表す画像オブジェクトが踊り、マイクロフォン11から入力されたユーザの声に合わせて画像オブジェクトが歌っているかのごとく口を動かします。画像オブジェクトのモデルデータやアニメーションデータはメモリカートリッジ2に格納されています。画像オブジェクトはグラフィックスプロセッサ107によって字幕画像とともにフレームバッファに描画されます。ディスプレイコントローラ109はフレームバッファに格納された画像を表示します。FIG. 2 (B)
This is a screen image for displaying an image object drawn in 3DCG (3D computer graphics) that changes in real time according to the accompaniment and the user's voice as the background image of karaoke. In this example, an image object representing “people” dances along with the accompaniment, and the mouth moves as if the image object is singing along with the voice of the user input from the
次に図3を参照して、本発明のカラオケ装置1の電気的な構成を示すブロック図を説明する。(図1で説明済みの部分については一部説明を省略します。)Next, with reference to FIG. 3, the block diagram which shows the electrical structure of the
入力段アンプ21
マイクロフォン11から入力されたアナログ音声信号の振幅を増幅してADC付きマイコン22に出力します。
The amplitude of the analog audio signal input from the
ADC付きマイコン22
2つのアナログ入力端子ならびにADC(アナログ−デジタル変換器)を備えるマイコン(マイクロコントローラ)です。入力段アンプ21ならびに外部マイクロフォン入力端子18から入力されたアナログ音声信号をデジタル音声データに変換し、マルチメディアプロセッサSoCに出力します。マルチメディアプロセッサSoC100の第1のUARTポート(UART#0)に接続されます。
A microcomputer (microcontroller) with two analog input terminals and ADC (analog-digital converter). The analog audio signal input from the
キースイッチ13
マルチメディアプロセッサSoCの第1のGPIO(General Purpose I/O)セット(GPIO#0 116)に接続され、各キーが押下されているか否かのステータスがマルチメディアプロセッサSoC100に入力されます。
It is connected to the first GPIO (General Purpose I / O) set (GPIO # 0 116) of the multimedia processor SoC, and the status of whether each key is pressed is input to the multimedia processor SoC100.
拡張コネクタ
マルチメディアプロセッサSoC100の第2のUARTポート(UART#1)に接続されます。電子楽器から入力された演奏情報をシリアル通信でマルチメディアプロセッサSoC100に伝達します。この拡張コネクタの仕様用途は、メモリカートリッジ2に格納されたソフトウェアに応じて様々に変化します。電子楽器以外にも、カラオケ装置1本体の検査器などを接続することも可能です。Expansion connector Connected to the second UART port (UART # 1) of multimedia processor SoC100. Performance information input from an electronic musical instrument is transmitted to the multimedia processor SoC100 via serial communication. The specifications of this expansion connector vary depending on the software stored in the
電源回路29
乾電池28より+3.3V、+1.2V等の複数の直流電源電圧を生成し、装置内の各部に供給します。
Multiple DC power supply voltages such as + 3.3V and + 1.2V are generated from dry cell 28 and supplied to each part in the equipment.
マルチメディアプロセッサSoC(System on Chip)100
カラオケ装置1の電源が投入される、あるいはカラオケ装置1のシステムリセットが発生すると、先ずブートROM23に格納されているプログラムコードを実行し、メモリカートリッジ2からプログラムコードならびにデータをメインメモリ24にロードし、ロードされたプログラムコードの実行を開始します。プログラムコードの実行に従い、ADC付きマイコン22から入力されたデジタル音声データ、キースイッチ13のステータス、電子楽器等4からの入力データに応じて、家庭用テレビ3に出力する画像、音声を生成します。生成された画像はコンポジットビデオ信号に変換され、映像出力端子14を通じて出力されます。音声はI2Sフォーマットのデジタル音声信号としてオーディオDAC26に出力されます。Multimedia processor SoC (System on Chip) 100
When the power of the
ブートROM23
カラオケ装置1の電源が投入される、あるいはカラオケ装置1のシステムリセットが発生した際に、マルチメディアプロセッサSoC100内のCPU102が実行するプログラムコードを格納しています。また、カラオケ装置1起動時に表示されるタイトル画面の画像データ、タイトル画面表示時に再生される音楽データも格納しています。
Stores the program code executed by the
メインメモリ24
マルチメディアプロセッサSoC100の主記憶装置です。8Mバイト〜32Mバイト程度のSDRAMで構成されます。メモリカートリッジ2からロードされたプログラムコードならびにデータを格納する領域、生成された画像を格納するフレームバッファとしての領域、3DCGにマッピングされるテクスチャデータの格納領域などに分かれています。
This is the main memory of the multimedia processor SoC100. It consists of 8Mbyte to 32Mbyte SDRAM. It is divided into an area for storing program code and data loaded from the
オーディオDAC26
マルチメディアプロセッサSoCから出力されるデジタル音声信号をアナログ音声信号に変換し、出力段アンプ27に出力します。Audio DAC26
The digital audio signal output from the multimedia processor SoC is converted into an analog audio signal and output to the
出力段アンプ27
オーディオDAC26から入力されたアナログ音声信号の振幅を増幅し、音声出力端子15,16を通じて家庭用テレビ3に出力します。
The amplitude of the analog audio signal input from the
メモリカートリッジコネクタ12
第2のGPIOセット(GPIO#1)に接続されます。CPU102はI/Oアクセスによりメモリカートリッジ2にアクセスします。
Connected to the second GPIO set (GPIO # 1). The
次に、図4を参照して、マルチメディアプロセッサSoC100の内部構成を示すブロック図を説明する。Next, a block diagram showing the internal configuration of the
CCCP101(Consumer Custom Solutions Platform)
内部の二つのバスシステムAHB104ならびにAPB120間のバスブリッジ、2セットのUART、GPIO#1、外部メモリとのインターフェース(SDRAMコントローラ含む)を含みます。CCCP101 (Consumer Custom Solutions Platform)
It includes a bus bridge between two internal bus systems AHB104 and APB120, two sets of UART,
AHB104
主にメモリアクセス等に用いられる高速な内部バスです。CPU102、DSP103、DMAC106、グラフィックスプロセッサ107、ディスプレイコントローラ109、サウンドプロセッサ110がバスマスタとして接続されています。CCCP101を通じて、メモリバス25やAPB120にアクセスを行うことも可能です。AHB104
A high-speed internal bus mainly used for memory access. The
APB120
主に制御やI/Oアクセスに用いられる低速な内部バスです。DSP103、DMAC106、グラフィックスプロセッサ107、ディスプレイコントローラ109、サウンドプロセッサ110、CAU111、パワーマネジメントユニット112、タイマ113、メールボックス114、GPIO#0がバススレーブとして接続されています。APB120
A low-speed internal bus mainly used for control and I / O access. The
CPU102
32ビットRISC型CPUです。ブートROM23ならびにメインメモリ24に格納されているプログラムコードを実行し、マルチメディアプロセッサSoC100の全体制御等を司ります。CPU102
32-bit RISC type CPU. The program code stored in the
DSP103(Digital Signal Processor)
演算を高速に処理するためのプロセッサです。DSPローカルメモリ105に格納されたプログラムコードを実行し、DSPローカルメモリ105を作業メモリ領域として用います。CPU102との通信は、APB120に接続されたメールボックス114を通じて行います。DMAC106を用い、メインメモリ24とDSPローカルメモリ105の間でDMA転送を行うことが可能です。DSP103 (Digital Signal Processor)
A processor for high-speed processing. The program code stored in the DSP local memory 105 is executed, and the DSP local memory 105 is used as a working memory area. Communication with the
DSPローカルメモリ105
DSP103によって実行されるプログラムコードを格納します。また、DSP103の作業メモリ領域として用いられます。DSPローカルメモリ105と後述するGPUローカルメモリ108は物理的には同じメモリブロックであり、この二つのメモリがメモリブロックの領域を分割して使用します。DSP local memory 105
Stores program code executed by DSP103. It is also used as a working memory area for the
DMAC106(Direct Memory Access Controller)メインメモリ24とDSPメモリとの間、メインメモリ24とGPUローカルメモリ108との間、メインメモリ24のある領域と別の領域との間でのDMA転送を行います。DMAC 106 (Direct Memory Access Controller) performs DMA transfer between the
グラフィックスプロセッサ107
3DCG生成のための幾何演算(行列演算、アフィン変換、投影変換等)、3DCGを構成するポリゴンのセットアップ、ポリゴンならびに2D画像オブジェクトのフレームバッファへの描画を司ります。
Geometric operations for 3DCG generation (matrix operations, affine transformations, projection transformations, etc.) It is responsible for setting up polygons that make up 3DCG and drawing polygons and 2D image objects to the frame buffer.
GPUローカルメモリ108
グラフィックスプロセッサ107の扱うローカルメモリです。3DCG描画の際のZバッファの格納等の用途に用いられます。GPU
This is the local memory handled by the
ディスプレイコントローラ109
ビデオスクリーン、フレームバッファ、4面の2Dキャラクタスクリーンを合成して表示画面イメージを生成します。ビデオスクリーンならびにフレームバッファの画像イメージは、メインメモリ24に格納されます。2Dキャラクタスクリーンは、縦8ピクセル×横8ピクセルから成るキャラクタを格子状に配置したキャラクタの2次元配列から成る画像です。各キャラクタの画像イメージならびにキャラクタの配置情報は、メインメモリ24に格納されます。生成された表示画面イメージは、ビデオコンポジット信号波形を表すデジタルデータストリームに変換され、ビデオDAC115に出力されます。
The display screen image is generated by combining the video screen, frame buffer, and 4D 2D character screen. The video screen and frame buffer images are stored in the
サウンドプロセッサ110
メインメモリ24にPCMデータかつ/またはADPCMデータとして格納されている楽器音のピッチ変換を行い、最大64音の楽器音の合成を行いカラオケの伴奏音を再生します。また、CPU102またはDSP103によってデコードされメインメモリ24に格納された圧縮PCMデータを再生します。再生された音声はI2Sフォーマットのデジタル音声信号として、オーディオDAC26に出力されます。
Performs pitch conversion of instrument sounds stored as PCM data and / or ADPCM data in the
CAU111(Conversion Acceleration Unit)
浮動小数点数と整数または固定小数点数との間の変換を高速に実行します。3DCGで描画される画像オブジェクトの座標等のパラメータ算出に用いられます。CAU111 (Conversion Acceleration Unit)
Performs fast conversion between floating-point numbers and integer or fixed-point numbers. It is used to calculate parameters such as the coordinates of image objects drawn with 3DCG.
パワーマネジメントユニット112
CPU102ならびにDSP103の動作周波数を段階的に制御し、また、使用していない機能ブロックへのクロック信号の供給を停止することにより、マルチメディアプロセッサSoCの電力消費を低減します。Power management unit 112
Reduces the power consumption of the multimedia processor SoC by controlling the operating frequency of the
タイマ113
供給されるクロック信号に基づき、内蔵するカウンタの値を更新します。カウント値が所定の値に一致した時、CPU102かつ/またはDSP103に対する割り込み要求信号をアサートすることも可能です。Timer 113
The built-in counter value is updated based on the supplied clock signal. When the count value matches the predetermined value, it is possible to assert an interrupt request signal for the
メールボックス114
CPU102とDSP103との間のメッセージ通信に用いられます。
It is used for message communication between CPU102 and DSP103.
GPIO#1
汎用目的で用いられるデジタルI/Oポートです。本願カラオケ装置においては、キースイッチ13に接続され、各キーのステータスが入力されます。
Digital I / O port used for general purposes. In this application karaoke device, it is connected to the
メモリバス25
非同期インターフェースのROM、非同期インターフェースのSRAM、NOR型フラッシュメモリ、SDRAMが接続可能です。本願カラオケ装置においては、ブートROM23および8Mバイト〜32MバイトのSDRAMが接続されます。
Asynchronous interface ROM, asynchronous interface SRAM, NOR flash memory, SDRAM can be connected. In this application karaoke device, boot ROM23 and SDRAM of 8MB to 32MB are connected.
ビデオDAC115
ディスプレイコントローラ109から入力されるジタルデータストリームをアナログ信号に変換し、コンポジットビデオ信号として出力します。Video DAC115
The digital data stream input from the
次に、図5、図6および図7を参照して、CPU102およびDSP103の動作フローチャートを用いて、デコードされた動画データをカラオケの背景画像として表示する場合について説明する。S1は、ステップS1の略である。S2〜も同様である。また、そのステップがCPU102の動作を表している場合は、(CPU102)と記載し、DSP103の動作を示している場合は、(DSP103)と記載することとする。Next, with reference to FIGS. 5, 6, and 7, the case where the decoded moving image data is displayed as a karaoke background image using the operation flowcharts of the
S1(CPU102)図5を参照。
システム起動後、CPU102はブートROM23の所定のアドレスに格納されているプログラムコードの実行を開始します。実行開始後、各機能ブロックのハードウェア設定の初期化、DSP103ローカルメモリとして割り当てるメモリ空間の設定、メインメモリ24におけるVRAM領域(フレームバッファ、テクスチャデータ等を格納)の設定等を行います。S1 (CPU 102) See FIG.
After starting the system, the
S3(CPU102)
カラオケ装置としてのタイトル画面の表示を行います。表示のためのプログラムコードならびに画像データは、ブートROM23に予め格納されています。S3 (CPU 102)
Displays the title screen as a karaoke device. The program code and image data for display are stored in the
S5(CPU102)
メモリカートリッジ2からCPU102が実行するプログラムコード、ならびにDSP103が実行するプログラムコードをメインメモリ24にロードします。S5 (CPU 102)
The program code executed by the
S7(CPU102)
プログラムコードのメインメモリ24へのロード完了を待機します。S7 (CPU 102)
Wait for program code to be loaded into
S9(CPU102)
ロード完了後、CPU102がロードされたプログラムコードの実行を開始します。S9 (CPU 102)
After loading is complete, CPU102 starts executing the loaded program code.
S11(CPU102)
DMAにより、DSP103が実行するプログラムコードをDSP103ローカルメモリに転送します。S11 (CPU 102)
The program code executed by the
S13(CPU102)
DMA転送の完了を待機します。S13 (CPU 102)
Wait for DMA transfer to complete.
S15(CPU102)
転送完了後、DSP103に対しDSPローカルメモリ105に転送されたプログラムコードの実行開始を指示します。S15 (CPU 102)
After the transfer is complete, the
S17(DSP103)
DSP103は、プログラムコードの実行開始後、直ちにDSP103の実行環境の初期化処理を行います。S17 (DSP103)
The
S21(CPU102)図6を参照。
CPU102は、所定量のデコード前動画データ、所定量のデコード前音声データをメインメモリ24にロードする必要があるかどうかを確認します。最初にこのステップが実行される際には、メインメモリ24には両者とも全くロードされていないので、必ず両者ともにロードの必要有り、と判断されます。CPU102がロードする必要ありと判断した場合は、S23へ進み、そうでない場合は、S25へ進む。S21 (CPU 102) See FIG.
The
S23(CPU102)
所定量のデコード前動画データ、所定量のデコード前音声データのいずれか、または両方がロードの必要有りと判断されると、それらのデータのメモリカートリッジ2からメインメモリ24へのロードを行います。S23 (CPU102)
If it is determined that either a predetermined amount of pre-decoding video data, a predetermined amount of pre-decoding audio data, or both need to be loaded, the data is loaded from the
S25(CPU102)
現在のプレゼンテーションタイムの確認を行います。プレゼンテーションタイムは再生開始時に0にクリアされ、ビデオ信号の垂直同期、またはタイマ113によるカウント値に基づいて更新されます。S25 (CPU 102)
Check the current presentation time. The presentation time is cleared to 0 at the start of playback, and is updated based on the vertical synchronization of the video signal or the count value by the timer 113.
S27(CPU102)
メインメモリ24にロードされた音声データのデコード処理はCPU102によって行われます。メインメモリ24にロードされた音声データは、AAC、MP3等の形式で圧縮されています。CPU102は、これを解凍し、リニアPCMのオーディオデータストリームを生成します。S27 (CPU 102)
The
S29(CPU102)
デコードされた音声データ(リニアPCM形式)を再生するよう、サウンドプロセッサ110に指示します。S29 (CPU102)
Instructs the
S31(CPU102)
次に表示すべき画像フレームデータが、DSP103によって既にメインメモリ24に格納されているか否かを確認します。CPU102がメインメモリ24に格納されていると判断した場合は、S33へ進み、そうでない場合は、S41へ進む。S31 (CPU 102)
Next, it is confirmed whether the image frame data to be displayed is already stored in the
S33(CPU102)
現在のプレゼンテーションタイムが、次のビデオフレームで新たな画像フレームデータを表示すべきタイミングに到達しているか否かを確認します。CPU102が該タイミングであると判断した場合は、S35へ進み、そうでない場合は、S41へ進む。S33 (CPU102)
Check whether the current presentation time has reached the timing for displaying new image frame data in the next video frame. If the
S35(CPU102)
動画の表示品質を向上させるため、画像データにディザリング処理を施す場合があります。ディスプレイコントローラ109が扱う色データ形式は最大で1ピクセル当り16ビットであるため、デコードされた動画データ(通常1ピクセル当り24ビット)をそのまま16ビットに精度を落とす処理を行うと、色の境界縞(マッハバンド)が目立ってしまいます。デコードされた動画データの各ピクセルの色データにランダムノイズを加えた後に精度を落とす処理を行うと、人間の目にはマッハバンドが目立たなくなります。この処理はディザリングと呼ばれます。ディザリング処理を行う際に、色空間の変換を行う必要がある場合があります。H.264ならびにMPEG−4といった動画コーデックでは、デコード後の動画データの色空間の形式は、色差信号YCbCrとなっています。ディザリングの処理は、通常RGB色空間で行われるので、YCbCRからRGBへの色空間変換処理がディザリング処理の前に必要となります。本実施例においては、色空間変換処理はCPU102によって行われます。次に表示すべき画像フレームデータとして、DSP103によってメインメモリ24に格納されているデータの各ピクセルの色空間を、YCbCrからRGBへと変換します。S35 (CPU 102)
In order to improve the display quality of the video, the image data may be dithered. The color data format handled by the
S37(CPU102)
色空間変換後の画像フレームデータに対し、ディザリング処理を行います。画像フレームデータの各ピクセルの表示XY座標に基づき、ノイズデータをデータテーブルより抽出し、各ピクセルの色データに加算します。S37 (CPU 102)
Dithering the image frame data after color space conversion. Based on the display XY coordinates of each pixel in the image frame data, noise data is extracted from the data table and added to the color data of each pixel.
S39(CPU102)
ディザリング処理が完了した画像フレームデータを、次のビデオフレームでビデオスクリーンに表示するように設定を行います。S39 (CPU 102)
Set the image frame data that has been dithered to be displayed on the video screen in the next video frame.
S41(CPU102)
字幕画像のディスプレイリストの生成を行います。字幕画像は、フレームバッファに描画され、ビデオ信号出力時にはディスプレイコントローラ109によってビデオスクリーンにオーバーレイされて表示されます。本実施例では、字幕画像の各文字データは、スプライト(矩形状の二次元グラフィックスオブジェクト)としてフレームバッファに描画されます。CPU102は、各スプライトの描画座標、色深度、カラールックアップテーブル指定等のパラメータを含むディスプレイリストを作成します。S41 (CPU 102)
Generate a display list of subtitle images. The subtitle image is drawn in the frame buffer and displayed on the video screen by the
S43(CPU102)
S41で作成されたディスプレイリストに基づいて字幕画像をフレームバッファに描画するよう、グラフィックスプロセッサ107に描画指示を与えます。メインメモリ24のVRAM領域には、二セットのフレームバッファが備えられ、描画用と表示用とが随時切り替えられます。グラフィックスプロセッサ107は、描画用に設定されたフレームバッファに対する描画を行います。S43 (CPU 102)
A rendering instruction is given to the
S45(CPU102)
コンポジットビデオ信号における垂直ブランキング期間の開始を待機します。S45 (CPU 102)
Wait for the start of the vertical blanking period in the composite video signal.
S47(CPU102)
フレームバッファかつ/またはビデオスクリーンの更新が完了していれば、ディスプレイコントローラ109が表示を行うために読み出すフレームバッファかつ/またはビデオスクリーン用データの切り替えを行います。S47 (CPU 102)
If the update of the frame buffer and / or video screen has been completed, the
S48(CPU102)
コンポジットビデオ信号の垂直ブランキング期間の開始、またはタイマ113のカウント値に基づいてプレゼンテーションタイムの更新を行います。S48 (CPU 102)
The presentation time is updated based on the start of the vertical blanking period of the composite video signal or the count value of the timer 113.
次にDSP103の処理を説明する。
S49(DSP103)
DSP103は、所定量のデコード前動画データが、メインメモリ24に既にロードされているか否かを確認します。そして、ロードされるまで待機します。Next, the processing of the
S49 (DSP103)
The
S51(DSP103)
DMAを用い、ロード済みのデコード前動画データをメインメモリ24からDSPローカルメモリ105に転送します。S51 (DSP103)
Transfers pre-decoded video data from the
S53(DSP103)
動画のデコード処理を行います。本実施例では、DSP103はH.264デコーダソフトウェアまたはMPEG−4デコーダソフトウェアを実行します。S53 (DSP103)
Decodes the video. In this embodiment, the
S55(DSP103)
DMAを用い、次に表示すべき画像フレームデータをDSPローカルメモリ105からメインメモリ24に転送します。S55 (DSP103)
The image frame data to be displayed next is transferred from the DSP local memory 105 to the
S57(DSP103)
メールボックス114を用い、次に表示すべき画像フレームデータがメインメモリ24に格納済みであることをCPU102に通知します。S57 (DSP103)
The
S59(DSP103)
次のデコード処理の単位に必要なデコード前動画データが、DSPローカルメモリ105中に存在するか否かを確認します。既に存在していれば、次の画像フレームデータのデコード処理を継続できます。(S49へ戻る)そうでない場合は、S53に戻る。S59 (DSP103)
Check whether the pre-decode video data required for the next decoding unit exists in the DSP local memory 105. If it already exists, you can continue decoding the next image frame data. (Return to S49) Otherwise, return to S53.
図7を参照して、カラオケの伴奏ならびにマイクロフォン11から入力されたユーザの音声に応じて変化するCGキャラクタをカラオケの背景画像として表示する場合における、CPU102ならびにDSP103で行われる処理の内容を示すフローチャートを説明する。(シンクロCG)初期化部分の処理(S1〜S17)は図5の動画再生のフローチャートと同じであるため、省略しています。但し、DSP103で実行されるプログラムコードの内容については、動画再生の場合とは異なります。Referring to FIG. 7, a flowchart showing the contents of processing performed by
S61(CPU102)
マイクから入力された音声データをADC付きマイコン22から受領し、メインメモリ24に格納します。外部マイクロフォン5も用いて二人分のユーザの声が入力される場合には、二つの音声データストリームがインターリーブされてADC付きマイコン22から入力されます。S61 (CPU 102)
Audio data input from the microphone is received from the
S63(CPU102)
所定量の音声データの受領が完了を待機します。DSP103で行われる処理には、所定サンプル数のPCM形式の音声データが必要とされます。S63 (CPU102)
Waiting for the completion of receiving the specified amount of audio data. The processing performed by the
S65(CPU102)
メールボックス114を用い、DSP103に所定量の音声データが既にメインメモリ24に格納されていることを通知します。S65 (CPU 102)
Using the
S67(CPU102)
サウンド処理用カウンタの値を更新します。本実施例では、カラオケの伴奏はMIDIベースの楽譜データに基づいて行われます。この場合、テンポや各音符の再生タイミングの管理については、CPU102がサウンド処理用カウンタに基づいて行います。S67 (CPU102)
Updates the value of the sound processing counter. In this example, karaoke accompaniment is based on MIDI-based score data. In this case, the
S69(CPU102)
楽譜データは、各音符の「楽器の種類」「再生開始タイミング」、「再生停止タイミング」、「ピッチ(音の高さ)」、「ベロシティ(発音の強さ)」、「パンポット(音像の位置)」等の情報を、時系列で格納しています。CPU102は、楽譜データの読み出し位置を指し示すポインタを管理し、サウンド処理カウンタの値に応じてポインタをどこまで進めるかを制御します。このステップでは、ポインタが現在指し示す位置の楽譜データを読み出し、解釈を行います。S69 (CPU 102)
The musical score data is “musical instrument type”, “playback start timing”, “playback stop timing”, “pitch (pitch)”, “velocity (sounding intensity)”, “panpot (sound image Information such as “Position” ”is stored in chronological order. The
S70(CPU102)
ポインタの値を、楽譜データから次に読み出しを行うべき位置へ更新します。S70 (CPU 102)
The pointer value is updated from the musical score data to the position to be read next.
S71(CPU102)
サウンド処理用カウンタの値に基づき、ポインタの値が今回処理を行うべき楽譜データを全て読み出し・解釈済みであるか否かを判断します。読み出し済みならS73へ進み、そうでないならS69へ戻る。S71 (CPU 102)
Based on the value of the sound processing counter, it is determined whether or not the pointer value has been read and interpreted all the musical score data to be processed this time. If it has been read, the process proceeds to S73, and if not, the process returns to S69.
S73(CPU102)
読み出した楽譜データの「楽器の種類」「再生開始タイミング」、「再生停止タイミング」、「ピッチ(音の高さ)」、「ベロシティ(発音の強さ)」、「パンポット(音像の位置)」の情報に応じて、描画する画像オブジェクトの「種類」、「大きさ」、「色」、「形状」、「座標」のパラメータを算出します。S73 (CPU102)
"Musical instrument type", "Playback start timing", "Playback stop timing", "Pitch (pitch)", "Velocity (sounding strength)", "Panpot (sound image position)" The "type", "size", "color", "shape", and "coordinate" parameters of the image object to be drawn are calculated according to the information of "".
S75(CPU102)
メールボックス114を確認し、DSP103からマイク入力音声のパラメータが通知されているか否かを判断します。パラメータが通知済みならばS77へ進み、そうでないなら待機する。S75 (CPU102)
Check the
S77(CPU102)
DSP103から通知されるマイク入力音声のパラメータ「平均レベル」、「ピークレベル」、「最もエネルギーの大きな周波数成分」、「特定の周波数成分のエネルギー」に応じて、描画する画像オブジェクトの「種類」、「大きさ」、「色」、「形状」、「座標」のパラメータを変化させます。S77 (CPU 102)
According to the parameters “average level”, “peak level”, “frequency component with the largest energy”, and “energy of a specific frequency component” of the microphone input sound notified from the
S79(CPU102)
S73ならびにS77にて算出された画像オブジェクトのパラメータに基づき、背景として表示される画像オブジェクトのディスプレイリストを作成します。また、字幕画像のディスプレイリストも合わせて作成します。背景として表示される画像オブジェクトの内、2DCGで再現されるものはスプライト、3DCGで再現されるものはポリゴンとしてフレームバッファに描画されます。字幕画像を構成する各文字は、動画再生の場合と同様に、スプライトとしてフレームバッファに描画されます。CPU102は、「各ポリゴンの描画座標、頂点色、テクスチャパターン、テクスチャ色深度、頂点テクスチャ座標等」、ならびに、「スプライトの描画座標、色深度、カラールックアップテーブル指定等」のパラメータを含むディスプレイリストを作成します。S79 (CPU 102)
Based on the image object parameters calculated in S73 and S77, a display list of image objects to be displayed as a background is created. A display list of subtitle images is also created. Of the image objects displayed as the background, those reproduced with 2DCG are drawn in the frame buffer as sprites and those reproduced with 3DCG as polygons. Each character that makes up a subtitle image is drawn as a sprite in the frame buffer, just like when playing a movie. The
S81(CPU102)
S79で作成されたディスプレイリストに基づいて、背景として表示される画像オブジェクト、ならびに、字幕画像をフレームバッファに描画するよう、グラフィックスプロセッサ107に描画指示を与えます。S81 (CPU 102)
Based on the display list created in S79, the
S83(CPU102)
コンポジットビデオ信号における垂直ブランキング期間の開始を待機します。S83 (CPU102)
Wait for the start of the vertical blanking period in the composite video signal.
S84(CPU102)
フレームバッファの更新が完了していれば、ディスプレイコントローラ109が表示を行うために読み出すフレームバッファの切り替えを行います。S84の終了後、S61に戻ります。S84 (CPU102)
If the frame buffer update is complete, the
一方、DSP103の動作について説明する。
S85(DSP103)
所定量のマイク入力音声データが、メインメモリ24に既にロードされているか否かを確認します。ロードされていた場合は、S87に進み、そうでない場合は待機する。On the other hand, the operation of the
S85 (DSP103)
Check whether a predetermined amount of microphone input audio data is already loaded in the
S87(DSP103)
DMAを用い、ロード済みのマイク入力音声データをメインメモリ24からDSPローカルメモリ105に転送します。S87 (DSP103)
Using DMA, the loaded microphone input audio data is transferred from the
S89(DSP103)
マイク入力音声データの「平均レベル」ならびに「ピークレベル」の算出を行います。平均レベルは、全サンプルの平均値を求めた後、平均偏差または標準偏差より求めます。ピークレベルは、全サンプルの平均値からの最大偏差より求めます。S89 (DSP103)
Calculates “average level” and “peak level” of microphone input voice data. The average level is calculated from the average deviation or standard deviation after calculating the average value of all samples. The peak level is obtained from the maximum deviation from the average value of all samples.
S91(DSP103)
マイク入力音声データに対するFFT(高速フーリエ変換)処理を行います。処理結果より、「最もエネルギーの大きな周波数成分」ならびに「特定の周波数成分のエネルギー」を算出します。S91 (DSP103)
Performs FFT (Fast Fourier Transform) processing for microphone input audio data. From the processing results, calculate the “frequency component with the largest energy” and the “energy of a specific frequency component”.
S93(DSP103)
メールボックス114を用い、S89ならびにS91で算出したマイク入力音声データの「平均レベル」、「ピークレベル」、「最もエネルギーの大きな周波数成分」、「特定の周波数成分のエネルギー」をCPU102に通知します。S93の終了後、S85に戻ります。S93 (DSP103)
Using the
次に、本発明のカラオケ装置を用いた、アプリケーションソフトの例を示す。Next, an example of application software using the karaoke apparatus of the present invention will be shown.
1.動画背景とシンクロCGの合成例
DSP103は、H.264またはMPEG−4のデコーダソフトウェアを実行し、圧縮された動画データを解凍し、メインメモリ24に格納する。1. An
CPU102は、MIDIベースの楽譜データに基づき、サウンドプロセッサ110に対してカラオケの伴奏の再生指示を行う。The
また、CPU102は、楽譜データ中の音符のパラメータ、ならびにマイク音声のパラメータに基づき、3DCG画像オブジェクトのパラメータを算出する。さらに算出したパラメータに基づき、3DCG画像オブジェクトを構成する各ポリゴンのディスプレイリストを生成し、グラフィックスプロセッサ107に渡す。Further, the
また、CPU102は、楽譜データに埋め込まれた歌詞データならびに歌詞表示制御データに基づき、字幕画像を構成する各スプライトのディスプレイリストを生成し、グラフィックスプロセッサ107に渡す。Further, the
グラフィックスプロセッサ107は、ディスプレイリストに基づき、ポリゴンで構成された3DCG画像オブジェクト、ならびにスプライトで構成された字幕画像をフレームバッファに描画する。The
ディスプレイコントローラ109は、メインメモリ24に格納された解凍済み動画データをビデオスクリーンの上に、フレームバッファに格納された画像をオーバーレイして表示する。The
これにより、予め録画された動画の上に、伴奏やマイク音声に応じてリアルタイムに変化するCGキャラクタを合成した画像を、カラオケ背景として用いることが可能。As a result, it is possible to use, as a karaoke background, an image in which a CG character that changes in real time according to accompaniment or microphone sound is synthesized on a previously recorded video.
2.シンクロCGカラオケの表示例
ポリゴンで表現される3DCG画像オブジェクトとして「人間」を表示。2. Display example of synchro CG karaoke “Human” is displayed as a 3DCG image object represented by polygons.
伴奏の楽譜データ中の、「ピアノ」の音符の「ピッチ(音の高さ)」に応じて「人間」の手の位置が上下に移動。ピッチが高ければ手の位置も高く、ピッチが低ければ手の位置も低く描画される。The position of the “human” hand moves up and down according to the “pitch (pitch)” of the “piano” notes in the accompaniment score data. If the pitch is high, the hand position is high, and if the pitch is low, the hand position is low.
「人間」が画面内でジャンプを繰り返している。マイク音声データの「ピークレベル」に応じてジャンプの高さが決定される。ピークレベルが高ければジャンプの高さが高くなり、ピークレベルが低ければジャンプの高さも低くなる。“Human” repeatedly jumps on the screen. The jump height is determined according to the “peak level” of the microphone sound data. If the peak level is high, the jump height is high, and if the peak level is low, the jump height is low.
3.伴奏やマイク音声に応じてインタラクティブに変化するカラオケ動画背景例
多数の短い動画データがメモリカートリッジ2に予め格納されている。3. A large number of short karaoke video background examples that change interactively according to accompaniment and microphone sound are stored in the
CPU102は、楽譜データ中の音符のパラメータ、ならびにマイク音声のパラメータに基づき、現在再生中の動画データの再生が完了するまでに、どの動画データを次に再生するを決定し、デコード前の動画データをメモリカートリッジ2からメインメモリ24にロードする。The
DSP103は、メインメモリ24に格納された動画データを順次デコード(解凍)する。The
これにより、例えば、伴奏やマイク音声に応じてストーリーが変化する動画をカラオケ背景として表示できる。Thereby, for example, a moving image whose story changes according to accompaniment or microphone sound can be displayed as a karaoke background.
さらに、本発明のカラオケ装置は次のような特徴を持ってもよい。
4.例えば、「カラオケ装置を用いるボイストレーニング」を実行する場合は、次のような構成を用いて実現することが可能である。Furthermore, the karaoke apparatus of the present invention may have the following features.
4). For example, when “voice training using a karaoke device” is executed, it can be realized using the following configuration.
マルチメディアプロセッサSoC100に搭載されているDSP103は、マイクから入力されデジタルデータに変換されたユーザの音声に対し、FFT(高速フーリエ変換)を施し、最もエネルギーの大きな周波数成分を算出する。The
マルチメディアプロセッサSoC100に搭載されているCPU102は、MIDIベースの楽譜データをメモリカートリッジ2から読み出しつつ、サウンドプロセッサ110に指示を与え、カラオケ伴奏を再生する。The
楽譜データには、「ボイスガイドデータ」が含まれる。ボイスガイドデータは、ユーザが歌うべき音階の各音符の音の高さならびにタイミングを示すデータである。CPU102はボイスガイドデータを楽譜データから読み出すが、必ずしもサウンドプロセッサ110を用いて再生は行わない。The score data includes “voice guide data”. The voice guide data is data indicating the pitch and timing of each note of the scale to be sung by the user. The
CPU102は、ボイスガイドデータの各音符に対応する、1または複数の第1の楽譜画像を画面に表示するようグラフィックスプロセッサ107に指示を与える。音符画像の表示位置は、ボイスガイドデータの音符の音の高さに関連付けられる。例えば、音の高さが高ければ、音符画像の画面上における垂直表示位置が高くなる。The
ボイスガイドデータの各音符に対応する音符画像の近傍に、第1の楽譜画像に一対一に対応する第2の楽譜画像を画面に表示するようグラフィックスプロセッサ107に指示を与える。第1の楽譜画像と第2の楽譜画像とは、例えば色または形状が異なり、ユーザが画面上でその違いを識別可能なようになされている。第2の音符画像の表示位置は、DSP103から伝達された「ユーザの音声の最もエネルギーの大きな周波数成分」の高さに関連付けられる。例えば、音の高さが高ければ、第2の音符画像の画面上における垂直表示位置が高くなる。The
ユーザは、画面上の二種類の音符画像の表示位置の違いから、歌うべき音階の高さと、現在歌っている音の高さとのずれをリアルタイムに認識することができるため、カラオケのトレーニングとしての効果が期待できる。The user can recognize in real time the difference between the pitch of the musical note to be sung and the pitch of the current singing sound from the difference in the display position of the two types of note images on the screen. The effect can be expected.
5.音声を利用したゲーム
・音声認識機能や英語発音評定機能を付加することにより、3DCGなどとあわせて、従来機器では実現困難なゲームコンテンツの提供が可能である。
・本発明によれば、拡張ポート17にマイク、マラカス、タイコ等を接続することによって、音楽の演奏や各種音楽ゲームを実行可能である。5. By adding a game / speech recognition function using speech and an English pronunciation rating function, it is possible to provide game content that is difficult to achieve with conventional devices in combination with 3DCG and the like.
According to the present invention, music performance and various music games can be executed by connecting a microphone, maracas, tyco, etc. to the
6.伴奏用楽器
本体拡張ポート17に接続することにより、楽器を用いた伴奏が可能になる。マラカスや太鼓などの演奏はもとより、楽器マイナス1演奏(ちょうどよいタイミングで楽器を操作することにより、そのタイミングの音程・音色での音が鳴る)によりギターやピアノなどの音程がある楽器の演奏も可能である。6). By connecting to the accompaniment instrument main
7.通信カラオケ
ROMカートリッジスロットに無線LANモジュールを差し込むことにより、PC不要の通信カラオケが実現可能である。7). By inserting a wireless LAN module into the communication karaoke ROM cartridge slot, a PC-free communication karaoke can be realized.
8.動画表示機能を活かした「カラドラマ」・「カラアニメ」
既存動画コンテンツの二次利用が可能なので、ドラマやアニメの登場人物になりきることができる「カラドラマ」や「カラアニメ」コンテンツの提供が可能である。(「カラドラマ」・「カラアニメ」とは、ドラマやアニメの登場人物のアテレコを楽しむことができるコンテンツです。)特定の人物の音声だけをミュートした状態で、その人物の台詞をアテレコすることにより、あたかも、その番組に登場しているような楽しみを得ることができます。さらに、音声認識を利用して、ユーザのアテレコの内容によりドラマの展開を変えるなど、これまでの機器では実現が困難であった、さまざまな遊びを提供することが可能です。8). “Kara-drama” and “Kara-Anime” utilizing the video display function
Since secondary use of existing video content is possible, it is possible to provide “Kara-drama” and “Kara-Anime” content that can become characters in drama and anime. ("Kara-drama" and "Kara-Anime" are contents that allow you to enjoy the drama and anime characters' telephony.) By muting only the voice of a specific person, by telcoing that person's dialogue , You can get the fun as if it were on the show. Furthermore, by using voice recognition, it is possible to provide a variety of games that were difficult to achieve with conventional devices, such as changing the development of dramas depending on the contents of the user's ateleco.
なお、本願発明のカラオケ装置の特徴をまとめると次のようになる。
本願発明を用いることにより、テレビに接続する家庭用カラオケ装置を安価に実現することができます。本願発明は、CPU、グラフィックスプロセッサ107、サウンドプロセッサ110等のカラオケ装置に必要とされる機能を内蔵しているだけでなく、搭載されているDSP103により、圧縮された動画データの解凍、様々なサウンドプロセッシング等を行うことが可能です。
本願発明のカラオケ装置の特長を以下に示します。The characteristics of the karaoke apparatus of the present invention are summarized as follows.
By using the present invention, a home karaoke device connected to a television can be realized at low cost. The present invention not only incorporates functions necessary for a karaoke apparatus such as a CPU, a
The features of the karaoke device of the present invention are as follows.
1.動画によるカラオケの背景
本願発明のカラオケ装置に搭載されているCPU102ならびにDSP103により、H.264またはMPEG−4による動画をカラオケの背景として再生することが可能です。H.264でQVGA(320×240ピクセル)/15fps、MPEG−4でQVGA/30fpsを達成できる。1. Background of Karaoke by Moving Image The
2.さまざまなオーディオコーデックへの対応
DSP103のミドルウェアとして、MP3、AAC SBR等の様々なオーディオコーデック(デコーダ)が既に用意されています。これにより、従来のMIDIベースの家庭用カラオケ機器では再生できなかった「ボーカル付きのオーディオトラック」や「生演奏を録音したトラック」をカラオケの伴奏として再生することが可能になりました。2. Correspondence to various audio codecs As middleware of DSP103, various audio codecs (decoders) such as MP3 and AAC SBR are already prepared. This has made it possible to play “audio tracks with vocals” and “tracks recorded with live performances” as accompaniment to karaoke, which could not be played with conventional MIDI-based home karaoke equipment.
3.伴奏、マイク音声にシンクロした3Dグラフィックス
本願発明のカラオケ装置に搭載されているGPUの優れた3Dグラフィックス生成機能と、DSP103で実行されるFFT等のミドルウェアとの組み合わせにより、「カラオケ伴奏」ならびに「マイクから入力されたユーザーの音声」にシンクロした3Dグラフィックスをカラオケの背景として表示することが可能です。3. Accompaniment, 3D graphics synchronized to mic sound By combining the excellent 3D graphics generation function of the GPU installed in the karaoke apparatus of the present invention with middleware such as FFT executed by the
1 …カラオケ装置
2 …メモリカートリッジ
3 …家庭用テレビ
4 …電子楽器等
5 …外部マイクロフォン
11 …マイクロフォン
12 …メモリカートリッジコネクタ
13 …キースイッチ
14 …映像出力端子
15 …音声出力端子(左)
16 …音声出力端子(右)
17 …拡張ポート
18 …外部マイクロフォン入力端子
21 …入力段アンプ
22 …ADC付きマイコン
23 …ブートROM
24 …メインメモリ
25 …メモリバス
26 …オーディオDAC
27 …出力段アンプ
28 …乾電池
29 …電源回路
100…マルチメディアプロセッサSoC
101…CCCP
102…CPU
103…DSP
104…AHB
105…DSPローカルメモリ
106…DMAC
107…グラフィックスプロセッサ
108…GPUローカルメモリ
109…ディスプレイコントローラ
110…サウンドプロセッサ
111…CAU
112…パワーマネジメントユニット
113…タイマ
114…メールボックス
115…ビデオDAC
116…GPIO#O
120…APBDESCRIPTION OF
16: Audio output terminal (right)
17 ...
24 ...
27 ... Output stage amplifier 28 ...
101 ... CCCP
102 ... CPU
103 ... DSP
104 ... AHB
105 ... DSP local memory 106 ... DMAC
107 ...
112 ... Power management unit 113 ...
116 ... GPIO # O
120 ... APB
Claims (2)
前記カラオケ装置に内蔵、または着脱可能なマイクロフォン、
前記カラオケ装置に内蔵、または着脱可能なメモリ、および
二次元および/または三次元で表現される画像オブジェクトを生成し、1または複数の前記画像オブジェクトから構成される画像をカラオケの背景画像として生成し、かつカラオケの歌詞を示す歌詞画像と合成し、映像信号として出力する画像処理手段を含み、
前記画像処理手段は、
「前記メモリに格納されたカラオケ伴奏楽譜データ」に含まれる「楽器の種類」、「音の高さ(ピッチ)」、「音の持続時間」、「発音の強さ(ベロシティ)」、「音像の位置(パンポット)」、ならびに「マイクロフォンから入力されたユーザの音声をアナログ−デジタル変換して得られたデータ」を解析して得られる「平均レベル」、「ピークレベル」、「最もエネルギーの大きな周波数成分」、「特定の周波数成分のエネルギー」のうちの1または複数に応じて、前記画像オブジェクトの「種類」、「大きさ」、「色」、「形状」、「座標」の1または複数のパラメータを動的に変化させることを特徴とするカラオケ装置。A karaoke device capable of outputting a video signal and an audio signal to a home TV device,
A microphone built into or detachable from the karaoke device;
A built-in or detachable memory in the karaoke device, and an image object expressed in two and / or three dimensions are generated, and an image composed of one or a plurality of the image objects is generated as a karaoke background image And image processing means for synthesizing with a lyric image showing lyrics of karaoke and outputting as a video signal,
The image processing means includes
“Musical instrument type”, “pitch”, “sound duration”, “sounding intensity (velocity)”, “sound image” included in the “karaoke accompaniment score data stored in the memory” "Panpot", as well as "Data obtained by analog-to-digital conversion of user's voice input from microphone", "Average level", "Peak level", "Most energy" Depending on one or more of “large frequency component” and “energy of specific frequency component”, one of “type”, “size”, “color”, “shape”, and “coordinate” of the image object A karaoke apparatus characterized by dynamically changing a plurality of parameters.
さらに電子楽器を接続可能な接続ポートを備え、
「前記接続ポートからMIDIまたはMIDIに類似の形式で入力される楽器演奏データ」に含まれる「楽器の種類」、「音の高さ(ピッチ)」、「音の持続時間」、「発音の強さ(ベロシティ)」、「音像の位置(パンポット)」のうちの1または複数のパラメータに応じて、前記画像オブジェクトの「種類」、「大きさ」、「色」、「形状」、「座標」の1または複数のパラメータを動的に変化させることを特徴とする請求項1に記載のカラオケ装置。The karaoke device
In addition, it has a connection port that can connect electronic musical instruments
“Musical instrument performance data input from the connection port in a format similar to MIDI or MIDI”, “Musical instrument type”, “Pitch”, “Sound duration”, “Strong pronunciation” “Type”, “size”, “color”, “shape”, “coordinate” of the image object in accordance with one or more parameters of “sales (velocity)” and “sound image position (panpot)” The karaoke apparatus according to claim 1, wherein one or a plurality of parameters are dynamically changed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006336357A JP2008122888A (en) | 2006-11-14 | 2006-11-14 | Karaoke machine |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006336357A JP2008122888A (en) | 2006-11-14 | 2006-11-14 | Karaoke machine |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008122888A true JP2008122888A (en) | 2008-05-29 |
Family
ID=39507663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006336357A Pending JP2008122888A (en) | 2006-11-14 | 2006-11-14 | Karaoke machine |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008122888A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013516010A (en) * | 2009-12-29 | 2013-05-09 | ゼットティーイー コーポレイション | Multiprocessor complete mutual access method and system |
WO2013077663A2 (en) * | 2011-11-25 | 2013-05-30 | 주식회사 지에스엘앤씨 | Musical instrument playing room system |
-
2006
- 2006-11-14 JP JP2006336357A patent/JP2008122888A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013516010A (en) * | 2009-12-29 | 2013-05-09 | ゼットティーイー コーポレイション | Multiprocessor complete mutual access method and system |
WO2013077663A2 (en) * | 2011-11-25 | 2013-05-30 | 주식회사 지에스엘앤씨 | Musical instrument playing room system |
WO2013077663A3 (en) * | 2011-11-25 | 2013-07-25 | 주식회사 지에스엘앤씨 | Musical instrument playing room system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3686906B2 (en) | Music game program and music game apparatus | |
JP5241805B2 (en) | Timing offset tolerance karaoke game | |
JP2003509729A (en) | Method and apparatus for playing musical instruments based on digital music files | |
JP2002215151A (en) | Acoustic signal output method and bgm generating method | |
JP2008122888A (en) | Karaoke machine | |
JP2002006866A (en) | Karaoke sing-along machine | |
JP2011206267A (en) | Game device, game progressing method, and game progressing program | |
JP4366240B2 (en) | Game device, pitched sound effect generating program and method | |
JP2004279786A (en) | Karaoke machine, interval deciding method, and program | |
JP2000047675A (en) | Singing sound device and action expression deciding method | |
JPH07152369A (en) | Multi-media controller | |
WO2010084830A1 (en) | Voice processing device, chat system, voice processing method, information storage medium, and program | |
JP5210908B2 (en) | Moving image generating device, game device, moving image generating method, and program | |
JP2011154289A (en) | Karaoke machine for enjoying mood for urging audience to sing in chorus | |
JP3942720B2 (en) | Musical sound generating device, image generating device, game device, and information storage medium | |
JP3522194B2 (en) | A karaoke device with a feature of modifying the lyrics display | |
JP4368817B2 (en) | Portable music player with lyrics display | |
JP2008233926A (en) | Stationary karaoke device, and mobile karaoke device and system | |
JP4169346B2 (en) | Karaoke performance device with language-specific display function | |
JP2001232058A (en) | Game device and information storage medium | |
JP3892433B2 (en) | Karaoke device, karaoke method, and program | |
JP3404594B2 (en) | Recording medium and music game apparatus | |
JP4714230B2 (en) | Audio processing apparatus, audio processing method, and program | |
WO2011030761A1 (en) | Music game system, computer program of same, and method of generating sound effect data | |
JP2009080372A (en) | Karaoke device |