JP2006106411A - Sound output controller, musical piece reproduction device, sound output control method, program thereof and recording medium with the program recorded thereon - Google Patents
Sound output controller, musical piece reproduction device, sound output control method, program thereof and recording medium with the program recorded thereon Download PDFInfo
- Publication number
- JP2006106411A JP2006106411A JP2004293801A JP2004293801A JP2006106411A JP 2006106411 A JP2006106411 A JP 2006106411A JP 2004293801 A JP2004293801 A JP 2004293801A JP 2004293801 A JP2004293801 A JP 2004293801A JP 2006106411 A JP2006106411 A JP 2006106411A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- music
- output control
- sound output
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Abstract
Description
本発明は、所定の音を出力させる制御をする音出力制御装置、楽曲再生装置、音出力制御方法、そのプログラム、および、そのプログラムを記録した記録媒体に関する。 The present invention relates to a sound output control device that controls to output a predetermined sound, a music playback device, a sound output control method, a program thereof, and a recording medium on which the program is recorded.
従来、音声を認識して音声データを出力するロボットや玩具、テレビゲームプログラムなどの各種構成が広く利用されている(例えば、特許文献1参照)。例えば、特許文献1に記載のものは、ロボットに適用した構成で、頭部ユニットの所定位置に配設されたマイクロフォンでユーザの発話を含む周囲の音声を集音する。そして、得られた音声信号に基づいて、モデル記憶部の状態情報における韻律を感情モデルの値に基づいて制御した合成音を生成し、スピーカから出力させる構成が採られている。
Conventionally, various configurations such as robots, toys, and video game programs that recognize voice and output voice data have been widely used (see, for example, Patent Document 1). For example, the device described in
ところで、上述した特許文献1に記載のような発音に応じて音声出力する従来の構成では、例えば楽曲に応じて聴取者が合いの手を入れた場合、合いの手の発話に応じて音声出力される。しかしながら、楽曲のリズムに応じたタイミングの合いの手に対して、合いの手に対して音声出力される合成音は楽曲のリズムから既にずれたタイミングとなり、聴取者の楽曲の鑑賞が阻害されるおそれがある問題が一例として挙げられる。
By the way, in the conventional structure which outputs a sound according to pronunciation like the
本発明の目的は、このような点に鑑みて、所定の音を良好に出力可能な音出力制御装置、楽曲再生装置、音出力制御方法、そのプログラム、および、そのプログラムを記録した記録媒体を提供することである。 In view of the above, an object of the present invention is to provide a sound output control device, a music playback device, a sound output control method, a program thereof, and a recording medium on which the program is recorded. Is to provide.
請求項1に記載の発明は、所定の音を音出力手段から出力させる音出力制御装置であって、外部状態に関する外部状態情報を取得する外部状態情報取得手段と、楽曲に関する楽曲データを出力する楽曲出力手段から出力される前記楽曲データの音の特性を認識する楽曲特性認識手段と、所定の前記外部状態に関する前記外部状態情報を取得したことを認識すると、前記音の特性に同調する出力形態の音を前記音出力手段から出力させる制御をする音出力制御手段と、を具備したことを特徴とした音出力制御装置である。
The invention according to
請求項21に記載の発明は、請求項1ないし請求項20のいずれかに記載の音出力制御装置と、前記楽曲データを再生して前記楽曲出力手段から出力させる処理をする楽曲再生処理手段と、を具備したことを特徴とした楽曲再生装置である。 A twenty-first aspect of the present invention is the sound output control device according to any one of the first to twentieth aspects of the present invention, and a music reproduction processing unit that performs a process of reproducing the music data and outputting the music data from the music output unit. , A music reproducing apparatus characterized by comprising:
請求項22に記載の発明は、請求項1ないし請求項20のいずれかに記載の音出力制御装置と、前記楽曲データを取得して前記音出力制御装置の前記音出力制御手段で出力が制御される前記音を前記楽曲データの音に重畳させた重畳楽曲データを生成する重畳楽曲データ生成手段と、前記重畳楽曲データを再生して前記楽曲出力手段から出力させる処理をする楽曲再生処理手段と、を具備したことを特徴とした楽曲再生装置である。 According to a twenty-second aspect of the present invention, the output is controlled by the sound output control device according to any one of the first to twentieth aspects, and the sound output control unit of the sound output control device that acquires the music data. Superimposed music data generating means for generating superimposed music data obtained by superimposing the sound to be sounded on the music data; music reproduction processing means for performing processing for reproducing the superimposed music data and outputting it from the music output means; , A music reproducing apparatus characterized by comprising:
請求項23に記載の発明は、所定の音を音出力手段から出力させる音出力制御方法であって、外部状態に関する外部状態情報を取得し、楽曲に関する楽曲データを出力する楽曲出力手段から出力される前記楽曲データの音の特性を認識し、所定の前記外部状態に関する前記外部状態情報を取得したことを認識すると、前記音の特性に同調する出力形態の音を前記音出力手段から出力させる制御をすることを特徴とする音出力制御方法である。 The invention described in claim 23 is a sound output control method for outputting a predetermined sound from the sound output means, which is output from the music output means for acquiring external state information relating to the external state and outputting music data relating to the music. Control to output from the sound output means a sound in an output form tuned to the sound characteristics when recognizing the sound characteristics of the music data and recognizing that the external state information relating to the predetermined external state has been acquired. A sound output control method characterized by:
請求項24に記載の発明は、演算手段を請求項1ないし請求項20のいずれかに記載の音出力制御装置として機能させることを特徴とした音出力制御プログラムである。 According to a twenty-fourth aspect of the present invention, there is provided a sound output control program that causes a computing means to function as the sound output control device according to any one of the first to twentieth aspects.
請求項25に記載の発明は、請求項23に記載の音出力制御方法を演算手段に実行させることを特徴とした音出力制御プログラムである。 A twenty-fifth aspect of the invention is a sound output control program that causes a calculation means to execute the sound output control method according to the twenty-third aspect.
請求項26に記載の発明は、請求項24または請求項25に記載の音出力制御プログラムが演算手段にて読取可能に記録されたことを特徴とした音出力制御プログラムを記録した記録媒体である。 The invention described in claim 26 is a recording medium on which a sound output control program is recorded, wherein the sound output control program according to claim 24 or claim 25 is recorded so as to be readable by an arithmetic means. .
以下、本発明に係る一実施の形態を図面に基づいて説明する。本実施の形態では、本発明の音出力制御装置を備えた楽曲再生装置として移動体である例えば車両に搭載される装置構成について例示して説明する。なお、本発明における楽曲再生装置としては、移動体に搭載される構成の他、例えば家屋などの建造物に設置される構成や携帯型の構成にも適用できる。また、本実施の形態では、外部状態である外部音の状態として、車両の運転手や同乗者(以下、利用者と称す)が発音する音声の状態を例示して説明する。また、外部状態である身体の動作の状態として、利用者の身体の動作の状態を例示して説明する。なお、外部音としては、利用者が発音する音声に限らず、利用者の手拍子や鼻歌あるいは口笛の音、車外から車内に伝播する音、さらにはタンバリンやカスタネットあるいはマラカスなどの楽器を奏でる音など、各種の音を対象とすることができる。また、身体の動作としては、車内や車外の動物や車外の人物の身体の動作を対象とすることができる。さらに、外部状態としては、車内や車外の物体の車両に対応する動きなどを対象とすることができる。図1は、本発明に係る一実施の形態における楽曲再生システムの概略構成を示すブロック図である。図2は、楽曲リストデータの概略構成を示す模式図である。図3は、挿入音リストデータの概略構成を示す模式図である。図4は、楽曲再生装置を構成する演算手段の概略構成を示す模式図である。図5は、音声対応モードにおける挿入音の出力状態の一例を示す模式図で、(A)は楽曲の歌詞で、(B)は音声で、(C)は挿入音である。図6は、動作対応モードにおける挿入音の出力状態の一例を示す模式図で、(A)は楽曲の歌詞で、(B)は動作で、(C)は挿入音である。 Hereinafter, an embodiment according to the present invention will be described with reference to the drawings. In the present embodiment, an apparatus configuration mounted on, for example, a vehicle that is a moving body will be described as an example of a music reproducing apparatus including the sound output control apparatus of the present invention. In addition, as a music reproduction apparatus in this invention, it is applicable also to the structure installed in structures, such as a house, and a portable structure other than the structure mounted in a mobile body. Further, in the present embodiment, as an external sound state that is an external state, a sound state that is sounded by a vehicle driver or a passenger (hereinafter referred to as a user) will be described as an example. Moreover, the state of the user's body movement will be described as an example of the state of the body movement that is an external state. The external sound is not limited to the sound produced by the user, but the user's clapping, nasal or whistling sounds, the sound propagating from the outside of the vehicle to the inside of the vehicle, and the sound of playing an instrument such as a tambourine, castanets or maracas For example, various sounds can be targeted. In addition, the movement of the body can be the movement of an animal inside or outside the car or a person outside the car. Furthermore, as an external state, a movement corresponding to a vehicle of an object inside or outside the vehicle can be targeted. FIG. 1 is a block diagram showing a schematic configuration of a music reproducing system according to an embodiment of the present invention. FIG. 2 is a schematic diagram showing a schematic configuration of music list data. FIG. 3 is a schematic diagram showing a schematic configuration of insertion sound list data. FIG. 4 is a schematic diagram showing a schematic configuration of a calculation means constituting the music reproducing device. FIG. 5 is a schematic diagram showing an example of the output state of the insertion sound in the voice corresponding mode, where (A) is the lyrics of the music, (B) is the voice, and (C) is the insertion sound. FIG. 6 is a schematic diagram showing an example of the output state of the insertion sound in the motion corresponding mode, where (A) is the lyrics of the music, (B) is the operation, and (C) is the insertion sound.
〔楽曲再生システムの構成〕
図1において、100は楽曲再生システムで、この楽曲再生システム100は、移動体としての例えば車内で利用者が発音する音声に対応する音を再生中の楽曲に合わせて出力するものである。また、楽曲再生システム100は、利用者の動作に対応する音を再生中の楽曲に合わせて出力するものである。なお、以下において、音声や動作に対応して出力される音を挿入音と称して説明する。ここで、移動体としては、自動車や電車などの車両に限らず、例えば飛行機や船舶など移動するいずれの移動体にも適用できる。そして、楽曲再生システム100は、マイクロフォン200(以下、マイク200と称す)と、撮像手段300と、楽曲再生装置400と、などを備えている。
[Configuration of music playback system]
In FIG. 1,
マイク200は、車両の室内空間における例えば天井の略中央部分に配設され、利用者の音声や車外から車内に伝播する音などの車内で認識できる音(以下、車内音と称す)を取得すなわち集音する。そして、マイク200は、集音した車内音に対応する外部状態情報としての外部音情報である車内音情報を楽曲再生装置400へ出力する。
The
撮像手段300は、車両の室内空間における例えば天井の前方部分に配設され、利用者を撮像する。そして、この撮像した内容に対応する外部状態情報としての身体動作情報である撮像データを楽曲再生装置400へ出力する。なお、撮像手段300の代わりに、例えば以下のようなセンサを設ける構成としてもよい。すなわち、室内空間の所定領域において利用者から放射される熱量を認識し、この熱量に対応する外部状態情報を出力するセンサを設ける構成としてもよい。また、所定の光線を所定領域に照射して、この光線の反射状態に対応する外部状態情報を出力するセンサを設ける構成としてもよい。さらに、車両に配設される構成に限らず、身体の一部に配設され振動ジャイロや加速度計などの検出値や測定値を外部状態情報として出力するセンサを設ける構成としてもよい。
The imaging means 300 is disposed, for example, in the front part of the ceiling in the vehicle interior space, and images the user. Then, imaging data that is physical motion information as external state information corresponding to the captured content is output to the
楽曲再生装置400は、MIDI(Musical Instrument Digital Interface)形式やWAVE形式あるいはMPEG(Moving Picture Coding Experts Group)形式など汎用デジタルフォーマットで記憶された楽曲や、CD(Compact Disc)やMD(Mini Disc)などに記録された楽曲などを再生する。また、楽曲再生装置400は、利用者の音声や動作に対応する挿入音を再生中の楽曲に合わせて出力する。この楽曲再生装置400は、例えば車両に搭載された図示しないバッテリから供給される電力により動作する。そして、楽曲再生装置400は、楽曲データ記憶手段410と、音データ記憶手段としての挿入音データ記憶手段420と、メモリ430と、入力手段440と、音出力手段および楽曲出力手段としての発音手段450と、表示手段460と、演算手段470と、などを備えている。
The
楽曲データ記憶手段410は、図2に示すような楽曲リストデータ500を適宜読み出し可能に記憶する。この楽曲データ記憶手段410としては、HD(Hard Disk)などの磁気ディスク、CDやMDあるいはDVD(Digital Versatile Disc)などの光ディスク、光磁気ディスク、メモリカードなどの記録媒体に読み出し可能に記憶するドライブやドライバなどを備えた構成などが例示できる。
The music data storage means 410 stores the
楽曲リストデータ500は、再生される楽曲のリストに関するデータである。そして、楽曲リストデータ500は、少なくとも1つの楽曲個別データ510が1つのデータ構造として関連付けられて構成されている。
The
楽曲個別データ510は、1つの楽曲に関する情報である。そして、楽曲個別データ510は、楽曲データ511と、楽曲関連情報512と、などが1つのデータ構造として構成されたテーブル構造である。なお、楽曲個別データ510は、楽曲データ511のみで構成される場合もある。
The music piece
楽曲データ511は、楽曲の再生の際に用いられるデータである。この楽曲データ511は、例えばMIDI形式やWAVE形式あるいはMPEG形式などの楽曲を再生可能な形式により記録されている。
The
楽曲関連情報512は、楽曲データ511により再生される楽曲に関する情報である。そして、楽曲関連情報512は、楽曲名情報512Aと、演奏者情報512Bと、楽曲リズム情報512Cと、などが1つのデータ構造として構成されたテーブル構造である。なお、楽曲関連情報512は、各情報512A,512B,512Cなどのうちの少なくともいずれか1つが格納された構成となる場合もある。
The music
楽曲名情報512Aは、楽曲の名前を示す情報をデータ化したものである。演奏者情報512Bは、楽曲の演奏者を示す情報をデータ化したものである。楽曲リズム情報512Cは、例えばBPM(Beats Per Minute)や拍子などの楽曲のリズムなどを示す情報をデータ化したものである。この楽曲リズム情報512Cとしては、例えばMIDIメッセージなどが例示できる。
The
挿入音データ記憶手段420は、図3に示すような挿入音リストデータ600を適宜読み出し可能に記憶する。この挿入音データ記憶手段420としては、楽曲データ記憶手段410と同様の構成などが例示できる。
The insertion sound data storage means 420 stores the insertion
挿入音リストデータ600は、利用者の音声や動作に対応して再生中の楽曲に合わせて適宜出力される挿入音のリストに関するデータである。この挿入音リストデータ600は、利用者による入力手段440の入力操作により適宜変更、追加、削除される。そして、挿入音リストデータ600は、少なくとも1つの挿入音個別データ610が1つのデータ構造として関連付けられて構成されている。
The insertion
挿入音個別データ610は、1つの挿入音に関する情報である。そして、挿入音個別データ610は、音データとしての挿入音データ611と、挿入音関連情報612と、などが1つのデータ構造として構成されたテーブル構造である。
The inserted sound
挿入音データ611は、挿入音の再生の際に用いられるデータである。この挿入音データ611は、MIDI形式により記録されている。この挿入音データ611により再生される挿入音としては、例えばドラム、和太鼓、ピアノ、シンバル、ギターなどの楽器を単独で奏でる音、あるいはこれらの楽器を複数組み合わせて奏でる音が例示できる。なお、ここでは、挿入音データ611としては、MIDI形式のものに限らず、例えばWAVE形式やMPEG形式など挿入音を再生可能ないずれの形式のものとしてもよい。また、挿入音としては、楽器を奏でる音に限らず、例えば「イェイ」、「ヒュウ」、「ヘイ」、「ヨイショ」などの音声、鼻歌や口笛の音、波や風あるいは水などの自然の音、クラクションの音などの人工的な音などいずれの音としてもよい。
The
挿入音関連情報612は、挿入音データ611より再生される挿入音に関する情報である。そして、挿入音関連情報612は、リズムパターン情報612Aと、所定外部状態情報としての対象言語情報612Bと、所定外部状態情報としての対象動作情報612Cと、などが1つのデータ構造として構成されたテーブル構造である。
The insertion sound
リズムパターン情報612Aは、挿入音データ611で再生される挿入音のリズムパターンを示す情報をデータ化したものである。このリズムパターンとしては、例えば「ロック」や「ジャズ」あるいは「リズムアンドブルース」などが例示できる。対象言語情報612Bは、音声として発音される言語を示す情報をデータ化したものである。この対象言語情報612Bで示される言語としては、例えば「イェイ」、「イェイェイ」、「ヒュウ」、「ヘイ」、「ヨイショ」などが例示できる。対象動作情報612Cは、利用者の動作を示す情報をデータ化したものである。この対象動作情報612Cで示される動作としては、例えば手や頭あるいは胴体を揺らす動き、さらには手を突き上げる動きなどが例示できる。
The rhythm pattern information 612A is data obtained by converting information indicating the rhythm pattern of the inserted sound reproduced by the inserted
メモリ430は、楽曲を再生したり挿入音を出力させる際に必要な各種情報や各種データを適宜読み出し可能に記憶する。また、メモリ430は、楽曲再生装置400全体を動作制御するOS(Operating System)上に展開される各種プログラムなどを記憶している。このメモリ430としては、例えば停電などにより突然電源が落ちた際にも記憶が保持される構成のメモリ、例えばCMOS(Complementary Metal-Oxide Semiconductor)メモリなどを用いることが望ましい。なお、メモリとしては、HD、DVD、光ディスク、メモリカードなどの記録媒体に読み出し可能に記憶するドライブやドライバなどを備えた構成としてもよい。
The
入力手段440は、入力操作される図示しない各種操作ボタンや操作つまみなどを有している。この操作ボタンや操作つまみの入力操作の内容としては、例えば楽曲再生装置400の動作内容の設定などの設定事項である。具体的には、動作内容の設定としては、楽曲の再生や停止などの設定、音量の調整、音声に対応する挿入音を出力するモード(以下、音声対応モードと称す)の設定、動作に対応する挿入音を出力するモード(以下、動作対応モードと称す)の設定などが例示できる。そして、入力手段440は、設定事項の入力操作により、各種情報を操作信号として演算手段470へ適宜出力して設定させる。なお、この入力手段440としては、操作ボタンや操作つまみなどの入力操作に限らず、例えば表示手段460に設けられたタッチパネルによる入力操作や、音声による入力操作など、各種設定事項を設定入力可能ないずれの構成が適用できる。また、入力手段440としては、例えば図示しないリモートコントローラ(以下、リモコンと称す)より赤外線を介して送信される各種情報を受信して、この各種情報を操作信号として演算手段470へ送信するリモコン受光部を備えた構成などとしてもよい。
The
発音手段450は、例えば車両のインストルメントパネル部、ドア部、リアダッシュボード部などに配設された図示しないスピーカを有している。この発音手段450は、演算手段470にて制御され、演算手段470からの楽曲データ511や挿入音データ611などの音声信号をスピーカから音により出力する。
The sound generation means 450 has a speaker (not shown) disposed on, for example, an instrument panel portion, a door portion, a rear dashboard portion, or the like of the vehicle. The sound generation means 450 is controlled by the calculation means 470 and outputs sound signals such as the
表示手段460は、演算手段470にて制御され、演算手段470からの画像データの画像信号を画面表示させる。画像データとしては、例えば再生している楽曲の名前、演奏者、演奏時間、音量の大きさなどの画像データなどが例示できる。この表示手段460としては、例えば液晶パネルや有機EL(Electro Luminescence)パネル、PDP(Plasma Display Panel)、CRT(Cathode-Ray Tube)、FED(Field Emission Display)、電気泳動ディスプレイパネルなどが例示できる。
The
演算手段470は、図示しない各種入出力ポート、例えばマイク200が接続されるマイクポート、撮像手段300が接続される撮像ポート、楽曲データ記憶手段410が接続される楽曲記憶ポート、挿入音データ記憶手段420が接続される挿入音記憶ポート、メモリ430が接続されるメモリポート、入力手段440が接続されるキー入力ポート、発音手段450が接続される発音制御ポート、表示手段460が接続される表示制御ポートなどを有する。そして、演算手段470は、各種プログラムとして、図4に示すように、楽曲再生処理手段471と、楽曲特性認識手段としての楽曲リズム認識手段472と、外部状態情報取得手段および外部状態リズム認識手段としての音声状態認識手段473と、外部状態情報取得手段および外部状態リズム認識手段としての動作状態認識手段474と、音出力制御手段としての挿入音再生制御手段475と、などを備えている。なお、楽曲リズム認識手段472、音声状態認識手段473、動作状態認識手段474、および、挿入音再生制御手段475にて、本発明の音出力制御装置が構成されている。
The calculation means 470 includes various input / output ports (not shown) such as a microphone port to which the
楽曲再生処理手段471は、楽曲データ記憶手段410に記憶された楽曲データ511に基づいて楽曲を再生する処理をする。具体的には、楽曲再生処理手段471は、入力手段440における入力操作に基づく所定の楽曲を再生させる旨の操作信号を取得すると、この所定の楽曲に対応する楽曲個別データ510を検索する。さらに、楽曲再生処理手段471は、この楽曲個別データ510に楽曲リズム情報512Cが組み込まれているか否かを判断する。そして、楽曲リズム情報512Cが組み込まれていると判断した場合、この楽曲リズム情報512Cのリズムに基づいた速度で楽曲データ511を音声信号として発音手段450へ出力する。また、楽曲再生処理手段471は、楽曲リズム情報512Cが組み込まれていないと判断した場合、楽曲データ511を予め設定された速度で音声信号として発音手段450へ出力する。さらに、楽曲再生処理手段471は、楽曲個別データ510に楽曲名情報512Aや演奏者情報512Bが組み込まれている場合、各情報512A,512Bに記載された楽曲の名前、演奏者、楽曲の演奏時間などの再生されている楽曲に関する各種情報を表示させるための画像データを生成する。そして、この画像データを画像信号として表示手段460へ出力する。
The music
楽曲リズム認識手段472は、楽曲再生処理手段471で再生している楽曲のリズムを認識する。具体的には、楽曲リズム認識手段472は、発音手段450で出力されている楽曲データ511を有する楽曲個別データ510に楽曲リズム情報512Cが組み込まれているか否かを判断する。ここで、楽曲リズム情報512Cが組み込まれているか否かを判断する方法としては、例えば所定のMIDIメッセージの有無に基づいて判断する方法が例示できる。なお、楽曲のリズムに関する他の情報の有無に基づいて判断する方法としてもよい。楽曲リズム認識手段472は、楽曲リズム情報512Cが組み込まれていると判断した場合、この楽曲リズム情報512Cを取得して、楽曲のBPM(以下、楽曲BPMと称す)を認識する。そして、この楽曲BPMに関する楽曲BPM情報をメモリ430に記憶させる。また、楽曲リズム認識手段472は、楽曲リズム情報512Cが組み込まれていないと判断した場合、例えば以下のような処理を実施して楽曲BPMを認識する。すなわち、楽曲リズム認識手段472は、楽曲データ511の音声信号を取得して、この音声信号に基づいて楽曲の出力波形を認識する。さらに、この出力波形のピークの間隔を認識し、このピーク間隔から楽曲BPMを認識する。そして、楽曲リズム認識手段472は、この楽曲BPMに関する楽曲BPM情報をメモリ430に記憶させる。
The music rhythm recognition means 472 recognizes the rhythm of the music being played back by the music playback processing means 471. Specifically, the music
音声状態認識手段473は、入力手段440における入力操作に基づく音声対応モードに設定されたことを認識すると、利用者の音声の状態を適宜検出する。そして、音声状態認識手段473は、音声リズム認識手段473Aと、言語認識手段473Bと、を備えている。
When the voice
音声リズム認識手段473Aは、音声のリズムを認識する。具体的には、音声リズム認識手段473Aは、マイク200に車内音を集音させて車内音情報を出力させる。そして、音声リズム認識手段473Aは、マイク200からの車内音情報を予め設定された所定時間だけ取得して、この車内音情報に基づいて車内音の出力波形を認識する。さらに、音声リズム認識手段473Aは、この出力波形における出力値が予め設定された基準出力値以下の部分をゼロに設定、すなわち車内音から基準音量以下の音を削除する。ここで、基準出力値は、例えば車両の走行音の出力値や、利用者の通常の会話の出力値と略同一の値に設定されている。すなわち、基準出力値は、車内音の出力波形における基準出力値以下の部分がゼロに設定された際に、利用者が楽曲に合わせて意識的に発音した例えば「イェイ」や「イェイェイ」などの音声に対応する成分のみがゼロにならない状態に設定されている。
The voice
そして、音声リズム認識手段473Aは、車内音から削除した音の時間長が予め設定された外部音認識基準時間としての音声認識基準時間以下であることを認識すると、車内音に例えば「イェイ」などの利用者が意識して発音した音声が含まれていると判断する。さらに、音声リズム認識手段473Aは、楽曲BPM情報をメモリ430から取得して、この楽曲BPM情報の楽曲BPMと、基準音量以下の音を削除した車内音の出力波形すなわち音声の出力波形のピークの間隔と、に基づいて、楽曲BPMを基準にした音声のBPM(以下、音声BPMと称す)を演算して認識する。そして、音声リズム認識手段473Aは、この音声BPMに基づいて、音声のリズムパターン(以下、音声リズムパターンと称す)を認識し、この音声リズムパターンに関する音声リズムパターン情報をメモリ430に記憶させる。
When the voice
言語認識手段473Bは、車内音情報に基づいて、音声リズム認識手段473Aで音声リズムパターンが認識された音声により発音されている言語(以下、音声言語と称す)を認識する。例えば、言語認識手段473Bは、音声リズム認識手段473Aで取得された車内音情報をデジタル信号化して、音響的な特徴を認識する。さらに、音声の統計的な情報をモデル化した音声モデルから、車内音情報に基づく音響的な特徴に最も近い言語を検索する。そして、言語認識手段473Bは、この検索した言語を音声言語として認識する。また、言語認識手段473Bは、音声言語を認識すると、この音声言語に関する音声言語情報をメモリ430に記憶させる。
The
動作状態認識手段474は、入力手段440における入力操作に基づく動作対応モードに設定されたことを認識すると、利用者の動作の状態を適宜認識する。そして、動作状態認識手段474は、動作リズム認識手段474Aと、動作内容認識手段474Bと、を備えている。
When the operation
動作リズム認識手段474Aは、動作のリズムを認識する。具体的には、動作リズム認識手段474Aは、撮像手段300に利用者を撮像させ、撮像データを出力させる。さらに、動作リズム認識手段474Aは、撮像手段300からの撮像データを予め設定された所定時間だけ取得して、この撮像データに基づいて利用者の身体の所定の部分、例えば頭や手などを把握する。そして、この把握した所定部分が所定の方向に予め設定された身体動作基準量以上動いたか否かを認識する。ここで、身体動作基準量は、例えば利用者の運転動作や窓を開閉する動作など、楽曲に合わせた意識的な動作以外の動作に対応する量に設定されている。なお、複数の撮像手段300を設け、これらの撮像手段300で利用者を撮像させて、身体の所定部分の動作を3次元的に認識する構成としてもよい。
The motion rhythm recognition means 474A recognizes the motion rhythm. Specifically, the motion
そして、動作リズム認識手段474Aは、身体の所定部分が身体動作基準量以上動いた、すなわち例えば手や頭あるいは胴体が左右方向に身体動作基準量以上動いたことや、手が上下方向に身体動作基準量以上動いたことを認識すると、利用者が楽曲に合わせて意識的に身体を動かしたと判断する。さらに、動作リズム認識手段474Aは、楽曲BPM情報をメモリ430から取得して、この楽曲BPM情報の楽曲BPMと、例えば手が所定の位置から他の位置まで動くまでの時間の長さと、に基づいて、楽曲BPMを基準にした動作のBPM(以下、動作BPMと称す)を演算して認識する。そして、動作リズム認識手段474Aは、この動作BPMに基づいて、動作のリズムパターン(以下、動作リズムパターンと称す)を認識し、この動作リズムパターンに関する動作リズムパターン情報をメモリ430に記憶させる。
The motion
動作内容認識手段474Bは、動作の内容を認識する。具体的には、動作内容認識手段474Bは、動作リズム認識手段474Aで取得された撮像データに基づいて、身体動作基準量以上動いた身体の所定の部分と、この所定の部分が動いた方向と、を特定する。そして、この特定した所定の部分および動いた方向に基づいて、動作の内容を認識する。例えば、動作内容認識手段474Bは、頭が左右方向に移動していることを特定した場合に頭を揺らす動作であることを認識し、手が上下方向に移動していることを特定した場合に手を突き上げる動作であることを認識する。そして、動作内容認識手段474Bは、この動作内容に関する動作内容情報をメモリ430に記憶させる。
The operation
挿入音再生制御手段475は、楽曲再生処理手段471で再生されている楽曲に合わせて挿入音を再生する制御をする。そして、挿入音再生制御手段475は、挿入位置特定手段475Aと、挿入音再生処理手段475Bと、などを備えている。
The insertion sound reproduction control means 475 controls to reproduce the insertion sound in accordance with the music being reproduced by the music reproduction processing means 471. The insertion sound
挿入位置特定手段475Aは、挿入音を再生する位置、すなわち挿入音を楽曲に挿入する位置(以下、挿入位置と称す)を特定する。具体的には、挿入位置特定手段475Aは、楽曲リズム認識手段472で認識された再生中の楽曲の出力波形に基づいて、楽曲の拍子を認識する。さらに、この楽曲の拍子に基づいて、楽曲の小節の区切りを認識する。そして、挿入位置特定手段475Aは、音声対応モードに設定されている場合、言語認識手段473Bで音声言語が認識された音声が発せられた時点から2つ目に現れる楽曲の小節の始めを挿入位置として特定する。すなわち、挿入位置特定手段475Aは、音声が発せられた時点から予め設定された出力処理期限時間以内に挿入音が出力されるように挿入位置を特定する。
The insertion position specifying means 475A specifies the position where the insertion sound is reproduced, that is, the position where the insertion sound is inserted into the music (hereinafter referred to as the insertion position). Specifically, the insertion position specifying means 475A recognizes the time signature of the music based on the output waveform of the music being played recognized by the music rhythm recognition means 472. Further, based on the time signature of the music, the break of the music bar is recognized. If the voice recognition mode is set, the insertion
例えば、挿入位置特定手段475Aは、図5(A)に示すような再生時間T1,T3,T4,T5,T7,T8,T9に小節の始めが現れる楽曲が再生されている状態において、図5(B)に示すような再生時間T1および再生時間T3の間の再生時間T2に発せられた「イェイ」の音声を認識すると、再生時間T2から2つ目に現れる小節の始め、すなわち再生時間T4に現れる小節の始めを挿入位置として特定する。さらに、再生時間T5および再生時間T7の間の再生時間T6に発せられた「イェイェイ」の音声を認識すると、再生時間T8に現れる小節の始めを挿入位置として特定する。 For example, the insertion position specifying means 475A is shown in FIG. 5A in a state in which a piece of music in which the beginning of a bar appears at the reproduction time T1, T3, T4, T5, T7, T8, T9 as shown in FIG. When the “Yay” sound uttered at the reproduction time T2 between the reproduction time T1 and the reproduction time T3 as shown in FIG. 5B is recognized, the beginning of the second measure appearing from the reproduction time T2, that is, the reproduction time T4. The beginning of the bar appearing in is specified as the insertion position. Further, when the “Yay” sound uttered at the reproduction time T6 between the reproduction time T5 and the reproduction time T7 is recognized, the beginning of the bar appearing at the reproduction time T8 is specified as the insertion position.
また、挿入位置特定手段475Aは、動作対応モードに設定されている場合、動作内容認識手段474Bで動作内容が認識された動作が実施された時点から、2つ目に現れる楽曲の小節の始めを挿入位置として特定する。すなわち、挿入位置特定手段475Aは、動作が実施された時点から出力処理期限時間以内に挿入音が出力されるように挿入位置を特定する。例えば、挿入位置特定手段475Aは、図6(A)に示すような図5(A)と同じ楽曲が再生されている状態において、図6(B)に示すような再生時間T2に実施された「手を突き上げる」という動作を認識すると、再生時間T4に現れる小節の始めを挿入位置として特定する。さらに、再生時間T6に実施された「頭を揺らす」という動作を認識すると、再生時間T8に現れる小節の始めを挿入位置として特定する。
In addition, when the operation position mode is set, the insertion
なお、ここでは、例えば音声が発せられた時点から2つ目に現れる小節の始めを挿入位置として特定する構成について例示するが、これに限らず音声が発せられた時点から1つ目や3つ目の小節の始め、あるいは所定の小節の終わり、さらには所定の小節の始めから終わりの間を挿入位置として特定する構成としてもよい。 Here, for example, a configuration is described in which the beginning of the second measure appearing from the time when the sound is emitted is specified as the insertion position, but the present invention is not limited to this, and the first and third from the time when the sound is emitted are exemplified. A configuration may be used in which the beginning of the eye bar, or the end of a predetermined bar, or the start to end of a predetermined bar is specified as the insertion position.
挿入音再生処理手段475Bは、音声や動作に対応する挿入音を楽曲に合わせて再生する処理をする。具体的には、挿入音再生処理手段475Bは、音声対応モードに設定されている場合、メモリ430から音声リズムパターン情報および音声言語情報を取得する。さらに、音声リズムパターン情報の音声リズムパターンに略一致するリズムパターンに関するリズムパターン情報612Aと、音声言語情報の音声言語に略一致する言語に関する対象言語情報612Bと、が組み込まれた挿入音個別データ610を挿入音リストデータ600から検索する。そして、挿入音再生処理手段475Bは、この検索した挿入音個別データ610に組み込まれた挿入音データ611を取得する。さらに、挿入音再生処理手段475Bは、この挿入音データ611のBPMに関する情報の設定値を楽曲BPM情報の楽曲BPMに対応する値に設定する。そして、挿入音再生処理手段475Bは、挿入位置特定手段475Aで特定された挿入位置において挿入音が出力されるように、この取得した挿入音データ611を音声信号として発音手段450へ出力する。
The insertion sound reproduction processing means 475B performs processing for reproducing the insertion sound corresponding to the voice or the operation in accordance with the music. Specifically, the insertion sound
例えば、挿入音再生処理手段475Bは、図5(B)に示すような「イェイ」の音声に対応する音声リズムパターン情報および音声言語情報に基づいて、ドラムを奏でる音である「ジャカジャン」の挿入音を出力させるための挿入音データ611を取得する。そして、挿入音再生処理手段475Bは、この挿入音データ611のBPMに関する情報を楽曲BPMに対応させて設定して、図5(C)に示すように、「イェイ」の音声に対応する挿入位置、すなわち再生時間T4に「ジャカジャン」の挿入音の再生が開始され、再生時間T5に終了されるように出力する。また、挿入音再生処理手段475Bは、「イェイェイ」の音声に対応する挿入音データ611として、ドラムを奏でる音である「ジャカジャカジャン」の挿入音を出力させるための挿入音データ611を取得する。そして、「イェイェイ」の音声に対応して、再生時間T8に「ジャカジャカジャン」の挿入音の再生が開始され、再生時間T9に終了されるように挿入音データ611を出力する。さらに、挿入音再生処理手段475Bは、ここでは図示しないが「ヒュウ」の音声に対応する挿入音データ611として、和太鼓を奏でる音である「ドンドン」の挿入音を出力させるための挿入音データ611を取得して出力する。
For example, the inserted sound reproduction processing means 475B inserts “Jakajan” which is a sound of playing a drum based on the audio rhythm pattern information and the audio language information corresponding to the “Yay” audio as shown in FIG. Insert
また、挿入音再生処理手段475Bは、動作対応モードに設定されている場合、メモリ430から動作リズムパターン情報および動作内容情報を取得する。さらに、動作リズムパターン情報の動作リズムパターンに略一致するリズムパターンに関するリズムパターン情報612Aと、動作内容情報の動作内容に略一致する動きに関する対象動作情報612Cと、が組み込まれた挿入音個別データ610を挿入音リストデータ600から検索する。そして、挿入音再生処理手段475Bは、この検索した挿入音個別データ610に組み込まれた挿入音データ611を、挿入位置特定手段475Aで特定された挿入位置において挿入音が出力されるように、音声信号として発音手段450へ出力する。
Further, the insertion sound
例えば、挿入音再生処理手段475Bは、図6(B)に示すような「手を突き上げる」という動作に対応する動作リズムパターン情報および動作内容情報に基づいて、シンバルを奏でる音である「ジャーン」の挿入音を出力させるための挿入音データ611を取得する。そして、挿入音再生処理手段475Bは、図6(C)に示すように、「手を突き上げる」という動作に対応して、再生時間T4に「ジャーン」の挿入音の再生が開始され、再生時間T5に終了されるように挿入音データ611を出力する。また、挿入音再生処理手段475Bは、「頭を揺らす」という動作に対応する挿入音データ611として、ピアノを奏でる音である「ポロローン」の挿入音を出力させるための挿入音データ611を取得する。そして、「頭を揺らす」という動作に対応して、再生時間T8に「ポロローン」の挿入音の再生が開始され、再生時間T9に終了されるように挿入音データ611を出力する。
For example, the inserted sound reproduction processing means 475B is a sound that plays a cymbal based on motion rhythm pattern information and motion content information corresponding to the motion of “pushing up a hand” as shown in FIG. The
〔楽曲再生システムの動作〕
次に、楽曲再生システム100の動作を図面を参照して説明する。
[Operation of music playback system]
Next, the operation of the
(音声対応モードにおける挿入音出力処理)
まず、楽曲再生システム100の動作として、音声対応モードにおける挿入音出力処理について図7に基づいて説明する。ここでは、図5(A)に示すような楽曲に合わせて、利用者が図5(B)に示すような音声を発音した状態を例示して説明する。図7は、音声対応モードにおける挿入音出力処理を示すフローチャートである。
(Inserted sound output processing in voice-compatible mode)
First, as an operation of the
まず、利用者は、入力手段440の入力操作により、音声対応モードで所定の楽曲の再生を要求する旨を設定入力する。そして、楽曲再生システム100の楽曲再生装置400は、図7に示すように、演算手段470の楽曲再生処理手段471にて、音声対応モードで所定の楽曲の再生を要求する旨の要求を認識すると、この所定の楽曲に対応する楽曲データ511に基づいて楽曲を再生する(ステップS101)。この後、演算手段470は、楽曲リズム認識手段472にて、再生中の楽曲の楽曲BPMを認識し(ステップS102)、この楽曲BPMに関する楽曲BPM情報をメモリ430に記憶させる。ここでは、演算手段470は、図5(A)に示すような楽曲を再生して、この楽曲に対応する楽曲BPM情報を記憶させる。さらに、演算手段470は、音声状態認識手段473の音声リズム認識手段473Aにて、マイク200から出力される車内音情報の車内音を所定時間だけ取得して(ステップS103)、この車内音から基準音量以下の音を削除する(ステップS104)。そして、音声リズム認識手段473Aは、車内音から削除した音の時間長が音声認識基準時間以下か否かを判断する(ステップS105)。
First, the user inputs a setting for requesting reproduction of a predetermined music piece in the voice corresponding mode by an input operation of the
このステップS105において、音声認識基準時間以下ではない、すなわち音声認識基準時間よりも長いと判断した場合、車内音に利用者が楽曲に合わせて意識的に発音した音声が含まれていないと認識する。そして、音声リズム認識手段473Aは、ステップS103に戻り車内音を取得する処理をする。一方、ステップS105において、音声リズム認識手段473Aは、音声認識基準時間以下であると判断した場合、車内音に利用者が意識的に発音した音声が含まれていると認識する。ここでは、音声リズム認識手段473Aは、再生時間T2や再生時間T6を含む時間の車内音を取得した際に、車内音に利用者が意識的に発音した「イェイ」や「イェイェイ」という音声が含まれていると認識する。そして、メモリ430に記憶された楽曲BPM情報の楽曲BPM、および、音声の出力波形のピーク間隔に基づいて、楽曲BPMを基準にした音声BPMを認識する(ステップS106)。さらに、音声リズム認識手段473Aは、音声BPMに基づいて、音声に対応する音声リズムパターンを認識し(ステップS107)、この音声リズムパターンに関する音声リズムパターン情報をメモリ430に記憶させる。また、音声状態認識手段473は、言語認識手段473Bにて、音声リズム認識手段473Aで外部リズムパターンが認識された音声の音声言語を認識し(ステップS108)、この音声言語に関する音声言語情報をメモリ430に記憶させる。ここでは、言語認識手段473Bは、音声リズム認識手段473Aで再生時間T2や再生時間T6を含む時間の車内音が取得された際に、「イェイ」や「イェイェイ」という言語を音声言語として認識して、この音声言語に関する音声言語情報を記憶させる。
If it is determined in step S105 that the time is not shorter than the voice recognition reference time, that is, longer than the voice recognition reference time, it is recognized that the in-vehicle sound does not include the voice that the user consciously pronounced according to the music. . Then, the voice
この後、演算手段470は、挿入音再生制御手段475の挿入音再生処理手段475Bにて、メモリ430に記憶された音声リズムパターン情報および音声言語情報に基づいて、音声リズムパターンおよび音声言語に対応する挿入音個別データ610を検索する。そして、挿入音再生処理手段475Bは、この検索した挿入音個別データ610の挿入音データ611を取得する(ステップS109)。さらに、挿入音再生制御手段475は、挿入位置特定手段475Aにて、再生中の楽曲の小節の区切りを認識し、音声言語が認識された音声が発せられた時点から、2つ目に現れる楽曲の小節の始めを挿入位置として特定する(ステップS110)。そして、挿入音再生処理手段475Bは、挿入位置特定手段475Aで特定された挿入位置に対応する時間に挿入音データ611を再生して(ステップS111)、楽曲に合わせた挿入音を出力する。ここでは、挿入音再生制御手段475は、図5(C)に示すように、「イェイ」の音声に対応する「ジャカジャン」の挿入音を再生時間T4から再生時間T5まで再生し、「イェイェイ」の音声に対応する「ジャカジャカジャン」の挿入音を再生時間T8から再生時間T9まで再生する。この後、音声リズム認識手段473Aは、楽曲の再生が終了したか否かを判断する(ステップS112)。このステップS112において、楽曲の再生が終了したと判断した場合、音声対応モードにおける挿入音出力処理を終了する。一方、音声リズム認識手段473Aは、楽曲の再生が終了していないと判断した場合、ステップS103に戻り音声を取得する処理をする。
Thereafter, the calculation means 470 corresponds to the voice rhythm pattern and the voice language based on the voice rhythm pattern information and the voice language information stored in the
(動作対応モードにおける挿入音出力処理)
次に、楽曲再生システム100の動作として、動作対応モードにおける挿入音出力処理について図8に基づいて説明する。ここでは、図6(A)に示すような楽曲に合わせて、利用者が図6(B)に示すような動作を実施した状態を例示して説明する。なお、音声対応モードにおける挿入音出力処理で実施される処理と同様の処理については、説明を簡略化する。図8は、動作対応モードにおける挿入音出力処理を示すフローチャートである。
(Inserted sound output processing in motion-compatible mode)
Next, as an operation of the
まず、利用者は、入力手段440の入力操作により、動作対応モードで所定の楽曲の再生を要求する旨を設定入力する。そして、楽曲再生システム100の楽曲再生装置400は、図8に示すように、演算手段470の楽曲再生処理手段471にて、動作対応モードで所定の楽曲の再生を要求する旨の要求を認識すると、この所定の楽曲を再生する(ステップS201)。この後、演算手段470は、楽曲リズム認識手段472にて、再生中の楽曲の楽曲BPMを認識して(ステップS202)、楽曲BPM情報をメモリ430に記憶させる。さらに、演算手段470は、動作状態認識手段474の動作リズム認識手段474Aにて、撮像手段300から出力される撮像データを所定時間だけ取得して(ステップS203)、利用者の身体の所定部分が身体動作基準量以上動いたか否かを判断する(ステップS204)。
First, the user inputs a setting for requesting reproduction of a predetermined music piece in the operation-compatible mode by an input operation of the
このステップS204において、身体動作基準量以上動いていないと判断した場合、利用者が楽曲に合わせて意識的に身体を動かしていないと認識する。そして、動作リズム認識手段474Aは、ステップS203に戻り撮像データを取得する処理をする。一方、ステップS204において、動作リズム認識手段474Aは、身体動作基準量以上動いていると判断した場合、利用者が楽曲に合わせて意識的に身体を動かしたと認識する。ここでは、動作リズム認識手段474Aは、再生時間T2や再生時間T6を含む時間の撮像データを取得した際に、利用者が意識的に「手を突き上げる」という動作や「頭を揺らす」という動作を実施したと認識する。そして、メモリ430に記憶された楽曲BPM情報の楽曲BPM、および、身体の所定部分が所定の位置から他の位置まで動くまでの時間の長さに基づいて、楽曲BPMを基準にした動作BPMを認識する(ステップS205)。さらに、動作リズム認識手段474Aは、動作BPMに基づいて、動作に対応する動作リズムパターンを認識し(ステップS206)、この動作リズムパターンに関する動作リズムパターン情報をメモリ430に記憶させる。また、動作状態認識手段474は、動作内容認識手段474Bにて、動作リズム認識手段474Aで動作リズムパターンが認識された動作の動作内容を認識し(ステップS207)、この動作内容に関する動作内容情報をメモリ430に記憶させる。ここでは、動作内容認識手段474Bは、動作リズム認識手段474Aで再生時間T2や再生時間T6を含む時間の撮像データが取得された際に、「手を突き上げる」という動作や「頭を揺らす」という動作を動作内容として認識して、この動作内容に関する動作内容を記憶させる。
In this step S204, when it is determined that the body movement reference amount is not moved, it is recognized that the user has not intentionally moved the body according to the music. Then, the motion
この後、演算手段470は、挿入音再生制御手段475の挿入音再生処理手段475Bにて、メモリ430に記憶された動作リズムパターン情報および動作内容情報に基づいて、動作リズムパターンおよび動作内容に対応する挿入音データ611を取得する(ステップS208)。さらに、挿入音再生制御手段475は、挿入位置特定手段475Aにて、動作内容が認識された動作が実施された時点から、2つ目に現れる楽曲の小節の始めを挿入位置として特定する(ステップS209)。そして、挿入音再生処理手段475Bは、挿入位置特定手段475Aで特定された挿入位置に対応する時間に挿入音データ611を再生して(ステップS210)、楽曲に合わせた挿入音を出力する。ここでは、挿入音再生制御手段475は、図6(C)に示すように、「手を突き上げる」という動作に対応する「ジャーン」の挿入音を再生時間T4から再生時間T5まで再生し、「頭を揺らす」という動作に対応する「ポロローン」の挿入音を再生時間T8から再生時間T9まで再生する。この後、動作リズム認識手段474Aは、楽曲の再生が終了したか否かを判断する(ステップS211)。このステップS211において、楽曲の再生が終了したと判断した場合、動作対応モードにおける挿入音出力処理を終了する。一方、動作リズム認識手段474Aは、楽曲の再生が終了していないと判断した場合、ステップS203に戻り撮像データを取得する処理をする。
Thereafter, the
〔楽曲再生システムの作用効果〕
上述したように、上記実施の形態では、楽曲再生装置400の演算手段470は、楽曲再生処理手段471にて、例えば音声対応モードで所定の楽曲を再生する旨の要求を認識すると、この所定の楽曲の再生を開始する。また、演算手段470は、音声状態認識手段473の音声リズム認識手段473Aにて、マイク200で集音された例えば「イェイ」の音声を含む車内音を取得する。さらに、音声リズム認識手段473Aは、再生中の楽曲の楽曲BPMを基準にした「イェイ」の音声の音声BPMを認識し、この音声BPMに対応する音声の音声リズムパターンを認識する。この後、演算手段470は、挿入音再生制御手段475の挿入音再生処理手段475Bにて、音声リズムパターンに対応するリズムパターン情報612Aに関連付けられた挿入音データ611を取得する。そして、挿入音再生処理手段475Bは、この挿入音データ611に基づいて音声リズムパターンに対応する挿入音、すなわち楽曲の特性である楽曲BPMに合わせた挿入音を発音手段450から出力させる。このため、楽曲再生装置400は、楽曲に同調する挿入音を挿入するので、楽曲の聴取の際に利用者が感じる違和感を低減できる。また、利用者は、例えば「イェイ」の音声に対して楽曲の特性に同調する「ジャカジャン」の挿入音が楽曲に挿入されるので、自ら発する音声に楽曲が反応してくれているような感覚を体感でき、楽曲の聴取をより楽しむことができる。したがって、楽曲再生装置400は、挿入音を良好に出力できる。
[Effects of music playback system]
As described above, in the above embodiment, when the calculation means 470 of the
さらに、挿入音再生処理手段475Bは、利用者により発せられた音声の音声リズムパターンに対応する挿入音を出力させる。具体的には、挿入音再生処理手段475Bは、例えば「イェイ」に対応して「ジャカジャン」の挿入音を出力させ、「イェイェイ」に対して「ジャカジャカジャン」の挿入音を出力させる。このため、利用者は、自ら発する音声に対応するリズムパターンの挿入音により、楽曲がより良好に反応してくれているような感覚を体感できる。したがって、楽曲再生装置400は、挿入音をより良好に出力できる。
Furthermore, the insertion sound reproduction processing means 475B outputs an insertion sound corresponding to the sound rhythm pattern of the sound emitted by the user. Specifically, the insertion sound reproduction processing means 475B, for example, outputs an insertion sound of “Jakajan” corresponding to “Yay” and outputs an insertion sound of “Jakajakajan” to “Yayye”. For this reason, the user can feel the sensation that the music is responding more favorably by the insertion sound of the rhythm pattern corresponding to the sound uttered by the user. Therefore, the
そして、挿入音再生処理手段475Bは、音声の音声言語や動作の内容に対応した挿入音を出力させる。具体的には、挿入音再生処理手段475Bは、「イェイ」の音声に対応して「ジャカジャン」のドラム音を、「ヒュウ」の音声に対応して「ドンドン」の和太鼓音を、「手を突き上げる」という動作に対応して「ジャーン」のシンバル音を、「頭を揺らす」という動作に対応して「ポロローン」のピアノ音を、それぞれ出力させる。このため、利用者は、音声や動作の内容に対応して出力される互いに異なる挿入音により、楽曲がさらに良好に反応してくれているような感覚を体感できる。したがって、楽曲再生装置400は、挿入音をさらに良好に出力できる。
Then, the insertion sound
また、挿入音再生処理手段475Bは、楽曲の特性に同調する挿入音として楽曲BPMに合わせた挿入音を出力させる。このため、楽曲再生装置400は、楽曲BPMに合わせた挿入音により、楽曲の聴取の際に利用者が感じる違和感をより低減できる。したがって、楽曲再生装置400は、挿入音をより良好に出力できる。
Further, the insertion sound reproduction processing means 475B outputs an insertion sound that matches the music BPM as an insertion sound synchronized with the characteristics of the music. For this reason, the
さらに、挿入位置特定手段475Aは、例えば言語認識手段473Bにて音声言語が認識された音声が発せられた時点から2つ目に現れる楽曲の小節の始めを、挿入音を挿入する挿入位置として認識する。このため、楽曲再生装置400は、小節に合わせたタイミングで挿入する挿入音により、楽曲の聴取の際に利用者が感じる違和感をさらに低減できる。したがって、楽曲再生装置400は、挿入音をさらに良好に出力できる。
Further, the insertion position specifying means 475A recognizes, for example, the beginning of the measure of the music appearing second from the time when the speech whose speech language is recognized by the language recognition means 473B is emitted as the insertion position for inserting the insertion sound. To do. For this reason, the
また、挿入位置特定手段475Aは、例えば音声が発せられた時点から出力処理期限時間以内に挿入音が出力されるように挿入位置を特定する。このため、利用者は、音声を発してから出力処理期限時間以内に出力される挿入音により、楽曲がさらに良好に反応してくれているような感覚を体感できる。したがって、楽曲再生装置400は、挿入音をさらに良好に出力できる。
Further, the insertion position specifying means 475A specifies the insertion position so that the insertion sound is output within the output processing time limit from the time when the sound is emitted, for example. For this reason, the user can feel the sensation that the music is responding more satisfactorily by the insertion sound that is output within the output processing time limit after the sound is emitted. Therefore, the
さらに、挿入音再生処理手段475Bは、挿入音データ記憶手段420に記憶された挿入音データ611に基づいて挿入音を出力する。このため、挿入音再生処理手段475Bは、挿入音データ611を取得して出力するだけの簡単な方法で挿入音を出力できる。したがって、挿入音再生処理手段475Bの処理負荷を減らすことができる。
Further, the insertion sound reproduction processing means 475B outputs an insertion sound based on the
また、挿入音データ611として、MIDI形式のデータを用いている。そして、挿入音再生処理手段475Bは、挿入音データ611のBPMに関する情報を楽曲BPMに合わせて設定して挿入音として再生する。このため、挿入音データ611のデータ量を最小限に抑えることができる。また、また、挿入音再生処理手段475Bは、挿入音データ611のBPMに関する情報の設定値を変更するだけで挿入音のBPMを変更でき、1つの挿入音データ611で複数のBPMに対応させた挿入音を出力させることができる。したがって、挿入音データ記憶手段420の容量を小さくでき、楽曲再生装置400のコストを低減できる。
Further, MIDI format data is used as the
さらに、挿入音データ611を対象言語情報612Bや対象動作情報612Cに関連付けて記憶する挿入音データ記憶手段420を設けている。そして、挿入音再生処理手段475Bは、例えば音声言語に略一致する言語に関する対象言語情報612Bを挿入音データ記憶手段420から検索し、この検索した対象言語情報612Bに関連付けられた挿入音データ611を取得する。このため、挿入音再生処理手段475Bは、音声言語に対応する対象言語情報612Bを検索するだけで、挿入音データ611を取得できる。したがって、挿入音再生処理手段475Bは、挿入音データ611をより容易に取得できる。また、挿入音再生処理手段475Bは、挿入音データ記憶手段420を無線媒体や有線媒体のネットワークを介して接続されたサーバ装置に設ける構成と比べて、挿入音データ611をより迅速に取得できる。
Further, there is provided an insertion sound data storage means 420 for storing the
そして、挿入音再生処理手段475Bは、マイク200で集音した音声に対応した挿入音を楽曲に合わせて出力させる。このため、利用者は、所定の音声を発するだけの簡単な方法で挿入音を出力させることができる。また、利用者は、音声を出力するだけでよいので、例えば運転を中断することなく挿入音を出力させることができる。したがって、利用者は、楽曲の聴取を容易に楽しむことができる。
Then, the insertion sound reproduction processing means 475B outputs an insertion sound corresponding to the sound collected by the
また、挿入音再生処理手段475Bは、音声リズム認識手段473Aで車内音に基準音量以上の音声が音声認識基準時間以上含まれていることが認識されると、この音声に対応した挿入音を出力させる。このため、楽曲再生装置400は、例えば車両の走行音や通常の会話などの音に反応して挿入音を出力することがなく、利用者が楽曲に合わせて発した音声のみに反応して挿入音を出力できる。したがって、楽曲再生装置400は、挿入音をさらに良好に出力できる。
In addition, when the voice
そして、挿入音再生処理手段475Bは、撮像手段300からの撮像データに撮像された利用者の動作に対応した挿入音を楽曲に合わせて出力させる。このため、利用者は、所定の動作をするだけの簡単な方法で挿入音を出力させることができる。したがって、利用者は、楽曲の聴取をより容易に楽しむことができる。
Then, the insertion sound
さらに、挿入音再生処理手段475Bは、動作リズム認識手段474Aで撮像データに基づいて身体の所定部分が所定方向に身体動作基準量以上動いたことが認識されると、この身体の所定部分の動作に対応した挿入音を出力させる。このため、楽曲再生装置400は、例えば運転動作などに反応して挿入音を出力することがなく、利用者が楽曲に合わせて実施した動作のみに反応して挿入音を出力できる。したがって、楽曲再生装置400は、挿入音をさらに良好に出力できる。
Furthermore, when the motion
そして、楽曲再生処理を実施する楽曲再生装置400に本発明の音出力制御装置を適用している。このため、音声に対応した挿入音を出力でき、楽曲再生装置400の利便性を高めることができる。
And the sound output control apparatus of this invention is applied to the
〔実施形態の変形〕
なお、本発明は、上述した各実施の形態に限定されるものではなく、本発明の目的を達成できる範囲で以下に示される変形をも含むものである。
[Modification of Embodiment]
In addition, this invention is not limited to each embodiment mentioned above, The deformation | transformation shown below is included in the range which can achieve the objective of this invention.
すなわち、挿入音再生処理手段475Bにて、楽曲の音の高さ、強さ、および、音色のうちの少なくともいずれか1つに同調する挿入音を出力する構成としてもよい。例えば、楽曲の音量の大きさに対応させて挿入音の音量の大きさを設定する構成や、楽曲の音色に対応させて挿入音の音色を設定する構成などとしてもよい。このような構成にすれば、楽曲再生装置400は、例えば楽曲の音量よりも著しく大きい音量の挿入音や、楽曲の音色と著しく異なる音色の挿入音を出力することがなくなり、楽曲の聴取の際に利用者が感じる違和感を低減できる。
In other words, the insertion sound reproduction processing means 475B may output an insertion sound that is tuned to at least one of the pitch, strength, and tone color of the music. For example, a configuration in which the volume level of the insertion sound is set in correspondence with the volume level of the music, or a configuration in which the tone color of the insertion sound is set in correspondence with the tone color of the music may be used. With such a configuration, the
また、例えば楽曲リズム認識手段472にて、再生中の楽曲のコードの進行を認識するとともにコードの進行予測をする。そして、挿入音再生処理手段475Bにて、この進行予測されたコードに対応する挿入音を出力する構成などとしてもよい。このような構成にすれば、利用者は、楽曲に調和する挿入音を聴取でき、楽曲の聴取をより楽しむことができる。
Further, for example, the music
そして、挿入音を音声リズムパターンや動作リズムパターンに対応させずに、音声の音声言語や動作の内容にのみ対応させる構成としてもよい。このような構成にすれば、各リズム認識手段473A,474Aを設ける必要がなく、演算手段470の構成を簡略化できる。したがって、楽曲再生装置400のコストを低減できる。
And it is good also as a structure which makes an insertion sound respond | correspond only to the audio | voice speech language and the content of an operation | movement, without making it respond | correspond to an audio | voice rhythm pattern or an operation | movement rhythm pattern. With such a configuration, it is not necessary to provide each
また、挿入音を音声の音声言語や動作の内容に対応させずに、音声リズムパターンや動作リズムパターンのみに対応させる構成としてもよい。このような構成にすれば、言語認識手段473Bや動作内容認識手段474Bを設ける必要がなく、演算手段470の構成を簡略化でき、楽曲再生装置400のコストを低減できる。
Moreover, it is good also as a structure which makes an insertion sound respond | correspond only to an audio | voice rhythm pattern and an operation | movement rhythm pattern, without making it respond | correspond to the audio | voice speech language and the content of operation | movement. With such a configuration, there is no need to provide the
さらに、挿入音を音声や動作に対応させずに、挿入音再生処理手段475Bにて、例えば楽曲BPMに合わせた挿入音を選択して出力させる構成などとしてもよい。このような構成にすれば、各状態認識手段473,474を設ける必要がなく、演算手段470の構成をさらに簡略化でき、楽曲再生装置400のコストをさらに低減できる。
Furthermore, it is good also as a structure etc. which select and output the insertion sound matched with the music BPM in the insertion sound reproduction | regeneration processing means 475B, without making an insertion sound respond | correspond to an audio | voice and operation | movement. With such a configuration, it is not necessary to provide the
また、挿入音再生処理手段475Bにて、楽曲BPMに合わせた挿入音ではなく、楽曲の拍子や拍などのリズムに合わせた挿入音を出力する構成としてもよい。例えば、図9(A)に示すような4拍子のリズムの楽曲に対して「ジャカジャン」の挿入音を2回出力する場合、「ジャカジャン」の挿入音を、図9(B)に示すように2拍で出力する構成や、図9(C)に示すように1拍で出力する構成としてもよい。さらに、「ジャカジャカジャン」の挿入音を2回出力する場合、「ジャカジャカジャン」の挿入音を、図9(D)に示すように3拍で出力する構成や、図9(E)に示すように1拍で出力する構成としてもよい。このような構成にしても、楽曲再生装置400は、楽曲に同調する挿入音を挿入するので、楽曲の聴取の際に利用者が感じる違和感を低減できる。
Further, the insertion sound reproduction processing means 475B may output an insertion sound that matches a rhythm such as the time signature or beat of the music instead of the insertion sound that matches the music BPM. For example, in the case where the “Jaca Jean” insertion sound is output twice for a music with a 4-beat rhythm as shown in FIG. 9A, the “Jaca Jean” insertion sound is output as shown in FIG. 9B. It is good also as a structure which outputs in 2 beats, or a structure which outputs in 1 beat as shown in FIG.9 (C). Further, when the insertion sound of “Jakajakajan” is output twice, the insertion sound of “Jakajakajan” is output in 3 beats as shown in FIG. 9D, or as shown in FIG. 9E. It is good also as a structure which outputs in 1 beat. Even with such a configuration, the
そして、挿入音再生処理手段475Bにて、楽曲の始めや終わり、さらには楽曲の盛り上がる部分であるいわゆるサビの部分にそれぞれ同調する挿入音を出力する構成としてもよい。例えば、挿入音再生処理手段475Bにて、楽曲の始めに対応してゆったりとおとなしめの挿入音を、サブの部分に対応して派手な感じの挿入音である例えば「ジャカジャカジャカジャカジャカジャカジャン」のドラム音を、終わりに対応して終わりを連想させる例えば「デケデケジャカジャカジャカジャカジャーン」のドラム音を出力する構成としてもよい。このような構成にすれば、利用者は、楽曲の曲調に同調する挿入音を聴取でき、楽曲の聴取をさらに楽しむことができる。 Then, the insertion sound reproduction processing means 475B may be configured to output insertion sounds that are respectively tuned to the beginning and end of the music, and further to the so-called rust portion that is the rising portion of the music. For example, in the insertion sound reproduction processing means 475B, an insertion sound that is loose and gentle corresponding to the beginning of the music is inserted into a flashy feeling corresponding to the sub part, for example, “Jakajakajakajakajakajakajan” For example, the drum sound may be configured to output a drum sound of “Dekedeke Jaka Jaka Jaka Jaka Jane”, which is reminiscent of the end corresponding to the end. With such a configuration, the user can listen to the insertion sound that synchronizes with the tune of the music, and can further enjoy listening to the music.
さらに、挿入音再生処理手段475Bにて、挿入音を楽曲の小節に合わせたタイミングではなく、例えば楽曲の拍子や拍さらにはBPMなどのリズムに合わせたタイミングで出力する構成としてもよい。このような構成にしても、楽曲再生装置400は、リズムに合わせたタイミングで挿入する挿入音により、楽曲の聴取の際に利用者が感じる違和感をさらに低減でき、挿入音をさらに良好に出力できる。
Further, the inserted sound reproduction processing means 475B may output the inserted sound not at the timing of matching the music bar, but at the timing of the music, for example, the beat or beat of the music or the rhythm such as BPM. Even with such a configuration, the
また、挿入位置特定手段475Aにて、挿入位置を小節に合わせて特定する構成について例示したが、これに限らず、音声が発せられた時点や動作が実施された時点から出力処理開始時間である例えば3秒間が経過した時点を挿入位置として特定する構成としてもよい。このような構成にすれば、挿入位置特定手段475Aは、楽曲の小節を認識することなく挿入位置を容易に特定できる。したがって、挿入位置特定手段475Aの処理負荷を低減できる。さらに、挿入位置特定手段475Aの構成を簡略化できる。
In addition, the configuration in which the insertion
そして、挿入位置特定手段475Aにて、例えば音声が発せられた時点から出力処理期限時間以内に挿入音が出力されるように挿入位置を特定する構成について例示したが、これに限らず例えば以下のような構成としてもよい。すなわち、挿入位置特定手段475Aの構成にて、出力処理期限時間が経過した後に挿入音が出力されるように挿入位置を適宜特定する構成としてもよい。このような構成にしても、楽曲再生装置400は、楽曲に同調する挿入音を挿入するので、楽曲の聴取の際に利用者が感じる違和感を低減できる。
In the insertion
さらに、挿入音再生処理手段475Bにて、挿入音データ記憶手段420から取得する挿入音データ611に基づいて挿入音を出力する構成について例示したが、これに限らず挿入音再生処理手段475Bにて挿入音データを生成して挿入音を出力する構成としてもよい。このような構成にすれば、楽曲再生装置400に挿入音データ記憶手段420を設ける必要がなくなり、楽曲再生装置400の重量を軽くできる。また、楽曲再生装置400のコストを低減できる。
Further, although the insertion sound
また、楽曲再生装置400に無線媒体や有線媒体のネットワークを介して接続されたサーバ装置に、挿入音データ記憶手段420を設ける構成としてもよい。このような構成にすれば、楽曲再生装置400の重量を軽くできる。また、挿入音データ611をサーバ装置に接続された他の楽曲再生装置400と共有できる。
Further, the insertion sound
そして、挿入音データ611としてMIDI形式のデータを用いたが、WAVE形式やMPEG形式など他の形式のデータを用いる構成としてもよい。このような構成にすれば、楽曲再生装置400は、MIDI形式では再生できない例えば自然の音や人物の音声を挿入音として適宜出力できる。したがって、楽曲再生装置400は、利用者に楽曲の聴取をさらに楽しませることができる。
Although the MIDI format data is used as the
さらに、音声リズム認識手段473Aに、車内音に基準音量以上の音声が音声認識基準時間以上含まれているか否かを判断する機能を設けた構成について例示したが、このような機能を設けない構成としてもよい。また、動作リズム認識手段474Aに、身体の所定部分が所定方向に身体動作基準量以上動いたか否かを判断する機能を設けた構成について例示したが、このような機能を設けない構成としてもよい。これらのような構成にすれば、ステップS105やステップS204の処理を省略でき、各リズム認識手段473A,474Aの処理負荷を低減できる。また、各リズム認識手段473A,474Aの構成を簡略化でき、楽曲再生装置400のコストを低減できる。
Furthermore, although the voice
そして、楽曲再生装置400に、音声に対応する挿入音および動作に対応する挿入音を出力する機能を設けた構成について例示したが、いずれか一方の機能を設けない構成としてもよい。このような構成にすれば、各状態認識手段473,474のうちのいずれか一方を設ける必要がなく、演算手段470の構成を簡略化でき、楽曲再生装置400のコストを低減できる。
And although the composition which provided the function which outputs the insertion sound corresponding to an audio | voice and the insertion sound corresponding to operation | movement was illustrated in the
また、利用者が発音する音声に対応して挿入音を出力する構成について例示したが、これに限らず利用者の手拍子や鼻歌あるいは口笛の音、さらにはタンバリンやカスタネットあるいはマラカスなどの楽器を奏でる音に対応して挿入音を出力する構成としてもよい。ここで、楽器は、楽曲再生装置400に有線媒体や無線媒体のネットワークを介して接続されていてもよいし、接続されていなくてもよい。このような構成にすれば、利用者は、上述した各種音に対応する挿入音により、自ら発する各種音や自ら奏でる楽器音に楽曲が反応してくれているような感覚を体感でき、楽曲の聴取をより楽しむことができる。
In addition, the configuration for outputting the insertion sound in response to the sound generated by the user is illustrated, but not limited to this, the user's hand clapping, nose singing, whistling sound, and tambourine, castanets, maracas and other musical instruments It is good also as a structure which outputs an insertion sound corresponding to the sound to play. Here, the musical instrument may or may not be connected to the
さらに、例えば楽曲再生処理手段471を本発明の重畳楽曲データ生成手段として機能させる。そして、楽曲再生処理手段471にて、挿入音再生処理手段475Bで取得した挿入音データ611の挿入音を再生中の楽曲データ511の楽曲に重畳させた重畳楽曲データを生成する。この後、楽曲再生処理手段471にて、この重畳楽曲データを再生して、挿入音が挿入された楽曲を出力する構成としてもよい。このような構成にすれば、挿入音再生処理手段475Bに挿入音の出力処理を実施させることなく楽曲および挿入音を出力できる。したがって、各再生処理手段471,475Bの処理により楽曲および挿入音を出力させる上記実施の形態と比べて、挿入音出力時における演算手段470の処理負荷を低減できる。
Further, for example, the music reproduction processing means 471 is caused to function as the superimposed music data generation means of the present invention. Then, the music
また、例えば再生されている楽曲の構成を予測して、この構成に基づいた挿入音を出力させる構成としてもよい。すなわち、例えば楽曲の波形を解析して、音素のアタック密度の高い部分と低い部分とを検出する。さらに、この検出した各部分に基づいてコード進行予測をし、このコード進行予測からパターンを検出して楽曲構成を予測する。そして、例えば楽曲の始まりや終わりなどでは、音声やリズムを模したパターンを基調パターンとした挿入音を出力させる構成としてもよい。また、楽曲のサビの前などでは、基調パターンに装飾的な音符を付加した拡張パターンの挿入音を出力させる構成としてもよい。さらに、例えば1つの楽器で間奏を奏でるいわゆるソロ間奏の後など、楽曲で最も盛り上がる部分では、サビの前などと比べて装飾の割合を増加させた拡張パターンの挿入音を出力させる構成としてもよい。 Further, for example, the configuration of a music piece being reproduced may be predicted, and an insertion sound based on this configuration may be output. That is, for example, the waveform of music is analyzed to detect a high and low part of phoneme attack density. Furthermore, chord progression prediction is performed based on each detected part, and a music composition is predicted by detecting a pattern from the chord progression prediction. For example, at the beginning or end of a song, a configuration may be adopted in which an insertion sound using a pattern simulating voice or rhythm as a basic pattern is output. In addition, before the rust of the music, an insertion sound of an extended pattern in which a decorative note is added to the key pattern may be output. Furthermore, for example, after a so-called solo interlude where an interlude is played with a single instrument, an insertion sound of an extended pattern with an increased proportion of decoration compared to before the chorus may be output at the most exciting part of the music. .
ここで、上述したような装飾した拡張パターンの挿入音を生成する構成としては、例えば以下のような構成が例示できる。すなわち、例えば楽曲の最小ビート感で装飾付加音の最小分解能を決定する。そして、基調パターンをアクセントとして、決定した最小分解能におけるアクセント以外の部分に装飾音符を付加した挿入音を生成する構成、例えば基調パターンの前の部分や後の部分さらには前後の部分に、装飾的な音符を付加する構成などとしてもよい。例えば打楽器について例示すると、スネアドラムの音に対応する挿入音にタムタムやシンバルを加えるなど、挿入音として使用する音色の数を増やす構成などとしてもよい。 Here, as a configuration for generating the insertion sound of the extended pattern as described above, for example, the following configuration can be exemplified. That is, for example, the minimum resolution of the decoration additional sound is determined by the minimum beat feeling of the music. A configuration that generates an insertion sound in which a decorative note is added to a portion other than the accent at the determined minimum resolution, using the keynote pattern as an accent, for example, a decorative pattern in the front part, the rear part, and the front and rear parts of the keynote pattern. It is good also as a structure which adds a simple note. For example, for a percussion instrument, a configuration may be adopted in which the number of timbres used as the insertion sound is increased, such as adding a tom or cymbal to the insertion sound corresponding to the sound of the snare drum.
また、本発明の楽曲再生装置400を車載型のいわゆるカーオーディオに適用した構成について例示したが、パーソナルコンピュータ、ロボット、楽曲の伴奏音楽だけを出力するいわゆるカラオケ装置などに適用してもよい。また、本発明の音出力制御装置を楽曲再生装置400に適用した構成に限らず、楽曲リズム認識手段472、音声状態認識手段473、動作状態認識手段474、および、挿入音再生制御手段475を独立させた構成としてもよい。そして、各手段472〜475を独立させた構成をパーソナルコンピュータ、ロボット、携帯電話などの各種電子機器や電気機器に設けてもよい。ここで、各手段472〜475を独立させた構成における楽曲リズム認識手段472でリズムを認識する楽曲としては、テレビジョン受像機やラジオ受信機から出力される楽曲、携帯電話や設置式電話の着信音、公開演奏会で演奏される楽曲などが例示できる。
Moreover, although the composition which applied the
そして、上述した各機能をプログラムとして構築したが、例えば回路基板などのハードウェアあるいは1つのIC(Integrated Circuit)などの素子にて構成するなどしてもよく、いずれの形態としても利用できる。なお、プログラムや別途記録媒体から読み取らせる構成とすることにより、取扱が容易で、利用の拡大が容易に図れる。 Each function described above is constructed as a program, but may be configured by hardware such as a circuit board or an element such as a single integrated circuit (IC), and can be used in any form. In addition, by adopting a configuration that allows reading from a program or a separate recording medium, handling is easy, and usage can be easily expanded.
その他、本発明の実施の際の具体的な構造および手順は、本発明の目的を達成できる範囲で他の構造などに適宜変更できる。 In addition, the specific structure and procedure for carrying out the present invention can be changed as appropriate to other structures and the like within the scope of achieving the object of the present invention.
〔実施の形態の効果〕
上述したように、上記実施の形態では、楽曲再生装置400の演算手段470は、例えば音声対応モードで所定の楽曲を再生する旨の要求を認識すると、この所定の楽曲の再生を開始するとともに、マイク200で集音された例えば「イェイ」の音声を含む車内音を取得する。さらに、演算手段470は、再生中の楽曲の楽曲BPMを基準にした「イェイ」の音声の音声BPMを認識し、この音声BPMに対応する音声の音声リズムパターンを認識する。この後、演算手段470は、音声リズムパターンに対応するリズムパターン情報612Aに関連付けられた挿入音データ611に基づいて、音声リズムパターンに対応する挿入音、すなわち楽曲の特性である楽曲BPMに合わせた挿入音を楽曲に合わせて発音手段450から出力させる。このため、楽曲再生装置400は、楽曲に同調する挿入音を挿入するので、楽曲の聴取の際に利用者が感じる違和感を低減できる。したがって、楽曲再生装置400は、挿入音を良好に出力できる。
[Effect of the embodiment]
As described above, in the above-described embodiment, when the
400 楽曲再生装置
420 音データ記憶手段としての挿入音データ記憶手段
450 音出力手段および楽曲出力手段としての発音手段
470 演算手段
471 重畳楽曲データ生成手段としても機能しうる楽曲再生処理手段
472 音出力制御装置を構成する楽曲特性認識手段としての楽曲リズム認識手段
473 音出力制御装置を構成する、外部状態情報取得手段および外部状態リズム認識手段としての音声状態認識手段
474 音出力制御装置を構成する、外部状態情報取得手段および外部状態リズム認識手段としての動作状態認識手段
475 音出力制御装置を構成する音出力制御手段としての挿入音再生制御手段
511 楽曲データ
611 音データとしての挿入音データ
612B 所定外部状態情報としての対象言語情報
612C 所定外部状態情報としての対象動作情報
400
Claims (26)
外部状態に関する外部状態情報を取得する外部状態情報取得手段と、
楽曲に関する楽曲データを出力する楽曲出力手段から出力される前記楽曲データの音の特性を認識する楽曲特性認識手段と、
所定の前記外部状態に関する前記外部状態情報を取得したことを認識すると、前記音の特性に同調する出力形態の音を前記音出力手段から出力させる制御をする音出力制御手段と、
を具備したことを特徴とした音出力制御装置。 A sound output control device for outputting a predetermined sound from the sound output means,
An external state information acquisition means for acquiring external state information related to the external state;
Music characteristic recognition means for recognizing the sound characteristics of the music data output from the music output means for outputting music data relating to the music;
Recognizing that the external state information related to the predetermined external state has been acquired, a sound output control means for controlling the sound output means to output a sound in an output form synchronized with the characteristics of the sound;
A sound output control device comprising:
前記音出力制御手段は、前記楽曲の音の高さ、強さ、および、音色のうちの少なくともいずれか1つに同調する出力形態の音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to claim 1,
The sound output control means controls to output a sound in an output form that is tuned to at least one of the pitch, strength, and tone color of the music. apparatus.
前記音出力制御手段は、前記楽曲のコードに同調する出力形態の音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to claim 1 or 2,
The sound output control means controls to output a sound in an output form synchronized with the chord of the music.
前記所定の外部状態のリズムを認識する外部状態リズム認識手段を具備し、
前記音出力制御手段は、前記所定の外部状態のリズムに同調する出力形態の音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to any one of claims 1 to 3,
Comprising external state rhythm recognition means for recognizing the rhythm of the predetermined external state;
The sound output control device is characterized in that the sound output control means controls to output a sound in an output form synchronized with the rhythm of the predetermined external state.
前記音出力制御手段は、前記所定の外部状態の内容に対応する出力形態の音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to any one of claims 1 to 4,
The sound output control device is characterized in that the sound output control means controls to output a sound in an output form corresponding to the content of the predetermined external state.
前記音出力制御手段は、前記楽曲のリズムに同調する出力形態の音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to any one of claims 1 to 5,
The sound output control means controls to output a sound in an output form synchronized with the rhythm of the music.
前記音出力制御手段は、前記楽曲のBPM(Beats Per Minute)に合わせた出力形態の音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to claim 6,
The sound output control means controls to output a sound in an output form in accordance with BPM (Beats Per Minute) of the music.
前記音出力制御手段は、前記楽曲の曲調に同調する出力形態の音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to claim 6 or 7,
The sound output control means controls to output a sound in an output form synchronized with the tune of the music.
前記音出力制御手段は、前記楽曲のリズムに合わせたタイミングで前記音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to any one of claims 1 to 5,
The sound output control device controls the output of the sound at a timing according to the rhythm of the music.
前記音出力制御手段は、前記楽曲の小節に合わせたタイミングで前記音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to claim 9,
The sound output control device is characterized in that the sound output control means controls to output the sound at a timing according to a measure of the music.
前記音出力制御手段は、前記所定の外部状態に関する外部状態情報が取得されてからの経過時間が所定の時間である出力処理期限時間になる前に前記音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to any one of claims 1 to 10,
The sound output control means performs control to output the sound before an output processing deadline time that is a predetermined time after the external state information relating to the predetermined external state is acquired. Sound output control device.
前記音出力制御手段は、前記所定の外部状態に関する外部状態情報が取得されてからの経過時間が所定の時間である出力処理開始時間になったことを認識すると前記音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to any one of claims 1 to 8,
The sound output control means performs control to output the sound when recognizing that an elapsed time from the acquisition of the external state information relating to the predetermined external state has reached an output processing start time which is a predetermined time. Sound output control device characterized by.
前記音出力制御手段は、前記出力形態で出力される音に関する音データを取得し、この音データに基づいて前記出力形態の音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to any one of claims 1 to 12,
The sound output control device, wherein the sound output control means acquires sound data related to the sound output in the output form, and controls to output the sound in the output form based on the sound data.
前記音データは、MIDI(Musical Instrument Digital Interface)の規格に準拠し、
前記前記音出力制御手段は、前記音データにおける出力形態に関する情報の設定値を変更して前記出力形態の音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to claim 13,
The sound data conforms to the MIDI (Musical Instrument Digital Interface) standard,
The sound output control device, wherein the sound output control means performs control to change a set value of information relating to an output form in the sound data to output a sound of the output form.
前記音データを前記所定の外部状態に関する所定外部状態情報に関連付けて記憶する音データ記憶手段を具備し、
前記音出力制御手段は、前記音データ記憶手段から前記取得した前記外部状態情報の前記所定の外部状態に関する前記所定外部状態情報を検索し、この検索した前記所定外部状態情報に関連付けられた前記音データを取得する
ことを特徴とした音出力制御装置。 The sound output control device according to claim 13 or 14,
Sound data storage means for storing the sound data in association with predetermined external state information relating to the predetermined external state;
The sound output control means retrieves the predetermined external state information related to the predetermined external state of the acquired external state information from the sound data storage means, and the sound associated with the retrieved predetermined external state information A sound output control device characterized by acquiring data.
前記外部状態情報取得手段は、外部音に関する外部音情報を前記外部状態情報として取得し、
前記音出力制御手段は、所定の前記外部音に関する前記外部音情報を取得したことを認識すると、前記音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to any one of claims 1 to 15,
The external state information acquisition means acquires external sound information related to an external sound as the external state information,
When the sound output control means recognizes that the external sound information related to the predetermined external sound has been acquired, the sound output control means controls to output the sound.
前記音出力制御手段は、前記外部音情報の外部音における基準音量以下の前記外部音の時間長が所定の時間である外部音認識基準時間以下であることを認識すると、前記音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to claim 16,
The sound output control unit is configured to output the sound when recognizing that a time length of the external sound equal to or less than a reference volume in the external sound of the external sound information is equal to or less than an external sound recognition reference time that is a predetermined time. A sound output control device characterized by
前記外部音は、音声である
ことを特徴とした音出力制御装置。 The sound output control device according to claim 16 or 17,
The sound output control device, wherein the external sound is a sound.
前記外部状態情報取得手段は、身体の動作に関する身体動作情報を前記外部状態情報として取得し、
前記音出力制御手段は、所定の前記身体の動作に関する前記身体動作情報を取得したことを認識すると、前記音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to any one of claims 1 to 18,
The external state information acquisition means acquires body motion information related to body motion as the external state information,
When the sound output control means recognizes that the body motion information related to a predetermined body motion has been acquired, the sound output control means controls to output the sound.
前記音出力制御手段は、前記身体動作情報の身体の動作における前記身体の移動量が所定の移動量である身体動作認識基準量以上であることを認識すると、前記音を出力させる制御をする
ことを特徴とした音出力制御装置。 The sound output control device according to claim 19,
The sound output control means performs control to output the sound when recognizing that the amount of movement of the body in the body movement of the body movement information is equal to or greater than a body movement recognition reference amount that is a predetermined movement amount. Sound output control device characterized by.
前記楽曲データを再生して前記楽曲出力手段から出力させる処理をする楽曲再生処理手段と、
を具備したことを特徴とした楽曲再生装置。 The sound output control device according to any one of claims 1 to 20,
Music reproduction processing means for performing processing for reproducing the music data and outputting the music data from the music output means;
A music playback device characterized by comprising:
前記楽曲データを取得して前記音出力制御装置の前記音出力制御手段で出力が制御される前記音を前記楽曲データの音に重畳させた重畳楽曲データを生成する重畳楽曲データ生成手段と、
前記重畳楽曲データを再生して前記楽曲出力手段から出力させる処理をする楽曲再生処理手段と、
を具備したことを特徴とした楽曲再生装置。 The sound output control device according to any one of claims 1 to 20,
Superimposed music data generating means for acquiring the music data and generating superimposed music data in which the sound whose output is controlled by the sound output control means of the sound output control device is superimposed on the sound of the music data;
Music reproduction processing means for performing processing for reproducing the superimposed music data and outputting the music from the music output means;
A music playback device characterized by comprising:
外部状態に関する外部状態情報を取得し、
楽曲に関する楽曲データを出力する楽曲出力手段から出力される前記楽曲データの音の特性を認識し、
所定の前記外部状態に関する前記外部状態情報を取得したことを認識すると、前記音の特性に同調する出力形態の音を前記音出力手段から出力させる制御をする
ことを特徴とする音出力制御方法。 A sound output control method for outputting a predetermined sound from sound output means,
Get external state information about the external state,
Recognizing the sound characteristics of the music data output from the music output means for outputting music data related to the music,
When recognizing that the external state information relating to a predetermined external state has been acquired, a sound output control method is provided for controlling the sound output means to output a sound in an output form that is tuned to the sound characteristics.
ことを特徴とした音出力制御プログラム。 21. A sound output control program that causes a computing means to function as the sound output control device according to claim 1.
ことを特徴とした音出力制御プログラム。 A sound output control program for causing a calculation means to execute the sound output control method according to claim 23.
ことを特徴とした音出力制御プログラムを記録した記録媒体。 26. A recording medium on which a sound output control program according to claim 24 or 25 is recorded so as to be readable by an arithmetic means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004293801A JP4244338B2 (en) | 2004-10-06 | 2004-10-06 | SOUND OUTPUT CONTROL DEVICE, MUSIC REPRODUCTION DEVICE, SOUND OUTPUT CONTROL METHOD, PROGRAM THEREOF, AND RECORDING MEDIUM CONTAINING THE PROGRAM |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004293801A JP4244338B2 (en) | 2004-10-06 | 2004-10-06 | SOUND OUTPUT CONTROL DEVICE, MUSIC REPRODUCTION DEVICE, SOUND OUTPUT CONTROL METHOD, PROGRAM THEREOF, AND RECORDING MEDIUM CONTAINING THE PROGRAM |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006106411A true JP2006106411A (en) | 2006-04-20 |
JP4244338B2 JP4244338B2 (en) | 2009-03-25 |
Family
ID=36376220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004293801A Expired - Fee Related JP4244338B2 (en) | 2004-10-06 | 2004-10-06 | SOUND OUTPUT CONTROL DEVICE, MUSIC REPRODUCTION DEVICE, SOUND OUTPUT CONTROL METHOD, PROGRAM THEREOF, AND RECORDING MEDIUM CONTAINING THE PROGRAM |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4244338B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8515092B2 (en) | 2009-12-18 | 2013-08-20 | Mattel, Inc. | Interactive toy for audio output |
JP2018022019A (en) * | 2016-08-03 | 2018-02-08 | ヤマハ株式会社 | Device and method for generating phrase |
CN109976699A (en) * | 2017-12-27 | 2019-07-05 | 丰田自动车株式会社 | Sound output device, method of outputting acoustic sound and voice output program storage medium |
JP2019191336A (en) * | 2018-04-24 | 2019-10-31 | 培雄 唐沢 | Arbitrary signal insertion method and arbitrary signal insertion system |
-
2004
- 2004-10-06 JP JP2004293801A patent/JP4244338B2/en not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8515092B2 (en) | 2009-12-18 | 2013-08-20 | Mattel, Inc. | Interactive toy for audio output |
JP2018022019A (en) * | 2016-08-03 | 2018-02-08 | ヤマハ株式会社 | Device and method for generating phrase |
CN109976699A (en) * | 2017-12-27 | 2019-07-05 | 丰田自动车株式会社 | Sound output device, method of outputting acoustic sound and voice output program storage medium |
JP2019191336A (en) * | 2018-04-24 | 2019-10-31 | 培雄 唐沢 | Arbitrary signal insertion method and arbitrary signal insertion system |
CN112119456A (en) * | 2018-04-24 | 2020-12-22 | 应确始听(上海)互联网科技有限公司 | Arbitrary signal insertion method and arbitrary signal insertion system |
JP7343268B2 (en) | 2018-04-24 | 2023-09-12 | 培雄 唐沢 | Arbitrary signal insertion method and arbitrary signal insertion system |
CN112119456B (en) * | 2018-04-24 | 2024-03-01 | 应确始听(上海)互联网科技有限公司 | Arbitrary signal insertion method and arbitrary signal insertion system |
Also Published As
Publication number | Publication date |
---|---|
JP4244338B2 (en) | 2009-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9502012B2 (en) | Drumstick controller | |
JP3915257B2 (en) | Karaoke equipment | |
JPH08234771A (en) | Karaoke device | |
WO2007055522A1 (en) | Novel drum edutainment apparatus | |
JP4568506B2 (en) | Playback control device | |
JPH08194495A (en) | Karaoke device | |
JP2006251053A (en) | Musical sound controller | |
JP2006259471A (en) | Singing practice system and program for singing practice system | |
JP3750699B2 (en) | Music playback device | |
JP4244338B2 (en) | SOUND OUTPUT CONTROL DEVICE, MUSIC REPRODUCTION DEVICE, SOUND OUTPUT CONTROL METHOD, PROGRAM THEREOF, AND RECORDING MEDIUM CONTAINING THE PROGRAM | |
JP7367835B2 (en) | Recording/playback device, control method and control program for the recording/playback device, and electronic musical instrument | |
JP3972619B2 (en) | Sound generator | |
JP6252420B2 (en) | Speech synthesis apparatus and speech synthesis system | |
JP2009198714A (en) | Karaoke device and reproduction processing method of karaoke accompaniment music and program | |
JP2006251697A (en) | Karaoke device | |
JP5486941B2 (en) | A karaoke device that makes you feel like singing to the audience | |
JPH08286689A (en) | Voice signal processing device | |
JP5842383B2 (en) | Karaoke system and karaoke device | |
JPH11338480A (en) | Karaoke (prerecorded backing music) device | |
JP2001228866A (en) | Electronic percussion instrument device for karaoke sing-along machine | |
JPH08227296A (en) | Sound signal processor | |
JPH08328555A (en) | Performance controller | |
KR101400258B1 (en) | Image displaying method using voice recognition | |
KR101842282B1 (en) | Guitar playing system, playing guitar and, method for displaying of guitar playing information | |
JPH1185174A (en) | Karaoke sing-along machine which enables a user to play accompaniment music |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20070814 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070903 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080916 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081202 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081226 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120116 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130116 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |