JPWO2005111997A1 - オーディオ再生装置 - Google Patents

オーディオ再生装置 Download PDF

Info

Publication number
JPWO2005111997A1
JPWO2005111997A1 JP2006513500A JP2006513500A JPWO2005111997A1 JP WO2005111997 A1 JPWO2005111997 A1 JP WO2005111997A1 JP 2006513500 A JP2006513500 A JP 2006513500A JP 2006513500 A JP2006513500 A JP 2006513500A JP WO2005111997 A1 JPWO2005111997 A1 JP WO2005111997A1
Authority
JP
Japan
Prior art keywords
sound
data
music
vocal
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006513500A
Other languages
English (en)
Inventor
博文 岩路
博文 岩路
野中 慶也
慶也 野中
伸夫 垂井
伸夫 垂井
杉野 竜二
竜二 杉野
紀孝 新居
紀孝 新居
武藤 健
健 武藤
将士 青山
将士 青山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
TechExperts Inc
Pioneer System Technologies Corp
Original Assignee
Pioneer Corp
TechExperts Inc
Pioneer System Technologies Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Corp, TechExperts Inc, Pioneer System Technologies Corp filed Critical Pioneer Corp
Publication of JPWO2005111997A1 publication Critical patent/JPWO2005111997A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/04Sound-producing devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • G10H1/366Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems with means for modifying or correcting the external signal, e.g. pitch correction, reverberation, changing a singer's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/46Volume control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

本発明は、お手本となるボーカル歌唱データを用意しないオーディオ再生装置でも任意のタイミングでカラオケを楽しむことができるようにすることを目的とする。マイクロホンMIC等で収音したユーザの歌声等の収音データDauに対して曲調検出を行う曲調検出部4と、音源部3から出力される音楽データDsonに対して曲調検出を行う曲調検出部5と、曲調検出部4の曲調検出結果(特徴量)CHxと曲調検出部6の曲調検出結果(特徴量)CHyとを比較してユーザの歌声と音楽のボーカル音との類似性を判断する比較部6と、ボーカル音量調部7と混合部8とを設ける。比較部6が類似性有りと判断するとボーカル音量調部7が音楽データDsonのボーカル音を除去又は減衰させた音楽データDcを生成し、混合部8が音声データDcと収音データDauを混合することにより、カラオケ再生用の音楽再生用データDoutを生成して出力する。

Description

本発明は、カラオケ機能を有するオーディオ再生装置に関する。
従来のカラオケ装置として、特開平11−175077号公報(以下「特許文献1」)と、特開2000−47677号公報(以下「特許文献2」)に開示されたものが知られている。
特許文献1に開示されているカラオケ装置は、伴奏音とお手本ボーカル歌唱データとを用意し、それら伴奏音とお手本ボーカル歌唱データとをミキシング(混合)することによってスピーカ等で再生を行う他、マイク入力されるユーザの歌声も混合して音楽再生を行うように構成されている。
そして、お手本ボーカル歌唱データの音程(interval)とユーザの歌声の音程とを比較し、その音程差が所定範囲内であれば、音程が合っていると判定して、お手本ボーカル歌唱データの音量を小さくすることによってユーザの歌声と伴奏音とを聴きやすくし、音程差が所定範囲外であれば、音程が外れていると判定して、ボーカル歌唱データの音量を大きくすることによってお手本ボーカル歌唱データと伴奏音とを聴きやすくすることにより、お手本ボーカル歌唱データの音程に合わせて歌唱練習を行えるようにしている。
つまり、特許文献1では、お手本ボーカル歌唱データを用意し、そのお手本ボーカル歌唱データとの音程差が大きい場合にはお手本ボーカル歌唱データの音量を大きくして練習させ、音程差が小さい場合には、お手本ボーカル歌唱データの音量を小さくして練習させる。すなわち、必要に応じてお手本ボーカル歌唱データを聴かせながら歌唱練習をサポートしている。
特許文献2に開示されているカラオケ装置も同様に、伴奏音とお手本となるボーカル音データとを用意し、それら伴奏音とボーカル音データとマイク入力されるユーザの歌声とを混合してスピーカ等で再生を行うように構成されている。
そして、このカラオケ装置では、ボーカル音データのレベルと、マイク入力されるユーザの歌声のレベルとを比較し、ユーザの歌声がボーカル音データに比して小さいレベルのときには、ユーザの分からない部分であると判断してお手本となるボーカル音データの音量を大きくして学習させ、ユーザの歌声がボーカル音データに比して大きいレベルのときには、ユーザが歌える部分であると判断してユーザの歌声の音量を大きくすることにより、ユーザの歌声と伴奏音とを聴きやすくして歌唱練習を行えるようにしている。
つまり、特許文献2では、お手本となるボーカル音データを用意し、そのボーカル音データのレベルより小さい場合には、ボーカル音データによる音量を大きくして学習させ、レベルが小さい場合にはユーザの歌声の音量を大きくしてユーザの歌唱を妨げないようにしている。すなわち、必要に応じてお手本となるボーカル音データを聴かせながら歌唱練習をサポートしている。
特開平11−175077号公報 特開2000−47677号公報
ところで、上記特許文献1に開示されている従来のカラオケ装置では、お手本ボーカル歌唱データとユーザの歌声との音程差に応じて、ユーザの歌声に対するボーカル歌唱データの音量を自動的に調整することとしているが、こうした音程に基づいて音量調整を行うと、周囲の環境音や会話等にも反応し、ユーザが歌唱していないにもかかわらず、自動的に音量調整を行ってしまう(例えば、お手本ボーカル歌唱データの音量を大きくする)という問題があった。
また、上記特許文献2に開示されている従来のカラオケ装置では、お手本となるボーカル音データとユーザの歌声とのレベルの大小に応じて、ユーザの歌声に対するボーカル音データの音量を自動的に調整することとしているが、こうしたレベルの大小に基づいてボーカル音の音量を自動調整する場合にも、周囲の環境音や会話等にも反応し、ユーザが歌唱していないにもかかわらず、自動的に音量調整を行ってしまう(例えば、お手本となるボーカル音データのレベルを大きくしてしまう)という問題があった。
また、上記特許文献1と特許文献2に開示された従来のカラオケ装置は、お手本となるボーカル歌唱データを用意して、そのボーカル歌唱データを必要に応じて聴かせることによりユーザに対しカラオケを楽しませるものであり、例えば、お手本のボーカル歌唱データが記録されていないCD(Compact Disc)等のストレージ媒体等から音楽データを再生するオーディオ再生装置ではその音楽データのボーカル音が邪魔してカラオケを充分に楽しむことができないという不都合があった。
本発明はこのような従来の問題点に鑑みてなされたものであり、ユーザの歌声を精度良く判定して、お手本となるボーカル歌唱データを用意しないオーディオ再生装置でもカラオケを楽しむことができることを目的とする。
請求項1に記載の発明は、音を収音する収音手段から出力される収音信号と音源手段から出力される音楽信号とを混合して出力する混合手段を備えたオーディオ再生装置であって、前記収音手段から出力される収音信号の曲調を検出する第1の曲調検出手段と、音源手段から出力される音楽信号のボーカル音の曲調を検出する第2の曲調検出手段と、前記第1,第2の曲調検出手段が検出した前記収音信号の曲調の特徴と前記ボーカル音の曲調の特徴との類似性を判断する比較手段と、前記比較手段が類似性有りと判断すると、前記音源手段から混合手段へ供給される前記音楽信号のボーカル音を除去又は減衰させるボーカル音量調整手段と、を具備することを特徴とする。
請求項3に記載の発明は、音を収音する収音手段から出力される収音信号と音源手段から出力される音楽信号とを混合して出力する混合手段を備えたオーディオ再生装置におけるオーディオ再生方法であって、前記収音手段から出力される収音信号の曲調を検出する第1の曲調検出工程と、音源手段から出力される音楽信号のボーカル音の曲調を検出する第2の曲調検出工程と、前記第1,第2の曲調検出工程で検出した前記収音信号の曲調の特徴と前記ボーカル音の曲調の特徴との類似性を判断する比較工程と、前記比較工程で類似性有りと判断すると、前記音源手段から混合手段へ供給される前記音楽信号のボーカル音を除去又は減衰させるボーカル音量調整工程と、を具備することを特徴とする。
本発明の実施形態に係るオーディオ再生装置の構成を表したブロック図である。 実施例に係るオーディオ再生装置の構成を表したブロック図である。 図2に示したオーディオ再生装置の動作を説明するためのフローチャートである。
本発明の実施形態に係るオーディオ再生装置について、図1を参照して説明する。図1は、本実施形態のオーディオ再生装置の構成を表したブロック図である。
同図において、このオーディオ再生装置1は、マイクロホンMIC及び入力アンプ部2と、音源部3と、曲調検出部4,5、比較部6、ボーカル音量調整部7と、混合部8を有して構成されている。
マイクロホンMIC及び入力アンプ部2は、ユーザの歌声等を収音する収音手段として設けられており、マイクロホンMICが収音した収音信号を入力アンプ部2が増幅し、更にデジタルデータ列から成る収音データDauにA/D変換して出力する。
音源部3は、デジタルデータ列から成る音楽データDsonを出力する音源手段であり、例えば、MD(Min Disc)やCD(Compact Disc)やDVD(Digital Versatile Disc)等の各種ストレージ媒体に記録されている音楽を再生して出力するいわゆる情報再生装置や、ラジオ放送やテレビ放送を受信して出力する無線受信機、インターネット等の通信網を介して配信されてくる音楽等を受信して出力する受信手段等によって形成されている。
曲調検出部4は、入力アンプ部2から出力される収音データDauに対して、所定周期毎に曲調検出を行うことにより、曲調を有するユーザの歌声の特徴を抽出する。
ここで、曲調検出部4は、「調性(キー:key)」と、「拍(ビート:beat)の変化量(BPM)」と、「和音(コード:chord)の変化量(CPM)」と、「拍の最大レベル」と、「楽音の平均強度」と、「楽音の最大強度」との6種類のパラメータを曲調を表すパラメータとして特徴抽出し、抽出した6種類のパラメータから成る特徴量CHxを比較部6に供給する。
曲調検出部5は、音源部3から出力される音楽データDsonに対して、所定周期毎に且つ曲調検出部4と同期を取りながら曲調検出を行うことにより、曲調を有する歌手のボーカル音の特徴を抽出する。
ここで、曲調検出部5も曲調検出部4と同様に、「調性(キー:key)」と、「拍(ビート:beat)の変化量(BPM)」と、「和音(コード:chord)の変化量(CPM)」と、「拍の最大レベル」と、「楽音の平均強度」と、「楽音の最大強度」との6種類のパラメータを曲調を表すパラメータとして特徴抽出し、抽出した6種類のパラメータから成る特徴量CHyを比較部6に供給する。
比較部6は、曲調検出部4,5から所定周期に同期して供給される特徴量CHx,CHyを上述の各パラメータ毎に比較して、各パラメータ毎の差分値を演算する。そして、各パラメータの差分値が夫々予め決められた基準値の範囲内であれば、マイク入力されたユーザの歌声と歌手のボーカル音とが類似していると判断して制御信号CNTを出力し、各パラメータの差分値が夫々予め決められた基準値の範囲外であれば、マイク入力されたユーザの歌声と歌手のボーカル音とが類似していなと判断して、制御信号CNTを出力しない。
すなわち、比較部6は、曲調検出部4と5からユーザの歌声に関する特徴量CHxと歌手のボーカル音に関する特徴量CHyが供給された場合に、特徴量CHxと特徴量CHyが類似していれば、制御信号CNTを出力し、それ以外の場合には制御信号CNTを出力しない。
したがって、比較部6は、ユーザの歌声に関する特徴量CHxと歌手のボーカル音に関する特徴量CHyが供給された場合であっても特徴量CHxと特徴量CHyが類似していなければ制御信号CNTを出力しない。
また、ユーザが歌唱していないときの収音データDauに基づいて、曲調検出部4が曲調検出を行った場合、曲調の性質を有さない特徴量CHxを検出することとなる。このため、ユーザが歌唱していないときの特徴量CHxと歌手のボーカル音に関する特徴量CHyが比較部6に供給された場合にも、比較部6は、制御信号CNTを出力しない。
ボーカル音量調整部7は、制御信号CNTが供給される期間において、音楽データDsonに含まれている歌手のボーカル音のデータを除去又はそのデータの値を減衰させて出力する。
すなわち、上述したように、曲調検出部4と5からユーザの歌声に関する特徴量CHxと歌手のボーカル音に関する特徴量CHyが出力され、比較部6が特徴量CHxと特徴量CHyが類似していると判断して、制御信号CNTを出力した場合に、ボーカル音量調整部7は、その制御信号CNTの出力期間だけ、歌手のボーカル音のデータを除去又は減衰させることにより、伴奏音の音楽データDcを生成して出力し、制御信号CNTが出力されない期間では、音楽データDsonをそのまま音楽データDcとして通過させて出力する。
混合部8は、入力アンプ部2からの収音データDauと、ボーカル音量調整部7からの音楽データDcとを混合することにより、スピーカ等に供給して音楽再生を行わせるための音楽再生用データDoutを生成して出力する。なお、混合部8は、ボーカル音量調整部7により歌手のボーカル音のデータが除去又は減衰されていない場合、すなわち、制御信号CNTが出力されない期間では、入力アンプ部2からの収音データDauを混合することなく、音楽データDc(すなわち、収音データDau)をそのまま音楽再生用データDoutとして出力する。
このように、本実施形態のオーディオ再生装置1によれば、マイクロホンMICで収音した音の曲調を表す特徴量CHxの各パラメータ(以下単に「特徴量CHx」として説明する)と、音源部3から出力される音楽データDsonによるボーカル音の曲調を表す特徴量CHyの各パラメータ(以下単に「特徴量CHy」として説明する)との類似性を比較し、特徴量CHx,CHyが類似している場合に、ボーカル音を除去又は減衰させて、収音した音を再生し、また、特徴量CHx,CHyが類似していない場合には、収音した音を再生せず、歌手のボーカル音を再生するので、会話や周囲の環境音の影響を受けることなく、ユーザが発声した歌声を精度良く検出することが可能となっている。
つまり、マイクロホンMICで収音した音が環境音や会話等の曲調を有さない音である場合には、特徴量CHxと特徴量CHyとが類似しなくなるため、比較部6は、収音した音をユーザの歌声ではないと判断し、制御信号CNTを出力しなくなる。このため、結果的に、ユーザが発声した歌声を精度良く検出することが可能となっている。
更に、特徴量CHxと特徴量CHyとが類似している場合に限り、ボーカル音を除去又は減衰させて、収音した音を再生するので、歌手のボーカル音が邪魔することなくカラオケを楽しむことができる。つまり、お手本となるボーカル歌唱データを用意したカラオケ装置でなく通常のオーディオ装置でもカラオケを楽しむことが可能となる。
次に、オーディオ再生装置のより詳細な実施例について、図2及び図3を参照して説明する。
図2は、本実施例に係るオーディオ再生装置の構成を表したブロック図であり、図1と同一又は相当する部分を同一符号で示している。図3は、本実施例のオーディオ再生装置の動作を説明するためのフローチャートである。
図2において、このオーディオ再生装置1は、マイクロホントMIC及び入力アンプ部2と、音源部3と、入力アンプ部2側に設けられたバンドパスフィルタ9と、音源部3側に設けられたバンドパスフィルタ10と、曲調検出部4,5、比較部6、ボーカル音量調整部7と、混合部8とを有して構成されており、曲調検出部4,5は、コンピュータプログラムに従って動作するデジタルシグナルプロセッサ(DSP)によって形成されている。
バンドパスフィルタ9は、入力アンプ部2から出力されるデジタルデータ列から成る収音データDauをデジタル演算処理することによって、人間の発話音声の周波数帯域成分に相当する音声データDvceを抽出し、曲調検出部4に供給する。
バンドパスフィルタ10は、音源部3から出力される音楽データDsonをデジタル演算処理することにより、人間の発話音声の周波数帯域成分に相当するボーカル音データDvocを抽出し、曲調検出部5に供給する。
曲調検出部4は、キー検出部4a、ビート変化量検出部4b、コード変化量検出部4c、ビート最大値検出部4d、平均強度検出部4e、最大強度検出部4fを有して構成されている。
ここで、キー検出部4aと、ビート変化量検出部4b、コード変化量検出部4c、ビート最大値検出部4d、平均強度検出部4e、最大強度検出部4fは、所定周期の範囲毎に音声データDvceに対して夫々曲調検出を行うことにより、「調性(キー:key)」を表す特徴データDx1と、「拍(ビート:beat)の変化量(BPM)」を表す特徴データDx2と、「和音(コード:chord)の変化量(CPM)」を表す特徴データDx3と、「拍の最大レベル」を表す特徴データDx4と、「楽音の平均強度」を表す特徴データDx5と、「楽音の最大強度」を表す特徴データDx6とを生成し、これら6種類の特徴データDx1〜Dx6を特徴量CHxとして、比較部6に供給する。
曲調検出部5は、曲調検出部4と同様に、キー検出部5a、ビート変化量検出部5b、コード変化量検出部5c、ビート最大値検出部5d、平均強度検出部5e、最大強度検出部5fを有して構成されている。
そして、キー検出部5aと、ビート変化量検出部5b、コード変化量検出部5c、ビート最大値検出部5d、平均強度検出部5e、最大強度検出部5fは、曲調検出部4側に設けられている各検出部4a〜4fと同期して動作し、所定周期の範囲毎にボーカル音データDvocに対して夫々曲調検出を行うことにより、「調性(キー:key)」を表す特徴データDy1と、「拍(ビート:beat)の変化量(BPM)」を表す特徴データDy2と、「和音(コード:chord)の変化量(CPM)」を表す特徴データDy3と、「拍の最大レベル」を表す特徴データDy4と、「楽音の平均強度」を表す特徴データDy5と、「楽音の最大強度」を表す特徴データDy6とを生成し、これら6種類の特徴データDy1〜Dy6を特徴量CHyとして、比較部6に供給する。
比較部6は、曲調検出部4,5から所定周期に同期して供給される特徴量CHx,CHyを上述の各パラメータ毎に比較して、各パラメータ毎の差分値を演算する。
すなわち、比較部6は、特徴データDx1とDy1の差分と、特徴データDx2とDy2の差分と、特徴データDx3とDy3の差分と、特徴データDx4とDy4の差分と、特徴データDx5とDy5の差分と、特徴データDx6とDy6の差分を演算する。
そして、各パラメータの差分値が夫々予め決められた基準値の範囲内であれば、マイク入力されたユーザの歌声と歌手のボーカル音とが類似していると判断して制御信号CNTを出力し、各パラメータの差分値が夫々予め決められた基準値の範囲外であれば、マイク入力されたユーザの歌声と歌手のボーカル音とが類似していないと判断して、制御信号CNTを出力しない。
つまり、比較部6は、ユーザの発声した歌声に関する特徴量CHxと歌手のボーカル音に関する特徴量CHyとの類似性を比較し、特徴量CHxと特徴量CHyが類似していれば、制御信号CNTを出力し、それ以外の場合には制御信号CNTを出力しないようになっている。
次に、ボーカル音量調整部7は、バンドパスフィルタ7aと、音声分析合成部7bと、ローパスフィルタ7c及び減算器7dを有して構成されている。
ここで、バンドパスフィルタ7aは、上述のバンドパスフィルタ10と同様に、音源部3から出力される音楽データDsonをデジタル演算処理することにより、人間の発話音声の周波数帯域成分に相当するボーカル音データDvocを抽出し、音声分析合成部7bへ供給する。
音声分析合成部7bは、人間の声道の伝達関数の逆特性に近似した音声分析用適応デジタルフィルタと、人間の声道の伝達関数に近似した音声合成用デジタルフィルタとを有している。
そして、制御信号CNTが供給されると、音声分析用適応デジタルフィルタがボーカル音データDvocに基づいて音声認識処理を行い、更に音声認識結果に基づいて音声合成用デジタルフィルタの各タップ係数を適応的に調整して、音声合成用デジタルフィルタから、擬似的なボーカル音に相当するインパルス応答列データhvocを出力させる。そして、ローパスフィルタ7cが、インパルス応答列データhvocの高域ノイズ成分を除去して減算器7dへ供給する。
減算器7dは、制御信号CNTが出力されている期間において、ローパスフィルタ7cを介して供給される擬似的なボーカル音に相当するインパルス応答列データhvocと、音楽データDsonとを減算処理することにより、音楽データDsonに含まれているボーカル音に関するデータを除去又は減衰させ、減算処理後の音楽データDcを混合部8へ供給する。
混合部8は、入力アンプ部2からの収音データDauと、減算器7dからの音楽データDcとを混合することにより、スピーカ等に供給して再生を行わせるための再生用データDoutを生成して出力する。また、混合部8は、ボーカル音量調整部7により歌手のボーカル音のデータが除去又は減衰されていない場合、すなわち、比較部6から制御信号CNTが出力されない期間では、入力アンプ部2からの収音データDauを混合することなく、音楽データDc(すなわち、収音データDau)をそのまま音楽再生用データDoutとして出力する。
次に、かかる構成を有する本実施例のオーディオ再生装置1の動作について図3を参照して説明する。
図3において、ユーザが音源部3である情報再生装置にMDやCD、DVD等の各種ストレージ媒体を装填して、例えばカラオケ機能をオン操作して再生を開始したり、又は、無線受信機をオン操作するとともに例えばカラオケ機能をオン操作してラジオ放送等の受信を開始させたり、インターネット等の通信網を介して配信されてくる音楽等を受信して再生開始の操作を行うとともに例えばカラオケ機能をオン操作すると、本実施例のオーディオ再生装置1が起動してカラオケ動作を開始し、ステップST1において音源部3が再生を開始する。
次に、ステップST2,ST3において、曲調検出部4,5が互いに同期を取りながら並列処理を行い、収音データDauから特徴量CHx、音楽データDsonから特徴量CHyを検出する。
ステップST4では、比較部6が、特徴量CHxとCHyを比較することによって相互の類似性を判断し、類似性があると判断するとステップST5の処理を行ってからステップST6へ移行し、類似性がない(収音データがないことを含む)と判断すると、ステップST5の処理を行わず直接ステップST6へ移行する。
ステップST5では、ボーカル音量調整部7が、音楽データDsonに含まれているボーカル音データDvocに基づいて擬似的なボーカル音に相当するインパルス応答列データhvocを生成すると共に、音楽データDsonからインパルス応答列データhvocを減算することによって、ボーカル音に関するデータを除去又は減衰させ、伴奏音の音楽データDcを生成する。更に、混合部8が伴奏音の音楽データDcと収音データDauとを混合することによって音楽再生用データDoutを生成して出力する。
したがって、ステップST4において、比較部6が類似性なしと判断した場合には、ボーカル音量調整部7が音楽データDsonからインパルス応答列データhvocを減算する等の処理を行わないため、混合部8からは、実質的に音源部3から出力される音楽データDsonと入力アンプ部2から出力される収音データDauとを混合せずに音楽データDsonを音楽再生用データDoutとして出力する。
ステップST6では、音源部3のカラオケ機能がオフ操作されているか否かに応じて、カラオケ動作を継続又は停止する。すなわち、音源部3のカラオケ機能がオフ操作されていないと、ステップST2,ST3に戻って処理を繰り返し、音源部3のカラオケ機能がオフ操作されるとカラオケ動作を終了する。
以上説明したように、本実施例のオーディオ再生装置1によれば、マイクロホンMICで収音した音の曲調を表す特徴量CHxと、音源部3からの音楽データのボーカル音の特徴量CHyとを比較して、それらが類似している場合に限り、音楽データのボーカル音を除去又は減衰させて、収音した音を再生するので、会話や周囲の環境音の影響を受けることなく、ユーザが発声した歌声を精度良く検出することができ、また、お手本となるボーカル歌唱データを用意したカラオケ装置でなく通常のオーディオ装置でもカラオケを楽しむことが可能となる。
本発明は、カラオケ機能を有するオーディオ再生装置に関する。
従来のカラオケ装置として、特開平11−175077号公報(以下「特許文献1」)と、特開2000−47677号公報(以下「特許文献2」)に開示されたものが知られている。
特許文献1に開示されているカラオケ装置は、伴奏音とお手本ボーカル歌唱データとを用意し、それら伴奏音とお手本ボーカル歌唱データとをミキシング(混合)することによってスピーカ等で再生を行う他、マイク入力されるユーザの歌声も混合して音楽再生を行うように構成されている。
そして、お手本ボーカル歌唱データの音程(interval)とユーザの歌声の音程とを比較し、その音程差が所定範囲内であれば、音程が合っていると判定して、お手本ボーカル歌唱データの音量を小さくすることによってユーザの歌声と伴奏音とを聴きやすくし、音程差が所定範囲外であれば、音程が外れていると判定して、ボーカル歌唱データの音量を大きくすることによってお手本ボーカル歌唱データと伴奏音とを聴きやすくすることにより、お手本ボーカル歌唱データの音程に合わせて歌唱練習を行えるようにしている。
つまり、特許文献1では、お手本ボーカル歌唱データを用意し、そのお手本ボーカル歌唱データとの音程差が大きい場合にはお手本ボーカル歌唱データの音量を大きくして練習させ、音程差が小さい場合には、お手本ボーカル歌唱データの音量を小さくして練習させる。すなわち、必要に応じてお手本ボーカル歌唱データを聴かせながら歌唱練習をサポートしている。
特許文献2に開示されているカラオケ装置も同様に、伴奏音とお手本となるボーカル音データとを用意し、それら伴奏音とボーカル音データとマイク入力されるユーザの歌声とを混合してスピーカ等で再生を行うように構成されている。
そして、このカラオケ装置では、ボーカル音データのレベルと、マイク入力されるユーザの歌声のレベルとを比較し、ユーザの歌声がボーカル音データに比して小さいレベルのときには、ユーザの分からない部分であると判断してお手本となるボーカル音データの音量を大きくして学習させ、ユーザの歌声がボーカル音データに比して大きいレベルのときには、ユーザが歌える部分であると判断してユーザの歌声の音量を大きくすることにより、ユーザの歌声と伴奏音とを聴きやすくして歌唱練習を行えるようにしている。
つまり、特許文献2では、お手本となるボーカル音データを用意し、そのボーカル音データのレベルより小さい場合には、ボーカル音データによる音量を大きくして学習させ、レベルが小さい場合にはユーザの歌声の音量を大きくしてユーザの歌唱を妨げないようにしている。すなわち、必要に応じてお手本となるボーカル音データを聴かせながら歌唱練習をサポートしている。
特開平11−175077号公報
特開2000−47677号公報
ところで、上記特許文献1に開示されている従来のカラオケ装置では、お手本ボーカル歌唱データとユーザの歌声との音程差に応じて、ユーザの歌声に対するボーカル歌唱データの音量を自動的に調整することとしているが、こうした音程に基づいて音量調整を行うと、周囲の環境音や会話等にも反応し、ユーザが歌唱していないにもかかわらず、自動的に音量調整を行ってしまう(例えば、お手本ボーカル歌唱データの音量を大きくする)という問題があった。
また、上記特許文献2に開示されている従来のカラオケ装置では、お手本となるボーカル音データとユーザの歌声とのレベルの大小に応じて、ユーザの歌声に対するボーカル音データの音量を自動的に調整することとしているが、こうしたレベルの大小に基づいてボーカル音の音量を自動調整する場合にも、周囲の環境音や会話等にも反応し、ユーザが歌唱していないにもかかわらず、自動的に音量調整を行ってしまう(例えば、お手本となるボーカル音データのレベルを大きくしてしまう)という問題があった。
また、上記特許文献1と特許文献2に開示された従来のカラオケ装置は、お手本となるボーカル歌唱データを用意して、そのボーカル歌唱データを必要に応じて聴かせることによりユーザに対しカラオケを楽しませるものであり、例えば、お手本のボーカル歌唱データが記録されていないCD(Compact Disc)等のストレージ媒体等から音楽データを再生するオーディオ再生装置ではその音楽データのボーカル音が邪魔してカラオケを充分に楽しむことができないという不都合があった。
本発明はこのような従来の問題点に鑑みてなされたものであり、ユーザの歌声を精度良く判定して、お手本となるボーカル歌唱データを用意しないオーディオ再生装置でもカラオケを楽しむことができることを目的とする。
請求項1に記載の発明は、音を集音する集音手段から出力される集音信号と音源手段から出力される音楽信号とを混合して出力する混合手段を備えたオーディオ再生装置であって、前記集音手段から出力される集音信号の曲調を表すパラメータを検出する第1の曲調検出手段と、前記音源手段から出力される音楽信号のボーカル音の曲調を表すパラメータを検出する第2の曲調検出手段と、前記第1の曲調検出手段が検出した前記集音信号の曲調を表すパラメータから成る特徴量と、前記第2の曲調検出手段が検出した前記音楽信号のボーカル音の曲調を表すパラメータから成る特徴量と、を比較し、前記集音信号の曲調の特徴と前記ボーカル音の曲調の特徴との類似性を判断する比較手段と、前記比較手段が類似性有りと判断すると、前記音源手段から混合手段へ供給される前記音楽信号のボーカル音を除去又は減衰させるボーカル音量調整手段と、を具備し、前記第1,第2の曲調検出手段は、前記曲調の特徴として、調性と、拍の変化量と、和音の変化量と、拍の最大レベルと、楽音の平均強度と、楽音の最大強度を検出すること、を特徴とする。
請求項2に記載の発明は、音を集音する集音手段から出力される集音信号と音源手段から出力される音楽信号とを混合して出力する混合手段を備えたオーディオ再生装置におけるオーディオ再生方法であって、前記集音手段から出力される集音信号の曲調を表すパラメータを検出する第1の曲調検出工程と、前記音源手段から出力される音楽信号のボーカル音の曲調を表すパラメータを検出する第2の曲調検出工程と、前記第1の曲調検出工程で検出された前記集音信号の曲調を表すパラメータから成る特徴量と、前記第2の曲調検出工程で検出された前記音楽信号のボーカル音の曲調を表すパラメータから成る特徴量と、を比較し、前記集音信号の曲調の特徴と前記ボーカル音の曲調の特徴との類似性を判断する比較工程と、前記比較工程で類似性有りと判断すると、前記音源手段から混合手段へ供給される前記音楽信号のボーカル音を除去又は減衰させるボーカル音量調整工程と、を具備し、前記第1,第2の曲調検出工程では、前記曲調の特徴量として、調性と、拍の変化量と、和音の変化量と、拍の最大レベルと、楽音の平均強度と、楽音の最大強度を検出すること、を特徴とする。
本発明の実施形態に係るオーディオ再生装置について、図1を参照して説明する。図1は、本実施形態のオーディオ再生装置の構成を表したブロック図である。
同図において、このオーディオ再生装置1は、マイクロホンMIC及び入力アンプ部2と、音源部3と、曲調検出部4,5、比較部6、ボーカル音量調整部7と、混合部8を有して構成されている。
マイクロホンMIC及び入力アンプ部2は、ユーザの歌声等を集音する集音手段として設けられており、マイクロホンMICが集音した集音信号を入力アンプ部2が増幅し、更にデジタルデータ列から成る集音データDauにA/D変換して出力する。
音源部3は、デジタルデータ列から成る音楽データDsonを出力する音源手段であり、例えば、MD(Min Disc)やCD(Compact Disc)やDVD(Digital Versatile Disc)等の各種ストレージ媒体に記録されている音楽を再生して出力するいわゆる情報再生装置や、ラジオ放送やテレビ放送を受信して出力する無線受信機、インターネット等の通信網を介して配信されてくる音楽等を受信して出力する受信手段等によって形成されている。
曲調検出部4は、入力アンプ部2から出力される集音データDauに対して、所定周期毎に曲調検出を行うことにより、曲調を有するユーザの歌声の特徴を抽出する。
ここで、曲調検出部4は、「調性(キー:key)」と、「拍(ビート:beat)の変化量(BPM)」と、「和音(コード:chord)の変化量(CPM)」と、「拍の最大レベル」と、「楽音の平均強度」と、「楽音の最大強度」との6種類のパラメータを曲調を表すパラメータとして特徴抽出し、抽出した6種類のパラメータから成る特徴量CHxを比較部6に供給する。
曲調検出部5は、音源部3から出力される音楽データDsonに対して、所定周期毎に且つ曲調検出部4と同期を取りながら曲調検出を行うことにより、曲調を有する歌手のボーカル音の特徴を抽出する。
ここで、曲調検出部5も曲調検出部4と同様に、「調性(キー:key)」と、「拍(ビート:beat)の変化量(BPM)」と、「和音(コード:chord)の変化量(CPM)」と、「拍の最大レベル」と、「楽音の平均強度」と、「楽音の最大強度」との6種類のパラメータを曲調を表すパラメータとして特徴抽出し、抽出した6種類のパラメータから成る特徴量CHyを比較部6に供給する。
比較部6は、曲調検出部4,5から所定周期に同期して供給される特徴量CHx,CHyを上述の各パラメータ毎に比較して、各パラメータ毎の差分値を演算する。そして、各パラメータの差分値が夫々予め決められた基準値の範囲内であれば、マイク入力されたユーザの歌声と歌手のボーカル音とが類似していると判断して制御信号CNTを出力し、各パラメータの差分値が夫々予め決められた基準値の範囲外であれば、マイク入力されたユーザの歌声と歌手のボーカル音とが類似していなと判断して、制御信号CNTを出力しない。
すなわち、比較部6は、曲調検出部4と5からユーザの歌声に関する特徴量CHxと歌手のボーカル音に関する特徴量CHyが供給された場合に、特徴量CHxと特徴量CHyが類似していれば、制御信号CNTを出力し、それ以外の場合には制御信号CNTを出力しない。
したがって、比較部6は、ユーザの歌声に関する特徴量CHxと歌手のボーカル音に関する特徴量CHyが供給された場合であっても特徴量CHxと特徴量CHyが類似していなければ制御信号CNTを出力しない。
また、ユーザが歌唱していないときの集音データDauに基づいて、曲調検出部4が曲調検出を行った場合、曲調の性質を有さない特徴量CHxを検出することとなる。このため、ユーザが歌唱していないときの特徴量CHxと歌手のボーカル音に関する特徴量CHyが比較部6に供給された場合にも、比較部6は、制御信号CNTを出力しない。
ボーカル音量調整部7は、制御信号CNTが供給される期間において、音楽データDsonに含まれている歌手のボーカル音のデータを除去又はそのデータの値を減衰させて出力する。
すなわち、上述したように、曲調検出部4と5からユーザの歌声に関する特徴量CHxと歌手のボーカル音に関する特徴量CHyが出力され、比較部6が特徴量CHxと特徴量CHyが類似していると判断して、制御信号CNTを出力した場合に、ボーカル音量調整部7は、その制御信号CNTの出力期間だけ、歌手のボーカル音のデータを除去又は減衰させることにより、伴奏音の音楽データDcを生成して出力し、制御信号CNTが出力されない期間では、音楽データDsonをそのまま音楽データDcとして通過させて出力する。
混合部8は、入力アンプ部2からの集音データDauと、ボーカル音量調整部7からの音楽データDcとを混合することにより、スピーカ等に供給して音楽再生を行わせるための音楽再生用データDoutを生成して出力する。なお、混合部8は、ボーカル音量調整部7により歌手のボーカル音のデータが除去又は減衰されていない場合、すなわち、制御信号CNTが出力されない期間では、入力アンプ部2からの集音データDauを混合することなく、音楽データDc(すなわち、集音データDau)をそのまま音楽再生用データDoutとして出力する。
このように、本実施形態のオーディオ再生装置1によれば、マイクロホンMICで集音した音の曲調を表す特徴量CHxの各パラメータ(以下単に「特徴量CHx」として説明する)と、音源部3から出力される音楽データDsonによるボーカル音の曲調を表す特徴量CHyの各パラメータ(以下単に「特徴量CHy」として説明する)との類似性を比較し、特徴量CHx,CHyが類似している場合に、ボーカル音を除去又は減衰させて、集音した音を再生し、また、特徴量CHx,CHyが類似していない場合には、集音した音を再生せず、歌手のボーカル音を再生するので、会話や周囲の環境音の影響を受けることなく、ユーザが発声した歌声を精度良く検出することが可能となっている。
つまり、マイクロホンMICで集音した音が環境音や会話等の曲調を有さない音である場合には、特徴量CHxと特徴量CHyとが類似しなくなるため、比較部6は、集音した音をユーザの歌声ではないと判断し、制御信号CNTを出力しなくなる。このため、結果的に、ユーザが発声した歌声を精度良く検出することが可能となっている。
更に、特徴量CHxと特徴量CHyとが類似している場合に限り、ボーカル音を除去又は減衰させて、集音した音を再生するので、歌手のボーカル音が邪魔することなくカラオケを楽しむことができる。つまり、お手本となるボーカル歌唱データを用意したカラオケ装置でなく通常のオーディオ装置でもカラオケを楽しむことが可能となる。
次に、オーディオ再生装置のより詳細な実施例について、図2及び図3を参照して説明する。
図2は、本実施例に係るオーディオ再生装置の構成を表したブロック図であり、図1と同一又は相当する部分を同一符号で示している。図3は、本実施例のオーディオ再生装置の動作を説明するためのフローチャートである。
図2において、このオーディオ再生装置1は、マイクロホンMIC及び入力アンプ部2と、音源部3と、入力アンプ部2側に設けられたバンドパスフィルタ9と、音源部3側に設けられたバンドパスフィルタ10と、曲調検出部4,5、比較部6、ボーカル音量調整部7と、混合部8とを有して構成されており、曲調検出部4,5は、コンピュータプログラムに従って動作するデジタルシグナルプロセッサ(DSP)によって形成されている。
バンドパスフィルタ9は、入力アンプ部2から出力されるデジタルデータ列から成る集音データDauをデジタル演算処理することによって、人間の発話音声の周波数帯域成分に相当する音声データDvceを抽出し、曲調検出部4に供給する。
バンドパスフィルタ10は、音源部3から出力される音楽データDsonをデジタル演算処理することにより、人間の発話音声の周波数帯域成分に相当するボーカル音データDvocを抽出し、曲調検出部5に供給する。
曲調検出部4は、キー検出部4a、ビート変化量検出部4b、コード変化量検出部4c、ビート最大値検出部4d、平均強度検出部4e、最大強度検出部4fを有して構成されている。
ここで、キー検出部4aと、ビート変化量検出部4b、コード変化量検出部4c、ビート最大値検出部4d、平均強度検出部4e、最大強度検出部4fは、所定周期の範囲毎に音声データDvceに対して夫々曲調検出を行うことにより、「調性(キー:key)」を表す特徴データDx1と、「拍(ビート:beat)の変化量(BPM)」を表す特徴データDx2と、「和音(コード:chord)の変化量(CPM)」を表す特徴データDx3と、「拍の最大レベル」を表す特徴データDx4と、「楽音の平均強度」を表す特徴データDx5と、「楽音の最大強度」を表す特徴データDx6とを生成し、これら6種類の特徴データDx1〜Dx6を特徴量CHxとして、比較部6に供給する。
曲調検出部5は、曲調検出部4と同様に、キー検出部5a、ビート変化量検出部5b、コード変化量検出部5c、ビート最大値検出部5d、平均強度検出部5e、最大強度検出部5fを有して構成されている。
そして、キー検出部5aと、ビート変化量検出部5b、コード変化量検出部5c、ビート最大値検出部5d、平均強度検出部5e、最大強度検出部5fは、曲調検出部4側に設けられている各検出部4a〜4fと同期して動作し、所定周期の範囲毎にボーカル音データDvocに対して夫々曲調検出を行うことにより、「調性(キー:key)」を表す特徴データDy1と、「拍(ビート:beat)の変化量(BPM)」を表す特徴データDy2と、「和音(コード:chord)の変化量(CPM)」を表す特徴データDy3と、「拍の最大レベル」を表す特徴データDy4と、「楽音の平均強度」を表す特徴データDy5と、「楽音の最大強度」を表す特徴データDy6とを生成し、これら6種類の特徴データDy1〜Dy6を特徴量CHyとして、比較部6に供給する。
比較部6は、曲調検出部4,5から所定周期に同期して供給される特徴量CHx,CHyを上述の各パラメータ毎に比較して、各パラメータ毎の差分値を演算する。
すなわち、比較部6は、特徴データDx1とDy1の差分と、特徴データDx2とDy2の差分と、特徴データDx3とDy3の差分と、特徴データDx4とDy4の差分と、特徴データDx5とDy5の差分と、特徴データDx6とDy6の差分を演算する。
そして、各パラメータの差分値が夫々予め決められた基準値の範囲内であれば、マイク入力されたユーザの歌声と歌手のボーカル音とが類似していると判断して制御信号CNTを出力し、各パラメータの差分値が夫々予め決められた基準値の範囲外であれば、マイク入力されたユーザの歌声と歌手のボーカル音とが類似していないと判断して、制御信号CNTを出力しない。
つまり、比較部6は、ユーザの発声した歌声に関する特徴量CHxと歌手のボーカル音に関する特徴量CHyとの類似性を比較し、特徴量CHxと特徴量CHyが類似していれば、制御信号CNTを出力し、それ以外の場合には制御信号CNTを出力しないようになっている。
次に、ボーカル音量調整部7は、バンドパスフィルタ7aと、音声分析合成部7bと、ローパスフィルタ7c及び減算器7dを有して構成されている。
ここで、バンドパスフィルタ7aは、上述のバンドパスフィルタ10と同様に、音源部3から出力される音楽データDsonをデジタル演算処理することにより、人間の発話音声の周波数帯域成分に相当するボーカル音データDvocを抽出し、音声分析合成部7bへ供給する。
音声分析合成部7bは、人間の声道の伝達関数の逆特性に近似した音声分析用適応デジタルフィルタと、人間の声道の伝達関数に近似した音声合成用デジタルフィルタとを有している。
そして、制御信号CNTが供給されると、音声分析用適応デジタルフィルタがボーカル音データDvocに基づいて音声認識処理を行い、更に音声認識結果に基づいて音声合成用デジタルフィルタの各タップ係数を適応的に調整して、音声合成用デジタルフィルタから、擬似的なボーカル音に相当するインパルス応答列データhvocを出力させる。そして、ローパスフィルタ7cが、インパルス応答列データhvocの高域ノイズ成分を除去して減算器7dへ供給する。
減算器7dは、制御信号CNTが出力されている期間において、ローパスフィルタ7cを介して供給される擬似的なボーカル音に相当するインパルス応答列データhvocと、音楽データDsonとを減算処理することにより、音楽データDsonに含まれているボーカル音に関するデータを除去又は減衰させ、減算処理後の音楽データDcを混合部8へ供給する。
混合部8は、入力アンプ部2からの集音データDauと、減算器7dからの音楽データDcとを混合することにより、スピーカ等に供給して再生を行わせるための再生用データDoutを生成して出力する。また、混合部8は、ボーカル音量調整部7により歌手のボーカル音のデータが除去又は減衰されていない場合、すなわち、比較部6から制御信号CNTが出力されない期間では、入力アンプ部2からの集音データDauを混合することなく、音楽データDc(すなわち、集音データDau)をそのまま音楽再生用データDoutとして出力する。
次に、かかる構成を有する本実施例のオーディオ再生装置1の動作について図3を参照して説明する。
図3において、ユーザが音源部3である情報再生装置にMDやCD、DVD等の各種ストレージ媒体を装填して、例えばカラオケ機能をオン操作して再生を開始したり、又は、無線受信機をオン操作するとともに例えばカラオケ機能をオン操作してラジオ放送等の受信を開始させたり、インターネット等の通信網を介して配信されてくる音楽等を受信して再生開始の操作を行うとともに例えばカラオケ機能をオン操作すると、本実施例のオーディオ再生装置1が起動してカラオケ動作を開始し、ステップST1において音源部3が再生を開始する。
次に、ステップST2,ST3において、曲調検出部4,5が互いに同期を取りながら並列処理を行い、集音データDauから特徴量CHx、音楽データDsonから特徴量CHyを検出する。
ステップST4では、比較部6が、特徴量CHxとCHyを比較することによって相互の類似性を判断し、類似性があると判断するとステップST5の処理を行ってからステップST6へ移行し、類似性がない(集音データがないことを含む)と判断すると、ステップST5の処理を行わず直接ステップST6へ移行する。
ステップST5では、ボーカル音量調整部7が、音楽データDsonに含まれているボーカル音データDvocに基づいて擬似的なボーカル音に相当するインパルス応答列データhvocを生成すると共に、音楽データDsonからインパルス応答列データhvocを減算することによって、ボーカル音に関するデータを除去又は減衰させ、伴奏音の音楽データDcを生成する。更に、混合部8が伴奏音の音楽データDcと集音データDauとを混合することによって音楽再生用データDoutを生成して出力する。
したがって、ステップST4において、比較部6が類似性なしと判断した場合には、ボーカル音量調整部7が音楽データDsonからインパルス応答列データhvocを減算する等の処理を行わないため、混合部8からは、実質的に音源部3から出力される音楽データDsonと入力アンプ部2から出力される集音データDauとを混合せずに音楽データDsonを音楽再生用データDoutとして出力する。
ステップST6では、音源部3のカラオケ機能がオフ操作されているか否かに応じて、カラオケ動作を継続又は停止する。すなわち、音源部3のカラオケ機能がオフ操作されていないと、ステップST2,ST3に戻って処理を繰り返し、音源部3のカラオケ機能がオフ操作されるとカラオケ動作を終了する。
以上説明したように、本実施例のオーディオ再生装置1によれば、マイクロホンMICで集音した音の曲調を表す特徴量CHxと、音源部3からの音楽データのボーカル音の特徴量CHyとを比較して、それらが類似している場合に限り、音楽データのボーカル音を除去又は減衰させて、集音した音を再生するので、会話や周囲の環境音の影響を受けることなく、ユーザが発声した歌声を精度良く検出することができ、また、お手本となるボーカル歌唱データを用意したカラオケ装置でなく通常のオーディオ装置でもカラオケを楽しむことが可能となる。
本発明の実施形態に係るオーディオ再生装置の構成を表したブロック図である。 実施例に係るオーディオ再生装置の構成を表したブロック図である。 図2に示したオーディオ再生装置の動作を説明するためのフローチャートである。
符号の説明
1…オーディオ再生装置
3…音源部
4,5…曲調検出部
6…比較部
7…ボーカル音量調整部
8…混合部

Claims (3)

  1. 音を収音する収音手段から出力される収音信号と音源手段から出力される音楽信号とを混合して出力する混合手段を備えたオーディオ再生装置であって、
    前記収音手段から出力される収音信号の曲調を検出する第1の曲調検出手段と、
    音源手段から出力される音楽信号のボーカル音の曲調を検出する第2の曲調検出手段と、
    前記第1,第2の曲調検出手段が検出した前記収音信号の曲調の特徴と前記ボーカル音の曲調の特徴との類似性を判断する比較手段と、
    前記比較手段が類似性有りと判断すると、前記音源手段から混合手段へ供給される前記音楽信号のボーカル音を除去又は減衰させるボーカル音量調整手段と、を具備することを特徴とするオーディオ再生装置。
  2. 前記第1,第2の曲調検出手段は、前記曲調の特徴として、調性と、拍の変化量と、和音の変化量と、拍の最大レベルと、楽音の平均強度と、楽音の最大強度を検出することを特徴とする請求項1に記載のオーディオ再生装置。
  3. 音を収音する収音手段から出力される収音信号と音源手段から出力される音楽信号とを混合して出力する混合手段を備えたオーディオ再生装置におけるオーディオ再生方法であって、
    前記収音手段から出力される収音信号の曲調を検出する第1の曲調検出工程と、
    音源手段から出力される音楽信号のボーカル音の曲調を検出する第2の曲調検出工程と、
    前記第1,第2の曲調検出工程で検出した前記収音信号の曲調の特徴と前記ボーカル音の曲調の特徴との類似性を判断する比較工程と、
    前記比較工程で類似性有りと判断すると、前記音源手段から混合手段へ供給される前記音楽信号のボーカル音を除去又は減衰させるボーカル音量調整工程と、を具備することを特徴とするオーディオ再生方法。
JP2006513500A 2004-05-14 2005-03-22 オーディオ再生装置 Pending JPWO2005111997A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004145047 2004-05-14
JP2004145047 2004-05-14
PCT/JP2005/005149 WO2005111997A1 (ja) 2004-05-14 2005-03-22 オーディオ再生装置

Publications (1)

Publication Number Publication Date
JPWO2005111997A1 true JPWO2005111997A1 (ja) 2008-03-27

Family

ID=35394380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006513500A Pending JPWO2005111997A1 (ja) 2004-05-14 2005-03-22 オーディオ再生装置

Country Status (2)

Country Link
JP (1) JPWO2005111997A1 (ja)
WO (1) WO2005111997A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4591391B2 (ja) * 2006-03-27 2010-12-01 ヤマハ株式会社 オーディオデータ再生装置および携帯端末装置
JP5034471B2 (ja) * 2006-12-11 2012-09-26 ヤマハ株式会社 楽音信号発生装置及びカラオケ装置
JP2015132695A (ja) 2014-01-10 2015-07-23 ヤマハ株式会社 演奏情報伝達方法、演奏情報伝達システム
JP6326822B2 (ja) 2014-01-14 2018-05-23 ヤマハ株式会社 録音方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2924208B2 (ja) * 1991-01-22 1999-07-26 ブラザー工業株式会社 練習機能付き電子音楽再生装置
JP2990994B2 (ja) * 1993-04-09 1999-12-13 松下電器産業株式会社 再生装置
JPH0720861A (ja) * 1993-06-30 1995-01-24 Casio Comput Co Ltd 自動演奏装置
JPH08115091A (ja) * 1994-10-14 1996-05-07 Sharp Corp 歌唱評価機能付き音響機器
JPH08146979A (ja) * 1994-11-25 1996-06-07 Matsushita Electric Ind Co Ltd 音声制御装置
JP2004102148A (ja) * 2002-09-12 2004-04-02 Taito Corp リズム感採点機能を有するカラオケ採点装置

Also Published As

Publication number Publication date
WO2005111997A1 (ja) 2005-11-24

Similar Documents

Publication Publication Date Title
US5889223A (en) Karaoke apparatus converting gender of singing voice to match octave of song
US7974838B1 (en) System and method for pitch adjusting vocals
US8019094B2 (en) Audio processing system with function of automatic gain control and method thereof
JPH0997091A (ja) 予め記録された背景音楽のピッチ変化方法およびカラオケシステム
JP2008096483A (ja) 音響出力制御装置、音響出力制御方法
US20080295672A1 (en) Portable sound processing device
US20090173217A1 (en) Method and apparatus to automatically match keys between music being reproduced and music being performed and audio reproduction system employing the same
JP2002215195A (ja) 音楽信号処理装置
US20050246170A1 (en) Audio signal processing apparatus and method
JPWO2005111997A1 (ja) オーディオ再生装置
US6629067B1 (en) Range control system
US5684262A (en) Pitch-modified microphone and audio reproducing apparatus
JP4305084B2 (ja) 音楽再生装置
JP4091892B2 (ja) 歌唱音声評価装置、カラオケ採点装置及びそのプログラム
JP3554649B2 (ja) 音声処理装置とその音量レベル調整方法
US20230057082A1 (en) Electronic device, method and computer program
CN115567845A (zh) 一种信息处理方法及装置
JP2006333396A (ja) 音声信号拡声装置
JP2007011090A (ja) カラオケ装置
US8195317B2 (en) Data reproduction apparatus and data reproduction method
WO2024107342A1 (en) Dynamic effects karaoke
JP5625429B2 (ja) カラオケ装置
KR20080007957A (ko) 가라오케 시스템에서의 출력 음성 보정장치 및 방법
JP2011211547A (ja) 収音装置および収音システム
JP4360212B2 (ja) カラオケ装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080527

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080930