JP2016122164A - 音声評価装置、およびカラオケ装置 - Google Patents

音声評価装置、およびカラオケ装置 Download PDF

Info

Publication number
JP2016122164A
JP2016122164A JP2014263628A JP2014263628A JP2016122164A JP 2016122164 A JP2016122164 A JP 2016122164A JP 2014263628 A JP2014263628 A JP 2014263628A JP 2014263628 A JP2014263628 A JP 2014263628A JP 2016122164 A JP2016122164 A JP 2016122164A
Authority
JP
Japan
Prior art keywords
evaluation
unit
pitch
voice
pitches
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014263628A
Other languages
English (en)
Inventor
川▲原▼ 毅彦
Takehiko Kawahara
毅彦 川▲原▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2014263628A priority Critical patent/JP2016122164A/ja
Publication of JP2016122164A publication Critical patent/JP2016122164A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

【課題】市販の音楽用CD等に記録されたデータを用いて、従来より多様な評価方法により、ユーザ満足度の高い音声評価を行う。【解決手段】音声評価装置(10)は、評価対象ピッチ抽出部(11)と基準ピッチ抽出部(12)と評価部(20)とを備える。評価対象ピッチ抽出部(11)は、音声データから、時間軸に沿ってその音声のピッチを評価対象ピッチとして抽出する。基準ピッチ抽出部(12)は、複数の音が含まれるオーディオデータから時間軸に沿って複数の音のピッチを各々基準ピッチとして抽出する。評価部(20)は、時間軸に沿って単位時間毎に、評価対象ピッチと複数の基準ピッチとを比較することにより音声データを評価する。【選択図】図1

Description

本発明は、音声データを評価する音声評価装置等に関する。
従来から、歌唱者による歌唱の巧拙を採点(以下では、評価とも称する)する機能を備えるカラオケ装置が存在する。このようなカラオケ装置に関する技術が特許文献1および2に開示されている。特許文献1には、楽譜に表される正確なピッチで構成された楽曲データ(以下では、正解データと称する)を用いて評価を行う方法の一例が開示されている。正解データの形式の一例としては、MIDI(Musical Instrument Digital Interface)形式が挙げられる。また、特許文献2には、市販の音楽用CD(compact disk)を採点に用いる技術が開示されている。
特開2013−190564号公報(2013年9月26日公開) 特開2005−148599号公報(2005年6月9日公開) 特許第3413634号公報(2003年4月4日登録)
しかしながら、特許文献1の技術では、正解データを用いて評価を行うため、予め正解データを準備しておく必要がある。また、歌唱による音声と正解データとの一致度に応じて評価が行われるため、正解データが示す旋律通りに歌わなければ、評価点が下がる。
また、特許文献2の技術では、正解データとの対比により評価を行うのではなく、市販の音楽用CDから抽出した、メインボーカルと想定される音声との比較により評価を行う。そのため、歌い手が、メインボーカル以外の旋律を歌った場合、その音声については評価されない。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、市販の音楽用CD等に記録されたデータを用いて、従来より多様な評価方法により、ユーザ満足度の高い音声評価を行う音声評価装置等を提供することにある。
上記の課題を解決するために、本発明に係る音声評価装置は、音声データを評価する音声評価装置であって、上記音声データから、時間軸に沿ってその音声のピッチを評価対象ピッチとして抽出する評価対象ピッチ抽出部と、複数の音が含まれるオーディオデータから、時間軸に沿って上記複数の音のピッチを、各々基準ピッチとして抽出する基準ピッチ抽出部と、時間軸に沿って単位時間毎に、上記評価対象ピッチと複数の上記基準ピッチとを比較し、該比較の結果に応じて上記音声データを評価する評価部と、を備える構成である。
上記構成によれば、上記オーディオデータから抽出した複数のピッチ候補である上記基準ピッチと上記音声データから抽出した上記評価対象ピッチとを、時間軸に沿って単位時間毎に比較した結果に応じて、上記音声データを評価する。
よって、上述したMIDI形式などで記録された正解データを用いることなく、市販の音楽用CDなどから得られる上記オーディオデータのみに基づいて、上記音声データを評価することができる。さらに、単位時間毎に上記評価対象ピッチと比較し得る上記基準ピッチが複数存在するため、1つのピッチと比較する場合と比べて、評価方法が多様に増大する。例えば、上記評価対象ピッチが複数の上記基準ピッチのいずれかと一致すれば評価を上げる(高評価を付ける)等のように、従来は実現できなかった新たな評価方法が実現可能となる。より具体的には、上記評価対象ピッチが歌唱による音声のピッチであり、上記基準ピッチが上記CDに記録されたボーカル、コーラス、および楽器演奏などの各ピッチである場合において、歌唱者が、ボーカルに限らず、コーラスまたは楽器演奏のピッチを歌っても加点して評価を上げるという評価方法が実現可能となる。これにより、加点が多くなりユーザの満足度を高めることができる。
なお、本発明の各態様に係る音声評価装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記音声評価装置が備える各部として動作させることにより上記音声評価装置をコンピュータにて実現させる音声評価装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。さらに、本発明の各態様に係る音声評価装置は集積回路(ICチップ)として実現してもよく、この場合には、上記集積回路を備えるチップなども本発明の範疇に入る。
本発明によれば、市販の音楽用CD等に記録されたデータを用いて、従来より多様な評価方法により、ユーザ満足度の高い音声評価が実現可能となる。
本発明の一実施形態に係るカラオケ装置の機能ブロック図である。 上記カラオケ装置にて基準ピッチを分類した例を示す模式図である。 上記カラオケ装置における処理の一例を示すフローチャートである。 上記カラオケ装置の変形例を示す機能ブロック図である。
本発明の一実施形態について、図1〜図4に基づいて説明すると以下のとおりである。まず、図1を用いて、本実施形態に係るカラオケ装置1の概要について説明する。図1は、カラオケ装置1の機能ブロック図である。
図1に示すように、カラオケ装置1は、音声入力部2、オーディオ再生部3、カラオケ音作成部4、ミキサー部5、音出力部6(提示部)、表示部7(提示部)、および音声評価装置10を備えている。また、音声評価装置10は、音声データの評価を行うものであり、評価対象ピッチ抽出部11、基準ピッチ抽出部12、および評価部20を備えている。
音声入力部2は、歌い手の歌唱による音声が入力されるものであり、マイクロフォン、アンプ、A/D(Analog/Digital)コンバータなどによって構成されている。音声入力部2は、入力された音声を、音声データとして、評価対象ピッチ抽出部11およびミキサー部5に出力する。なお、音声入力部2は、歌唱以外の楽器演奏等による音が入力されてもよい。この場合、音声入力部2は、当該音を音声データとして評価対象ピッチ抽出部11に出力する。
オーディオ再生部3は、市販の音楽用CD等の記録媒体に記録されている、複数の音が含まれるオーディオデータを再生するものであり、CDプレーヤー等によって構成されている。オーディオ再生部3が再生したオーディオデータは、基準ピッチ抽出部12およびカラオケ音作成部4に出力される。このオーディオデータは、リニアPCM(pulse code modulation)などの、同時に再生される複数の音が個々に分離不能である形式のデータであり、MIDI形式などの正解データではない。なお、オーディオデータは、必ずしも記録媒体から取得する必要はなく、通信ネットワークを介して外部の装置から取得してもよい。
カラオケ音作成部4は、オーディオデータから、カラオケ用の伴奏として出力する音(以下、カラオケ音と称する)を作成する。具体的には、オーディオデータに含まれるボーカルの周波数帯域のみを除去したり、オーディオデータに含まれる特定の音程を強調したりするなどによって、カラオケ音を作成する。作成されたカラオケ音は、ミキサー部5に出力される。なお、記憶媒体(不図示)にカラオケ音が予め記憶されている場合、カラオケ装置1はカラオケ音作成部4を備えなくてもよい。この場合、オーディオ再生部3は、上記記録媒体から読み出したカラオケ音をミキサー部5に出力する。
ミキサー部5は、カラオケ音作成部4により作成されたカラオケ音と、音声入力部2に入力された音声データとをミキシングし、出力音を作成する。作成された出力音は、音出力部6に出力される。ミキサー部5は、ミキシングした音に対して、エコーまたはリバーブなどの残響効果を付加したり、ハウリングをキャンセルするなどの調整を施してもよい。
音出力部6は、ミキサー部5が作成した出力音を外部に出力するものであり、D/Aコンバータ、アンプ、スピーカなどによって構成されている。また、音出力部6は、評価部20による評価結果を音声(効果音など)で出力してもよい。これにより、ユーザ(歌い手を含む)は評価結果を聴覚で捉えることができる。
表示部7は、評価部20による評価結果を画像として表示するものであり、ディスプレイなどによって構成されている。これにより、ユーザは評価結果を視覚で捉えることができる。
評価対象ピッチ抽出部11は、入力された音声データから、時間軸に沿ってその音声のピッチを評価対象ピッチとして抽出する。抽出した評価対象ピッチは、評価対象ピッチデータとして評価部20に出力される。音声データに含まれる音のピッチを抽出する手法は公知であるので、その詳細については省略する。
基準ピッチ抽出部12は、入力されたオーディオデータから、時間軸に沿って複数の音のピッチの各々を、評価基準となるピッチ(以下では「基準ピッチ」と称する)として抽出する。すなわち、基準ピッチ抽出部12は、メインボーカルの音声、コーラスの音声、各種楽器の演奏音等、オーディオデータに含まれる全ての音のピッチを時間軸に沿って抽出する。抽出した基準ピッチの各々は、基準ピッチデータとして評価部20に出力される。
基準ピッチは、例えば以下の公知手法にて抽出される。まず、オーディオデータに含まれる複数の音源の音の高調波成分となるべき周波数成分の候補を、所定のバンドパスフィルタを用いて抽出する。次に、周波数成分の候補に対して、各高調波成分の相対的な優勢さを表す基本周波数の確率密度関数を求める。そして、確率密度関数の中でピークを複数抽出し、それぞれのピークの信頼度に基づき、信頼度が高くパワーが大きい基本周波数を抽出する。この基本周波数の抽出手法については、特許文献3に具体的に開示されている。そして、基準ピッチ抽出部12は、上記基本周波数を有する音から倍音を除いた音のピッチを、基準ピッチとして抽出する。なお、以下のような選択処理を行うことにより基準ピッチを抽出してもよい。
オーディオ再生部3の入力がステレオ方式の場合、基準ピッチ抽出部12は、2チャンネルにおいて同時刻に再生される音のピッチを抽出する。そして、基準ピッチ抽出部12は、同時刻に再生される音の各々から抽出された2つのピッチが同一周波数である場合のみ、基準ピッチとして選択する。すなわち、同時刻に再生される2つの音の中央成分のピッチのみを、基準ピッチとして選択する。
また、基準ピッチ抽出部12は、抽出した基準ピッチの各々を複数のグループに分類してもよい。典型的な分類方法として、(方法1)抽出した基準ピッチの各々を、当該基準ピッチに応じて分類する方法、(方法2)抽出した基準ピッチの各々を、当該基準ピッチが抽出された音の長さ(再生時間長)に応じて分類する方法、が挙げられる。なお、上記方法1に関していえば、音の周波数帯域は当該音の発生源(人、楽器など)に応じて大凡定まるから、上記バンドパスフィルタの帯域を適宜調整することにより、オーディオデータに含まれる旋律毎(パート毎)に分類することも可能である。
図2を用いて、基準ピッチの分類例について説明する。図2の(a)および(b)は、基準ピッチの分類例を示す模式図である。同図に示す横長の実線の各々は、時間軸に沿って抽出された1または複数の基準ピッチから構成されており、実線の長さは、基準ピッチの抽出元である音の再生時間長を示している。
図2の(a)は、上記方法1による分類例を示している。この例では、分類の基準となる周波数を「F」として図示した。この例では、周波数F以上の周波数帯域に属する基準ピッチをグループAに分類し、周波数F未満の周波数帯域に属する基準ピッチをグループBに分類している。
図2の(b)は、上記方法2による分類例を示している。この例では、分類の基準となる音の再生時間長を「T」として図示した。この例では、T未満の再生時間長の音から抽出された基準ピッチをグループCに分類し、T以上の再生時間長の音から抽出された基準ピッチをグループDに分類している。なお、基準ピッチの抽出元の音の再生時間長がT以上であるか否かは、下記のとおり判定することができる。基準ピッチ抽出部12にて同一の周波数の基準ピッチを連続して抽出した時間がT以上である場合、これら連続して抽出した基準ピッチの抽出元の音の再生時間長はT以上であると判定し、一方、基準ピッチ抽出部12にて同一の周波数の基準ピッチを連続して抽出した時間がT未満である場合、これら連続して抽出した基準ピッチの抽出元の音の再生時間長はT未満であると判定する。
なお、上述では、周波数Fおよび再生時間長Tをそれぞれ1つずつ設ける例を示したが、それぞれを複数個ずつ設けることにより、基準ピッチを3以上のグループに分類してもよい。また、オーディオデータに含まれる音声または各種楽器の演奏音の周波数帯域をあらかじめ特定できる場合には、その周波数帯域に応じて周波数Fを設定してもよい。この場合、音声入力部2に入力された音声と、オーディオデータに含まれるメインボーカルや特定の楽器等の音との比較を、より精度よく行うことができる。同様に、音声または各種楽器の演奏音の長さをあらかじめ特定できる場合には、その長さに応じて再生時間長Tを設定してもよい。
なお、基準ピッチ抽出部12は、基準ピッチの各々をグループに分類する場合、基準ピッチデータとともに、当該基準ピッチが分類されたグループを示すグループ情報を、評価部20に出力する。この場合、基準ピッチの分類先のグループが決定してから、当該基準ピッチデータを評価部20に出力することとなる。
再び図1を参照する。評価部20は、時間軸に沿って単位時間毎に、評価対象ピッチ抽出部11が抽出した評価対象ピッチと、基準ピッチ抽出部12が抽出した複数の基準ピッチとを比較し、該比較の結果に応じて、音声データを評価する。そして、評価結果を音出力部6および/または表示部7に出力する。評価部20は、一致度判定部21および評価結果算出部22を備えている。
一致度判定部21は、時間軸に沿って単位時間毎に、1つの評価対象ピッチと複数の基準ピッチのいずれかとが一致するか否かを判定する。具体的には、(i)オーディオデータの再生に合わせて音声入力部2に入力された音声から抽出された評価対象ピッチと、(ii)当該評価対象ピッチを抽出した音声が入力された時刻に再生されたオーディオデータから抽出された基準ピッチとが一致するか否かを、時間軸に沿って順次判定する。そして、判定結果を評価結果算出部22に出力する。判定結果の典型例は、評価対象ピッチと基準ピッチとが一致した回数である。
また、一致度判定部21は、評価対象ピッチと、複数の基準ピッチのうちのいずれか1つの基準ピッチとが一致する時間の長さを、判定結果に含めることが好ましい。
また、基準ピッチ抽出部12にて基準ピッチの各々がグループに分類されている場合、一致度判定部21は、次に示す事項を判定結果に含めることが好ましい。(i)評価対象ピッチが、複数の上記基準ピッチのうち同一グループに属する基準ピッチのいずれかと一致した回数、(ii)評価対象ピッチが、複数の上記基準ピッチのうち同一グループに属する基準ピッチのいずれかと一致した時間の長さ、(iii)評価対象ピッチが、ユーザにより予め定められた特定グループに属する基準ピッチのいずれかと一致した回数、(iv)評価対象ピッチが、ユーザにより予め定められた特定グループに属する基準ピッチのいずれかと連続して一致した時間の長さ。
評価結果算出部22は、入力された判定結果に基づいて評価結果を算出し、当該評価結果を音出力部6および/または表示部7に出力する。音出力部6に評価結果を提示する場合、評価結果算出部22は、評価結果に応じた音声を音出力部6に出力する。また、表示部7に評価結果を提示する場合、評価結果算出部22は、評価結果に応じた画像(点数、文字、など)を表示部7に出力する。なお、評価結果に応じた音声および/または画像は予め音声評価装置10に記憶されている。
入力された判定結果に、評価対象ピッチと基準ピッチとが一致した回数が含まれる場合、評価結果算出部22は、当該回数に応じて評価結果を算出する。典型的には、当該回数が多いほど、評価結果として高評価を付ける(つまり、加点を増やす)。
また、入力された判定結果に、評価対象ピッチと、複数の基準ピッチのうちのいずれか1つの基準ピッチとが一致する時間の長さが含まれる場合、評価結果算出部22は、当該長さに応じて評価結果を算出することが好ましい。典型的には、当該長さが長いほど、評価結果として高評価を付ける(つまり、加点して評価を上げる)。一般に、オーディオデータに含まれる1音が比較的長い場合、その1音と同一の音程を維持したままその長さ分だけ発声した方が、その長さに満たない発声をした場合より、オーディオデータを忠実に歌唱しているといえる。そのため、上記長さに応じて評価を上げることにより、ユーザが満足する評価を提供することができる。
また、入力された判定結果に、評価対象ピッチが同一グループに属する基準ピッチのいずれかと一致した時間の長さが含まれる場合、評価結果算出部22は、当該長さに応じて評価結果を算出することが好ましい。典型的には、当該長さが長いほど、評価結果として高評価を付ける(つまり、加点を増やす)。この構成によれば、評価対象ピッチが、同一グループに属する基準ピッチと続けて一致するほど評価が上がる。よって、ユーザは、同一グループ内の旋律を続けて歌う場合(または楽器を奏でる場合)、複数グループ内の旋律を移り変わりながら歌うよりも、高い評価を得ることができる。
特に、基準ピッチ抽出部12にて基準ピッチに応じて複数のグループに分類されている場合、評価対象ピッチが、予め定められた特定グループに属する基準ピッチと一致した回数に応じて評価を上げることが好ましい。一般に、メインボーカル、コーラス、各種楽器が形成する旋律の周波数帯域は、それぞれが所定範囲内に存在する。つまり、その周波数帯域内の旋律に音声データが一致している(すなわち、評価対象ピッチが連続的に抽出された基準ピッチに一致している)ほど、オーディオデータに忠実に即してユーザが歌っている(または楽器を奏でている)ことになる。したがって、特定の周波数帯域に属する基準ピッチと一致した回数に応じて評価を上げることにより、例えばメインボーカルと推定される旋律を歌っている場合の評価を上げることなどが可能となる。それゆえ、ユーザの期待に応じた評価が可能となる。
また、基準ピッチ抽出部12にて基準ピッチが抽出元の音の長さに応じて複数のグループに分類されており、一致度判定部21にて評価対象ピッチが同一グループに属する基準ピッチのいずれかと一致する時間の長さを判定している場合には、例えば、オーディオデータに含まれる特定の音の抑揚またはリズムを忠実に再現してユーザが歌うほど評価を上げてもよい。
また、評価結果算出部22は、判定結果に対して重み付けを行ってもよい。例えば、評価対象ピッチが同一グループに属する基準ピッチのいずれかと所定時間一致した場合、それ以降は、通常より2倍の得点を与えるといった高評価を行ってもよい。さらに、所定時間が経過する毎に、3倍、4倍、・・・の得点を与えるといった高評価を段階的に行ってもよい。
また、評価対象ピッチが、あるグループに属する基準ピッチと一致している場合の評価を、他のグループに属する基準ピッチと一致している場合の評価とに差が生じるように重み付けを行ってもよい。例えば、図2の(a)において、評価対象ピッチがグループAに属する基準ピッチと一致している場合の評価は、グループBに属する基準ピッチと一致している場合の評価より2倍の重み付けを行ってもよい。
次に、図3を用いて、カラオケ装置1における処理の一例について説明する。なお、ステップS1〜S4の処理は、音声評価装置10にて行われる。
オーディオ再生部3によりオーディオデータが再生されている間、基準ピッチ抽出部12は、オーディオデータから時間軸に沿って基準ピッチを抽出する(ステップS1;基準ピッチ抽出工程)。また、音声入力部2に音声が入力されている間、評価対象ピッチ抽出部11は、音声データから時間軸に沿って評価対象ピッチを抽出する(ステップS2;評価対象ピッチ抽出工程)。なお、ステップS1およびS2の処理順は、この順に限定されない。例えば、オーディオデータの再生開始とともに、音声入力が行われた場合には、ステップS1およびS2の処理は同時に開始される。
ステップS1およびS2のそれぞれにおいて抽出された基準ピッチおよび評価対象ピッチは、評価部20によって、時間軸に沿って単位時間毎に比較され(ステップS3;評価工程)、比較結果に基づき評価結果が算出される(ステップS4;評価工程)。具体的には、一致度判定部21が、時間軸に沿って、単位時間毎に評価対象ピッチが複数の基準ピッチのいずれかと一致するかどうかを判定し、評価結果算出部22が、その判定結果に基づく評価結果を算出する。そして、表示部7および/または音出力部6に、評価結果が提示される(ステップS5;提示工程)。
なお、各ステップの実行順序として、例えば、次のパターンがある。(i)ステップS1〜S5を単位として繰り返す。(ii)ステップS1〜S4を単位として繰り返した後、ステップS5を実行する。(iii)ステップS1〜S3を単位として繰り返した後、ステップS4〜S5を実行する。(iv)ステップS1〜S2を単位として繰り返した後、ステップS3〜S5を実行する。
以上のように、本実施形態の音声評価装置10は、オーディオデータに含まれる複数の音の全てを評価対象として、音声データの評価を行うことができる。そのため、例えば、メインボーカル以外の旋律を歌ったり、楽器を奏でる場合であっても、適切に評価することができる。なお、メインボーカル以外の旋律には、(i)コーラスの旋律、(ii)各種楽器の旋律、および、(iii)歌い手が意図的にピッチを変えて歌うような音楽的に破綻していない程度の演出等による旋律等が含まれる。
また、各種楽器の旋律も評価対象となるため、間奏またはインストルメンタル曲についても評価対象とすることができる。なお、メインボーカルの旋律も評価対象となるため、正解データを用いた評価と同様の評価を行うことも当然ながら可能である。
このように、音声評価装置10によれば、オーディオデータを用いて、従来より多様な評価を実現することができる。それゆえ、従来より、ユーザの満足度を向上させることが可能となる。
なお、音声評価装置10は、MIDI形式等の正解データを含まないオーディオデータから基準ピッチを抽出する点で、正解データを用いてピッチを抽出しない従来技術とは異なることに留意されたい。また、音声評価装置10は、簡易な構成により、オーディオデータに含まれるメインボーカル、コーラス、各種楽器などのあらゆる音の基準ピッチを評価対象とし得る点で、従来技術とは異なることに留意されたい。
次に、図4を用いて、カラオケ装置1の変形例であるカラオケ装置1aについて説明する。図4に示すように、カラオケ装置1aは、記憶部30および編集部31を備える点で、カラオケ装置1と異なる。
記憶部30は、ハードディスク、フラッシュメモリ等の不揮発性の記憶装置によって構成される。記憶部30には、基準ピッチ抽出部12が抽出した基準ピッチデータ、および、カラオケ音作成部4が作成したカラオケ音が格納される。
オーディオ再生部3は、カラオケ装置1のオーディオ再生部3が備える構成に加え、カラオケ音の再生指示を受け付けた場合、記憶部30から読み出したカラオケ音をミキサー部5に出力する。
一致度判定部21は、評価対象ピッチと比較する基準ピッチを、記憶部30から読み出す。
編集部31は、記憶部30に格納されている基準ピッチおよびカラオケ音をユーザ操作等に応じて編集する処理を行う。例えば、これらのデータに含まれているエラーをユーザ操作等に応じて修正する。
以上のように、カラオケ装置1aでは、記憶部30に予め基準ピッチおよびカラオケ音を格納する構成である。よって、基準ピッチ抽出部12による基準ピッチの抽出、および、カラオケ音作成部4によるカラオケ音の作成を、リアルタイムより長い時間をかけて精度良く行ったり、編集部31による編集作業を長時間かけて精度良く行うことが可能となる。これにより、正解データに近い各旋律の基準ピッチを提供することができ、また、より高品質のカラオケ音を出力することができる。
なお、記憶部30は、必ずしもカラオケ装置1aが備える必要はない。例えば、記憶部30は、通信ネットワーク上の記憶装置として設けられてもよい。この場合、通信ネットワークに接続可能な複数の装置が、記憶部30に格納された基準ピッチおよびカラオケ音を共有することが可能となる。
最後に、音声評価装置10の制御ブロック(特に、評価対象ピッチ抽出部11、基準ピッチ抽出部12、および評価部20)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。その他、カラオケ装置1のカラオケ音作成部4およびミキサー部5についても同様である。後者の場合、音声評価装置10は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、実施形態に開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明は、歌唱や楽器演奏などを評価する音声評価装置に利用できる。特に、カラオケでの歌唱を採点するカラオケ装置に好適に利用することができる。
1 カラオケ装置、1a カラオケ装置、6 音出力部(提示部)、7 表示部(提示部)、10 音声評価装置、11 評価対象ピッチ抽出部、12 基準ピッチ抽出部、20 評価部、21 一致度判定部(評価部)、22 評価結果算出部(評価部)

Claims (6)

  1. 音声データを評価する音声評価装置であって、
    上記音声データから、時間軸に沿ってその音声のピッチを評価対象ピッチとして抽出する評価対象ピッチ抽出部と、
    複数の音が含まれるオーディオデータから、時間軸に沿って上記複数の音のピッチを、各々基準ピッチとして抽出する基準ピッチ抽出部と、
    時間軸に沿って単位時間毎に、上記評価対象ピッチと複数の上記基準ピッチとを比較し、該比較の結果に応じて上記音声データを評価する評価部と、を備えることを特徴とする音声評価装置。
  2. 上記評価部は、複数の上記基準ピッチのいずれかと上記評価対象ピッチとが一致するとき、評価を上げることを特徴とする請求項1に記載の音声評価装置。
  3. 上記評価部は、複数の上記基準ピッチのうちのいずれか1つの基準ピッチと上記評価対象ピッチとが一致する時間の長さに応じて評価を上げることを特徴とする請求項1または2に記載の音声評価装置。
  4. 上記基準ピッチ抽出部は、抽出した上記基準ピッチの各々を、当該基準ピッチに応じて複数のグループに分類し、
    上記評価部は、同一のグループに属する複数の上記基準ピッチのいずれかと上記評価対象ピッチとが一致する時間の長さに応じて評価を上げることを特徴とする請求項1から3のいずれか1項に記載の音声評価装置。
  5. 上記基準ピッチ抽出部は、抽出した上記基準ピッチの各々を、当該基準ピッチの抽出元の音の長さに応じて複数のグループに分類し、
    上記評価部は、同一のグループに属する複数の上記基準ピッチのいずれかと上記評価対象ピッチとが一致する時間の長さに応じて評価を上げることを特徴とする請求項1から3のいずれか1項に記載の音声評価装置。
  6. 上記音声データは、歌唱による音声を示すデータであり、
    請求項1から5のいずれか1項に記載の音声評価装置と、
    上記評価部による評価結果をユーザに提示する提示部と、を備えることを特徴とするカラオケ装置。
JP2014263628A 2014-12-25 2014-12-25 音声評価装置、およびカラオケ装置 Pending JP2016122164A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014263628A JP2016122164A (ja) 2014-12-25 2014-12-25 音声評価装置、およびカラオケ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014263628A JP2016122164A (ja) 2014-12-25 2014-12-25 音声評価装置、およびカラオケ装置

Publications (1)

Publication Number Publication Date
JP2016122164A true JP2016122164A (ja) 2016-07-07

Family

ID=56327394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014263628A Pending JP2016122164A (ja) 2014-12-25 2014-12-25 音声評価装置、およびカラオケ装置

Country Status (1)

Country Link
JP (1) JP2016122164A (ja)

Similar Documents

Publication Publication Date Title
US9847078B2 (en) Music performance system and method thereof
JP2007310204A (ja) 楽曲練習支援装置、制御方法及びプログラム
US10298192B2 (en) Sound processing device and sound processing method
JP5311069B2 (ja) 歌唱評価装置及び歌唱評価プログラム
JP6406273B2 (ja) カラオケ装置,及びプログラム
KR20090023912A (ko) 음악 데이터 처리 시스템
JP2023013684A (ja) 歌唱声質変換プログラム及び歌唱声質変換装置
JP2008040260A (ja) 楽曲練習支援装置、動的時間整合モジュールおよびプログラム
JP2007322933A (ja) 指導装置、指導用データ製作装置及びプログラム
JP6954780B2 (ja) カラオケ装置
GB2606522A (en) A system and method for generating a musical segment
JP2016122164A (ja) 音声評価装置、およびカラオケ装置
JP4553013B2 (ja) カラオケ装置
JP5618743B2 (ja) 歌唱音声評価装置
JP6788560B2 (ja) 歌唱評価装置、歌唱評価プログラム、歌唱評価方法及びカラオケ装置
JP4369118B2 (ja) カラオケ装置
CN112825244A (zh) 配乐音频生成方法和装置
JP5034642B2 (ja) カラオケ装置
JP6380305B2 (ja) データ生成装置、カラオケシステム、及びプログラム
JP2005107332A (ja) カラオケ装置
JP2008040258A (ja) 楽曲練習支援装置、動的時間整合モジュールおよびプログラム
JP2007225916A (ja) オーサリング装置、オーサリング方法およびプログラム
JP5805474B2 (ja) 音声評価装置,音声評価方法,及びプログラム
JP5983670B2 (ja) プログラム、情報処理装置、及びデータ生成方法
JP2007233078A (ja) 評価装置、制御方法及びプログラム