JP4228581B2 - Audio equipment, audio data management method and program therefor - Google Patents

Audio equipment, audio data management method and program therefor Download PDF

Info

Publication number
JP4228581B2
JP4228581B2 JP2002106389A JP2002106389A JP4228581B2 JP 4228581 B2 JP4228581 B2 JP 4228581B2 JP 2002106389 A JP2002106389 A JP 2002106389A JP 2002106389 A JP2002106389 A JP 2002106389A JP 4228581 B2 JP4228581 B2 JP 4228581B2
Authority
JP
Japan
Prior art keywords
data
genre
output
average value
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002106389A
Other languages
Japanese (ja)
Other versions
JP2003302988A5 (en
JP2003302988A (en
Inventor
正弘 奥納
呂尚 高岡
茂 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002106389A priority Critical patent/JP4228581B2/en
Publication of JP2003302988A publication Critical patent/JP2003302988A/en
Publication of JP2003302988A5 publication Critical patent/JP2003302988A5/ja
Application granted granted Critical
Publication of JP4228581B2 publication Critical patent/JP4228581B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To enable an audio device to automatically discriminate the category of audio data and record it as extended information added to the audio data by detecting and analyzing the frequency characteristics, distribution, period, etc., of reproduced signals of the audio data. <P>SOLUTION: Comparative reference data of the frequency characteristics, distribution or period, etc., of audio data is stored in advance by a plurality of categories. When audio data is reproduced, the frequency characteristics, distribution or period of the reproduced audio data is detected. The detected data of the frequency characteristics, distribution, or period is compared with the comparative reference data, and the degree of matching by each category is obtained, according to which the category is determined. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、オーディオ機器、特に、オーディオデータを、それに拡張情報を付加して機器内部或いは外部の記憶手段に記憶できるようにしたオーディオ機器オーディオデータの管理方法及びそのためのプログラムに関する。
【0002】
【従来の技術】
オーディオ装置やパーソナルコンピュータの発達により、オーディオデータ(例えば、各種の音楽、朗読、語学等の講座等のデータ)を各種記録媒体、例えばパーソナルコンピュータのハードディスク等に格納する場合、それに拡張情報(曲名等のタイトル、アーチスト名、その他データ管理に有用な各種情報)を付加することができるようになっている。
【0003】
従って、ユーザーは、オーディオ装置の例えばハードディスク等の記録媒体例えばCD(Compact Disc)等のオーディオデータソースから後で楽しみたいオーディオデータを大量に収納しておき、好きなときに好きなオーディオデータを再生して、楽しんだり、学んだりするときに、多数あるオーディオデータから好きなものを選択する際、その拡張情報を指標としてオーディオデータを特定して再生することが可能となる。
【0004】
そして、従来においては、ユーザーがオーディオデータをオーディオ装置のハードディスク等の記録媒体に記憶するに当たって、拡張情報の付加は、そのユーザーがパーソナルコンピュータ等のキーボード等の操作により行うようになっていた。
【0005】
【発明が解決しようとする課題】
ところで、上述したように、従来においては、オーディオデータの拡張情報の付加はパーソナルコンピュータ等のキーボード操作により行わざるを得なかったので、記憶するオーディオデータの数が多くなると、ユーザーの行うべき作業が多くなり、負担が重くなり、その結果としてオーディオデータの管理が困難になるという問題があった。
【0006】
また、カーオーディオ装置の場合、パーソナルコンピュータ等に接続してキーボーで操作によりオーディオデータの記憶することは不可能である。従って、オーディオデータを記憶する際に、ユーザーが拡張情報を付加することは事実上不可能である。これは看過できない問題である。というのは、近年、カーオーディオ装置として大容量の記録媒体、例えばハードディスクを内蔵し、それに大量のオーディオデータを入力できるようにしたものが現れている。しかし、大量のオーディオデータを格納することができても、それ等からユーザーが好きなものを選んで再生するときに拡張情報がないので、選びにくいとか、選ぶのに時間がかかるという問題があり、使い勝手が極めて悪いということになる。これでは、大容量の記録媒体に大量のオーディオデータを記録するカーオーディオ装置を提供しても有効に活用できないおそれがあるのである。
【0007】
本発明はこのような問題点を解決すべく為されたものであり、ディジタルオーディオデータを、それに拡張情報を付加して機器内部或いは外部の記憶手段に記憶できるようにしたオーディオ機器において、拡張情報が付加されていないオーディオデータに対して、そのオーディオデータを再生し、その再生された信号の周波数特性、分布、周期等を検出し、その検出結果を分析して自動的にそのオーディオデータのジャンルを判定して拡張情報として自動的にオーディオデータに付加してオーディオ装置の記録媒体に記憶できるようにすることを目的とし、更には、手動により、自動的判定結果と異なるジャンルを拡張情報として付加できるようにしてなる。
【0008】
【課題を解決するための手段】
本発明のオーディオ機器は、オーディオデータを所定の周波数帯域ごとにわけ、所定の検出時間毎に所定時間それぞれの周波数帯域について出力レベルを検出し、周波数帯域ごとの出力レベルが予め設定された範囲にあるかを判定するレベル判定手段と、周波数帯域ごとの出力レベルが予め設定された範囲内にあるとレベル判定手段が判定した回数の総数に基づくデータである回数データと、周波数帯域ごとの出力レベルが予め設定された範囲内にあるとレベル判定手段が判定した各時点の時間間隔の平均値である出力間隔平均値データと、周波数帯域ごとの出力レベルが予め設定された範囲内にあるとレベル判定手段が連続して判定した時間の平均値である出力時間平均値データとを、オーディオデータの特徴データとして検出する検出手段と、複数のジャンルごとに、回数データと出力間隔平均値データと出力時間平均値データを表す所定の値を基準データとして記憶する記憶手段と、検出手段により検出された特徴データを基準データと比較し、比較結果に基づいて最適なジャンルを判定するジャンル判定手段と、オーディオデータと最適なジャンルとを関連付けて記憶手段に記憶させる記憶制御手段とを有することを特徴とする。
【0012】
【発明の実施の形態】
本発明は、基本的には、オーディオデータの周波数特性、分布又は周期について、複数のジャンル毎に比較基準データ格納しておき、オーディオデータを再生したときその再生したオーディオデータの周波数特性、分布又は周期を検出し、その周波数特性、分布又は周期についての検出データを上記比較基準データと比較して各ジャンル毎にそのジャンルとの適合度を求め、該適合度の大きさをジャンル決定要素としてその再生オーディオデータのジャンルを決定し、そのジャンルをオーディオデータについてのジャンルを示す拡張情報としてそのオーディオデータと共に上記記憶手段に記憶できるようにしたものである。
【0013】
ところで、ジャンルに関する拡張情報が付加される、オーディオデータがディジタルオーディオデータ[例えばMD(ミニディスク)、CD(コンパクトディスク)等に記憶されたデータが典型例]である場合、A/Dコンバータは不要であるが、アナログオーディオデータ(例えばカセットテープに記憶されたデータが典型例)は、それをディジタル信号に変換するA/Dコンバータが必要であり、そのA/Dコンバータから出力されたディジタルオーディオデータを処理してそれからジャンルを決定して拡張情報とすることになる。また、ディジタルオーディオデータが圧縮されている場合(例えば、Mpeg1−Layer3、ATRAC3等のデータ等がその一例)には、解凍したうえで再生し、その再生されたディジタルオーディオデータを処理してジャンルに関する拡張情報を得るようにする必要がある。
【0014】
本発明においては、オーディオデータの周波数特性、分布又は周期からジャンルを決定することとするが、その一つの実施の形態例を説明する。先ず、互いに異なる複数の周波数(例えば50Hz、100Hz、400Hz、1KHz)を信号成分の検出をする周波数として予め設定しておき、予め設定した一定の検出時間間隔(例えば0.1秒或いは1.0秒等)毎にその各周波数毎の信号成分のレベルを検出する。尚、斯かる検出は、オーディオデータによる一つの曲の初めから終わるまでの全時間行うようにしても良いが、曲の特定の一又は複数の時間帯のみ行うようにしても良いし、それに関しても種々の候補があり、その中から選択できるようにしても良い。全時間検出を行うようにした場合、長い再生時間の長いオーディオデータついては、ジャンル解析対象となるデータ量が膨大になることになる。従って、その場合、曲の特定の一又は複数の時間帯(例えば、再生開始後例えば1分間の時間帯と、その時間帯経過例えば1分後の例えば1分間の時間帯)のみ行うようにすればよい、ということになる。
【0015】
そして、その各検出データの信号成分のレベルが予め設定された許容範囲(下限と上限とがある許容範囲があるが、下限のみある許容範囲もありうる。)にあるとき、その検出時におけるその周波数の信号の出力があるとし、それを「出力有り」とする。
そして、その各検出時毎における各周波数毎の出力有りに関するデータから、以下の各項目のデータをつくる。第1の項目のデータとして、出力有りとされた回数、即ち出力回数、又は検出回数に対する出力回数の比に関する出力回数又は回数比データをつくる。尚、曲の特定の一又は複数の時間帯のみ行うようにした場合には、出力回数データを得るようにしてよい。というのは、検出回数が一定になるからである。それに対して、例えば一つの曲の初めから終わるまでの全時間データ検出を行うようにした場合には、曲によって再生時間の長さが異なり、検出回数が異なるので、検出回数当たりの出力回数(出力回数の対検出回数比)をデータとしてつくる必要がある。
【0016】
第2の項目のデータとして、上記各周波数毎の出力有りとされた時点と次に出力有りとされた時点との時間間隔のすべてに渡っての平均値である出力間隔平均値データをつくり、第3の項目のデータとして、各周波数成分毎の出力有りとされた時間長の出力時間平均値データをつくる。
更には、第2の項目及び第3の項目のデータに付随するデータとして出力間隔平均値及び出力時間平均値各々についての標準偏差についてのデータもつくるようにしても良い。
【0017】
ところで、オーディオ機器内には、オーディオデータの再生により得られた上記データに基づく上記各周波数毎の各項目のデータに対応して、比較基準データを、例えばROM(リードオンリーメモリ)等の記憶手段に格納しておく。具体的には、上記各周波数毎の出力回数又は回数比データに対しては、各周波数毎に出力回数又は回数比比較基準データを、各周波数毎の出力間隔平均値データに対しては、各周波数毎の出力間隔平均値比較基準データを、各周波数毎の出力時間平均値データに対しては各周波数毎の出力時間平均値比較基準データを、それぞれ用意しておく。更に、第2の項目及び第3の項目のデータに付随するデータとして出力間隔平均値及び出力時間平均値各々についての標準偏差についてのデータもつくるようにする実施の形態においては、その標準偏差に関しても比較基準データを予め設定し、ROM等に格納しておく。
【0018】
各項目毎の各周波数毎の比較基準データは、例えば許容範囲の下限と上限を特定するという形態で格納することができる。そして、その各項目毎の各周波数毎の検出データがその下限と上限との間に入っているか否かを以て許容範囲内にあるか否かを判定するようにすることができる。尚、下限と上限の一方、例えば下限のみを有する許容範囲もありうる。
そして、各項目毎の上記各周波数毎に、予めそのデータの重みを示す優先度(例えば%或いは小数)をも設定しておき、それについてもROM等に格納しておく。このような、比較基準データ及び優先度に関するデータは、各ジャンル毎に各別にそのジャンルに対応した内容で用意しておく。これは各ジャンル毎に予め多数のオーディオデータを再生して、データ分析して、各ジャンル毎の特徴、傾向に基づいてメーカー側でつくっておくのである。
【0019】
そして、オーディオデータを再生して、それに基づいて上記各項目の上記各周波数毎の上記各データをつくり、それ等を予め格納されている上記比較基準データと比較することを全項目に渡って上記全周波数について行い、許容範囲内のものについてのみ、その項目のその周波数に関して設定された優先度を加算して適合値を求め、それを当該オーディオデータについてのそのジャンルである可能性を示す指数とする。斯かる処理を全ジャンルに対して所定の順序で行い、原則的に、最も大きい適合値のジャンルを以て当該オーディオデータのジャンルとし、それをジャンルを示す拡張データとしてそのオーディオデータと共に記憶する。
【0020】
尚、最も大きい適合値が予め設定した最低基準適合値よりも小さいときは、ジャンルを特定せず、その旨を示すデータ、例えば「その他」、或いは「不明」という内容のデータをジャンルに関する拡張情報として格納するようにしても良い。というのは、例えばジャズ、ポップス等の複数のジャンルの可能性があり、決定的なジャンル決定ができないような場合、最大適合値の値が小さくなる。従って、予め最低基準適合値を設定しておき、それより小さいときはジャンルを特定せず、そして、特定しない旨の拡張情報を格納するようにする。すると、ジャンルが不明瞭にもかかわらずジャンルが特定され、誤ったジャンルについて拡張情報として付加されてしまう可能性を軽減することができる。
【0021】
尚、上述したように、項目として上記付随項目(出力間隔平均値標準偏差と出力時間平均値標準偏差)について比較基準データが予め格納されており、その付随項目についてもデータをつくり、そのデータが比較基準データによる許容範囲に含まれるか否かを判断できるようにした場合には、許容範囲内に含まれないと判定された上記周波数毎のデータについては、それが付随する項目(出力間隔時間平均値の標準偏差については出力間隔時間平均値、出力時間平均値の標準偏差については出力時間平均値)についての優先度を予め設定された割合で減算する(過小評価)ようにしても良い。標準偏差が許容範囲外の場合には、それが付随する項目についての優先度を100%認めず、一定の割合で低く評価すべきであるからである。
【0022】
また、自動モードと、手動モードを有するようにし、自動モードにしたときは、上記ルールに基づいて最大適合値のジャンルが、或いは最大適合値が最低基準適合値よりも小さいときは、ジャンルを特定せず、その旨を示すデータ、例えば「その他」、或いは「不明」という内容のデータをジャンルに関する拡張情報として格納するようにするが、手動モードによる場合には、手動操作により、最大適合値のジャンル以外のジャンルを以て当該オーディオデータのジャンルとし、それの拡張情報として付加することができるようにしても良い。というのは、ユーザーの知識、勘、経験をジャンル決定に反映できるからである。
このように、本発明は種々の形態で実施することができる。
【0023】
【実施例】
以下、本発明を実施例に従って詳細に説明する。図1は本発明オーディオ機器の第1の実施例の構成の概略を示す回路ブロック図である。図面において、1は中央処理装置(CPU:Central Processing Unit)で、オーディオ機器全体を制御する。2はROM(Read Only Memory)で、該CPU1が実行するプログラム及びジャンル認識のための比較基準データ等が記憶されている。3はRAM(Random Acces Memory)で、CPU1がプログラム実行するうえで必要なデータの記憶をする。
【0024】
4はHDD(ハードディスクドライバ)で、大容量ハードディスクを内蔵し、該ハードディスク4へのオーディオデータを拡張情報も含め記憶し、また、再生時にはそのオーディオデータを読み出す。また、その際に、更には後述するディスプレイがリスト表示モードの時に、拡張情報を読み出す。尚、この読み出された情報は、再生時に、或いはリスト表示モード時に後述するディスプレイに表示される。5は操作部で、各種スイッチが配置され、ユーザーは該操作部5のスイッチを操作することによりオーディオ機器を任意にコントロールすることができる。6はオーディオ信号発生回路で、ディジタルのオーディオデータを適宜処理し、更にD/A(ディジタル・アナログ)変換してオーディオ信号を発生する。本例では、左右の2チャンネルのオーディオ信号を発生するようになっている。7L、7Rはオーディオ信号発生回路6により発生されたアナログのオーディオ信号を増幅するアンプ、8L、8Rはアンプ7L、7Rにより増幅されたオーディオ信号を受けてそれを音声に変換するスピーカである。本音声再生系は、本例では左右2チャンネルの音声を発生するようにされているが、必ずしもそれに限定されるものではなく、例えば5.1チャンネルの音声を再生するものにも本発明は適用し得る。
【0025】
11はディジタルのオーディオデータが記録された記録媒体、例えばCD(Compact Disc)、MD(Mini Disk)、DVD(Digital Versatile Disc)等を装着し、それに記録されたオーディオデータを読み出すプレーヤ、12はアナログのオーディオデータが記録された記録媒体、例えばオーディオカセットテープ等を装着し、それに記録されたオーディオデータを読み出すプレーヤである。13はDSP(Digital Signal Processor)回路で、A/コンバータ14と、フィルタ15からなる。A/コンバータ14は上記アナログ用のプレーヤ12からのアナログのオーディオデータをディジタルのオーディオデータに変換するものであり、フィルタ15は予め設定された複数の周波数狭帯域(帯域が極めて狭いので、以下単に「周波数」という。)の信号を、その各周波数毎に分けて出力するものであり、狭帯域のバンドパスフィルタを複数有するのと等価であり、例えば50Hz、100Hz、400Hz、1KHzというような可聴周波数帯域内から選んだ複数の周波数毎にその周波数成分の信号があるときその信号を通す(出力する)。
【0026】
151〜15nはそのフィルタ15を構成するバンドパスフィルタであり、便宜上、第1の周波数(例えば50Hz)の信号成分を通すバンドパスフィルタを151と、第2の周波数(例えば100Hz)の信号成分を通すバンドパスフィルタを152と、第3(正の整数)の周波数(例えば400Hz)の信号成分を通すバンドパスフィルタを153と、第4の周波数(例えば1KHz)の信号成分を通すバンドパスフィルタを154というように、n番目の周波数の信号成分を通すバンドパスフィルタに対して15nという符号を与える。16はタイムカウンタで、DSP回路13における動作の制御のための計時を行うものである。
【0027】
本オーディオ機器による拡張情報の作成の基本的原理について説明する。プレーヤ11或いは12に拡張情報の付加を希望する記録媒体をセットし、再生する。すると、プレーヤ11でディジタルのオーディオデータを再生する場合には、そのプレーヤ11の出力はフィルタ15に直接的に入力される。また、プレーヤ12でアナログのオーディオデータを再生する場合には、A/コンバータ14にてそのオーディオデータをディジタルのオーディオデータに変換した上でフィルタ15に入力される。
【0028】
ところで、拡張情報の付加に当たり、オーディオデータの検出分析対象とする時間を予め設定できるようにしておくと良い。例えば、一つのケースでは、そのオーディオデータ1曲(或いは1楽章)分全部を検出分析対象とし、他のケースでは、開始直後の一定時間内、開始から所定時間経過後の一定時間内、更にそれから所定時間経過後の一定時間内のデータのみを検出分析対象とするというようにである。
【0029】
例えば、オーディオデータ1曲分全部を検出分析対象とする場合、1曲(或いは1楽章)が長いクラッシックだと拡張情報の付加に時間がかかりすぎるという問題が起きるが、2〜3分ぐらいの長さの例えば歌謡曲、ポップスのような場合には全曲を、データ検出分析対象としてより精確な拡張情報得て、それを付加すると良いというように、ジャンルにより適切な検出分析対象は異なるが、それはユーザーの勘、経験により選択できるようにすると良い。例えばクラッシックのように1曲(或いは1楽章)の時間が長いものを絶対聴かないユーザーの場合には、曲、楽章全部を検出分析対象とすれば良いし、クラッシックを比較的多く聴くユーザーの場合には、上記他のケースを選べばよい。
【0030】
フィルタ15は、オーディオデータの検出時間帯においては、入力されたオーディオデータに対して、タイムカウンタ16で計時された所定時間[例えば1秒間(1s)]経過する時毎に、各予め設定された上記複数の周波数毎にその周波数成分の信号を出力する。図2はある一つの周波数に関しての出力レベルの検出態様の例を示すものである。本例では、1秒(1s)間隔で、フィルタ15の各バンドパスフィルタ151〜154で出力のレベルRAM3への書込を行う。そして、このRAM3に書き込まれたデータを分析し、オーディオデータのジャンルを判定する。
【0031】
図3は出力レベルの格納例を示すものである。同図において、左端はタイムカウンタ16により計時された時刻t1、t2、・・・tx(本例では1秒おきである。しかし、これに限定されるものではなく、例えば0.1秒おき、0.5秒おき等種々の時間間隔があり得る。)を示し、そして、その各時刻t1、t2、・・・txにおける第1の周波数、第2の周波数、第3の周波数及び第4の周波数の信号成分のレベル(出力レベル)を示したものである。そのレベルは何ビットかのデジタル信号の形で表され、RAM3に記憶される。
【0032】
このRAM3への記憶は、各時刻tと、その各時刻tにおける各周波数毎の信号成分との対応関係を明らかにして為される。尚、その場合において、出力レベルのビット数は、検出条件をソフトウエアにより管理するときは、ROM2に検出条件の一つとして記憶しておくことになる。従って、RAM3に書き込んで設定することは必要ではない。
次に、上記図3で示されたところのRAM3に格納された各時点t1、t2、・・・txにおける各周波数毎の出力レベルデータを各種処理して複数種類のデータをつくる。図4(A)〜(F)は各項目の検出データ格納例を示す。
【0033】
図4(A)は総カウント数(出力回数)についての格納例を示すものであり、上記第1〜第4の各周波数毎に、その周波数成分の信号が発生した総回数を格納する。例えば検出対象時間帯内において、第1の周波数については、t1〜tx迄のx回(データ検出回数)のうち何回出力があったかをカウントし、その総回数を第1の周波数についての出力総カウント数としてカウントする。第2番目以降の周波数についても同様にカウントし、出力総カウント数を格納する。そして、それをジャンル判定の資料の一つにするのである。
尚、各時点tで出力があったか否かは、その出力レベルが、基準レベルを越えたか否かを以て判定し、基準レベルを越えない場合出力無しとし、総カウント数に加えないようにする。ある周波数の成分が0ではないが、極めてレベルが低く無視すべきものでもカウントされるのは適切ではないからである。
【0034】
また、所定範囲(上限と下限が決められた範囲)外のレベルをカウントしないようにすることもできる。このようにすれば、異常に高いレベルの信号について無視できるようにすることができる。例えば検出範囲の限を100、限を111と設定した場合、出力レベルが100〜111ならば出力有りとしてカウントし、それ以外ならば出力無しとしてカウントをしない。このようにすると、無視すべき低レベルのものや異常に高くノイズ、エラーと判断すべきものを判定対象から取り除くことができる。このような出力有りとする条件は、ソフトウエアにより管理する場合、検出条件の一つとしてROM2に予め書き込んでおくことになる。
【0035】
ところで、同じ周波数でも基準レベル、或いは許容範囲を複数種用意し、この基準レベル或いは範囲では出力総カウント数がX1、別の基準レベル或いは範囲では出力総カウント数がX2であるというようなより詳細なデータを得るようにしても良い。このようにすると、より詳細にオーディオデータについての周波数に関する傾向を把握することが可能となるからである。但し、本実施例では一つの周波数には一つの許容範囲を設定している。
【0036】
図4(B)は出力間隔(時間間隔)の平均時間の格納例を示すものである。出力間隔の平均時間とは出力有りとされた時点と、その次の出力有りとされた時点との時間差、即ち出力間隔についての平均値を各周波数(第1〜第4の周波数)毎に求めたものであり、その各周波数毎の出力間隔時間の平均時間もジャンル判定の資料の一つとするのである。尚、図4(A)に示すと同様に、図4(B)〜(E)においても、最左のブロックが第1の周波数について、その一つ右のブロックが第2の周波数について、更にその右のブロックが第3の周波数について、最も右のブロックが第4の周波数についての格納領域を示す。
【0037】
図4(C)は上記出力間隔の標準偏差の格納例を示すものであり、この図のように、各周波数毎に、上記出力間隔の標準偏差を格納する。これにより、検出した出力(出力有りという条件を備えた出力)の発生間隔のバラツキが各周波数毎に解る。これが、後述するように、許容範囲を外れた場合には、出力間隔の平均値のデータに対して設定された後述する優先度が所定の割合で低減される。
図4(D)は連続して出力が生じた場合におけるその出力が生じ続けた時間をタイムカウンタ16により求めた出力時間の平均値の格納例を示すものである。具体的には、例えばある周波数について、t1、t2では出力有りとはならず、t3、t4、t5の連続する検出で出力有りとされ、t6で出力無しとされた場合、そのt3、t4、t5の3回に時間間隔を乗算した時間(例えば3×1秒)が出力時間となる。そして、各周波数毎に、その出力時間の平均値を求めてそれもジャンル判定の資料の一つとするのである。
【0038】
図4(E)は上記の出力時間の標準偏差の格納例を示すものであり、これにより出力時間のバラツキを認識することが可能となる。この出力時間の平均値の標準偏差が、後述するように、許容範囲を外れた場合には、出力時間の平均値のデータに対して設定された後述する優先度が所定の割合で低減される。
図4(F)は再生時間の格納例であり、オーディオデータを拡張情報の作成のために検出分析対象とした再生時間を格納する。
以上の図3及び図4A)〜(E)に示すデータはすべてRAM3に記憶される。そして、これ等のデータがジャンル判定の資料となるのである。
【0039】
次に、上記データからジャンル判定をするために必要な各種検出条件、比較基準について説明する。オーディオデータを再生することによりそのデータからジャンル判定の資料としての各種データを上述したように作成する一方で、そのデータからジャンルを判定するための検出条件、比較基準のデータはオーディオ機器のメーカー側が用意し、例えばROM2に格納しておかなければならない。
検出条件として格納しておくデータには、タイムカウンタ16により各周波数毎の信号成分を取り込む時間間隔、信号成分の取り込みを行う上述した検出時間帯(開始時間と終了時間)、各検出周波数(例えば50Hz、100Hz、400Hz、1KHz)、出力レベルのビット数、出力有りと判定するレベルの条件等がある。
【0040】
図5はその各項目についての検出条件の一つの格納例を示すものである。本例では、1秒間隔で再生開始後1分後から2分後までを検出(従って検出回数は60回)し、検出周波数が4種あり、第1の周波数が、50Hz、第2の周波数が100Hz、第3の周波数が400Hz、第4の周波数が1KHzであり、出力ビット数が3bit、出力有りとされるレベル範囲が「100」〜「111」である。
【0041】
図6はある一つのジャンル(例えば「ポップス」)についての、そのジャンルに入る各種検出データについての許容範囲を示すデータの格納例を示すものである。同図に示すように、先ず、ジャンル名を格納する領域があり、更に、各検出周波数(50Hz、100H、400Hz、1KHz)毎に上記総カウント数、出力間隔平均時間、出力間隔標準偏差、出力平均時間、出力平均時間標準偏差に関しての許容範囲を下限と上限を示して特定するものである。この図6に示すような各種項目のデータについての許容範囲を示すデータは、他のジャンル、例えば男性ボーカル、女性ボーカル、クラッシック、ロック、ジャズ、歌謡曲、民謡等毎に用意されており、当然のことながら、その内容は異なる。このデータは、ジャンル毎の多数のオーディオデータについての総カウント数、出力間隔平均時間、出力間隔標準偏差、出力平均時間、出力平均時間標準偏差に関する特徴、傾向を把握した上でジャンル毎に設定され、そして、ROM2に格納して出荷されるのである。
【0042】
尚、上記総カウント数の許容範囲に関しては、総カウント数をそのまま格納するのではなく、総カウント数/検出回数(txにおけるx)をその総カウント数に代えて格納するようにしても良い。というのは、タイムカウンタ16により一定時間経過毎に上記検出(検出)をする回数が固定されない場合があるからである。例えば1曲(或いは1楽章)全部を検出対象とする場合、曲の再生時間が異なるので、当然に検出の回数が異なる。従って、検出回数の違う場合、それを無視して上記総カウント数を評価しても意味がない。そこで、そのような場合には、上記総カウント数をそのまま格納するのではなく、総カウント数/検出回数(txにおけるx)をその総カウント数に代えて格納するようにするのである。例えば、検出回数が60回で総カウント数が48回を下限、同じく総カウント数が60回を上限とする場合には、下限として0.8を、上限として1.0を格納するのである。
【0043】
勿論、検出回数が固定されている場合には、総カウント数の下限及び上限をそのまま格納して良いことはいうまでもない。この場合、例えば上記例では、下限を48と、上限を60と格納することになり、また、40〜60が許容範囲の場合には、下限に40と、上限に60と格納することになる。
また、出力間隔平均時間、出力平均時間の許容範囲については、例えば下限、上限を検出時間間隔の倍数で表し、例えば下限を3、上限を8とした場合、3〜8秒が許容範囲ということになる。許容範囲内にある場合には検出データと比較基準データとが合致したことになり、当該項目(各周波数毎の当該項目に)について設定された優先度が加算されることになる。
また、出力間隔平均時間及び出力平均時間それぞれについての標準偏差に関しても許容範囲が上限と下限を示して特定され、標準偏差が許容範囲内である場合と、許容範囲外である場合とで、後述する適合値の値がそのままになったり、それを減算した値になったりと異なるようになっている。
【0044】
更に、各データ項目間、即ち上記総カウント数、出力間隔平均時間、出力間隔標準偏差、出力平均時間、出力平均時間標準偏差間の優先度(重み)についても設定することができる。また、同じデータ項目間においても検出周波数(本例では第1〜第4の周波数)間における優先度(重み)等についても設定するようにしても良い。
これ等、図6に示すデータ及び各データ項目間の優先度に関するデータは改めて述べるまでもなく、オーディオ機器メーカー側が予め設定してROM2に格納しておくのである。
【0045】
そこで、どのように図4に示したデータを、図6に示したデータと比較してジャンルの判定をするかについて、大まかに説明する。その判定は、図4に示したデータについて、各検出周波数毎の各データ項目毎に許容範囲に入っているか否かを検出し、その優先度、標準偏差に応じてその適合性を数値化し、数値化したものを加算し、そのジャンルにおける適合度を求めることを、ジャンル毎に行い、最も適合の大きくなったジャンルを以て当該オーディオデータが属するジャンルとし、自動的に拡張情報としてそのジャンルをオーディオデータと共にHDD4に記録することができるようにする。
【0046】
尤も、適合の大きい順から複数のジャンルをその適合値と共に表示し、その中からユーザーが選んだジャンルを以てそのジャンルとし、そのジャンルをオーディオデータと共に、HDD3に格納するようにしても良い。また、最も大きい適合のジャンルのその適合でも、予め設定された一定の基準値に達しない場合は、ジャンルの特定がかなり難しいケースであるといえるので、「不明」或いは「その他」というようにジャンルに関して表示がされるようにしても良い。
【0047】
図7及び図8はその比較条件の一例を示すもので、これを例として判定処理例を簡単に説明する。本例では、前提を簡単にして解りやすくするために、検出データが図9に示すように、ジャンルがジャンルA、ジャンルB、ジャンルCの三種類しかなく、検出周波数が3つ、タイムカウンタにより制御される検出時間間隔が0.1秒、検出回数が固定で、1000回、比較する項目は、総カウント数、出力間隔の平均時間、出力間隔の平均時間の三つのみ示し、出力間隔の平均時間、出力間隔の平均時間各々の標準差については図示しなかった。本例では、その各標準差については許容範囲内にあるものとする。このような比較条件が設定されているとして、例えば図9に示すようなオーディオデータの各項目のデータが検出されたとした場合、どのように判定されるのかを説明する。
【0048】
ジャンルAの場合、総カウント数に関して、第1の周波数については許容範囲に入っており(許容範囲が100回〜400回で、実際の回数が300回)、従って、この点について優先度20%が計算にはいる。第2の周波数については許容範囲に入っており(許容範囲が0回〜100回で、実際の回数が50回)、従って、この点について優先度10%が計算にはいる。第3の周波数については条件無しであり、優先度は元々計算に入らない。
また、出力間隔(の平均値)に関して、第1の周波数については許容範囲に入っており(許容範囲が0秒〜7秒で、実際が2秒)、従って、この点について優先度20%が計算に入る。第2の周波数については許容範囲に入っておらず(許容範囲が2秒〜10秒で、実際が15秒)、従って、この点について優先度10%が計算に入らない。また、第3の周波数については条件無しであり、優先度は元々計算に入らない。
【0049】
また、出力時間(の平均値)に関しては、第1の周波数については許容範囲に入っており(許容範囲が3秒〜8秒で、実際が5秒)、従って、この点について優先度40%が計算に入る。第2の周波数についても許容範囲に入っており(許容範囲が0秒〜4秒で、実際が2秒)、従って、この点について優先度5%が計算に入る。また、第3の周波数については条件無しであり、優先度は元々計算に入らない。
そこで、このジャンルAに関しての優先度を合計すると、20+10+40+5=95%になる。これがジャンルAについての適合度を表す適合値となる。
同様の適合値検出処理を、ジャンルBに関して行うと、その適合値は10+10+35=55%となり、ジャンルCに関して行うと、その適合値は15+10+10+10=45%となる。そこで、各ジャンルA〜Cの適合値を比較すると、ジャンルAの適合値が最も高い。
【0050】
従って、ジャンルAが当該オーディオデータ(図9に示すよう検出データが得られたオーディオデータ)のジャンルと判定され、そのオーディオデータがそのジャンルAを示す拡張情報と共にHDD4に記録される。そして、後に、HDD4に記録されたオーディオデータのリストを見る場合、そのオーディオデータについての認識をさせるものの少なくとも一つとしてその拡張情報がディスプレイ10に表示され、その拡張情報のある例えば行を指定して確定することにより再生しようとするオーディオデータを特定することができる。
尚、ジャンルとして適合値の高いものから順に複数ジャンル、適合値と共にディスプレイ10に表示をし、複数のジャンルの適合値をユーザーに認識させ、原則的には最も適合値の高いものを当該オーディオデータのジャンルとして設定されるが、ユーザーが操作をすることにより例外的にユーザーの他のジャンルを設定できるようにしても良い。
【0051】
この場合、例えばジャンルAが95%、ジャンルBが55%、ジャンルCが45%と表示され、原則的にはジャンルAが当該オーディオデータのジャンルとして設定されるが、ユーザーの操作により例えばジャンルBを当該オーディオデータのジャンルとして設定することもできる。尚、上記の例では、出力間隔の平均時間、出力の平均時間各々の標準差については許容範囲内にあることを前提としていた。しかし、標準差が許容範囲外の場合もあり、その場合には、優先度(%)に或る所定の小数(例えば0.8)を乗算し、その乗算したものを以て当該項目(例えば出力間隔の平均時間或いは出力の平均時間)の優先度(%)として適合値を計算するのである。
【0052】
具体例を挙げて説明すると、上記例におけるジャンルAの出力間隔の平均値は第1の周波数の場合、下限が0秒、上限が7秒であり、実際の値2秒はその許容範囲に入り、優先度20%が適合値の計算に入るが、もし、その出力間隔の平均時間についての標準偏差が許容範囲外にあるときは、所定の小数(例えば0.8)をその優先度20%に乗算し(実質的な減算)、その乗算後の値、例えば16%を以て優先度とし、適合値の計算をする。
【0053】
出力の平均時間についても同様で、標準差について許容範囲外の場合は所定の小数(例えば0.8。但しそれ以外の値であっても良い。また、出力間隔の平均時間についての標準偏差の許容範囲外の場合における小数と同じ値である必要はない。)を当該項目の優先度に乗算し、乗算後の値を以て当該項目の優先度として適合値の計算をすることになる。以上が本実施例におけるジャンル判定の原理を説明するものである。
【0054】
次に、実際の判定についての動作を図10、図11に示すフローチャートを参照して説明する。図10(A)は本比較判定処理を示すフロー全体を示し、図10(B)は(A)に示すフローのうちの比較及び適合値算出の具体的なフローを示し、図11(A)は図10(A)に示すフローのうちの自動モード用処理の具体的なフローを示し、図11(B)は同じく手動モード用処理の具体的フローを示す。
以下に、先ず図10(A)を参照して比較判定処理のフロー全体を説明する。
【0055】
尚、上述したように、ROM2には前述のように検出周波数その他の検出条件、項目、比較ジャンルの順序等に関して固定されたデータが予め格納されているものとする。また、自動/手動モードについての設定はこの比較判定処理開始前に設定しておくものとする。ここで、自動モードとは自動的に拡張情報を当該オーディオデータに追加するモードであり、手動モードとは拡張情報を追加するに当たり、その追加の可否を問い、手動操作により拡張情報の変更をし或いはそれを追加することを許容するモードである。また、オーディオデータの検出分析対象の時間帯についても設定、或いは手動等により指定されているものとする。
【0056】
(1)「比較及び適合値算出処理」
フローが開始すると、先ず、検出データ(図4に示すデータ)からある一つのジャンルに関しての比較処理を行い、その適合値を求め、それをRAM3に書き込む。尚、この処理の具体的フローは図11(A)に図示してあり、それについての詳細は後述する。尚、この処理で比較処理を行うジャンルの順序は、例えばジャンルA、ジャンルB、ジャンルC、・・・というように予め設定されており、最初は第1番目に設定されたジャンル、本例ではジャンルAについて比較処理及び適合値算出処理を行う。
【0057】
(2)「全ジャンル完了?」
比較等の処理を行うすべてのジャンルに関してステップ(1)の処理が終了したか否かを判定する。
(3)「ジャンル切換」
上記ステップ(2)の判定結果がNoの場合、換言すれば、ステップ(1)の処理が行われていないジャンルがある場合には、ステップ(1)による処理を行う各種比較条件等を次のジャンル用のものに切り換える処理を行う。そして、その条件等の切換が終わると、上記ステップ(1)の比較及び適合値算出処理が行われる。即ち、次のジャンルについての比較及び適合値算出処理が行われるのである。ステップ(1)〜(3)のフローはすべてのジャンルについてステップ(1)の処理が済むまで繰り返される。
【0058】
(4)「モード判定」
上記ステップ(2)の判定結果がYesの場合、換言すれば、ステップ(1)の処理がすべてのジャンルに関して終わった場合、操作により設定されている自動モードか手動モードかについてのモードの判定を行う。
(5)「自動モード用処理」
上記ステップ(4)の判定結果が「自動モード」であった場合には、自動モード用処理が行われる。この具体的内容は図11(A)に図示されており、これについては同図を参照して後述する。
【0059】
(6)「手動モード用処理」
上記ステップ(4)の判定結果が「手動モード」であった場合には、手動モード用処理が行われる。この具体的内容は図11(B)に図示されており、これについては同図を参照して後述する。
(7)「拡張情報追加」
上記ステップ(5)又は(6)が終了後、確定した追加すべき拡張情報をオーディオデータに付随するものとしてHDD4に記録する。
その後、このフローが終了する。
【0060】
次に、上記ステップ(1)の比較及び適合値算出処理について、そのフローを示す図10(B)を参照して説明する。本フローは、各種項目の検出データを、比較基準としてA/コンバータメーカー側が用意した比較基準データを基準として比較し、その比較結果に基づいて適合値の計算を行うものであるが、比較する項目の順序は予め設定されている。尚、その順序は、先ず、総カウント数について第1の周波数、第2の周波数、第3の周波数、第4周波数の順で比較処理を行い、次に、出力間隔の平均時間について、同じ周波数の順序で行うというように、図4に示すような順序になっている。
【0061】
(8)「許容範囲内?」
先ず、一つの項目についての検出データが比較基準データによって設定された許容範囲に入っているか否かを検出する。
(9)「比較条件の切換」
上記ステップ(8)の判定結果がNoの場合には、次の項目についてステップ(8)の処理を行わせるべく、比較条件の切換を行う。それが終わると、新たな項目についてステップ(8)による処理(「許容範囲内?」)が行われる。
【0062】
(10)「標準偏差有?」
次に、ステップ(8)の判定結果がYesの場合、「許容範囲内?」という処理が行われた比較条件が標準偏差というものが付随する比較条件であるか否かを判定する。標準偏差が付随しない比較条件には図4(A)に示す総カウント数があり、従って、その比較条件が総カウント数の場合には、本ステップ(10)の判定結果がNoになる。また、標準偏差が付随する比較条件には図4(B)に示す出力間隔の平均時間と、図4(D)に示す出力の平均時間とがあり、従って、その比較条件がそのいずれかの場合には、本ステップ(10)の判定結果がYesになる。
【0063】
(11)「許容範囲内?」
上記ステップ(10)の判定結果がYesの場合、即ち、ステップ(8)で許容範囲内か否かの判定が行われた比較条件に付随する標準偏差(出力間隔の平均時間又は出力の平均時間の標準偏差)が許容範囲内か否かを判定する。
(12)「優先度の減算」
ステップ(11)の判定結果がNoの場合、即ち、標準偏差が許容範囲外の場合、該標準偏差自身が付随する比較条件についての優先度に予め設定された小数を乗算することにより実質的な優先度の減算をする。例えば出力間隔の平均時間の第1の周波数について許容範囲だとすると、優先度が20%ということになるが、その出力間隔の平均時間についての標準偏差が許容範囲だとするとその優先度を20%×0.8=16%に減算し、それを適合値算出に供する。
【0064】
(13)「適合値算出」
ステップ(10)の判定結果がNoの場合、ステップ(11)の判定結果がYesの場合又はステップ(12)の処理が終了した場合、当該比較条件についての優先度を加算する。これは、例えば適合値算出用のレジスタに、各比較条件についての優先度が確定する毎にその優先度を加算して行くことにより為し得る。尚、ステップ(10)の判定結果がNoの場合とステップ(11)の判定結果がYesの場合、予め設定された優先度がそのまま適合値算出に供されるが、ステップ(12)で優先度が減算された場合には、その減産された値の優先度が適合値算出に供される。
【0065】
(14)「全比較条件の処理終了?」
上記ステップ(13)の処理が終了すると、当該ジャンル(現在比較及び適合値算出処理を行っているジャンル)についての全比較条件の処理が終了したか否かを判定する。この判定結果がNoの場合は、ステップ(9)に戻る。
そして、この判定結果がYesならばこの比較及び適合値算出処理は一応終了したということになる。そして、このときの、優先度の加算結果(積分値)がそのジャンルについての適合値ということになる。
【0066】
次に、図10(A)のステップ(5)の「自動モード用処理」を図11(A)を参照して説明する。
(15)「最も大きい適合値を求める」
上記ステップ(5)のモード判定で自動モードという判定結果が得られた場合、自動モード用処理が行われるが、この処理は、先ず、RAM3内に格納された各ジャンルの適合値のうちから最も大きい適合値を探し出す。
(16)「所定値より大きい?」
上記ステップ(15)で探し出した最も大きい適合値が所定値(最低基準適合値)より大きいか否かを判定する。ジャンル毎の適合値を求め、最大適合値を有するジャンルを認識できたが、その値がさほど大きくない場合は、ジャンル判定の信頼度が低い(他のジャンルである可能性がある)といえ、そのような場合には決定を留保すべきであると言える。そこで、ジャンルを明確に決定するのに最小限必要な最低基準適合値を所定値として設定しておき、それより最大適合値が低い場合、ジャンル決定を留保できるようにするため、このステップ(16)で、最大適合値が所定値(最低基準適合値)より大きいか否かを判定するようにしたのである。
【0067】
(17)「最大適合値のジャンルに決定」
上記ステップ(16)の判定結果がYesの場合、当該オーディオデータのジャンルを最大適合値のジャンルに決定する。
(18)「その他(又は不明)とジャンル決定」
上記ステップ(16)の判定結果がNoの場合、具体的なジャンル決定をせず、その他(又は不明)というようにする。これにより、自動的ジャンル決定ができなかったことをユーザーに知らせることができる。
【0068】
次に、図10(B)のステップ(6)の「手動モード用処理」を図11(B)を参照して説明する。
(19)「最も大きい適合値を求める」
上記ステップ(6)のモード判定で手動モードという判定結果が得られた場合、手動モード用処理が行われるが、この処理は、先ず、RAM3内に格納された各ジャンルの適合値のうちから最も大きい適合値を探し出す。
(20)「所定値より大きい?」
上記ステップ(19)で探し出した最も大きい適合値が所定値(最低基準適合値)より大きいか否かを判定する。このような判定をするステップを設けた理由は前述の通りである。
【0069】
(21)「その他(又は不明)と決定」
上記ステップ(20)の判定結果がNoの場合、具体的なジャンル決定をせず、ジャンルをその他(又は不明)と決定する。
(22)「その他(又は不明)と表示」
その後、その他(又は不明)という表示をし、それに応じる(可)か、拡張情報の付加をキャンセル(キャンセル)するか、その他(又は不明)という決定に従わず飽くまでジャンルの決定を求める(否)かについてのユーザーの指示を促す。尚、表示は単にその他(又は不明)と示すに止まらず、具体的に選択肢(この場合三つある)の内容を列挙し、更に、そのうちの一つを指示することを促すような内容を、更には、指示する操作方法を示すようにしても良い。
【0070】
(23)「指示内容判定」
上記表示に促されて指示が為された場合、その指示内容を判定する。そして、判定結果がキャンセルであった場合には、そのオーディオデータについては、拡張情報の付加をせず、終了する。また、判定結果が可であれば、図1(A)のステップ(7)にすすみ、このオーディオデータについては拡張情報としてジャンルが「その他(又は不明)」として付加されることになる。
(24)「ジャンル決定」
ステップ(20)の判定結果がNoである場合、ステップ(23)の判定結果が否である場合又は後述するステップ(27)が終了した場合、ジャンル決定をする。
そのジャンル決定は、ステップ(20)の判定結果がNoである場合又はステップ(23)の判定結果が否である場合には、最も大きい適合値のジャンルを選ぶ[ステップ(19)により行われている]ことにより行う。また、後述するステップ(27)が終了した場合には、その次に大きな値のジャンルにジャンル決定する。
【0071】
(25)「ジャンル表示」
ステップ(24)で決定したジャンルを表示をし、それに応じる(可)か、拡張情報の付加をキャンセル(キャンセル)するか、そのジャンル決定に従わず次に大きな適合値のジャンルが何かを求める(否)かについてのユーザーの指示を促す。尚、表示は単に決定されたジャンルを示すに止まらず、具体的に選択肢(この場合三つある)の内容を列挙し、更に、そのうちの一つを指示することを促すような内容を、更には、指示する操作方法を示すようにしても良い。
(26)「指示内容判定」
上記表示に促されて指示が為された場合、その指示内容を判定する。そして、判定結果がキャンセルであった場合には、そのオーディオデータについては、拡張情報の付加をせず、終了する。また、判定結果が可であれば、図10(A)のステップ(7)にすすみ、このオーディオデータについては拡張情報としてステップ(24)で決定され、ステップ(25)で表示されたジャンルが当該オーディオデータに拡張情報として付加されるのである。
【0072】
(27)「次に大きな適合値を求める」
ステップ(26)の判定結果が否である場合には、その次に大きな適合値を求める。このステップ(27)が終わると、ステップ(24)に進み、そこで、その適合値のジャンルにジャンル決定が為され、ステップ(25)でそのジャンルが表示され、指示が促される。
それでも、そのジャンル決定に不満で、促されてした指示が否である場合には、更にその次に大きな(次の次の大きさの)適合値のジャンルが選ばれることになる。即ち、否という指示を繰り返すことによりどんどん適合値が小さなジャンルが決定され、表示されていくことになる。
【0073】
尚、このように次に大きい適合値を求めていく場合、大きい方のジャンルを消し去るのではなく、残して行き、複数のジャンルを適合値の大きさが解るように、或いは適合値の大きさの順位が解るように表示し、可という指示を出したときその複数のジャンルが適合値を大きさ或いは大きさの順位と共に拡張情報として当該オーディオデータに付加されるようにしても良い。
【0074】
【発明の効果】
本発明のオーディオ機器によれば、複数のジャンル毎に比較基準データを予め格納しておき、それとオーディオデータの再生時にそのオーディオデータと比較基準データとを比較すること行い、その比較結果からジャンル毎の適合を求めて、その適合の大きさをジャンル決定の要素とするので、オーディオデータの各ジャンルとの適合度を数値化により把握することができる。従って、客観的なジャンルの自動的判断が可能となり、延いては、自動的にジャンルについての拡張情報の付加が可能となる。
【0075】
また本発明のオーディオ機器によれば、オーディオデータを、一定の検出時間間隔毎に、複数の異なる周波数の信号成分を検出し、その信号成分のレベルが許容範囲(下限及び上限を有する許容範囲もあれば、下限のみ有する許容範囲もある。)内にある場合にその検出時におけるその周波数の信号成分が出力されたと、即ち、出力有りとし、その出力回数、出力間隔の平均時間、出力時間平均値という具体的且つ客観的な数値により把握し、各ジャンル毎に予め設定された比較基準と比較することにより、ジャンルとの適合値を算出する。従って、各ジャンル毎にその再生したディジタルオーディオデータのそのジャンルである可能性を数値的に表すことができ、延いては、その数値の比較からジャンルを客観的に自動設定することが可能になる。
【0076】
また本発明のオーディオ機器によれば、オーディオデータを、複数の周波数各々についてその周波数の信号成分がある、即ち、出力有りとされた出力回数、出力間隔の平均時間、出力時間平均値という具体的且つ客観的な数値により把握し、それぞれの項目の上記各周波数毎に予め設定した許容範囲にある場合において適合値算出に供される加算データとして重みを表す優先度を設定しておいた値に基づいて各ジャンルの適合値を求め、それから当該オーディオデータのジャンルを決定するようにしたので、より客観的で且つ精確にジャンルを決定することができる。
【0078】
また本発明のオーディオ機器によれば適合値の最も大きいジャンルを以て当該オーディオデータのジャンルとするので、最もそのオーディオデータのジャンルとして可能性の高いものを、そのジャンルを示す拡張情報と決定することができ、的確なジャンル決定する可能性を高いものにすることができる。
【0079】
また本発明のオーディオ機器によれば適合値が予め設定された最低基準許容値を越えるジャンルのない場合、即ち、ジャンル判定の精度が充分に高くすることが難しい場合、どのジャンルも特定せず、その特定をしないことを示す情報を拡張情報として記録するようにしてなるので、判定精度の低いジャンルを以て当該オーディオデータのジャンルとする拡張情報が付加されるのを防止することができる。
【図面の簡単な説明】
【図1】本発明オーディオ機器の第1の実施例の構成の概略を示す回路ブロック図である。
【図2】上記実施例における、ある一つの周波数に関しての出力レベルの検出態様の一例を示すものである。
【図3】上記実施例における、出力レベルの格納例を示すものである。
【図4】上記実施例における、(A)〜(F)は各項目の検出データ格納例を示す。
【図5】上記実施例における、各項目についての検出条件の一つの格納例を示すものである。
【図6】上記実施例における、ある一つのジャンル(例えば「ポップス」)についての、そのジャンルに入る各項目の検出データについての許容範囲を示すデータの格納例を示すものである。
【図7】上記実施例における、各項目についての比較条件の一例の一部を示す図である。
【図8】上記実施例における、各項目についての比較条件の一例の残りを示す図である。
【図9】上記実施例において、適合値計算の説明に供した一つの検出データ例を示す図である。
【図10】(A)は本比較判定処理を示すフロー全体を示し、(B)は(A)に示すフローのうちの比較及び適合値算出の具体的なフローを示す。
【図11】(A)は図10(A)に示すフローのうちの自動モード用処理の具体的なフローを示し、(B)は同じく手動モード用処理の具体的なフローを示す。
【符号の説明】
1・・・CPU、2・・・ROM、3・・・RAM、4・・・HDD(記憶処理)、6・・・オーディオ信号発生回路、10・・・ディスプレイ、11・・・デジタルオーデイオデータ再生機(プレーヤ)、12・・・アナログオーディオデータ再生機(プレーヤ)、13・・・DSP部。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an audio device, in particular, an audio device in which audio data can be stored in an internal storage device or an external storage means with extension information added thereto , How to manage audio data And programs for it About.
[0002]
[Prior art]
When audio data (for example, data for various music, reading, language courses, etc.) is stored on various recording media, for example, a hard disk of a personal computer, etc. due to the development of audio devices and personal computers, extended information (such as song titles) Titles, artist names, and other information useful for data management).
[0003]
Therefore, the user can record a recording medium such as a hard disk of the audio device. In For example, you can store a large amount of audio data that you want to enjoy later from an audio data source such as a CD (Compact Disc) and play it back whenever you want to enjoy it or learn it. When a favorite item is selected from the audio data, the audio data can be identified and reproduced using the extended information as an index.
[0004]
Conventionally, when a user stores audio data in a recording medium such as a hard disk of an audio device, the extension information is added by the user by operating a keyboard of a personal computer or the like.
[0005]
[Problems to be solved by the invention]
By the way, as described above, conventionally, the addition of the extension information of the audio data has been inevitably performed by a keyboard operation of a personal computer or the like. Therefore, when the number of audio data to be stored increases, the work to be performed by the user is increased. There is a problem that the load becomes large and the load becomes heavy, and as a result, the management of audio data becomes difficult.
[0006]
In the case of a car audio device, a keyboard is connected to a personal computer or the like. Do It is impossible to store audio data by operation. Therefore, when storing audio data, it is virtually impossible for the user to add extended information. This is a problem that cannot be overlooked. This is because in recent years, a car audio device that has a built-in large-capacity recording medium, for example, a hard disk, into which a large amount of audio data can be input has appeared. However, even if a large amount of audio data can be stored, there is no extended information when selecting and playing back what the user likes, so there is a problem that it is difficult to select or it takes time to select This means that the usability is extremely bad. Now Large capacity Even if a car audio device that records a large amount of audio data on the recording medium is provided, it may not be used effectively.
[0007]
The present invention has been made to solve such a problem, and in an audio device in which digital audio data can be stored in an internal or external storage means by adding extended information to the digital audio data. The audio data is reproduced for the audio data to which no is added, the frequency characteristics, distribution, period, etc. of the reproduced signal are detected, and the detection result is analyzed and automatically the genre of the audio data Is added to audio data automatically as extended information and stored in the recording medium of the audio device, and a genre different from the automatic determination result is manually added as extended information. You can do it.
[0008]
[Means for Solving the Problems]
The audio equipment of the present invention Level determination that divides audio data into predetermined frequency bands, detects the output level for each frequency band for a predetermined time every predetermined detection time, and determines whether the output level for each frequency band is within a preset range And frequency data that is data based on the total number of times that the level determination means determines that the output level for each frequency band is within a preset range, and the output level for each frequency band is within a preset range The level determination means continuously determines that the output interval average value data, which is the average value of the time intervals at each time point determined by the level determination means, and the output level for each frequency band are within a preset range. Output time average value data, which is an average value of the selected time, and detection means for detecting the characteristic data of the audio data, and for each of a plurality of genres A storage means for storing predetermined values representing the count data, the output interval average value data, and the output time average value data as reference data, and the feature data detected by the detection means are compared with the reference data, and optimum based on the comparison result Genre determining means for determining a proper genre, and storage control means for associating audio data with the optimum genre and storing them in the storage means It is characterized by that.
[0012]
DETAILED DESCRIPTION OF THE INVENTION
Basically, the present invention provides comparison reference data for each of a plurality of genres with respect to the frequency characteristics, distribution or period of audio data. The When the audio data is reproduced, the frequency characteristics, distribution or period of the reproduced audio data is detected, and the detected data about the frequency characteristics, distribution or period is compared with the comparison reference data for each genre. Then, the genre of the reproduced audio data is determined using the magnitude of the genre as a genre determining element, and the genre is stored as the extended information indicating the genre of the audio data together with the audio data. It can be stored in the means.
[0013]
By the way, when the extended information about the genre is added and the audio data is digital audio data [eg, data stored in MD (mini disk), CD (compact disk), etc., a typical example], an A / D converter is unnecessary. However, analog audio data (for example, data stored on a cassette tape is a typical example) requires an A / D converter that converts it into a digital signal, and the digital audio data output from the A / D converter is necessary. Is processed, and then the genre is determined to be extended information. Also, when digital audio data is compressed (for example, Mpeg 1-Layer 3, data such as ATRAC3 is an example), and it is necessary to decompress and reproduce and process the reproduced digital audio data to obtain extended information on the genre.
[0014]
In the present invention, the genre is determined from the frequency characteristics, distribution, or period of the audio data. One embodiment will be described. First, a plurality of different frequencies (for example, 50 Hz, 100 Hz, 400 Hz, and 1 KHz) are set in advance as frequencies for detecting signal components, and a predetermined detection time interval (for example, 0.1 seconds or 1.0 is set). The level of the signal component for each frequency is detected every second. Such detection may be performed for the entire time from the beginning to the end of one song by audio data, but may be performed only for one or more specific time zones of the song. There are various candidates, and it may be possible to select among them. When all time detection is performed, audio data with a long playback time is used. In As a result, the amount of data subject to genre analysis becomes enormous. Therefore, in that case, only one or more specific time zones of the song (for example, a time zone of 1 minute after the start of playback and a time zone of 1 minute after the time zone, for example, 1 minute) are performed. That's right.
[0015]
When the level of the signal component of each detection data is within a preset allowable range (there is an allowable range with a lower limit and an upper limit, but there is also an allowable range with only a lower limit), Assume that there is an output of a frequency signal, and that is “with output”.
Then, the following items of data are created from the data relating to the presence of output for each frequency at each detection time. As the data of the first item, the output count or the frequency ratio data relating to the ratio of the output count with respect to the output count, that is, the output count or the detection count is generated. In the case where only one or a plurality of specific time periods of the music are performed, output frequency data may be obtained. This is because the number of detections is constant. On the other hand, for example, when the detection of all time data from the beginning to the end of one song is performed, the length of the playback time differs depending on the song, and the number of detections differs. The ratio of the number of outputs to the number of detection times) must be created as data.
[0016]
As the data of the second item, output interval average value data that is an average value over the entire time interval between the time point when the output for each frequency is present and the time point when the output is next is created, As the data of the third item, output time average value data having a time length for which there is an output for each frequency component is created.
Furthermore, data regarding the standard deviation for each of the output interval average value and the output time average value may be generated as data accompanying the data of the second item and the third item.
[0017]
By the way, in the audio equipment, the comparison reference data is stored in a storage means such as a ROM (Read Only Memory) corresponding to the data of each item for each frequency based on the data obtained by reproducing the audio data. Store it in. Specifically, for the output frequency or frequency ratio data for each frequency, output frequency or frequency ratio comparison reference data for each frequency, and for output interval average value data for each frequency, The output interval average value comparison reference data for each frequency is prepared, and the output time average value comparison reference data for each frequency is prepared for the output time average value data for each frequency. Furthermore, in the embodiment in which data about the standard deviation for each of the output interval average value and the output time average value is also generated as data accompanying the data of the second item and the third item, Also, comparison reference data is set in advance and stored in a ROM or the like.
[0018]
The comparison reference data for each frequency for each item can be stored, for example, in the form of specifying the lower limit and the upper limit of the allowable range. Then, it can be determined whether or not the detection data for each frequency for each item is within the allowable range based on whether or not the detection data is between the lower limit and the upper limit. There may be an allowable range having only one of the lower limit and the upper limit, for example, only the lower limit.
A priority (for example,% or decimal number) indicating the weight of the data is also set in advance for each frequency for each item, and this is also stored in the ROM or the like. Such comparison reference data and data related to priority are prepared for each genre with contents corresponding to the genre. This is because a large number of audio data is reproduced in advance for each genre, analyzed, and created by the manufacturer based on the characteristics and trends of each genre.
[0019]
Then, the audio data is reproduced, the data for each frequency of the items is generated based on the audio data, and the comparison with the reference data stored in advance is performed for all items. For all frequencies, only for those that are within an acceptable range, add the priority set for that frequency for that item to find a fitness value, and use it as an index to indicate the possibility of that genre for that audio data. To do. Such processing is performed in a predetermined order for all genres, and in principle, the genre having the largest matching value is used as the genre of the audio data, and this is stored as extension data indicating the genre together with the audio data.
[0020]
When the largest adaptation value is smaller than the preset minimum reference adaptation value, the genre is not specified, and data indicating that, for example, “other” or “unknown” data is extended information about the genre. You may make it store as. This is because there is a possibility of a plurality of genres such as jazz and pops, and when the definitive genre cannot be determined, the value of the maximum adaptation value becomes small. Therefore, a minimum standard conformity value is set in advance, and if it is smaller than that, the genre is not specified, and extended information indicating that it is not specified is stored. Then, although a genre is unclear, a genre is specified and the possibility that an incorrect genre is added as extended information can be reduced.
[0021]
As described above, the comparison reference data is stored in advance for the accompanying items (output interval average value standard deviation and output time average value standard deviation) as items, and data is also created for the accompanying items. When it is possible to determine whether the data is included in the allowable range based on the comparison reference data, the data for each frequency determined not to be included in the allowable range is included in the item (output interval time) associated with the data. For the standard deviation of the average value, the priority for the output interval time average value, and for the standard deviation of the output time average value, the output time average value) may be subtracted at a preset ratio (underestimation). This is because when the standard deviation is out of the allowable range, the priority for the item to which the standard deviation is attached is not recognized 100% and should be evaluated at a low rate at a certain rate.
[0022]
In addition, when automatic mode and manual mode are set and automatic mode is set, the genre of the maximum fit value is specified based on the above rules, or the genre is specified when the maximum fit value is smaller than the minimum reference fit value. However, data indicating that, for example, “other” or “unknown” data is stored as extended information about the genre. A genre other than the genre may be used as the genre of the audio data and added as extension information thereof. This is because the user's knowledge, intuition, and experience can be reflected in genre determination.
Thus, the present invention can be implemented in various forms.
[0023]
【Example】
Hereinafter, the present invention will be described. Example It explains in detail according to. FIG. 1 is a circuit block diagram showing an outline of the configuration of a first embodiment of an audio apparatus according to the present invention. In the drawing, reference numeral 1 denotes a central processing unit (CPU) that controls the entire audio equipment. Reference numeral 2 denotes a ROM (Read Only Memory) which stores a program executed by the CPU 1 and comparison reference data for genre recognition. 3 is RAM (Rand o m Acces Memory) The Store the data necessary for execution.
[0024]
An HDD (Hard Disk Driver) 4 has a built-in large-capacity hard disk, stores audio data to the hard disk 4 including extended information, and reads the audio data during reproduction. At this time, the extended information is read when the display described later is in the list display mode. The read information is displayed on a display described later during reproduction or list display mode. Reference numeral 5 denotes an operation unit on which various switches are arranged, and the user can arbitrarily control the audio device by operating the switch of the operation unit 5. Reference numeral 6 denotes an audio signal generation circuit which appropriately processes digital audio data and further performs D / A (decoding). Iji Audio signal is generated. In this example, left and right two-channel audio signals are generated. Reference numerals 7L and 7R denote amplifiers that amplify the analog audio signal generated by the audio signal generation circuit 6, and reference numerals 8L and 8R denote speakers that receive the audio signals amplified by the amplifiers 7L and 7R and convert them into sound. In the present example, the present audio reproduction system is adapted to generate two channels of left and right channels. However, the present invention is not necessarily limited to this. For example, the present invention is also applied to a unit that reproduces 5.1 channels. Can do.
[0025]
Reference numeral 11 denotes a recording medium on which digital audio data is recorded, such as a CD (Compact Di). s c), MD (Mini Disk), DVD (Digital Versa tile A player that reads the audio data recorded on the disc, and 12 is a player that loads a recording medium on which analog audio data is recorded, such as an audio cassette tape, and reads the audio data recorded on the recording medium. . Reference numeral 13 denotes a DSP (Digital Signal Processor) circuit. D It comprises a converter 14 and a filter 15. A / D The converter 14 converts the analog audio data from the analog player 12 into digital audio data, and the filter 15 has a plurality of preset frequency narrow bands (the band is extremely narrow. ).) Is output separately for each frequency, which is equivalent to having a plurality of narrow-band bandpass filters. For example, an audible frequency band such as 50 Hz, 100 Hz, 400 Hz, or 1 KHz. When there is a signal of the frequency component for each of a plurality of frequencies selected from within, the signal is passed (output).
[0026]
151 to 15n are band-pass filters that constitute the filter 15. For convenience, a band-pass filter that passes a signal component of a first frequency (for example, 50 Hz) 151 and a signal component of a second frequency (for example, 100 Hz) 152 and the third (positive integer) )of A bandpass that passes a signal component of the nth frequency, such as 153 a bandpass filter that passes a signal component of frequency (for example, 400 Hz) and 154 that of a bandpass filter that passes a signal component of the fourth frequency (for example, 1 KHz). A sign of 15n is given to the filter. Reference numeral 16 denotes a time counter for measuring time for controlling the operation of the DSP circuit 13.
[0027]
The basic principle of creating extended information by this audio device will be described. A recording medium for which extension information is desired to be added is set in the player 11 or 12 and reproduced. Then, when digital audio data is reproduced by the player 11, the output of the player 11 is directly input to the filter 15. Further, when analog audio data is reproduced by the player 12, A / D The audio data is converted into digital audio data by the converter 14 and input to the filter 15.
[0028]
By the way, when adding the extended information, it is preferable to set in advance the time for audio data detection and analysis. For example, in one case, the entire audio data (or one movement) is subject to detection analysis, and in other cases, within a certain time immediately after the start, within a certain time after the start of a predetermined time, and then Only data within a certain period of time after a predetermined time has passed is targeted for detection analysis.
[0029]
For example, when all audio data for one song is subject to detection and analysis, if one song (or one movement) is a classic, it takes too much time to add extended information. For example, in the case of pop songs, pop songs, all songs are subject to data detection analysis and more accurate expansion information The The appropriate detection and analysis target varies depending on the genre, as it is good to add it, but it is preferable that it can be selected according to the user's intuition and experience. For example, in the case of a user who never listens to a song (or one movement) that has a long time, such as a classic, all the songs and movements may be detected and analyzed, and a user who listens to a lot of classics. For this, the other cases above may be selected.
[0030]
In the audio data detection time zone, the filter 15 is set in advance each time a predetermined time [for example, 1 second (1 s)] counted by the time counter 16 has elapsed with respect to the input audio data. A signal of the frequency component is output for each of the plurality of frequencies. FIG. 2 shows an example of an output level detection mode for a certain frequency. In this example, the output level of each band-pass filter 151 to 154 of the filter 15 at intervals of 1 second (1 s). of Writing to the RAM 3 is performed. Then, the data written in the RAM 3 is analyzed to determine the genre of the audio data.
[0031]
FIG. 3 shows an example of output level storage. In the figure, the left end is the time t1, t2,... Tx (in this example, every 1 second measured by the time counter 16. However, the present invention is not limited to this, for example, every 0.1 second, There may be various time intervals, such as every 0.5 seconds), and the first frequency, second frequency, third frequency, and fourth frequency at each time t1, t2,. This shows the level (output level) of the frequency signal component. The level is expressed in the form of a digital signal of several bits and stored in the RAM 3.
[0032]
The storage in the RAM 3 is performed by clarifying the correspondence between each time t and the signal component for each frequency at each time t. In this case, the number of bits of the output level is stored in the ROM 2 as one of the detection conditions when the detection condition is managed by software. Therefore, it is not necessary to write and set in the RAM 3.
Next, various types of output level data for each frequency at each time point t1, t2,... Tx stored in the RAM 3 shown in FIG. 4A to 4F show detection data storage examples of each item.
[0033]
FIG. 4A shows an example of storage of the total count number (number of outputs), and stores the total number of times the frequency component signal is generated for each of the first to fourth frequencies. For example, in the detection target time zone, for the first frequency, the number of times of output of x times (number of times of data detection) from t1 to tx is counted, and the total number of times is the total output for the first frequency. Count as a count. The second and subsequent frequencies are similarly counted and the total output count is stored. And it makes it one of the materials for genre determination.
Whether or not there is an output at each time point t is determined based on whether or not the output level exceeds the reference level. If the reference level does not exceed the reference level, there is no output and the total count is not added. This is because a component at a certain frequency is not 0, but it is not appropriate to count even a very low level that should be ignored.
[0034]
It is also possible not to count levels outside a predetermined range (a range in which an upper limit and a lower limit are determined). In this way, an abnormally high level signal can be ignored. For example, the detection range under Limit to 100, Up When the limit is set to 111, if the output level is 100 to 111, it is counted as having an output, and otherwise, it is not counted as having no output. In this way, low-level items that should be ignored or abnormally high noises and errors that should be determined can be removed from the determination target. The condition of having such an output is written in advance in the ROM 2 as one of detection conditions when managed by software.
[0035]
By the way, a plurality of reference levels or allowable ranges are prepared even at the same frequency, and the total output count is X1 at this reference level or range, and the total output count is X2 at another reference level or range. You may make it acquire the correct data. This is because it is possible to grasp the tendency regarding the frequency of the audio data in more detail. However, in this embodiment, one allowable range is set for one frequency.
[0036]
FIG. 4B shows an example of storing the average time of output intervals (time intervals). The average time of the output interval is the time difference between the time point when the output is present and the time point when the next output is present, that is, the average value for the output interval is obtained for each frequency (first to fourth frequencies). The average time of the output interval time for each frequency is also one of the genre determination materials. As shown in FIG. 4A, also in FIGS. 4B to 4E, the leftmost block is for the first frequency, and the rightmost block is for the second frequency. The right block shows the storage area for the third frequency, and the rightmost block shows the storage area for the fourth frequency.
[0037]
FIG. 4C shows an example of storing the standard deviation of the output interval. As shown in the figure, the standard deviation of the output interval is stored for each frequency. As a result, the variation in the generation interval of the detected output (output having the condition that there is an output) can be understood for each frequency. As will be described later, when this is out of the allowable range, the priority described later for the data of the average value of the output interval is reduced at a predetermined rate.
FIG. 4D shows an example of storing the average value of the output time obtained by the time counter 16 when the output continues when the output is continuously generated. Specifically, for example, for a certain frequency, when t1 and t2 do not have an output, when t3, t4 and t5 are continuously detected, and when there is no output at t6, t3, t4, The time (for example, 3 × 1 second) obtained by multiplying three times t5 by the time interval is the output time. Then, for each frequency, an average value of the output times is obtained and used as one of genre determination materials.
[0038]
FIG. 4E shows an example of storing the standard deviation of the output time described above, whereby it becomes possible to recognize variations in the output time. As will be described later, when the standard deviation of the average value of the output time is out of the allowable range, the priority set for the data of the average value of the output time is reduced at a predetermined rate. .
FIG. 4F shows an example of storing the playback time, and stores the playback time for which audio data is subject to detection analysis in order to create extended information.
3 and 4A) to (E) are all stored in the RAM 3. These data serve as materials for genre determination.
[0039]
Next, various detection conditions and comparison criteria necessary for genre determination from the above data will be described. By reproducing audio data, various data as genre determination materials are created from the data as described above. On the other hand, detection conditions for comparing the genre from the data and comparison reference data are determined by the audio equipment manufacturer. It must be prepared and stored in the ROM 2, for example.
The data stored as the detection condition includes a time interval at which the signal component for each frequency is taken in by the time counter 16, the detection time zone (start time and end time) at which the signal component is taken in, and each detection frequency (for example, 50 Hz, 100 Hz, 400 Hz, 1 KHz), the number of bits of the output level, a level condition for determining that there is an output, and the like.
[0040]
FIG. 5 shows one example of storing detection conditions for each item. In this example, from 1 minute to 2 minutes after the start of playback is detected at 1 second intervals (therefore, the number of detections is 60 times), there are four types of detection frequencies, the first frequency is 50 Hz, the second frequency Is 100 Hz, the third frequency is 400 Hz, the fourth frequency is 1 KHz, the number of output bits is 3 bits, and the level range in which output is present is “100” to “111”.
[0041]
FIG. 6 shows an example of storing data indicating an allowable range for various types of detection data belonging to a certain genre (for example, “pops”). As shown in the figure, first, there is an area for storing genre names, and each detection frequency (50 Hz, 100 H). z , 400 Hz, 1 KHz), an allowable range regarding the total count, the output interval average time, the output interval standard deviation, the output average time, and the output average time standard deviation is specified by indicating the lower limit and the upper limit. The data indicating the allowable range for the data of various items as shown in FIG. 6 is prepared for each of other genres such as male vocals, female vocals, classics, rock, jazz, popular songs, folk songs, etc. However, the contents are different. This data is set for each genre after grasping the total count, output interval average time, output interval standard deviation, output average time, output average time standard deviation characteristics and trends for many audio data by genre. And, it is stored in the ROM 2 and shipped.
[0042]
As for the allowable range of the total count number, the total count number may not be stored as it is, but may be stored instead of the total count number / detection count (x in tx). This is because the number of times of detection (detection) may not be fixed by the time counter 16 every time a fixed time elapses. For example, when the entire song (or one movement) is to be detected, the number of times of detection is naturally different because the playback time of the song is different. Therefore, if the number of detections is different, it is meaningless to ignore the case and evaluate the total count. Therefore, in such a case, the total count number is not stored as it is, but the total count number / detection count (x in tx) is stored instead of the total count number. For example, if the number of detections is 60 and the total count is 48 lower limit, and the total count is 60 upper limit, 0.8 is set as the lower limit. As 1.0 is stored.
[0043]
Of course, when the number of times of detection is fixed, it goes without saying that the lower limit and the upper limit of the total count number may be stored as they are. In this case, for example, in the above example, the lower limit is stored as 48 and the upper limit is stored as 60, and when 40 to 60 is within the allowable range, 40 is stored as the lower limit and 60 is stored as the upper limit. .
In addition, regarding the allowable range of the output interval average time and the output average time, for example, the lower limit and the upper limit are represented by multiples of the detection time interval. For example, when the lower limit is 3 and the upper limit is 8, 3 to 8 seconds is the allowable range. become. When it is within the allowable range, the detected data and the comparison reference data match, and the priority set for the item (to the item for each frequency) is added.
In addition, regarding the standard deviation for each of the output interval average time and the output average time, the allowable range is specified by indicating an upper limit and a lower limit, and the case where the standard deviation is within the allowable range and outside the allowable range is described later. The value of the conforming value to be left is the same or the value obtained by subtracting it is different.
[0044]
Furthermore, the priority (weight) between the data items, that is, the total count, the output interval average time, the output interval standard deviation, the output average time, and the output average time standard deviation can be set. Also, the priority (weight) between the detection frequencies (the first to fourth frequencies in this example) may be set between the same data items.
These data shown in FIG. 6 and the data related to the priority between the data items need not be described again, but are set in advance by the audio equipment manufacturer and stored in the ROM 2.
[0045]
Therefore, how to determine the genre by comparing the data shown in FIG. 4 with the data shown in FIG. 6 will be roughly described. The determination is whether the data shown in FIG. 4 is within an allowable range for each data item for each detection frequency, and the suitability is quantified according to its priority and standard deviation. The numerical value is added and the degree of conformity in the genre is calculated for each genre. value The genre that has become larger is set as the genre to which the audio data belongs, and the genre can be automatically recorded in the HDD 4 together with the audio data as extended information.
[0046]
However, fit value A plurality of genres may be displayed together with their corresponding values in descending order, and the genre selected by the user may be used as the genre, and the genre may be stored in the HDD 3 together with the audio data. Also the biggest fit value That fits the genre of value However, if the preset reference value is not reached, it can be said that the genre is quite difficult to specify, so the genre may be displayed as “unknown” or “other”. .
[0047]
FIG. 7 and FIG. 8 show an example of the comparison condition, and an example of the determination process will be briefly described using this as an example. In this example, in order to simplify the assumption and make it easy to understand, there are only three types of detection data, genre A, genre B, and genre C, as shown in FIG. 9, three detection frequencies, and a time counter. The controlled detection time interval is 0.1 seconds, the number of detections is fixed, 1000 times, and the items to be compared are only the total count number, the average time of the output interval, and the average time of the output interval. Standard of average time and average time of output interval side The difference was not shown. In this example, each standard side The difference shall be within the allowable range. Assuming that such a comparison condition is set, for example, when data of each item of audio data as shown in FIG. 9 is detected, how it is determined will be described.
[0048]
In the case of genre A, with respect to the total count number, the first frequency is within the allowable range (the allowable range is 100 to 400 times, and the actual number is 300 times). Is in the calculation. The second frequency is within the allowable range (the allowable range is 0 to 100 times and the actual number is 50 times). Therefore, the priority is 10% in this point. There is no condition for the third frequency, and the priority is not originally calculated.
Regarding the output interval (average value thereof), the first frequency is within the allowable range (the allowable range is 0 to 7 seconds and the actual is 2 seconds). Therefore, the priority is 20% for this point. Get into the calculation. The second frequency is not within the allowable range (the allowable range is 2 to 10 seconds and the actual is 15 seconds), and therefore a priority of 10% is not included in this calculation. Further, there is no condition for the third frequency, and the priority is not originally calculated.
[0049]
Further, regarding the output time (average value thereof), the first frequency is within the allowable range (the allowable range is 3 to 8 seconds and the actual is 5 seconds). Therefore, the priority is 40% for this point. Enters the calculation. The second frequency is also within the allowable range (the allowable range is 0 second to 4 seconds, and the actual is 2 seconds). Therefore, a priority level of 5% is calculated for this point. Further, there is no condition for the third frequency, and the priority is not originally calculated.
Therefore, the sum of the priorities for this genre A is 20 + 10 + 40 + 5 = 95%. This is a fitness value representing the fitness level for genre A.
If the same adaptation value detection process is performed for genre B, the adaptation value is 10 + 10 + 35 = 55%, and if it is performed for genre C, the adaptation value is 15 + 10 + 10 + 10 = 45%. Therefore, when the matching values of the genres A to C are compared, the matching value of the genre A is the highest.
[0050]
Therefore, the genre A is determined as the genre of the audio data (the audio data from which the detection data is obtained as shown in FIG. 9), and the audio data is recorded on the HDD 4 together with the extended information indicating the genre A. Then, when viewing a list of audio data recorded in the HDD 4 later, the extended information is displayed on the display 10 as at least one of the recognition items for the audio data, and for example, a line having the extended information is designated. The audio data to be reproduced can be specified by confirming.
The genre is displayed on the display 10 together with a plurality of genres and the matching values in order from the highest matching value, and the user is allowed to recognize the matching values of the plurality of genres. However, the user may exceptionally be able to set another genre by operating the user.
[0051]
In this case, for example, genre A is 95%, genre B is 55%, and genre C is 45%. In principle, genre A is set as the genre of the audio data. Can be set as the genre of the audio data. In the above example, the average time of the output interval and the standard of the average time of the output side The difference was assumed to be within an acceptable range. But standard side In some cases, the difference is outside the allowable range. In this case, the priority (%) is multiplied by a predetermined decimal number (for example, 0.8), and the product (for example, the average time of the output interval) is obtained by the multiplication. Alternatively, the adaptation value is calculated as the priority (%) of the average time of output.
[0052]
In the above example, the average value of the output interval of the genre A in the above example is 0 second and the upper limit is 7 seconds in the case of the first frequency, and the actual value 2 seconds falls within the allowable range. The priority 20% enters into the calculation of the fitness value. If the standard deviation of the average time of the output interval is outside the allowable range, a predetermined decimal number (for example, 0.8) is set to the priority 20%. Is multiplied by (substantial subtraction), and the value after the multiplication, for example, 16% is set as the priority, and the adaptation value is calculated.
[0053]
The same applies to the average output time. side When the difference is outside the allowable range, a predetermined decimal number (for example, 0.8. However, other values may be used. Also, the same value as the decimal number when the average time of the output interval is outside the allowable range of the standard deviation. The priority of the item is multiplied, and the value after the multiplication is used to calculate the fitness value as the priority of the item. The above explains the principle of genre determination in the present embodiment.
[0054]
Next, the operation for actual determination will be described with reference to the flowcharts shown in FIGS. FIG. 10 (A) shows the entire flow showing this comparison determination process, FIG. 10 (B) shows a specific flow of comparison and adaptation value calculation in the flow shown in (A), and FIG. 11 (A). FIG. 11A shows a specific flow of the automatic mode processing in the flow shown in FIG. 10A, and FIG. 11B shows a specific flow of the manual mode processing.
First, the overall flow of the comparison determination process will be described first with reference to FIG.
[0055]
As described above, it is assumed that the ROM 2 stores data fixed in advance regarding the detection frequency and other detection conditions, items, the order of comparison genres, and the like as described above. The automatic / manual mode is set before the comparison determination process is started. Here, the automatic mode is a mode in which extended information is automatically added to the audio data, and the manual mode is a mode for adding extended information, asking whether or not to add the extended information, and manually changing the extended information. Alternatively, it is a mode that allows it to be added. In addition, it is assumed that the time zone for detection and analysis of audio data is also set or designated manually.
[0056]
(1) “Comparison and conformity calculation processing”
When the flow starts, first, a comparison process is performed for a certain genre from the detection data (data shown in FIG. 4), the matching value is obtained, and it is written in the RAM 3. A specific flow of this processing is shown in FIG. 11A, and details thereof will be described later. It should be noted that the order of the genres to be compared in this process is set in advance, for example, genre A, genre B, genre C,... A comparison process and a matching value calculation process are performed for genre A.
[0057]
(2) “All genres complete?”
It is determined whether or not the processing of step (1) has been completed for all genres for which processing such as comparison is performed.
(3) “Genre switching”
If the determination result in step (2) is No, in other words, if there is a genre where the process in step (1) is not performed, the various comparison conditions for performing the process in step (1) are as follows. A process for switching to a genre is performed. Then, when the switching of the conditions and the like is finished, the comparison in step (1) and the adaptive value calculation process are performed. That is, the comparison and matching value calculation processing for the next genre is performed. The flow of steps (1) to (3) is repeated until the processing of step (1) is completed for all genres.
[0058]
(4) “Mode judgment”
If the determination result of step (2) is Yes, in other words, if the process of step (1) is completed for all genres, the mode determination as to whether the automatic mode or the manual mode is set by the operation. Do.
(5) "Processing for automatic mode"
If the determination result in step (4) is “automatic mode”, automatic mode processing is performed. The specific contents are shown in FIG. 11A, which will be described later with reference to FIG.
[0059]
(6) “Manual mode processing”
If the determination result in step (4) is “manual mode”, the manual mode process is performed. The specific contents are shown in FIG. 11B, which will be described later with reference to FIG.
(7) "Add extended information"
After the step (5) or (6) is completed, the determined extension information to be added is recorded in the HDD 4 as accompanying the audio data.
Thereafter, this flow ends.
[0060]
Next, the comparison and matching value calculation processing in step (1) will be described with reference to FIG. This flow uses A / D The comparison reference data prepared by the converter manufacturer is used as a reference, and the matching value is calculated based on the comparison result. The order of items to be compared is set in advance. The order is such that the first count, the second frequency, the third frequency, and the fourth frequency are compared in the order of the total count, and then the average frequency of the output intervals is the same frequency. In this order, the order is as shown in FIG.
[0061]
(8) “Within tolerance”
First, it is detected whether or not the detection data for one item is within the allowable range set by the comparison reference data.
(9) “Switching comparison conditions”
When the determination result of step (8) is No, the comparison condition is switched so that the process of step (8) is performed for the next item. After that, the process (“within allowable range?”) Is performed for the new item in step (8).
[0062]
(10) “Does standard deviation exist?”
Next, when the determination result in step (8) is Yes, it is determined whether or not the comparison condition for which the process “within an allowable range?” Is performed is a comparison condition accompanied by a standard deviation. The comparison condition not accompanied by the standard deviation includes the total count number shown in FIG. 4A. Therefore, when the comparison condition is the total count number, the determination result of this step (10) is No. Further, the comparison condition accompanied by the standard deviation includes the average time of the output interval shown in FIG. 4B and the average time of the output shown in FIG. 4D. Therefore, the comparison condition is any one of the comparison conditions. In this case, the determination result of this step (10) is Yes.
[0063]
(11) “Within tolerance”
When the determination result in the above step (10) is Yes, that is, the standard deviation (average time of output interval or average time of output) associated with the comparison condition in which it was determined whether or not it is within the allowable range in step (8). Is determined to be within the allowable range.
(12) "Priority subtraction"
When the determination result in step (11) is No, that is, when the standard deviation is outside the allowable range, the priority for the comparison condition accompanied by the standard deviation itself is substantially multiplied by a preset decimal. Subtract priority. For example, if the first frequency of the average time of the output interval is within the allowable range, the priority is 20%, but the standard deviation of the average time of the output interval is within the allowable range. Outside If so, the priority is subtracted from 20% × 0.8 = 16%, and this is used for the calculation of the fitness value.
[0064]
(13) “Compliance value calculation”
When the determination result of step (10) is No, when the determination result of step (11) is Yes, or when the process of step (12) is completed, the priority for the comparison condition is added. This can be done, for example, by adding the priority to the register for calculating the adaptive value every time the priority for each comparison condition is determined. In addition, when the determination result of step (10) is No and when the determination result of step (11) is Yes, the preset priority is used for the adaptation value calculation as it is, but the priority is determined in step (12). Is subtracted, the priority of the reduced value is used for calculation of the fitness value.
[0065]
(14) “End of all comparison conditions?”
When the process of step (13) is completed, it is determined whether or not the process of all the comparison conditions for the genre (the genre for which the current comparison and matching value calculation process is being performed) has been completed. If this determination result is No, the process returns to step (9).
And if this determination result is Yes, it means that the comparison and the adaptation value calculation processing are temporarily ended. Then, the priority addition result (integrated value) at this time is an appropriate value for the genre.
[0066]
Next, the “automatic mode process” in step (5) of FIG. 10A will be described with reference to FIG.
(15) “Find the largest fit value”
When the determination result of the automatic mode is obtained in the mode determination in the above step (5), the automatic mode process is performed. This process is first performed from the compliant values of each genre stored in the RAM 3. Find a large fit value.
(16) “Is greater than a predetermined value?”
It is determined whether or not the largest fit value found in step (15) is greater than a predetermined value (minimum reference fit value). We found the genre for each genre, and we were able to recognize the genre with the maximum fit value, but if that value is not so large, it can be said that the reliability of genre determination is low (possibly other genres) In such cases, it can be said that the decision should be withheld. Therefore, in order to allow the genre determination to be reserved when the minimum standard conformance value necessary for clearly determining the genre is set as a predetermined value and the maximum conformance value is lower than that, this step (16 ), It is determined whether or not the maximum fitness value is larger than a predetermined value (minimum standard fitness value).
[0067]
(17) “Determined as maximum fit value genre”
If the determination result in step (16) is Yes, the genre of the audio data is determined as the genre having the maximum matching value.
(18) “Other (or unknown) and genre determination”
When the determination result of the above step (16) is No, a specific genre is not determined, and other (or unknown) is set. As a result, the user can be notified that automatic genre determination has failed.
[0068]
Next, the “manual mode process” in step (6) of FIG. 10B will be described with reference to FIG.
(19) “Find the largest fit value”
When the determination result of the manual mode is obtained in the mode determination of the step (6), the manual mode process is performed. This process is first performed from the adaptation values of each genre stored in the RAM 3. Find a large fit value.
(20) “Is greater than a predetermined value?”
It is determined whether or not the largest fit value found in step (19) is greater than a predetermined value (minimum reference fit value). The reason for providing such a determination step is as described above.
[0069]
(21) “Determined as Other (or Unknown)”
When the determination result of the above step (20) is No, the specific genre is not determined and the genre is determined as other (or unknown).
(22) “Indication of other (or unknown)”
After that, display “other” (or unknown), respond to it (possible), cancel the addition of extended information (cancel), or ask for the determination of the genre until you are tired without following the other (or unknown) determination (no) Prompt the user for instructions. It should be noted that the display is not limited to simply indicating other (or unknown), but specifically lists the contents of the options (in this case, there are three), and further prompts the user to indicate one of them. Further, an operation method for instructing may be shown.
[0070]
(23) “Instruction content determination”
When an instruction is given in response to the above display, the contents of the instruction are determined. If the determination result is cancellation, the audio data is terminated without adding extension information. If the determination result is acceptable, the process proceeds to step (7) in FIG. 1A, and the genre is added as “other (or unknown)” as extended information for the audio data.
(24) “Genre decision”
If the determination result in step (20) is No, if the determination result in step (23) is negative, or if step (27) described later is completed, the genre is determined.
The genre is determined when the determination result in step (20) is No, or when the determination result in step (23) is negative, the genre having the largest fitness value is selected [by step (19). Is done. In addition, when step (27) to be described later is completed, the genre is determined as the next largest genre.
[0071]
(25) “Genre display”
Display the genre determined in step (24) and respond (can) or cancel the addition of extended information (cancel), or find out which genre has the next highest fit value without following that genre determination. Prompt the user's instructions on (No). Note that the display is not limited to the determined genre, but specifically lists the contents of the options (in this case, there are three), and further prompts the user to indicate one of them. May indicate an operating method for instructing.
(26) “Instruction content determination”
When an instruction is given in response to the above display, the contents of the instruction are determined. If the determination result is cancellation, the audio data is terminated without adding extension information. If the determination result is acceptable, the process proceeds to step (7) in FIG. 10A. The audio data is determined as extended information in step (24), and the genre displayed in step (25) is It is added as extension information to the audio data.
[0072]
(27) “Find the next best fit value”
If the determination result in step (26) is negative, the next largest fitness value is obtained. When this step (27) ends, the process proceeds to step (24), where the genre is determined as the genre of the appropriate value, and in step (25), the genre is displayed and prompted.
If the user is still dissatisfied with the genre determination and the prompted instruction is negative, the genre having the next larger (next next size) fitness value is selected. That is, by repeating the instruction of “no”, a genre having a smaller fitness value is determined and displayed.
[0073]
When finding the next largest fit value in this way, instead of erasing the larger genre, leave it behind so that multiple genres can be found, or the size of the fit value is large. It is also possible to display the order so that the order can be understood, and when an instruction is given, a plurality of genres may be added to the audio data as extension information along with the magnitude or the order of magnitude.
[0074]
【The invention's effect】
According to the audio device of the present invention, the comparison reference data is stored in advance for each of a plurality of genres, and the audio data and the comparison reference data are compared with the audio data when the audio data is reproduced. The Done and that Comparison result Fit by genre value Seeking its fit value Since the size of the genre is an element of genre determination, each audio data And The degree of fitness of can be grasped by numerical value. Accordingly, it is possible to automatically determine an objective genre, and further, it is possible to automatically add extended information about the genre.
[0075]
According to the audio device of the present invention, the audio data T A plurality of signal components having different frequencies are detected at a certain detection time interval, and the level of the signal component is within an allowable range (there is an allowable range having a lower limit and an upper limit, and an allowable range having only a lower limit). If the signal component of that frequency at the time of detection is output, that is, the output is present, number, Grasping by specific and objective numerical values such as average time of output interval and average value of output time, and comparing with a comparison criterion set in advance for each genre, calculate a genre compatible value . Therefore The possibility that the reproduced digital audio data is the genre can be numerically expressed for each genre, and further, the genre can be objectively automatically set by comparing the numerical values.
[0076]
According to the audio device of the present invention, the audio data T , For each of a plurality of frequencies, there is a signal component of that frequency, that is, an output circuit in which output is considered to be present. number, As additional data used to calculate the appropriate value when grasped by specific and objective numerical values such as the average time of the output interval and the average value of the output time and within the allowable range set in advance for each frequency of each item Since the adaptation value of each genre is obtained based on the value indicating the priority indicating the weight, and then the genre of the audio data is determined, the genre can be determined more objectively and accurately. it can.
[0078]
The present invention According to audio equipment , Since the genre with the largest conforming value is used as the genre of the audio data, the most likely genre of the audio data can be determined as the extended information indicating the genre, and the possibility of determining the exact genre. Can be made high.
[0079]
The present invention According to audio equipment , When there is no genre whose conforming value exceeds the preset minimum reference allowable value, that is, when it is difficult to sufficiently improve the accuracy of genre determination, no genre is specified, and information indicating that it is not specified Since the information is recorded as extended information, it is possible to prevent the extension information having the genre of the audio data from being added with the genre having low determination accuracy.
[Brief description of the drawings]
FIG. 1 is a circuit block diagram showing an outline of a configuration of a first embodiment of an audio apparatus of the present invention.
FIG. 2 shows an example of an output level detection mode for a certain frequency in the embodiment.
FIG. 3 shows an example of output level storage in the embodiment.
FIGS. 4A to 4F show examples of detection data storage for each item in the embodiment.
FIG. 5 shows one example of storing detection conditions for each item in the embodiment.
FIG. 6 shows an example of storing data indicating an allowable range for detection data of each item belonging to a certain genre (for example, “pops”) in the embodiment.
FIG. 7 is a diagram illustrating a part of an example of comparison conditions for each item in the embodiment.
FIG. 8 is a diagram illustrating the remainder of an example of comparison conditions for each item in the embodiment.
FIG. 9 is a diagram showing an example of detection data used for explanation of matching value calculation in the embodiment.
FIG. 10A shows the entire flow showing this comparison determination processing, and FIG. 10B shows a specific flow of comparison and adaptation value calculation in the flow shown in FIG.
11A shows a specific flow of the automatic mode processing in the flow shown in FIG. 10A, and FIG. 11B also shows a specific flow of the manual mode processing.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 ... CPU, 2 ... ROM, 3 ... RAM, 4 ... HDD (storage process), 6 ... Audio signal generation circuit, 10 ... Display, 11 ... Digital audio data Reproduction machine (player), 12... Analog audio data reproduction machine (player), 13... DSP section.

Claims (8)

オーディオデータを所定の周波数帯域ごとにわけ、所定の検出時間毎に所定時間それぞれの前記周波数帯域について出力レベルを検出し、前記周波数帯域ごとの出力レベルが予め設定された範囲にあるかを判定するレベル判定手段と、
前記周波数帯域ごとの出力レベルが予め設定された範囲内にあると前記レベル判定手段が判定した回数の総数に基づくデータである回数データと、前記周波数帯域ごとの出力レベルが予め設定された範囲内にあると前記レベル判定手段が判定した各時点の時間間隔の平均値である出力間隔平均値データと、前記周波数帯域ごとの出力レベルが予め設定された範囲内にあると前記レベル判定手段が連続して判定した時間の平均値である出力時間平均値データとを、前記オーディオデータの特徴データとして検出する検出手段と、
複数のジャンルごとに、前記回数データと前記出力間隔平均値データと前記出力時間平均値データを表す所定の値を基準データとして記憶する記憶手段と、
前記検出手段により検出された前記特徴データを前記基準データと比較し、比較結果に基づいて最適なジャンルを判定するジャンル判定手段と、
前記オーディオデータと前記最適なジャンルとを関連付けて前記記憶手段に記憶させる記憶制御手段と
を有することを特徴とするオーディオ機器。
Audio data is divided into predetermined frequency bands, the output level is detected for each frequency band for a predetermined time every predetermined detection time, and it is determined whether the output level for each frequency band is within a preset range. Level judging means;
Number-of-times data, which is data based on the total number of times that the level determination means determines that the output level for each frequency band is within a preset range, and the output level for each frequency band is within a preset range If the output interval average value data, which is the average value of the time intervals at each time point determined by the level determination means, and the output level for each frequency band are within a preset range, the level determination means continues. Detecting means for detecting, as characteristic data of the audio data, output time average value data that is an average value of the time determined in the above;
Storage means for storing a predetermined value representing the number-of-times data, the output interval average value data, and the output time average value data as reference data for each of a plurality of genres;
A genre determination unit that compares the feature data detected by the detection unit with the reference data and determines an optimum genre based on a comparison result;
Storage control means for associating the audio data and the optimum genre with each other and storing them in the storage means;
An audio device comprising:
前記基準データを表す前記回数データ、前記出力間隔平均値データ及び前記出力時間平均値データにはそれぞれ所定の優先度が記憶されており、
前記ジャンル判定手段は前記優先度に基づいて最適なジャンルを判定することを特徴とする請求項記載のオーディオ機器。
A predetermined priority is stored in each of the number-of-times data representing the reference data, the output interval average value data, and the output time average value data,
The genre determining unit, wherein the determining the optimum genre on the basis of the priority claim 1 Audio equipment according.
前記回数データ、前記出力間隔平均値データ及び前記出力時間平均値データの前記優先度はそれぞれ所定の適合値によって表され、
前記ジャンル判定手段は、前記検出手段により検出された前記特徴データの前記回数データ、前記出力間隔平均値データ及び前記出力時間平均値データがそれぞれ、前記基準データの前記回数データ、前記出力間隔平均値データ及び前記出力時間平均値データの範囲内であると判定されたとき、前記記憶手段に記憶された当該基準データの前記回数データ、前記出力間隔平均値データ、前記出力時間平均値データに対応する前記適合値をジャンルごとに加算し、前記適合値の合計が高いジャンルを前記オーディオデータの最適なジャンルとすることを特徴とする請求項記載のオーディオ機器。
The priorities of the frequency data, the output interval average value data, and the output time average value data are each represented by a predetermined fitness value,
The genre determining means includes the number-of-times data, the output interval average value data, and the output time average value data of the feature data detected by the detection means, respectively, the number-of-times data of the reference data, and the output interval average value When it is determined that it is within the range of the data and the output time average value data, it corresponds to the number-of-times data, the output interval average value data, and the output time average value data of the reference data stored in the storage means the adaptation value is added to each genre, the characterized total high genre adaptation value to the optimum genre of the audio data, according to claim 2 audio equipment according.
前記記憶制御手段は、前記適合値の合計として最低限必要な値である最低適合値を記憶手段にさらに記憶させ、
前記ジャンル判定手段は、前記適合値の合計が前記最低適合値を越えるジャンルがないとき、前記オーディオデータについてジャンルを特定しないことを特徴とする請求項記載のオーディオ機器。
The storage control means further causes the storage means to further store a minimum fitness value that is a minimum required value as a sum of the fitness values,
4. The audio device according to claim 3 , wherein the genre determination unit does not specify a genre for the audio data when there is no genre whose total of the adaptation values exceeds the minimum adaptation value .
前記記憶制御手段はオーディオデータを判定するための判定情報をオーディオデータと関連付けて記憶手段に記憶させるものであり、The storage control means stores determination information for determining audio data in the storage means in association with the audio data,
前記判定情報と共に前記判定情報に関連付けられたオーディオデータに関連するジャンルを表示させる表示制御手段をさらに有することを特徴とする、請求項1記載のオーディオ機器。2. The audio device according to claim 1, further comprising display control means for displaying a genre related to audio data associated with the determination information together with the determination information.
前記記憶制御手段は、前記表示制御手段により表示されたジャンルのうち操作入力に基づいて選択された少なくとも一つのジャンルをオーディオデータと関連付けてさらに記憶させることを特徴とする、請求項5記載のオーディオ機器。6. The audio according to claim 5, wherein the storage control unit further stores at least one genre selected based on an operation input among the genres displayed by the display control unit in association with audio data. machine. オーディオデータを所定の周波数帯域ごとにわけ、所定の検出時間毎に所定時間それぞれの前記周波数帯域について出力レベルを検出し、前記周波数帯域ごとの出力レベルが予め設定された範囲にあるかを判定するステップと、
前記周波数帯域ごとの出力レベルが予め設定された範囲内にあると判定した回数の総数に基づくデータである回数データと、前記周波数帯域ごとの出力レベルが予め設定された範囲内にあると判定した各時点の時間間隔の平均値である出力間隔平均値データと、前記周波数帯域ごとの出力レベルが予め設定された範囲内にあると連続して判定した時間の平 均値である出力時間平均値データとを、前記オーディオデータの特徴データとして検出するステップと、
予め記憶手段に基準データとして記憶されている、複数のジャンルごとに前記回数データと前記出力間隔平均値データと前記出力時間平均値データを表す所定の値と、検出した前記特徴データとを比較し、比較結果に基づいて最適なジャンルを判定するステップと、
前記オーディオデータと前記最適なジャンルとを関連付けて前記記憶手段に記憶させるステップと、
を含むことを特徴とするオーディオデータの管理方法。
Audio data is divided into predetermined frequency bands, the output level is detected for each frequency band for a predetermined time every predetermined detection time, and it is determined whether the output level for each frequency band is within a preset range. Steps,
Number-of-times data that is data based on the total number of times that the output level for each frequency band is determined to be within a preset range, and that the output level for each frequency band is determined to be within a preset range an output interval average data is the average value of the time interval of each time point, the frequency band for each of the output level preset time is determined continuously to be within the scope average values in the form of the output time average value Detecting data as characteristic data of the audio data;
Comparing the detected characteristic data with the predetermined value representing the number-of-times data, the output interval average value data, and the output time average value data stored in advance as reference data in the storage means. Determining an optimal genre based on the comparison result;
Storing the audio data and the optimum genre in the storage means in association with each other;
A method for managing audio data, comprising:
コンピュータに、On the computer,
オーディオデータを所定の周波数帯域ごとにわけ、所定の検出時間毎に所定時間それぞれの前記周波数帯域について出力レベルを検出し、前記周波数帯域ごとの出力レベルが予め設定された範囲にあるかを判定するレベル判定手段と、  Audio data is divided into predetermined frequency bands, the output level is detected for each frequency band for a predetermined time every predetermined detection time, and it is determined whether the output level for each frequency band is within a preset range. Level judging means;
前記周波数帯域ごとの出力レベルが予め設定された範囲内にあると前記レベル判定手段が判定した回数の総数に基づくデータである回数データと、前記周波数帯域ごとの出力レベルが予め設定された範囲内にあると前記レベル判定手段が判定した各時点の時間間隔の平均値である出力間隔平均値データと、前記周波数帯域ごとの出力レベルが予め設定された範囲内にあると前記レベル判定手段が連続して判定した時間の平均値である出力時間平均値データとを、前記オーディオデータの特徴データとして検出する検出手段と、  Number-of-times data, which is data based on the total number of times that the level determination means determines that the output level for each frequency band is within a preset range, and the output level for each frequency band is within a preset range If the output interval average value data, which is the average value of the time intervals at each time point determined by the level determination means, and the output level for each frequency band are within a preset range, the level determination means continues. Detecting means for detecting, as characteristic data of the audio data, output time average value data that is an average value of the time determined in the above;
複数のジャンルごとに、前記回数データと前記出力間隔平均値データと前記出力時間平均値データを表す所定の値を基準データとして記憶する記憶手段と、  Storage means for storing a predetermined value representing the number-of-times data, the output interval average value data, and the output time average value data as reference data for each of a plurality of genres;
前記検出手段により検出された前記特徴データを前記基準データと比較し、比較結果に基づいて最適なジャンルを判定するジャンル判定手段と、  A genre determination unit that compares the feature data detected by the detection unit with the reference data and determines an optimum genre based on a comparison result;
前記オーディオデータと前記最適なジャンルとを関連付けて前記記憶手段に記憶させる記憶制御手段と  Storage control means for associating the audio data and the optimum genre with each other and storing them in the storage means;
を有することを特徴とするオーディオ機器として機能させるためのプログラム。A program for causing an audio device to function.
JP2002106389A 2002-04-09 2002-04-09 Audio equipment, audio data management method and program therefor Expired - Fee Related JP4228581B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002106389A JP4228581B2 (en) 2002-04-09 2002-04-09 Audio equipment, audio data management method and program therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002106389A JP4228581B2 (en) 2002-04-09 2002-04-09 Audio equipment, audio data management method and program therefor

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007337713A Division JP2008170991A (en) 2007-12-27 2007-12-27 Apparatus and method for processing information

Publications (3)

Publication Number Publication Date
JP2003302988A JP2003302988A (en) 2003-10-24
JP2003302988A5 JP2003302988A5 (en) 2005-09-08
JP4228581B2 true JP4228581B2 (en) 2009-02-25

Family

ID=29390724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002106389A Expired - Fee Related JP4228581B2 (en) 2002-04-09 2002-04-09 Audio equipment, audio data management method and program therefor

Country Status (1)

Country Link
JP (1) JP4228581B2 (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009510509A (en) * 2005-09-29 2009-03-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Method and apparatus for automatically generating a playlist by segmental feature comparison
US20090269029A1 (en) * 2005-10-21 2009-10-29 Kenji Ishikawa Recording/reproducing device
JP4001897B2 (en) * 2005-12-09 2007-10-31 株式会社コナミデジタルエンタテインメント Music genre discriminating apparatus and game machine equipped with the same
JP4665836B2 (en) * 2006-05-31 2011-04-06 日本ビクター株式会社 Music classification device, music classification method, and music classification program
JP4399440B2 (en) * 2006-06-30 2010-01-13 株式会社コナミデジタルエンタテインメント Music genre discriminating apparatus and game machine equipped with the same
JP4137148B2 (en) 2006-08-30 2008-08-20 株式会社バンダイナムコゲームス PROGRAM, INFORMATION STORAGE MEDIUM, AND GAME DEVICE
JP2008197199A (en) * 2007-02-09 2008-08-28 Matsushita Electric Ind Co Ltd Audio encoder and audio decoder
JP4577412B2 (en) 2008-06-20 2010-11-10 ソニー株式会社 Information processing apparatus, information processing method, and information processing program
JP6606844B2 (en) * 2015-03-31 2019-11-20 カシオ計算機株式会社 Genre selection device, genre selection method, program, and electronic musical instrument

Also Published As

Publication number Publication date
JP2003302988A (en) 2003-10-24

Similar Documents

Publication Publication Date Title
JP2003084877A (en) Information selection apparatus and music playback unit
JPH0528790A (en) Recording and reproducing device
JP3886372B2 (en) Acoustic inflection point extraction apparatus and method, acoustic reproduction apparatus and method, acoustic signal editing apparatus, acoustic inflection point extraction method program recording medium, acoustic reproduction method program recording medium, acoustic signal editing method program recording medium, acoustic inflection point extraction method Program, sound reproduction method program, sound signal editing method program
JP4228581B2 (en) Audio equipment, audio data management method and program therefor
KR100745995B1 (en) Device for managing meta data and method thereof
JP2006202127A (en) Recommended information presentation device and recommended information presentation method or the like
EP1367590A2 (en) Music recording/reproducing apparatus, list generation method, and information recording medium
WO2006087891A1 (en) Information selecting method information selecting device
JP2001266470A (en) On-vehicle reproducing unit and musical piece reproducing method
JP4475597B2 (en) Presentation data selection device, presentation data selection method, etc.
JP2008170991A (en) Apparatus and method for processing information
US20080140236A1 (en) Musical Composition Reproducing Apparatus and a Method for Reproducing Musical Composition
EP1793381A1 (en) Musical composition reproducing device, musical composition reproducing method and so forth
US7187627B2 (en) System for controlling recording and reproducing data using management information on the medium
JP2002074909A (en) Audio player
JP4244011B2 (en) Data reproduction apparatus and reproduction data management method in data reproduction apparatus
JP4905190B2 (en) Audio reproduction device, audio reproduction method, and program
JP3834488B2 (en) Playback apparatus, playback method, and program
JP2004071062A (en) Information reproducing and recording device
JP3995657B2 (en) Data processing device
JP5195879B2 (en) Music search / playback apparatus, music search / playback method, and music search / playback program
WO2007132627A1 (en) Musical composition searching device, musical composition searching method, musical composition searching program, and recording medium where musical composition searching program is recorded
JP4336362B2 (en) Sound reproduction apparatus and method, sound reproduction program and recording medium therefor
JPH0753188Y2 (en) Disk player
JP2002358726A (en) Reproducing device and reproducing method

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041102

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20050131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050318

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050318

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081111

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121212

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees