JP5098896B2 - 再生装置および再生方法 - Google Patents

再生装置および再生方法 Download PDF

Info

Publication number
JP5098896B2
JP5098896B2 JP2008219061A JP2008219061A JP5098896B2 JP 5098896 B2 JP5098896 B2 JP 5098896B2 JP 2008219061 A JP2008219061 A JP 2008219061A JP 2008219061 A JP2008219061 A JP 2008219061A JP 5098896 B2 JP5098896 B2 JP 5098896B2
Authority
JP
Japan
Prior art keywords
analysis
content
audio data
playback
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008219061A
Other languages
English (en)
Other versions
JP2010054758A (ja
Inventor
基行 高井
真哉 福田
敬 木野内
武史 小澤
晃 井上
秀介 高橋
学 内野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2008219061A priority Critical patent/JP5098896B2/ja
Priority to US12/502,332 priority patent/US20100058186A1/en
Priority to CN2009101657908A priority patent/CN101661788B/zh
Publication of JP2010054758A publication Critical patent/JP2010054758A/ja
Application granted granted Critical
Publication of JP5098896B2 publication Critical patent/JP5098896B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、例えば音声データを解析し再生可能な再生装置および再生方法に関する。
ユーザがアクセスできるコンテンツが膨大になるにつれ、特定のコンテンツを選択することが煩わしくなり、所持する全曲からランダムに曲を聴くようなスタイルが定着している。しかし、全曲からランダムに曲を聴くような場合、曲調や雰囲気もランダムに選ばれてしまうという問題がある。たとえばリラックスしたいという目的で音楽を聴いている場合は、一般に静かな曲だけが連続して再生されることが望ましい。
このような目的のために、コンテンツの曲調の解析を行い、あらかじめ類似する曲調に基づいた複数のグループに分類しておき、所定のグループの中からコンテンツをランダムに再生するシステムが提案されている。このシステムを使うことで、ユーザは一様な曲調のコンテンツを連続して再生することができる。
ソニー(登録商標)NetJuke(登録商標)のおまかせチャンネル(登録商標)、VAIO(登録商標)MusicBox(登録商標)、パナソニック(登録商標)のミュージックソムリエ(登録商標)がその例である。しかし、これらはいずれもパーソナルコンピュータや据え置きタイプの電子機器で用いられる。また、ポータブル機器で同様の機能をもつものもあるが、(ソニーエリクソン(登録商標):W595 SensMe(登録商標))、曲調の解析自体はパーソナルコンピュータ等で行っている(例えば、特許文献1参照。)。
特開2008−65905号公報(段落[0005]、図2)
しかしながら、曲などのコンテンツの曲調の解析及び分類をポータブル機器で行う場合には、ポータブル機器のCPU(Central Processing Unit)の演算負荷が大きくなる、という問題がある。また、ポータブル機器のバッテリは、その容量に制限がある。このため、コンテンツの曲調の解析及び分類をポータブル機器で行う場合には、できる限り効率よくコンテンツの曲調の解析等を行うことが求められる。
また、この分類結果と、分類結果に応じてユーザが実際に聴いた曲の印象とが異なると、ユーザが解析結果に違和感を覚えることになる。
以上のような事情に鑑み、本発明の目的は、音声データの解析を効率的に行うと共にユーザが解析結果に違和感を感じないようにすることが可能な再生装置および再生方法を提供することにある。
上記問題を解決するために、本発明に係る再生装置は、記憶手段と、判定手段と、解析手段と、分類手段と、入力手段と、再生手段とを有する。上記記憶手段は、複数の音声データを記憶する。上記判定手段は、上記記憶手段に記憶された個々の音声データの長さに基づいて上記音声データに対する解析時間区間を判定する。上記解析手段は、上記判定手段により判定された上記解析時間区間の上記音声データを解析する。上記分類手段は、解析結果に基づきそれぞれ音声データを予め定められた複数の分類項目に分類する。上記入力手段は、再生する音声データの分類項目をユーザに選択させる。上記再生手段は、上記入力手段により選択された分類項目に属する音声データを上記解析時間区間内の再生開始点から再生する。
本発明では、音声データの長さに基づいて音声データに対する解析時間区間を判定し、判定手段により判定された解析時間区間の音声データを解析するので、再生装置の演算負荷を低減し効率的に解析を行うことができる。入力手段により選択された分類項目に属する音声データを解析時間区間内の再生開始点から再生するので、再生開始点が解析時間区間に含まれ、解析結果に違和感を感じないようにすることができる。
上記判定手段は、上記音声データの長さが所定の値以上であることを判定したとき、上記音声データの長さの一部を上記解析時間区間として判定するようにしてもよい。
これにより、音声データの長さが所定の値以上であるときに、音声データの一部を解析時間区間とし、再生装置の演算負荷を低減することができる。
上記再生開始点が上記解析時間区間の解析の開始点と同じであるようにしてもよい。
これにより、音声データの再生時に、より確実にユーザが解析結果に違和感を感じないようにすることができる。
上記記憶手段に記憶された未解析の音声データの解析をユーザに促すための案内画面を表示する表示手段を更に具備するようにしてもよい。
これにより、未解析の音声データの解析をユーザに促すことができる。
上記記憶手段に記憶された複数の音声データについて、上記判定手段、上記解析手段、上記分類手段による処理を連続的に行うように制御する制御手段を更に具備するようにしてもよい。
これにより、複数の音声データを連続的に解析することができる。
上記制御手段は、上記記憶手段に記憶された全ての音声データに対する上記処理の残り時間を計算し表示するように制御するようにしてもよい。
これにより、音声データの解析中にこれらの処理が終了するまでの時間をユーザが知ることができる。
上記解析手段は、上記音声データの曲調を解析するようにしてもよい。
これにより、音声データの曲調を解析し、解析結果に応じて、音声データを分類することができる。
本発明に係る再生方法は、複数の音声データを記憶することを含む。個々の音声データの長さに基づいて上記音声データに対する解析時間区間が判定される。判定された上記解析時間区間の上記音声データが解析される。解析結果に基づきそれぞれ音声データが予め定められた複数の分類項目に分類される。再生する音声データの分類項目がユーザにより選択される。選択された分類項目に属する音声データが上記解析時間区間内の再生開始点から再生される。
本発明では、音声データの長さに基づいて音声データに対する解析時間区間を判定し、判定された解析時間区間の音声データを解析するので、演算負荷を低減し効率的に解析を行うことができる。ユーザにより選択された分類項目に属する音声データを解析時間区間内の再生開始点から再生するので、再生開始点が解析時間区間に含まれ、解析結果に違和感を感じないようにすることができる。
以上のように、本発明によれば、音声データの解析を効率的に行うと共にユーザが解析結果に違和感を感じないようにすることができる。
以下、本発明の実施の形態を図面に基づき説明する。
[再生装置の構成]
図1は本発明の一実施形態に係る再生装置のハードウェアの構成を示すブロック図である。
再生装置1は、例えばコンテンツ(例えば音声ファイル)を記録再生可能な携帯型の電子機器である。再生装置1は、CPU2、ROM3、RAM4、デコード部5、内部記憶装置6、キー入力部7、音声処理部8、音声出力部9、表示制御部10、表示部11、及び音声解析部12を備える。
CPU2は、各部を制御したり音楽等のコンテンツのデータを処理したりする。ROM3は、コンテンツの後述する解析(例えば曲調の解析)のときに用いられる解析式データや各種プログラムが記憶されている。RAM4は、例えばコンテンツデータの解析処理時のワークスペースとなる。
デコード部5は、例えばMP3(MPEG Audio Layer−3)等のフォーマットでエンコードされている音楽等のコンテンツデータをデコードする。
内部記憶装置6は、インターフェース(I/F)13を介してバス15に接続されている。内部記憶装置6は、例えば音声ファイル管理用のコンテンツデータベースが記憶されている。このコンテンツデータベースは、例えば複数の音声ファイルを含んでいる。ここで、音声ファイルとは、音声を情報として含むデータであり、例えば、楽曲、人の発生音、その他の音全般のデータである。内部記憶装置6は、インターフェース(I/F)13、バス15を介して各部との間でデータ等のやり取りが可能である。
キー入力部7は、例えばインターフェース(I/F)14等を介してバス15に接続されている。キー入力部7は、例えば電源のオンオフを切り替えるためのボタン、再生中の音量を調節するための音量調節ボタン、再生を開始するボタン、再生を停止するボタン、及び各種機能を切り替えて選択するためのボタンなどを備える。
音声処理部8は、例えばユーザによるキー入力部7の操作に応じて音声ファイルを再生するためのボタンが選択されると、内部記憶装置6に記憶されている音声ファイルを取得し音声データを処理する。音声出力部9は音声処理部8からの音声信号に基づき可聴音を出力する。
表示制御部10は、例えば音声ファイルに含まれる属性情報の1つである画像データ(ジャケットの画像データ等)を取得し、画像処理を行い、表示部11に画像信号を出力する。表示部11は、表示制御部10からの画像信号に基づき画像を表示する。
音声解析部12は、個々の音声ファイルを、例えば曲調等に応じた分類項目としてのグループ(チャンネル)に分類するために、後で詳述するように音声ファイルの解析を行う。
図2は再生装置1の解析、分類時における機能的な構成を示すブロック図である。
再生装置1は、キー情報検出部21、コンテンツ検索部22、コンテンツデータベース23、コンテンツデコード部24、コンテンツ解析部25、コンテンツグループ管理部26、及びコンテンツグループ管理データベース27を備える。ここで、「コンテンツ」とは音声ファイル、画像データなどである。
キー情報検出部21は、例えばユーザによるキー入力部7の所定のボタンの操作に応じてキー情報を検出し、キー情報をコンテンツ検索部22に送信する。具体的には、音声解析部12に未解析のコンテンツを解析させるための所定のボタンをユーザが押下すると、キー情報検出部21は、キー情報を検出しコンテンツ検索部22に送信する。
コンテンツ検索部22は、このキー情報を受信すると、例えばコンテンツデータベース23に含まれるコンテンツの中から未解析のコンテンツを検索する。コンテンツデータベース23には、複数の音声ファイル等が含まれている。コンテンツ検索部22は、未解析のコンテンツの検索結果をコンテンツデコード部24に通知する。
コンテンツデコード部24は、例えばコンテンツ検索部22からの検索結果を取得し、この検索結果に応じて、コンテンツデータベース23から未解析のコンテンツデータを読込みデコード部5を用いてデコード処理を行う。
コンテンツ解析部25は、デコードされたコンテンツデータの解析を行う。この解析は、例えばコンテンツである音声ファイルの曲調の解析を含む。コンテンツ解析部25は、後で詳述するように、曲調の解析を行う解析時間区間(解析開始位置及び解析終了位置)を演算し、この解析時間区間の音声ファイルを解析すると共に、再生開始位置を演算する。
曲調の解析は、音声ファイルを周波数解析する周波数解析処理と、その周波数解析処理の結果を基に、音声データの特徴を数値化した特徴量を求める特徴量演算処理とからなる。すなわち、コンテンツ解析部25は、音声ファイルに対する周波数解析処理を実行する。これにより、コンテンツ解析部25は、音声ファイルを音楽の時間軸に沿って所定の解析開始位置から解析終了位置まで1オクターブの12音階それぞれに相当する周波数帯域毎のエネルギー値を抽出する。このようにして、コンテンツ解析部25は、音声データの所定の解析時間区間に亘る周波数帯域毎のエネルギー値を得ると、次に、その周波数帯域毎のエネルギー値を基に、特徴量演算処理を行う。特徴量は、例えば音楽のテンポ、音のバラツキ、音階、リズム等の情報を用いて求められるパラメータ値である。この解析の結果、コンテンツ解析部25は、特徴量(パラメータ値)を得て、この特徴量をコンテンツグループ管理部26に送信する。
コンテンツグループ管理部26は、特徴量をもとに音声ファイルが属するべき曲調のグループを判定し、その音声ファイルとグループとを対応つけるように、コンテンツグループ管理データベース27への登録を行う。
図3は図2のコンテンツデータベース23中のコンテンツリストの構成を示す図である。
コンテンツデータベース23には、複数の音声ファイルD1、D2等を含むコンテンツリスト41が含まれる。例えば音声ファイルD1は、図3に示すようにオーディオデータである「音声データ」、音楽の「タイトル名」、音楽の属する「ジャンル名」、音楽の再生可能な長さである「コンテンツ全長の長さc」に加えて、「解析フラグ」、「特徴量」、及び「グループ」等の属性情報を含んでいる。「解析フラグ」は、例えば音声ファイルD1の解析が済んでいるかいないかを示すフラグである。「特徴量」は、例えば解析の結果、得られるパラメータ値である。特徴量は、例えば音声ファイルD1、D2等が属するグループの判定に用いられる。「グループ」は、音声ファイルD1等が属する曲調のグループを示している。
図4は図2のコンテンツグループ管理データベース27中のグループリストの構成を示す図である。
コンテンツグループ管理データベース27には、グループリスト42が含まれている。グループリスト42は、特徴量に応じて分類される曲調のグループの一覧である。これらのグループには、例えば、リラックスG1、エネルギッシュG2、バラードG3、クラッシックG4、及びジャズG5等がある。リラックスG1は、リラックスできる静かな曲のグループである。エネルギッシュG2は、元気の出る曲のグループである。バラードG3は、バラード調の曲のグループである。クラッシックG4は、クラッシック調の曲のグループである。ジャズG5は、ジャズ調の曲のグループである。
図5はROM3に含まれる解析式データテーブルを示す図である。
解析式データテーブルは、コンテンツ全長の長さcと、解析時間区間Kと、再生開始位置Pとの関係を示すデータが登録されたテーブルである。コンテンツ全長の長さcの4つの場合(1)〜(4)に対応して、解析時間区間K、再生開始位置Pが解析式データテーブルに記憶されている。
(1)コンテンツ全長の長さcが0≦c<Tのときには、コンテンツの解析時間区間Kは0〜c、再生開始位置Pはc/2となる。ここで、Tは、固定解析長(予め所定の値に定められた固定値)であり、例えば30秒に設定されている。
(2)コンテンツ全長の長さcがT≦c<2Tのときには、コンテンツの解析時間区間Kはc−T〜c、再生開始位置Pはc/2となる。
(3)コンテンツ全長の長さcが2T≦c<2Sのときには、コンテンツの解析時間区間Kはc/2〜c/2+T、再生開始位置Pはc/2となる。
(4)コンテンツ全長の長さcが2S≦cのときには、コンテンツの解析時間区間KはS〜S+T、再生開始位置PはSとなる。ここで、Sは、固定さび位置(予め所定の値に定められた固定値)であり、例えば90秒に設定されている。
解析式データテーブルに示すように、解析時間区間Kと、再生開始位置Pとが対応しており、解析時間区間K内に再生開始位置Pが含まれている。つまり、解析時間区間Kの解析開始位置と解析終了位置との間に、再生開始位置Pが位置する。
図6はコンテンツ全長の長さcと解析時間区間Tとの関係を示すグラフである。
ここで、縦軸は再生開始後の経過時間である再生時間、横軸はコンテンツ全長の長さcである。解析時間区間Kは斜線で示す。音声ファイルD1等の固定さびの位置Sは、例えば3分以上の曲の場合には、曲の再生開始から90秒の位置以降であると予測される。
ここで、固定サビ位置Sとは、一般的に曲のどのあたりの時間からサビが開始されるかを統計的に調べて一意に決めた位置のことである。例えば、3分以上の曲の場合には、曲の再生開始から90秒の位置からサビが始まる場合が多い。このような理由から、この実施形態では、コンテンツ全長の長さcが2S(3分 S=90秒)以上の場合には、その再生開始から90秒の位置を解析開始位置と再生開始位置として採用している。
[再生装置1による音声ファイルの解析分類の動作]
図7は再生装置1による音声ファイルの解析分類(登録)動作を示すフローチャートである。
コンテンツ検索部22は、未解析のコンテンツが記憶されているか否かを判断する(ST701)。具体的には、コンテンツ検索部22は、内部記憶装置6に記憶された図3に示す音声ファイルD1の解析フラグの情報に基づき、音声ファイルD1が解析済みか否かを判断する。
コンテンツ検索部22は、未解析のコンテンツがないときには(ST701でNO)、解析分類処理を終了する。コンテンツ検索部22は、未解析のコンテンツがあるときには(ST701でYES)、解析を促すためのメッセージを表示部11に表示させる(ST702)。
図8は解析を促すメッセージの例を示す図である。
例えばこの例においては、「解析されていない曲があります。オプションメニューからチャンネルの更新を実行して下さい。」といったメッセージ32が用いられている。
図7の動作説明に戻る。
キー情報検出部21は、ユーザにより解析を開始させるための操作が行われたか否かを判断する(ST703)。具体的には、キー情報検出部21は、例えばユーザにより所定のボタン(解析開始を指示するためのボタン)が押下されたときに入力されるキー情報を検出する。
コンテンツ検索部22は、検出されたキー情報を取得して、コンテンツリスト41に含まれる音声ファイルD1の中から未解析のコンテンツを検索を開始する(ST704)。具体的には、コンテンツ検索部22は、コンテンツリスト41中の図3に示す音声ファイルD1に含まれる属性データを取得し、属性データ中の解析フラグに基づき、音声ファイルD1が解済みか否かを判断する。
コンテンツ検索部22は、未解析のコンテンツ数、未解析のコンテンツの解析に必要な残りの時間である残り解析時間等を演算し、未解析のコンテンツ数及び残り解析時間を図9に示すように表示画面に表示させる(ST705)。例えば各コンテンツの長さの和を基に、残り解析時間を解析する。図9は未解析コンテンツの数及び残り解析時間を示す図である。コンテンツの解析中に、表示画面には、同図に示すように、例えば、現在解析中であることを示すメッセージとともに、解析済みの曲の数/未解析の曲の数(4/60)、残り解析時間(1分23秒)等が表示される。
コンテンツ検索部22は、ST701と同様に未解析のコンテンツがあるか否かを判断する(ST706)。なお、最初にST706の処理が実行されるときには、ST701で既に未解析のコンテンツがあると判断されているので、ST706の処理は省略可能である。コンテンツ検索部22は、未解析のコンテンツがないときには(ST706でNO)、解析分類処理を終了する。
コンテンツグループ管理部26は、未解析のコンテンツがあるときには(ST706でYES)、音声ファイルD1の図3に示すグループ管理テーブルを参照して、当該音声ファイルD1が特定のグループに登録されているか否かを判断する(ST707)。コンテンツグループ管理部26は、音声ファイルD1が特定のグループに登録されていると判断したときには(ST707でYES)、ST705に戻って未解析のコンテンツ数、未解析の残りコンテンツ数・残り解析時間の計算と計算結果の表示を行う。コンテンツグループ管理部26は、音声ファイルD1が特定のグループに登録されていないと判断したときには(ST707でNO)、ST708に進む。
コンテンツグループ管理部26は、音声ファイルD1が音声コンテンツか否かを判断する(ST708)。この音声コンテンツとは、例えば英会話等の教材、ニュース、本を読み上げただけの音声等を含む。音声ファイルD1が音声コンテンツであるか否かは、例えば、音声ファイルD1の属性情報に、「Podcast」、「語学」、「News」、「Audio Book」、「Talk」等の文字列が含まれているか否かに基づき判断する。コンテンツグループ管理部26が、このような文字列が属性情報に含まれていると判断したときには(ST708でYES)、そのコンテンツを音声コンテンツと判定し、含まれていないと判断したときには(ST708でNO)、音声コンテンツでないと判断する。
コンテンツグループ管理部26は、音声データD1を音声コンテンツであると判断したときには(ST708でYES)、ST705に戻って未解析のコンテンツ数、未解析の残りコンテンツ数・残り解析時間の計算と計算結果の表示を行う。音声コンテンツでないと判断したときには(ST708でNO)、ST709に進む。つまり、コンテンツが未解析であり(ST706でYES)、グループに未登録であり(ST707でNO)、かつ音声コンテンツでない(ST708でNO)ときに、ST709以降のコンテンツの解析分類処理が実行される。
コンテンツ解析部25は、コンテンツデータベース23に格納された音声データD1の属性データを取得し、音声データD1の属性データからコンテンツ全長の長さcを取得する(ST709)。
コンテンツ解析部25は、図5に示す解析式データテーブルに基づき、音声ファイルD1の解析時間区間K(解析開始位置及び解析終了位置)を解析式データベースを用いて演算する(ST710)。
コンテンツ解析部25は、イコライザの設定をオフにする(ST711)。
コンテンツデコード部24は、音声ファイルD1をデコードする(ST712)。
コンテンツ解析部25は、コンテンツデコード部24でデコードしたデータを用いて、上述したように解析時間区間Kの音声ファイルD1の曲調解析を行う(ST713)。これにより、音声ファイルD1をグループに分類するための特徴量が得られる。
この後、コンテンツ解析部25は、イコライザの設定を復帰する(ST714)。
コンテンツグループ管理部26は、コンテンツ解析部25から取得した特徴量をもとに、音声ファイルD1が属するべきグループを判定し、この判定結果でコンテンツグループ管理データベース27に登録されたグループ管理テーブルを更新する(ST715)。
この後、ST705に戻って、に戻って未解析のコンテンツ数、未解析の残りコンテンツ数・残り解析時間の計算と計算結果の表示を繰り返す。そして、コンテンツ解析部25は、ST706で未解析のコンテンツがないと判断したときには、解析分類処理を終了する。
[再生装置1による再生]
図10は再生装置1の再生時における機能的な構成を示すブロック図である。
なお、以下、例えばユーザにより一様な曲調の(同一グループ内の)コンテンツを連続して再生することが可能なチャンネル(おまかせチャンネル(登録商標))が選択され、図4に示すようなグループリスト42から所望のグループをユーザが選択することができるものとする。
キー情報検出部21は、ユーザにより入力されたキーの情報を検出し、コンテンツグループ管理部26に送信する。具体的には、キー情報検出部21は、図4に示すグループのうち例えばリラックスG1がユーザにより選択される。すると、コンテンツグループ管理部26は、ユーザにより選択されたグループを示す情報に基づいて、コンテンツグループ管理データベース27に含まれるグループ管理テーブル42からそのグループに属する音声ファイルを示す情報を抽出して、コンテンツ検索部22に通知する。
コンテンツ検索部22は、コンテンツグループ管理部26から通知された情報を基に、コンテンツデータベース23中から該当する音声ファイルを検索する。コンテンツ検索部22は、検索された音声ファイルの中からデコードする音声ファイルを選択し、選択された音声ファイルの情報、例えばファイル名などの情報をコンテンツデコード部24に送信する。
コンテンツデコード部24は、コンテンツ検索部22により通知された音声ファイルの情報を基に、コンテンツデータベース23から該当する音声ファイルの音声データを取得し、音声データのデコードを行う。
音声再生部40は、コンテンツデコード部24からデコードされた音声データを取得し当該再生対象である音声ファイルに含まれる属性データ中のコンテンツ全長の長さcを取得し、このコンテンツ全長の長さcから再生開始位置Pを求める。そして、音声再生部40は、解析時間区間Kに対応した再生開始位置Pから音声データを再生する。
[再生装置1による再生の動作]
図11は再生装置1のコンテンツデータ再生動作を示すフローチャートである。以下、図4に示す複数のグループ(G1〜G5等)からユーザが所望のグループを選択することが可能となっているものとする。
まず、ユーザはキー入力部7を操作することにより、再生すべきグループを選択するための入力操作を行う。キー情報検出部21は、キー入力部7からの入力に対応するキーコードをコンテンツグループ管理部26に出力する。コンテンツグループ管理部26は、キー情報検出部21より入力されたキーコードを基に、ユーザによって選択されたグループを判定し、このグループに属する音声ファイルのファイル名をコンテンツ検索部22に通知する(ST1101)。
コンテンツ検索部22は、コンテンツグループ管理部26より通知された音声ファイルのファイル名の中から最初に再生する音声ファイルのファイル名を例えばランダム方式で決定し、そのファイル名を音声再生部40及びコンテンツデコード部27に通知する(ST1102)。
音声再生部40は、コンテンツ検索部22より通知されたファイル名を基に、コンテンツデータベース23から該当する音声ファイルの属性データに含まれるコンテンツ全長の長さcを取得する(ST1103)。
音声再生部40は、取得したコンテンツ全長の長さcに基づき、図5に示す解析式データテーブルを用いて再生開始位置Pを演算する(ST1104)。
音声再生部40は、ST1104で演算した再生開始位置Pを音声データの再生開始位置として設定する(ST1105)。
これにより、音声再生部40は、当該音声データの再生開始位置P(図5参照)に相当する位置から再生処理を開始する(ST1106)。
音声再生部40は、音声ファイルの再生が終了したか否かを判断する(ST1107)。
音声再生部40は、音声データの再生が終了していないときには(ST1107でNO)、キー情報検出部21より入力されたキーコードを基に、ユーザによるグループの変更操作があったか否かを判断する(ST1108)。
音声再生部40は、ユーザによるグループの変更操作があったときには(ST1108でYES)、ST1101に戻り再び再生するグループを決定し直す。
音声再生部40は、ユーザによるグループの変更操作がなかったときには(ST1108でNO)、ST1109に進む。
音声再生部40は、キー情報検出部21より入力されたキーコードを基に、再生する音声データを変更する操作がユーザによりあった否かを判断する(ST1109)。
音声再生部40は、ユーザによる音声データの変更操作があったときには(ST1109でYES)、ST1102に戻り、再生する音声ファイルを決定する。これにより、同一グループ内の別の音声ファイルに、再生される音声ファイルが変更される。
音声再生部40は、ユーザによる音声ファイルの変更操作がなかったときには(ST1109でNO)、キー情報検出部21より入力されたキーコードを基に、ユーザによる終了操作があったか否かを判断する(ST1110)。
音声再生部40は、ユーザによる終了操作があったときには(ST1110でYES)、再生処理を終了する。音声再生部40は、ユーザによる終了操作がなかったときには(ST1110でNO)、ST1107に戻り、音声ファイルの再生が終了したか否かを判断する。
音声再生部40は、音声データの再生が終了したときには(ST1107でYES)、グループに属するコンテンツ群から次に再生するコンテンツを決定する(ST1111)。具体的には、音声データの再生が終了したときには、音声ファイルの含まれるグループと同じグループに含まれる音声ファイルの中からランダムに次に再生する音声ファイルが決定される。なお、音声ファイルの再生が終了したときに、図4に示すように、同じグループ内の音声ファイルをリストアップされている順に再生するようにしてもよい。
音声再生部40は、次に再生する音声ファイルの音声データの先頭位置を音声データの再生開始位置として設定する(ST1112)。
音声再生部40は、音声データの再生を開始し(ST1113)、ST1107に戻り、音声ファイルの再生が終了したか否かを判断する。
[作用]
このように本実施形態によれば、再生装置1は、コンテンツ全長の長さcに基づいて音声データに対する解析時間区間Kを判定し(ST710)、判定結果に基づいて解析時間区間Kの音声データを解析するので、再生装置1のCPU2にかかる演算負荷を低減し効率的に解析を行うことができる。キー入力部7により選択されたグループ(分類項目)に属する音声データを解析時間区間K内の再生開始位置Pから再生するので、再生開始位置Pが解析時間区間Kに含まれ、ユーザが解析結果に違和感を感じないようにすることができる。
つまり、例えば音声ファイルの場合、コンテンツ全長の長さcの全域に亘って音声ファイルの曲調を解析しなくても、曲の一部から全体を曲調を類推することができる。そのため、解析時間区間Kだけ曲調を解析して音声ファイル全体の曲調とすることで曲調の解析を効率良く行うことができる。
この際、ユーザが実際に曲を聴いた印象と、解析された分類結果とが異なると、ユーザが解析結果に違和感を覚えることになる。本実施形態では、図5に示すように、再生開始位置Pが解析時間区間Kに含まれるようにすることによって、再生開始時に解析結果に違和感を感じないようにする。
ここで、再生開始位置Pは、図6に示すように、曲の先頭よりも、むしろ曲の途中の特定の位置である。曲の先頭は無音であったり、イントロ部分であることが多いため、曲の先頭から再生する場合、曲調をすぐに把握できない。さび位置などから再生することが望ましい。
再生装置1は、コンテンツ全長の長さcが所定の値(例えばT)以上であることを判定したとき(図5参照)、コンテンツ全長の長さcの一部を解析時間区間Kと判定する。これにより、コンテンツ全長の長さcが所定の値T以上であるときに、音声データの一部を解析時間区間Kとし、再生装置1の演算負荷を低減することができる。
例えば図5に示すように、再生装置1は、再生開始位置Pを解析時間区間Kの解析の開始点と同じにすることができる。このため、音声データの再生時に、より確実にユーザが解析結果に違和感を感じないようにすることができる。
再生装置1は、未解析の音声ファイルが記憶されているときに、未解析の音声ファイルの解析をユーザに促すための図8に示すメッセージ32を表示することができる。これにより、未解析の音声データの解析をユーザに促すことができる。
再生装置1は、解析中(ST713等)に、図9に示すように、未解析のコンテンツ数及び残り解析時間を表示画面に表示することができる(ST705)。これにより、音声データの解析中や分類中にこれらの処理が終了するまでの時間や音声ファイルの数をユーザが知ることができる。
例えば音声ファイルD1は、音声データが解析済か否かを示す判断情報である解析フラグを含む。再生装置1は、解析フラグに基づき、音声ファイルD1を解析するか否かを判断することができる。例えば音声ファイルD1が既に外部機器において解析済みである場合には、再生装置1は、解析処理や分類処理を実行しない。例えば、音声ファイルD1が既に外部機器において解析済みであるときには、予め音声ファイルD1の音声データと、解析フラグや解析結果である特徴量とが関係付けられて、音声ファイルD1に記憶されている。これにより、例えば音声ファイルが予め解析済みであるとき(音声データが予め解析結果に関係付けられているとき)に、解析処理や分類処理を実行しないことで、CPU2による演算負荷を低減することができる。
再生装置1は、図5に示すように再生開始位置Pが解析時間区間K中の所定の時点(解析時間区間Kの中間点)とし、解析時間区間K中の所定の時点(解析時間区間Kの中間点)から所定の時間(固定解析長T)、音声データを再生することができる。これにより、さびの位置の音声データを解析し、さびの位置の音声データを再生することができる。
予め曲の盛り上がるさび位置が情報として分かっている場合には、解析時間区間Kが再生開始位置Pに先行して決まる。この場合においても、解析式データテーブルを用いることで、例えば再生開始位置Pを解析時間区間Kに合わせることができる。
<変形例>
次に変形例の再生装置について説明する。なお、本変形例以降では、上記実施形態と同一の部材などには同一の符号を付し、異なる箇所のみ説明する。
上記実施形態では、図5に示す例1の解析式データテーブルを用いて再生開始位置Pを求めたが、本変形例では、図5に示す例2の解析式データテーブルを用いて再生開始位置Pを求める点が異なる。
図5に示すように、コンテンツ全長の長さcの4つの場合(1)〜(4)に対応して、解析時間区間K、再生開始位置Pが解析式データテーブルに記憶されている。
(1)コンテンツ全長の長さcが0≦c<Tのときには、コンテンツの解析時間区間Kは0〜c、再生開始位置Pは0となる。
(2)コンテンツ全長の長さcがT≦c<2Tのときには、コンテンツの解析時間区間Kはc−T〜c、再生開始位置Pはc−Tとなる。
(3)コンテンツ全長の長さcが2T≦c<2Sのときには、コンテンツの解析時間区間Kはc/2〜c/2+T、再生開始位置Pはc/2となる。
(4)コンテンツ全長の長さcが2S≦cのときには、コンテンツの解析時間区間KはS〜S+T、再生開始位置PはSとなる。
例えば図5に示すように、再生装置は、再生開始位置Pを解析時間区間Kの解析の開始点と同じにすることができる。このため、音声データの再生時に、より確実にユーザが解析結果に違和感を感じないようにすることができる。
本発明は以上説明した実施の形態には限定されるものではなく、種々の変形が可能である。
本発明の一実施形態に係る再生装置の構成を示すブロック図である。 再生装置の解析、分類時における機能的な構成を示すブロック図である。 図2のコンテンツデータベース中のコンテンツリストの構成を示す図である。 図2のコンテンツ管理データベース中のグループリストの構成を示す図である。 ROMに含まれる解析式データテーブルを示す図である。 長さと再生時間との関係を示す図である。 再生装置の解析、分類(登録)動作を示すフローチャートである。 メッセージが表示画面に表示された状態を示す図である。 未解析コンテンツの数及び残り時間を示す図である。 再生装置の再生時における機能的な構成を示すブロック図である。 再生装置のコンテンツデータ再生動作を示すフローチャートである。
符号の説明
D1、D2 音声ファイル
c 長さ
K 解析時間区間
P 再生開始位置
1 再生装置
2 CPU
3 ROM
6 内部記憶装置
7 キー入力部
8 音声処理部
9 音声出力部
12 音声解析部
21 キー情報検出部
22 コンテンツ検索部
23 コンテンツデータベース
24 コンテンツデコード部
25 コンテンツ解析部
26 コンテンツグループ管理部
27 コンテンツグループ管理データベース
32 メッセージ
40 音声再生部
41 コンテンツリスト
42 グループリスト

Claims (7)

  1. 音声データの再生時間の長さに対して予め決められた当該音声データの解析時間区間に関する情報を記憶する区間情報記憶手段と、
    再生対象である複数の音声データを記憶する記憶手段と、
    前記区間情報記憶手段に記憶された前記情報をもとに、前記記憶手段に記憶された前記音声データ解析時間区間を判定する判定手段と、
    前記判定手段により判定された前記解析時間区間の前記音声データを解析する解析手段と、
    解析結果に基づきそれぞれ音声データを予め定められた複数の分類項目に分類する分類手段と、
    再生する音声データの分類項目をユーザに選択させる入力手段と、
    前記入力手段により選択された分類項目に属する音声データを前記解析時間区間内の再生開始点から再生する再生手段と
    を具備する再生装置。
  2. 請求項に記載の再生装置であって、
    前記再生開始点が前記解析時間区間の解析の開始点と同じである
    再生装置。
  3. 請求項に記載の再生装置であって、
    前記記憶手段に記憶された未解析の音声データの解析をユーザに促すための案内画面を表示する表示手段を更に具備する
    再生装置。
  4. 請求項に記載の再生装置であって、
    前記記憶手段に記憶された複数の音声データについて、前記判定手段、前記解析手段、前記分類手段による処理を連続的に行うように制御する制御手段を更に具備する
    再生装置。
  5. 請求項に記載の再生装置であって、
    前記制御手段は、前記記憶手段に記憶された全ての音声データに対する前記処理の残り時間を計算し表示するように制御する
    再生装置。
  6. 請求項に記載の再生装置であって、
    前記解析手段は、前記音声データの曲調を解析する
    再生装置。
  7. 音声データの再生時間の長さに対して予め決められた当該音声データの解析時間区間に関する情報を記憶し、
    再生対象である複数の音声データを記憶し、
    記憶された前記情報をもとに、記憶された前記音声データ解析時間区間を判定し、
    判定された前記解析時間区間の前記音声データを解析し、
    解析結果に基づきそれぞれ音声データを予め定められた複数の分類項目に分類し、
    再生する音声データの分類項目をユーザに選択させ、
    選択された分類項目に属する音声データを前記解析時間区間内の再生開始点から再生する
    再生方法。
JP2008219061A 2008-08-28 2008-08-28 再生装置および再生方法 Expired - Fee Related JP5098896B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008219061A JP5098896B2 (ja) 2008-08-28 2008-08-28 再生装置および再生方法
US12/502,332 US20100058186A1 (en) 2008-08-28 2009-07-14 Reproducing apparatus and reproducing method
CN2009101657908A CN101661788B (zh) 2008-08-28 2009-08-13 再现设备和再现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008219061A JP5098896B2 (ja) 2008-08-28 2008-08-28 再生装置および再生方法

Publications (2)

Publication Number Publication Date
JP2010054758A JP2010054758A (ja) 2010-03-11
JP5098896B2 true JP5098896B2 (ja) 2012-12-12

Family

ID=41727117

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008219061A Expired - Fee Related JP5098896B2 (ja) 2008-08-28 2008-08-28 再生装置および再生方法

Country Status (3)

Country Link
US (1) US20100058186A1 (ja)
JP (1) JP5098896B2 (ja)
CN (1) CN101661788B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110113330A1 (en) * 2009-11-06 2011-05-12 Sony Ericsson Mobile Communications Ab Method for setting up a list of audio files
CN103092854B (zh) * 2011-10-31 2017-02-08 深圳光启高等理工研究院 一种音乐数据分类方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050038819A1 (en) * 2000-04-21 2005-02-17 Hicken Wendell T. Music Recommendation system and method
JP2002044572A (ja) * 2000-07-21 2002-02-08 Sony Corp 情報信号処理装置及び情報信号処理方法および情報信号記録装置
JP4622199B2 (ja) * 2001-09-21 2011-02-02 日本ビクター株式会社 楽曲検索装置及び楽曲検索方法
US7038118B1 (en) * 2002-02-14 2006-05-02 Reel George Productions, Inc. Method and system for time-shortening songs
EP1615204B1 (en) * 2004-07-09 2007-10-24 Sony Deutschland GmbH Method for classifying music
JP4759281B2 (ja) * 2005-02-09 2011-08-31 パイオニア株式会社 情報処理装置、情報処理方法、情報処理プログラム、および、情報処理プログラムを記録した記録媒体
JP4665836B2 (ja) * 2006-05-31 2011-04-06 日本ビクター株式会社 楽曲分類装置、楽曲分類方法、及び楽曲分類プログラム
JP2008065905A (ja) * 2006-09-07 2008-03-21 Sony Corp 再生装置、再生方法及び再生プログラム

Also Published As

Publication number Publication date
JP2010054758A (ja) 2010-03-11
US20100058186A1 (en) 2010-03-04
CN101661788B (zh) 2012-04-25
CN101661788A (zh) 2010-03-03

Similar Documents

Publication Publication Date Title
JP4919796B2 (ja) ディジタルオーディオファイル検索方法および装置
JP5318095B2 (ja) 電子装置を用いて複数のソングを自動的にビートミックスするシステム及び方法
US7953504B2 (en) Method and apparatus for selecting an audio track based upon audio excerpts
JP2004347943A (ja) データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム
JP2008532200A (ja) 再生リストを作成するためのスキャンシャッフル
WO2017028686A1 (zh) 一种信息处理方法、终端设备及计算机存储介质
JP2007164545A (ja) 嗜好プロファイル生成装置、嗜好プロファイル生成方法及びプロファイル生成プログラム
JP2009093779A (ja) コンテンツ再生装置及びコンテンツ再生方法
JP2006318182A (ja) 音声検索装置、音声検索方法、音声再生方法および携帯再生装置、並びに、楽曲検索装置、楽曲検索方法、楽曲再生方法
JP5098896B2 (ja) 再生装置および再生方法
JP6288197B2 (ja) 評価装置及びプログラム
JP6102076B2 (ja) 評価装置
JP4646249B2 (ja) プログラム記録媒体、携帯型ビデオゲーム機、再生制御プログラム及び再生制御方法
JPWO2006087891A1 (ja) 情報選択方法及び情報選択装置等
JP4475597B2 (ja) 提示データ選択装置及び提示データ選択方法等
JP2006323943A (ja) 再生装置,プログラム及び再生制御方法
JP2005285285A (ja) コンテンツ読出装置及び楽曲再生装置
JP4740583B2 (ja) 音楽データ処理装置及びプログラム
WO2019239538A1 (ja) 音響装置およびプログラム
JP6587459B2 (ja) カラオケイントロにおける曲紹介システム
JP2004326907A (ja) オーディオ再生装置
JP2008089751A (ja) 楽音再生装置及びプログラム
JP2007172745A (ja) 楽曲再生装置、プログラム及び楽曲選曲方法
JP4299747B2 (ja) 電子早見本装置
JP2023091483A (ja) 格納装置、再生装置、格納方法、再生方法、データ構造、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110815

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120619

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120828

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120910

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees