JP2007525779A - グラフィカルインタフェースを用いてオーディオドキュメント集合内を巡回する方法、及び当該方法による巡回のための受信機 - Google Patents

グラフィカルインタフェースを用いてオーディオドキュメント集合内を巡回する方法、及び当該方法による巡回のための受信機 Download PDF

Info

Publication number
JP2007525779A
JP2007525779A JP2006518309A JP2006518309A JP2007525779A JP 2007525779 A JP2007525779 A JP 2007525779A JP 2006518309 A JP2006518309 A JP 2006518309A JP 2006518309 A JP2006518309 A JP 2006518309A JP 2007525779 A JP2007525779 A JP 2007525779A
Authority
JP
Japan
Prior art keywords
document
audio
graphic
patrol
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006518309A
Other languages
English (en)
Other versions
JP4372151B2 (ja
Inventor
シェヴァリエ ルイ
グラスランド イザベラ
ヴィグルー ジャン−ロナン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2007525779A publication Critical patent/JP2007525779A/ja
Application granted granted Critical
Publication of JP4372151B2 publication Critical patent/JP4372151B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • G06F16/639Presentation of query results using playlists
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2545CDs

Abstract

本発明はディスプレイ装置を備えた再生装置に格納された音声ドキュメントのコレクション内を巡回する方法に関する。本方法は、各ドキュメントに固有の「ローレベル」と呼ばれるオーディオパラメータを求めるためにドキュメントを分析するステップを有している。つぎに、音声ドキュメントの少なくとも一部のグラフィック識別子がグラフィックページ内に置かれる。グラフィック識別子の配置は事前に計算されたパラメータに依存している。最後に、本発明は、グラフィックページ内でのドキュメント識別子の位置を考慮に入れて、決定されたストラテジーに従って音声ドキュメントを逐次再生することにより自動巡回を行うステップを有している。
本発明はまた、決定されたストラテジーとグラフィックページ内でのドキュメント識別子の位置とに従って音声ドキュメントを再生するソフトウェアモジュールを実行することのできる装置にも関する。

Description

本発明はオーディオビジュアル受信機によってアクセスすることのできるドキュメントを巡回する方法、及び、巡回を可能にするグラフィカルユーザインタフェースを備えた再生装置に関する。
多数の音声ドキュメントを量販機器に格納することは周知である。例えば、数枚のCDを収容することができ、一方では適当なCDを、他方ではそのCDの中の適当なピースをユーザが選択できるようにするリモートコントローラを備えた、オーディオコンパクトディスク(CD)読出し装置が挙げられる。これらの装置は音声ピースの連鎖を決めるプログラミング機能も有している。このプログラミングの際に、ユーザは各ピースに対してCDの識別子とCD内のピースの識別子を入力する。ある程度のメロディの連続性を保つには、ユーザは事前にピースを知っていなければならい上に、再生中にある程度の音声の連続性が再現されるようにピースをプログラムしなければならない。
音声コンテンツを格納する他の手段も存在している。例えば、ポータブルリーダ(又はパーソナルプレーヤー)は、何百もの音楽作品を記録することのできる大容量電子メモリを有している。後者の中では、例えば、出願人が生産及び製造するMP 3 LYRAリーダが挙げられる。ある種の家電も大容量の、例えば20ギガバイトのハードディスクを有しており、それにより何千もの音声コンテンツの格納が可能である。
オーディオコンテンツ(例えば、歌)の膨大なコレクションにアクセスするユーザは、決めたピースを聞くためにコレクションからそのピースを検索する際に困難に遭遇する。それゆえ、コンテンツをある基準に従って整理すること、また特に、ユーザが1つ又は複数の適当なピースを迅速に検索することができるようにコンテンツを提示することが大切である。オーディオコンテンツを同定するためにディジタルデータを対応付けることは周知であり、最も一般的なものはタイトルであるが、プロデューサ、歌手、発行者などもある。「属性」と呼ばれる他の要素、例えば、ジャンル(ジャズ、ボーカル、ロック、イージーリスニング、BGMなど)は、コンテンツの分類を可能にする。他方で、ユーザがアクセスすることのできるある種のオーディオコンテンツは、例えば、ユーザ自身が自分の音楽作品をライブで記録する場合のように、自動的にこれらの属性を有しているわけではない。オーディオコンテンツを分類する別の方法は音声信号を直接分析することである。各オーディオコンテンツに関していわゆる「ローレベル」パラメータの値を計算することのできる信号分析技術が存在している。これらのパラメータは、例えば、テンポ、エネルギー、ブライトネス、エンベロープなどである。これらは信号をディジタル形式又はアナログ形式で分析することにより求められる。オーディオコンテンツの索引法は、2000年8月に刊行されたIEEE Journalの第88巻の1338〜1353頁に所収の論文“Speech and Language Technologies for audio indexing and retrieval”において説明されている。この論文はオーディオ信号を分析することによってどのようにして様々なコンテンツの分類が可能になるかを説明している。他の論文はローレベルパラメータを計算する手段と可能な利用法を記述している。ここに、参照により本特許出願に含められている他のいくつかの論文を挙げる:
・B. Feiten and S. Gunzel, Automatic indexing of a Sound Database using self-organizing neural networks, Computer Music Journal, 18 (3°,1994
・Eric Scheirer, Music Listening systems, PhD thesis, MIT Media Laboratory, Apr 2000.
2001年4月29日に刊行されたIEEE−WEIPPL文献“Visualizing content based relations in texts”は、主成分分析やコホーネンマップのような従来のアルゴリズムを用いて2D又は3D空間に投影することによりテキスト文書のコレクションを視覚化する様々な方法を提示している。このような視覚化方法のユーザは文書を探したい人であって、邪魔なしにコンテンツを聴きたい人ではない。
コレクションの各音声ドキュメントに対していったんローレベルパラメータが求まると、格納又は再生装置はこれらのパラメータに応じて音声ドキュメントをグループに分類することができる。したがって、クラッシック音楽のコンテンツは1つのグループを形成し、同様にジャズの作品は別のグループを形成する。2001年8月23日に公表された特許出願PCT/GB01/00681には、スクリーン上に表示され、オーディオビジュアル受信機により制御されるグラフィックから構成されたユーザインタフェースが記載されている。表示されたメニューには、ユーザが選択することのできるアイコン(「クラッシック」、「ジャズ」、「チャート音楽」、「トークバック」など)が示され、グループのドキュメントを選択するとその音声コンテンツの再生が開始される。
このようなインタフェースはオーディオコンテンツの選択を容易にするが、複数のコンテンツを自動的に連鎖させることはできない。このような連鎖は、ユーザが事前に様々なコンテンツを知っていることを条件に、プログラミングによって実行される。このケースでも、ユーザがメロディアスな連鎖を得たいと思っても、ユーザが音楽を理解する耳をもっていなければ、ユーザにはどのようにすればよいかが分からない。
MIHALCHEONの国際特許出願WO01/65346には、オンライン製品カタログのプレゼンテーションが記載されている。製品はスクリーン上にアイコンの形で現れ、ユーザはアイコンを選択することで選らんだオブジェクトに関するオーディオ再生をトリガすることができる。あるアイコンから別のアイコンへの移動は、カタログ提供者によって策定されたストラテジーに従った巡回によって行われる。したがって、この巡回はユーザ端末に固有のオブジェクト又はユーザに固有の基準を考慮に入れることができない。
本発明は、ある程度の音楽的統一性又は少なくともある程度の論理性を維持しつつ、ユーザがユーザ端末に収容されているオーディオコンテンツを逐次再生することができるようにする。さらに、このように規定されたグラフィックインタフェースは、オーディオコンテンツの膨大なコレクション内を容易に巡回し、ユーザ所望のコンテンツを再生することができるようにし、しかもそれを競争力のある仕方で且つユーザフレンドリーに行う。
本発明は、ディスプレイ装置を備えた再生装置に格納された音声ドキュメントのコレクション内を巡回する方法であって、前記コレクションの各音声ドキュメントを格納するステップと、各ドキュメントに固有のオーディオパラメータを求めるため前記ドキュメントを分析するステップを有する形式の方法において、ディスプレイ装置のグラフィックページ上で音声ドキュメントの少なくとも一部に対応するグラフィック識別子の位置を決定し、ただし、各グラフィック識別子の位置は所与のドキュメントに対して事前に計算された前記パラメータに依存しており、グラフィックページ内でのドキュメントのグラフィック識別子の位置と再生装置に固有の幾何学的特徴とを考慮したストラテジーに従って音声ドキュメントを選択及び逐次再生することにより自動巡回を行う、ことを特徴とする音声ドキュメントのコレクション内を巡回する方法を対象としている。
このように、本方法はオーディオコンテンツセット内の巡回に関する新奇な概念を提供する。この概念はこのセットのグラフィカルな表現の視覚化といくつかのグラフィック識別子をつなぐグラフィカルな関係に基づいたストラテジーとに基づいている。したがって、ユーザは自端末内で使用可能な音声ドキュメントの連鎖の進展をグラフィックページ上で見ることができる。さらに、グラフィックページ内でのドキュメントの表示位置は各ドキュメントについて計算されたローレベルパラメータに依存しており、したがってこれらの表示位置に基づいた巡回はある程度の聴覚的連続性をもたらす。
第1の実施形態によれば、本方法は近いパラメータ値を有するドキュメントのグループを求めるステップを有する。1つのグループのドキュメントに対応付けられたグラフィック識別子は類似性をもって表示され、これによりユーザはグラフィックページ内でグループの位置を特定することができる。したがって、ユーザは明瞭に決められた音楽グループ内で音声ドキュメントを選択することができる。
別の実施形態によれば、本方法はドキュメントを自動的に連鎖して再生するために再生装置によって使用される巡回ストラテジーを指定することにより巡回を開始させるコマンドを受信するステップを有する。線分のトラバース、螺旋形又は開放形のトラバース、識別子を含んだグラフィックゾーンの画定、及びこのゾーン内でのランダムな選択といった可能な複数の巡回ストラテジーが存在するが、すべてグラフィカルに表示可能である。
別の実施形態によれば、本方法は決定されたストラテジーに従って再生されるドキュメントの数を表示するステップを有する。別の実施形態によれば、本方法は再生中のドキュメントの通し番号を表示するステップを有する。
本発明はまた、中央ユニット、音声ドキュメントを受信する手段、受信したドキュメントを格納する手段、ユーザコマンドを入力する手段、及び、各ドキュメントに固有のパラメータを求めるために格納されたドキュメントを分析する手段を有する再生装置であって、格納された音声ドキュメントの少なくとも一部に対応するグラフィック識別子のグラフィックページを表示する手段と、グラフィックページ内でのドキュメントのグラフィック識別子の位置と再生装置に固有の幾何学的特徴とを考慮したストラテジーに従って音声ドキュメントを自動的に連鎖再生する巡回手段を有しており、ただし、各ドキュメントのグラフィック識別子の位置は事前に計算された前記パラメータに依存していることを特徴とする再生装置も対象としている。
本発明の他の特徴及び利点は、添付した図面を参照しつつ、図解のために与えられた実施例に続く説明の枠内で、より詳細に明らかにされる。添付図面のうち、
図1は、本発明を実施するための再生装置のブロック回路図であり、
図2は、コレクションの各ドキュメントに対してそのローレベルパラメータの値を対応させる配列を示しており、
図3は、2次元空間内でドキュメントのコレクションを表すスクリーンショットを示しており、
図4は、音声ドキュメントを自動的に連鎖させるいわゆるセグメント巡回ストラテジーを示すスクリーンショットであり、
図5は、音声ドキュメントを自動的に連鎖させる螺旋巡回ストラテジーを示すスクリーンショットである。
ディスプレイ装置2に接続された、マルチメディア受信機などのような再生装置1の動作をまず説明する。受信機は、プログラムメモリ12に接続された中央ユニット3と、インタフェース5を有している。インタフェース5は、高ビットレートでのオーディオ及び/又はビデオデータの受信を可能にする高ビットレートローカルディジタルバス6と通信する。このネットワークは例えばIEEE 1394ネットワークである。受信機はまた復調器4に接続された受信アンテナを介して送信ネットワークからオーディオ及び/又はビデオデータを受信することができる。このネットワークはラジオ又はテレビジョンタイプであってよい。受信機はさらに、リモートコントローラ8からの信号を受信するための赤外信号受信機7、データベースを格納するためのメモリ9、ならびに、テレビジョンスクリーン2に対して発信されるオーディオビジュアル信号を生成するオーディオ/ビデオ復号論理回路10を有している。リモートコントローラ8は方向キー↑、↓、→、←と「OK」キー及び「選択」キーを備えている。これらの機能については後で見る。
受信機はまたスクリーン上にデータを表示するための回路11も有している。この回路11はしばしばOSD回路と呼ばれる。ただし、OSDは英語の“On Screen Display”を意味している。OSD回路11は、スクリーン上にメニュー、絵文字、又は他のグラフィックスを表示することのできるテキスト及びグラフィックスジェネレータであり、メニューには巡回が提示される。OSD回路は中央ユニット3とナビゲータ12とにより制御される。ナビゲータ12は、有利には、読出し専用メモリに記録されたプログラムモジュールの形態で実施される。また、例えば、ASICタイプの専用回路の形態でナビゲータ12を実施してもよい。
ディジタルバス6及び/又は送信ネットワークはオーディオコンテンツをディジタル形式又はアナログ形式で受信機に送信し、受信機はこれらのコンテンツをメモリ9に記録する。有利な実施形態によれば、オーディオコンテンツは、有利には、例えばMP3のような圧縮規格で符号化され、ディジタル形式で受信され、この同じ形式で格納される。この有利な実施形態によれば、メモリ9は、例えば40ギガバイトの、大容量ハードディスクである。1分のMP3オーディオコンテンツを記憶するために約1メガバイトを占有するようなディスクであれば、666時間の音声ドキュメントを記録することができる。オーディオコンテンツのダウンロードは周知の技術であり、本特許出願において説明する必要はない。
いったん或る一定の数のオーディオコンテンツがメモリ9に格納されると、ユーザはあまり多くの手動操作なしにコンテンツを再生することを望む。さらに、ユーザは調和感が維持されるようにコンテンツが類似性をもって続くことも望む。これを実現するために、ナビゲータのソフトウェアモジュールはオーディオコンテンツの受信中に各オーディオコンテンツを分析し、コンテンツからローレベルパラメータを抽出する。冒頭で指摘したように、これらの歌のディジタル記述子の配列の取得を可能にする多くの信号分析技術が存在している。記述子の要素の数は数十のオーダーである。
図2のスクリーンページに含まれている配列は、或る一定の数のオーディオドキュメントの記述子を構成するローレベルパラメータの値を示している。配列の第1列はオーディオコンテンツのタイトルを示しており、各コンテンツは番号付けされている。後の列は、平均した音の強さ、テンポ、エネルギー、零交差率(英語では《zerocrossing》)、ブライトネス(英語では《brightness》)、エンベロープ、帯域幅(英語では《bandwidth》、ラウドネス、ケプストラム係数などのような、ドキュメントに関連したローレベルパラメータの値を示している。
1つの実施形態によれば、ローレベルパラメータはオーディオコンテンツとともにディジタル形式で供給してもよい。コンテンツがディジタル送信によって圧縮された形で供給される場合、対応付けられたローレベルパラメータはオーディオコンテンツに付与されるフィールドを構成する。パラメータの計算はユーザによってではなく製造者又はコンテンツ提供者により行われ、したがって一度しか行われないため、この解決手段は特に有利である。
ダウンロードされるにせよ、局所的に計算されるにせよ、記述子はメモリ9に格納され、一定の類似性を有するドキュメントのグループを形成するために使用される。第1のアプローチによれば、一貫性のあるグループ(又はクラスタ)へのコンテンツのグループ分けは、例えばk平均アルゴリズム(Mac Queen, “Some Methods for classification and analysis of multivariate observations”, Proc Fifth Berkeley Symposium on Math., Stat. and Prob., vol1, pp 281-296, 1967)のような、いわゆるクラスタリングアルゴリズムを用いて実行することできる。図2の記述子の配列はコンテンツの属するグループを規定する新たな列を有している。k平均アルゴリズムを用いたグループ計算技術は周知であり、このようにして形成されるグループの数は容易に制御することができる。
第2のアプローチによれば、グループは事前のクラス選択(例えば、ムード(英語ではmoods)、主要楽器、テンポなど)とこれらのクラスの定義に役立つ基礎事実とにより決定される。クラスは学この基礎事実に習アルゴリズムを適用することによって得られる。
本発明の現実施形態によれば、受信機からアクセスできる音声ドキュメントはグラフィック識別子によりスクリーン上に表される。これらのグラフィック識別子の位置、つまり、グラフィックページ内での空間座標は、ローレベルパラメータから得られる。図3の例によれば、スクリーンは2次元巡回空間を表しており、点Piは音声ドキュメントSiを表すグラフィック識別子を構成している。グラフィック識別子の座標(xi,yi)は、ローレベル記述子の値を座標にもつ点Piを、選択した表示タイプに依存して、音声サンプルや2,3次元空間などへ射影することによって得られる。射影は主成分分析、すなわちPCAにより決定される。PCAは特に1990年にTechnipにより出版された“Probabilites Analyse de donnees et statistiques”と題するSaportaの文献に記載されている。この周知のデータ分析アルゴリズムは、サンプルを最もよく「広げる」オリジナルに対して線形に結合された軸のサブシステムを発見しようとするものである。これらの軸は相関したオリジナルの軸と混同される傾向のあるものである。ローレベル記述子は知覚的一貫性(音はローレベル記述子の値が近いとき且つそのときに限って知覚的に近い)を有するものとし、射影は連続であるものとすると、スクリーン上で近いグラフィック識別子は知覚的に近い音に対応する。この例は、2次元より高次元の空間によるコレクションの表現を排除するものではまったくない。
一般的には、多次元空間内でのグラフィック識別子の座標{x,y,…z}によってユーザは対応する音声ドキュメントのタイプを頭の中で視覚化することができる。実際、グラフィック識別子の位置はローレベルパラメータの値の関数として計算されるので、2つの識別子が図表的に離れていれば、これら2つの識別子のローレベルパラメータの値は非常に異なり、したがって音声コンテンツのタイプは異なる。他方で、2つの識別子が近ければ、対応する音声コンテンツも同様に聴覚的に近い。歌の或る集合における主次元(又は次元の組合せ)を発見することのできるデータ分析技術が存在している。このことは、これらの主次元とは歌が最も広く分布する軸に対応する次元であると指摘することによって図式化することができる。有利には、ナビゲータは音声ドキュメントを分析し、オーディオコンテンツのタイプに対応した主次元を決定することができる。したがって、巡回空間の次元の数を選択するのはナビゲータである。
同じく図3に示されている実施形態によれば、音声ドキュメントは、例えばk平均アルゴリズムである「クラスタリング」アルゴリズムに従ってグループ分けされる。同一のグループの要素のグラフィック識別子は共通の特性を有する。有利な実施形態によれば、グラフィック識別子の色(例えば、青、赤、及び緑)は、ドキュメントの属するグループに依存する。図3に示されている実施形態は、グラフィック識別子に円形、十字形、又は星形といった特有の形状を与えることにある。図3に示されている実施形態は、閉曲線から成る輪郭線でグループの境界を設定することにある。図3に図示されている例では、ナビゲータは3つのグループA,B,及びCを計算し、そのメンバーを3つの特有の形状で区別し、各グループの輪郭線を閉曲線により表している。1つのグループのドキュメントに対応付けられたグラフィック識別子はスクリーン上にまとまって現れている。実際、スクリーン上での識別子の分布は一般に一様ではなく、巡回空間内には十分に近い識別子のグループ分けが現れ、これらの「星雲」が音声ドキュメントを連鎖させる巡回に対して視覚的利点を付加する。また、物好きなユーザが聴いてみたいと思う孤立した識別子も見られる。異なるタイプのオーディオコンテンツを表すグループをグラフィカルに区別することにより、ユーザは自分のコレクションを「見て」、適当なグループからグラフィック識別子を選択することでオーディオコンテンツを選択することができる。識別子の選択は2つの直交する直線から成るターゲットを移動させることにより行われ、目的のオブジェクトはこれらの直線の交点にある。ユーザはリモートコントローラ又は「ジョイスティック」の方向キーを用いてターゲットを動かす。スクリーンの下部にあるウィンドウは再生中のオーディオコンテンツのタイトルを表示し、このコンテンツがユーザの要望に合っていれば、ユーザは「OK」を押し、コンテンツが再生される。ウィンドウにタイトルが表示されない場合は、ターゲットがいずれのオーディオコンテンツも指していないことを意味する。
上の段落では、メモリ9に格納されたコレクションに含まれている単一の音声ドキュメントの選択及び再生を説明した。今度は、複数のオーディオコンテンツの自動巡回を説明する。
複数のオーディオコンテンツの自動連鎖を始動させるには、ユーザが事前に巡回ストラテジーを確立していなければならない。ユーザは、或る意味で宇宙空間内の星雲を思わせるグラフィックスのおかげで、自分のコレクションのコンテンツに関する十分な知識を有しており、巡回ストラテジーの考え方は、これらの要素のグループをトラバースする経路を確立するというものである。巡回にとって同じタイプのドキュメントをグループに表すことは必須ではない。しかしながら、自分のオーディオコレクションがどのように分布するかをよりよく想像しようとするユーザには助けになる。
つぎに、ユーザが選択することのできる自動巡回の複数のストラテジーを説明する。目的は、ストラテジーの選択とドキュメントの自動連鎖の決定のための決定手段としてグラフィック表現を使用することである。第1のストラテジーは直線分のストラテジーである。この巡回ストラテジーは図4のデッサンによって示されている。ユーザは開始ドキュメントDd(したがって出発点である)と終着ドキュメントDf(相応する終着点である)を選択し、巡回を開始させる。すると、ナビゲータがこれら2つのグラフィック識別子の間の直線分Sを表示し、この直線分を用いてコレクションの各識別子の距離を計算する。つぎに、ナビゲータは開始ドキュメントに対応付けられた音声ドキュメントを再生し、直線分から距離が最大のドキュメントを次々に再生する。1つの実施形態は、出発点から終着点まで直線分を移動するマーク(例えば、図4及び5のスマイルマーク)を表示し、このマークに基づいてグラフィック識別子の距離を計算することにある。直線分上でのマークの位置を通して、ユーザは巡回の進展を追い、終着点に達する前に残り時間を求めることができる。
この巡回ストラテジーによれば、ユーザは、出発点(図4ではDdで表す)の座標、終着点(図4ではDfで表す)の座標、及び、ナビゲータにより選択されたグラフィック識別子と直線分との間の距離(図4ではdで表す)の3つのパラメータを入力する。グラフィック識別子を選択する1つの方法は、方向キーによってスクリーン上でインデックス(選択すべき点を含んだ四角形)を動かすことであり、ナビゲータは自動的にグラフィック識別子上にこの四角形を置く。第3のパラメータに関しては、ユーザは1から99までの値をキー入力する。
コレクションの各グラフィック識別子の距離は最初の再生の前に線分を用いて計算されるので、ナビゲータは逐次再生されるドキュメントの数を知っており、スクリーンの隅のグラフィックウィンドウにその数を表示する。ウィンドウ内には、再生中の音声ドキュメントの通し番号も表示される。
この線分をベースとした巡回ストラテジーによれば、或るタイプの音声ドキュメントから別の音声ドキュメントへ移動することができ、一方のドキュメントから他方のドキュメントへの移動は、ドキュメントが図表的に近いため、穏やかに行われる。
螺旋ストラテジーは図5に示されている。ユーザは開始ドキュメントDd(したがって出発点である)と曲率半径Rを選択し、巡回を開始させる。すると、ナビゲータは、出発点に中心を持ち、この識別子までの距離が回転のたびに値Rだけ増大する螺旋を表示する。前と同様に、ナビゲータは表示された各識別子の距離をこの螺旋を用いて計算する。つぎに、ナビゲータは開始ドキュメントに対応付けられた音声ドキュメントを再生し、螺旋からの距離が最大のドキュメントを次々に再生する。前と同じように、ナビゲータはドキュメントの再生に付随して螺旋に沿って動くマークを表示し、グラフィックウィンドウには、逐次再生されるドキュメントの数と、また再生中の音声ドキュメントの通し番号も表示する。再生の連鎖は、ナビゲータが最大距離に位置するドキュメントをもはや見つけられなくなったときに終了する。これは一般に螺旋のインデックスがスクリーンを出たという事態に対応する。
ユーザが音声ドキュメントのグループの中央に出発点を置いた場合、このストラテジーはグループの大部分をスキャンし、長時間にわたって同タイプのドキュメントの再生を可能にする。一方、ユーザが出発点を音声ドキュメントの2つのグループの境界に置いた場合、螺旋の回転のたびに、ナビゲータは一方のグループのドキュメントを再生し、つぎには他方のグループのドキュメントを再生することで、再生のタイプを変えることができる。
これら2つのストラテジーは、きちんと決められた、したがってまたユーザが同じパラメータを入力した場合には同一に再生される連鎖に従って、コレクションの一部をスキャンすることができるようにする。第3のストラテジーはランダムな側面を伴っている。ユーザは開始ドキュメントDd(したがってまた出発点である)と円の半径を選択し、巡回を始動させる。すると、ナビゲータは、出発点を中心として持つ円を表示する。つぎに、ナビゲータは円で囲まれたゾーンの中でグラフィック識別子をランダムに選択し、対応するドキュメントを再生する。巡回はすべてのドキュメントが再生されたときに終了する。前と同様に、ナビゲータはグラフィックウィンドウに逐次再生されるドキュメントの数と、また再生中の音声ドキュメントの通し番号も表示する。第3のストラテジーは(出発点に応じて)第2のストラテジーと同じ利点の他にさらに、ドキュメントがつねに同じ連鎖で再生されるのを防ぐという利点も有している。
受信機からアクセスできるドキュメントの数が非常に大きい場合には、これらドキュメントの各々のグラフィック表現をスクリーン上に表示することはもはや可能でない。1つの実施形態によれば、グラフィックページはグラフィック表現のセレクションを表示し、ユーザは、例えばドキュメントの属性で定義されるようなジャンル、又はドキュメントの作成日もしくは記録日、又はドキュメントが歌であれば歌手の名前などの基準を入力する。
本発明は図示された具体的な実施例を参照して説明されているが、これらの実施例に限定されるものではまったくなく、付属の請求項によってのみ限定される。当業者により変更及び改造が為されうることに注意されたい。
本発明を実施するための再生装置のブロック回路図である。 コレクションの各ドキュメントに対してそのローレベルパラメータの値を対応付ける配列を示す。 2次元空間内でドキュメントのコレクションを示すスクリーンショットである。 音声ドキュメントを自動的に連鎖させるいわゆるセグメント巡回ストラテジーを示すスクリーンショットである。 音声ドキュメントを自動的に連鎖させる螺旋巡回ストラテジーを示すスクリーンショットである。

Claims (18)

  1. ディスプレイ装置を備えた再生装置に格納された音声ドキュメントのコレクション内を巡回する方法であって、
    前記コレクションの各音声ドキュメントを格納するステップと、
    各ドキュメントに固有のオーディオパラメータを求めるため前記ドキュメントを分析するステップを有する形式の方法において、
    ディスプレイ装置のグラフィックページ上で音声ドキュメントの少なくとも一部に対応するグラフィック識別子の位置を決定し、ただし、各グラフィック識別子の位置は所与のドキュメントに対して事前に計算された前記パラメータに依存しており、
    グラフィックページ内でのドキュメントのグラフィック識別子の位置と再生装置に固有の幾何学的特徴とを考慮したストラテジーに従って音声ドキュメントを選択及び逐次再生することにより自動巡回を行う、ことを特徴とする音声ドキュメントのコレクション内を巡回する方法。
  2. 近いパラメータ値を有するドキュメントのグループを決定するステップを有し、前記グラフィック識別子は類似性をもつグループのドキュメントに対応付けられる、請求項1記載の巡回方法。
  3. ドキュメントを自動的に連鎖して再生するために再生装置によって使用される巡回ストラテジーを指定することにより巡回を開始させるコマンドを受信するステップを有する、請求項1又は2記載の巡回方法。
  4. ドキュメントを自動的に連鎖して再生するために再生装置により巡回ストラテジーを決定するステップを有する、請求項1又は2記載の巡回方法。
  5. 巡回は、対応するグラフィック識別子を出発点と終着点の間の直線分の近傍にもつドキュメントを自動的に選択及び再生することから成り、最初に選択されるドキュメントは出発点に位置するドキュメント又は前記出発点に最も近い位置にあるドキュメントである、請求項1から4のいずれか1項記載の巡回方法。
  6. 巡回は、対応するグラフィック識別子を出発点から始まりスクリーンの端で終わる線から成る幾何学形の近傍にもつドキュメントを自動的に選択及び再生することから成り、最初に選択されるドキュメントは始点に位置するドキュメント又は前記始点に最も近い位置にあるドキュメントである、請求項1から4のいずれか1項記載の巡回方法。
  7. グラフィック識別子のサブセットを求める先行するステップを有し、自動巡回は前記サブセットのグラフィック識別子に対応した各ドキュメントをランダムに逐次選択することから成る、請求項1から4のいずれか1項記載の巡回方法。
  8. 決定されたストラテジーに従って再生されるドキュメントの数を表示するステップを有する、請求項1から7のいずれか1項記載の巡回方法。
  9. 再生中のドキュメントの通し番号を表示するステップを有する、請求項1から8のいずれか1項記載の巡回方法。
  10. 中央ユニット(3)、音声ドキュメントを受信する手段(5,6;4)、受信したドキュメントを格納する手段(9)、ユーザコマンドを入力する手段(7,8)、及び、各ドキュメントに固有のパラメータを求めるために格納されたドキュメントを分析する手段(3,12)を有する再生装置であって、
    格納された音声ドキュメントの少なくとも一部に対応するグラフィック識別子のグラフィックページを表示する手段(3,10,11,12)と、グラフィックページ内でのドキュメントのグラフィック識別子の位置と再生装置に固有の幾何学的特徴とを考慮したストラテジーに従って音声ドキュメントを自動的に連鎖再生する巡回手段(3,12)を有しており、ただし、各ドキュメントのグラフィック識別子の位置は事前に計算された前記パラメータに依存している、ことを特徴とする再生装置。
  11. 近いパラメータ値を有するドキュメントのグループを決定する手段(3,12)を有し、前記グラフィック識別子は類似性をもつグループのドキュメントに対応付けられる、請求項10記載の再生装置。
  12. ドキュメントを自動的に連鎖して再生するために再生装置によって使用される巡回ストラテジーを指定することにより巡回を開始させるコマンドを受信する手段を有する、請求項10又11記載の再生装置。
  13. ドキュメントを自動的に連鎖して再生するために再生装置により巡回ストラテジーを求める手段を有する、請求項10又は11記載の再生装置。
  14. 前記巡回手段(3,12)は、対応するグラフィック識別子を出発点と終着点の間の直線分の近傍にもつドキュメントを自動的に選択及び再生し、最初に選択されるドキュメントは出発点に位置するドキュメント又は前記出発点に最も近い位置にあるドキュメントである、請求項10から13のいずれか1項記載の再生装置。
  15. 前記巡回手段(3,12)は、出発点に始まりスクリーンの端に終わる線から成る幾何学形の近傍に対応するグラフィック識別子をもつドキュメントを自動的に選択及び再生し、最初に選択されるドキュメントは始点に位置するドキュメント又は前記始点に最も近い位置にあるドキュメントである、請求項10から13のいずれか1項記載の再生装置。
  16. グラフィック識別子のサブセットを求める手段(3,12)を有し、前記巡回手段は前記サブセットのグラフィック識別子に対応した各ドキュメントをランダムに逐次選択する、請求項10から13のいずれか1項記載の再生装置。
  17. 決定されたストラテジーに従って再生されるドキュメントの数を表示する手段(3,10,11,12)を有する、請求項10から16のいずれか1項記載の再生装置。
  18. 再生中のドキュメントの通し番号を表示する手段(3,10,11,12)を有する、請求項10から17のいずれか1項記載の再生装置。
JP2006518309A 2003-07-03 2004-07-02 グラフィカルインタフェースを用いてオーディオドキュメント集合内を巡回する方法、及び当該方法による巡回のための受信機 Active JP4372151B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0308110A FR2857122A1 (fr) 2003-07-03 2003-07-03 Procede de navigation dans un ensemble de documents sonores a l'aide d'une interface graphique, et recepteur pour la navigation selon le procede
PCT/FR2004/050305 WO2005006163A2 (fr) 2003-07-03 2004-07-02 Procédé de navigation dans un ensemble de documents sonores à l'aide d'une interface graphique, et récepteur pour la navigation selon le procédé

Publications (2)

Publication Number Publication Date
JP2007525779A true JP2007525779A (ja) 2007-09-06
JP4372151B2 JP4372151B2 (ja) 2009-11-25

Family

ID=33522723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006518309A Active JP4372151B2 (ja) 2003-07-03 2004-07-02 グラフィカルインタフェースを用いてオーディオドキュメント集合内を巡回する方法、及び当該方法による巡回のための受信機

Country Status (8)

Country Link
US (1) US7590938B2 (ja)
EP (1) EP1642219A2 (ja)
JP (1) JP4372151B2 (ja)
KR (1) KR101090388B1 (ja)
CN (1) CN100461165C (ja)
FR (1) FR2857122A1 (ja)
MX (1) MXPA05013997A (ja)
WO (1) WO2005006163A2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007121935A (ja) * 2005-10-31 2007-05-17 Yamaha Corp 音楽素材編集方法及び音楽素材編集システム
JP2007140136A (ja) * 2005-11-18 2007-06-07 Mitsubishi Electric Corp 楽曲分析装置及び楽曲検索装置
JP2007172702A (ja) * 2005-12-20 2007-07-05 Sony Corp コンテンツ選択方法及びコンテンツ選択装置
JP2010271398A (ja) * 2009-05-19 2010-12-02 Yamaha Corp 音素材検索装置
WO2013046629A1 (ja) * 2011-09-30 2013-04-04 旭化成株式会社 基本周波数抽出装置および基本周波数抽出方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602004017475D1 (de) * 2003-08-07 2008-12-11 Thomson Licensing Verfahren zum wiedergeben von audio-dokumenten mit hilfe einer schnittstelle mit dokumentgruppen und assoziierte wiedergabeeinrichtung
US20070038671A1 (en) * 2005-08-09 2007-02-15 Nokia Corporation Method, apparatus, and computer program product providing image controlled playlist generation
KR100782825B1 (ko) * 2005-12-01 2007-12-06 삼성전자주식회사 오디오 컨텐츠 선택 정보 제공 방법 및 장치와 그 방법을수행하는 프로그램이 기록된 기록매체
WO2007066663A1 (ja) * 2005-12-05 2007-06-14 Pioneer Corporation コンテンツ検索装置、コンテンツ検索システム、コンテンツ検索システム用サーバ装置、コンテンツ検索方法及びコンピュータプログラム並びに検索機能付きコンテンツ出力装置
TWI384413B (zh) * 2006-04-24 2013-02-01 Sony Corp An image processing apparatus, an image processing method, an image processing program, and a program storage medium
WO2007143693A2 (en) 2006-06-06 2007-12-13 Channel D Corporation System and method for displaying and editing digitally sampled audio data
US7730414B2 (en) * 2006-06-30 2010-06-01 Sony Ericsson Mobile Communications Ab Graphical display
US7542039B2 (en) * 2006-08-21 2009-06-02 Pitney Bowes Software Inc. Method and apparatus of choosing ranges from a scale of values in a user interface
JP5227521B2 (ja) 2007-02-26 2013-07-03 富士フイルム株式会社 インク組成物、インクジェット記録方法、印刷物、及び、インクセット
US20080222188A1 (en) * 2007-03-05 2008-09-11 Kaleidescape, Inc. Playlists responsive to coincidence distances
US9015633B2 (en) * 2007-10-22 2015-04-21 Sony Corporation Data management apparatus and method for organizing data elements into multiple categories for display
US9020914B2 (en) * 2008-06-13 2015-04-28 Sony Corporation Automatic song selection
EP2159719B1 (en) 2008-08-27 2013-01-09 Sony Corporation Method for graphically displaying pieces of music
KR20100101912A (ko) * 2009-03-10 2010-09-20 삼성전자주식회사 동영상 파일을 연속 재생하는 방법 및 장치
CN101901622B (zh) * 2009-05-27 2012-08-29 鸿富锦精密工业(深圳)有限公司 音频资料定位方法
KR101695490B1 (ko) * 2009-12-23 2017-01-12 삼성전자주식회사 컨텐츠 검색방법
WO2012035471A1 (en) * 2010-09-13 2012-03-22 Koninklijke Philips Electronics N.V. A method and apparatus for selecting an audio item
WO2012103840A2 (zh) 2012-03-29 2012-08-09 华为技术有限公司 对象过滤方法及终端设备
DE102013221865A1 (de) * 2013-10-28 2015-04-30 Johnson Controls Automotive Electronics Gmbh Verfahren und Vorrichtung zur Verarbeitung eines Datensatzes

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6480194B1 (en) * 1996-11-12 2002-11-12 Silicon Graphics, Inc. Computer-related method, system, and program product for controlling data visualization in external dimension(s)
AU7627398A (en) * 1996-12-02 1998-06-29 Thomson Consumer Electronics, Inc Apparatus and method for identifying the information stored on a medium
US7596755B2 (en) * 1997-12-22 2009-09-29 Ricoh Company, Ltd. Multimedia visualization and integration environment
US6934464B1 (en) * 1998-12-23 2005-08-23 Matsushita Electric Industrial Co., Ltd. Video/audio data recording apparatus, video/audio data reproducing apparatus, video/audio data recording/reproducing apparatus, video/audio data recording method, video/audio data reproducing method, and program recording program recording medium
GB2368665A (en) * 2000-03-02 2002-05-08 Outersonic Ltd On-line multimedia product catalogue
CA2357289A1 (en) * 2000-09-28 2002-03-28 At&T Corp. Graphical user interface text-based interpolation searching
FR2822261A1 (fr) * 2001-03-16 2002-09-20 Thomson Multimedia Sa Procede de navigation par calcul de groupes, recepteur mettant en oeuvre le procede, et interface graphique pour la presentation du procede
US7861169B2 (en) * 2001-11-19 2010-12-28 Ricoh Co. Ltd. Multimedia print driver dialog interfaces

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007121935A (ja) * 2005-10-31 2007-05-17 Yamaha Corp 音楽素材編集方法及び音楽素材編集システム
JP4670591B2 (ja) * 2005-10-31 2011-04-13 ヤマハ株式会社 音楽素材編集方法及び音楽素材編集システム
JP2007140136A (ja) * 2005-11-18 2007-06-07 Mitsubishi Electric Corp 楽曲分析装置及び楽曲検索装置
JP4668039B2 (ja) * 2005-11-18 2011-04-13 三菱電機株式会社 楽曲分析装置及び楽曲検索装置
JP2007172702A (ja) * 2005-12-20 2007-07-05 Sony Corp コンテンツ選択方法及びコンテンツ選択装置
JP2010271398A (ja) * 2009-05-19 2010-12-02 Yamaha Corp 音素材検索装置
WO2013046629A1 (ja) * 2011-09-30 2013-04-04 旭化成株式会社 基本周波数抽出装置および基本周波数抽出方法

Also Published As

Publication number Publication date
EP1642219A2 (fr) 2006-04-05
FR2857122A1 (fr) 2005-01-07
WO2005006163A3 (fr) 2005-06-23
CN100461165C (zh) 2009-02-11
WO2005006163A2 (fr) 2005-01-20
JP4372151B2 (ja) 2009-11-25
CN1836230A (zh) 2006-09-20
US20060202994A1 (en) 2006-09-14
KR101090388B1 (ko) 2011-12-07
KR20060080538A (ko) 2006-07-10
US7590938B2 (en) 2009-09-15
MXPA05013997A (es) 2006-03-16

Similar Documents

Publication Publication Date Title
JP4372151B2 (ja) グラフィカルインタフェースを用いてオーディオドキュメント集合内を巡回する方法、及び当該方法による巡回のための受信機
JP4711683B2 (ja) ディスプレイを使用することなしにオーディオコンテンツのメニューを作成及びアクセスするための方法
US9665629B2 (en) Media device and user interface for selecting media
US20080188964A1 (en) Procedure And Apparatus For Generating Automatic Replay Of Recordings
US7521620B2 (en) Method of and system for browsing of music
US20070089057A1 (en) Method and system for selecting media
US20120023403A1 (en) System and method for dynamic generation of individualized playlists according to user selection of musical features
EP2096626A1 (en) Method for visualizing audio data
JP2005521979A (ja) “dj”モードを有するメディアプレーヤ
KR100978689B1 (ko) 미디어 선택 방법 및 시스템
US20220335084A1 (en) User consumption behavior analysis and composer interface
CN100375191C (zh) 具有可变随机播放选项的声频系统
US20060200769A1 (en) Method for reproducing audio documents with the aid of an interface comprising document groups and associated reproducing device
US20120271830A1 (en) Data processing device
Dittenbach et al. Playsom: An alternative approach to track selection and playlist generation in large music collections
US20170039026A1 (en) Auditory Transition System
JP2000268541A (ja) 音楽ソフト自動分類装置
JP4858332B2 (ja) オーディオ装置及び連続再生プログラム
CN1833282B (zh) 借助于包括文件组的界面来再现音频文件的方法和相关联的再现设备
Dittenbach et al. PlaySOM and PocketSOMPlayer, Alternative Interfaces to Large Music Collections

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090430

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090819

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090901

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120911

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4372151

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130911

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250