JP5015789B2 - 関連コンテンツの抽出における位置類似性閾値の適応化 - Google Patents

関連コンテンツの抽出における位置類似性閾値の適応化 Download PDF

Info

Publication number
JP5015789B2
JP5015789B2 JP2007543974A JP2007543974A JP5015789B2 JP 5015789 B2 JP5015789 B2 JP 5015789B2 JP 2007543974 A JP2007543974 A JP 2007543974A JP 2007543974 A JP2007543974 A JP 2007543974A JP 5015789 B2 JP5015789 B2 JP 5015789B2
Authority
JP
Japan
Prior art keywords
content item
location
distance
candidate
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007543974A
Other languages
English (en)
Other versions
JP2008522308A (ja
Inventor
エム アー ディーデリクス,エルモ
デ スライス,バルテル エム ファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008522308A publication Critical patent/JP2008522308A/ja
Application granted granted Critical
Publication of JP5015789B2 publication Critical patent/JP5015789B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/322Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier used signal is digitally coded

Description

本発明は、コンテンツ抽出、管理及び提示の分野に関し、コンテンツアイテム類似性閾値の決定に関する。
近年、パーソナルコンピュータ上のハードドライブと他のタイプの記憶媒体を含む記憶装置及びデータベースの記憶容量は急速に増大してきている。ある予想では、記憶容量は毎年ほぼ2倍となり、ネットワーク帯域幅もまた大変急速に増大してきている。この結果、記憶装置は、それへのユーザアクセスが実現される必要があるより大量のコンテンツを格納している。ユーザは、記憶装置又はデータベース上、さらにユーザ自らのハードドライブ上に格納されているコンテンツに圧倒される可能性があり、コンテンツがユーザにとって便利なアクセスを提供するよう何れかの方法により管理又は整理されていない場合、インターネットなどのネットワーク上で利用可能なコンテンツを抽出することができないかもしれない。ユーザに透過な方法によりインデックス処理又は整理されていないコンテンツは、ユーザニーズに関する限り“欠落”してしまうかもしれず、抽出されないかもしれない。
多くのデータ抽出スキームが知られている。Farnhamらの米国特許出願公報第2003/0158855号は、コンピュータファイル間の数値として表される類似度が決定されるように、関連付けがオブジェクト又はメタデータの間で動的に生成される自動的なコンテクストの関連付けについて開示している。Stublerらの米国特許出願公報第2002/0188602号は、取得した画像のメタデータを抽出することによって、格納されている画像と取得した画像との類似性に基づき、取得した画像のキャプション又はセマティックラベルの生成について開示している。Plattの米国特許出願公報第2003/0221541号は、“所望されないシード(undesirable seed)”楽曲を含む複数のシード楽曲がプレイリスト上の楽曲を生成するのに使用される自動プレイリスト生成装置を開示している。Clutsの米国特許第5,616,876号は、エディタにより以前に書き込まれた各楽曲の“スタイルラベル”に基づき、第1楽曲セットと同様のさらなる楽曲を選択することを開示している。しかしながら、上記参考文献の何れも、ターゲットアイテムの選択又は拒絶における位置類似性に対して閾値を設定することについて開示していない。Princeの米国特許出願公報第2002/0099696号は、類似度にスコアが与えられ、抽出されるアイテムを選択するのに閾値が使用されるファジーデータベース抽出を開示している。しかしながら、Princeもその他の参考文献も、ベース位置に基づく閾値の設定について、またベース位置と特定されたアイテム位置との間の距離に基づく閾値の設定については開示も示唆もされていない。
もちろんユーザがコンテンツアイテムを抽出することは可能であるが、特に所望のコンテンツのコンテンツタイプがユーザによって指定されず、又は知られていない場合、類似するアイテムを特定しようとすることは時間がかかり面倒な作業となる可能性がある。さらに、コンテンツアイテムがユーザにより制御される記憶装置又はデータベースに蓄積し続けるに従って、コンテンツアイテムを抽出する作業はさらに困難となる。
抽出システムの機能を実現又は実行する方法、システム、デバイス、エンジン、装置及びコンピュータ可読媒体が提供される。
選択された候補となるコンテンツアイテムが、ユーザ又はデータベースに提供される。ベース位置が決定される。第1位置が、第1の特定されたコンテンツアイテムの位置デー0他を抽出することによって特定される。その後、第1閾値が、ベース位置と第1位置との間で決定される基準距離に基づき設定される。候補となる位置が特定され、候補となるコンテンツアイテムの位置データが抽出される。ベース位置と第1候補位置との間の距離が、候補距離として決定されるかもしれない。候補となるコンテンツアイテムは、第1候補距離と第1閾値とに基づき抽出のため又は類似として選択され、選択された候補コンテンツの選択信号が、これに従って出力される。
さらに、基準距離に基づく第2閾値が設定され、この第2閾値は第1閾値と一緒になってある範囲を有し、その後、第1候補距離が当該範囲内にある場合、候補コンテンツアイテムが選択される。
第1位置は、コンテンツアイテム取得位置、コンテンツアイテムを直近に使用した位置、又はコンテンツアイテムを最もよく使用した位置を含むかもしれない。この位置は、コンテンツアイテムの現在位置、コンテンツアイテムの直近の変更位置、又はコンテンツアイテム生成位置であってもよい。
ベース位置は、第1の特定されたコンテンツアイテム、ユーザの自宅、ユーザのオフィス、ユーザの自動車及びユーザの現在位置であってもよい。
ベース位置及び位置データは、GPS情報又はユーザエントリに基づき決定することが可能である。
さらなる追加的な特定されたコンテンツアイテムが特定され、位置及び距離が決定され、これにより、第1閾値がまた決定された基準距離に基づき設定されてもよい。
以下の説明及び上記図面は、発明者によって現在最も良く理解されるような出願人の発明の実施例を記載するが、本発明の多くの改良が可能であり、本発明が、本発明の趣旨から逸脱することなく他の形式により実現され、また他の方法により実現されてもよいということが理解されるであろう。さらに、記載される実施例のいくつかの特徴は、本発明の趣旨から逸脱することなく、省略され、選択的に若しくは全体的に他の実施例と組み合わされ、又は他の実施例若しくはその一部の特徴を置換するのに利用されてもよい。従って、図面及び詳細な説明は、本発明のいくつかの側面の例示的な説明として解釈されるべきものであり、本発明の範囲を限定するものと解釈されるべきでない。
図1に示されるように、抽出システム1−1は、後述されるいくつかのモジュールを有している。抽出システム1−1のモジュール、その一部及び/又は抽出システム全体は、ハードウェア、ソフトウェア、ファームウェア又は上記の組み合わせから構成可能であるが、一部のモジュールがハードウェアなどから構成され、他のモジュールがソフトウェア、ファームウェア又はそれらの組み合わせから構成されるようにしてもよい。
抽出システムのすべてのモジュールが同一の装置に配置又は統合されている必要はないということが理解されるであろう。分散化されたアーキテクチャはまた、既存の装置によって提供される適切なモジュールから“ピギーバック(piggy−back)”する抽出システムについて考えられる。
以下の説明は、有線又は無線接続を介しデータベース1−2に物理的に一体化又は接続される抽出システム1−1について言及する。抽出システム1−1はまた、GPS装置(図示せず)に統合又は接続されてもよい。データベース1−2は、パーソナルコンピュータ、パーソナルビデオレコーダ、エンターテイメントシステム、エレクトロニックオーガナイザ、パーソナル携帯装置、Jazドライブのハードドライブなどの記憶装置により実現されてもよく、又はディスクドライブなどの商用の記憶装置として実現されてもよい。データベース1−2は、このような装置の2以上におけるコンテンツアイテムの整理又はグループ化が可能となるように、接続されるいくつかの記憶装置を含むかもしれないということは理解されるであろう。さらに、データベースは、データベース1−2にロード及びそれにより抽出可能なCD、DVD、zipディスク、フロッピー(登録商標)ディスク、データカートリッジなどを含むディスクなどの1以上の記憶媒体を含むものであると理解されるかもしれない。しかしながら、抽出システム1−1はまた、LAN、WAN、インターネットなどのネットワーク1−9を介しコンテンツを抽出することが可能であるということが理解されるであろう。
図1に示されるように、抽出システム1−1は、コンテンツアイテムから特定のタイプのデータを収集するモジュールである位置データ抽出装置1−11を含む。コンテンツアイテムは、ビデオ、ビデオクリップ、ムービー、フォト、テキストファイル、音楽データ、オーディオファイル、又はJPEGファイルやXMLデータなどの他のタイプのマルチメディアデータであってもよい。例えば、ビデオは、デジタルビデオレコーダ上のホームビデオショットであってもよく、ムービーは、MPEG(MPEG−2、MPEG−3などを含む)として符号化されたフィルムなどの市販のフィルムデータであってもよく、フォトは、デジタル写真データ、写真又は写真アルバム群であってもよい。テキストファイルは、ワープロにより生成されたファイル、スプレッドシート、又はコンピュータコードファイルであってもよい。音楽データは、MP3ファイルなどであってもよい。
位置データ抽出装置1−11によって抽出される記述データは、コンテンツアイテムに関する使用データ又はメタデータなどの情報を含む。このような情報はまた、アイテムの生成場所、アイテムの取得場所、コンテンツアイテムの最後の/最初の/2番目などの再生及び/又は編集場所、アムステルダム又は所与の通りのアドレスにおいて主として使用されるアイテムなどの最もよく使用される場所、当該アイテムはリビングで主として使用される、ユーザの自宅などのコンテンツアイテムの位置データを含むものであってもよい。ここで使用される“主として”とは、平均使用位置、メディアン使用位置、使用位置のモードなどに基づくものであってもよい。このような使用履歴データは、ときにはメタデータとして知られるかもしれず、他方、メタデータのタイプはときには使用履歴データと呼ばれる。
ここに記載される位置情報は、1つ又は多くの当該類似性特徴であるかもしれず、又はそれは唯一の又は最も重要な特徴であるかもしれない。このようなファクタは、(そうであったとしても)重み付けされる程度は、ユーザニーズとアプリケーションに依存するであろう。
アイテムに関するこのような記述データは、アイテムから、インデックス又はデータベース管理ファイルから、インターネット1−9との有線又は無線接続を介し抽出システム1−1に接続されるワールドワイドウェブなどの外部ソースからを含む各種方法により配置及び抽出されてもよいということが理解されるであろう。
特定されたコンテンツアイテムは、いくつかの方法の1つにより特定されてもよい。ユーザは、“候補となるコンテンツアイテム”とときには呼ばれる他のアイテムがそれに基づき抽出されるアイテムを指定してもよい。あるいは、新たに追加又は生成されるコンテンツアイテムは、それに基づき他のアイテムが抽出される特定されたコンテンツアイテムとして自動的に指定されてもよい。
ベース位置が、ベース位置決定装置1−13により決定される。このようなベース位置は、例えば、第1の特定されたコンテンツアイテムの現在位置、ユーザの自宅、オフィス若しくは自動車の位置、ユーザの現在位置、ユーザが頻繁に訪れる場所、又は最近訪れた場所などであってもよい。ベース位置はまた、ユーザの存在が最もよく検出され、又は頻繁に検出される場所(又は検出された場所の平均、メディアン又はモードに基づく最もよく検出される場所)、又はある関連する最近の期間におけるユーザの時間の大部分を過ごした場所であってもよい。ユーザが携帯装置又はノートブックコンピュータを使用している場合、ベース位置は、当該携帯装置又はコンピュータノートブックが頻繁に(又は最もよく)ある、又は最近訪れた場所であってもよい。このような携帯装置又はコンピュータノートブックの存在はまた、関連する直近の期間に基づくベース位置として決定されてもよい。また、ベース位置は、抽出システム1−1の位置であってもよい。このようなベース位置は、ユーザにより入力若しくは設定され、以前にプログラムされ、第1の特定されたコンテンツアイテムのメタデータから若しくはシステムがアクセスする他の文書から決定され、GPS装置を介し受信したGPSデータを参照して決定され、インターネット若しくは他のネットワークから決定され、又は上記の組み合わせによるものであってもよい。
位置データ抽出装置1−11はまた、特定されたコンテンツアイテムの位置を決定し、特定されたコンテンツアイテムとベース位置との間の距離を決定する。この距離は、ときには第1基準距離と呼ばれる。位置は、コンテンツアイテムに係るメタデータ、GPSデータ若しくはデータベースインデックスを参照することによって、ワールドワイドウェブなどを含むネットワーク1−9を参照することによって、ユーザ入力を要求することによって、又は上記の組み合わせにより決定されてもよい。距離は、テーブルを参照することによって、GPS情報に基づく計算によって、ユーザ入力を要求することによって、又は上記の組み合わせによって決定されてもよい。
閾値設定装置1−14は、候補となるコンテンツアイテムが選択されるため充足する必要がある閾値又は範囲を設定する。この閾値又は範囲は、第1基準距離に基づき閾値設定装置1−14により設定される。例えば、第1基準距離が近隣都市間の距離である場合、閾値はほぼ当該距離の距離とすることが可能である。
候補コンテンツアイテム特定装置1−12は、データベースにおいて、ネットワーク接続を介し又は他のソースから、上記メタデータ若しくは他の情報に関して、及び/又はベース位置に対する第1の特定されたコンテンツアイテムの距離とベース位置からのそれらの距離に基づき類似である候補となるコンテンツアイテムを特定する。
コントローラ1−15は、抽出システム1−1の機能全体を調整し、ユーザインタフェース1−1、データベース1−2、サーバ1−9及び外部とやりとりし、システム設定を処理する。
選択装置1−16は、適格な候補となるコンテンツアイテムを選択し、結果出力1−17は、選択された及び/又は拒絶された候補となるコンテンツアイテムの結果信号を提供する。結果出力1−17は、ユーザ(図示せず)とのやりとりを含む外部との通信及び他の装置とやりとりする。特に、抽出結果出力1−17は、抽出システム1−1により抽出されたコンテンツアイテムをユーザインタフェースに通知する。ユーザインタフェース1−3は、独立した装置であってもよく、又はパーソナルコンピュータ、パーソナルビデオレコーダ、上述したストレージ及び他の装置の1以上などの他の装置又はシステムと統合されてもよい。
さらに利用可能な特定されるコンテンツアイテムが存在するかもしれない。従って、当該位置データ抽出処理及び/又は距離決定は、任意数の利用可能な特定されたコンテンツアイテム1〜N(Nは、1より大きな正の整数)に対して繰り返されるかもしれない。その後、候補となるコンテンツアイテムの選択が、このようなすべての基準距離の平均に基づき実行される。
図1〜2を参照して、本発明の実施例の処理が説明される。上述したように、図1に示されるユーザインタフェース1−3を介しユーザによって、又はデータベース1−2の新たに追加されたコンテンツアイテム又は孤立したコンテンツアイテムを検出などすることによってシステムにより自動的に特定される。
S1において、上述したように、ベース位置決定装置1−13がベース位置を決定する。抽出システム1−1の位置データ抽出装置1−11は、図2のS2において示されるように、第1の特定されたコンテンツアイテムの第1位置データを抽出する。S2において、さらなる特定されたコンテンツアイテムが、例えば、ユーザ又はシステムがそれに基づきターゲット文書が抽出されるいくつかの“アンカー”文書を指定する場合など、同様に処理されるかもしれない。
S3において、基準距離が、各特定されたコンテンツアイテムの位置とベース位置との間の距離を決定することによって、各特定されたコンテンツアイテムにより決定される。S4において、そのような基準距離は、平均的な基準距離で到着するよう平均化されてもよい。ここで使用される平均とは、算術平均、モード又はメディアンの計算に基づき決定されるかもしれない。さらに、上記値の単純和が、選択された値の合成的な視点を提供するのに適切に選択された統計的機能と共に利用されてもよい。
S5において、閾値又は範囲が、基準距離又は平均基準距離に基づき設定される。例えば、1又は0の値は、ベース距離と第1の特定されたコンテンツアイテムとの間の距離が僅かであることを示し、9又は10の値は距離が大きいことを示すように、閾値が割り当てられてもよい。あるいは、1〜10のスケールを使用する代わりに、閾値は、例えば、“同一の距離”、“大変近い距離”、“近い距離”、“離れた距離”、“大変離れた距離”又はそのような指定などを表すものであってもよい。このような値の他の多数のスキームが、本発明の趣旨から逸脱することなく利用可能であるということは理解されるであろう。
さらに、第2閾値が同様にして選択されてもよい。第1閾値は最大距離を表し、第2閾値は最小距離を表し、一緒になってこれらの閾値がある範囲を構成する。候補となるアイテムは、それらの距離が当該範囲内に属する場合に限って(ベース距離と候補となるコンテンツアイテム距離との間の距離)、選択される。
S6において、図1の候補コンテンツアイテム特定装置1−12は、データベースにおいて、ネットワークを介して又は何れかにおいて候補となるコンテンツアイテムを特定し、位置データ抽出装置1−11(図2)は、各候補となるコンテンツアイテムの位置データを抽出する。その後S7において、候補となるコンテンツアイテムの距離の決定が実行される。さらなる特定されたコンテンツアイテムがまた利用可能であり、距離データを抽出し、距離を決定する処理が、候補となるコンテンツアイテム1〜Mについて続けられる。
S8において、候補となるコンテンツアイテムの距離は、選択装置1−16によって閾値又は範囲と対比される。その距離が閾値以下又は当該範囲内である場合、それが選択される。
例えば、ベース位置がニューヨークのある通りのアドレスとして決定され、ニューヨークと第1の特定されたコンテンツアイテムが、ニューヨークのロングアイランドのガーデンシティーであると決定されている場合、これら2つの都市の間の距離を表すXマイルの距離が第1基準距離となる。このXマイルの距離に基づき、又は特定されたコンテンツアイテム1〜Nから決定される基準距離の平均に基づき、閾値距離が、例えば、“30マイル”、“同一の州”、“近い”又は“4”(4は、0〜9の間で割り当てられる整数であり、0は実質的に同じ位置を意味し、9は大変離れていることを意味する)などとして設定される。このとき、候補となるコンテンツアイテムの距離が当該閾値と比較され、ベース位置からの候補となるコンテンツアイテムの距離が、30マイル内、“同一州”内、“近い”範囲内、又は“距離ランキング”“4”の閾値によるものである場合、S8において候補となるアイテムが選択される。
本発明の特徴によると、距離粒度がベース位置からさらに離れた位置に対してよりもベース位置に地理的により近い位置に対して大きくなるように、閾値が設定される。従って、例えば、ベース位置からの距離が1〜10のスケールによりランク付けされる場合、ベース位置からの距離が増大するに従って、当該スケールのより少ないグラデーションによってより長い距離が含まれるであろう。このため、基準距離(ベース距離と特定された文書若しくはコンテンツアイテムとの間の距離)が1マイルである場合、第1候補コンテンツアイテムは、ベースからの候補距離が30マイルであるとき、非類似と判断されるかもしれない。しかしながら、基準距離が100マイルである場合、ベースからの第2候補距離が600マイルであるとき、第2候補文書は類似であると判断されるかもしれない。このような閾値処理は、人々はしばしば、より遠い位置の間の距離の差を等しい距離のより近い位置の間のものより重要性が低いと直感的に考えるというアイデアに基づくものである。関連する現在のベース位置からより遠くに移動するに従って、類似性を決定することに関して、異なるアイテムの位置の間の距離は重要性が低くなる。このような閾値処理は、ときには決定された粒度閾値の基準距離と呼ばれる。
上述されるように、S5において、特定されたコンテンツアイテムの距離のセットにおけるスプレッドに基づき、最大及び最小閾値を利用して、閾値設定装置1−14によりある範囲が生成されるようにしてもよい。このため、1つのみの特定されたコンテンツアイテムによる上述した具体例を利用して、最大閾値は上述したようなものであってもよく、また最小閾値は、例えば、“異なる都市”、“少なくとも5マイル”、“大変近い”、“距離ランキング5”などであってもよい。このとき、選択されたコンテンツアイテムの範囲は、使用される閾値処理/範囲のシステムに応じて、“異なる都市の同一州の距離”、“5〜30マイル”、“大変近いから近いまでの距離”又は“2〜4”となるであろう。
本発明の特徴によると、作業ベース位置、休暇位置、及び自宅ベース位置などの複数のベース位置が利用可能であり、決定された粒度の基準距離が各ベース位置について個別に適用される。従って、粒度レベルは、ベース位置1(遠く離れた候補となる文書位置、類似とみなされる大きな距離)からの距離と共に減少し、同様にベース位置2からの距離と共に減少する。このアイデアは、例えば、第2位置において多くの休暇時間又は作業時間を費やす人々にとって、第2ベース位置により近い距離の差は、これら遠く離れたものより重要であり、このため、より大きな粒度が利用される必要がある。
このような第2、第3、第L(Lは、3より大きな整数)などのベース位置が、ユーザにより設定可能であり、又は上述したベース位置を決定する方法に従ってシステムにより決定することが可能である。このため、例えば、システムは、システムがユーザの頻繁な存在を決定する位置を第2ベース位置として設定することが可能であり(GPSデータ、携帯装置の存在などに基づき)、又はユーザに係る多数の又は高い割合の文書(例えば、ユーザのコンピュータ、データベース、携帯などにある文書など)は、第1ベース距離と異なる特定の位置にコンテンツアイテム位置(生成日時又は直近の使用日時など)を有すると決定することが可能である。その後、基準距離が決定可能であり、このようなさらなるベース位置に基づき、決定された粒度による基準距離に従って、閾値が設定される。
本発明の特徴によると、抽出されたコンテンツアイテムは、ユーザにより選択されたコンテンツアイテムのコンテンツタイプと異なるコンテンツタイプであるかもしれない。例えば、ユーザにより選択されたコンテンツアイテムが音楽ファイルタイプ、すなわちMP3である場合、抽出されたコンテンツアイテムは、写真データのコンテンツタイプであるかもしれない。このように、例えば、あるジャンルの写真が、位置類似性に基づきユーザにより選択された音楽に一致するよう抽出されるかもしれない。
この(又はこれらの)選択された候補となるコンテンツアイテムが、S9においてユーザ又はユーザインタフェースに提供される。あるいは(又はさらに)、候補となるコンテンツアイテムが拒絶される場合、信号が提供されてもよい。データベース又はユーザインタフェース1−3に対する選択された候補となるアイテムの抽出を実行させるため、信号が直接データベース1−2に提供されてもよい。ユーザ(図示せず)に抽出可能なコンテンツアイテムを通知するための通知がユーザインタフェース1−3に提供されてもよい。この通知は、抽出されるコンテンツアイテムの特定、コンテンツアイテムの記述、コンテンツアイテムのURL又はリンク、コンテンツアイテム全体又はその一部の抽出、又は上記の組み合わせから構成されるかもしれない。システムはまた、データベースを整理するため、アンカーアイテムにより選択される抽出されたアイテムをグループ化するのに利用可能である。S10において、処理は終了する。
上記説明により提供された本発明の実施例は、単なる例示的な実施例として意図されている。しかしながら、本発明の範囲は請求項に与えられるということは理解されるであろう。
図1は、本発明の実施例による抽出システムの概略図である。 図2は、本発明の実施例によるシステムの処理のフローチャートである。

Claims (16)

  1. 抽出システムにおけるコンテンツアイテム抽出方法であって、
    前記抽出システムのベース位置決定装置が、コンテンツアイテムの抽出のための類似度の決定において基準距離により決定された粒度閾値処理を適用する位置であるベース位置を決定するステップと、
    前記抽出システムの位置データ抽出装置が、抽出されるべき候補コンテンツアイテムを指定するための第1の特定されたコンテンツアイテムの位置データを第1位置として抽出するステップと、
    前記抽出システムの閾値設定装置が、基準距離により決定された粒度閾値処理を用いて前記ベース位置と前記第1位置との間の距離として決定される基準距離に基づき第1閾値を設定するステップと、
    前記位置データ抽出装置が、第1候補コンテンツアイテムの位置データを第1候補位置として抽出し、前記ベース位置と前記第1候補位置との間の距離を第1候補距離として決定するステップと、
    前記抽出システムの選択装置が、前記第1候補距離と前記第1閾値とに基づき類似しているとして前記第1候補コンテンツアイテムを選択するステップと、
    前記抽出システムの出力手段が、前記候補コンテンツアイテムの前記第1候補位置が前記第1の特定されたコンテンツアイテムの位置と類似しているとして選択されるとき、前記第1候補コンテンツアイテムの抽出を示すための選択信号を出力するステップと、
    を有するコンテンツアイテム抽出方法であって、
    前記基準距離により決定された粒度閾値処理は、等距離のより近い位置との間よりも重要度の低いより遠い位置との間の距離の差分に基づき、
    異なるコンテンツアイテムの位置の間の距離は、前記ベース位置からの移動した距離においてより遠く、類似度に関してより重要性が低く、
    前記ベース位置からの距離は、スケールによりランク付けされ、
    距離の粒度が、前記ベース位置からより離れた位置に対してよりも前記ベース位置に地理的により近い位置に対して高くなるように、前記ベース位置からの距離が増加するに従って、前記スケールのより少数のグラデーションによってより長い距離が含まれ、
    前記第1閾値と比較して前記決定された第1候補距離が前記第1閾値より小さいことに応答して、前記第1候補コンテンツアイテムが、前記第1の特定されたコンテンツアイテムと類似しているとして選択されるコンテンツアイテム抽出方法。
  2. 当該方法はさらに、前記閾値設定装置が、前記基準距離に基づき、前記第1閾値と共にある範囲を有する第2閾値を設定するステップを有し、
    前記第1候補コンテンツアイテムを選択するステップはさらに、前記第1候補距離が前記範囲内にあることに応答して、前記第1の特定されたコンテンツアイテムに類似しているとして前記第1候補コンテンツアイテムを選択するステップを有する、請求項1記載の方法。
  3. 前記第1位置と前記第1候補位置の少なくとも1つは、コンテンツアイテム取得場所、コンテンツアイテムを直近に使用した場所、及びコンテンツアイテムを最もよく使用した場所の少なくとも1つを有する、請求項1記載の方法。
  4. 前記第1位置と前記第1候補位置の少なくとも1つは、コンテンツアイテムの現在位置、コンテンツアイテムの直近に変更された場所、及びコンテンツアイテム生成場所の少なくとも1つを有する、請求項1記載の方法。
  5. 前記ベース位置は、前記第1の特定されたコンテンツアイテムの現在位置、頻繁に訪れる場所、ユーザが最近訪れた場所、及びユーザが最もよく存在する場所の1つである、請求項1記載の方法。
  6. 前記ベース位置は、ユーザの自宅、ユーザのオフィス、ユーザの自動車、及びユーザの現在位置の1つである、請求項1記載の方法。
  7. 前記ベース位置と前記位置データの少なくとも1つは、GPS情報に基づき決定される、請求項1記載の方法。
  8. 当該方法はさらに、
    抽出されるべきさらなる候補コンテンツアイテムを指定するための第2の特定されたコンテンツアイテムの位置データを第2位置として抽出するステップと、
    前記第1基準距離と、前記ベース位置と前記第2位置との間の距離として決定された第2基準距離とに基づき、前記第1閾値を設定するステップと、
    をさらに有する、請求項1記載の方法。
  9. コンテンツアイテムの抽出のための類似度の決定において基準距離により決定された粒度閾値処理を適用する位置であるベース位置を決定するよう構成されるベース位置抽出モジュールと、
    抽出されるべき候補コンテンツアイテムを指定するための第1の特定されたコンテンツアイテムの位置データを第1位置として抽出し、前記ベース位置と前記第1位置との間で決定される距離を基準距離として決定し、さらに第1候補コンテンツアイテムの位置データを第1候補位置として抽出し、前記ベース位置と前記第1候補位置との間の距離を第1候補距離として決定するよう構成される位置データ抽出モジュールと、
    基準距離により決定された粒度閾値処理を用いて前記ベース位置と前記第1位置との間の距離として決定された前記基準距離に基づき第1閾値を設定するよう構成される閾値設定モジュールと、
    前記第1候補距離と前記第1閾値とに基づき、類似しているとして前記第1候補コンテンツアイテムを選択するよう構成される選択モジュールと、
    前記候補コンテンツアイテムの前記第1候補位置が前記第1の特定されたコンテンツアイテムの位置に類似しているとして選択されるとき、前記第1候補コンテンツアイテムの抽出を示すための選択信号を出力するよう構成される結果出力モジュールと、
    各モジュールの全体機能を調整するよう構成されるコントローラと、
    ユーザインタフェースと、
    抽出されるコンテンツアイテムを格納するための記憶装置と、
    を有するコンテンツアイテム抽出システムであって、
    前記基準距離により決定された粒度閾値処理は、等距離のより近い位置との間よりも重要度の低いより遠い位置との間の距離の差分に基づき、
    異なるコンテンツアイテムの位置の間の距離は、前記ベース位置からの移動した距離においてより遠く、類似度に関してより重要性が低く、
    前記ベース位置からの距離は、スケールによりランク付けされ、
    距離の粒度が、前記ベース位置からより離れた位置に対してよりも前記ベース位置に地理的により近い位置に対して高くなるように、前記ベース位置からの距離が増加するに従って、前記スケールのより少数のグラデーションによってより長い距離が含まれ、
    前記第1閾値と比較して前記決定された第1候補距離が前記第1閾値より小さいことに応答して、前記第1候補コンテンツアイテムが、前記第1の特定されたコンテンツアイテムと類似しているとして選択され、
    前記コントローラは、前記ユーザインタフェースと前記記憶装置とやりとりするよう構成され、
    前記コントローラ、前記ベース位置抽出モジュール、前記位置抽出モジュール、前記閾値設定モジュール、前記選択モジュール、前記結果出力モジュール、これらの一部及び当該システムは、全体として前記コントローラ及び各モジュールの対応する機能を実行するよう構成されるハードウェア、ソフトウェア及びファームウェアの組み合わせを有するコンテンツアイテム抽出システム。
  10. 前記閾値設定モジュールは、前記基準距離に基づき、前記第1閾値と共にある範囲を有する第2閾値を設定し、
    前記選択モジュールは、前記第1候補距離が前記範囲内にあることに応答して、前記第1候補コンテンツアイテムを選択する、請求項9記載のシステム。
  11. 前記第1位置と前記第1候補位置の少なくとも1つは、コンテンツアイテム取得場所、コンテンツアイテムを直近に使用した場所、及びコンテンツアイテムを最もよく使用した場所の少なくとも1つを有する、請求項9記載のシステム。
  12. 前記第1位置と前記第1候補位置の少なくとも1つは、コンテンツアイテムの現在位置、コンテンツアイテムの直近に変更された場所、及びコンテンツアイテム生成場所の少なくとも1つを有する、請求項9記載のシステム。
  13. 前記ベース位置は、前記第1の特定されたコンテンツアイテムの現在位置、頻繁に訪れる場所、ユーザが最近訪れた場所、及びユーザが最もよく存在する場所の1つである、請求項9記載のシステム。
  14. 前記ベース位置は、ユーザの自宅、ユーザのオフィス、ユーザの自動車、及びユーザの現在位置の1つである、請求項9記載のシステム。
  15. 前記ベース位置と前記位置データの少なくとも1つは、ユーザ入力とGPS情報との1つに基づき決定される、請求項9記載のシステム。
  16. 前記位置データ抽出モジュールは、第2の特定されたコンテンツアイテムの位置データを第2位置として抽出するよう構成され、
    前記閾値設定モジュールは、前記第1基準距離と、前記ベース位置と前記第2位置との間の距離として決定された第2基準距離とに基づき、前記第1閾値を設定する、請求項9記載のシステム。
JP2007543974A 2004-12-01 2005-11-30 関連コンテンツの抽出における位置類似性閾値の適応化 Expired - Fee Related JP5015789B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US63213704P 2004-12-01 2004-12-01
US60/632,137 2004-12-01
PCT/IB2005/053980 WO2006059291A1 (en) 2004-12-01 2005-11-30 Adaptation of location similarity threshold in associative content retrieval

Publications (2)

Publication Number Publication Date
JP2008522308A JP2008522308A (ja) 2008-06-26
JP5015789B2 true JP5015789B2 (ja) 2012-08-29

Family

ID=36218677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007543974A Expired - Fee Related JP5015789B2 (ja) 2004-12-01 2005-11-30 関連コンテンツの抽出における位置類似性閾値の適応化

Country Status (6)

Country Link
US (1) US8442976B2 (ja)
EP (1) EP1820128A1 (ja)
JP (1) JP5015789B2 (ja)
KR (1) KR101194705B1 (ja)
CN (1) CN100573514C (ja)
WO (1) WO2006059291A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4881034B2 (ja) 2005-02-28 2012-02-22 富士フイルム株式会社 電子アルバム編集システム、電子アルバム編集方法、及び電子アルバム編集プログラム
US20080097972A1 (en) * 2005-04-18 2008-04-24 Collage Analytics Llc, System and method for efficiently tracking and dating content in very large dynamic document spaces
US8150932B2 (en) * 2005-06-30 2012-04-03 Nokia Corporation System and method for providing privacy protected navigation between mobile terminals
US20080064351A1 (en) * 2006-09-08 2008-03-13 Agere Systems, Inc. System and method for location-based media ranking
US9535911B2 (en) * 2007-06-29 2017-01-03 Pulsepoint, Inc. Processing a content item with regard to an event
US20090138480A1 (en) 2007-08-29 2009-05-28 Chatley Scott P Filing system and method for data files stored in a distributed communications network
JP4518168B2 (ja) * 2008-03-21 2010-08-04 富士ゼロックス株式会社 関連文書提示システム及びプログラム
US10163113B2 (en) * 2008-05-27 2018-12-25 Qualcomm Incorporated Methods and apparatus for generating user profile based on periodic location fixes
US8433805B2 (en) * 2008-09-19 2013-04-30 Apple Inc. Method and system for facilitating contacting people using electronic devices
JP2011180729A (ja) * 2010-02-26 2011-09-15 Sony Corp 情報処理装置、キーワード登録方法及びプログラム
WO2012064278A1 (en) * 2010-11-12 2012-05-18 Telefonaktiebolaget L M Ericsson (Publ) Matching a first location profile with at least one other location profile
US9031958B2 (en) * 2011-04-18 2015-05-12 International Business Machines Corporation File searching on mobile devices
US8949212B1 (en) * 2011-07-08 2015-02-03 Hariharan Dhandapani Location-based informaton display
US20150112808A1 (en) * 2013-10-18 2015-04-23 Google Inc. Determining relevant business locations based on travel distances
US20150278860A1 (en) 2014-03-25 2015-10-01 Google Inc. Dynamically determining a search radius to select online content
KR102216049B1 (ko) * 2014-04-21 2021-02-15 삼성전자주식회사 시맨틱 라벨링 시스템 및 방법
US11030537B2 (en) * 2017-09-25 2021-06-08 Microsoft Technology Licensing, Llc Intelligent inferences of authoring from document layout and formatting
CN109359582B (zh) * 2018-10-15 2022-08-09 Oppo广东移动通信有限公司 信息搜索方法、信息搜索装置及移动终端
CN111382593B (zh) * 2018-12-27 2023-07-21 浙江宇视科技有限公司 身份验证方法、装置及电子设备

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6282489B1 (en) * 1993-05-28 2001-08-28 Mapquest.Com, Inc. Methods and apparatus for displaying a travel route and generating a list of places of interest located near the travel route
US5616876A (en) * 1995-04-19 1997-04-01 Microsoft Corporation System and methods for selecting music on the basis of subjective content
US6701307B2 (en) * 1998-10-28 2004-03-02 Microsoft Corporation Method and apparatus of expanding web searching capabilities
US6631326B1 (en) * 2000-03-29 2003-10-07 Sourceprose Corporation System and method for performing flood zone certifications
DE10030606A1 (de) * 2000-06-21 2002-01-03 Sms Demag Ag Bandspeicher für Metallbänder, insbesondere Spiralbandspeicher für dickere Stahlbänder
JP2004513413A (ja) * 2000-06-30 2004-04-30 トロイ シュルツ リアルタイムの広告を使用するgisベースの検索エンジンのための方法および装置
US7689621B1 (en) * 2000-11-06 2010-03-30 Navteq North America, Llc Multi-dimensional spatial index for a geographic database
JP4977291B2 (ja) * 2000-11-17 2012-07-18 日本電気株式会社 情報提供サーバ及び情報提供検索実行プログラムを記録した記録媒体
US6842761B2 (en) * 2000-11-21 2005-01-11 America Online, Inc. Full-text relevancy ranking
US6804684B2 (en) * 2001-05-07 2004-10-12 Eastman Kodak Company Method for associating semantic information with multiple images in an image database environment
JP4534381B2 (ja) * 2001-05-08 2010-09-01 マツダ株式会社 情報表示方法
US7082365B2 (en) * 2001-08-16 2006-07-25 Networks In Motion, Inc. Point of interest spatial rating search method and system
KR20040029452A (ko) * 2001-08-27 2004-04-06 그레이스노트 아이엔씨 플레이리스트 생성, 전송 및 검색
JP2003084774A (ja) * 2001-09-07 2003-03-19 Alpine Electronics Inc 楽曲の選択方法及び装置
US7343365B2 (en) * 2002-02-20 2008-03-11 Microsoft Corporation Computer system architecture for automatic context associations
US6987221B2 (en) * 2002-05-30 2006-01-17 Microsoft Corporation Auto playlist generation with multiple seed songs
US6996390B2 (en) * 2002-06-26 2006-02-07 Microsoft Corporation Smart car radio
CN100407782C (zh) * 2002-09-27 2008-07-30 富士胶片株式会社 相册制作方法及其装置
US7107520B2 (en) * 2002-11-18 2006-09-12 Hewlett-Packard Development Company, L.P. Automated propagation of document metadata
JP2004185461A (ja) * 2002-12-05 2004-07-02 Recruit Co Ltd 旅行計画システム
US7475060B2 (en) * 2003-05-09 2009-01-06 Planeteye Company Ulc Browsing user interface for a geo-coded media database
JP2004340747A (ja) * 2003-05-15 2004-12-02 Fujitsu Ten Ltd ネットワークを利用した経路案内情報取得方法、及び中継装置
CA2526187C (en) * 2003-05-20 2014-01-21 America Online, Inc. Presence and geographic location notification
US6954697B1 (en) * 2003-08-04 2005-10-11 America Online, Inc. Using a corridor search to identify locations of interest along a route
US7231405B2 (en) * 2004-05-08 2007-06-12 Doug Norman, Interchange Corp. Method and apparatus of indexing web pages of a web site for geographical searchine based on user location
US7487072B2 (en) * 2004-08-04 2009-02-03 International Business Machines Corporation Method and system for querying multimedia data where adjusting the conversion of the current portion of the multimedia data signal based on the comparing at least one set of confidence values to the threshold
US20060080286A1 (en) * 2004-08-31 2006-04-13 Flashpoint Technology, Inc. System and method for storing and accessing images based on position data associated therewith
US7653249B2 (en) * 2004-11-17 2010-01-26 Eastman Kodak Company Variance-based event clustering for automatically classifying images

Also Published As

Publication number Publication date
EP1820128A1 (en) 2007-08-22
JP2008522308A (ja) 2008-06-26
KR101194705B1 (ko) 2012-10-29
US8442976B2 (en) 2013-05-14
CN100573514C (zh) 2009-12-23
CN101069179A (zh) 2007-11-07
WO2006059291A1 (en) 2006-06-08
US20080091728A1 (en) 2008-04-17
KR20070086804A (ko) 2007-08-27

Similar Documents

Publication Publication Date Title
JP5015789B2 (ja) 関連コンテンツの抽出における位置類似性閾値の適応化
US8321456B2 (en) Generating metadata for association with a collection of content items
US7953735B2 (en) Information processing apparatus, method and program
US9652693B2 (en) Automatic photo grouping by events
US20100217755A1 (en) Classifying a set of content items
US20140122465A1 (en) Ranking Music Search Results
US20090063568A1 (en) Method and apparatus for constructing user profile using content tag, and method for content recommendation using the constructed user profile
JP2012507189A (ja) コンテンツベース・フィルタリング及びテーマベース・クラスタリングを用いたページ内へのイメージの配置
US20100114901A1 (en) Computer-readable recording medium, content providing apparatus collecting user-related information, content providing method, user-related information providing method and content searching method
JP5923626B2 (ja) コンテキストベースのコンテンツリスト生成
JP2008522311A (ja) コンテンツアイテムの関連付けに基づく自動的なコンテンツ整理
JP4375626B2 (ja) カテゴリ別のキーワードの入力順位を提供するための検索サービスシステムおよびその方法
JP2008522310A (ja) 関連コンテンツの抽出
US20150331863A1 (en) Selection method, method for maintaining data list and electronic device
US9152679B2 (en) Displaying recommended entities in a relevance map
JP2008522309A (ja) 関連コンテンツの抽出における時間類似性閾値の適応化
RU2481626C2 (ru) Аннотирование контента с помощью контекстных метаданных
CN117131095A (zh) 知识库对接方法、装置、设备及介质
JP2008193472A (ja) 携帯端末装置
JP2006048384A (ja) 情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110104

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110401

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110408

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120410

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120515

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120607

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150615

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5015789

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees