JP2008522309A - Adapting temporal similarity threshold in related content extraction - Google Patents

Adapting temporal similarity threshold in related content extraction Download PDF

Info

Publication number
JP2008522309A
JP2008522309A JP2007543975A JP2007543975A JP2008522309A JP 2008522309 A JP2008522309 A JP 2008522309A JP 2007543975 A JP2007543975 A JP 2007543975A JP 2007543975 A JP2007543975 A JP 2007543975A JP 2008522309 A JP2008522309 A JP 2008522309A
Authority
JP
Japan
Prior art keywords
time
content item
candidate
difference
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007543975A
Other languages
Japanese (ja)
Inventor
エム アー ディーデリクス,エルモ
デ スライス,バルテル エム ファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008522309A publication Critical patent/JP2008522309A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

類似するコンテンツアイテム又は文書の抽出が、生成又は使用時間などの関連する時間の類似性に基づき提供される。データベースなどにおける1以上の特定されたアンカー文書の時間が、時間メタデータを抽出することによって決定される。その後、第1閾値が、ベース時間又は現在の時間とアンカーアイテム時間との間で決定される基準時間差に基づき設定される。候補となる文書アイテム時間が特定され、候補となるコンテンツアイテムの時間メタデータが抽出されるかもしれない。ベース時間と候補時間との間の時間差が、候補時間差として決定されるかもしれない。候補となるコンテンツアイテムが、第1候補時間差と第1閾値とに基づく抽出について類似しているとして選択されるかもしれない。閾値を設定するための決定された粒度の基準時間差の概念が提供される。
Extraction of similar content items or documents is provided based on related time similarities such as generation or usage time. The time of one or more identified anchor documents, such as in a database, is determined by extracting time metadata. Thereafter, the first threshold is set based on a base time or a reference time difference determined between the current time and the anchor item time. Candidate document item times may be identified and temporal metadata for candidate content items may be extracted. The time difference between the base time and the candidate time may be determined as the candidate time difference. Candidate content items may be selected as similar for extraction based on the first candidate time difference and the first threshold. A concept of a reference time difference of the determined granularity for setting the threshold is provided.

Description

本発明は、コンテンツの抽出、管理及び提示の分野に関し、時間使用及びメタデータに基づくコンテンツアイテム類似性閾値の決定に関する。   The present invention relates to the field of content extraction, management and presentation, and to content item similarity threshold determination based on time usage and metadata.

近年、パーソナルコンピュータ上のハードドライブと他のタイプの記憶媒体を含む記憶装置及びデータベースの記憶容量は急速に増大してきている。ある予想では、記憶容量は毎年ほぼ2倍となり、ネットワーク帯域幅もまた大変急速に増大してきている。この結果、記憶装置は、それへのユーザアクセスが実現される必要があるより大量のコンテンツを格納している。ユーザは、記憶装置又はデータベース上、さらにユーザ自らのハードドライブ上に格納されているコンテンツに圧倒される可能性があり、コンテンツがユーザにとって便利なアクセスを提供するよう何れかの方法により管理又は整理されていない場合、インターネットなどのネットワーク上で利用可能なコンテンツを抽出することができないかもしれない。ユーザに透過な方法によりインデックス処理又は整理されていないコンテンツは、ユーザニーズに関する限り“欠落”してしまうかもしれず、抽出されないかもしれない。   In recent years, the storage capacity of storage devices and databases, including hard drives and other types of storage media on personal computers, has been rapidly increasing. One expectation is that storage capacity has almost doubled each year, and network bandwidth has also increased very rapidly. As a result, the storage device stores a larger amount of content that requires user access to it. Users may be overwhelmed by content stored on a storage device or database, as well as on their own hard drive, and managed or organized in any way so that the content provides convenient access for the user. If not, you may not be able to extract content that is available on networks such as the Internet. Content that has not been indexed or organized in a way that is transparent to the user may be “missed” as far as the user needs are concerned and may not be extracted.

多くのデータ抽出スキームが知られている。Farnhamらの米国特許出願公報第2003/0158855号は、コンピュータファイル間の数値として表される類似度が決定されるように、関連付けがオブジェクト又はメタデータの間で動的に生成される自動的なコンテクストの関連付けについて開示している。Stublerらの米国特許出願公報第2002/0188602号は、取得した画像のメタデータを抽出することによって、格納されている画像と取得した画像との類似性に基づき、取得した画像のキャプション又はセマティックラベルの生成について開示している。Plattの米国特許出願公報第2003/0221541号は、“所望されないシード(undesirable seed)”楽曲を含む複数のシード楽曲がプレイリスト上の楽曲を生成するのに使用される自動プレイリスト生成装置を開示している。Clutsの米国特許第5,616,876号は、エディタにより以前に書き込まれた各楽曲の“スタイルラベル”に基づき、第1楽曲セットと同様のさらなる楽曲を選択することを開示している。Gargiの米国特許出願公報第2004/0098362号は、生成時間を含む文書メタデータの自動的な伝搬について開示している。しかしながら、上記参考文献の何れも、ターゲットアイテムの選択又は拒絶における時間類似性に対して閾値を設定することについて開示していない。Princeの米国特許出願公報第2002/0099696号は、類似度にスコアが与えられ、抽出されるアイテムを選択するのに閾値が使用されるファジーデータベース抽出を開示している。しかしながら、Princeもその他の参考文献も、ベース時間に基づく閾値の設定について、またベース時間と特定されたアイテム時間との間の時間差に基づく閾値の設定については開示も示唆もされていない。   Many data extraction schemes are known. Farnham et al., US Patent Application Publication No. 2003/0158855, is an automatic method in which associations are dynamically generated between objects or metadata so that the similarity expressed as a numerical value between computer files is determined. The context association is disclosed. US Patent Application Publication No. 2002/0188602 to Stubler et al., Based on the similarity between a stored image and an acquired image by extracting metadata of the acquired image, Disclosure of label generation. Platt's US Patent Application Publication No. 2003/0221541 discloses an automatic playlist generator in which multiple seed songs, including “undesirable seed” songs, are used to generate songs on a playlist. is doing. Cluts US Pat. No. 5,616,876 discloses selecting additional music similar to the first music set based on the “style label” of each music previously written by the editor. Gargi's US Patent Application Publication No. 2004/0098362 discloses automatic propagation of document metadata including generation time. However, none of the above references disclose setting a threshold for temporal similarity in target item selection or rejection. Prince's US Patent Application Publication No. 2002/0099696 discloses a fuzzy database extraction in which similarity is scored and a threshold is used to select items to be extracted. However, neither Prince nor any other reference discloses or suggests setting a threshold based on the base time, or setting a threshold based on the time difference between the base time and the identified item time.

もちろんユーザがコンテンツアイテムを抽出することは可能であるが、特に所望のコンテンツのコンテンツタイプがユーザによって指定されず、又は知られていない場合、類似するアイテムを特定しようとすることは時間がかかり面倒な作業となる可能性がある。さらに、コンテンツアイテムがユーザにより制御される記憶装置又はデータベースに蓄積し続けるに従って、コンテンツアイテムを抽出する作業はさらに困難となる。   Of course, it is possible for the user to extract content items, but trying to identify similar items is time consuming and tedious, especially if the content type of the desired content is not specified or known by the user. Can be a painful task. Furthermore, as content items continue to accumulate in a storage device or database controlled by the user, the task of extracting content items becomes more difficult.

抽出システムの機能を実現又は実行する方法、システム、デバイス、装置及びコンピュータ可読媒体が提供される。   Methods, systems, devices, apparatuses and computer readable media are provided that implement or perform the functions of the extraction system.

選択された候補となるコンテンツアイテムが提供される。ベース時間が決定される。このようなベース時間は、例えば、現在の時間であってもよい。第1時間は、第1の特定されたコンテンツアイテムの時間データを抽出することによって特定される。その後、第1閾値が、ベース時間と第1時間との間で決定される基準時間差に基づき設定されてもよい。候補となる時間が特定され、候補となるコンテンツアイテムの時間データが抽出される。ベース時間と第1の候補となる時間との間の差が、候補となる差として決定されてもよい。候補となるコンテンツアイテムが、データベースの整理のため、又は第1の候補となる時間差と第1閾値とに基づく抽出のため、類似として選択されてもよく、選択された候補となるコンテンツの選択信号がこれに応じて出力される。   A selected candidate content item is provided. A base time is determined. Such a base time may be the current time, for example. The first time is specified by extracting time data of the first specified content item. Thereafter, the first threshold value may be set based on a reference time difference determined between the base time and the first time. The candidate time is specified, and the time data of the candidate content item is extracted. The difference between the base time and the first candidate time may be determined as a candidate difference. The candidate content item may be selected as similar for organizing the database or for extraction based on the first candidate time difference and the first threshold, and a selection signal for the selected candidate content Is output accordingly.

閾値を設定するための時間決定された粒度の時間差の概念が提供され、これに従って、差分粒度はベース時間からさらに離れた時間に対してより、ベース時間により近い時間に対して大きなものとなるように設定される。   The concept of time-determined time difference for setting the threshold is provided, so that the difference granularity is greater for times closer to the base time than for times further away from the base time. Set to

さらに、基準時間差に基づく第2閾値が設定されてもよく、第1閾値と一緒に第2閾値はある範囲を有し、第1の候補となる時間差が当該範囲内である場合、候補となるコンテンツアイテムが選択される。   Further, a second threshold value based on the reference time difference may be set, and the second threshold value has a certain range together with the first threshold value, and becomes a candidate when the time difference to be the first candidate is within the range. A content item is selected.

第1時間は、コンテンツアイテム取得時間、コンテンツアイテムの直近の使用時間、又はコンテンツアイテムが最もよく使用される時間を含むかもしれない。この時間は、コンテンツアイテムベース時間、コンテンツアイテム直近変更時間、又はコンテンツアイテム生成時間であってもよい。   The first time may include a content item acquisition time, a most recent use time of the content item, or a time when the content item is most often used. This time may be a content item base time, a content item latest change time, or a content item generation time.

さらなる特定されたコンテンツアイテムが特定されてもよく、第1閾値がまたこれらの決定された基準時間差に基づき設定可能となるように、時間及び差分が決定される。   Further identified content items may be identified, and the time and difference are determined such that the first threshold can also be set based on these determined reference time differences.

以下の説明及び上記図面は、発明者によって現在最も良く理解されるような出願人の発明の実施例を記載するが、本発明の多くの改良が可能であり、本発明が、本発明の趣旨から逸脱することなく他の形式により実現され、また他の方法により実現されてもよいということが理解されるであろう。さらに、記載される実施例のいくつかの特徴は、本発明の趣旨から逸脱することなく、省略され、選択的に若しくは全体的に他の実施例と組み合わされ、又は他の実施例若しくはその一部の特徴を置換するのに利用されてもよい。従って、図面及び詳細な説明は、本発明のいくつかの側面の例示的な説明として解釈されるべきものであり、本発明の範囲を限定するものと解釈されるべきでない。   The following description and the above drawings describe embodiments of Applicant's invention as best understood by the inventor, but many modifications of the invention are possible, and the invention is intended to It will be understood that other forms may be implemented and may be implemented in other ways without departing from. Moreover, some features of the described embodiments may be omitted, selectively or wholly combined with other embodiments, or other embodiments or one of them without departing from the spirit of the invention. It may be used to replace part features. Accordingly, the drawings and detailed description are to be taken as illustrative illustrations of certain aspects of the invention and should not be construed as limiting the scope of the invention.

図1に示されるように、抽出システム1−1は、後述されるいくつかのモジュールを有している。抽出システム1−1のモジュール、その一部及び/又は抽出システム全体は、ハードウェア、ソフトウェア、ファームウェア又は上記の組み合わせから構成可能であるが、一部のモジュールがハードウェアなどから構成され、他のモジュールがソフトウェア、ファームウェア又はそれらの組み合わせから構成されるようにしてもよい。   As shown in FIG. 1, the extraction system 1-1 has several modules to be described later. The module of the extraction system 1-1, a part thereof, and / or the entire extraction system can be configured by hardware, software, firmware, or a combination of the above, but some modules are configured by hardware, etc. The module may be composed of software, firmware, or a combination thereof.

抽出システムのすべてのモジュールが同一の装置に配置又は統合されている必要はないということが理解されるであろう。分散化されたアーキテクチャはまた、既存の装置によって提供される適切なモジュールから“ピギーバック(piggy−back)”する抽出システムについて考えられる。   It will be understood that not all modules of the extraction system need be located or integrated in the same device. A decentralized architecture is also conceivable for an extraction system that “piggy-backs” from the appropriate modules provided by existing equipment.

以下の説明は、有線又は無線接続を介しデータベース1−2に物理的に一体化又は接続される抽出システム1−1について言及する。クロック(図示せず)はまた、抽出システム1−1に統合又は接続されてもよい。データベース1−2は、パーソナルコンピュータ、パーソナルビデオレコーダ、エンターテイメントシステム、エレクトロニックオーガナイザ、パーソナル携帯装置、Jazドライブのハードドライブなどの記憶装置により実現されてもよく、又はディスクドライブなどの商用の記憶装置として実現されてもよい。データベース1−2は、このような装置の2以上におけるコンテンツアイテムの整理又はグループ化が可能となるように、接続されるいくつかの記憶装置を含むかもしれないということは理解されるであろう。さらに、データベースは、データベース1−2にロード及びそれにより抽出可能なCD、DVD、zipディスク、フロッピー(登録商標)ディスク、データカートリッジなどを含むディスクなどの1以上の記憶媒体を含むものであると理解されるかもしれない。しかしながら、抽出システム1−1はまた、LAN、WAN、インターネットなどのネットワーク1−9を介しコンテンツを抽出することが可能であるということが理解されるであろう。   The following description refers to an extraction system 1-1 that is physically integrated or connected to the database 1-2 via a wired or wireless connection. A clock (not shown) may also be integrated or connected to the extraction system 1-1. The database 1-2 may be realized by a storage device such as a personal computer, a personal video recorder, an entertainment system, an electronic organizer, a personal portable device, a hard drive of a Jaz drive, or realized as a commercial storage device such as a disk drive. May be. It will be appreciated that the database 1-2 may include a number of storage devices that are connected to allow for the organization or grouping of content items on two or more of such devices. . Further, the database is understood to include one or more storage media such as CDs, DVDs, zip disks, floppy disks, disks including data cartridges, etc. that can be loaded into and extracted from the database 1-2. It may be. However, it will be appreciated that the extraction system 1-1 can also extract content via a network 1-9 such as a LAN, WAN, or the Internet.

図1に示されるように、抽出システム1−1は、コンテンツアイテムから特定のタイプのデータを収集するモジュールである時間データ抽出装置1−11を含む。コンテンツアイテムは、ビデオ、ビデオクリップ、ムービー、フォト、テキストファイル、音楽データ、オーディオファイル、又はJPEGファイルやXMLデータなどの他のタイプのマルチメディアデータであってもよい。例えば、ビデオは、デジタルビデオレコーダ上のホームビデオショットであってもよく、ムービーは、MPEG(MPEG−2、MPEG−3などを含む)として符号化されたフィルムなどの市販のフィルムデータであってもよく、フォトは、デジタル写真データ、写真又は写真アルバム群であってもよい。テキストファイルは、ワープロにより生成されたファイル、スプレッドシート、又はコンピュータコードファイルであってもよい。音楽データは、MP3ファイルなどであってもよい。   As shown in FIG. 1, the extraction system 1-1 includes a time data extraction device 1-11, which is a module that collects specific types of data from content items. The content item may be a video, video clip, movie, photo, text file, music data, audio file, or other type of multimedia data such as a JPEG file or XML data. For example, the video may be a home video shot on a digital video recorder, and the movie is commercially available film data such as a film encoded as MPEG (including MPEG-2, MPEG-3, etc.). Alternatively, the photo may be digital photo data, a photo, or a photo album group. The text file may be a file generated by a word processor, a spreadsheet, or a computer code file. The music data may be an MP3 file or the like.

時間データ抽出装置1−11によって抽出される記述データは、コンテンツアイテムに関する使用データ又はメタデータなどの情報を含む。このような情報はまた、アイテムの生成時間、アイテムの取得時間、コンテンツアイテムの最後の/最初の/2番目などの再生及び/又は編集時間、最もよく使用される時間、例えば、当該アイテムは午後8時頃に、1週間、1月又は1年の所与の日に主として使用され、又は夜によく使用されるなどのコンテンツアイテムの時間データを含むものであってもよい。ここで使用される“主として”とは、平均使用時間、メディアン使用時間、使用時間のモードなどに基づくものであってもよい。このような使用履歴データは、ときにはメタデータとして知られるかもしれず、他方、メタデータのタイプはときには使用履歴データと呼ばれる。   The description data extracted by the time data extraction device 1-11 includes information such as usage data or metadata regarding the content item. Such information may also include item creation time, item acquisition time, content item last / first / second etc. playback and / or editing time, most commonly used time, eg It may include time data for content items such as around 8 o'clock, mainly used for a given day of the week, January or year, or often used at night. As used herein, “mainly” may be based on average usage time, median usage time, usage time mode, and the like. Such usage history data may sometimes be known as metadata, while the type of metadata is sometimes referred to as usage history data.

ここに記載される時間情報は、1つ又は多くの当該類似性特徴であるかもしれず、又はそれは唯一の又は最も重要な特徴であるかもしれない。このようなファクタは、(そうであったとしても)重み付けされる程度は、ユーザニーズとアプリケーションに依存するであろう。   The temporal information described herein may be one or many such similarity features, or it may be the only or most important feature. The degree to which such factors are weighted (if any) will depend on the user needs and the application.

アイテムに関するこのような記述データは、アイテムから、インデックス又はデータベース管理ファイルから、インターネット1−9との有線又は無線接続を介し抽出システム1−1に接続されるワールドワイドウェブなどの外部ソースからを含む各種方法により配置及び抽出されてもよいということが理解されるであろう。   Such descriptive data about the item includes from the item, from an index or database management file, from an external source such as the World Wide Web connected to the extraction system 1-1 via a wired or wireless connection to the Internet 1-9. It will be appreciated that it may be arranged and extracted by various methods.

特定されたコンテンツアイテムは、いくつかの方法の1つにより特定されてもよい。ユーザは、“候補となるコンテンツアイテム”とときには呼ばれる他のアイテムがそれに基づき抽出されるアイテムを指定してもよい。あるいは、新たに追加又は生成されるコンテンツアイテムは、それに基づき他のアイテムが抽出される特定されたコンテンツアイテムとして自動的に指定されてもよい。   The identified content item may be identified by one of several methods. The user may specify items from which other items, sometimes called “candidate content items”, are extracted based on. Alternatively, a newly added or generated content item may be automatically designated as a specified content item from which another item is extracted based on the content item.

ベース時間が、ベース時間決定装置1−13により決定される。このようなベース時間は、ユーザによって入力又は設定され、以前にプログラムされ、クロック(図示せず)を参照して決定され、又はインターネット若しくは他のネットワーク又は上記の組み合わせによって決定される現在の時間であってもよい。ベース時間、特定されたコンテンツアイテムに係る時間及び候補となるコンテンツアイテムはそれぞれ、日付及び/又は時間を含むかもしれないということが理解されるであろう。いくつかのアプリケーションについて、時間のない日付で十分であり、又はより適切であるかもしれない。多くのアプリケーションについて、時間と日付の両方が使用される。このような日付情報と時間情報は、時間差計算と他の日付及び時間との比較を実現するフォーマットに変換可能であるということが理解されるであろう。   The base time is determined by the base time determination device 1-13. Such base time is the current time entered or set by the user, previously programmed, determined with reference to a clock (not shown), or determined by the Internet or other network or combination of the above. There may be. It will be appreciated that the base time, the time associated with the identified content item, and the candidate content item may each include a date and / or time. For some applications, a date with no time may be sufficient or more appropriate. For many applications, both time and date are used. It will be appreciated that such date information and time information can be converted to a format that allows for time difference calculations and comparisons with other dates and times.

時間データ抽出装置1−11は、特定されたコンテンツアイテムに係る時間を決定し、特定されたコンテンツアイテムに係る時間とベース時間との間の時間差(すなわち、経過した時間)を決定する。この差分は、ときには第1基準時間差と呼ばれる。特定されたコンテンツアイテムに係る時間は、コンテンツアイテムにかかるメタデータを参照して、データベースインデックスによって、ワールドワイドウェブなどを含むネットワーク1−9を参照することによって、ユーザ入力を要求することによって、又は上記の組み合わせによって決定されるかもしれない。この時間差は、テーブルを参照することによって、計算によって、ユーザ入力を要求することによって、又は上記の組み合わせによって決定されてもよい。   The time data extraction device 1-11 determines the time related to the specified content item, and determines the time difference (that is, the elapsed time) between the time related to the specified content item and the base time. This difference is sometimes called the first reference time difference. The time associated with the identified content item refers to the metadata associated with the content item, by referring to the network 1-9, including the World Wide Web, by database index, by requesting user input, or May be determined by a combination of the above. This time difference may be determined by referring to a table, by calculation, by requesting user input, or by a combination of the above.

閾値設定装置1−14は、候補となるコンテンツアイテムが選択されるため充足する必要がある閾値又は範囲を設定する。この閾値又は範囲は、第1基準時間差に基づき閾値設定装置1−14によって設定される。   The threshold setting device 1-14 sets a threshold or a range that needs to be satisfied because a candidate content item is selected. This threshold value or range is set by the threshold setting device 1-14 based on the first reference time difference.

候補となるコンテンツアイテム特定装置1−12は、データベースにおいて、ネットワーク接続を介し又は他のソースから、それらのメタデータ又は他の情報に関して類似し、及び/又はベース時間への第1の特定されたコンテンツアイテムの時間差に対するベース時間からのそれらの差分に基づく候補となるコンテンツアイテムを特定する。   Candidate content item identification devices 1-12 are similar in terms of their metadata or other information in the database or from other sources over a network connection and / or first identified to base time Identify candidate content items based on their differences from the base time relative to the time difference of the content items.

コントローラ1−15は、抽出システム1−1の全体機能を調整し、ユーザインタフェース1−1、データベース1−2、サーバ1−9及び一般に外部とやりとりし、システム設定を処理する。   The controller 1-15 adjusts the overall function of the extraction system 1-1, interacts with the user interface 1-1, the database 1-2, the server 1-9 and generally the outside, and processes system settings.

選択装置1−16は、適格性を有する候補となるコンテンツアイテムを選択し、結果出力1−17は、選択及び/又は拒絶された候補となるコンテンツアイテムについて結果信号を提供する。結果出力1−17は、ユーザ(図示せず)とのやりとりを含む、他の装置及び外部との通信とインタフェースをとる。特に、抽出結果出力1−17は、抽出システム1−1により抽出されたコンテンツアイテムをユーザインタフェースに通知する。ユーザインタフェース1−3は、独立した装置であってもよく、又はパーソナルコンピュータ、パーソナルビデオレコーダ、上述したストレージ及び他の装置の1以上などの他の装置又はシステムと統合されてもよい。   The selection device 1-16 selects eligible content items that are eligible, and the result output 1-17 provides a result signal for the selected and / or rejected candidate content items. The result output 1-17 interfaces with other devices and external communications, including interaction with a user (not shown). In particular, the extraction result output 1-17 notifies the user interface of the content item extracted by the extraction system 1-1. The user interface 1-3 may be an independent device or may be integrated with other devices or systems, such as a personal computer, a personal video recorder, the storage described above, and one or more of other devices.

さらなる利用可能な特定されたコンテンツアイテムが存在するかもしれない。従って、当該時間メタデータ処理並びに/又は使用抽出及び時間差決定は、任意数の利用可能な特定されたコンテンツアイテム1〜N(Nは、1より大きな正の整数)に対して繰り返されるかもしれない。その後、候補となるコンテンツアイテムの選択が、このようなすべての基準時間差の平均に基づき実行される。   There may be additional identified content items available. Accordingly, the time metadata processing and / or usage extraction and time difference determination may be repeated for any number of available identified content items 1-N (N is a positive integer greater than 1). . Thereafter, selection of candidate content items is performed based on the average of all such reference time differences.

図1〜2を参照して、本発明の実施例の処理が説明される。上述したように、図1に示されるユーザインタフェース1−3を介しユーザによって、又はデータベース1−2の新たに追加されたコンテンツアイテム又は孤立したコンテンツアイテムを検出などすることによってシステムにより自動的に特定される。   The processing of the embodiment of the present invention will be described with reference to FIGS. As described above, automatically identified by the system via the user interface 1-3 shown in FIG. 1 or by detecting a newly added or isolated content item in the database 1-2. Is done.

S1において、上述したように、ベース時間決定装置1−13がベース時間を決定する。抽出システム1−1の時間データ抽出装置1−11は、図2のS2において示されるように、第1の特定されたコンテンツアイテムの第1時間データを抽出する。S2において、さらなる特定されたコンテンツアイテムが、例えば、ユーザ又はシステムがそれに基づきターゲット文書が抽出されるいくつかの“アンカー”文書を指定する場合など、同様に処理されるかもしれない。   In S1, as described above, the base time determination device 1-13 determines the base time. The time data extraction device 1-11 of the extraction system 1-1 extracts the first time data of the first identified content item as shown in S2 of FIG. In S2, further identified content items may be processed in a similar manner, for example, when the user or system specifies several “anchor” documents from which the target document is extracted.

S3において、基準時間差が、各特定されたコンテンツアイテムに対してベース時間と特定されたコンテンツアイテムの時間との間の時間差を決定することによって、時間メタデータ抽出装置1−11により決定される。S4において、そのような基準時間差は、平均的な基準時間差で到着するよう平均化されてもよい。ここで使用される平均とは、算術平均、モード又はメディアンの計算に基づき決定されるかもしれない。さらに、上記値の単純和が、選択された値の合成的な視点を提供するのに適切に選択された統計的機能と共に利用されてもよい。   In S3, a reference time difference is determined by the time metadata extraction device 1-11 by determining a time difference between the base time and the time of the identified content item for each identified content item. In S4, such a reference time difference may be averaged to arrive at an average reference time difference. The average used here may be determined based on arithmetic average, mode or median calculations. Furthermore, the simple sum of the values may be utilized with a statistical function appropriately selected to provide a synthetic view of the selected value.

S5において、閾値又は範囲が、基準時間差又は平均基準時間差に基づき設定される。例えば、1又は0の値は、ベース時間と第1の特定されたコンテンツアイテムとの間の時間差が僅かであることを示し、9又は10の値は時間差が大きいことを示すように、閾値が割り当てられてもよい。あるいは、1〜10のスケールを使用する代わりに、閾値は、例えば、“同一の時間”、“大変近い時間”、“近い時間”、“離れた時間”、“大変離れた時間”又はそのような指定などを表すものであってもよい。このような値の他の多数のスキームが、本発明の趣旨から逸脱することなく利用可能であるということは理解されるであろう。   In S5, a threshold value or range is set based on the reference time difference or the average reference time difference. For example, a value of 1 or 0 indicates that the time difference between the base time and the first identified content item is small, and a value of 9 or 10 indicates that the time difference is large. May be assigned. Alternatively, instead of using a scale of 1-10, the threshold may be, for example, “same time”, “very close time”, “close time”, “away time”, “very far time”, or the like It may represent a specific designation. It will be understood that many other schemes of such values can be used without departing from the spirit of the invention.

さらに、第2閾値が同様にして選択されてもよい。第1閾値は最大時間差を表し、第2閾値は最小時間差を表し、一緒になってこれらの閾値がある範囲を構成する。候補となるアイテムは、それらの差分が当該範囲内に属する場合に限って(ベース時間と候補となるコンテンツアイテム時間との間の差分)、選択される。   Further, the second threshold value may be selected in the same manner. The first threshold value represents the maximum time difference, the second threshold value represents the minimum time difference, and together these constitute a range with these threshold values. Candidate items are selected only if their differences fall within the range (difference between base time and candidate content item time).

S6において、図1の候補となるコンテンツアイテムの特定装置1−12は、データベースにおいて、ネットワークを介して又は何れかにおいて候補となるコンテンツアイテムを特定し、時間データ抽出装置1−11(図2)は、各候補となるコンテンツアイテムの時間データを抽出する。その後S7において、候補となるコンテンツアイテムの時間差の決定が実行される。さらなる特定されたコンテンツアイテムがまた利用可能であり、時間データを抽出し、時間差を決定する処理が、候補となるコンテンツアイテム1〜Mについて続けられる。   In S6, the candidate content item specifying device 1-12 shown in FIG. 1 specifies a candidate content item in the database via the network or in any case, and the time data extracting device 1-11 (FIG. 2). Extracts the time data of each candidate content item. Thereafter, in S7, the determination of the time difference between the candidate content items is executed. Further identified content items are also available, and the process of extracting time data and determining the time difference is continued for candidate content items 1-M.

S8において、候補となるコンテンツアイテムの時間差は、選択装置1−16によって閾値又は範囲と対比される。その差分が閾値以下又は当該範囲内である場合、それが選択される。   In S8, the time difference between candidate content items is compared with a threshold value or a range by the selection device 1-16. If the difference is less than or within the threshold, it is selected.

例えば、ベース時間が2004年11月22日午後8時として決定され、第1の特定されたコンテンツアイテムの時間が2004年11月22日の午後6時であると決定される場合、ベース時間と第1の特定されたコンテンツアイテムとの間の差分を表す2時間の時間差が、第1基準時間差となる。この2時間の時間差に基づき、又は特定されたコンテンツアイテム1−Nから決定された基準時間差の平均に基づき、時間差閾値が、“4時間”、“同日”、“同一日数”、“近い時間差”又は“4”などとして設定される。(4は、0〜9で割り当てられた整数であり、0は実質的に同一な時間を意味し、9は大変離れた時間を意味する。)その後、候補となるコンテンツアイテムの差分が当該閾値と対比され、S8において、ベース時間からの候補となるコンテンツアイテムの時間差が4時間以内、“同日”中、“同一日数”内、“近い時間差”の範囲内、又は時間差スケールで“4”の閾値によるものである場合、候補となるアイテムが選択される。   For example, if the base time is determined as 8:00 pm on November 22, 2004 and the time of the first identified content item is determined to be 6:00 pm on November 22, 2004, the base time and A time difference of 2 hours representing a difference from the first identified content item becomes a first reference time difference. Based on the time difference of 2 hours or based on the average of the reference time differences determined from the identified content items 1-N, the time difference threshold values are “4 hours”, “same day”, “same days”, “close time difference”. Alternatively, it is set as “4” or the like. (4 is an integer assigned from 0 to 9, 0 means substantially the same time, and 9 means a very far time.) Thereafter, the difference between the candidate content items is the threshold value. In S8, the time difference of the candidate content item from the base time is within 4 hours, “same day”, “same number of days”, “near time difference”, or “4” on the time difference scale. If it is due to a threshold, a candidate item is selected.

本発明の特徴によると、差分粒度がベース時間からさらに離れた時間に対してよりもベース時間により近い時間に対して大きなものとなるように、閾値は設定される。このため、例えば、ベース時間からの距離が1〜10のスケールによりランク付けされている場合、ベース時間からの差分が増大するに従って、より大きな差分がスケールのより小さなグラデーションにより取り込まれるかもしれない。従って、基準時間差(ベース時間と特定された文書又はコンテンツアイテムとの間の差分)が1時間である場合、ベースからの候補となる差分が5時間であれば、第1の候補となるコンテンツアイテムは非類似と判断されるかもしれない。しかしながら、基準時間差が1000日である場合、ベースからの第2の候補となる差分が6000日であったとしても、第2の候補となる文書は類似と判断されるかもしれない。このような閾値は、しばしば人々は直感的により以前の時点の時間差をより最近の同じ長さの時間差ほど重要とは考えないという考えに基づくものである。すなわち、人が時間差において関連するベース時間から遠く離れるに従って、類似性を決定するのに時点間の時間差は重要でなくなる。このような閾値処理は、決定された粒度閾値処理の基準時間差と呼ばれる。   According to a feature of the invention, the threshold is set such that the difference granularity is greater for times closer to the base time than for times further away from the base time. Thus, for example, if the distance from the base time is ranked by a scale of 1-10, as the difference from the base time increases, a larger difference may be captured by a smaller scale gradation. Thus, if the reference time difference (difference between the base time and the identified document or content item) is 1 hour, the content item that is the first candidate if the candidate difference from the base is 5 hours May be considered dissimilar. However, if the reference time difference is 1000 days, the second candidate document may be determined to be similar even if the second candidate difference from the base is 6000 days. Such thresholds are often based on the idea that people intuitively do not consider a time difference at a previous time point as important as a more recent time difference of the same length. That is, as the person moves farther away from the associated base time in the time difference, the time difference between time points becomes less important in determining similarity. Such threshold processing is called a reference time difference of the determined granularity threshold processing.

上述されるように、特定されたコンテンツアイテムの差分セットにおけるスプレッドに基づき、最大及び最小閾値を用いて、ある範囲が閾値設定装置1−14によってS5において生成されるかもしれない。従って、1つのみの特定されたコンテンツアイテムによる上述した具体例を用いて、最大閾値は記載されたようなものであり、最小閾値は、例えば、“異なる時間”、“少なくとも1時間”、大変近い時間“又は差分ランキング2”などとされる。このとき、選択されるコンテンツアイテムの範囲は、使用される閾値処理/範囲のシステムに応じて、“同日の異なる時間”、“同一期間の異なる時間”、“1〜4時間”、“時間近接した時間差の大変近い差分”、又は“2〜4”スケールであるかもしれない。   As described above, a range may be generated in S5 by the threshold setting device 1-14 using the maximum and minimum thresholds based on the spread in the difference set of identified content items. Thus, using the above example with only one identified content item, the maximum threshold is as described, and the minimum threshold is, for example, “different time”, “at least one hour”, very The near time is “or differential ranking 2”. At this time, the range of the selected content item is “different time of the same day”, “different time of the same period”, “1 to 4 hours”, “time proximity”, depending on the threshold processing / range system used. May be a "very close difference" or "2-4" scale.

本発明の特徴によると、複数の“ベース”時間が利用可能であり、このような各ベース時間に対して、決定された粒度の基準時間差が個別に適用される。例えば、ユーザの結婚式の日付、子供の誕生日、記念日などの過去の重要なイベントの時間と実際の現在の時間が第2のベース時間となりうる。このため、粒度レベルは、ベース時間1からの差分により減少し(候補となる文書時間が過去になるほど、より多くの経過時間が類似すると考えられる)、ベース時間2からの時間差により同様に減少する。このアイデアは、例えば、ある日付に結婚式をした人にとって、第2ベース時間により近い時間差はより重要となり、このため、より高い粒度を必要とするというものである。   According to a feature of the present invention, multiple “base” times are available, and for each such base time, a reference time difference of the determined granularity is applied individually. For example, the second base time may be the time of a past important event, such as a user's wedding date, child's birthday, or anniversary, and the actual current time. For this reason, the granularity level decreases due to the difference from the base time 1 (the more elapsed time is considered to be similar as the candidate document time becomes the past), and similarly decreases due to the time difference from the base time 2. . The idea is that, for example, for a person who has a wedding on a certain date, the time difference closer to the second base time becomes more important and therefore requires a higher granularity.

このような第2、第3、第L(Lは、3より大きな整数)ベース時間は、ユーザによって設定可能であるか、又は上述したベース時間を決定する方法に従ってシステムにより決定することが可能である。このため例えば、システムが、ユーザに係る文書の多く又は大きなパーセンテージ(ユーザのコンピュータ、データベース、携帯などにある文書など)が、ある時間にコンテンツアイテム時間(生成又は直近の使用日付/時間など)を有する場合、このような追加的なベース時間が設定可能である。例えば、説明のため、結婚式の写真、結婚式のビデオ、音楽、電子メールなどのコンテンツアイテムのユーザの過去の結婚式の日付に又はその近くに通常よりかなり高い集中度を示す統計関数に基づき、又は閾値を利用して、多くのコンテンツアイテムがこのようなさらなるベース時間として決定可能である。その後、基準時間差が決定可能であり、このようなさらなるベース時間に基づき、決定された粒度の基準時間差に従って閾値が設定される。   Such second, third and Lth (L is an integer greater than 3) base times can be set by the user or can be determined by the system according to the method for determining the base time described above. is there. Thus, for example, a system may have a large or large percentage of documents related to a user (such as a document on a user's computer, database, mobile phone, etc.) that has a content item time (such as the date of creation or most recent use / time) at a certain time. If so, such additional base time can be set. For example, for illustrative purposes, based on statistical functions that show a much higher concentration than usual on or near a user's past wedding date for content items such as wedding photos, wedding videos, music, email, etc. Or, using a threshold, many content items can be determined as such additional base times. Thereafter, a reference time difference can be determined, and a threshold is set according to the determined reference time difference of the granularity based on such further base time.

本発明の特徴によると、抽出されるコンテンツアイテムは、ユーザにより選択されたコンテンツアイテムのコンテンツタイプと異なるコンテンツタイプであってもよい。例えば、ユーザにより選択されたコンテンツアイテムが音楽ファイル、すなわち、MP3タイプである場合、抽出されたコンテンツアイテムは、写真データのコンテンツタイプであるかもしれない。このように、例えば、あるジャンルの写真が、時間類似性に基づきユーザにより選択された音楽に一致するよう抽出されるようにしてもよい。   According to a feature of the present invention, the extracted content item may be a content type different from the content type of the content item selected by the user. For example, if the content item selected by the user is a music file, ie, MP3 type, the extracted content item may be the content type of photo data. In this way, for example, a photo of a certain genre may be extracted so as to match the music selected by the user based on the temporal similarity.

この(又はこれらの)選択された候補となるコンテンツアイテムが、S9においてユーザ又はユーザインタフェースに提供される。データベース又はユーザインタフェース1−3に対する選択された候補となるアイテムの抽出を実行させるため、信号が直接データベース1−2に提供されてもよい。あるいは(又は加えて)、候補となるコンテンツアイテムが拒絶される場合、信号が提供されてもよい。   This (or these) selected candidate content items are provided to the user or user interface in S9. A signal may be provided directly to the database 1-2 to cause extraction of selected candidate items for the database or user interface 1-3. Alternatively (or in addition), a signal may be provided if a candidate content item is rejected.

ユーザ(図示せず)に抽出可能なコンテンツアイテムを通知するための通知がユーザインタフェース1−3に提供されてもよい。この通知は、抽出されるコンテンツアイテムの特定、コンテンツアイテムの記述、コンテンツアイテムのURL又はリンク、コンテンツアイテム全体又はその一部の抽出、又は上記の組み合わせから構成されるかもしれない。システムはまた、データベースを整理するため、アンカーアイテムにより選択される抽出されたアイテムをグループ化するのに利用可能である。S10において、処理は終了する。   A notification for notifying a user (not shown) of extractable content items may be provided to the user interface 1-3. This notification may consist of identifying the content item to be extracted, a description of the content item, the URL or link of the content item, extracting the entire content item or part thereof, or a combination of the above. The system can also be used to group extracted items selected by anchor items to organize the database. In S10, the process ends.

上記説明により提供された本発明の実施例は、単なる例示的な実施例として意図されている。しかしながら、本発明の範囲は請求項に与えられるということは理解されるであろう。   The embodiments of the present invention provided by the above description are intended as exemplary embodiments only. However, it will be understood that the scope of the invention is provided by the claims.

図1は、本発明の実施例による抽出システムの概略図である。FIG. 1 is a schematic diagram of an extraction system according to an embodiment of the present invention. 図2は、本発明の実施例によるシステムの処理のフローチャートである。FIG. 2 is a flowchart of the processing of the system according to the embodiment of the present invention.

Claims (13)

ベース時間を決定するステップと、
第1の特定されたコンテンツアイテムの時間メタデータを第1時間として抽出するステップと、
前記ベース時間と前記第1時間との間で決定される基準時間差に基づき第1閾値を設定するステップと、
第1の候補となるコンテンツアイテムの時間メタデータを第1候補時間として抽出し、前記ベース時間と前記第1候補時間との間の差分を第1候補時間差として決定するステップと、
前記第1候補時間差と前記第1閾値とに基づき前記第1候補コンテンツアイテムを選択するステップと、
前記第1候補コンテンツアイテムが選択されると、前記第1候補コンテンツアイテムの選択信号を出力するステップと、
を有するコンテンツアイテム抽出方法。
Determining a base time;
Extracting the time metadata of the first identified content item as a first time;
Setting a first threshold based on a reference time difference determined between the base time and the first time;
Extracting time metadata of a content item as a first candidate as a first candidate time, and determining a difference between the base time and the first candidate time as a first candidate time difference;
Selecting the first candidate content item based on the first candidate time difference and the first threshold;
Outputting a selection signal of the first candidate content item when the first candidate content item is selected;
A content item extraction method comprising:
前記第1閾値が、決定された粒度の基準時間差に基づき設定される、請求項1記載の方法。   The method of claim 1, wherein the first threshold is set based on a determined reference time difference in granularity. 前記基準時間差に基づき、前記第1閾値と一緒になってある範囲を有する第2閾値を設定し、前記第1候補時間差が前記範囲内にあるとき、前記第1候補コンテンツアイテムを選択するステップをさらに有する、請求項1記載の方法。   Setting a second threshold having a range together with the first threshold based on the reference time difference, and selecting the first candidate content item when the first candidate time difference is within the range; The method of claim 1 further comprising: 前記第1時間と前記第1候補時間の少なくとも1つは、コンテンツアイテム取得時間、コンテンツアイテムを直近に使用した時間、コンテンツアイテムを最初に使用した時間及びコンテンツアイテムを最もよく使用する時間を有する、請求項1記載の方法。   At least one of the first time and the first candidate time includes a content item acquisition time, a time when the content item was most recently used, a time when the content item was used first, and a time when the content item is used most often. The method of claim 1. 前記第1時間と前記第1候補時間の少なくとも1つは、コンテンツアイテムの直近変更時間及びコンテンツアイテム生成時間を有する、請求項1記載の方法。   The method of claim 1, wherein at least one of the first time and the first candidate time comprises a content item last modification time and a content item generation time. 第2の特定されたコンテンツアイテムの時間メタデータを第2時間として抽出するステップと、
前記ベース時間と前記第2時間との間の差分として決定される第2基準時間差にもまた基づき、前記第1閾値を設定するステップと、
をさらに有する、請求項1記載の方法。
Extracting time metadata of the second identified content item as a second time;
Setting the first threshold based also on a second reference time difference determined as a difference between the base time and the second time;
The method of claim 1, further comprising:
ベース時間を決定するよう構成されるベース時間抽出装置と、
第1の特定されたコンテンツアイテムの時間メタデータを第1時間として抽出し、前記ベース時間と前記第1時間との間の時間差を基準時間差として決定し、第1候補コンテンツアイテムのメタデータを第1候補時間として抽出し、前記ベース時間と前記第1候補時間との間の時間差を第1候補時間差として決定するよう構成される時間メタデータ抽出装置と、
前記ベース時間と前記第1時間との間の差分として決定される基準時間差に基づき第1閾値を設定するよう構成される閾値設定装置と、
前記第1候補時間差と前記第1閾値とに基づき前記第1候補コンテンツアイテムを選択するよう構成される選択装置と、
前記第1候補時間が選択されると、前記第1候補コンテンツアイテムの選択信号を出力するよう構成される結果出力と、
を有するコンテンツアイテム抽出システム。
A base time extractor configured to determine a base time;
The time metadata of the first identified content item is extracted as a first time, the time difference between the base time and the first time is determined as a reference time difference, and the metadata of the first candidate content item is A time metadata extraction device configured to extract as one candidate time and determine a time difference between the base time and the first candidate time as a first candidate time difference;
A threshold setting device configured to set a first threshold based on a reference time difference determined as a difference between the base time and the first time;
A selection device configured to select the first candidate content item based on the first candidate time difference and the first threshold;
A result output configured to output a selection signal for the first candidate content item when the first candidate time is selected;
A content item extraction system.
前記第1閾値が、決定された粒度の基準時間差に基づき設定される、請求項7記載のシステム。   The system according to claim 7, wherein the first threshold is set based on a reference time difference of the determined granularity. 前記閾値設定装置はさらに、前記基準時間差に基づき、前記第1閾値と一緒にある範囲を有する第2閾値を設定し、
前記選択装置は、前記第1候補時間差が前記範囲内にあるとき、前記第1候補コンテンツアイテムを選択する、請求項7記載のシステム。
The threshold setting device further sets a second threshold having a range together with the first threshold based on the reference time difference,
The system according to claim 7, wherein the selection device selects the first candidate content item when the first candidate time difference is within the range.
前記第1時間と前記第1候補時間の少なくとも1つは、コンテンツアイテム取得時間、コンテンツアイテムを直近に使用した時間、コンテンツアイテムを最初に使用した時間及びコンテンツアイテムを最もよく使用した時間を有する、請求項7記載のシステム。   At least one of the first time and the first candidate time has a content item acquisition time, a time when the content item was most recently used, a time when the content item was used first, and a time when the content item was most used, The system of claim 7. 前記第1時間と前記第1候補時間の少なくとも1つは、コンテンツアイテム直近変更時間及びコンテンツアイテム生成時間を有する、請求項7記載のシステム。   The system according to claim 7, wherein at least one of the first time and the first candidate time includes a content item latest change time and a content item generation time. 前記第1時間と前記第1候補時間の少なくとも1つは、頻繁に使用される時間、ユーザにより直近に使用された時間及びユーザにより最もよく使用される時間の1つを有する、請求項7記載のシステム。   8. The at least one of the first time and the first candidate time has one of a frequently used time, a time most recently used by a user, and a time most often used by a user. System. 前記時間データ抽出装置は、第2の特定されたコンテンツアイテムの時間メタデータを第2時間として抽出するよう構成され、
前記閾値設定装置は、前記ベース時間と前記第2時間との間の差分として決定される第2基準時間差にもまた基づき、前記第1閾値を設定するよう構成される、請求項7記載のシステム。
The time data extraction device is configured to extract time metadata of a second identified content item as a second time;
8. The system of claim 7, wherein the threshold setting device is configured to set the first threshold based also on a second reference time difference determined as a difference between the base time and the second time. .
JP2007543975A 2004-12-01 2005-11-30 Adapting temporal similarity threshold in related content extraction Pending JP2008522309A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US63213604P 2004-12-01 2004-12-01
PCT/IB2005/053983 WO2006059293A1 (en) 2004-12-01 2005-11-30 Adaptation of time similarity threshold in associative content retrieval

Publications (1)

Publication Number Publication Date
JP2008522309A true JP2008522309A (en) 2008-06-26

Family

ID=36169210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007543975A Pending JP2008522309A (en) 2004-12-01 2005-11-30 Adapting temporal similarity threshold in related content extraction

Country Status (5)

Country Link
EP (1) EP1820125A1 (en)
JP (1) JP2008522309A (en)
KR (1) KR20070086805A (en)
CN (1) CN101069180A (en)
WO (1) WO2006059293A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008242966A (en) * 2007-03-28 2008-10-09 Kddi Corp Recommender system

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002323413A1 (en) * 2001-08-27 2003-03-10 Gracenote, Inc. Playlist generation, delivery and navigation
US6987221B2 (en) * 2002-05-30 2006-01-17 Microsoft Corporation Auto playlist generation with multiple seed songs
US6996390B2 (en) * 2002-06-26 2006-02-07 Microsoft Corporation Smart car radio
US7228054B2 (en) * 2002-07-29 2007-06-05 Sigmatel, Inc. Automated playlist generation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008242966A (en) * 2007-03-28 2008-10-09 Kddi Corp Recommender system

Also Published As

Publication number Publication date
EP1820125A1 (en) 2007-08-22
CN101069180A (en) 2007-11-07
KR20070086805A (en) 2007-08-27
WO2006059293A1 (en) 2006-06-08

Similar Documents

Publication Publication Date Title
JP5015789B2 (en) Adaptation of location similarity threshold in related content extraction
CN100559868C (en) The method and system of process user preference
CA2628946C (en) Methods for characterizing content item groups
US9652693B2 (en) Automatic photo grouping by events
US8117210B2 (en) Sampling image records from a collection based on a change metric
JP4643735B1 (en) Electronic device and video processing method
US8356034B2 (en) Image management apparatus, control method thereof and storage medium storing program
CN101398850A (en) Multiple media type synchronization between host computer and media device
CN101128880A (en) Retrieving content items for a playlist based on universal content ID
KR20090118752A (en) Method and apparatus for providing content playlist
US20060288042A1 (en) System and method for generating a play-list
JP5415516B2 (en) Method and apparatus for reproducing one document preferred by user from a plurality of documents
JP2008522311A (en) Automatic content organization based on content item association
JP2008522310A (en) Extract related content
US9665627B2 (en) Method and device for multimedia data retrieval
US20140012850A1 (en) Method And Apparatus For Prioritizing Metadata
US20150331863A1 (en) Selection method, method for maintaining data list and electronic device
JP2008522309A (en) Adapting temporal similarity threshold in related content extraction
JP2019086939A (en) Search system, search method and search program