JP7843895B2 - メディアアイテムコレクション内の視覚テーマの決定 - Google Patents
メディアアイテムコレクション内の視覚テーマの決定Info
- Publication number
- JP7843895B2 JP7843895B2 JP2025092492A JP2025092492A JP7843895B2 JP 7843895 B2 JP7843895 B2 JP 7843895B2 JP 2025092492 A JP2025092492 A JP 2025092492A JP 2025092492 A JP2025092492 A JP 2025092492A JP 7843895 B2 JP7843895 B2 JP 7843895B2
- Authority
- JP
- Japan
- Prior art keywords
- media item
- media
- cluster
- subset
- media items
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/56—Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/75—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本願は、2021年3月11日に出願され、「メディアアイテムコレクション内のピクセルからの視覚テーマの決定」と題された米国特許仮出願第63/187390号および2021年5月17日に出願され、「メディアアイテムコレクション内のピクセルからの視覚テーマの決定」と題された米国特許仮出願第63/189658号の両方の優先権を主張する、2021年10月25日に出願され、「メディアアイテムコレクション内の視覚テーマの決定」と題された米国特許出願第17/509767号の優先権を主張し、各出願の全体が本明細書に組み込まれる。
スマートフォンまたは他のデジタルカメラなどの装置のユーザは、多数の写真およびビデオを撮影して、画像ライブラリに記憶する。ユーザは、このようなライブラリを利用して自分の写真およびビデオを閲覧することによって、誕生日、結婚式、休暇、旅行などの様々なイベントを思い出す。ユーザは、長期間にわたって撮影された数千枚の画像を含む大きな画像ライブラリを有することができる。
コンピュータによって実装される方法は、訓練済み機械学習モデルを用いて、ユーザアカウントに関連付けられたメディアアイテムコレクションから、メディアアイテムのベクトル表現を生成することと、メディアアイテムのベクトル表現に基づいて、各クラスタ内のメディアアイテムが視覚的類似度を有するようにメディアアイテムクラスタを決定することとを含み、メディアアイテム対のベクトル表現間のベクトル距離は、メディアアイテムの視覚的類似度を示し、クラスタは、クラスタ内の各メディアアイテム対の間のベクトル距離が視覚的類似度閾値の範囲の外にあるように選択され、方法はさらに、メディアアイテムクラスタのサブセットを含むユーザインターフェイスを表示することとを含む。
メディアアイテムクラスタのサブセットを選択することは、メディアアイテムクラスタのサブセットが場所的多様性基準を満たすような場所に基づいて行われる。いくつかの実施形態において、メディアアイテムクラスタは、意味的類似度を有するラベルに関連付けられた対応するメディアアイテムに基づいてさらに決定される。いくつかの実施形態において、方法は、ユーザアカウントに関連付けられたユーザがメディアアイテムを参照して肯定的な行動を実行する可能性を分析することに基づいて、メディアアイテムクラスタのサブセット内の各メディアアイテムを採点することと、閾値スコアを満たす対応するスコアに基づいて、メディアアイテムクラスタのサブセットからメディアアイテムを選択することとをさらに含む。いくつかの実施形態において、方法は、メディアアイテムクラスタのサブセット内の1つ以上のメディアアイテムに関するフィードバックをユーザから受信することと、フィードバックに基づいて、メディアアイテムクラスタのサブセット内の1つ以上のメディアアイテムの対応するスコアを変更することとをさらに含む。いくつかの実施形態において、フィードバックは、ユーザインターフェイスからのメディアアイテムクラスタのサブセットから1つ以上のメディアアイテムを削除することによって示された明示的行動、またはメディアアイテムクラスタのサブセット内の対応するメディアアイテムを閲覧することもしくはメディアアイテムクラスタのサブセット内の対応するメディアアイテムを共有することのうちの1つ以上によって示された暗黙的行動を含む。いくつかの実施形態において、方法は、メディアアイテムクラスタの集約サブセットの集約フィードバックをユーザから受信することと、集約フィードバックを訓練済み機械学習モデルに提供することとを含み、訓練済み機械学習モデルのパラメータが更新され、方法はさらに、訓練済み機械学習モデルのパラメータを更新することに基づいて、メディアアイテムクラスタを変更することをさらに含む。いくつかの実施形態において、方法は、視覚的類似度に対応する最大数の物体を含む特定のメディアアイテムに基づいて、メディアアイテムクラスタのサブセット内の各クラスタから、特定のメディアアイテムを、メディアアイテムクラスタのサブセット内の各クラスタのカバー写真として選択することをさらに含む。いくつかの実施形態において、方法は、視覚的類似度の種類および共通表現に基づいて、メディアアイテムクラスタのサブセット内の各クラスタにタイトルを追加することをさらに含む。いくつかの実施形態において、ユーザインターフェイスは、所定の間隔で表示される。いくつかの実施形態において、方法は、メディアアイテムクラスタのサブセットが利用可能であるという通知を、ユーザアカウントに関連付けられたユーザに提供することをさらに含み、通知は、メディアアイテムクラスタのサブセット内のクラスタの各々に対応するタイトルを含む。いくつかの実施形態において、方法は、計算を最適化するために個々の装置上で実行される計算を決定することと、個々の装置上で実行される計算に基づいて、訓練済み機械学習モデルを複数の装置上で実装することとをさらに含む。
変更を含むユーザからのフィードバックを用いて訓練される。
ネットワーク環境100
図1は、例示的な環境100のブロック図を示す。いくつかの実施形態において、環境100は、メディアサーバ101と、ユーザ装置115aと、ユーザ装置115nと、ネットワーク105とを含む。ユーザ125a、125nは、ユーザ装置115a、115nに各々関連付けられてもよい。いくつかの実施形態において、環境100は、図1に示されていない他のサーバまたは装置を含んでもよく、またはメディアサーバ101を含まなくてもよい。図1および他の図面において、参照番号の後の文字、例えば「115a」は、その特定の参照番号を有する要素への言及を表す。後ろに文字を持たない本文中の参照番号、例えば「115」は、その参照番号を有する要素の実施形態への一般的言及を表す。
含む第2の例325を示している。3つの画像は、木の葉が次第により区別できるように、異なる方法で撮影された同じ静物画である。
図2は、本明細書に記載された1つ以上の特徴を実装するために使用され得る例示的なコンピューティング装置200のブロック図である。コンピューティング装置200は、任意の好適なコンピュータシステム、サーバ、または他の電子装置もしくはハードウェア装置であってもよい。一例において、コンピューティング装置200は、メディアアプリケーション103を実行するために使用されるユーザ装置115である。別の例において、コンピューティング装置200は、メディアサーバ101である。さらに別の例において、メディアアプリケーション103は、ユーザ装置115上に部分的に配置され、メディアサーバ101上に部分的に配置される。
ア(メディアアプリケーション103を含む)を記憶することができる。
する。
図2は、例示的なメディアアプリケーション103を示している。メディアアプリケーション103は、フィルタリングモジュール202と、クラスタリングモジュール204と、機械学習モジュール205と、選択モジュール206と、ユーザインターフェイスモジュール208とを含む。いくつかの実施形態において、メディアアプリケーション103は、クラスタリングモジュール204または機械学習モジュール205のいずれかを使用する。
に関連付けられたメディアアイテムコレクション、例えばユーザに関連付けられたライブラリにアクセスする。フィルタリングモジュール202がメディアアイテムを除外した場合、クラスタリングモジュール204は、禁止カテゴリリストに対応するメディアアイテムを含まないメディアアイテムコレクションにアクセスする。クラスタリングモジュール204は、メディアアイテムコレクションからの画像またはビデオのピクセルに基づいて、各クラスタ内のメディアアイテムが視覚的類似度を有するようにメディアアイテムクラスタを決定することができる。いくつかの実施形態において、クラスタリングは、N次元ガウス多様性関数を用いて、視覚的類似度を決定する。
みとを含むデータファイルとして提供されてもよい。機械学習モジュール205は、訓練済みモデルのデータファイルを読み取り、訓練済みモデルにおいて指定されたモデル構造または形態に基づいて、ノード接続、層および重みを含むニューラルネットワークを実装することができる。
、モデル形態または構造は、各層中のノードの数および/または種類を指定する。
デオ内のフレーム、会話、または他の音声などを処理する際に有用であろう。例えば、ゲーティングモデルに使用されるヒューリスティックスベースモデルは、以前の画像に対して以前に生成された1つ以上の特徴を記憶することができる。
対の間の接続に、各々の重みを適用することができる。例えば、各々の重みは、ランダムに割り当てられてもよく、またはデフォルト値に初期化されてもよい。その後、例えば、メディアクラスタの訓練セットを用いて機械学習モデルを訓練して、結果を生成することができる。いくつかの実施形態において、アーキテクチャ全体のサブセットは、事前に訓練された重みを活用するために、伝達学習法として他の機械学習アプリケーションから再利用されてもよい。
計算を最適化するように個々の装置上で実行される計算を決定することができる。別の例において、機械学習モジュール205は、プロセッサ235が特定の数(例えば、1000個)のGPUコアを有するGPUを含んでいると判断すると、機械学習モジュール205を(例えば、1000個の個別のプロセスまたはスレッドとして)実装することができる。
クラスタのうちの1つのタイトルの変更を含む。機械学習モジュール205は、フィードバックを機械学習モデルに提供して、特定の種類の視覚的類似度を有するメディアアイテムクラスタ(例えば、視覚的に類似しているが、ユーザが見たい種類のメディアではない海波の画像、および異なる時間および/または異なる場所で撮影した波上のサーファーの画像)を除外するようにパラメータを変更する。
ジュール206は、より低い視覚的類似度を有するテーマをより頻繁に選択するようにスコアを修正することができる。
ることもできる。
例えば、「mixed nuts」、「smorgasbord」、「mixed bag」、「goody bag」、「wine flight」、「cheese pairing」、「sampler」、「treasure trove」、「overlooked treasures」、「have a drink」)、写真トレイル(例えば、「photo detective」、「photo mystery」、「mystery photos」、「photo sphinx」)、創造的な組み合わせ、相関関係(
例えば、繋がり、羽毛の写真、フォトクラブ、フォトウィービング、パターン的、偶然、原因と結果、スロットマシン、これらのうちの1つは他のものと同じである、類似)、パターンに言及するタイトル(例えば、ベータパターン、パターンハンター、小パターン、パターンポータル、ドットの連結、画像パターン、写真パターン)、パターンの同義語、例えばテーマ(例えば、フォトストーリー、写真ストーリー、フォト物語、2つの写真の物語、フォトテーマ、ラッキーテーマ)、セット(例えば、写真セット、驚きセット)、または一致(例えば、メモリ一致)、擬音語(例えば、ジグザグ、ブーム、パンパン、ビシッ、ビシッフォト、フォトビシッ)、動詞(例えば、「look what we found in the couch cushions」、「look what appeared」、「help us sleuth」、「will it blend」、
「time flies」、「some things never change」)、または推測が正しいという高めの信頼スコアを選択モジュールが有することになる繋がりを参照するクラスタのタイトル(例えば、魔法のパターン、軽快感)を指すことができる。いくつかの実施形態において、ひな型表現は、単に「誕生日1997~2001」などのタイトルを追加することよりも、口語的且つ魅力的な面白い表現または常用表現であってもよい。いくつかの実施形態において、ユーザインターフェイスモジュール208は、図3Bの第4の例375に関して、「Look what we found」などの一般的なタイトルと、「your orange backpack brought you far」などのテーマを特定するサブタイトルとを含むタイトルを含むことができる。
図6は、いくつかの実施形態に従って、メディアアイテムクラスタのサブセットを表示するための例示的な方法600を示すフローチャートである。フローチャート600に示された方法は、図2のコンピューティング装置200によって実行されてもよい。
ターフェイスモジュール208は、ユーザがメディアアイテムコレクションにアクセスするための許可を提供することを要求するための許可インターフェイス要素を含むユーザインターフェイスを表示することができる。ブロック604の後にブロック606を実行することができる。
Claims (21)
- コンピュータによって実行される方法であって、
メディアアイテムコレクションからの画像またはビデオのピクセルに基づいて、各クラスタ内の前記メディアアイテムが視覚的類似度を有するようにメディアアイテムクラスタの画像埋め込みを決定すること、
各メディアアイテムは、場所および関連タイムスタンプに関連付けられ、
所定の期間内に取得されたメディアアイテムは、エピソードに関連付けられ、
前記メディアアイテムコレクションは、ユーザアカウントに関連付けられ、
前記方法は、
視覚的類似度閾値の範囲内の前記視覚的類似度を有する各クラスタ内の対応するメディアアイテム、および前記メディアアイテムクラスタのサブセット内の前記対応するメディアアイテムが前記エピソードから第1の所定数よりも多くの前記対応するメディアアイテムを除外する時間的多様性基準を満たすように、対応する関連タイムスタンプに基づいて、前記メディアアイテムクラスタの前記サブセットを選択すること、
前記クラスタのサブセット内の前記対応するメディアアイテムの数が第2の所定数よりも多くのメディアアイテムを含むことに応答して、前記メディアアイテムクラスタの前記サブセットが場所的多様性基準を満たすような場所に基づいて、1つ以上の前記対応するメディアアイテムを除外することとを含む、方法。 - 前記メディアアイテムクラスタの前記サブセットを含むユーザインターフェイスを表示することと、
メディアアイテムクラスタの集約サブセットの集約フィードバックをユーザから受信することと、
前記集約フィードバックを機械学習モデルに提供することとを含み、前記機械学習モデルのパラメータは、前記集約フィードバックに基づいて更新され、前記方法は、
更新済みの前記パラメータを有する前記機械学習モデルの前記パラメータを用いて、前記メディアアイテムクラスタの前記画像埋め込みを変更することをさらに含む、請求項1に記載の方法。 - 前記メディアアイテムクラスタの前記サブセットを選択する前に、前記メディアアイテムコレクションから、禁止カテゴリリストにあるカテゴリに関連付けられたメディアアイテムを除外することをさらに含む、請求項1または2に記載の方法。
- 前記メディアアイテムクラスタを決定する前に、禁止カテゴリリストにあるカテゴリに対応するメディアアイテムを除外することをさらに含む、請求項1~3のいずれか1項に記載の方法。
- 前記メディアアイテムクラスタは、意味的類似度を有するラベルに関連付けられた前記対応するメディアアイテムに基づいてさらに決定される、請求項1~4のいずれか1項に記載の方法。
- 前記ユーザアカウントに関連付けられたユーザが前記メディアアイテムを参照して肯定的な行動を実行する可能性を分析することに基づいて、前記メディアアイテムクラスタの前記サブセット内の各メディアアイテムを採点することと、
閾値スコアを満たす対応するスコアに基づいて、前記メディアアイテムクラスタの前記サブセットから前記メディアアイテムを選択することとをさらに含む、請求項1~5のいずれか1項に記載の方法。 - 前記メディアアイテムクラスタの前記サブセット内の1つ以上のメディアアイテムに関するフィードバックを前記ユーザから受信することと、
前記フィードバックに基づいて、前記メディアアイテムクラスタの前記サブセット内の前記1つ以上のメディアアイテムの対応するスコアを変更することとをさらに含む、請求項6に記載の方法。 - 前記フィードバックは、ユーザインターフェイスからの前記メディアアイテムクラスタの前記サブセットから前記1つ以上のメディアアイテムを削除することによって示された明示的行動、または前記メディアアイテムクラスタの前記サブセット内の前記対応するメディアアイテムを閲覧すること、もしくは前記メディアアイテムクラスタの前記サブセット内の前記対応するメディアアイテムを共有することのうちの1つ以上によって示された暗黙的行動を含む、請求項7に記載の方法。
- 前記メディアアイテムクラスタの前記画像埋め込みを変更することに基づいて、ユーザインターフェイスを更新することをさらに含む、請求項1~8のいずれか1項に記載の方法。
- 前記視覚的類似度に対応する最大数の物体を含む特定のメディアアイテムに基づいて、前記メディアアイテムクラスタの前記サブセット内の各クラスタから、前記特定のメディアアイテムを、前記メディアアイテムクラスタの前記サブセット内の前記各クラスタのカバー写真として選択することをさらに含む、請求項1~9のいずれか1項に記載の方法。
- 視覚的類似度の種類および共通表現に基づいて、前記メディアアイテムクラスタの前記サブセット内の各クラスタにタイトルを追加することをさらに含む、請求項1~10のいずれか1項に記載の方法。
- 前記メディアアイテムクラスタの前記サブセットは、所定の間隔でユーザインターフェイスに表示される、請求項1~11のいずれか1項に記載の方法。
- 前記メディアアイテムクラスタの前記サブセットが利用可能であるという通知を、前記ユーザアカウントに関連付けられたユーザに提供することをさらに含み、
前記通知は、前記メディアアイテムクラスタの前記サブセット内の前記クラスタの各々に対応するタイトルを含む、請求項1~12のいずれか1項に記載の方法。 - 前記決定することは、訓練済み機械学習モデルを用いて各メディアアイテムのベクトル表現を生成するステップを含み、
メディアアイテム対のベクトル表現間のベクトル距離は、前記メディアアイテムの前記視覚的類似度を示し、
前記ベクトル表現は、前記訓練済み機械学習モデルによって生成された画像埋め込みであり、
前記クラスタは、前記クラスタ内の各メディアアイテム対の間の前記ベクトル距離が前記視覚的類似度閾値の範囲外にあるように選択される、請求項1~13のいずれか1項に記載の方法。 - コンピュータによって実行される方法であって、
ユーザアカウントに関連付けられたメディアアイテムコレクションからのメディアアイテムを訓練済み機械学習モデルへの入力として受信することを含み、各メディアアイテムは、関連タイムスタンプに関連付けられ、所定の期間内に取得された前記メディアアイテムは、エピソードに関連付けられ、
前記訓練済み機械学習モデルを用いて、メディアアイテムクラスタの出力画像埋め込みを生成することとを含み、各クラスタ内の前記メディアアイテムは、視覚的類似度を有し、前記視覚的類似度を有するメディアアイテムがベクトル空間において類似していないメディアアイテムよりも互いに近くであることにより、前記ベクトル空間を分割することが前記メディアアイテムクラスタを生成し、各メディアアイテムは、場所に関連付けられ、前記方法は、
視覚的類似度閾値の範囲内の視覚的類似度を有する各クラスタ内の対応するメディアアイテム、および前記メディアアイテムクラスタのサブセット内の前記対応するメディアアイテムが前記エピソードから第1の所定数よりも多くの前記対応するメディアアイテムを除外する時間的多様性基準を満たすように、対応する関連タイムスタンプに基づいて、前記メディアアイテムクラスタのサブセットを選択することと、
前記クラスタのサブセット内の前記対応するメディアアイテムの数が第2の所定数よりも多くのメディアアイテムを含むことに応答して、前記メディアアイテムクラスタの前記サブセットが場所的多様性基準を満たすような場所に基づいて、1つ以上の前記対応するメディアアイテムを除外することとを含む、方法。 - 前記メディアアイテムコレクションが前記訓練済み機械学習モデルに提供される前に、機能的画像は、前記メディアアイテムコレクションから削除される、請求項15に記載の方法。
- ユーザからの集約フィードバックは、メディアアイテムセットに対する反応または前記メディアアイテムセットのタイトルの変更を含む、請求項15または16に記載の方法。
- システムであって、
プロセッサと、
前記プロセッサに接続されたメモリとを備え、前記メモリは、前記プロセッサによって実行されると、前記プロセッサに以下の動作を実行させる命令を記憶し、
前記動作は、
メディアアイテムコレクションからの画像またはビデオのピクセルに基づいて、各クラスタ内の前記メディアアイテムが視覚的類似度を有するようにメディアアイテムクラスタの画像埋め込みを決定することを含み、各メディアアイテムは、場所および関連タイムスタンプに関連付けられ、所定の期間内に取得されたメディアアイテムは、エピソードに関連付けられ、前記メディアアイテムコレクションは、ユーザアカウントに関連付けられ、前記動作は、
視覚的類似度閾値の範囲内の前記視覚的類似度を有する各クラスタ内の対応するメディアアイテム、および前記メディアアイテムクラスタのサブセット内の前記対応するメディアアイテムが前記エピソードから第1の所定数よりも多くの前記対応するメディアアイテムを除外する時間的多様性基準を満たすように、対応する関連タイムスタンプに基づいて、前記メディアアイテムクラスタのサブセットを選択すること、
前記クラスタのサブセット内の前記対応するメディアアイテムの数が第2の所定数よりも多くのメディアアイテムを含むことに応答して、前記メディアアイテムクラスタの前記サブセットが場所的多様性基準を満たすような場所に基づいて、1つ以上の前記対応するメディアアイテムを除外することとを含む、システム。 - 各メディアアイテムは、関連タイムスタンプを有し、
所定の期間内に取得された前記メディアアイテムは、エピソードに関連付けられ、
前記メディアアイテムクラスタの前記サブセットを選択することは、前記メディアアイテムクラスタの前記サブセット内の対応するメディアアイテムが特定のエピソードから所定の数よりも多くの前記対応するメディアアイテムを除外する第2の時間的多様性基準を満たすように、対応する関連タイムスタンプに基づいて行われる、請求項18に記載のシステム。 - 前記動作は、前記メディアアイテムクラスタの前記サブセットを選択する前に、前記メディアアイテムコレクションから、禁止カテゴリリストにあるカテゴリに関連付けられたメディアアイテムを除外することをさらに含む、請求項18または19に記載のシステム。
- 前記メディアアイテムクラスタは、意味的類似度を有するラベルに関連付けられた前記対応するメディアアイテムに基づいてさらに決定される、請求項18~20のいずれか1項に記載のシステム。
Applications Claiming Priority (8)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US202163187390P | 2021-05-11 | 2021-05-11 | |
| US63/187,390 | 2021-05-11 | ||
| US202163189658P | 2021-05-17 | 2021-05-17 | |
| US63/189,658 | 2021-05-17 | ||
| US17/509,767 | 2021-10-25 | ||
| US17/509,767 US12008057B2 (en) | 2021-05-11 | 2021-10-25 | Determining a visual theme in a collection of media items |
| JP2023528144A JP2023548906A (ja) | 2021-05-11 | 2021-12-13 | メディアアイテムコレクション内の視覚テーマの決定 |
| PCT/US2021/063116 WO2022240444A1 (en) | 2021-05-11 | 2021-12-13 | Determining a visual theme in a collection of media items |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023528144A Division JP2023548906A (ja) | 2021-05-11 | 2021-12-13 | メディアアイテムコレクション内の視覚テーマの決定 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2025124812A JP2025124812A (ja) | 2025-08-26 |
| JP7843895B2 true JP7843895B2 (ja) | 2026-04-10 |
Family
ID=79687071
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023528144A Pending JP2023548906A (ja) | 2021-05-11 | 2021-12-13 | メディアアイテムコレクション内の視覚テーマの決定 |
| JP2025092492A Active JP7843895B2 (ja) | 2021-05-11 | 2025-06-03 | メディアアイテムコレクション内の視覚テーマの決定 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023528144A Pending JP2023548906A (ja) | 2021-05-11 | 2021-12-13 | メディアアイテムコレクション内の視覚テーマの決定 |
Country Status (5)
| Country | Link |
|---|---|
| EP (1) | EP4204993A1 (ja) |
| JP (2) | JP2023548906A (ja) |
| KR (1) | KR20230073327A (ja) |
| CN (1) | CN116324764A (ja) |
| WO (1) | WO2022240444A1 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2025081750A1 (en) * | 2023-10-20 | 2025-04-24 | Huawei Cloud Computing Technologies Co., Ltd | Method and apparatus for programming |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009530741A (ja) | 2006-03-17 | 2009-08-27 | マイクロソフト コーポレーション | 配列ベースのメディアアイテム発見 |
| JP2011154687A (ja) | 2010-01-26 | 2011-08-11 | Xerox Corp | 画像データセットをナビゲートするための方法、装置、及びプログラム |
| CN112088370A (zh) | 2018-05-07 | 2020-12-15 | 苹果公司 | 数字资产搜索用户界面 |
| JP2021504803A (ja) | 2017-12-22 | 2021-02-15 | グーグル エルエルシーGoogle LLC | 画像選択提案 |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007080061A (ja) * | 2005-09-15 | 2007-03-29 | Univ Of Tsukuba | Webページの検索方法及びWebページのクラスタリング方法 |
| CN102265598A (zh) * | 2008-10-26 | 2011-11-30 | 惠普开发有限公司 | 使用基于内容的过滤和基于主题的聚类将图像布置到页面中 |
| WO2010146495A1 (en) * | 2009-06-15 | 2010-12-23 | Koninklijke Philips Electronics N.V. | A method and apparatus for selecting a representative image |
| US9405771B2 (en) * | 2013-03-14 | 2016-08-02 | Microsoft Technology Licensing, Llc | Associating metadata with images in a personal image collection |
| US9740963B2 (en) * | 2014-08-05 | 2017-08-22 | Sri International | Multi-dimensional realization of visual content of an image collection |
| WO2016160629A1 (en) * | 2015-03-27 | 2016-10-06 | Google Inc. | Providing selected images from a set of images |
| WO2018212822A1 (en) * | 2017-05-16 | 2018-11-22 | Google Inc. | Suggested actions for images |
| US10891526B2 (en) * | 2017-12-22 | 2021-01-12 | Google Llc | Functional image archiving |
| US11030257B2 (en) * | 2019-05-20 | 2021-06-08 | Adobe Inc. | Automatically generating theme-based folders by clustering media items in a semantic space |
| US11314802B2 (en) * | 2019-11-01 | 2022-04-26 | Microsoft Technology Licensing, Llc | Automatic image selection for visual consistency |
-
2021
- 2021-12-13 CN CN202180063447.1A patent/CN116324764A/zh active Pending
- 2021-12-13 EP EP21844453.7A patent/EP4204993A1/en not_active Withdrawn
- 2021-12-13 JP JP2023528144A patent/JP2023548906A/ja active Pending
- 2021-12-13 KR KR1020237014319A patent/KR20230073327A/ko active Pending
- 2021-12-13 WO PCT/US2021/063116 patent/WO2022240444A1/en not_active Ceased
-
2025
- 2025-06-03 JP JP2025092492A patent/JP7843895B2/ja active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009530741A (ja) | 2006-03-17 | 2009-08-27 | マイクロソフト コーポレーション | 配列ベースのメディアアイテム発見 |
| JP2011154687A (ja) | 2010-01-26 | 2011-08-11 | Xerox Corp | 画像データセットをナビゲートするための方法、装置、及びプログラム |
| JP2021504803A (ja) | 2017-12-22 | 2021-02-15 | グーグル エルエルシーGoogle LLC | 画像選択提案 |
| CN112088370A (zh) | 2018-05-07 | 2020-12-15 | 苹果公司 | 数字资产搜索用户界面 |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2022240444A1 (en) | 2022-11-17 |
| JP2025124812A (ja) | 2025-08-26 |
| CN116324764A (zh) | 2023-06-23 |
| EP4204993A1 (en) | 2023-07-05 |
| KR20230073327A (ko) | 2023-05-25 |
| JP2023548906A (ja) | 2023-11-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12265574B2 (en) | Using interpolation to generate a video from static images | |
| CN110678861B (zh) | 图像选择建议 | |
| CN113348486B (zh) | 具有选择性运动描述的图像显示 | |
| JP7654692B2 (ja) | ユーザの好みを反映した機械学習ベースの画像圧縮設定 | |
| US12340584B2 (en) | Automatic generation of events using a machine-learning model | |
| JP7843895B2 (ja) | メディアアイテムコレクション内の視覚テーマの決定 | |
| US12254387B2 (en) | Systems and methods for customizing user interfaces using artificial intelligence | |
| EP4537221B1 (en) | Prompt-driven image editing using machine learning | |
| US20260094404A1 (en) | Segmentation of objects in an image | |
| US12008057B2 (en) | Determining a visual theme in a collection of media items | |
| WO2022240443A1 (en) | Automatic generation of events using a machine-learning model | |
| WO2025231129A1 (en) | Search query generation using machine-learning model | |
| KR20260030893A (ko) | 기계 학습을 사용하여 이미지로부터 텍스트 생성 | |
| WO2024233689A1 (en) | Relighting of outdoor images using machine learning |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250606 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20250606 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260303 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260331 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7843895 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |