JP7515552B2 - 人々のグループおよび画像ベースの作成物の自動生成 - Google Patents
人々のグループおよび画像ベースの作成物の自動生成 Download PDFInfo
- Publication number
- JP7515552B2 JP7515552B2 JP2022171574A JP2022171574A JP7515552B2 JP 7515552 B2 JP7515552 B2 JP 7515552B2 JP 2022171574 A JP2022171574 A JP 2022171574A JP 2022171574 A JP2022171574 A JP 2022171574A JP 7515552 B2 JP7515552 B2 JP 7515552B2
- Authority
- JP
- Japan
- Prior art keywords
- images
- people
- image
- person
- subset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/75—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/7867—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23211—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with adaptive number of clusters
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/24—Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/30—Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
- G06V20/47—Detecting features for summarising video content
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
- G06V40/173—Classification, e.g. identification face re-identification, e.g. recognising unknown faces across different face tracks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- Library & Information Science (AREA)
- Human Computer Interaction (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Primary Health Care (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Image Analysis (AREA)
- Television Signal Processing For Recording (AREA)
- Information Transfer Between Computers (AREA)
Description
スマートフォンまたは他のデジタルカメラなどのデバイスのユーザは、多数の写真およびビデオをキャプチャして、ユーザの画像ライブラリに格納する。ユーザは、このようなライブラリを利用して、彼らの写真およびビデオを視聴し、例えば、誕生日、結婚式、休暇、旅行等のような様々なイベントを追憶する。ユーザは、長い期間にわたって撮影される何千もの画像を有する大きな画像ライブラリを有し得る。
本明細書で説明する実現例は、画像ベースの作成物を生成し提供するための方法、デバイス、およびコンピュータ可読媒体に関する。
とも1つの人々のグループをマージした後に実行されてもよい。
最も頻繁な人物識別子を含む画像の数に基づいて判断されてもよい。
セッサに動作を実行させる命令が格納されていてもよく、前記動作は、少なくとも1つの人々のグループが閾値数未満のエピソードに関連付けられていると判定することと、少なくとも1つの人々のグループが前記閾値数未満のエピソードに関連付けられているという判定に応答して、前記少なくとも1つの人々のグループを1つ以上の他の人々のグループと組み合わせることとを含む。いくつかの実現例では、前記1つ以上の他の人々のグループは、各々、前記少なくとも1つの人々のグループに含まれる人物識別子のサブセットを含んでもよい。これらの実現例では、前記ユーザインターフェイスを提供する動作は、前記少なくとも1つの人々のグループをマージした後に実行されてもよい。
本開示は、ユーザの画像ライブラリに基づいて有意な人々のグループを自動的に判定し
、適切な時間にそのような人々のグループに対する画像ベースの作成物を提供することに関する。例えば、ユーザは、例えばユーザの人生にわたって、長期間にわたって撮影される何千もの写真を含む画像ライブラリを有し得る。そのような画像のブラウジングは、ユーザが多数の関心のない画像または複製画像に遭遇する可能性があるので、面倒であり得る。さらに、検索機能は、ユーザが特定の基準を満たす画像(例えば、特定の期間にキャプチャされた画像、特定の人物を表す画像等)を識別することを可能にし得るが、ユーザは、画像を閲覧するために検索を明示的に構築し、実行する必要がある。
ントデバイス120と122との間のピアツーピア通信の一例が矢印132によって示されている。
デバイス120,122,124,および126を用いて、サーバシステム102と、および/または互いに通信することができる。いくつかの例では、ユーザU1、U2、U3、およびU4は、それぞれのクライアントデバイスおよび/もしくはサーバシステム102上で実行するアプリケーションを介して、ならびに/またはサーバシステム102上で実現されるネットワークサービス、例えばソーシャルネットワークサービスもしくは他のタイプのネットワークサービスを介して、互いと対話することができる。例えば、それぞれのクライアントデバイス120,122,124,および126は、1つ以上のサーバシステム、例えば、サーバシステム102との間でデータを通信することができる。
ザ許可された技術を用いて)画像内に示される1人以上の人物を判定するために、および画像ライブラリ108内の画像内に示される各人物(例えば、人間、ペット)に対する人物識別子を生成するために、画像を解析することを含み得る。各画像の人物識別子は、画像ライブラリ108内の画像と関連付けて格納されてもよい。いくつかの実現例では、人物識別子を生成することは、ユーザを示す画像をズーミングまたはクロッピングすることによって取得される、画像内に示される人物のサムネイル表現、例えば、人物のクローズアップを取得することをさらに含み得る。
4上の画像アプリケーション106aと協働してサーバに送信することを含み得る。
後にブロック204が続く。
ソード1の場合、20)に基づいて判断され得る。例えば、エピソード1の場合、閾値数は5(20の20%未満)であると判断し、閾値数未満に関連付けられる人物識別子(例えば、人物C)をクラスタ1から除去することができる。人物識別子の除去が、単一の人物識別子を有するクラスタをもたらす場合、そのようなクラスタは、さらなる処理の前に除去される。
ブロック214では、1つ以上の人物識別子が閾値数未満のクラスタに含まれるかどうかが判断される。例えば、図3Cに見られるように、人物識別子Dは、2つのクラスタ(クラスタ2およびクラスタ6)に含まれるものとして識別され、それは、クラスタの閾値数、例えば、4、未満である。いくつかの実現例では、クラスタの閾値数は、ユーザの画像ライブラリ中のエピソードの総数(または、少なくとも2つの人物識別子を有するクラスタを有するエピソードの総数)に基づいて選択され得る。例えば、小さな画像ライブラリ(例えば、10個のエピソード、20個のエピソードを有する)の場合、クラスタの閾値数は比較的低い値(例えば、2、3など)となるように選択することができ、大きな画像ライブラリ(例えば、50個のエピソード、200個のエピソード、またはさらにより多くのエピソードを有する)の場合、閾値数は比較的高い値(例えば、5、10など)に選択することができる。
低い人物は、会食した人物、旅行グループの一員であった人物、それらの画像において偶然にキャプチャされた人物などの、他の人物を含み得る。
々のグループに含まれる人物識別子のサブセットを含む。例えば、図3Eは、(単一のエピソードに関連付けられる)人々のグループ320が、人々のグループ310(人物Aおよび人物Bを含む)および人々のグループ330(人物Bおよび人物Eを含む)とマージされることを示す。
成可能であること)を保証することができる。
グループに対する部分的一致であり、例えば、特定の人々のグループの2つ以上の人物識別子に含まれる少なくとも2人の人物を含み、任意選択で、1人以上の他の人物を含むように、選択され得る。換言すれば、これらの実現例では、画像のサブセットは、人々のグループ内の人物識別子に関連付けられた人物のうちの少なくとも2人、および任意選択で、1人以上の他の人物(別の人々のグループにあってもよく、そうでなくてもよい)を示してもよい。これらの実現例のうちのいくつかでは、画像のサブセットは、(特定の人々のグループにない)1人以上の他の人物が任意の他の人々のグループの一部ではないように、選択され得る。
像ライブラリに追加されるときに実行され得る。これらの実現例では、方法200を実行することは、以前に得られた人々のグループを更新すること、または1つ以上の追加の人々のグループを得ることを含み得る。いくつかの実現例では、ブロック210~222は、人々のグループを得るために初期時に実行され得、ブロック224は、例えば、オンデマンドで(例えば、ユーザが画像アプリケーション106にアクセスするときに)ユーザインターフェイスを提供するために、後で実行され得る。
含むスライドショーである場合、画像は、順次表示されてもよい。例えば、画像ベースの作成物の第1の画像を含むUI412は、第1の時間量の間、表示され、その後、第2の時間量の間表示される第2の画像を含むUI414が続き、その後、第3の時間量の間表示される第3の画像を含むUI416が続く。いくつかの実現例では、UI412,414,および416の各々は、同じタイトル(図4Aのタイトル404と同じ)、またはUI412~416に表示された画像に対するそれぞれのタイトルを含み得る。いくつかの実現例では、タイトルはUI412~416に表示されなくてもよい。画像ベースの作成物における画像は、様々な連続順序、例えば、時系列の逆、時系列、人数、人々のグループに対する正確な一致に続く部分的一致、または任意の他の順序で配列され得る。
プリ)内で実行することができる。別の例では、モバイルコンピューティングデバイスと1つまたは複数のサーバデバイスとの間で計算を分割することができる。
たは処理回路であり得る。「プロセッサ」は、データ、信号、または他の情報を処理する任意の適切なハードウェアシステム、メカニズム、またはコンポーネントを含む。プロセッサは、(例えば、シングルコア、デュアルコア、またはマルチコア構成にある)1つまたは複数のコアを有する汎用中央処理ユニット(CPU)、(たとえば、マルチプロセッサ構成における)複数の処理ユニット、グラフィック処理ユニット(GPU)、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、複合プログラマブルロジックデバイス(CPLD)、機能を達成するための専用回路、ニューラルネットワークモデルベースの処理を実施するための専用プロセッサ、ニューラル回路、行列計算(例えば、行列乗算)のために最適化されたプロセッサ、または他のシステム、を備えたシステムを含み得る。ある実施の形態では、プロセッサ502は、ニューラルネットワーク処理を実施する1つまたは複数のコプロセッサを含み得る。ある実施の形態では、プロセッサ502は、確率的出力を生成するためにデータを処理するプロセッサであり得、たとえば、プロセッサ502によって生成される出力は、不正確なものであり得、または予想される出力からの範囲内において正確であり得る。処理は、特定の地理的位
置に限定される必要はなく、または時間的制限を有する必要はない。例えば、プロセッサは、「リアルタイム」、「オフライン」、「バッチモード」等でその機能を実行することができる。処理の部分は、異なる(または同じ)処理システムによって、異なる時間および異なる場所で実行されてもよい。コンピュータは、メモリと通信する任意のプロセッサであり得る。
一体化して配置される。メモリ504は、オペレーティングシステム508、画像アプリケーション510(たとえば図1の画像アプリケーション106と同じであってもよい)、他のアプリケーション512、およびアプリケーションデータ514を含む、プロセッサ502によってサーバデバイス500上で動作するソフトウェアを記憶することができる。他のアプリケーション512は、データ表示エンジン、ウェブホスティングエンジン、地図アプリケーション、画像表示エンジン、通知エンジン、ソーシャルネットワーキングエンジンなどのアプリケーションを含み得る。ある実施の形態では、画像アプリケーション510は、プロセッサ502が本明細書で説明する機能、たとえば、図2の方法の一部またはすべてを実行することを可能にする命令を含み得る。
他の接続された記憶装置)は、1つまたは複数のメッセージ、1つまたは複数の分類、電子百科事典、辞書、デジタル地図、シソーラス、知識ベース、メッセージデータ、文法、ユーザ選好、および/または本明細書に記載の特徴で使用される他の命令およびデータを
記憶することができる。メモリ504および任意の他のタイプのストレージ(磁気ディスク、光ディスク、磁気テープ、または他の有形媒体)は、「ストレージ」または「ストレージデバイス」と見なすことができる。
、I/Oインターフェイス506を介して通信することができる。ある実施の形態では、I/Oインターフェイスは、入力装置(キーボード、ポインティングデバイス、タッチスクリーン、マイクロフォン、カメラ、スキャナ、センサなど。)および/または出力装置
(表示装置、スピーカデバイス、プリンタ、モータなど。)などのインターフェイスデバイスに接続することができる。
明するアプリケーションのユーザインターフェイスを表示するために使用することができる1つまたは複数の表示装置520を含むことができる。表示装置520は、ローカル接続(例えば、ディスプレイバス)を介して、および/またはネットワーク接続を介してデ
バイス500に接続することができ、任意の適切な表示装置とすることができる。表示装置520は、LCD、LED、またはプラズマディスプレイスクリーン、CRT、テレビ、モニタ、タッチスクリーン、3Dディスプレイスクリーン、または他の視覚表示装置などの任意の適切な表示装置を含み得る。表示装置520はまた、入力装置、例えば、タッチスクリーン入力装置として機能することができる。例えば、表示装置520は、モバイルデバイス上に提供される平坦なディスプレイ画面、眼鏡もしくはヘッドセットデバイス内に提供される複数のディスプレイ画面、またはコンピュータデバイスのためのモニタ画面であり得る。
500は、示される構成要素のすべてを有しなくてもよく、および/または本明細書に示
される構成要素の代わりに、またはそれに加えて、他のタイプの構成要素を含む他の構成要素を有してもよい。いくつかのコンポーネントは、本明細書のいくつかの実施において説明されるようなブロックおよび動作を実行するものとして説明されるが、環境100、デバイス500、同様のシステム、またはそのようなシステムに関連する任意の適切なプロセッサまたは複数のプロセッサの任意の適切なコンポーネントまたはコンポーネントの組み合わせは、説明されるブロックおよび動作を実行することができる。
)から配信されるサービス(SaaS)としてのソフトウェアの形態で、電子信号に含まれ、電子信号として提供されることもできる。あるいは、1つまたは複数の方法は、ハードウェア(論理ゲートなど)で、またはハードウェアとソフトウェアとの組み合わせで実施され得る。ハードウェアの例は、プログラム可能なプロセッサ(例えば、フィールドプログラマブルゲートアレイ(FPGA)、複合プログラマブルロジックデバイス)、汎用プロセッサ、グラフィックプロセッサ、特定用途向け集積回路(ASIC)などであり得る。1つまたは複数の方法は、システム上で実行するアプリケーションの一部または構成
要素として、または他のアプリケーションおよびオペレーティングシステムとともに実行するアプリケーションまたはソフトウェアとして実行することができる。
Claims (14)
- コンピュータで実施される方法であって、
複数のエピソードを取得することを含み、各エピソードは、対応する期間に関連付けられ、画像のそれぞれのセットと、前記画像のそれぞれのセット内の各画像に対する人物識別子とを含み、前記方法はさらに、
各エピソードについてのそれぞれのクラスタを含む複数のクラスタを形成することを含み、各クラスタは少なくとも2つの人物識別子を含み、前記方法はさらに、
同一のクラスタをマージして複数の人々のグループを得ることを含み、各人々のグループは2つ以上の人物識別子を含み、前記方法はさらに、
前記マージの後、少なくとも1つの人々のグループが、前記複数のエピソードのうち、閾値数未満である数のエピソードに現れると判定することと、
前記少なくとも1つの人々のグループが前記閾値数未満の前記数のエピソードに現れるという判定に応答して、前記少なくとも1つの人々のグループを1つ以上の他の人々のグループと組み合わせることとを含み、前記1つ以上の他の人々のグループは、各々、前記少なくとも1つの人々のグループに含まれる前記人物識別子のサブセットを含み、前記方法はさらに、
前記組み合わせることの後に、前記複数の人々のグループのうちの特定の人々のグループからの人物を示す1つ以上の画像を含む画像ベースの作成物を含むユーザインターフェイスを提供することを含む、方法。 - 前記複数のクラスタを形成することは、各クラスタについて、
前記クラスタに関連付けられる前記エピソードの前記画像のセットにおける少なくとも1つの画像に現れるすべての人物識別子を前記クラスタにマッピングすることと、
前記エピソードについて最も頻繁な人物識別子を判定することとを含み、前記最も頻繁な人物識別子は、前記人物識別子のうちの他の識別子よりも、前記エピソードの前記画像のセットのうちの、より多くの画像に現れ、前記複数のクラスタを形成することは、さらに、各クラスタについて、
前記エピソードの前記画像のセットから、前記エピソードについて前記最も頻繁な人物識別子を含む画像の数を判定することと、
前記エピソードについて前記最も頻繁な人物識別子を含む前記画像の数に基づいて閾値画像数を判定することと、
前記クラスタから、前記クラスタのうち、前記閾値画像数未満の数の画像に現れる人物識別子を除去することとを含む、請求項1に記載の方法。 - 前記少なくとも1つの人々のグループを前記1つ以上の他の人々のグループと組み合わせることは、前記少なくとも1つの人々のグループに関連付けられるエピソードを前記1つ以上の他の人々のグループに関連付けることを含む、請求項1または2に記載の方法。
- 前記閾値数は、閾値エピソード数であり、前記方法はさらに、
閾値クラスタ数を判断することと、
1つ以上の人物識別子が、前記複数のクラスタのうち、前記閾値クラスタ数未満の数のクラスタに含まれるかどうかを判定することと、
前記1つ以上の人物識別子が、前記閾値クラスタ数未満の前記数のクラスタに含まれると判定された場合、前記数のクラスタが含まれる前記クラスタから前記1つ以上の人物識別子を除去することとを含む、請求項1~3のいずれか1項に記載の方法。 - 前記同一のクラスタをマージすることは、前記クラスタに基づいて、エピソードのそれぞれのセットを前記複数の人々のグループの各々に関連付けることを含み、
前記画像ベースの作成物を提供することは、前記画像ベースの作成物のための画像のサブセットを、前記特定の人々のグループに関連付けられるエピソードに含まれる画像のそれぞれのセットから選択することを含み、前記画像のサブセット内の各画像は、前記特定の人々のグループに含まれる前記2つ以上の人物識別子のうちの少なくとも2つに対応する人物を示す、請求項1~4のいずれか1項に記載の方法。 - 前記ユーザインターフェイスを提供することは、少なくとも1つのアクション可能なユーザインターフェイス要素を表示することを、
前記特定の人々のグループと一致する画像が、前記少なくとも1つのアクション可能なユーザインターフェイス要素が以前に表示された時の後にキャプチャされたことを検出すること、
前記ユーザインターフェイスを提供する時間における現在の日付が前記特定の人々のグループに関連付けられる日付と一致することを検出すること、および、
それらの組み合わせ、からなる群から選択される少なくとも1つに応答して実行することを含む、請求項1~5のいずれか1項に記載の方法。 - 前記複数のエピソードの前記期間は重複しない、請求項1~6のいずれか1項に記載の方法。
- 前記画像ベースの作成物を含む前記ユーザインターフェイスを提供することは、
前記画像ベースの作成物のための画像のサブセットを、前記特定の人々のグループに基づいて選択することを含み、前記画像のサブセット内の各画像は、前記特定の人々のグループに含まれる前記2つ以上の人物識別子のうちの少なくとも2つに対応する人物を示し、前記画像ベースの作成物を含む前記ユーザインターフェイスを提供することはさらに、
前記画像のサブセットに基づいて前記画像ベースの作成物を生成することを含む、請求項1~7のいずれか1項に記載の方法。 - 前記画像のサブセット内の各画像は、前記特定の人々のグループに含まれる前記2つ以上の人物識別子に対応する人物を示す、請求項8に記載の方法。
- 前記画像のサブセット内の各画像は、前記特定の人々のグループに含まれる前記2つ以上の人物識別子に対応する人物を示し、前記画像のサブセットのうちの少なくとも1つの画像は、他の人々のグループに含まれない1人以上の追加の人物を示す、請求項8に記載の方法。
- 前記画像のサブセットは、前記複数のエピソードのうちの少なくとも2つのエピソードからの画像を含む、請求項8に記載の方法。
- 前記画像のサブセットは、前記サブセットが、
複数の2つ以上の位置においてキャプチャされる画像が前記画像のサブセットに含まれる位置多様性、
複数のタイプのオブジェクトが前記画像のサブセットに示される視覚的多様性、およびそれらの組み合わせ、からなる群から選択される1つ以上を提供するように選択される、請求項11に記載の方法。 - 1つ以上のプロセッサに請求項1~12のいずれか1項に記載の方法を実行させるためのプログラム。
- システムであって、
請求項13に記載のプログラムを記憶するメモリと、
前記プログラムを実行するための1つ以上のプロセッサとを備える、システム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022171574A JP7515552B2 (ja) | 2020-06-25 | 2022-10-26 | 人々のグループおよび画像ベースの作成物の自動生成 |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/US2020/039706 WO2021262183A1 (en) | 2020-06-25 | 2020-06-25 | Automatic generation of people groups and image-based creations |
| JP2021514507A JP7167318B2 (ja) | 2020-06-25 | 2020-06-25 | 人々のグループおよび画像ベースの作成物の自動生成 |
| JP2022171574A JP7515552B2 (ja) | 2020-06-25 | 2022-10-26 | 人々のグループおよび画像ベースの作成物の自動生成 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021514507A Division JP7167318B2 (ja) | 2020-06-25 | 2020-06-25 | 人々のグループおよび画像ベースの作成物の自動生成 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023017827A JP2023017827A (ja) | 2023-02-07 |
| JP7515552B2 true JP7515552B2 (ja) | 2024-07-12 |
Family
ID=71579691
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021514507A Active JP7167318B2 (ja) | 2020-06-25 | 2020-06-25 | 人々のグループおよび画像ベースの作成物の自動生成 |
| JP2022171574A Active JP7515552B2 (ja) | 2020-06-25 | 2022-10-26 | 人々のグループおよび画像ベースの作成物の自動生成 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021514507A Active JP7167318B2 (ja) | 2020-06-25 | 2020-06-25 | 人々のグループおよび画像ベースの作成物の自動生成 |
Country Status (6)
| Country | Link |
|---|---|
| US (2) | US11475616B2 (ja) |
| EP (2) | EP4250252B1 (ja) |
| JP (2) | JP7167318B2 (ja) |
| KR (2) | KR102589154B1 (ja) |
| CN (1) | CN114127779B (ja) |
| WO (1) | WO2021262183A1 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12238138B2 (en) * | 2021-05-20 | 2025-02-25 | F.A.C.C.T. Antifraud Llc | Method and device for clustering phishing web resources based on visual content image |
| CN115103236B (zh) * | 2022-06-16 | 2024-09-13 | 抖音视界有限公司 | 影像记录生成方法、装置、电子设备及存储介质 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006236218A (ja) | 2005-02-28 | 2006-09-07 | Fuji Photo Film Co Ltd | 電子アルバム表示システム、電子アルバム表示方法、及び電子アルバム表示プログラム |
| JP2007094762A (ja) | 2005-09-29 | 2007-04-12 | Sony Corp | 情報処理装置および方法、並びにプログラム |
| WO2009090804A1 (ja) | 2008-01-18 | 2009-07-23 | Nikon Corporation | 画像群の標題付与装置、画像のグループ化装置、画像群の代表画像決定装置、画像表示装置、カメラおよび画像表示プログラム |
| JP2010507139A (ja) | 2006-10-11 | 2010-03-04 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー. | 顔に基づく画像クラスタリング |
| JP2011113270A (ja) | 2009-11-26 | 2011-06-09 | Sony Corp | 情報処理装置、情報処理方法およびプログラム |
| JP2015064811A (ja) | 2013-09-26 | 2015-04-09 | 富士フイルム株式会社 | 撮像画像の主要顔画像決定装置ならびにその制御方法およびその制御プログラム |
Family Cites Families (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| AU2003903728A0 (en) * | 2003-07-21 | 2003-07-31 | Hao Hang Zheng | Method and system for performing combined image classification storage and rapid retrieval on a computer database |
| KR100601997B1 (ko) | 2004-10-12 | 2006-07-18 | 삼성전자주식회사 | 인물기반 디지털 사진 클러스터링 방법 및 장치와 이를이용한 인물기반 디지털 사진 앨버밍 방법 및 장치 |
| US20100157056A1 (en) * | 2007-05-20 | 2010-06-24 | Rafael Advanced Defense Systems Ltd. | Tracking and imaging data fusion |
| US8189880B2 (en) * | 2007-05-29 | 2012-05-29 | Microsoft Corporation | Interactive photo annotation based on face clustering |
| US10169646B2 (en) * | 2007-12-31 | 2019-01-01 | Applied Recognition Inc. | Face authentication to mitigate spoofing |
| JPWO2010041377A1 (ja) | 2008-10-06 | 2012-03-01 | パナソニック株式会社 | 代表画像表示装置及び代表画像選択方法 |
| US20110205399A1 (en) | 2008-10-26 | 2011-08-25 | Yuli Gao | Arranging Images Into Pages Using Content-based Filtering And Theme-based Clustering |
| US8457366B2 (en) * | 2008-12-12 | 2013-06-04 | At&T Intellectual Property I, L.P. | System and method for matching faces |
| US8121358B2 (en) | 2009-03-06 | 2012-02-21 | Cyberlink Corp. | Method of grouping images by face |
| US8531478B2 (en) | 2009-03-19 | 2013-09-10 | Cyberlink Corp. | Method of browsing photos based on people |
| US8351661B2 (en) * | 2009-12-02 | 2013-01-08 | At&T Intellectual Property I, L.P. | System and method to assign a digital image to a face cluster |
| JP5434569B2 (ja) * | 2009-12-22 | 2014-03-05 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
| US8712168B2 (en) * | 2010-01-25 | 2014-04-29 | Panasonic Corporation | Image sorting device, method, program, and integrated circuit and storage medium storing said program |
| US9122912B1 (en) | 2012-03-15 | 2015-09-01 | Google Inc. | Sharing photos in a social network system |
| US9836464B2 (en) * | 2014-07-31 | 2017-12-05 | Microsoft Technology Licensing, Llc | Curating media from social connections |
| CA3003084A1 (en) * | 2014-10-23 | 2016-04-28 | Dele Atanda | Intelligent personal information management system |
| CN108198172B (zh) * | 2017-12-28 | 2022-01-28 | 北京大学深圳研究生院 | 图像显著性检测方法和装置 |
| CN110348274B (zh) | 2018-04-08 | 2022-03-04 | 杭州海康威视数字技术股份有限公司 | 一种人脸识别方法、装置及设备 |
| US10740400B2 (en) * | 2018-08-28 | 2020-08-11 | Google Llc | Image analysis for results of textual image queries |
| US11151386B1 (en) * | 2020-03-04 | 2021-10-19 | Amazon Technologies, Inc. | Automated identification and tagging of video content |
-
2020
- 2020-06-25 EP EP23186338.2A patent/EP4250252B1/en active Active
- 2020-06-25 KR KR1020217007314A patent/KR102589154B1/ko active Active
- 2020-06-25 WO PCT/US2020/039706 patent/WO2021262183A1/en not_active Ceased
- 2020-06-25 JP JP2021514507A patent/JP7167318B2/ja active Active
- 2020-06-25 EP EP20739832.2A patent/EP3948659B1/en active Active
- 2020-06-25 KR KR1020237034391A patent/KR102851238B1/ko active Active
- 2020-06-25 US US17/252,707 patent/US11475616B2/en active Active
- 2020-06-25 CN CN202080005126.1A patent/CN114127779B/zh active Active
-
2022
- 2022-09-30 US US17/956,909 patent/US11783521B2/en active Active
- 2022-10-26 JP JP2022171574A patent/JP7515552B2/ja active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006236218A (ja) | 2005-02-28 | 2006-09-07 | Fuji Photo Film Co Ltd | 電子アルバム表示システム、電子アルバム表示方法、及び電子アルバム表示プログラム |
| JP2007094762A (ja) | 2005-09-29 | 2007-04-12 | Sony Corp | 情報処理装置および方法、並びにプログラム |
| JP2010507139A (ja) | 2006-10-11 | 2010-03-04 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー. | 顔に基づく画像クラスタリング |
| WO2009090804A1 (ja) | 2008-01-18 | 2009-07-23 | Nikon Corporation | 画像群の標題付与装置、画像のグループ化装置、画像群の代表画像決定装置、画像表示装置、カメラおよび画像表示プログラム |
| JP2011113270A (ja) | 2009-11-26 | 2011-06-09 | Sony Corp | 情報処理装置、情報処理方法およびプログラム |
| JP2015064811A (ja) | 2013-09-26 | 2015-04-09 | 富士フイルム株式会社 | 撮像画像の主要顔画像決定装置ならびにその制御方法およびその制御プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| US11475616B2 (en) | 2022-10-18 |
| EP3948659B1 (en) | 2023-08-30 |
| US20220036614A1 (en) | 2022-02-03 |
| KR102851238B1 (ko) | 2025-08-27 |
| KR102589154B1 (ko) | 2023-10-13 |
| KR20230147752A (ko) | 2023-10-23 |
| CN114127779B (zh) | 2025-05-30 |
| CN114127779A (zh) | 2022-03-01 |
| EP3948659A1 (en) | 2022-02-09 |
| EP4250252B1 (en) | 2024-09-25 |
| WO2021262183A1 (en) | 2021-12-30 |
| EP4250252A1 (en) | 2023-09-27 |
| US20230018830A1 (en) | 2023-01-19 |
| JP2023017827A (ja) | 2023-02-07 |
| JP7167318B2 (ja) | 2022-11-08 |
| KR20220000981A (ko) | 2022-01-04 |
| JP2022541081A (ja) | 2022-09-22 |
| US11783521B2 (en) | 2023-10-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12411926B2 (en) | Automatic image sharing with designated users over a communication network | |
| US10885380B2 (en) | Automatic suggestion to share images | |
| JP7624424B2 (ja) | 画像選択提案 | |
| CN107710197B (zh) | 在通信网络上共享图像和图像相册 | |
| US20160283483A1 (en) | Providing selected images from a set of images | |
| JP7654692B2 (ja) | ユーザの好みを反映した機械学習ベースの画像圧縮設定 | |
| JP7515552B2 (ja) | 人々のグループおよび画像ベースの作成物の自動生成 | |
| US20150242405A1 (en) | Methods, devices and systems for context-sensitive organization of media files | |
| US10885619B2 (en) | Context-based imagery selection | |
| US12235889B2 (en) | Device messages provided in displayed image compilations based on user content |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221107 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221107 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231218 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240116 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240401 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240604 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240702 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7515552 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |