JP7313915B2 - 学習方法 - Google Patents

学習方法 Download PDF

Info

Publication number
JP7313915B2
JP7313915B2 JP2019107507A JP2019107507A JP7313915B2 JP 7313915 B2 JP7313915 B2 JP 7313915B2 JP 2019107507 A JP2019107507 A JP 2019107507A JP 2019107507 A JP2019107507 A JP 2019107507A JP 7313915 B2 JP7313915 B2 JP 7313915B2
Authority
JP
Japan
Prior art keywords
album
layout data
data
album creation
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019107507A
Other languages
English (en)
Other versions
JP2020201677A5 (ja
JP2020201677A (ja
Inventor
寛康 國枝
信二郎 堀
貴之 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019107507A priority Critical patent/JP7313915B2/ja
Priority to US16/893,760 priority patent/US11089170B2/en
Publication of JP2020201677A publication Critical patent/JP2020201677A/ja
Publication of JP2020201677A5 publication Critical patent/JP2020201677A5/ja
Application granted granted Critical
Publication of JP7313915B2 publication Critical patent/JP7313915B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • H04N1/00442Simultaneous viewing of a plurality of images, e.g. using a mosaic display arrangement of thumbnails
    • H04N1/00456Simultaneous viewing of a plurality of images, e.g. using a mosaic display arrangement of thumbnails for layout preview, e.g. page layout
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00167Processing or editing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00143Ordering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00185Image output
    • H04N1/00196Creation of a photo-montage, e.g. photoalbum
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、フォトアルバムを作成する技術に関する。
特許文献1は、フォトアルバムを作成するソフトウエアであって、複数の写真の中からアルバムに使う写真を選択し、該選択した写真を自動でレイアウトしてくれるソフトウエアを開示する。このような、自動的に写真を選んでアルバムにレイアウトする機能は自動レイアウト機能と呼ばれている。自動レイアウト機能では、複数の写真を解析し、それらの写真を解析してスコアを付け、スコアの高い写真をアルバムのレイアウトに優先的に採用する。
特開2017-038343号公報
自動レイアウトにより作成されたフォトアルバムの満足度は、画質だけでなくユーザの個人的な好みも関連する。そこで本発明は、ユーザの好みをより反映したレイアウトを提示可能にすることを目的とする。
本発明の一実施形態は、情報処理装置のコンピュータに、第1アルバム作成パラメータに基づいて生成された第1レイアウトデータに基づき、推定特徴量を出力するステップと、前記出力された推定特徴量に基づき、第2アルバム作成パラメータを生成するステップと、前記生成された前記第2アルバム作成パラメータと、ユーザにより生成された第2レイアウトデータに用いられた画像と、に基づき、第3レイアウトデータを生成するステップと、前記生成された前記第3レイアウトデータに基づく特徴量と前記第2レイアウトデータに基づく特徴量と、に基づき、前記第1アルバム作成パラメータを第3アルバム作成パラメータに更新するステップと、を実行させ、前記第1レイアウトデータ及び前記第2レイアウトデータは、サーバにアップロードされたデータであり、前記サーバにアップロードされたレイアウトデータの数が所定数より少ない場合、前記第1レイアウトデータとしてアルバムの見開き単位のデータが用いられ、前記サーバにアップロードされたレイアウトデータの数が前記所定数より多い場合、前記第1レイアウトデータとしてアルバム単位のデータが用いられるように制御することを特徴とするプログラムである。
本発明により、ユーザの好みを反映したレイアウトを提示することが可能になる。
アルバム作成サービスのシステム構成。 アルバム作成に関するシーケンス図。 決済用UI画面。 自動レイアウト制御の学習に関するシーケンス図。 ユーザ端末におけるアルバムデータ作成とアルバム発注との処理のフローチャート。 設定用UI画面。 画像選択用UI画面。 レイアウト編集用UI画面。 自動レイアウト処理のフローチャート。 クラウドサーバ上で実行する学習処理のフローチャート。 GroupIDの割当て処理のフローチャート。 学習の説明図。 ターゲットアルバム特徴量推定部の詳細な機能ブロック図。 学習処理のフローチャート。 学習用データと検証用データの設定方法の説明図。 アルバム作成パラメータのデータ構造。 アルバム作成パラメータの検証例。
[第1の実施形態]
<システムの構成について>
以下、本実施形態におけるアルバム作成システムの構成について、図1を用いて説明する。図1(a)は、本実施形態におけるアルバム作成システムの全体構成を示す図である。図1(a)に示すように、このシステムは、ユーザ端末100と、ユーザ端末100に接続されたクラウドサーバ110とを有し、ユーザ端末100とクラウドサーバ110との間でデータを送信または受信することが可能である。ユーザ端末100として、タブレット、スマートフォン、情報処理装置(以下PC)等を想定している。
図1(b)は、画像処理装置として機能するユーザ端末100のハードウェア構成を示すブロック図である。CPU101は、ROM103に記憶された制御プログラムをRAM104に展開し、必要な時に読み出して画像処理制御等の各種制御を行うことで、ユーザ端末100の動作を統括的に制御する。
GPU102は、画像描写を行う際に必要となる計算処理を行うことで、ディスプレイ106の表示を制御する。最近では、高負荷な並列演算を必要とする人工知能処理のアクセラレータとして、GPUが使用されることもある。
ROM103には、ユーザ端末100の起動プログラム等の各種プログラムが記憶されている。本実施形態では、ROM103としてフラッシュストレージ等を想定している。RAM104は、CPU101の主記憶装置であり、ワークエリアやROM103に記憶された各種プログラムを展開するための一時記憶領域として用いられる。
ハードディスクドライブ(以下HDD)105は、大容量記憶装置である。HDD105には、アルバム作成用アプリケーション等のアプリケーションプログラムや画像データ等が保存される。
ディスプレイ106には、アプリケーションの処理結果(例えば、アルバムの見開き等)が表示される。
ニューラル処理ユニット(以下NPU)107は、人間の脳神経系を模したニューラルネットワークを組み込んだ人工知能専用チップである。NPU107をユーザ端末100に組み込むことで、従来、クラウドベースで行われる機械学習(例えばディープラーニング)を用いた画像認識や自然言語処理などを、端末単体で行うことが可能となる。
入力I/F108には、キーボード、マウスといった入力装置が接続されている(図示せず)。入力I/F108は、このような入力装置からのユーザ指示を受け付け、入力データを、CPU101により実現されるアプリケーションの各モジュールに送信する。
通信I/F109は、USB I/FとネットワークI/Fとを有し、ユーザ端末100は、通信I/F109を介して外部のクラウドサーバ110と接続される。
図1(c)は、クラウドサーバ110のハードウェア構成を示すブロック図である。画像処理装置として機能するクラウドサーバ110の基本的な構成は、ユーザ端末100と同じである。但し一般的に、クラウドサーバのCPU、GPU、通信I/Fは、ユーザ端末のCPU、GPU、通信I/Fより高性能であり、クラウドサーバのHDD、ROM、RAMは、ユーザ端末のHDD、ROM、RAMより大容量である。尚、ここでは、クラウドサーバ110がディスプレイ及びNPUを有さない構成としているが、クラウドサーバ110はディスプレイ及びNPUを有してもよい。
<アルバム作成について>
以下、本実施形態におけるアルバム作成について、図2を用いて説明する。図2は、本実施形態におけるアルバム作成の全体の流れを示すシーケンス図であり、ユーザ端末100と、クラウドサーバ110と、印刷ラボ200と、によって提供されるアルバム作成サービスの例を示している。
ユーザは、ユーザ端末100上でアルバム作成用アプリケーション(以下、単純にアプリと記載する)を立ち上げて、アプリのUIを介して、撮りためた写真を用いて所定のフォーマットでアルバムを作成するよう指示する。尚、図1(a)及び図2では、アルバム作成システムが1台のユーザ端末を有する形態を示しているが、アルバム作成システムに接続されるユーザ端末の数は、複数であってもよい。この場合、クラウドサーバは、複数ユーザのユーザ端末と接続されることとなる。
クラウドサーバ110は、ネットワークを介して、ユーザ端末100及び印刷ラボ200のPCと接続される。アプリのインストーラは、クラウドサーバ110に格納されており、ユーザは必要に応じて該インストーラをダウンロードする。アプリを介して作成されたアルバムデータがクラウドサーバ110にアップロードされると、クラウドサーバ110はこのアルバムデータを一旦保存する。また、ユーザは、アプリ上の決済用UI画面(図3参照)を介して、料金の支払い処理等のいわゆる課金処理を行う。クラウドサーバ110は、印刷ラボ200のPCに対し、課金処理等のアルバム作成依頼の手続きが完了したアルバムデータを転送する。
印刷ラボ200は、ユーザ端末100と同様の構成のPC(図1(b)参照)と、印刷装置とを備える。印刷ラボ200のPCは、課金処理等を含むアルバム作成依頼の手続きが完了したアルバムデータを、クラウドサーバ110から受信する。印刷ラボ200では、このアルバムデータに基づくアルバム作成、具体的には、印刷、製本が行われる。作成されたアルバムは、ユーザに配送される。印刷ラボ200のPCは、ユーザ端末100に対しアルバムの配送を通知する。
実際のアルバム作成の手順は、以下の通りである。アルバムを作成したいと思ったときにユーザ端末100にアプリがインストールされていない場合、ユーザは、ユーザ端末100を操作して、アルバム作成サービスを提供する企業のWEBサイト等からアプリをダウンロードしようとする。このとき、符号201で示すように、ユーザ端末100は、クラウドサーバ110に対してアプリのダウンロード要求を送信する。
ユーザ端末100が送信するダウンロード要求を受信したクラウドサーバ110は、符号202で示すように、ユーザ端末100に対し、アプリのインストーラを送信する。クラウドサーバ110が送信するインストーラを受信したユーザ端末100では、符号203で示すように、アプリのインストールが行われる。アプリのインストールによって、ユーザは、ユーザ端末100を用いてアルバムを作成することが可能になる。
符号204で示すように、ユーザは、ユーザ端末100にインストールされたアプリを起動して、アプリ上でアルバムを作成する。アプリは、写真画像を選択し、該選択した写真画像を見開きに配置することで、自動的にアルバムを作成する機能(自動レイアウト機能)を有する。ユーザは、自動レイアウト機能を利用して作成されたアルバムを、アプリ上で、自動的にまたは手動で編集してもよい。また、アプリは、これを介して作成されたアルバムデータを、クラウドサーバ110にアップロードする機能も有する。
符号205で示すように、ユーザ端末100は、アプリを用いて作成したアルバムデータを、クラウドサーバ110にアップロードする。また、図2では示していないが、ユーザ端末100は、アルバムデータのクラウドサーバ110へのアップロードと共に、課金処理等のアルバム発注に関する処理も実行する。
なお、クラウドサーバ110にアップロードされるアルバムデータは、ユーザ端末100において生成されたアルバムデータ(テンプレートに画像が配置された見開きページデータ)そのものでなくてもよい。例えば、アルバムデータにおいて用いられているテンプレートデータは含んでいなくてもよい。つまり、アルバムデータは、テンプレートデータは含まず、テンプレートを識別する識別情報と、配置された画像データと、配置位置に関する情報と、含むデータでもよい。この場合、クラウドサーバ110又は印刷ラボ200において、テンプレートデータを識別する識別情報と画像データと配置位置に関する情報とを基に再度レイアウトが実行され、アルバムデータが生成される。
アルバム発注処理の完了通知を受信した場合、クラウドサーバ110は、アルバムが発注されたと判定し、符号206で示すように、ユーザ端末100から受信したアルバムデータを、印刷ラボ200のPCに対し転送する。
符号207で示すように、印刷ラボ200では、PCに転送されたアルバムデータに基づくアルバムの作成(具体的には、印刷機を使った印刷、製本機を使った製本)が実行される。
印刷ラボ200で作成されたアルバム商材(製本完成品)は、印刷ラボ200からユーザに発送される。また、符号208で示すように、印刷ラボ200のPCは、ユーザ端末100に対し、アルバム商材の発送通知を送信する。尚、この発送通知は、クラウドサーバ110にも送信され、発送通知を受信したクラウドサーバ110では、発送通知の内容に基づくアルバムの注文管理が行われる。
尚、図2では、ユーザ端末100にアプリがインストールされておらず、アプリのインストーラをダウンロードするケースを示したが、本実施形態はこのケースに限定されない。例えば、ユーザ端末100に既にアプリがインストールされており(但し最新版ではない)、アプリの最新版をダウンロードするようなケースにも、本実施形態を適用可能である。
<自動レイアウト制御の学習について>
以下、本実施形態における自動レイアウト制御の学習について、図4を用いて説明する。尚、図4では、自動レイアウト制御の学習をクラウドサーバ110で実行するケースを示すが、印刷ラボ200のPCで実行してもよい。また、ユーザ端末100上で実行してもよい。
ユーザからのアルバム発注指示を受信した場合、符号401で示すように、クラウドサーバ110は、自動レイアウト制御のための学習を開始する。自動レイアウト制御のための学習とは、クラウドサーバ110が、ユーザが発注したアルバムの内容を示すアルバムデータ等を用いて、ユーザの嗜好や傾向を解析することを指す。より具体的には、自動レイアウト処理時に必要なパラメータ(アルバム作成パラメータとする)の各値を導出することを指す。尚、自動レイアウト制御のための学習やアルバム作成パラメータについては、後述する。
符号402で示すように、自動レイアウト制御の学習結果に応じて、クラウドサーバ110は、前述の学習で導出した値でアルバム作成パラメータを更新する。
符号403で示すように、図2で説明したアプリの更新時に、アルバム作成パラメータの更新結果が反映される。これにより、ユーザが次にユーザ端末100上でアプリを起動した際に、更新されたアルバム作成パラメータの各値がロードされることになる。従って、ユーザ端末100において、更新されたアルバム作成パラメータに基づく自動レイアウト処理を実行することが可能になる。
<ユーザ端末におけるアルバム作成処理について>
以下、本実施形態におけるユーザ端末100で実行されるアルバム作成処理(図2の204)について、図5を用いて説明する。
ステップS501において、アプリのアップデートを実行する。ユーザ端末100でアプリが起動された場合、ユーザ端末100は、既定のクラウドサーバ110にアクセスする。この際、ユーザ端末100がまだインストールしていないアプリの最新版があった場合、ユーザ端末100は、クラウドサーバ110に対し最新版のダウンロード要求を送信し、この要求の応答として、最新版を受信する。その後、ユーザ端末100では、受信した最新版のインストールによるアプリの更新が実行される。アプリの更新の際、ユーザ端末100は、アルバム作成に必要なパラメータの最新版も取得する。尚、以降では、「ステップS~」を単純に「S~」と記載する。
S501でアプリが起動して、アプリとアルバム作成パラメータとが更新された場合、S502に進む。S502において、図6に例示するような設定用UI画面を表示する。ユーザは、設定用UI画面を介して、アルバムのサイズ、紙種、ページ数、製本方法などの、注文するアルバムの仕様を選択的に決定する。ユーザがアルバムの仕様を決定し、「次へ」ボタン601を押下すると、S503の画像選択に進む。
S503において、アプリのUIとして、アルバムに使用する写真画像を選択するための画面(画像選択用UI画面とする)を表示する。ユーザは、画像選択用UI画面を介して、アルバムに使用する画像を選択する。ユーザによって画像が選択された場合、S504に進む。
ここで、画像選択用UI画面について、図7を用いて説明する。図7は、画像選択用UI画面の例を示す。画像選択ウィンドウ700は、フォルダ表示領域701と、選択領域702とを有する。
フォルダ表示領域701は、HDD105内のフォルダ構造を表示するための領域である。フォルダ表示領域701には、画像フォルダが階層的に表示される。画像選択用UI画面が表示されるとまず、ユーザは、所望のフォルダを選択する。図7の例は、ユーザ所望のフォルダとして“02-01”という名称のフォルダが選択されている状態を示し、このフォルダには、2019年2月1日に撮影した写真の画像が保存されている。
選択領域702は、ユーザがアルバムに使用する写真を選択するための領域であり、指定フォルダに保存されている写真それぞれのサムネイル画像が表示される。図7の例では、ユーザによって選択された写真のサムネイル画像に、選択済みアイコン703が付随されている。
ポインタ704は、マウスなどの入力装置で制御される。ユーザはポインタ704を移動させることで、アプリにおける機能の選択や実行を制御できる。
画像全選択ボタン705は、指定フォルダ内の全ての画像を選択するためのボタンである。ユーザが画像全選択ボタン705を押下した場合、指定フォルダ内の全画像が選択された状態になる(即ち、選択済みアイコン703が付随される)。尚、その状態で、ユーザが画像全選択ボタン705を再び押下した場合、全画像の選択が解除される。
自動レイアウトボタン706は、自動レイアウト処理を実行するためのボタンである。ユーザが自動レイアウトボタン706を押下した場合、ユーザが選択した画像または指定フォルダ内に含まれる複数の画像がレイアウトのために解析され、該解析された画像のうち少なくとも一部を自動的に配置する自動レイアウト処理が実行される。
手動レイアウトボタン707は、ユーザが手動でレイアウトを行うためのボタンである。ユーザによっては、自動レイアウト処理を実行するのではなく、自分でレイアウトしたい者もいる。手動レイアウトボタン707が押下された場合、自動レイアウト処理は実行されない。この場合、ポインタなどを用いて、ユーザが選択した画像を、GUIを介して自身で配置するモードとなる。このように、ユーザは、自動レイアウトボタン706と手動レイアウトボタン707との何れかを押下して、レイアウトの作成方法を選択できる。
画像選択ウィンドウ700には、ユーザによって選択された写真の枚数と、選択可能な枚数とを通知するためのメッセージ708も表示される。
図5の説明に戻る。S504において、自動レイアウト処理を実行するか否か判定する。具体的には、自動レイアウトボタン706と手動レイアウトボタン707との何れが押下されたか判定する。自動レイアウトボタン706が押下されたと判定した場合、S505に進む一方、手動レイアウトボタン707が押下されたと判定した場合、S506に進む。
S505において、自動レイアウト処理を実行する。「自動レイアウト処理」とは、ユーザの嗜好や傾向に基づいて、自動的に又はユーザによって手動で選択された画像を、見開きに自動的に配置する処理である。自動レイアウト処理については、後述する。
S506において、アプリのUIとして、アルバムのレイアウトを編集するための画面(レイアウト編集用UI画面とする)を表示する。ユーザは、レイアウト編集用UI画面を介して、レイアウトを編集することができる。ユーザ端末100は、レイアウト編集用UI画面を介するユーザ入力を受け付ける。
ここで、レイアウト編集用UI画面について、図8を用いて説明する。図8は、レイアウト編集用UI画面の例を示す。編集ウィンドウ800は、現在選択されている見開きの編集用画面が表示される表示領域801と、編集対象の見開きを選択するための選択領域806と、を有する。
表示領域801には、編集中の見開きのプレビュー802が表示される。プレビュー802は、使用予定の画像803が配置された場合に作成されるレイアウト結果を示す。
ボタン804、805は、表示領域801に表示する見開きを変えるためのボタンである。ユーザはボタン804を押下することで、表示領域801に表示される見開きを、次の見開き(詳しくは、次にページ番号が大きい見開き)に変更できる。これに対し、ユーザはボタン805を押下することで、表示領域801に表示される見開きを、前の見開き(詳しくは、次にページ番号が小さい見開き)に変更できる。
選択領域806には、アルバムを構成する複数の見開きそれぞれのサムネイル画像として、表示領域801に表示されている(つまり選択中の)見開きと、それ以外の見開きとのサムネイル画像が表示される。図8の例では、符号807で示すように、7-8ページの見開きが選択されている。
ユーザがエフェクトボタン820を押下した場合、編集中のレイアウト上でユーザにより選択されたスロットに配置されている画像に対するエフェクト処理が施される。エフェクトボタン820押下時のエフェクト処理として、既定の処理が実施されてもよいし、別のGUIが開いて、該GUIを介してユーザがエフェクトの種類を設定できてもよい。
ユーザが補正ボタン821を押下した場合、編集中のレイアウト上でユーザにより選択されたスロットに配置されている画像に対する補正が施される。ここでは、補正ボタン821押下時に、規定の処理として、自動写真補正が実施されるものとする。但し、別のGUIが開いて、該GUIを介してユーザが補正の種類を設定できるような形態であってもよい。
ユーザがトリミングボタン822を押下した場合、編集中のレイアウト上でユーザにより選択されたスロットに配置されている画像に対するトリミング処理が実施される。トリミング処理では、画像の解析情報に基づいて主要オブジェクト領域を特定して、その領域サイズがスロットに収まる範囲で最大となるようにトリミングを行う。
画像選択ボタン811は、再度画像選択に戻るためのボタンである。ユーザが画像選択ボタン811を押下した場合、編集ウィンドウ800と共にまたは編集ウィンドウ800に代えて、画像選択ウィンドウ700が表示される。発注ボタン812は、アルバムの編集作業を終了して、その次の発注作業へ進むためのボタンである。発注ボタン812が押下された場合、アルバムデータ及び編集履歴データが、ユーザ端末100からクラウドサーバ110に送信される。編集履歴データはクラウドサーバ110での学習に使用されるとよい。例えば、自動レイアウト処理後の編集履歴が少ない場合、自動レイアウト処理時に用いたアルバム作成パラメータにユーザの好みが適確に反映されているとみなすことができる。
ポインタ808は、マウスなどの入力装置で制御される。ユーザは、ポインタ808を用いて、各種の編集作業を実行できる。例えば、移動したい画像803がある場合、ユーザは、ポインタ808をドラッグしドロップすることで、移動対象の1または複数の画像を選択して、左右上下のどこか望む所に移動させることができる。また例えば、補正したい画像がある場合、ユーザはポインタ808を用いて対象画像を選択した上で、補正ボタン821を押下すればよい。補正ボタン821の押下により、対象画像に対する補正処理が実行される。尚、補正ボタン821の押下により開く別のウィンドウを介して、ユーザが、画像の先鋭化、明るさ補正、彩度補正などを選択、制御できるような形態であってもよい。
新しく画像を追加したい場合には、画像選択ボタン811を押下して、画像選択ウィンドウ700を再表示し、画像を選択して手動レイアウトボタン707を押下することで、現在選択中のプレビュー802において画像を追加することが可能である。尚、前述した編集項目以外の編集項目として、使用するテンプレートの変更、背景色の選択、背景パターンの設定、余白量の調整、等が考えられる。
このように、S506で表示されるレイアウト編集用UI画面を介して、ユーザの嗜好に応じたレイアウト編集が実行される。この時の操作ログを取得し、アルバム作成パラメータの学習(後で詳しく説明する)に使用することで、ユーザの嗜好や傾向に合ったアルバムの自動作成が可能になる。
S507において、レイアウト編集が完了したか、具体的には、発注ボタン812が押下されたか判定する。本実施形態では、1つの編集項目に関する内容が決定されるたびにS507にて編集完了かの判定がなされる。S507の判定結果が真の場合、S508に進む。一方、S507の判定結果が偽の場合(つまり、新たな編集指示がなされた場合)、S506に戻り、レイアウト編集が継続される。
S508において、作成したアルバムデータをクラウドサーバ110に送信する。本ステップでアルバムデータをクラウドサーバ110に送信する際、アプリにおけるユーザの操作履歴データも送信される。
S509において、アルバムの発注処理を実行する。アルバムの発注処理には、アルバムの料金の支払い完了通知のクラウドサーバ110への送信や、ユーザによって入力されるアルバム送付先データの受け付け、クラウドサーバ110への送信が含まれる。ユーザ端末100におけるアルバム発注に関する全処理が完了した場合、クラウドサーバ110は、S508でユーザ端末100から送信されたアルバムデータを、印刷ラボ200のPCに転送する。
<自動レイアウト処理について>
以下、自動レイアウト処理(図5のS505)について、図9を用いて説明する。図9は、ユーザ端末100で実行される自動レイアウト処理の詳細を説明するためのフローチャートである。尚、ここでは、ユーザが指定したフォルダ内に含まれる画像群から、アルバムに使用する画像を自動的に選択し、該選択した画像を見開きに自動的に配置することで、レイアウトを作成するケースを例に挙げて説明する。
S901において、画像選択用UI画面を介して指定されたフォルダ内の画像を取得し、該取得した画像に対するリサイズ処理を実行することで、解析用画像を作成する。
S902において、取得したアルバム作成パラメータが設定され、該設定されたアルバム作成パラメータに基づいて、S901で作成した解析用画像に対する画像解析を実行する。例えば、本ステップの解析により、各画像に対する撮影日時の情報が取得される結果、隣接する画像間での撮影時間差を算出することが可能になる。尚、本ステップで解析する項目は予め決められているが、アルバム作成パラメータの設定に応じて、解析項目または解析条件が変更されてもよい。
S903において、指定フォルダ内の全ての画像が解析されたか判定する。本ステップの判定結果が真の場合、S904に進む。一方、本ステップの判定結果が偽の場合、まだ解析していない画像に対する画像解析を実行するために、S901に戻る。
S904において、S902の解析結果を用いて、主被写体判定、及び、シーン判定を実行する。ここでは、特定のオブジェクトが含まれる画像枚数をオブジェクト毎にカウントして、カウント値が最大となる特定のオブジェクトを主被写体と判定する。特定オブジェクトとして、例えば、人、子供、赤ちゃん、犬、猫、花、料理などが考えられる。なお、オブジェクト判定は、特開2017-038343号公報に記載の方法など、従来の判定方法を用いることができる。
シーン判定では、S902の解析結果を用いて、既定のシーンのうち何れに分類されるかの判定がなされる。本実施形態では、結婚式、旅行、その他の3つを既定のシーンとし、それぞれのシーンに対する、ショット数の分布と、顔数の分布とが予め設定されている。これら3つのシーンのうち最も分布が近いものを、画像のシーンと判定する。なお、シーン判定は、特開2017-038343号公報に記載の方法など、従来の判定方法を用いてもよい。
S905において、指定フォルダ内の画像群をサブ画像群に分割する。本ステップの分割は、隣接する画像間での撮影時間差の大きい箇所が境界となるように、サブ画像群の数がアルバムの見開き数と等しくなるまで繰り返し実行される。
S906~S910の処理は、見開き毎に実行される。
S906において、見開き内のレイアウト用画像の傾向を判定する。ここでは、主要オブジェクトに応じて傾向を判定するケースを例に挙げて説明する。S904で判定された主被写体と、アルバム作成パラメータの設定内の主要オブジェクトとを比較する。比較の結果、両者が異なっていた場合、これから作成するレイアウト結果に登場させるオブジェクトとして、S904で判定された主被写体を優先する。一例として、アルバム作成パラメータ内で、ペット(例えば、犬または猫)より人物を高得点にする設定がなされている一方、指定フォルダにおいてペットの画像が人物の画像より多い場合を考える。このような場合は、アルバム作成パラメータの設定をキャンセルして、指定フォルダに多く含まれるオブジェクトの画像(本例ではペットの画像)が高得点になるように設定を変更する。発注履歴がない初回の発注ではデフォルトのパラメータ設定を使用するとよい。そして、見開き内のレイアウト用画像の傾向がデフォルトパラメータと異なる場合は、指定のフォルダに多く含まれるオブジェクトの画像が高得点になるように設定を変更する。なお、ここでは説明のために、主オブジェクトが高得点になるように制御する方法を記載したが、オブジェクトが含まれるかを画像ごとにフラグを付けて管理して、そのフラグに基づいて使用する画像を選択してもよい。
S907において、アルバム作成パラメータを選択的に決定する。具体的には、ユーザ端末100においてシーン毎のアルバム作成パラメータを予め保持しておき、S704におけるシーン判定の結果に応じて、アルバム作成パラメータを決定する。或いは、ユーザ端末100において、主被写体毎のアルバム作成パラメータを予め保持しておき、S704における主被写体判定の結果に応じて、アルバム作成パラメータを決定してもよい。
S908において、画像に対する得点付け(スコアリング)を実行する。本ステップでは、S902の解析により導出される特徴量に基づいて、画像毎に得点を算出する。得点算出の際、判定されたシーンに応じて特徴量の重みを変更することで、シーン毎に得点が異なるように制御する。例えば、画像のシーンが旅行と判定された場合は、顔サイズの小さい画像が顔サイズの大きい画像と比べて高得点になるよう設定する。一方、画像のシーンが結婚式と判定された場合は、顔サイズの大きい画像が顔サイズの小さい画像と比べて高得点になるよう設定する。
S909において、見開きレイアウトを作成する。本ステップの見開きレイアウト作成では、アルバム作成パラメータに設定されている画像スロット数に基づいて、使用する画像が選択される。この画像選択の際、割り当てられた撮影日時区間を、選択する画像枚数分に分割して、該分割した区間毎に画像を選択してもよい。
S909では、選択された画像を用いたレイアウト結果が作成される。ここでは、予め作成済みの複数の固定テンプレートの中から選択画像を最適に配置できるものを選定し、該選定した固定テンプレートに画像を配置してレイアウト結果を作成するケースを例に挙げて説明する。配置する画像数毎に、1または複数の固定テンプレートが作成され、ユーザ端末100には、画像のアスペクト比の組合せ、画像間の余白量、商材縁の余白量、写真と写真との重なり具合などを変えた様々なバリエーションの固定テンプレートが予め用意されている。
S909ではまず、予め用意されている複数の固定テンプレートの中から、選択画像を配置可能な固定テンプレートを抽出する。ここで抽出する固定テンプレートとは具体的には、画像の枚数、アスペクト比が一致するテンプレートである。抽出したテンプレートにおいて、サイズの大きいスロットから順に高得点の画像が配置される。このような処理を、抽出したテンプレートの数分、繰り返し実行する。その結果、抽出したテンプレート数分の候補レイアウトが作成される。
その後、作成した候補レイアウトの中から最終的なレイアウトを1つ選択する。詳しく説明すると、作成された1または複数の候補テンプレートの夫々に対して、レイアウト評価を実行する。レイアウト評価は、見開き内の余白量、最大スロットと最小スロットとのサイズ比率、画像のトリミング量、主要オブジェクトが上レイヤーのスロットにより隠れていないか、主要オブジェクトが折り目にかかっているかなどの観点で実施される。
また、レイアウト評価は、アルバム作成パラメータに含まれる余白量や最大スロットと最小スロットとのサイズ比率などに基づいて実施される。レイアウト評価の結果、最も評価値が高かった候補レイアウトが最終的なレイアウトとして決定される。アルバム作成パラメータに、使用頻度の高いテンプレート番号などの項目が規定されているのであれば、その情報で指定されるテンプレートを優先的に使用しても良い。また例えば、アルバム作成パラメータに、連続するテンプレートの繋がり傾向の項目が規定されているのであれば、その情報に基づいて各見開きのテンプレートを決定した上で、最終的なレイアウトを作成してもよい。連続するテンプレートの繋がり傾向の項目とは、どのテンプレートの後にどのテンプレートが続く傾向があるかを示す項目である。
S910において、全見開き分のレイアウトが作成されたか判定する。本ステップの判定結果が真の場合、自動レイアウト処理は終了する(即ち、S906に進む)。一方、本ステップの判定結果が偽の場合、S906に戻り、全見開き分のレイアウトが作成されるまで、自動レイアウト処理は継続される。
<クラウドサーバにおける学習フェーズの全体フローについて>
以下、クラウドサーバ110で実行される学習処理、具体的には、発注の際にクラウドサーバ110に送信されるアルバムデータに基づいて、アルバム作成パラメータを学習するフェーズの全体フローについて、図10を用いて説明する。
S1001において、待機していたクラウドサーバ110は、ユーザ端末100から送信されるアルバム発注処理の完了通知を受信する。
S1002において、S1001で受信した完了通知に対応するアルバムデータを取得する。本ステップで取得するアルバムデータには、作成したユーザ(アルバム作成者)を識別するためのUserIDが含まれている。
S1003において、S1002で取得したアルバムデータ(レイアウトデータ)に基づいて、アルバム特徴量を算出する。
S1004において、S1003で算出したアルバム特徴量をHDD115に保存する。
S1005において、学習を実行するか否か判定する。まず、S1002で取得したUserIDのユーザが過去に発注したアルバムのアルバム特徴量を取得し、該取得した特徴量と、S1004でHDD115に保存したアルバム特徴量とを比較する。この比較では、アルバム特徴量をベクトルとみなし、過去に発注したアルバムの数だけ総当たりで相関が取られる。算出した相関値が所定の閾値以上の場合、関係性があると判定する一方、該算出した相関値が所定の閾値未満の場合、関係性がないと判定する。関係性があると判定されたアルバム特徴量が1個でもあれば過去に発注したアルバムデータを再度利用して再発注された可能性が高いため学習を実行せず、S1001に戻り待機する。これに対し、関係性があると判定されたアルバム特徴量がない場合、S1006に進み、アルバム特徴量を用いた学習が実行されることになる。
S1006において、S1002で取得したUserIDに基づいて、学習対象とする該UserIDのアルバム特徴量をHDD115から読み取る。この際、取得したアルバム特徴量の個数がカウントされる。HDD115には、過去の発注データが記憶されている。尚、本ステップでは、アルバム発注間隔に基づいて、学習に使用するアルバム特徴量を選定してもよい。例えば、アルバムを発注したユーザの発注間隔が3年以上空いている場合、過去に発注されたアルバムのアルバム特徴量を、学習に使用しないようにすることが考えられる。或いは、直近で(つまり、同一ユーザにより連続で)アルバムが発注された場合には、過去3ヶ月の間に発注されたアルバムのアルバム特徴量のみを、学習に使用してもよい。さらに、再注文されたデータは、学習に使用しないようにしてもよい。
S1007において、単独ユーザ(つまり、S1002で取得したUserIDのユーザ)のアルバム特徴量のみを用いて学習するか判定する。本ステップの判定結果が真の場合、S1009に進む一方、該判定結果が偽の場合、S1008に進む。尚、本例では、S1006でカウントしたアルバム特徴量の個数に基づく判定を行う。具体的には、アルバム特徴量の個数が所定の閾値以上の場合、単独ユーザのアルバム特徴量のみを用いて学習すると判定してS1009に進む。一方、アルバム特徴量の個数が所定の閾値未満の場合、S1008に進む。
S1008において、S1002で取得したUserIDのユーザが所属するグループを識別するためのGroupIDを取得し、該取得したGroupIDに紐づけされている全てのアルバム特徴量をHDD115から読み取る。GroupIDは、他のユーザも含めて嗜好の類似するユーザをグループ毎に管理するためのものである。S1007にて単独ユーザのアルバム特徴量の個数が不足していると判定された場合に、他のユーザのアルバム特徴量を追加して学習を実行する。但しその際、追加するデータを、HDD115に保存されている全ユーザのアルバム特徴量とするのではなく、同系統のユーザのアルバム特徴量を選定し学習用データとして利用する。本実施形態では、同系統のユーザのアルバム特徴量か判定する目的で、所属するグループを識別するためのGroupIDをアルバム毎に割り当てる。
ここで、クラウドサーバ110で実行されるGroupIDの割当てについて、図11を用いて説明する。
S1101において、GroupIDの修正待ち状態にあるクラウドサーバ110が、ユーザ端末100から送信されたアルバム発注処理の完了通知を受信する。
S1102において、全てのアルバム特徴量である全UserIDのアルバム特徴量を、HDD115から読み取る。
S1103において、GroupIDのクラスタリングを実行する。取得した全てのアルバム特徴量を多次元特徴量空間にプロットしてクラスタリングを実行する。より詳しくは、2つのアルバム特徴量について、特徴量空間における距離を算出し、該算出した距離が所定の閾値以下の場合に該2つのアルバムが同一クラスと判定する。全てのアルバム特徴量に対して、総当たりで距離を算出し、同一クラスと判定されたアルバム特徴量が多いアルバム特徴量を中心とするクラスを割り当てる。かかる処理を、全てのアルバム特徴量に対して所属するクラスが割り当てられるまで繰り返す。結果、各アルバム特徴量が何れかのクラスに割当てられる。
S1104において、GroupIDとUserIDとの紐づけを実行する。S1103のクラスタリングの結果に基づいて、各アルバム特徴量に割り当てられたクラスを、GroupIDとして割り当てる。
S1105において、全てのアルバム特徴量について、GroupIDの修正を行う。本ステップの処理を実行する理由は、発注によりアルバム特徴量が追加されたことから、該追加されたアルバム特徴量を考慮して、保存されていたアルバム特徴量に付随するGroupIDを更新する必要があるためである。
尚、ここでは、クラスタリングによりGroupIDを割り当てる方法を記載したが、UserIDに紐づけられたユーザプロファイルを用いて、年齢層、性別などから、嗜好性が一致する可能性が高いUserIDを同一クラスとして割り当ててもよい。つまり、類似特徴量以外を利用して、GroupIDを割り当ててもよい。性別や年齢などのユーザプロファイルが類似しているユーザは、嗜好性が一致する可能性が高いため、同一GroupIDが割り当てられる。また、画像がクラウドサーバ110などで管理されている場合は、直近にアップロードされた画像に含まれるオブジェクト種類などに基づいて、同一GroupIDに割当ててもよい。
さらに、アルバム特徴量をカテゴリに分類してもよい。例えば、シーン判定で判定されたシーンに基づいてカテゴリ分けをする。具体的には、結婚式、旅行、その他の3つのシーンに分類する場合、結婚式用のアルバム特徴量、旅行用のアルバム特徴量、その他用のアルバム特徴量の3つにカテゴリ分けするとよい。アルバム作成パラメータもそれに合わせて、複数個数分けておく。
図10の説明に戻る。S1009において、S1006やS1008で取得したアルバム特徴量に基づいて、学習を実行する。この学習処理の詳細は後述する。
S1010において、アルバム作成パラメータを更新する。詳しくは、後述するアルバム作成パラメータ生成部1213(図12参照)により生成されたアルバム作成パラメータで更新される。
S1011において、今回発注されたアルバムに対するIDと、アルバム作成パラメータとを紐づける。
ユーザ端末100においてアプリが起動された場合、S1012において、クラウドサーバ110は、学習されたアルバム作成パラメータをユーザ端末100に送信する(学習済みアルバム作成パラメータのダウンロード)。ユーザ端末100では、ダウンロードした学習済みアルバム作成パラメータを用いたアルバム作成パラメータのアップデートが行われる。これにより、アプリの各モジュールで学習済みアルバム作成パラメータを用いることが可能になる結果、自動レイアウト処理時に更新パラメータの設定が反映されることになる。
<ユーザの嗜好に合ったアルバム作成パラメータを求める学習について>
以下、本実施形態の学習方法として、ユーザアルバム特徴量1206に基づいてユーザの嗜好に合ったアルバム作成パラメータ1204を生成する方法について、図12を用いて説明する。
画像セット1201は、学習で使用する画像セットである。学習に使用する画像セットに含める画像としては、ユーザの撮影画像だけでなく、WEB上に公開されている画像、アルバムサービス提供会社が用意する画像などを使用できる。
画像設定部1212は、使用可能な画像DB(本例ではHDD115)に保存されている画像を用いて、画像セット1201を作成する。本実施形態では、画像セット1201として、学習用画像セットと、検証用画像セットとの2種類を作成する。
画像セット1201に対して、アルバム作成パラメータ1204を用いて自動レイアウト処理部1210にて自動レイアウト処理を実行した場合、アルバムデータ1202(レイアウトデータ)が作成される。アルバム作成パラメータ1204は、学習を繰り返すことにより最適化されるパラメータである。アルバム作成パラメータ生成部1213は、自動レイアウト処理部1210にて自動レイアウト処理を実行する際に必要なアルバム作成パラメータを生成する。自動レイアウト処理部1210は、前述の自動レイアウト機能を提供するモジュールである。
アルバム特徴量取得部1211は、自動レイアウト処理部1201により生成されたアルバムデータ1202に基づいてアルバム特徴量1203を導出(算出)する。
図12において、ユーザアルバム特徴量1206は、ユーザが作成したアルバムの特徴を示す特徴量である。ターゲットアルバム特徴量推定部1216は、ユーザアルバム特徴量1206に基づいて、ターゲットアルバム特徴量を推定する。なお、ターゲットアルバム特徴量推定部1216は、ユーザアルバム特徴量1206からターゲットアルバムの正解アルバム特徴量(正解ターゲットアルバム特徴量とする)1207も取得する。尚、ターゲットアルバム特徴量推定部1216の処理については、図13を用いて後述する。
学習制御部1214は、本実施形態で説明する学習作業を制御する。アルバム特徴量比較部1215は、アルバム特徴量1203と正解ターゲットアルバム特徴量1207とを比較する。このアルバム特徴量比較部1215による比較と、ターゲットアルバム特徴量推定部1216によるターゲットアルバム特徴量の推定処理と、を繰り返し実行する(つまり繰り返し学習する)。これにより、ユーザの嗜好がまとめられたターゲットアルバム特徴量1205を求めることができる。
<ターゲットアルバム特徴量の推定について>
以下、図12のターゲットアルバム特徴量推定部1216の詳細について、図13を用いて説明する。図13は、ターゲットアルバム特徴量推定部1216の詳細な機能ブロック図である。
アルバム特徴量取得部1301は、アルバムデータに基づいて、アルバム特徴量を導出する。ここでは、ユーザアルバム特徴量1206と、正解ターゲットアルバム特徴量1207とを取得する。ユーザアルバム特徴量1206が、DeepLearning等の学習部1304に入力されることにより、ターゲットアルバム特徴量1205が出力される。なお、正解ターゲットアルバム特徴量1207は、そのままアルバム特徴量比較部1215に渡される。なお、ユーザアルバム特徴量1206と正解ターゲットアルバム特徴量1207とは、それぞれ学習用と検証用に割り振られる。「検証」とは学習フェーズの中の一処理であり、詳細は図14を用いて説明する。
学習用データ設定部1302は、ユーザアルバム特徴量1206のうち、学習時に使用するアルバム特徴量を、学習用に割り振って設定する。取得されたアルバム特徴量の総数に対する所定割合の数のアルバム特徴量が学習用データとして設定される。このとき、学習用データ数が所定数に満たない場合は、アルバムの見開き単位の特徴量が学習用データとして設定される。一方、学習用データ数が所定数以上の場合は、アルバム単位の特徴量が学習用データとして設定される。
検証用データ設定部1303は、S1006で取得されたアルバム特徴量のうち、学習用データ設定部1302で学習用データに設定された残りのアルバム特徴量を検証用データとして設定する。このとき、学習用データ設定部1302にて、学習用データ数に応じて、見開き単位の特徴量が学習用データとして設定されている場合は、検証用データも見開き単位の特徴量を設定する。一方、アルバム単位の特徴量が学習用データとして設定されている場合は、検証用データもアルバム単位の特徴量を設定する。
学習部1304は、ユーザアルバム特徴量1206を用いてターゲットアルバム特徴量1205を出力する推定処理を行う。学習部1304は、学習用データの数に応じて、採用する学習方法を切り替えることができる。学習用データ数が所定値以上の場合は機械学習による学習を実行する。ここでは機械学習のアルゴリズムとして、DeepLearningを用いる。DeepLearningは、アルバム特徴量の次元数と同サイズの次元数の特徴量が推測されるネットワークを構成する。アルバム発注データの日付を加味して時系列を考慮した学習を行ってもよい。また、DeepLaerningによらず、SVMなどの機械学習を用いてもよい。
一方、学習用データ数が所定値未満の場合は、ルールベースによる学習が行われる。統計的手法を使って、平均、最頻値など、主成分分析を行ってもよい。或いは、特徴量空間にプロットして特徴量空間における距離が近い結果を選定してもよい。
学習用データを使って推定処理を行った結果、ターゲットアルバム特徴量1205が推定される。なお、ターゲットアルバム特徴量推定部1216には、学習制御部1214からアルバム特徴量比較部1215による比較結果が入力されることにより、ターゲットアルバム特徴量1205の推定精度を向上させる。この一連の流れについては、図14を用いて説明する。
尚、ここでは説明のために、固定のアルバム特徴量を学習する方法を記載しているが、学習対象のアルバム特徴量の項目は可変であってもよい。例えば、発注回数が少ない場合は、学習用データが少ないため、学習項目を減らして学習してもよい。発注回数が増え、学習用データ数が増えた場合は、学習項目を増やしてもよい。つまり、学習用データ数に少ない場合の学習項目よりも、学習用データ数が多い場合の学習項目を多くするとよい。また、学習がうまく収束しない場合も学習項目を減らしてもよい。学習が収束すれば、学習項目を増やしてもよい。
学習を行う際、学習済みのアルバム作成パラメータが存在する場合には、この学習済みのアルバム作成パラメータを初期値に設定して、追加学習を行ってもよい。学習に使用するデータ数が少ない場合は、学習用と検証用との組合せを変えることで、学習回数を増やしてもよい。
学習制御部1214は、学習を終了するか否か判定する(後述の図14のS1408及びS1414)。学習部1304における処理過程で算出された相関値が所定の閾値以上の場合に、学習を終了すると判定することが好ましい。相関値が所定の閾値未満の場合、処理を続ける。このとき、相関値が所定値未満であれば、後述するアルバム作成パラメータのアップデートを行わないように制限してもよい。
<学習処理について>
以下、前述の学習処理(図12、図13参照)について、図14を用いて説明する。図14の学習処理は、学習ループと検証ループとを含む。
アルバム作成パラメータ1204の学習が開始された場合、S1401にて、学習制御部1214は、ターゲットアルバム特徴量推定部1216に、ターゲットアルバム特徴量1205の推定と、正解ターゲットアルバム特徴量1207の取得を行うよう指示する。
指示を受けたターゲットアルバム特徴量推定部1216は、取得済みのユーザアルバム特徴量1206に基づいて、ターゲットアルバム特徴量1205を算出(推定)する。ここでは、図13の学習用データ設定部1302で設定された学習用データのアルバム特徴量が学習部1304に入力されることにより、ターゲットアルバム特徴量1205が推定される。推定したターゲットアルバム特徴量1205は、学習制御部1214を介してアルバム作成パラメータ生成部1213へ渡される。例えば、ユーザが生成したアルバムの1見開き目のレイアウトデータのユーザアルバム特徴量1206と2見開き目のレイアウトデータのユーザアルバム特徴量1206に基づき、ターゲットアルバム特徴量を推定する。この推定したターゲットアルバム特徴量1205は学習制御部1214を介してアルバム作成パラメータ制御部1213へ出力される。
さらに、ターゲットアルバム特徴量推定部1216は、学習制御部1214からの指示に基づき、正解ターゲットアルバム特徴量1207を取得し、取得した正解ターゲットアルバム特徴量1207をアルバム特徴量比較部1215へ渡す。例えば、ユーザが生成したアルバムの3見開き目のレイアウトデータのアルバム特徴量を正解ターゲットアルバム特徴量1207として取得し、アルバム特徴量比較部1215へ渡す。
S1402では、学習制御部1214は、アルバム作成パラメータ生成部1213に、アルバム作成パラメータ1204の生成を指示する。アルバム作成パラメータ生成部1213は、この指示を受け、ターゲットアルバム特徴量推定部1216から出力されたターゲットアルバム特徴量1205をアルバム作成パラメータ1204に変換する。例えば、1見開き目と2見開き目のユーザアルバム特徴量1206に基づいて推定されたターゲットアルバム特徴量1205を基に、アルバム作成パラメータ1204を生成する。なお、初めて学習する際は、最初のアルバム作成パラメータとして、規定のパラメータを使用してもよいし、ランダムにパラメータを変化させたものを改めて作成してもよい。
S1403において、学習制御部1214は、画像設定部1212に、学習用の画像セット1201をセットするよう指示する。この指示により画像設定部1212は、学習用の画像セット1201を自動レイアウト処理部1210へ入力する。例えば、3見開き目のレイアウトデータにおいて使用された複数の画像を画像セット1201として自動レイアウト処理部1201へ入力する。
S1404において、自動レイアウト処理部1210は、S1402で生成されたアルバム作成パラメータ1204と、S1403で設定された学習用の画像セット1201とを使用して、アルバムデータ1202(レイアウトデータ)を作成する。例えば、S1402により生成された、1見開き目と2見開き目に基づき推定されたターゲットアルバム特徴量1205に基づくアルバム作成パラメータ1204と、3見開き目の画像と、を用いてアルバムデータ1202が生成される。この場合、生成されたアルバムデータは、3見開き目の推定アルバムデータ(3見開き目の推定レイアウトデータ)とも言える。尚、自動レイアウト処理の説明については、既に説明済みなので省略する(図9参照)。
S1405において、アルバム特徴量取得部1211は、S1404で作成したアルバムデータ1202に対応するアルバム特徴量1203を取得する。例えば、3見開き目の推定アルバムデータのアルバム特徴量を取得する。この場合、取得されたアルバム特徴量は、3見開き目の推定アルバム特徴量とも言える。
S1406において、アルバム特徴量比較部1215は、S1401で取得した正解ターゲットアルバム特徴量1207と、S1405で取得したアルバム特徴量1203とを比較する。例えば、S1406で取得した3見開き目の正解ターゲットアルバム特徴量1207と、3見開き目の推定アルバム特徴量と、を比較する。
比較結果に基づく情報は、アルバム作成パラメータ生成部1213に、学習制御部1214を介して渡される。そして、この比較結果に基づく情報をもとに、推定アルバム特徴量2103が正解ターゲットアルバム特徴量2107に近づくようアルバム作成パラメータ1204が更新される。このアルバム作成パラメータ1204の更新結果に基づく情報は、学習制御部1214を介して、ターゲットアルバム特徴量推定部1216に入力される。そして、ターゲットアルバム特徴量推定部1216の学習部1304におけるパラメータ(例えば、ニューラルネットワークの各ノード間の重み付けパラメータ)を最適化する。
なお、比較結果に基づく情報は、学習制御部1214を介して、ターゲットアルバム特徴量推定部1216に直接渡されてもよい。そして、ターゲットアルバム特徴量推定部1216の学習部1304におけるパラメータ(例えば、ニューラルネットワークの各ノード間の重み付けパラメータ)が最適化されてもよい。なお、この場合、比較結果に基づく情報は、アルバム作成パラメータ生成部1213に入力されなくてもよい。ターゲットアルバム特徴量推定部1216により、ターゲットアルバム特徴量1205の推定精度が向上されるのであれば、そのターゲットアルバム特徴量1205から生成されるアルバム作成パラメータは自ずと最適化されることになる。
このように、ターゲットアルバム特徴量推定部1216による推定と、アルバム特徴量比較部1215による比較と、による学習によって、アルバム生成パラメータの最適化と、ターゲットアルバム特徴量1205の推定精度の向上が行われる。
S1407において、学習制御部1214は、学習ループが所定回数行われたか判定する。本ステップの判定結果が真の場合、S1408に進む、一方、該判定結果が偽の場合、S1402に戻る。尚、本ステップで採用する所定回数は特に決まった値である必要はない。
以上説明した処理により、画像セット1201とアルバム作成パラメータ1204とを更新しながら自動レイアウト処理を実行し、その結果得られる推定アルバム特徴量1203が正解ターゲットアルバム特徴量1207に近づくように学習することが可能である。
S1408において、その時点の正解ターゲットアルバム特徴量1207と推定アルバム特徴量1203との比較結果に基づいて、学習ループを完了するか否かを判定する。例えば、S1406における比較結果が所定の正解率となっているか否かを判定する。正解ターゲットアルバム特徴量1207と推定アルバム特徴量1203とが十分に近い特徴量となっていない場合(つまり正解率が低い場合)、学習ループを継続させるために、S1402に戻る。一方、ターゲットアルバム特徴量1205とアルバム特徴量1203とが十分に近い特徴量となっている場合(つまり正解率が高い場合)、学習ループを終了し、S1409へ進む。
これまでの流れを、具体例を用いて再度説明する。例えば、ユーザアルバム特徴量が3つの見開き分あるとする。このうち1見開き目と2見開き目を使って学習部1304によりターゲットアルバム特徴量1205を算出する。算出されたターゲットアルバム特徴量に基づいて、アルバム作成パラメータ生成部1213によりアルバム作成パラメータ1204が生成される。ここで、画像設定部1212は、3つの見開き分のうち、未使用の3見開き目で使用されている画像を画像セット1201として設定する。そして、自動レイアウト処理部1210は、該設定された3見開き目の画像セット1201に対し、生成されたアルバム作成パラメータを用いて、自動レイアウト処理を実行する。その後、アルバム特徴量取得部1211は、作成されたアルバムデータ(3見開き目の推定アルバムデータ)に対応するアルバム特徴量(3見開き目の推定アルバム特徴量)を取得する。この推定アルバム特徴量は、1見開き目と2見開き目に基づき推定したアルバム作成パラメータを用いて作成される、3見開き目の推定アルバム特徴量となる。そして、この推定アルバム特徴量と、3見開き目の正解ターゲットアルバム特徴量とを、アルバム特徴量比較部1215により比較する。これにより、ターゲットアルバム特徴量推定部1216の推定精度を確認することができる。
なお、上述したとおり、学習用データ数が少ない場合は、アルバムの見開き単位の特徴量が学習用データとして設定されるが、学習用データ数が多い場合は、アルバム単位(複数の見開きからなるフォトブック単位)の特徴量が学習用データとして設定されるとよい。例えば、1つ目のアルバムと2つ目のアルバムに基づきアルバム作成パラメータを作成し、この作成したアルバム作成パラメータと3つ目のアルバムに用いる画像とを用いて自動レイアウトを実施する。そして、このレイアウトの結果生成される3つ目の推定アルバムデータの推定アルバム特徴量と、3つ目の正解ターゲットアルバム特徴量と、を比較するとよい。
このような比較結果を図13の学習部1304に反映することにより、アルバム作成パラメータの推定精度を向上する。なお、推定精度が低い場合は、学習の設定を変更して繰り返し推定を行うことで推定精度を向上することができる。これにより、ユーザの好みがある程度反映されたアルバム作成パラメータが生成される。なお、このアルバム作成パラメータが本当に正確かを検証するために、本実施形態の学習フェーズでは、検証フローを実行する。なお、図14では学習ループと検証ループ(検証フロー)とに分けて記載しているが、検証ループも学習の中の一つのフローである。
以下、学習フェーズの中の検証ループについて説明する。S1409において、学習制御部1214は、画像設定部1212に、これまでの学習ループでは使用していなかった検証用の画像セット1201をセットするように指示する。例えば、学習ループにおいて、1見開き目~8見開き目を用いていた場合、検証ループにおいては、9見開き目以降を使用する。
S1410において、自動レイアウト処理部1210は、学習ループにより生成されたアルバム作成パラメータ1204と、S1409で設定された検証用の画像セット1201とを使用して、アルバムデータ1202を作成する。例えば、学習ループにより生成されたアルバム作成パラメータ1204と、9見開き目で使用される画像とを使用してアルバムデータを生成する。なおこのアルバムデータは、アルバム作成パラメータを用いて推定された9見開き目の推定アルバムデータともいえる。
S1411において、アルバム特徴量取得部1211は、アルバムデータ1202に対応するアルバム特徴量1203を取得する。例えば、9見開き目の推定アルバムデータのアルバム特徴量(9見開き目の推定アルバム特徴量)を取得する。
S1412において、アルバム特徴量比較部1215は、正解ターゲットアルバム特徴量1207と、S1411で取得した推定アルバム特徴量1203とを比較する。例えば、実際にユーザにより作成された9見開き目のアルバムデータのアルバム特徴量(9見開き目の正解ターゲットアルバム特徴量)と、9見開き目の推定アルバム特徴量と、を比較する。これにより、9見開き目を用いて、生成されたアルバム生成パラメータが正しいか検証することができる。
S1413において、学習制御部1214は、検証ループが所定回数行われたか判定する。本ステップの判定結果が真の場合、S1414に進む、一方、該判定結果が偽の場合、S1409に戻る。尚、本ステップで採用する所定回数は特に決まった値である必要はないが、学習ループの回数よりは小さくてよい。
S1409~S1412の検証ループを行うことで、学習されたアルバム作成パラメータ1204の性能が検証される。例えば、9見開き目の正解ターゲットアルバム特徴量と、9見開き目の推定アルバム特徴量とが、所定の相関値に達していれば、ユーザの嗜好性が反映されていると判定できる。
このように、学習用の画像セット1201と異なる検証用の画像セット1201を設定した場合であっても、ターゲットアルバム特徴量1205に近いアルバム特徴量1203となっていれば、S1414で検証完了と判定され、学習は終了する。なお、検証の際、図13の検証用データ設定部1303にて設定されるユーザアルバム特徴量(例えば、9見開き目以降のアルバム特徴量)を使用する。このアルバム特徴量は、学習時に使用されていない。学習に使用していないアルバム特徴量を使うことで、生成したアルバム作成パラメータにより、ユーザの嗜好性を反映するアルバムを作成できるか検証できる。具体的には、検証用のユーザアルバム特徴量に対応した見開きに使用された画像と、学習用のユーザアルバム特徴量を用いて作成したアルバム作成パラメータと、に従いレイアウト結果を生成し、このレイアウト結果に対応する推定アルバム特徴量を導出する。これを検証用の正解ターゲットアルバム特徴量と比較することで、ユーザの嗜好性が反映させられているかを検証することができる。つまり、アルバム作成パラメータが所定の条件を満足しているかを判定することができる。そして、この条件を満足した場合、アルバム作成パラメータは、アプリのアップデート時にダウンロード可能となる。
尚、検証ループでも、学習ループと同様に、検証用データ数が少ない場合は、アルバムの見開き単位の特徴量が検証用データとして設定されるが、検証用データ数が多い場合は、アルバム単位(フォトブック単位)の特徴量が検証用データとして設定されるとよい。
検証後、ターゲットアルバム特徴量1205とアルバム特徴量1203との間の差が小さくならない場合は、S1402に進み、再度学習を実行する。こうすることで、ユーザの嗜好を反映したアルバム作成パラメータ1204を学習で求めることが可能になる。
尚、図14では示していないが、学習ループ、検証ループを行っても所望のアルバム作成パラメータ1204を作成できない場合に備え、ループの限度回数を予め定めておき、必要に応じて学習を停止させるなどの対応をとってもよい。また、学習が収束しなかった場合に、ターゲットアルバム特徴量推定部1216の設定を変えるなどして、異なる条件で学習を行うようにしてもよい。
<学習用データと検証用データの設定方法について>
以下、学習用データと検証用データの設定方法について、図15を用いて説明する。
図15(a)は、見開き単位で学習する際の学習用データ及び検証用データの設定方法を示している。学習に利用できるデータ数が不十分な場合に、見開き単位のデータを利用して学習を行う。例えば、見開きのレイアウトデータが全部でn個ある場合、学習用データをm個、検証用データをk個と割り振る(但し、n=m+k)。
符号1501は、見開き番号ごとの特徴量を示す。この特徴量は、アルバム固有情報に含まれる見開き内情報が設定される(図16(b)参照)。図15(a)の例では、見開きn個分の特徴量があるとする。
符号1502は、割り振られた学習用データ群を示す。n個の見開き特徴量のうちm個が学習用として割り振られる。m個の選択はランダムでもよいが、ここでは説明のために、アルバムのページ構成を考慮して見開き番号#1~#n-2の見開き特徴量を、学習用データに設定する。
符号1503は、割り振られた検証用データ群を示す。見開き特徴量(総数n個)のうち学習用データとして設定されたもの(m個)以外を検証用データに設定する(k個)。ここでは説明のために、見開き番号#n-1~#nの見開き特徴量を、検証用データに設定する。尚、見開きのスロットサイズごとに、学習用データと検証用データとを分けてもよい。
図15(b)は、アルバム単位(複数の見開きページからなるブック単位)で学習する際の学習用データ及び検証用データの設定方法を示している。アルバムデータがn個ある場合に、学習用アルバムデータをm個、検証用アルバムデータをk個と割り振る(但し、n=m+k)。
符号1504は、アルバム番号ごとの特徴量を示す。この特徴量は、各アルバムのアルバム全体情報と見開き内情報が設定される(図16(b)参照)。図15(b)の例では、アルバムn個分の特徴量があるとする。
符号1505は、割り振られた学習用アルバムデータ群を示す。n個のアルバム特徴量のうちm個が学習用として割り振られる。m個の選択はランダムでもよいが、ここでは説明のために、アルバム番号no.1~no.n-2のアルバム特徴量を、学習用データに設定する。
符号1506は、割り振られた検証用アルバムデータ群を示す。アルバム特徴量(総数n個)のうち学習用データとして設定されたもの(m個)以外を検証用データに設定する(k個)。ここでは説明のために、アルバム番号no.n-1~no.nのアルバム特徴量を、検証用データに設定する。尚、解析時に判定されたシーンごとに、学習用データと検証用データとを分けてもよい。
<アルバム作成パラメータについて>
以下、アルバム作成パラメータについて、図16を用いて説明する。図16(a)は、アルバム作成パラメータのデータ構造を示す図である。図示するように、アルバム作成パラメータは、User固有情報と、アルバム固有情報とから構成される。
図16(b)は、User固有情報とアルバム固有情報との夫々の構成を示す図である。GroupIDは、嗜好が類似するユーザをまとめたユーザ群毎に割り当てる。UserIDは、アルバムを発注したユーザ毎に固有のIDを割り当てる。また、User固有情報には、その他の情報として、アルバムを発注したユーザの性別、年齢、住所、電話番号、E-mailアドレス等が格納されている。アルバム固有情報は、アルバム全体情報と、見開き内情報とから構成される。
図16(c)は、アルバム全体情報と、見開き内情報との夫々の構成を示す図である。以下、アルバム全体情報の構成要素(各項目)について説明する。
AlbumIDは、発注されたアルバム毎に固有のIDが割り当てられる。商材サイズは、発注されたアルバムの商材サイズが設定される。製本種別は、発注されたアルバムの製本種別(フルフラット、無線綴じなど)が設定される。メディアは、発注されたアルバムのメディア種類(光沢紙、半光沢紙など)が設定される。見開き数は、発注されたアルバムのページ数が設定される。単価は、発注されたアルバムの1冊あたりの値段が設定される。キャンペーンはユーザが発注したアルバムがキャンペーン対象商品か否かに関する情報や、対応するキャンペーンに関する情報が設定される。平均余白量は、各見開き内の余白面積の合計を見開き数で割った値が設定される。平均画像スロット数は、アルバムに使用された画像枚数を見開き数で割った値が設定される。平均スロットサイズ比は、アルバム内の総スロット面積を総スロット数で割った値が設定される。全体構図パターンは、アルバムに使用された画像の構図のパターン(日の丸、三分割、サンドイッチなど)が設定される。オブジェクトの重みは、得点付け(スコアリング)の際のオブジェクト評価に関する項目と、色合いや明るさなどといった画像の良し悪しに関する項目とについて、重みに関する比率が設定される。編集操作ログは、見開き単位ごとにレイアウト編集された内容が設定される。画像の入れ替え回数、画像のトリミング回数、実行した補正種類及びエフェクト種類などのログが格納される。尚、アルバム全体情報の中の項目には、前述のもの以外にもアルバム全体に関する情報が格納される。
以下、見開き内情報の構成要素(項目)について説明する。
見開き番号は、発注されたアルバム内の見開きの番号が設定される。余白量は、見開き番号で指定された見開き内の余白の面積量が設定される。尚、余白量は、見開きの縁の見開きの幅サイズ、または、見開き内のスロット間の幅サイズでもよい。画像スロット数は、見開き番号で指定された見開きに配置されている画像スロットの個数が設定される。スロットサイズ比は、見開き番号で指定された見開き内のスロットにおいて、最大スロットのサイズと最小スロットのサイズとの比率が設定される。構図パターンは、見開き番号で指定された見開きに配置された画像の構図パターン(日の丸、三分割、サンドイッチなど)が格納される。編集操作ログは、レイアウト編集で実施された編集履歴情報(画像の入れ替え回数、トリミングしたスロット数など)が設定される。尚、図示しないが、見開き内情報の中の項目には、前述のもの以外にも見開きに関する情報が格納される。例えば、以降のような項目が挙げられる。
大スロットオブジェクトは、大スロットに配置した画像に含まれるオブジェクト種類が設定される。エフェクトは、レイアウトに実施したエフェクト処理の種類が設定され、例えば、PhotoOnPhoto、グラデーション処理などのエフェクト種類が設定される。レイヤー数は、見開き内のレイヤー数が設定される。上位レイヤーオブジェクトは、最上位レイヤーのスロットに配置された画像に含まれるオブジェクト情報が格納される。大スロット構図は、最大スロットに配置された画像の構図情報が設定される。上位レイヤー構図は、最上位レイヤーに配置された画像の構図情報が設定される。テンプレート番号は、見開きに使用された固定テンプレート番号が設定される。ユーザが編集もしくは新規でテンプレートを作成した場合は所定値を設定する。ページ跨ぎは、見開きの折り目をまたぐ、もしくはまたがないかを設定する。トリミング量は、各スロットのトリミング量が設定される。
なお、アルバム全体情報及び見開き内情報に同様の項目が含まれてもよい。同様の項目に対しては、学習用データ量で優先度を変えてもよい。例えば、学習用データ量が少ない場合は、アルバム全体情報に設定されている項目の学習を優先する。学習データ量が多い場合は見開き内情報に設定されている項目の学習を優先する。また、アルバム全体情報内のキャンペーン情報に応じて、学習用データに加えるか否かを判断してもよい。
<アルバム作成パラメータの検証について>
以下、学習により設定されたアルバム作成パラメータをユーザ環境で検証する方法について、図17を用いて説明する。図17は、レイアウト編集用UI画面(図8参照)上でアルバム作成パラメータを検証するケースを示している。
編集中の見開きのレイアウト上でマウスを使って操作することにより、画像を入れ替えたり、画像サイズを変更したりすることが可能である。
符号1701は、編集中のアルバムにおける1-2ページのレイアウトのサムネイルを表す。このレイアウトに付随する「a」は、このサムネイルを作成した際のアルバム作成パラメータの種類を表している。同様に、符号1702は、編集中のアルバムにおける3-4ページのレイアウトのサムネイルを表す。このサムネイルに付随する「b」は、このレイアウトを作成した際のアルバム作成パラメータの種類(1-2ページのアルバム作成パラメータとは異なる)を表している。図17の例では、2種類のアルバム作成パラメータを用いて作成されたレイアウトのサムネイルが交互に表示されているが、3種類以上のアルバム作成パラメータであってもよい。
自動レイアウト処理を複数アルバム作成パラメータで実行し、アルバム作成パラメータごとのレイアウト結果を取得しておく。アルバム作成パラメータの種類は、発注履歴がある場合は、学習済みのアルバム作成パラメータと、デフォルトのアルバム作成パラメータとの2種類であってもよい。発注履歴がない場合は、デフォルトのアルバム作成パラメータと、アルバムを作成する際に画像を解析した結果に応じて作成したアルバム作成パラメータとの2種類であってもよい。例えば、画像を解析した結果、候補画像に人物画像が多いことが判明すれば、人物画像を優先的に選択して、サイズの大きいスロットに配置するようなアルバム作成パラメータを設定する。見開きごとにどのアルバム作成パラメータを使用するかは、ランダムで決定してもよいし、順番でループさせてもいい。
このように複数のアルバム作成パラメータで実行した自動レイアウト結果を提示し、各レイアウト結果に対してユーザが行った編集履歴を取得することにより、各アルバム作成パラメータを検証することができる。例えば図17のケースで、パラメータ「a」で生成したレイアウト結果よりも、パラメータ「b」で生成したレイアウト結果の方が、画像入れ替え回数が少なければ、パラメータ「b」の方がユーザの嗜好を適確に表現していると判断できる。また、パラメータ「b」が最新のアルバム作成パラメータであれば、学習がうまくいっていると判断できる。
アルバム発注時にはユーザによる編集履歴もクラウドサーバにアップするので、その履歴に基づいて、学習用データを選定したり、分類したりすることができる。
[その他の実施形態]
尚、前述の実施形態では、アルバム特徴量を用いて学習する方法を説明したが、アルバムに使用された画像と配置情報などをまとめたデータを入力とし、アルバム作成パラメータを出力するネットワークを設計してもよい。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。尚、前述した実施形態の各構成を適宜組み合わせて用いてもよい。

Claims (17)

  1. 情報処理装置のコンピュータに、
    第1アルバム作成パラメータに基づいて生成された第1レイアウトデータに基づき、推定特徴量を出力するステップと、
    前記出力された推定特徴量に基づき、第2アルバム作成パラメータを生成するステップと、
    前記生成された前記第2アルバム作成パラメータと、ユーザにより生成された第2レイアウトデータに用いられた画像と、に基づき、第3レイアウトデータを生成するステップと、
    前記生成された前記第3レイアウトデータに基づく特徴量と前記第2レイアウトデータに基づく特徴量と、に基づき、前記第1アルバム作成パラメータを第3アルバム作成パラメータに更新するステップと、
    を実行させ、
    前記第1レイアウトデータ及び前記第2レイアウトデータは、サーバにアップロードされたデータであり、
    前記サーバにアップロードされたレイアウトデータの数が所定数より少ない場合、前記第1レイアウトデータとしてアルバムの見開き単位のデータが用いられ、
    前記サーバにアップロードされたレイアウトデータの数が前記所定数より多い場合、前記第1レイアウトデータとしてアルバム単位のデータが用いられるように制御することを特徴とするプログラム。
  2. 前記第1レイアウトデータに基づく第1特徴量が入力データとして学習部に入力されることにより、前記学習部から前記推定特徴量が出力されることを特徴とする請求項1に記載のプログラム。
  3. 前記生成された前記第3レイアウトデータに基づく特徴量と、前記第2レイアウトデータに基づく特徴量との比較結果に基づき、前記学習部のパラメータが更新されることを特徴とする請求項2に記載のプログラム。
  4. 前記第2レイアウトデータに用いられた画像が、前記生成された前記第2アルバム作成パラメータに基づいてテンプレートに配置されることにより、前記第3レイアウトデータが生成されることを特徴とする請求項1乃至3のいずれかに記載のプログラム。
  5. 前記第1レイアウトデータと前記第2レイアウトデータとは、前記情報処理装置においてアルバム作成アプリケーションにより生成された後にサーバにアップロードされた複数のレイアウトデータの中から取得されたレイアウトデータであることを特徴とする請求項1乃至4のいずれかに記載のプログラム。
  6. 前記サーバにレイアウトデータがアップロードされた数が所定数より少ない場合において更新される前記第1アルバム作成パラメータの項目の数よりも、前記サーバにレイアウトデータがアップロードされた数が所定数より多い場合において更新される前記第1アルバム作成パラメータの項目の数のほうが多いことを特徴とする請求項5に記載のプログラム。
  7. 前記第3アルバム作成パラメータが所定の条件を満たした場合、前記第3アルバム作成パラメータは、アルバム作成アプリケーションのアップデートによって前記情報処理装置にダウンロードされることを特徴とする請求項1乃至6のいずれかに記載のプログラム。
  8. 前記ダウンロードされた前記第3アルバム作成パラメータは、前記アルバム作成アプリケーションにより新たなレイアウトデータを生成する際に用いられることを特徴とする請求項7に記載のプログラム。
  9. 情報処理装置のコンピュータの制御方法であって、
    第1アルバム作成パラメータに基づいて生成された第1レイアウトデータに基づき、推定特徴量を出力するステップと、
    前記出力された推定特徴量に基づき、第2アルバム作成パラメータを生成するステップと、
    前記生成された前記第2アルバム作成パラメータと、ユーザにより生成された第2レイアウトデータに用いられた画像と、に基づき、第3レイアウトデータを生成するステップと、
    前記生成された前記第3レイアウトデータに基づく特徴量と前記第2レイアウトデータに基づく特徴量と、に基づき、前記第1アルバム作成パラメータを第3アルバム作成パラメータに更新するステップと、
    を有し、
    前記第1レイアウトデータ及び前記第2レイアウトデータは、サーバにアップロードされたデータであり、
    前記サーバにアップロードされたレイアウトデータの数が所定数より少ない場合、前記第1レイアウトデータとしてアルバムの見開き単位のデータが用いられ、
    前記サーバにアップロードされたレイアウトデータの数が前記所定数より多い場合、前記第1レイアウトデータとしてアルバム単位のデータが用いられるように制御することを特徴とする制御方法。
  10. 前記第1レイアウトデータに基づく第1特徴量が入力データとして学習部に入力されることにより、前記学習部から前記推定特徴量が出力されることを特徴とする請求項9に記載の制御方法。
  11. 前記生成された前記第3レイアウトデータに基づく特徴量と、前記第2レイアウトデータに基づく特徴量との比較結果に基づき、前記学習部のパラメータが更新されることを特徴とする請求項10に記載の制御方法。
  12. 前記第2レイアウトデータに用いられた画像が、前記生成された前記第2アルバム作成パラメータに基づいてテンプレートに配置されることにより、前記第3レイアウトデータが生成されることを特徴とする請求項9乃至11のいずれかに記載の制御方法。
  13. 前記第1レイアウトデータと前記第2レイアウトデータとは、前記情報処理装置においてアルバム作成アプリケーションにより生成された後にサーバにアップロードされた複数のレイアウトデータの中から取得されたレイアウトデータであることを特徴とする請求項9乃至12のいずれかに記載の制御方法。
  14. 前記サーバにレイアウトデータがアップロードされた数が所定数より少ない場合において更新される前記第1アルバム作成パラメータの項目の数よりも、前記サーバにレイアウトデータがアップロードされた数が所定数より多い場合において更新される前記第1アルバム作成パラメータの項目の数のほうが多いことを特徴とする請求項13に記載の制御方法。
  15. 前記第3アルバム作成パラメータが所定の条件を満たした場合、前記第3アルバム作成パラメータは、アルバム作成アプリケーションのアップデートによって前記情報処理装置にダウンロードされることを特徴とする請求項9乃至14のいずれかに記載の制御方法。
  16. 前記ダウンロードされた前記第3アルバム作成パラメータは、前記アルバム作成アプリケーションにより新たなレイアウトデータを生成する際に用いられることを特徴とする請求項15に記載の制御方法。
  17. 第1アルバム作成パラメータに基づいて生成された第1レイアウトデータに基づき、推定特徴量を出力する出力手段と、
    前記出力された推定特徴量に基づき、第2アルバム作成パラメータを生成する生成手段と、
    前記生成された前記第2アルバム作成パラメータと、ユーザにより生成された第2レイアウトデータに用いられた画像と、に基づき、第3レイアウトデータを生成する生成手段と、
    前記生成された前記第3レイアウトデータに基づく特徴量と前記第2レイアウトデータに基づく特徴量と、に基づき、前記第1アルバム作成パラメータを第3アルバム作成パラメータに更新する更新手段と、
    を有する情報処理装置であって、
    前記第1レイアウトデータ及び前記第2レイアウトデータは、サーバにアップロードされたデータであり、
    前記サーバにアップロードされたレイアウトデータの数が所定数より少ない場合、前記第1レイアウトデータとしてアルバムの見開き単位のデータが用いられ、
    前記サーバにアップロードされたレイアウトデータの数が前記所定数より多い場合、前記第1レイアウトデータとしてアルバム単位のデータが用いられるように制御することを特徴とする情報処理装置。
JP2019107507A 2019-06-07 2019-06-07 学習方法 Active JP7313915B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019107507A JP7313915B2 (ja) 2019-06-07 2019-06-07 学習方法
US16/893,760 US11089170B2 (en) 2019-06-07 2020-06-05 Control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019107507A JP7313915B2 (ja) 2019-06-07 2019-06-07 学習方法

Publications (3)

Publication Number Publication Date
JP2020201677A JP2020201677A (ja) 2020-12-17
JP2020201677A5 JP2020201677A5 (ja) 2022-06-13
JP7313915B2 true JP7313915B2 (ja) 2023-07-25

Family

ID=73650863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019107507A Active JP7313915B2 (ja) 2019-06-07 2019-06-07 学習方法

Country Status (2)

Country Link
US (1) US11089170B2 (ja)
JP (1) JP7313915B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7341677B2 (ja) * 2019-02-28 2023-09-11 キヤノン株式会社 装置、方法、及びプログラム
JP2020201679A (ja) * 2019-06-07 2020-12-17 キヤノン株式会社 学習方法
JP7414409B2 (ja) * 2019-06-07 2024-01-16 キヤノン株式会社 学習方法
JP2022086520A (ja) 2020-11-30 2022-06-09 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP2022123209A (ja) 2021-02-12 2022-08-24 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP2022123213A (ja) 2021-02-12 2022-08-24 キヤノン株式会社 画像処理装置、画像処理装置の制御方法、及びプログラム
JP2022123210A (ja) 2021-02-12 2022-08-24 キヤノン株式会社 画像処理装置、画像処理装置の制御方法、及びプログラム
JP2023021794A (ja) 2021-08-02 2023-02-14 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP2023067166A (ja) 2021-10-29 2023-05-16 キヤノン株式会社 画像処理装置及び画像処理方法
JP2023067164A (ja) 2021-10-29 2023-05-16 キヤノン株式会社 画像処理装置及び画像処理方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013229006A (ja) 2012-03-27 2013-11-07 Fujifilm Corp レイアウト装置、レイアウト方法およびプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6494503B2 (ja) 2015-08-07 2019-04-03 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP6902860B2 (ja) 2016-12-09 2021-07-14 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP6723937B2 (ja) * 2017-01-31 2020-07-15 キヤノン株式会社 プログラム、画像処理装置、および画像処理方法
JP6938422B2 (ja) 2018-04-23 2021-09-22 キヤノン株式会社 画像処理装置、画像処理方法、およびプログラム
JP7224774B2 (ja) 2018-04-23 2023-02-20 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP7350495B2 (ja) 2019-02-28 2023-09-26 キヤノン株式会社 装置、方法、及びプログラム
JP7250567B2 (ja) 2019-02-28 2023-04-03 キヤノン株式会社 装置、方法、及びプログラム
US11361487B2 (en) 2019-02-28 2022-06-14 Canon Kabushiki Kaisha Apparatus, method and storage medium

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013229006A (ja) 2012-03-27 2013-11-07 Fujifilm Corp レイアウト装置、レイアウト方法およびプログラム

Also Published As

Publication number Publication date
JP2020201677A (ja) 2020-12-17
US11089170B2 (en) 2021-08-10
US20200389566A1 (en) 2020-12-10

Similar Documents

Publication Publication Date Title
JP7313915B2 (ja) 学習方法
JP7414409B2 (ja) 学習方法
JP7418976B2 (ja) 学習方法
JP2020201679A (ja) 学習方法
JP7250567B2 (ja) 装置、方法、及びプログラム
JP7350495B2 (ja) 装置、方法、及びプログラム
US11470209B2 (en) Image processing apparatus, method of controlling image processing apparatus, and storage medium for editing an album
JP7341677B2 (ja) 装置、方法、及びプログラム
US11915351B2 (en) Image processing apparatus, image processing method, and storage medium
US20220262054A1 (en) Storage medium, image processing apparatus, and image processing method
US20220262057A1 (en) Storage medium, image processing apparatus, and image processing method
US11936821B2 (en) Image processing apparatus, method of controlling image processing apparatus, and storage medium with determination as to whether image is already contained in album data for first subject and album data for second subject and specifying image as change target
US20220263952A1 (en) Storage medium, image processing apparatus, and image processing method
JP2020140567A (ja) 装置、方法、及びプログラム
US20220262055A1 (en) Image processing apparatus, image processing method, and storage medium
US20120075676A1 (en) Layout system, information processing apparatus, layout method, and program thereof
JP7336211B2 (ja) 画像処理装置、制御方法、及びプログラム
JP2020140555A (ja) 画像処理装置、制御方法、及びプログラム
JP2022086521A (ja) 画像処理装置、画像処理方法、及びプログラム
US20210248661A1 (en) Image processing apparatus, image processing method, program, and image processing system
JP2021071870A (ja) 情報処理装置、情報処理方法およびプログラム
JP7336212B2 (ja) 画像処理装置、制御方法、及びプログラム
JP7336210B2 (ja) 画像処理装置、制御方法、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220603

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220603

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230613

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230712

R151 Written notification of patent or utility model registration

Ref document number: 7313915

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151