WO2022085076A1

WO2022085076A1 - 方法、情報処理装置及びプログラム

Info

Publication number: WO2022085076A1
Application number: PCT/JP2020/039403
Authority: WO
Inventors: 健太菅原
Original assignee: 株式会社ラディウス・ファイブ
Priority date: 2020-10-20
Filing date: 2020-10-20
Publication date: 2022-04-28

Abstract

【課題】ドキュメントファイルをより自由度高く校正することこと。【解決手段】本開示に係るドキュメントファイルの処理に関する方法は、プロセッサが、オブジェクトを含むドキュメントファイルのデータから前記オブジェクトを抽出することと、抽出された前記オブジェクトに対して画像に関する処理を行うことと、前記処理されて得られる処理後画像を、ドキュメントファイルに含める処理を行うことと、前記処理後画像を含む前記ドキュメントファイルのデータを出力することと、を含む。

Description

方法、情報処理装置及びプログラム

　本開示は、方法、情報処理装置及びプログラムに関する。

　ドキュメントファイルの出力や印刷において、特許文献１には、テキストのフォントに対し、プレビューとして表示されるフォントと実際の印刷物のフォントとを一致させる技術が開示されている。。

特開２０１４－１２３１６８号公報

　直接的に修正が困難なドキュメントファイルにおいては、上記特許文献１に開示された技術によりフォントを校正することはできるが、ドキュメントファイルに含まれる画像等のオブジェクトに対する校正は困難である。そのため、ドキュメントファイルの校正に限度がある。

　本開示は、このような問題を鑑みてなされたものであり、ドキュメントファイルをより自由度高く校正することができる方法、情報処理装置及びプログラムを提供することを目的とする。

　本開示によれば、ドキュメントファイルの処理に関する方法であって、プロセッサが、オブジェクトを含むドキュメントファイルのデータから前記オブジェクトを抽出することと、抽出された前記オブジェクトに対して画像に関する処理を行うことと、前記処理されて得られる処理後画像を、ドキュメントファイルに含める処理を行うことと、前記処理後画像を含む前記ドキュメントファイルのデータを出力することと、を含む方法が提供される。

　また、本開示によれば、ドキュメントファイルの処理を行うための情報処理装置であって、オブジェクトを含むドキュメントファイルのデータから前記オブジェクトを抽出するオブジェクト抽出部と、抽出された前記オブジェクトに対して画像に関する処理を行う画像処理部と、前記処理されて得られる処理後画像を、前記ドキュメントファイルに含める書換処理部部と、前記処理後画像を含む前記ドキュメントファイルのデータを出力する出力制御部と、を備える情報処理装置が提供される。

　また、本開示によれば、コンピュータに、ドキュメントファイルの処理を行わせるためのプログラムであって、前記コンピュータを、オブジェクトを含むドキュメントファイルのデータから前記オブジェクトを抽出するオブジェクト抽出部と、抽出された前記オブジェクトに対して画像に関する処理を行う画像処理部と、前記処理されて得られる処理後画像を、前記ドキュメントファイルに含める書換処理部と、前記処理後画像を含む前記ドキュメントファイルのデータを出力する出力制御部と、として機能させるプログラムが提供される。

　その他本願が開示する課題やその解決方法については、本開示の実施形態の欄及び図面により明らかにされる。

　本開示によれば、ドキュメントファイルをより自由度高く校正することができる。

本開示の一実施形態に係るシステム１の全体構成例を示す図である。同実施形態に係るサーバ１０のハードウェア構成例を示す図である。同実施形態に係るユーザ端末２０のハードウェア構成例を示す図である。同実施形態に係る制御部１１の機能構成例を示す図である。同実施形態に係るオブジェクト特定部１０２による特定処理の一例を示す図である。同実施形態に係るオブジェクト特定部１０２による特定処理の一例を示す図である。同実施形態に係る書換処理部１０６による書換処理の一例を示す図である。同実施形態に係る書換処理部１０６による書換処理の他の例を示す図である。同実施形態のシステム１により実行される処理の流れを示すフローチャートである。本実施形態の第一の変形例に係る書換処理部１０６による処理の一例を示すための図である。同変形例に係る書換処理部１０６による処理の一例を示すための図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　図１は、本開示の一実施形態に係る画像表示システムの全体構成例を示す図である。本実施形態のシステム１は、サーバ１０を含んで構成される。サーバ１０は、一又は複数のユーザ端末２０と通信ネットワークＮＷを介して通信可能に接続される。通信ネットワークＮＷは、たとえばインターネットであり、公衆電話回線網や携帯電話回線網、無線通信路、イーサネット（登録商標）などにより構築される。

　本実施形態のシステム１は、作成されたドキュメントファイルに含まれる画像等のオブジェクトを抽出し、抽出されたオブジェクトに画像処理等を行い、画像処理後のオブジェクトをドキュメントファイルに再度埋め込む。そしてシステム１は、埋め込まれた画像を含むドキュメントファイルを出力するものである。出力されるドキュメントファイルは、元のドキュメントファイルを更新するものであってもよいし、新たに生成されるものであってもよい。また、処理内容のドキュメントファイルには、自然言語等により構成されるテキストを含むものであり、処理対象がかかるテキスト情報であってもよい。ここでは、テキストはオブジェクトの一例である。すなわち、本実施形態のシステム１は、かかるテキスト情報に基づいて画像処理を行うものも含みうる。また、出力されるドキュメントファイルのファイル形式は、元のドキュメントファイルとは異なるファイル形式（例えば、画像ファイル形式や、他のドキュメントファイル形式）であってもよい。例えば、ユーザがユーザ端末２０を操作して、一連の処理を行う対象のドキュメントファイルを選択し、選択されたドキュメントファイルに対して一連の処理を実行することにより、上記の処理が行われ得る。

　サーバ１０は、ユーザ端末２０に対するユーザの操作に応じて選択されるドキュメントファイルに対して処理を行うためのコンピュータである。サーバ１０は、情報処理装置の一例である。サーバ１０は、たとえば、パーソナルコンピュータ、ワークステーション、またはクラウドコンピューティングによる仮想的なコンピュータであってもよい。サーバ１０は、いわゆるＷｅｂアプリケーションとしてこれらの機能を実行することを想定する。なお、図１において、サーバ１０は単一のサーバとして図示しているが、これに限らず、システム１は、サーバ１０を含む複数の処理用サーバを有し、分散処理によって本システムにおける処理を実行することができる。また、ここで、分散処理を行うサーバの台数の増減を、各処理の負荷及び／または各処理を行う対象となるドキュメントファイルや画像のサイズおよび／または数に応じて動的に変更することもできる。また、サーバ１０は、オンラインでドキュメントファイルを処理しても良い。

　ユーザ端末２０は、携帯電話、スマートフォン、ゲーム機、タブレットコンピュータ、パーソナルコンピュータなどの端末機器である。

　ユーザ端末２０は、処理する対象であるドキュメントファイルを選択するための画面を表示し、ユーザの操作によるドキュメントファイルの選択に関する情報をサーバ１０に送信する。また、ユーザ端末２０は、選択されたドキュメントファイルの処理後のデータをサーバ１０から受信する。ユーザ端末２０には、例えば、本実施形態に係るシステム１に対応するアプリケーションソフトやＷｅｂブラウザ等がインストールされていてもよい。

　図２は、本実施形態に係るサーバ１０のハードウェア構成例を示す図である。サーバ１０は、少なくとも、制御部１１、メモリ１２、ストレージ１３、送受信部１４及び入出力部１５等を備える。これらはバス１６を通じて相互に電気的に接続される。

　制御部１１は、処理サーバ１全体の動作を制御し、各要素間におけるデータの送受信の制御、及びアプリケーションの実行及び認証処理に必要な情報処理等を行う演算装置である。制御部１１は、例えばＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）であり、ストレージ１３に格納されメモリ１２に展開されたプログラム等を実行して各情報処理を実施する。また、制御部１１は、画像処理用のプロセッサとして、例えばＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）であってもよく、ホストであるＣＰＵからの命令を多数のコアにより同時に並列処理を行うことができる。また、制御部１１は、アクセラレーターや、アクセラレータークラスタにより同時に並列処理を行ってもよい。アクセラレーターとしては、例えば、ＣＰＵ、ＧＰＵ、ＦＰＧＡ、ＡＳＩＣ、独自定義のニューラルネットワーク専用演算コア、推論専用の光を用いた演算装置などが挙げられ、これらに限定されない。画像の自動生成処理は、例えば、ボルツマンマシン、Ｅｎｃｏｄｅｒ－Ｄｅｃｏｄｅｒ、ＧＡＮ、ＶＡＥ（Ｖａｒｉａｔｉｏｎａｌ　Ａｕｔｏｅｎｃｏｄｅｒ）、ＳｔｙｌｅＴｒａｎｓｆｅｒ等の公知の機械学習のアルゴリズムが用いられる。

　メモリ１２は、ＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）等の揮発性記憶装置で構成される主記憶と、フラッシュメモリやＨＤＤ（Ｈａｒｄ　Ｄｉｓｃ　Ｄｒｉｖｅ）等の不揮発性記憶装置で構成される補助記憶と、を含む。メモリ１２は、制御部１１のワークエリア等として使用され、また、サーバ１０の起動時に実行されるＢＩＯＳ（Ｂａｓｉｃ　Ｉｎｐｕｔ／Ｏｕｔｐｕｔ　Ｓｙｓｔｅｍ）、及び各種設定情報等を格納する。また、メモリ１２は、自動生成された画像データを格納するために用いられてもよい。その場合メモリ１２は、例えば、ＶＲＡＭ（Ｖｉｄｅｏ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）でありうる。

　ストレージ１３は、アプリケーション・プログラム等の各種プログラムを格納する。各処理に用いられるデータを格納したデータベース（図示せず）がストレージ１３に構築されていてもよい。

　送受信部１４は、サーバ１０を通信ネットワークＮＷに接続する。なお、送受信部１４は、Ｂｌｕｅｔｏｏｔｈ（登録商標）やＷｉ－Ｆｉ（登録商標）などの近距離通信インタフェースを備えていてもよい。送受信部１４は、例えば、ユーザ端末２０から選択された画像に関する情報を受信したり、サーバ１０で自動生成した画像データをユーザ端末２０に送信したりする。入出力部１５は、キーボードやマウス類、コントローラ等の情報入力機器、及びディスプレイ等の出力機器である。

　バス１６は、上記各要素に共通に接続され、例えば、アドレス信号、データ信号及び各種制御信号を伝達する。

　図３は、本実施形態に係るユーザ端末２０のハードウェア構成例を示す図である。ユーザ端末２０は、少なくとも、制御部２１、メモリ２２、ストレージ２３、送受信部２４、入出力部２５、および表示部２６等を備え、これらはバス２７を通じて相互に電気的に接続される。制御部２１、メモリ２２、ストレージ２３、送受信部２４および入出力部２５の各構成要素は上述したサーバ１０の有する各構成要素のハードウェアとしての機能は同一であるため説明を省略する。

　表示部２６は、各種情報を表示する機能を有する。表示部２６は、例えば、ディスプレイ等により実現されてもよい。また、表示部２６は、タッチパネルなど、入出力部２５と機能が一体となって実現されるものであってもよい。本実施形態では、表示部２６はタッチパネル（すなわちユーザの操作を受け付ける機能を有するもの）により実現されているものとして説明する。

　図４は、本実施形態に係る制御部１１の機能構成例を示す図である。制御部１１は、取得部１０１、オブジェクト特定部１０２、オブジェクト抽出部１０３、データ解析部１０４、画像処理部１０５、書換処理部１０６および出力制御部１０７を備える。

　なお、取得部１０１、オブジェクト特定部１０２、オブジェクト抽出部１０３、データ解析部１０４、画像処理部１０５、書換処理部１０６および出力制御部１０７は、サーバ１０が備える制御部１１がストレージ１３に記憶されているプログラムをメモリ１２に読み出して実行することにより実現される。また、各部で実行される処理について、その処理負荷やハードウェアリソースに応じて、サーバ１０内の複数の装置、及び／または、他のサーバで並列処理を行うこともできる。

　取得部１０１は、各種データを取得する機能を有する。例えば、取得部１０１は、ドキュメントファイルデータを取得する。取得部１０１は、例えば、予めストレージ１３に格納されているドキュメントファイルデータや、ユーザ端末２０等の外部ハードウェアから入出力部１５等を通じて取得してもよい。

　本明細書におけるドキュメントファイルとは、例えば、ＰＤＦ（Portable　Document　File）形式のファイルであってもよい。ＰＤＦ形式のドキュメントファイルは、テキストや画像等のオブジェクトが埋め込まれたドキュメントファイルである。ＰＤＦファイルは実際に紙等に印刷したり、スマートフォンやタブレット等のデバイスで閲覧したりする際に、共通のレイアウトを維持したまま表示させることが可能である。しかしながら、ＰＤＦファイル等に変換する際に、埋め込まれた画像等の画質が低下したり、実際の印刷時等において元の画像とは異なる態様で表示されることがある。本実施形態では、例えば、そのような画像を選択的に抽出し、画像処理を行うことで、表示の際に適切な画質となるようにすることができる。なお、ドキュメントファイルはＰＤＦ形式に限定されず、ワードプロセッサに係るファイル形式、表計算に係るファイル形式、プレゼンテーションに係るファイル形式、画像編集に係るファイル形式などのファイル形式を対象とすることができる。例えば、ファイル形式は、ＰＳＤ形式、ＡＩ（Adobe　Illustrator）形式、Word形式、Excel形式、Powerpoint形式またはindesign形式等であってもよい。

　また、取得部１０１は、例えば、ユーザ端末２０等に対するユーザの操作に基づく入力情報を取得してもよい。取得した入力情報に基づき、例えば、ドキュメントファイルに含まれる画像が画像処理対象として選択されたり、どのような画像処理を行うかが選択されたりする。

　オブジェクト特定部１０２は、ドキュメントファイルのデータから、抽出対象である画像を特定する機能を有する。図５は、本実施形態に係るオブジェクト特定部１０２による特定処理の一例を示す図である。図示するように、ユーザ端末２０の表示部２６に、ドキュメントファイル１０００が表示されているとする。ドキュメントファイル１０００は、テキスト１００１、画像１００２、画像１００３およびテキスト１００４を含む。ここで、オブジェクト特定部１０２は、画像１００２および画像１００３の少なくともいずれかを画像処理対象の画像として特定する。

　抽出される画像は、例えば、ドキュメントファイルに対するユーザによる入力に基づいて特定されてもよい。具体的には、オブジェクト特定部１０２は、ユーザ端末２０に対するユーザの操作（例えば選択領域を設定する操作）により、画像１００２が抽出対象として選択された場合に、画像１００２を抽出対象の画像として特定してもよい。

　また、抽出される画像は、ドキュメントファイルのデータを解析することにより特定されてもよい。具体的には、オブジェクト特定部１０２は、後述するデータ解析部１０４によりドキュメントファイルのデータを解析して画像データであると認識された領域（すなわち画像１００２および画像１００３に対応する領域）を、抽出される画像として特定してもよい。また、オブジェクト特定部１０２は、かかる領域について画像の解像度に基づく解析を行って、その解析結果に基づいて抽出される画像を特定してもよい。例えば、画像の解像度が所定の閾値を下回る領域（画像）を、抽出される画像として特定してもよい。これにより、画像処理が必要な画像について自動的に抽出することが可能となる。また、オブジェクト特定部１０２は、かかる領域について画像の画質に関するパラメータに基づく解析を行って、その解析結果に基づいて抽出される画像を特定してもよい。画質に関するパラメータは、例えば、画像内の解像度を測るパラメータとしてｄｐｉの値、画質向上の余地を測るパラメータとしてＰＳＮＲ（Peak　Signal-to-Noise　Ratio）や、画像をバイキュービック法で１／２に縮小した後に、再度２倍にバイキュービック法で拡大させて得られる元画像とのＭＳ－ＳＳＩＭ（Multi-Scale　Structural　SIMilarity）の値であり得る。

　図６は、本実施形態に係るオブジェクト特定部１０２による特定処理の一例を示す図である。図示するように、画像１００２および画像１００３が、抽出領域１０１０および抽出領域１０１１として特定され得る。なお、オブジェクト特定部１０２は、画像の他に、テキストや動画など、ドキュメントファイルに含まれる各種オブジェクトを抽出対象として特定し得る。

　オブジェクト抽出部１０３は、特定された画像を抽出する機能を有する。例えば、図６に示した例では、特定された画像１００２および１００３（抽出領域１０１０および１０１１）を画像データとして抽出し、後述する画像処理のためのメモリ等に適宜出力され得る。なお、例えば、画像が１つのページに複数存在する場合は、例えば、オブジェクト抽出部１０３は、それらを一つの画像データとして抽出してもよい。なお、オブジェクト抽出部１０３は、画像抽出部の一例である。オブジェクト抽出部１０３は、画像の他に、テキストや動画など、ドキュメントファイルに含まれる各種オブジェクトを抽出し得る。

　データ解析部１０４は、ドキュメントファイルデータを解析する機能を有する。かかる解析結果は、例えば、前述したようなオブジェクトの特定や抽出のための条件として用いられたり、画像処理における効率化を図るための条件として用いられ得る。

　また、データ解析部１０４は、複数のページからなるドキュメントファイルデータを解析し、各ページの情報を取得し、解析を行ってもよい。各ページの情報とは、例えば、各ページに含まれるテキストのフォント、サイズおよび場所、画像の色、形状、位置、解像度、輝度、彩度、色相およびコントラスト等の画質に関する情報、並びにレターアート等の情報を含みうる。これらの解析結果としては、例えば、複数ページ間における統一性やそれぞれのページにおけるクオリティに基づく、スコアやランキングとしての評価値が出力され得る。統一性やクオリティは、例えば、予め機械学習により得られる学習モデルに基づいて決定されるものであってもよい。当該学習モデルは、適宜ユーザや開発者のフィードバックにより更新されるものであってもよい。このようなデータ解析部１０４により得られる解析結果に基づく各種処理については後述する。

　画像処理部１０５は、抽出されたオブジェクトに対して画像に関する処理を行う。本実施形態では、画像処理部１０５は、抽出された画像に対して画像処理を行う機能を有する。画像処理部１０５による画像処理の種類は特に限定されず、公知の画像処理を行うことができる。例えば、画像処理としては、超解像処理、高解像度処理、スタイル変換処理、ボケ除去処理、着彩処理、色調補正処理、ＨＤＲ化処理その他の各種処理が挙げられる。その他の画像処理としては、例えば、画像から三次元モデルを生成する処理、画像から生成した三次元モデルにおける他の視点に基づく画像を生成する処理、画像に含まれる環境に関する情報を変更する処理、軽量化処理、欠損補完処理、オブジェクト除去処理、他の画像へのクロップ処理の少なくともいずれかがあり得る。かかる画像処理は、機械学習に基づくものであってもよい。また、かかる画像処理は、複数のサーバによる分散処理により行われてもよい。例えば、抽出された画像が複数である場合は、一以上の画像ごとにそれぞれ異なるサーバによって処理が行われてもよい。また、画像処理部１０５は、画像の各々についてそれぞれ異なる処理を行ってもよい。

　画像処理部１０５は、例えば、画像処理の対象となる画像が、ドキュメントファイルに複数含まれている場合に、そのうち一の画像に対して画像処理を行ってもよい。後述する書換処理部１０６により、該複数の画像は、画像処理がされた一の処理後画像にそれぞれ書き換えられ得る。これにより、画像処理の負荷を低減することができる。また、画像処理部１０５は、一のページに含まれる画像に対して、一括で画像処理を行ってもよい。

　また、画像処理部１０５は、オブジェクト特定部１０２による画像の特定や、オブジェクト抽出部１０３による画像の抽出に係る処理よりも前に、予めドキュメントファイルの少なくとも一ページ以上に含まれる画像に対して予め画像処理（仮の画像処理）を行ってもよい。この場合、画像処理は、抽出後に行われる画像処理よりも処理負荷の低い処理であってもよい。これにより、画像処理後のドキュメントファイルの仕上がりを予め確認することができる。この場合、後述する出力制御部１０７は、仮の画像処理を行ったドキュメントファイルに係る表示を表示部２６に出力してもよい。

　また、画像処理部１０５は、ドキュメントファイルに含まれる画像以外のオブジェクトについての画像処理を行ってもよい。具体的には、画像処理部１０５は、ドキュメントファイルに含まれるテキストについて画像処理を行い、画像を生成してもよい。画像処理部１０５は、例えば、抽出されたテキストの情報に基づいて画像を修正してもよいし、かかるテキストの情報に基づいて、他に抽出された画像を修正する処理を行ってもよい。

　書換処理部１０６は、処理後画像をドキュメントファイルに含める機能を有する。例えば、書換処理部１０６は、処理後画像をドキュメントファイルに含まれる画像に代えてドキュメントファイルに含める機能を有する。図７は、本実施形態に係る書換処理部１０６による書換処理の一例を示す図である。図示するように、ユーザ端末２０の表示部２６に、ドキュメントファイル１１００が表示されているとする。ドキュメントファイル１１００は、テキスト１１０１、画像１１０２、画像１１０３およびテキスト１１０４を含む。テキスト１１０１および１１０４は、図５および図６に示したテキスト１００１および１００４と同様であるが、画像１１０２および１１０３は、画像１００２および１００３に対して画像処理を行って得られた処理後画像である。すなわち、書換処理部１０６は、画像１００２および１００３が位置していた領域に、各画像を画像処理して得られた処理後画像１１０２よび１１０３を含める処理を行う。

　なお、書換処理部１０６は、単に画像処理を行った処理後画像をドキュメントファイルに埋め込むだけの機能を有することに限定されない。例えば、書換処理部１０６は、オブジェクト（例えば、画像やテキスト等）の配置等を変更する処理を行ってもよい。「配置等を変更する」とは、オブジェクトを元のドキュメントファイルにおける位置から変更することを含む。さらに「配置等を変更する」は、元のドキュメントファイルに含まれるオブジェクトそのものを変更することを含みうる。

　図８は、本実施形態に係る書換処理部１０６による書換処理の他の例を示す図である。図８に示す例では、ドキュメントファイル１１００に含まれる（画像処理後の）画像１１０３とテキスト１１０４との位置が、図７に示す位置とは異なる位置である。具体的には、図８に示す例では、ドキュメントファイルにおいて、テキストが左側に、画像が右側に位置するように、書換処理部１０６による書換処理が行われている。かかる書換処理部１０６は、例えば、データ解析部１０４によりドキュメントファイルを解析して得られる解析結果（例えばテキストや画像の配置の傾向等）や、予め定められたルールに基づいて、画像やテキスト等のオブジェクトの配置を変更してもよい。なお、配置の変更の対象となる画像は、画像処理部１０５による画像処理が行われていない画像であってもよい。このように、書換処理部１０６は、単に画像処理後の画像に差し替える処理を行うだけでなく、ドキュメントファイルにおける画像等の態様や配置を変更する処理を行ってもよい。

　書換処理部１０６による書換処理の変形例については後述する。

　出力制御部１０７は、書換処理部１０６により処理されたドキュメントファイルのデータを出力する機能を有する。例えば、出力制御部１０７は、処理後画像を含むドキュメントファイルのデータを出力し得る。出力態様は特に限定されないが、例えば、本システム１がウェブサービス等である場合は、ドキュメントファイルのファイル形式は、処理前と同様であってもよいし、異なるファイル形式であってもよい。また、出力態様は、ドキュメントファイルの表示態様に対応する画像データであってもよい。また、かかるドキュメントファイルのデータは、ユーザ端末２０やその他のサーバ等に出力されて記憶されてもよい。

　また、出力制御部１０７は、ドキュメントファイルのデータを出力するとともに、処理されたドキュメントファイルについてのフィードバックを入力するための表示を、ユーザ端末２０の表示部２６に表示してもよい。これにより、ユーザが所望するドキュメントファイルであるかどうかを判定することが可能となり、また、その判定結果によるフィードバックを、上述した学習モデルの再学習のために用いることができる。また、かかる処理後のドキュメントファイルは、ユーザ端末２０への操作により適宜修正可能なものであってもよい。かかる操作による入力情報は取得部１０１により取得され、かかる入力情報に基づき、適宜画像処理部１０５等により再度画像処理等が実行されてもよい。

　以上、制御部１１のソフトウェア構成の各機能について説明した。次に、本実施形態に係るシステム１による処理の流れの一例について説明する。図９は、本実施形態のシステム１により実行される処理の流れを示すフローチャートである。

　まず、取得部１０１は、ユーザ端末２０等からドキュメントファイルのデータを取得する（ステップＳＱ１０１）。次に、オブジェクト特定部１０２は抽出対象となる画像等を特定する（ステップＳＱ１０２）。次に、オブジェクト抽出部１０３は、特定された画像を抽出する（ステップＳＱ１０３）。

　次に、特定された画像に対して画像処理部１０５が画像処理を行う（ステップＳＱ１０４）。次に、書換処理部１０６は、処理後の画像をドキュメントファイルに含めて配置する（ステップＳＱ１０５）。そして、出力制御部１０７は、処理後のドキュメントファイルデータを出力する（ステップＳＱ１０６）。

　このように、本開示によれば、ドキュメントファイルに含まれる画像等のオブジェクトを抽出し、かかる画像に対して画像処理を行い、画像処理後の画像を元のドキュメントファイルに戻す（その際に、配置を変更してもよい）ことを簡単に行うことができる。また、ドキュメントファイルに含まれる画像やテキスト等の配置やデザインも、容易に変更することができる。よって、ドキュメントファイルをより自由度高く校正することができる。

　次に、本実施形態の第一の変形例について説明する。ここでは、書換処理部１０６の変形例について説明する。上記の実施形態において書換処理部１０６は、画像処理後の画像やテキストの配置を変更する機能も有しうるとしたが、本技術はかかる例に限定されない。例えば、書換処理部１０６は、複数のページのそれぞれに含まれる画像およびオブジェクトの少なくともいずれかに基づいて、画像およびオブジェクトの少なくともいずれかの態様および配置の少なくともいずれかを変更する処理を行ってもよい。より具体的には、ドキュメントファイルがプレゼンテーション用ファイルである場合に、各ページのレイアウトやデザインを自動的に統一化する処理を書換処理部１０６が行ってもよい。かかる統一化する処理は、例えば、各ページに用いられている画像やテキストのサイズ、表示態様（フォント等）、位置等を調整する処理を含む。かかる処理は、例えば、ドキュメントファイルを構成する複数のページにおけるレイアウトやデザインに関する情報をデータ解析部１０４が解析し、かかる解析結果に基づいて書換処理部１０６が行うものであってもよい。また、かかる処理は、予め用意されたテンプレートに基づいて、書換処理部１０６が画像やテキスト等のオブジェクトの態様や配置を変更するものであってもよい。

　図１０および１１は、本実施形態の第一の変形例に係る書換処理部１０６による処理の一例を示すための図である。図１０に示すように、ドキュメントファイル１２００は複数のページにより構成されている。ドキュメントファイル１２００は、ページ１２０１、１２０２、１２０３を含む。ページ１２０１にはテキスト２００１および画像２００２が、ページ１２０２には画像２００３およびテキスト２００４が、ページ１２０３にはテキスト２００５および画像２００６が含まれている。このうち、ページ１２０２は、他のページ１２０１、１２０３とは異なるレイアウトを有している。ページ１２０１、１２０３においては左側にテキスト、右側に画像が配置されているが、ページ１２０２においては上側に画像、下側にテキストが配置されている。また、画像２００２および画像２００６には、枠が設けられている。例えば、データ解析部１０４は、ドキュメントファイルのデータを解析し、かかる配置および画像のデザインが基本のパターンであるという解析結果を出力しうる。書換処理部１０６は、かかる解析結果に基づいて、上記基本のパターンとは異なるレイアウトやデザインを有するページ１２０２に対して、書換処理を行う。なお、画像に対する処理については、画像処理部１０５が行ってもよい。

　書換処理部１０６は、例えば、ページ１２０２に含まれる画像やテキスト等のオブジェクトを、ページ１２０１やページ１２０３と同様のレイアウトやデザインとなるように、その態様や配置を変更する処理を行う。図１１に示すように、書換処理部１０６により処理されたページ１２０２’の画像２００３’には、画像２００２、２００６と同様の枠が設けられたり、テキスト２００４’はページの左側に、画像２００３’はページの右側に配置を変更され得る。

　このように、書換処理部１０６により、複数のページから構成されるドキュメントファイルに対して統一的なデザインを簡単に編集することができる。すなわち、ドキュメントファイルをサーバ１０に読み込ませるだけで、簡単に統一的なレイアウトを有するドキュメントファイルに編集することができる。なお、書換処理部１０６は、ページごとの属性（例えば、目次等のページ、タイトルのページ、コンテンツのページ等）に応じて、そのページのレイアウトやデザインを自動的に編集してもよい。特に、ＰＤＦファイルのようなオブジェクトが埋め込まれたドキュメントファイルであっても、容易に所望の構成を有するドキュメントファイルを得ることができる。

　次に、本実施形態の第二の変形例について説明する。ここでは、画像処理部１０５が、ＰＳＤ形式のようなレイヤー構造を有するドキュメントファイルにおいて、レイヤーごとに処理を行い、その後ドキュメントファイルに処理されたレイヤーを含める例について説明する。

　ドキュメントファイルがレイヤー構造を有する画像に関するファイルである場合、例えば、オブジェクト特定部１０２は、抽出して処理すべきレイヤーを特定する。オブジェクト抽出部１０３は、特定されたレイヤーを抽出する。画像処理部１０５は、抽出されたレイヤーに対して処理を行う。ここでの処理は、上述したような種々の画像処理や画像生成処理、画像修正処理等が含まれる。そして書換処理部１０６は、処理されたレイヤーをドキュメントに含める処理を行う。

　例えば、元のドキュメントファイルに複数のレイヤーが含まれている場合は、画像処理部１０５は、複数のレイヤーのそれぞれに含まれる情報に基づく画像処理を、一以上のレイヤーに対して行ってもよい。各レイヤーに対する処理は、同一の処理であってもよいし、相異なる処理であってもよい。また、元のドキュメントファイルがレイヤー構造を有しないファイル形式である場合は、画像処理部１０５により、複数のレイヤーに分割され、書換処理部１０６が複数のレイヤー構造を有するファイル形式として書き出す処理をしてもよい。なお、書換処理部１０６は、レイヤーの態様や配置を変更する処理を行いうる。例えば、書換処理部１０６は、レイヤー間の階層関係（配置）を変更する処理を行ってもよい。

　このように、本変形例における画像処理部１０５は、ドキュメントファイルにおける物理的な配置や調整等の処理を行うだけではなく、レイヤー構造における重なりの関係を調整する等、レイヤー構造そのものの配置や調整に関する処理を行いうる。これにより、レイヤー構造を有するドキュメントファイルにおいても、容易に所望の態様を有するドキュメントファイルを得ることができる。

　本開示の実施形態は、例えば、上記で説明したような電子機器、システム、電子機器またはシステムで実行される方法、電子機器を機能させるためのプログラム、およびプログラムが記録された一時的でない有形の媒体を含みうる。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　例えば、上記実施形態においては、システム１は、サーバ１０とユーザ端末２０とにより構成されていたが、本技術はかかる例に限定されない。例えば他の実施形態では、システム１は、同一の端末であってもよいし、異なる端末により実現されていてもよい。具体的には、システム１は、ユーザ端末２０のみにより構成されてもよい。この場合、サーバ１０が有している機能がユーザ端末２０の備える各種ハードウェアにより実現されてもよい。

　また、上記実施形態における各ステップは、必ずしもフローチャート図として記載された順序に沿って時系列に処理される必要はない。例えば、上記実施形態の処理における各ステップは、フローチャート図として記載した順序と異なる順序で処理されても、並列的に処理されてもよい。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、以下のような構成も本開示の技術的範囲に属する。
（項目１）
　ドキュメントファイルの処理に関する方法であって、
　プロセッサが、
　オブジェクトを含むドキュメントファイルのデータから前記オブジェクトを抽出することと、
　抽出された前記オブジェクトに対して画像に関する処理を行うことと、
　前記処理されて得られる処理後画像を、ドキュメントファイルに含める処理を行うことと、
　前記処理後画像を含む前記ドキュメントファイルのデータを出力することと、
　を含む方法。
（項目２）
　前記プロセッサが、前記処理された処理後画像を、元の前記ドキュメントファイルに含まれる前記オブジェクトに代えて前記ドキュメントファイルに含める処理を行う、項目１に記載の方法。
（項目３）
　前記抽出されるオブジェクトは、前記ドキュメントファイルに対するユーザによる入力に基づいて特定される、項目１または２に記載の方法。
（項目４）
　前記ユーザによる入力に基づく選択の前に、予め前記ドキュメントファイルに含まれる前記オブジェクトに対して機械学習に基づく処理を行い、処理後オブジェクトから前記オブジェクトの抽出の選択を行う、項目３に記載の方法。
（項目５）
　前記抽出されるオブジェクトは、前記ドキュメントファイルのデータを解析することにより特定される、項目１～４のいずれか１項に記載の方法。
（項目６）
　前記抽出されるオブジェクトは画像を含む、項目１～５のいずれか１項に記載の方法。
（項目７）
　前記抽出される画像は、前記ドキュメントファイルに含まれる画像の解像度に基づく解析により特定される、項目６に記載の方法。
（項目８）
　前記抽出される画像は、前記ドキュメントファイルに含まれる画像の画質に関するパラメータに基づき特定される、項目６に記載の方法。
（項目９）
　前記抽出される画像に対する処理は、超解像処理、高解像度処理、スタイル変換処理、ボケ除去処理、着彩処理、色調補正処理、ＨＤＲ化処理、画像から三次元モデルを生成する処理、画像から生成した三次元モデルにおける他の視点に基づく画像を生成する処理、画像に含まれる環境に関する情報を変更する処理、軽量化処理、欠損補完処理、オブジェクト除去処理、他の画像へのクロップ処理の少なくともいずれかを含む、項目６～８のいずれか１項に記載の方法。
（項目１０）
　前記抽出されるオブジェクトは、前記ドキュメントファイルに含まれるテキストを含み、
　前記抽出されるオブジェクトに対して行う処理は、前記テキストの情報に基づく画像生成処理または前記テキストの情報に基づく画像修正処理を含む、項目１～９のいずれか１項に記載の方法。
（項目１１）
　前記ドキュメントファイルが複数の同一のオブジェクトを含む場合に、前記オブジェクトのうち少なくとも一のオブジェクトに対して前記処理を行い、
　前記複数の同一のオブジェクトの各々に対応するように、前記処理後画像をそれぞれ前記ドキュメントファイルに含める処理を行う、項目１～１０のいずれか１項に記載の方法。
（項目１２）
　前記処理後画像を、前記ドキュメントファイルにおいて前記オブジェクトが配置されていた場所とは異なる位置に配置することを含む、項目１～１１のいずれか１項に記載の方法。
（項目１３）
　前記オブジェクトの態様および配置の少なくともいずれかを変更する処理を行うことをさらに含む、項目１～１１のいずれか１項に記載の方法。
（項目１４）
　前記ドキュメントファイルは、複数のページにより構成され、
　前記複数のページのそれぞれに含まれる前記オブジェクトの少なくともいずれかに基づいて、前記オブジェクトの少なくともいずれかの態様および配置の少なくともいずれかを変更する処理を行う、項目１３に記載の方法。
（項目１５）
　前記処理された処理後画像に対するユーザの入力に基づいて、前記処理後画像の態様および配置を変更する処理を行うことをさらに含む、項目１～１４のいずれか１項に記載の方法。
（項目１６）
　前記ドキュメントファイルはレイヤー構造を有し、
　レイヤーに対する画像に関する処理、並びに、前記レイヤーの態様および配置を変更する処理の少なくともいずれかを行う、項目１～１５のいずれか１項に記載の方法。
（項目１７）
　前記処理は、複数のサーバによる分散処理により実行される、項目１～１６のいずれか１項に記載の方法。
（項目１８）
　前記ドキュメントファイルは、ＰＤＦ（Portable　Document　File）形式、ＰＳＤ形式、ＡＩ（Adobe　Illustrator）形式、Word形式、Excel形式、Powerpoint形式およびindesign形式の少なくともいずれかを含む、項目１～１７のいずれか１項に記載の方法。
（項目１９）
　ドキュメントファイルの処理を行うための情報処理装置であって、
　オブジェクトを含むドキュメントファイルのデータから前記オブジェクトを抽出するオブジェクト抽出部と、
　抽出された前記オブジェクトに対して画像に関する処理を行う画像処理部と、
　前記処理されて得られる処理後画像を、前記ドキュメントファイルに含める書換処理部部と、
　前記処理後画像を含む前記ドキュメントファイルのデータを出力する出力制御部と、
　を備える情報処理装置。
（項目２０）
　コンピュータに、ドキュメントファイルの処理を行わせるためのプログラムであって、
　前記コンピュータを、
　オブジェクトを含むドキュメントファイルのデータから前記オブジェクトを抽出するオブジェクト抽出部と、
　抽出された前記オブジェクトに対して画像に関する処理を行う画像処理部と、
　前記処理されて得られる処理後画像を、前記ドキュメントファイルに含める書換処理部と、
　前記処理後画像を含む前記ドキュメントファイルのデータを出力する出力制御部と、
　として機能させるプログラム。

　　１　　　システム
　　１０　　サーバ
　　１１　　制御部
　　２０　　ユーザ端末
　　１０１　取得部
　　１０２　オブジェクト特定部
　　１０３　オブジェクト抽出部
　　１０４　データ解析部
　　１０５　画像処理部
　　１０６　書換処理部
　　１０７　出力制御部

Claims

　ドキュメントファイルの処理に関する方法であって、
　プロセッサが、
　オブジェクトを含むドキュメントファイルのデータから前記オブジェクトを抽出することと、
　抽出された前記オブジェクトに対して画像に関する処理を行うことと、
　前記処理されて得られる処理後画像を、ドキュメントファイルに含める処理を行うことと、
　前記処理後画像を含む前記ドキュメントファイルのデータを出力することと、
　を含む方法。
　前記プロセッサが、前記処理された処理後画像を、元の前記ドキュメントファイルに含まれる前記オブジェクトに代えて前記ドキュメントファイルに含める処理を行う、請求項１に記載の方法。
　前記抽出されるオブジェクトは、前記ドキュメントファイルに対するユーザによる入力に基づいて特定される、請求項１または２に記載の方法。
　前記ユーザによる入力に基づく選択の前に、予め前記ドキュメントファイルに含まれる前記オブジェクトに対して機械学習に基づく処理を行い、処理後オブジェクトから前記オブジェクトの抽出の選択を行う、請求項３に記載の方法。
　前記抽出されるオブジェクトは、前記ドキュメントファイルのデータを解析することにより特定される、請求項１～４のいずれか１項に記載の方法。
　前記抽出されるオブジェクトは画像を含む、請求項１～５のいずれか１項に記載の方法。
　前記抽出される画像は、前記ドキュメントファイルに含まれる画像の解像度に基づく解析により特定される、請求項６に記載の方法。
　前記抽出される画像は、前記ドキュメントファイルに含まれる画像の画質に関するパラメータに基づき特定される、請求項６に記載の方法。
　前記抽出される画像に対する処理は、超解像処理、高解像度処理、スタイル変換処理、ボケ除去処理、着彩処理、色調補正処理、ＨＤＲ化処理、画像から三次元モデルを生成する処理、画像から生成した三次元モデルにおける他の視点に基づく画像を生成する処理、画像に含まれる環境に関する情報を変更する処理、軽量化処理、欠損補完処理、オブジェクト除去処理、他の画像へのクロップ処理の少なくともいずれかを含む、請求項６～８のいずれか１項に記載の方法。
　前記抽出されるオブジェクトは、前記ドキュメントファイルに含まれるテキストを含み、
　前記抽出されるオブジェクトに対して行う処理は、前記テキストの情報に基づく画像生成処理または前記テキストの情報に基づく画像修正処理を含む、請求項１～９のいずれか１項に記載の方法。
　前記ドキュメントファイルが複数の同一のオブジェクトを含む場合に、前記オブジェクトのうち少なくとも一のオブジェクトに対して前記処理を行い、
　前記複数の同一のオブジェクトの各々に対応するように、前記処理後画像をそれぞれ前記ドキュメントファイルに含める処理を行う、請求項１～１０のいずれか１項に記載の方法。
　前記処理後画像を、前記ドキュメントファイルにおいて前記オブジェクトが配置されていた場所とは異なる位置に配置することを含む、請求項１～１１のいずれか１項に記載の方法。
　前記オブジェクトの態様および配置の少なくともいずれかを変更する処理を行うことをさらに含む、請求項１～１１のいずれか１項に記載の方法。
　前記ドキュメントファイルは、複数のページにより構成され、
　前記複数のページのそれぞれに含まれる前記オブジェクトの少なくともいずれかに基づいて、前記オブジェクトの少なくともいずれかの態様および配置の少なくともいずれかを変更する処理を行う、請求項１３に記載の方法。
　前記処理された処理後画像に対するユーザの入力に基づいて、前記処理後画像の態様および配置を変更する処理を行うことをさらに含む、請求項１～１４のいずれか１項に記載の方法。
　前記ドキュメントファイルはレイヤー構造を有し、
　レイヤーに対する画像に関する処理、並びに、前記レイヤーの態様および配置を変更する処理の少なくともいずれかを行う、請求項１～１５のいずれか１項に記載の方法。
　前記処理は、複数のサーバによる分散処理により実行される、請求項１～１６のいずれか１項に記載の方法。
　前記ドキュメントファイルは、ＰＤＦ（Portable　Document　File）形式、ＰＳＤ形式、ＡＩ（Adobe　Illustrator）形式、Word形式、Excel形式、Powerpoint形式およびindesign形式の少なくともいずれかを含む、請求項１～１７のいずれか１項に記載の方法。
　ドキュメントファイルの処理を行うための情報処理装置であって、
　オブジェクトを含むドキュメントファイルのデータから前記オブジェクトを抽出するオブジェクト抽出部と、
　抽出された前記オブジェクトに対して画像に関する処理を行う画像処理部と、
　前記処理されて得られる処理後画像を、前記ドキュメントファイルに含める書換処理部部と、
　前記処理後画像を含む前記ドキュメントファイルのデータを出力する出力制御部と、
　を備える情報処理装置。
　コンピュータに、ドキュメントファイルの処理を行わせるためのプログラムであって、
　前記コンピュータを、
　オブジェクトを含むドキュメントファイルのデータから前記オブジェクトを抽出するオブジェクト抽出部と、
　抽出された前記オブジェクトに対して画像に関する処理を行う画像処理部と、
　前記処理されて得られる処理後画像を、前記ドキュメントファイルに含める書換処理部と、
　前記処理後画像を含む前記ドキュメントファイルのデータを出力する出力制御部と、
　として機能させるプログラム。