JP2021141497A - 画像処理システム - Google Patents

画像処理システム Download PDF

Info

Publication number
JP2021141497A
JP2021141497A JP2020039057A JP2020039057A JP2021141497A JP 2021141497 A JP2021141497 A JP 2021141497A JP 2020039057 A JP2020039057 A JP 2020039057A JP 2020039057 A JP2020039057 A JP 2020039057A JP 2021141497 A JP2021141497 A JP 2021141497A
Authority
JP
Japan
Prior art keywords
document data
input
unit
image
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020039057A
Other languages
English (en)
Inventor
龍太 土井
Ryuta Doi
龍太 土井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2020039057A priority Critical patent/JP2021141497A/ja
Publication of JP2021141497A publication Critical patent/JP2021141497A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】入力文書データに入力画像データが合成された合成文書データにおいて、合成文書データにおける画像レイアウト領域の情報が修正される画像処理装置を提供する。【解決手段】文書データ比較部218は、入力文書データXと教師文書データX´とを比較する。文書データ抽出部220は、入力文書データXと類似する教師文書データX´を抽出する。解析部224は、入力文書データX中の画像レイアウト領域10を解析する。合成部226は、文書データラベルを付与された入力文書データXの画像レイアウト領域10に、入力画像データAを合成して合成文書データ20を生成する。レイアウト修正部228は、ユーザーの指示により、画像レイアウト領域10を修正する。情報修正部230は、合成文書データ20における画像レイアウト領域10の情報を修正する。【選択図】図2

Description

本発明は、画像処理システムに関する。
特許文献1は、背景となる写真画像と前景となる文字原稿(人物写真)をソフトウェア上に読み込み、写真画像と文字原稿(人物写真)の合成を実行し、合成具合を調整し、合成結果をプリントアウトする、自動画像合成装置、自動画像合成方法、およびそのプログラムを開示する。
特開2003−271947号公報
しかしながら、特許文献1に記載された自動画像合成装置は、前景となる文字原稿(人物写真)に、その文字原稿の種類や属性の情報が付与されていない。そのため、自動画像合成装置は、背景となる写真画像のどの位置に、前景となる文字原稿を合成すればよいかの情報を有さない。従って、ユーザーは、写真画像に文字原稿が合成された結果を見ながら、文字原稿の位置を調整しなければならないという課題がある。
本発明は、上記課題に鑑みてなされたものであり、入力画像データが入力文書データの好適な位置に合成されて、合成文書データが生成されることにより、ユーザーの労力を軽減できる画像処理システムを提供することを目的とする。
本発明の一局面によれば、画像処理システムは、取得部と、比較部と、画像データラベル付与部と、合成部とを備える。前記取得部は、入力画像データを取得し、および、入力文書データを取得する。前記画像データ比較部は、前記入力画像データと教師画像データとを比較する。前記画像データラベル付与部は、前記入力画像データと類似する前記教師画像データに付随していた画像データラベルを、前記入力画像データに付与する。前記合成部は、前記画像データラベルに基づいて、前記入力画像データを前記入力文書データに合成して、合成文書データを生成する。
本発明によれば、入力画像データが入力文書データの好適な位置に合成されて、合成文書データ生成されることにより、ユーザーの労力を軽減できる画像処理システムを提供することができる。
本発明の実施形態に係る画像処理システムを示す図である。 本実施形態に係る画像処理システム、および、画像処理システムに含まれる複合機の機能ブロック図である。 実施形態1に係る画像処理システムの画像処理を示す図である。 実施形態1に係る画像処理システムの画像処理を示す図である。 実施形態2に係る画像処理システムの画像処理を示す図である。 実施形態2に係る画像処理システムの画像処理を示す図である。 実施形態3に係る画像処理システムの画像処理を示す図である。 実施形態3に係る画像処理システムの画像処理を示す図である。 本実施形態に係る画像処理システムの処理を示すフローチャートである。 本実施形態に係る画像処理システムの処理を示すフローチャートである。
(実施形態1)
以下、本発明の実施形態について、図面を参照しながら説明する。なお、図中、同一または相当部分については同一の参照符号を付して説明を繰り返さない。
図1を参照して、本発明の実施形態に係る画像処理システム1について説明する。図1は、本実施形態に係る画像処理システム1を示す図である。なお、図1で説明される本実施形態は、本発明のすべての実施形態に適用され得る。
図1に示すように、画像処理システム1は、画像処理装置100と、複合機300と、サーバー310と、クラウド320とを備える。
画像処理装置100は、一例として、デスクトップパソコン、携帯電話、スマートフォン、タブレットである。
複合機300は、一例として、画像形成装置、MFP(Multi Function Printer)、ファクシミリ、または、スキャナーである。
サーバー310は、ユーザーからの要求に対して情報や処理結果を提供する機能を果たすコンピューターである。
クラウド320は、インターネットを介して、ユーザーにコンピューター資源を提供するサービスである。クラウド320の一例は、SaaS(Software as a Service)、PaaS(Platform as a Service)、IaaS(Infrastructure as a Service)である。
画像処理装置100と、複合機300と、サーバー310と、クラウド320とは、回線Lで互いに接続されている。回線Lは、例えば、LAN(Local Area Network)、WAN(Wide Area Network)である。回線Lは、無線回線または有線回線のいずれかに限定されない。
次に、引き続き、図1に加え、図2を参照して、画像処理システム1に含まれる画像処理装置100、および、複合機300における画像処理を説明する。図2は、本実施形態に係る画像処理装置100、および、画像処理装置100に接続される複合機300の機能ブロック図である。なお、図2で説明される本実施形態は、本発明のすべての実施形態に適用され得る。
以下、これらの構成要素を、情報が処理される順に説明する。
図2に示すように、画像処理システム1は、画像処理装置100と、複合機300とを備える。
複合機300は、読取部302を含む。読取部302は、図示しない原稿搬送装置によって搬送される原稿から画像を読み取る。読取部302は、読み取った画像から画像データを生成する。読取部302は、CIS(Contact Image Sensor)方式またはCCD(Charge Coupled Devices)方式のスキャナーである。読取部302の動作は後述する。
画像処理装置100は、制御部200と、画像データ記憶部110と、文書データ記憶部120と、表示部130と、受信部140とを備える。
画像処理装置100の制御部200と、画像データ記憶部110と、文書データ記憶部120とは、それぞれ、サーバー310、または、クラウド320に配置されてもよい。その場合、「画像処理装置100」は、サーバー310、または、クラウド320に置換され得る。当該事項は、本願のすべての実施形態に適用され得る。
制御部200は、画像処理装置100の各部の動作を制御する。具体的には、CPU(Central Processing Unit)のようなプロセッサーを含む。そして、制御部200のプロセッサーは、図示しない記憶装置に記憶されたコンピュータープログラムを実行することによって、画像処理装置100の各部の動作を制御する。記憶装置は、サーバー310、または、クラウド320に配置されてもよい。当該事項は、本願のすべての実施形態に適用され得る。
画像データ記憶部110は、教師画像データA´(図3)を記憶する。教師画像データA´は、例えば、過去に取得した画像データの集合である。
例えば、教師画像データA´が、ハワイの画像である場合、「海」、「ハワイ」などを示す画像データラベルと紐付けられる。画像データ記憶部110は、教師画像データA´を画像データラベルと紐付けて記憶してもよい。
画像データ記憶部110は、半導体メモリーのような主記憶装置と、半導体メモリーおよび/またはハードディスクドライブのような補助記憶装置とを含む。画像データ記憶部110は、リムーバブルメディアを含んでいてもよい。
文書データ記憶部120は、教師文書データX´を記憶する。教師文書データX´は、例えば、過去に取得した文書データの集合である。教師文書データX´は、入力画像データAが合成される画像レイアウト領域10、その他の文書情報を示す文書データラベルが付随してもよい。例えば、教師文書データX´が、ハワイ旅行のパンフレットである場合、「海」、「ハワイ」などのキーワードの他、画像レイアウト領域10のデータを示す文書データラベルと紐付けられる。
文書データ記憶部120は、教師文書データX´を文書データラベルと紐付けて記憶してもよい。文書データ記憶部120の構成は、画像データ記憶部110の構成と同様であってもよい。
表示部130は、ユーザーに情報を表示し、または、ユーザーが入力した情報を制御部200に出力する。表示部130は、ディスプレーを含む。表示部130は、例えば、LCD(Liquid Crystal Display)のようなディスプレーであり、種々の画像を表示する。
また、ディスプレーは、タッチパネル機能を有しており、タッチセンサーを含む。タッチパネル機能を有するディスプレーは、入力部の一部を構成する。入力部は、情報を入力可能な複数のハードウェアボタンを含む。
受信部140は、画像データの入力指示を受信する。具体的には、ユーザーが、画像処理装置100から入力指示を出してもよい。受信部140の一例は、コーデック(CODEC:CODER/DECODER)である。
受信部140は、サーバー310、または、クラウド320から画像データの入力指示を受けてもよい。当該事項は、本願のすべての実施形態において適用され得る。なお、受信部140は、必須の構成要素ではない。
制御部200は、判別部204と、取得部206と、画像データ比較部208と、画像データ抽出部210と、画像データラベル付与部212と、画像データ更新部214と、変形部216と、文書データ比較部218と、文書データ抽出部220と、文書データラベル付与部222と、解析部224と、合成部226と、レイアウト修正部228と、情報修正部230と、文書データ更新部232とを含む。
制御部200の上記各構成要素は、具体的には、ASIC(Application Specific Integrated Circuit)などで実現される。
(画像入力)
制御部200の判別部204は、受信部140が受信した入力指示が、画像入力か、文書入力かを判別する。画像入力は、例えば、写真などの画像を入力することである。ここでは、判別部204は、画像入力の入力指示を受信部140が受信したことを判別する。判別部204は、必須の構成要素ではない。画像入力と、文書入力とは、判別されずに独立して行うことが可能である。
複合機300(図1)の読取部302は、画像入力と判別された場合に、入力画像を読み取り、文書入力と判別された場合に、入力文書を読み取る。すなわち、読取部302は、受信部140が受信した入力指示が、画像入力と判別された場合に、入力画像を読み取る。読取部302は、受信部140が受信した入力指示が、文書入力と判別された場合に、入力文書を読み取る。ここでは、読取部302は、入力画像を読み取って、入力画像データAを生成する。
制御部200の取得部206は、入力画像データAを取得し、および、入力文書データXを取得する。受信部202が、サーバー310、または、クラウド320から画像データの入力指示を受信した場合、取得部206は、サーバー310、または、クラウド320から入力画像データAを取得し、および、入力文書データXを取得する。
制御部200の取得部206は、判別部204において画像入力と判別された場合に、入力画像データAを取得してもよい。取得部206は、判別部204において文書入力と判別された場合に、入力文書データXを取得してもよい。
本実施形態によれば、取得部206は、画像入力と判別された場合に、写真などを読み取って、入力画像データAを取得できる。
制御部200の画像データ比較部208は、入力画像データAと教師画像データA´とを比較する。すなわち、画像データ比較部208は、読取部302または取得部206が取得した入力画像データAと、画像データ記憶部110に記憶されている教師画像データA´とを比較する。
画像データ比較部208は、例えば、入力画像データAの画素配列と、教師画像データA´の画素配列とを比較する。画像データ比較部208は、例えば、入力画像データAの画素配列に基づく構図と、教師画像データA´の画素配列に基づく構図とを比較してもよい。
画像データ比較部208は、例えば、入力画像データAの画素配列に基づく構図から、入力画像データAは、「ハワイ」であると判定する。画像データ比較部208は、「ハワイ」のグループ、または、「ハワイ」の画像データラベルが付随した教師画像データA´と、入力画像データAとを比較してもよい。
画像データ比較部208は、入力画像データAと、教師画像データA´とを比較した結果、入力画像データAと類似する、一つまたは複数の教師画像データA´を選定する。
画像データ比較部208は、入力画像データAと教師画像データA´とが類似しているか否かを示す画像類似情報を出力する。
制御部200の画像データ抽出部210は、入力画像データAと類似する教師画像データA´を、画像データ記憶部110から抽出する。画像データ抽出部210は、画像データ比較部208の比較結果に基づいて、入力画像データAと類似する教師画像データA´を、画像データ記憶部110から少なくとも1つ抽出する。
画像データ抽出部210は、必須構成要素ではない。入力画像データAと類似する教師画像データA´は、画像データ記憶部110から抽出されなくてもよい。
制御部200の画像データラベル付与部212は、入力画像データAと類似する教師画像データA´に付随していた画像データラベルを、入力画像データAに付与する。
具体的には、画像データ抽出部210が抽出した教師画像データA´に付随する画像データラベルに、「ハワイ」と記載されていた場合、画像データラベル付与部212は、入力画像データAに、「ハワイ」と記載した画像データラベルを付与する。
また、画像データラベルに、画像レイアウト領域10の情報が記載されていた場合、画像データラベル付与部212は、入力画像データAに、画像レイアウト領域10が記載された画像データラベルを付与する。
制御部200の画像データ更新部214は、画像データ記憶部110に、画像データラベルを付与された入力画像データAを追加する。入力画像データAは、画像データ記憶部110に教師画像データA´として記憶される。入力画像データAは、画像データラベルに基づいて分類されて、画像データ記憶部110に記憶されてもよい。
制御部200の変形部216は、入力画像データAのサイズを変形する。変形部216については、後述する。
(文書入力)
次に、受信部140は、文書データの入力指示を受信する。
制御部200の判別部204は、文書入力の入力指示を受信部140が受信したことを判別する。文書入力は、例えば、文字が記載された文書の画像を入力することである。入力文書は、少なくとも文字が記載されていればよく、写真などの画像が記載されている必要はない。
また、入力文書は、画像レイアウト領域10を有している必要はない。判別部204は、必須の構成要素ではない。画像入力と、文書入力とは、判別されずに独立して行うことが可能である。
複合機300(図1)の読取部302は、文書入力と判別された場合に、入力文書を読み取り、入力文書データXを生成する。すなわち、読取部302は、受信部140が受信した入力指示が、文書入力と判別された場合に、入力文書を読み取る。
制御部200の取得部206は、入力文書データXを取得する。受信部202が、サーバー310、または、クラウド320から文書データの入力指示を受信した場合、取得部206は、サーバー310、または、クラウド320から入力文書データXを取得する。
制御部200の取得部206は、判別部204において文書入力と判別された場合に、入力文書データXを取得してもよい。
本実施形態によれば、取得部206は、文書入力と判別された場合に、文章を読み取って、入力文書データXを取得できる。
制御部200の文書データ比較部218は、入力文書データXと教師文書データX´とを比較する。すなわち、文書データ比較部218は、読取部302または取得部206が取得した入力文書データXと、文書データ記憶部120に記憶されている教師文書データX´とを比較する。
文書データ比較部218は、例えば、入力文書データXの画素配列と、教師文書データX´の画素配列とを比較する。文書データ比較部218は、例えば、入力文書データXの画素配列に基づく構図と、教師文書データX´の画素配列に基づく構図とを比較してもよい。
文書データ比較部218は、例えば、入力文書データXの画素配列に基づく構図から、入力文書データXは、「ハワイ旅行のパンフレット」であると判定する。文書データ比較部218は、「ハワイ旅行のパンフレット」のグループ、または、「ハワイ旅行のパンフレット」の文書データラベルが付随した教師文書データX´と、入力文書データXとを比較してもよい。
文書データ比較部218は、例えば、入力文書データXの文字データから、入力文書データXは、「ハワイ旅行のパンフレット」であると判定してもよい。
制御部200の文書データ抽出部220は、入力文書データXと類似する教師文書データX´を文書データ記憶部120から抽出する。文書データ抽出部220は、文書データ比較部218の比較結果に基づいて、入力文書データXと類似する教師文書データX´を、少なくとも1つ抽出する。文書データ抽出部220は、画像データ比較部208の比較結果に基づいて、入力文書データXと最も似ている教師文書データX´を、少なくとも1つ抽出してもよい。
文書データ抽出部220は、必須構成要素ではない。入力文書データXと類似する教師文書データX´は、文書データ記憶部120から抽出されなくてもよい。
制御部200の文書データラベル付与部222は、入力文書データXと類似する教師文書データX´に付随していた文書データラベルを、入力文書データXに付与する。
具体的には、文書データ抽出部220が抽出した教師文書データX´に付随する文書データラベルに、「ハワイ」と記載されていた場合、文書データラベル付与部222は、入力文書データXに、「ハワイ」と記載した文書データラベルを付与する。
また、文書データラベルに、画像レイアウト領域10の情報が記載されていた場合、文書データラベル付与部222は、入力文書データXに、画像レイアウト領域10が記載された文書データラベルを付与する。
先述した、表示部130は、入力文書データXを表示する。例えば、入力文書データXが「ハワイ旅行のパンフレット」である場合、表示部130は、「ハワイ旅行のパンフレット」を、図示しないディスプレーに表示する。
制御部200の解析部224は、入力文書データX中の画像レイアウト領域10を解析する。具体的には、解析部224は、教師文書データX´に付与されていた文書データラベルの内容に基づいて、入力文書データXに配置する画像レイアウト領域10の位置(座標)、大きさ、形状を解析する。
例えば、文書データラベルが「ハワイ」である場合、解析部224は、入力文書データXにおいて、「ハワイ」の文字が多く集まった位置、旅行日程が記載された位置、パンフレットの表題の位置などに画像レイアウト領域10を配置する。
また、解析部224は、教師文書データX´に配置されていた画像レイアウト領域10の位置(座標)、大きさ、形状に基づいて、入力文書データXに配置する画像レイアウト領域10の位置(座標)、大きさ、形状を解析してもよい。
解析部224は、教師文書データX´に配置されていた画像レイアウト領域10の位置に基づいて、入力文書データXに配置する画像レイアウト領域10の位置を解析してもよい。
先述した、制御部200の変形部216は、入力画像データAのサイズを変形する。具体的には、ユーザーは、表示部130のディスプレーに表示された「ハワイのパンフレット」の画像を目視して、「ハワイのパンフレット」における画像レイアウト領域10の位置、大きさ、形状を観察しながら、入力画像データAの形状を修正する。
本実施形態によれば、ユーザーは、画像処理装置100のマウスなどを操作し、表示部130のディスプレーに表示された、教師文書データX´である、「ハワイのパンフレット」における画像レイアウト領域10と、入力画像データAを見比べながら、入力画像を「ハワイのパンフレット」の画像レイアウト領域10に合成できるように、入力画像データAの形状を修正することができる。
制御部200の合成部226は、画像データラベルに基づいて、画像レイアウト領域10に、入力画像データAを合成して合成文書データ20(図6)を生成する。すなわち、合成部226は、ユーザーにより形状等が修正された入力画像データAを、「ハワイのパンフレット」における画像レイアウト領域10に合成し、合成文書データ20を生成する。
合成部226は、文書データラベルを付与された入力文書データXの画像レイアウト領域10に、入力画像データAを合成して合成文書データ20を生成してもよい。すなわち、入力文書データXに文書データラベルが付与されていた場合、文書データラベルに記載された画像レイアウト領域10の情報に基づいて、入力画像データAを合成して合成文書データ20を生成してもよい。
表示部130は、合成文書データ20を表示する。
制御部200のレイアウト修正部228は、ユーザーの指示により、画像レイアウト領域10を修正する。例えば、ユーザーは、画像処理装置100のマウスなどのインターフェースを用いて、表示部130に表示された合成文書データ20における画像レイアウト領域10の位置を修正することができる。
制御部200の情報修正部230は、画像レイアウト領域10の修正情報を文書データラベルに追加し、または、文書データラベルの修正情報をさらに修正する。情報修正部230は、例えば、合成文書データ20に付随する文書データラベルを修正する。具体的には、情報修正部230は、合成文書データ20に付随する文書データラベル「ハワイ」に加えて、修正情報の文書データラベルを付随させる。
つまり、合成文書データ20には、文字「ハワイ」の文書データラベル、および、修正情報の文書データラベルが付随する。
情報修正部230は、画像レイアウト領域10の修正前の座標情報と、修正後の座標情報とを、修正情報の文書データラベルとし、合成文書データ20に付随させてもよい。
制御部200の文書データ更新部232は、文書データ記憶部120に、文書データラベルを付与し、または、文書データラベルが修正された合成文書データ20を追加する。つまり、レイアウト修正部228により画像レイアウト領域10が修正された合成文書データ20が、文書データ記憶部120に多数記憶される。
制御部200の文書データ比較部218は、文書データ記憶部120に記憶される合成文書データ20の数が増えるに従って、入力文書データXに設定される画像レイアウト領域10の位置を学習する。
本実施形態によれば、文書データ比較部218は、入力文書データXに設定する画像レイアウト領域10の位置を学習する。そのため、ユーザーは、合成文書データ20の画像レイアウト領域10の位置を修正する負担が減少する。
(実施形態1)
次に、図1および図2に加え、図3および図4を参照して、実施形態1に係る画像処理システム1の具体的な画像処理を説明する。図3および図4は、実施形態1に係る画像処理システム1の画像処理を示す図である。
実施形態1では、画像処理システム1は、入力画像データAを取得し、および、入力文書データXを取得する取得部206と、入力画像データAと教師画像データA´とを比較する画像データ比較部208と、入力画像データAと類似する教師画像データA´に付随していた画像データラベルを、入力画像データAに付与する画像データラベル付与部212と、画像データラベルに基づいて、入力画像データAを入力文書データXに合成して、合成文書データ20を生成する合成部226とを備える。
実施形態1では、画像処理システム1は、さらに、入力画像を読み取って入力画像データAを出力し、入力文書を読み取って入力文書データXを出力する読取部302と、教師画像データA´を記憶する画像データ記憶部110とを備える。
図1に示すように、例えば、ユーザーは、画像処理装置100を用いて、複合機300に写真を読み取る指示を入力する。受信部140は、ユーザーの入力指示を受信する。図1に示すように、ユーザーが画像処理装置100を用いて写真を読み取る指示を入力すると、サーバー310、または、クラウド320に配置された受信部140が、複合機300に写真を読み取る指示を受信してもよい。
制御部200の判別部204は、受信部140が受信した入力指示が、画像入力か、文書入力かを判別する。ここでは、判別部204は、画像入力の入力指示を受信部140が受信したことを判別する。複合機300(図1)の読取部302は、入力画像を読み取って、画像データを生成する。判別部204は、必須の構成要素ではない。画像入力と、文書入力とは、判別されずに独立して行うことが可能である。
取得部206は、画像データに基づいて、入力画像データAを取得する。取得部206は、読取部302、および、判別部204を介さず、サーバー310、または、クラウド320、その他の外部から入力画像データAを取得してもよい。
画像データ記憶部110は、教師画像データA´を記憶する。図3に示すように、画像データ記憶部110は、例えば、教師画像データA´、教師画像データB、および教師画像データCを記憶している。以降、教師画像データA´、教師画像データB、および教師画像データCを区別して記載する必要がある場合を除き、教師画像データA´と記載する。
実施形態1において、画像データ記憶部110は、必須の構成要素ではない。教師画像データA´、教師画像データB、および教師画像データCは、外部の装置から取得されてもよく、画像データ記憶部110に記憶されることに限定されない。
教師画像データA´には、「ハワイ」を示す画像データラベルが付随している(紐付けられている)。教師画像データB、教師画像データCにも、それぞれ、画像データラベルが付随していてもよい。
教師画像データA´には、「ハワイ」を示す画像データラベルに加えて、後述する画像レイアウト領域10の修正情報を示す画像データラベルが付随してもよい。
図3に示すように、制御部200の画像データ比較部208は、入力画像データAと、教師画像データA´、教師画像データB、および教師画像データCとを比較する。具体的には、画像データ比較部208は、入力画像データAと、教師画像データA´、教師画像データB、および教師画像データCとの画素配列、構図等を比較する。
画像データ比較部208は、入力画像データAと、教師画像データA´、教師画像データB、および教師画像データCとが類似しているか否かを判定する。例えば、画像データ比較部208は、画素配列、構図、過去の比較実績などに基づいて、教師画像データA´が入力画像データAに類似していることを示す画像類似情報を出力する。
図3に示すように、制御部200の画像データ抽出部210は、画像類似情報に基づいて、画像データ記憶部110から教師画像データA´を抽出する。ただし、画像データ抽出部210による、画像データ記憶部110からの教師画像データA´の抽出は、省略され得る。
制御部200の画像データラベル付与部212は、入力画像データAに、入力画像データAと類似する教師画像データA´に付随していた画像データラベルと同じ画像データラベル「ハワイ」を付与する。
次に、図1に示すように、例えば、ユーザーは、画像処理装置100を用いて、複合機300に文書を読み取る指示を入力する。受信部140は、ユーザーの入力指示を受信する。図1に示すように、ユーザーが画像処理装置100を用いて文書を読み取る指示を入力すると、サーバー310、または、クラウド320に配置された受信部140が、複合機300に文書を読み取る指示を受信してもよい。
本実施形態によれば、ハワイ旅行などを説明する文章が記載されたパンフレットなどの入力文書と、入力文書に合成したいハワイなどの写真を入力画像として読み取ることで、入力画像データAと、入力文書データXとを取得することができる。
制御部200の判別部204は、受信部140が受信した入力指示が、画像入力か、文書入力かを判別する。ここでは、判別部204は、文書入力の入力指示を受信部140が受信したことを判別する。複合機300(図1)の読取部302は、入力文書を読み取って、画像データを生成する。
取得部206は、画像データに基づいて、入力文書データXを取得する。取得部206は、読取部302、および、判別部204を介さず、サーバー310、または、クラウド320、その他の外部から入力文書データXを取得してもよい。
制御部200の変形部216は、入力画像データAのサイズを変形する。具体的には、ユーザーは、入力文書データXにおいて、ユーザーの意図する位置に入力画像データAが合成されるよう、入力画像データAの形状を変形することを指示できる。変形部216は、ユーザーの指示に基づいて、入力画像データAの形状を変形させる。
また、入力文書データXが画像レイアウト領域10を有している場合、ユーザーは、画像処理装置100の表示部130に表示された入力画像データAと、入力文書データXの画像レイアウト領域10とに基づいて、入力画像データAが、入力文書データXの画像レイアウト領域10に合成されやすいよう、入力画像データAの形状を変形することを指示できる。
図4に示すように、制御部200の合成部226は、入力画像データAに付与された画像データラベル「ハワイ」に基づいて、入力文書データXの所定位置に、入力画像データAを合成して、合成文書データ20を生成する。
具体的には、合成部226は、入力画像データAに画像データラベル「ハワイ」が付与されていることから、入力文書データXにおいて、「ハワイ」の文字が集まっている位置に、入力画像データAを合成して、合成文書データ20を生成する。
本実施形態によれば、入力画像データAが入力文書データXの好適な位置に合成されて、合成文書データ20が生成されることにより、ユーザーの労力を軽減できる。
また、本実施形態によれば、画像データラベル付与部212が、入力画像データAと類似する教師画像データA´の画像データラベルと同じ画像データラベル「ハワイ」を、入力画像データAに付与するため、合成部226は、入力文書データXにおける「ハワイ」と関連する文字が多い位置に、入力画像データAを好適に合成することができる。
(実施形態2)
次に、図1〜図3に加え、図5および図6を参照して、実施形態2に係る画像処理システム1の具体的な画像処理を説明する。図5および図6は、実施形態2に係る画像処理システム1の画像処理を示す図である。
実施形態2では、実施形態1で説明した構成要素に加え、教師文書データX´を記憶する文書データ記憶部120と、入力文書データXと教師文書データX´とを比較する文書データ比較部218と、入力文書データXと類似する教師文書データX´に付随していた文書データラベルを、入力文書データXに付与する文書データラベル付与部222と、入力文書データX中の画像レイアウト領域10を解析する解析部224とを、さらに備え、合成部226は、文書データラベルを付与された入力文書データXの画像レイアウト領域10に、入力画像データAを合成して合成文書データ20を生成する。
実施形態2において、図1〜図3を参照して説明した、写真などの画像データの生成、および、処理に関わる、受信部140、判別部204、読取部302、取得部206、画像データ記憶部110、画像データ比較部208、画像データ抽出部210、画像データラベル付与部212、画像データ更新部214、および変形部216の構成、および動作は、実施形態1と同様であるので、重複する説明を省略する。
ユーザーは、画像処理装置100を用いて、複合機300に文書を読み取る指示を入力する。受信部140は、ユーザーの入力指示を受信する。
制御部200の判別部204は、文書入力の入力指示を受信部140が受信したことを判別する。複合機300(図1)の読取部302は、入力文書を読み取って、画像データを生成する。判別部204は、必須の構成要素ではない。画像入力は、判別されずに独立して行うことが可能である。
図5に示すように、取得部206は、画像データに基づいて、入力文書データXを取得する。取得部206は、読取部302、および、判別部204を介さず、サーバー310、または、クラウド320、その他の外部から入力文書データXを取得してもよい。
文書データ記憶部120は、教師文書データX´を記憶する。文書データ記憶部120は、例えば、教師文書データX´、教師文書データY、および教師文書データZを記憶している。以降、教師文書データX´、教師文書データY、および教師文書データZを区別して記載する必要がある場合を除き、教師文書データX´と記載する。
教師文書データX´には、「ハワイ」を示す文書データラベルが付随している(紐付けられている)。教師文書データY、教師文書データZにも、それぞれ、文書データラベルが付随していてもよい。
教師文書データX´には、「ハワイ」を示す文書データラベルに加えて、後述する画像レイアウト領域10の修正情報を示す文書データラベルが付随してもよい。
制御部200の文書データ比較部218は、入力文書データXと、教師文書データX´、教師文書データY、および教師文書データZとを比較する。文書データ比較部218は、入力文書データXと、教師文書データX´、教師文書データY、および教師文書データZとの画素配列、構図等を比較する。
文書データ比較部218は、入力文書データXと、教師文書データX´、教師文書データY、および教師文書データZとが類似しているか否かを判定する。文書データ比較部218は、画素配列、構図、過去の比較実績などに基づいて、教師文書データX´が入力文書データXに類似していることを示す文書類似情報を出力する。
制御部200の文書データ抽出部220は、文書類似情報に基づいて、文書データ記憶部120から教師文書データX´を抽出する。ただし、文書データ抽出部220による、文書データ記憶部120からの教師文書データX´の抽出は、省略され得る。
制御部200の文書データラベル付与部222は、入力文書データXに、教師文書データX´に付随していた文書データラベルと同じ、文書データラベル「ハワイ」を付与する。
図6に示すように、制御部200の解析部224は、入力文書データX中の画像レイアウト領域10を解析する。入力文書データXが画像レイアウト領域10を有している場合、解析部224は、教師文書データX´に付与されていた文書データラベルの内容に基づいて、入力文書データXに配置する画像レイアウト領域10の位置(座標)、大きさ、形状を解析する。
また、例えば、入力文書データXが画像レイアウト領域10を有しておらず、文書データラベルが「ハワイ」である場合、解析部224は、入力文書データXにおいて、「ハワイ」の文字が多く集まった位置、旅行日程が記載された位置、パンフレットの表題の位置など、画像レイアウト領域10を配置する。
制御部200の変形部216は、入力画像データAのサイズを変形する。具体的には、ユーザーは、画像処理装置100の表示部130に表示された入力画像データAと、入力文書データXの画像レイアウト領域10とに基づいて、入力画像データAが、入力文書データXの画像レイアウト領域10に合成されやすいよう、入力画像データAの形状を変形することを指示できる。変形部216は、ユーザーの指示に基づいて、入力画像データAの形状を変形させる。
図6に示すように、制御部200の合成部226は、文書データラベル「ハワイ」を付与された入力文書データXの画像レイアウト領域10に、入力画像データAを合成して、合成文書データ20を生成する。
本実施形態によれば、文書データラベル付与部222が、教師文書データX´に付随していた文書データラベルと同じ文書データラベル「ハワイ」を、入力文書データXに付与するため、合成部226は、入力文書データXにおける「ハワイ」と関連する文字が多い位置に、入力画像データAを好適に合成することができる。
また、本実施形態によれば、合成部226は、入力文書データXにおいて、文書データラベル「ハワイ」に関連して、旅行日程が記載された位置、パンフレットの表題の位置などに画像レイアウト領域10を配置でき、入力画像データAを好適に合成することができる。
(実施形態3)
次に、図1〜図6に加え、さらに、図7および図8を参照して、実施形態3に係る画像処理システム1の画像処理を説明する。
実施形態3では、実施形態1および実施形態2で説明した構成要素に加え、合成文書データ20を表示する表示部130と、ユーザーの指示により、画像レイアウト領域10を修正し、修正情報を出力するレイアウト修正部228と、修正情報を文書データラベルに追加し、または、文書データラベルの修正情報をさらに修正する情報修正部230と、文書データ記憶部120に、文書データラベルを付与し、または、文書データラベルが修正された合成文書データ20を追加する文書データ更新部232とをさらに備える。
実施形態3は、入力文書データXに入力画像データAを合成して生成された合成文書データ20の文書データラベルに、入力文書データXの画像レイアウト領域10の修正情報を追加して、文書データ記憶部120に合成文書データ20を追加する実施形態である。
また、すでに合成文書データ20に文書データラベルが付随している場合、文書データラベルの修正情報をさらに修正して、文書データ記憶部120に合成文書データ20を追加する実施形態である。
実施形態3において、実施形態1および実施形態2で説明した、写真および文書の読み取り、画像データの取得、および画像処理は、引き続き、実施形態3で適用されるので、重複する説明を省略する。
図2に示す表示部130は、合成文書データ20を表示する。ユーザーは、表示部130に表示された合成文書データ20を見ながら、合成文書データ20の画像レイアウト領域10が、ユーザーの意図に合った位置に配置されているか否かを確認することができる。
画像レイアウト領域10が、ユーザーの意図に合った位置に配置されていないと、ユーザーが判断した場合、ユーザーは、画像処理装置100のマウスなどのインターフェースを用いて、表示部130に表示された合成文書データ20における画像レイアウト領域10の位置を、ユーザーの意図に合った位置に修正できる。
具体的には、制御部200のレイアウト修正部228は、ユーザーの指示に従って、画像レイアウト領域10を修正する。
例えば、図7に示すように、ユーザーは、入力画像データAを、入力文書データXの最上段の表題「格安ハワイ旅行」の文字の次段に挿入したいという意図があったとする。
ユーザーは、表示部130に表示された合成文書データ20を見ながら、マウスなどのポインターで、入力画像データAを、合成文書データ20の表題「格安ハワイ旅行」の次段に移動させることができる。
レイアウト修正部228は、入力画像データAの位置を修正する。レイアウト修正部228は、入力画像データAの位置とともに、画像レイアウト領域10の位置も修正できる。
制御部200の合成部226は、改めて、入力画像データAを、合成文書データ20のユーザーが新しく指示した画像レイアウト領域10に合成する。加えて、合成部226は、合成文書データ20の画像レイアウト領域10の位置が修正されたことに基づいて、文書の文字列を修正することができる。
制御部200の情報修正部230は、合成文書データ20における画像レイアウト領域10の情報を修正する。具体的には、情報修正部230は、合成文書データ20が文書データラベルを有しない場合、合成文書データ20に修正情報の文書データラベルを付随させる。
合成文書データ20が、文書データラベル「ハワイ」を付随させている場合、情報修正部230は、合成文書データ20に付随する文書データラベル「ハワイ」に加えて、修正情報の文書データラベルを付随させる。
さらに、合成文書データ20が、文書データラベル「ハワイ」と、修正情報の文書データラベルとを付随させている場合、情報修正部230は、修正情報の文書データラベルをさらに追加するか、または、修正情報の文書ラベルを修正する。
文書データ更新部232は、文書データ記憶部120に、文書データラベル「ハワイ」と、修正情報の文書データラベルとを付与された合成文書データ20を追加して更新する。
図8に示すように、文書データ記憶部120には、教師文書データX´、教師文書データY、教師文書データZに加えて、文書データラベル「ハワイ」と、修正情報の文書データラベルとを付与された合成文書データ20が記憶される。
文書データ記憶部120は、画素配列や構図などからハワイの写真である入力画像データAが入力された場合、教師文書データX´よりも、さらに画像レイアウト領域10がユーザーの意図に沿った位置に配置された合成文書データ20を学習したことになる。
文書データ記憶部120は、文書データラベル「ハワイ」を付与された入力文書データXが入力された場合、教師文書データX´よりも、さらに画像レイアウト領域10がユーザーの意図に沿った位置に配置された合成文書データ20を学習したことになる。
制御部200の文書データ比較部218は、画素配列や構図などからハワイの写真である入力画像データAが入力された場合、教師文書データX´よりも、さらに画像レイアウト領域10がユーザーの意図に沿った位置に配置された合成文書データ20と、入力文書データXとを比較することを学習したことになる。
制御部200の文書データ比較部218は、文書データラベル「ハワイ」を付与された入力文書データXが入力された場合、教師文書データX´よりも、さらに画像レイアウト領域10がユーザーの意図に沿った位置に配置された合成文書データ20と、入力文書データXとを比較することを学習したことになる。
本発明によれば、入力文書データXの画像レイアウト領域10に、入力画像データAを好適に合成して、合成文書データ20を生成する画像処理システム1を提供することができる。
本実施形態によれば、入力文書データXに入力画像データAが合成された合成文書データ20において、合成文書データ20における画像レイアウト領域10の情報が修正される画像処理システム1を提供することができる。
本実施形態によれば、入力文書データXにおけるユーザーの意図に沿った位置に、入力画像データAを好適に合成することを学習できる画像処理システム1を提供することができる。
次に、図9および図10を参照して、本実施形態に係る画像処理システム1の制御を説明する。図9および図10は、本実施形態に係る画像処理システム1の処理を示すフローチャートである。図9および図10に示すように、処理は、ステップS10からステップS44を含む。具体的には次の通りである。
図9に示すステップS10において、受信部140は、画像データの入力指示を受信する。処理は、ステップS12に進む。
ステップS12において、判別部204は、受信部140が受信した入力指示が、画像入力か、文書入力かを判別する。画像入力であると判別された場合(ステップS12において、No)、処理は、ステップS14に進む。文書入力であると判別された場合(ステップS12において、Yes)、処理は、ステップS24に進む。
ステップS12において、Noの場合、ステップS14において、読取部302は、入力画像を読み取り、入力画像データAを生成する。取得部206は、入力画像データAを取得し、および、入力文書データXを取得する。処理は、ステップS16に進む。
ステップS16において、画像データ比較部208は、入力画像データAと教師画像データA´とを比較する。処理は、ステップS18に進む。
ステップS18において、画像データ抽出部210は、入力画像データAと類似する教師画像データA´を抽出する。処理は、ステップS20に進む。
ステップS20において、画像データラベル付与部212は、教師画像データA´に付随していた画像データラベルを入力画像データAに付与する。処理は、ステップS22に進む。
ステップS22において、画像データ更新部214は、画像データ記憶部110に、画像データラベルを付与された入力画像データAを追加する。
ステップS12において、Yesの場合、ステップS24において、読取部302は、入力文書を読み取って、入力文書データXを生成する。取得部206は、入力文書データXを取得する。処理は、ステップS26に進む。
ステップS26において、文書データ比較部218は、入力文書データXと教師文書データX´とを比較する。処理は、ステップS28に進む。
ステップS28において、文書データ抽出部220は、入力文書データXと類似する教師文書データX´を抽出する。処理は、ステップS30に進む。
ステップS30において、文書データラベル付与部222は、入力文書データXに、教師文書データX´に付随していた文書データラベルを付与する。処理は、ステップS32に進む。
ステップS32において、解析部224は、入力文書データX中の画像レイアウト領域10を解析する。処理は、図10に示すステップS36に進む。
ステップS34において、変形部216は、入力画像データAのサイズを修正する。処理は、図10に示すステップS36に進む。
図10に示すステップS36において、合成部226は、文書データラベルを付与された入力文書データXの画像レイアウト領域10に、入力画像データAを合成して、合成文書データ20を生成する。処理は、ステップS38に進む。
ステップS38において、表示部130は、合成文書データ20を表示する。処理は、ステップS40に進む。
ステップS40において、レイアウト修正部228は、合成文書データ20における画像レイアウト領域10の位置を修正する。処理は、ステップS42に進む。
ステップS42において、情報修正部230は、合成文書データ20における画像レイアウト領域10の情報を修正する。処理は、ステップS44に進む。
ステップS44において、文書データ更新部232は、文書データ記憶部120に、文書データラベルを付与された合成文書データ20を追加する。そして、処理は、終了する。
以上、図面(図1〜図10)を参照しながら、本発明の実施形態を説明した。但し、本発明は、上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲で、種々の態様において実施することが可能である。また、上記の各実施形態に開示されている複数の構成要素を適宜組み合わせることによって、種々の発明の形成が可能である。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合わせてもよい。図面は、理解しやすくするために、それぞれの構成要素を主体に模式的に示しており、図面作成の都合上から実際とは異なる場合がある。また、上記の実施形態で示す各構成要素は一例であって、特に限定されるものではなく、本発明の構成から実質的に逸脱しない範囲で種々の変更が可能である。
本発明は、画像処理システムの分野に利用可能である。
1 画像処理システム
100 画像処理装置
110 画像データ記憶部
120 文書データ記憶部
130 表示部
140 受信部
200 制御部
204 判別部
206 取得部
208 画像データ比較部
210 画像データ抽出部
212 画像データラベル付与部
214 画像データ更新部
216 変形部
218 文書データ比較部
220 文書データ抽出部
222 文書データラベル付与部
224 解析部
226 合成部
228 レイアウト修正部
230 情報修正部
232 文書データ更新部
300 複合機
310 サーバー
320 クラウド

Claims (4)

  1. 入力画像データを取得し、および、入力文書データを取得する取得部と、
    前記入力画像データと教師画像データとを比較する画像データ比較部と、
    前記入力画像データと類似する前記教師画像データに付随していた画像データラベルを、前記入力画像データに付与する画像データラベル付与部と、
    前記画像データラベルに基づいて、前記入力画像データを前記入力文書データに合成して、合成文書データを生成する合成部と
    を備えた、画像処理システム。
  2. 入力画像を読み取って前記入力画像データを出力し、入力文書を読み取って前記入力文書データを出力する読取部と、
    前記教師画像データを記憶する画像データ記憶部と
    を、さらに備える、請求項1に記載の画像処理システム。
  3. 教師文書データを記憶する文書データ記憶部と、
    前記入力文書データと前記教師文書データとを比較する文書データ比較部と、
    前記入力文書データと類似する前記教師文書データに付随していた文書データラベルを、前記入力文書データに付与する文書データラベル付与部と、
    前記入力文書データ中の画像レイアウト領域を解析する解析部と
    を、さらに備え、
    前記合成部は、前記文書データラベルを付与された前記入力文書データの前記画像レイアウト領域に、前記入力画像データを合成して前記合成文書データを生成する、請求項1または請求項2に記載の画像処理システム。
  4. 前記合成文書データを表示する表示部と、
    ユーザーの指示により、前記画像レイアウト領域を修正し、修正情報を出力するレイアウト修正部と、
    前記修正情報を前記文書データラベルに追加し、または、前記文書データラベルの前記修正情報をさらに修正する情報修正部と、
    前記文書データ記憶部に、前記文書データラベルを付与し、または、前記文書データラベルが修正された前記合成文書データを追加する文書データ更新部と
    をさらに備える、請求項3に記載の画像処理システム。
JP2020039057A 2020-03-06 2020-03-06 画像処理システム Pending JP2021141497A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020039057A JP2021141497A (ja) 2020-03-06 2020-03-06 画像処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020039057A JP2021141497A (ja) 2020-03-06 2020-03-06 画像処理システム

Publications (1)

Publication Number Publication Date
JP2021141497A true JP2021141497A (ja) 2021-09-16

Family

ID=77669178

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020039057A Pending JP2021141497A (ja) 2020-03-06 2020-03-06 画像処理システム

Country Status (1)

Country Link
JP (1) JP2021141497A (ja)

Similar Documents

Publication Publication Date Title
US20210209359A1 (en) Image processing apparatus, control method for image processing apparatus, and non-transitory storage medium
US9544473B2 (en) Information processing system and information processing method
JP4902568B2 (ja) 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体
CN108132762B (zh) 图像处理装置以及图像形成装置
JP4093241B2 (ja) 書類作成支援装置、書類作成支援プログラムおよび記憶媒体、並びに書類作成支援方法
JP6379897B2 (ja) 機器、情報処理装置、情報処理システム、データ処理方法、及びプログラム
JP6119992B2 (ja) 画像処理装置およびコンピュータプログラム
US20150138220A1 (en) Systems and methods for displaying scanned images with overlaid text
JP2010262584A (ja) 情報処理装置、情報処理システム、情報処理方法およびプログラム
US10306095B2 (en) Image processing apparatus and method
JP5284994B2 (ja) 画像処理装置
JP2022170175A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2024012448A (ja) 画像処理装置、画像処理装置の制御方法及びそのプログラム
JP2021141497A (ja) 画像処理システム
JP2010124459A (ja) 文書生成方法及び文書生成装置
JP2006184415A (ja) 画像処理装置、画像処理プログラム及び画像処理方法
JP2007011529A (ja) Ocr処理における文字認識位置の決定方法
JP6194781B2 (ja) 画像処理装置及びプログラム
JP4152927B2 (ja) 画像処理装置、画像形成装置、処理原稿検索方法、処理原稿検索プログラム、記録媒体
JP4501731B2 (ja) 画像処理装置
JP2020052480A (ja) 情報処理装置及びプログラム
JP2011250251A (ja) 画像処理装置、付加画像合成方法および付加画像合成プログラム
JP2019074875A (ja) 情報処理装置、制御方法、およびプログラム
US20160057309A1 (en) Text scanning system, image processing apparatus, and text scanning method
JP2024027539A (ja) 学習用画像生成装置、学習用画像生成方法、及び、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231212