JP2021027556A - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP2021027556A
JP2021027556A JP2019146673A JP2019146673A JP2021027556A JP 2021027556 A JP2021027556 A JP 2021027556A JP 2019146673 A JP2019146673 A JP 2019146673A JP 2019146673 A JP2019146673 A JP 2019146673A JP 2021027556 A JP2021027556 A JP 2021027556A
Authority
JP
Japan
Prior art keywords
user
image data
cpu
image forming
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019146673A
Other languages
English (en)
Inventor
大樹 武石
Daiki Takeishi
大樹 武石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019146673A priority Critical patent/JP2021027556A/ja
Priority to US16/983,254 priority patent/US11303768B2/en
Publication of JP2021027556A publication Critical patent/JP2021027556A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00244Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00413Display of information to the user, e.g. menus using menus, i.e. presenting the user with a plurality of selectable options
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/10Recognition assisted with metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Facsimiles In General (AREA)

Abstract

【課題】ユーザーごとにメタデータを生成し、画像データを保存先にアップロードすることを目的とする。【解決手段】ユーザーの操作に応じて生成されたスキャン画像データを受信する。ユーザーがアクセス権を有する外部装置のリソースに関する学習データに基づき、スキャン画像データのメタデータを設定する。スキャン画像データと、メタデータとを、外部装置に送信する。【選択図】図5

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。
画像形成装置でスキャンした画像データに、後続のシステムへの入力データとして利用するための付加情報(メタデータ)を付与して画像形成装置から後続のシステムに送信する技術がある(特許文献1)。
更に帳票の特徴量を計算し、類似する帳票データを発見する技術がある。(特許文献2)。
また、スキャンした画像を送信する際に、送信の失敗の原因となる条件を送信先が満たす場合に、送信先として退避保存先を選ぶエラー処理を行う技術もある(特許文献3)。
特開2017―194953号公報 特開2019−57173号公報 特開2012−156824号公報
しかし、特許文献1−3の技術には以下の課題があった。近年、保存先として画像形成装置から外部のネットワーク、例えばクラウドサービスに保存することが一般的となっている。クラウドサービスはセキュリティーを高めるためにユーザーごとにアクセス権を設定することができる。しかし、クラウドサービスと画像形成装置は疎結合であり、ユーザーごとのアクセス権の変更等をリアルタイムに把握することが困難である。このため、画像形成装置が抽出したメタデータに基づき、使用することができないフォルダー又はメタデータ等のリソースに対してアクセスし、画像の保存に失敗することがあり得る。
このとき、特許文献3によれば画像形成装置はほかの退避場所に保存するエラー処理を行うことができる。しかし、画像形成装置の利用者は画像データを所望のメタデータに基づいて保存できないという問題は依然残る。
本発明の情報処理装置は、ユーザーの操作に応じて生成されたスキャン画像データを受信する受信手段と、前記ユーザーがアクセス権を有する外部装置のリソースに関する学習データに基づき、前記スキャン画像データのメタデータを設定する設定手段と、前記スキャン画像データと、前記メタデータとを、前記外部装置に送信する送信手段と、を有することを特徴とする。
本発明によれば、ユーザーごとにメタデータを生成し、画像データを保存先にアップロードすることができる。
画像形成システムのシステム構成の一例を示す図である。 画像形成装置のハードウェア構成の一例を示す図である。 サーバーのハードウェア構成の一例を示す図である。 画像形成装置の操作部の一例を示す図である。 実施形態1の画像形成システムにおける情報処理の一例を示す図である。 画像処理の一例を示すフローチャートである。 メタデータ抽出処理の一例を示すフローチャートである。 変形例1の画像形成システムにおける情報処理の一例を示す図である。 画面例を示す図である。 変形例2の画像形成システムにおける情報処理の一例を示す図である。
以下、本発明の実施形態について図面に基づいて説明する。
<実施形態1>
図1は、画像形成システムのシステム構成の一例を示す図である。
画像形成システム100は、画像形成装置101、102と、情報処理端末103、画像処理サーバー104を含む。これら画像形成装置101、102と、情報処理端末103、画像処理サーバー104はネットワーク105を通じて通信可能である。画像形成システム100は更に外部ネットワーク106を通じて外部サーバー111に接続されている。この外部サーバー111も同様に画像形成装置101、102と、情報処理端末103、画像処理サーバー104とネットワーク105及び外部ネットワーク106を通じて通信可能である。外部サーバー111は、外部装置の一例である。
図1では、画像形成装置101が1つである場合を例に挙げて示しているが、複数の画像形成装置が同一のネットワーク105上に存在してもよい。なお、ネットワーク105は、LAN(Local Area Network)に代表される画像形成システム内の装置が相互に通信できるものであればよい。また外部ネットワーク106はインターネット及びWANといわれるネットワーク105を複数接続することができる広域ネットワークであり、画像形成システム100内の装置が相互に通信できるものであればよい。
画像形成装置101は、情報処理端末103から画像データの印刷依頼(印刷データ)を受信して印刷したり、画像形成装置101に備わるスキャナで画像データを読み取ったりすることができる。また、画像形成装置101は、スキャナで読み取られた画像データを印刷する(通称コピーと呼ばれる処理)ことができる。また、画像形成装置101は、情報処理端末103から受信した印刷データを保存したり、画像形成装置101のスキャナで読み取られた画像を情報処理端末103に送信したりすることができる。更に画像形成装置101は、画像処理サーバー104に画像データを送信して画像処理の依頼することができる。また、画像処理サーバー104は、画像形成装置101から依頼された画像処理の結果、生成された画像データを外部サーバー111に送信し、保存を依頼することができる。
図1では画像処理サーバー104及び外部サーバー111がそれぞれ1つずつであるシステム構成を例に挙げて示すが、それぞれのサーバー数は任意(1つ以上)であってもよい。またそれぞれのサーバーが複数である場合に、それぞれのサーバーは用途に応じた異なる役割を持っていてもよい。また、図1に示す構成において、画像処理サーバー104も外部ネットワーク106を通じたクラウド、即ちインターネット上に配置されていてもよい。画像形成装置101は、この他に、MFP(Multi Function Peripheral)等の画像形成装置が有する機能を実現することができる。
図2は、画像形成装置101のハードウェア構成の一例を示す図である。画像形成装置101は、コントローラ201、プリンタ202、スキャナ203、及び操作部204を有する。コントローラ201は、CPU211、RAM212、HDD213、ネットワークI/F214、プリンタI/F215、スキャナI/F216、操作部I/F217、及び拡張I/F218を有する。CPU211は、RAM212、HDD213、ネットワークI/F214、プリンタI/F215、スキャナI/F216、操作部I/F217、及び拡張I/F218とデータを授受することができる。また、CPU211は、HDD213から読み出したプログラムをRAM212に展開し、RAM212に展開したプログラムに基づき処理を実行する。CPU211がプログラムに基づき処理を実行することによって、画像形成装置101の機能及び後述する図5、図8の画像形成装置の処理が実現される。
HDD213には、CPU211で実行可能なプログラム、画像形成装置101で使用する設定値、及びユーザーから依頼された処理に関するデータ等を記憶しておくことができる。RAM212は、CPU211がHDD213から読み出したプログラムを一時的に格納するための領域である。またRAM212は、プログラムの実行に必要な各種のデータを記憶しておくこともできる。例えば画像処理では、画像形成装置101は、入稿されたデータをRAM212に展開することで処理を行うことができる。
ネットワークI/F214は、画像形成システム内の装置とネットワーク通信を行うためのインターフェイスである。ネットワークI/F214は、データ受信を行ったことをCPU211に伝達すること、及びRAM212上のデータをネットワーク105に送信することができる。プリンタI/F215は、CPU211から送信された印刷データをプリンタ202に送信すること、及びプリンタ202から受信したプリンタの状態をCPU211に伝達することができる。スキャナI/F216は、CPU211から送信された画像読み取り指示をスキャナ203に送信し、スキャナ203から受信した画像データをCPU211に伝達すること、及びスキャナ203から受信した状態をCPU211に伝達することができる。操作部I/F217は、操作部204から入力されたユーザーからの指示をCPU211に伝達すること、及びユーザーが操作するための画面情報を操作部204に伝達することができる。
拡張I/F218は、画像形成装置101に認証部205等、外部機器を接続することを可能とするインターフェイスである。拡張I/F218は、例えば、USB(Universal Serial Bus)形式のインターフェイスを具備する。画像形成装置101は、拡張I/F218に接続された認証部205を通じてユーザーの特定と認証を行うことができる。認証部205は、例えばICカード認証デバイス、指紋認証デバイス、又は虹彩認証デバイス等、ユーザーを認識し、認証することができるデバイスを含むモジュールであればよい。更に画像形成装置101は、USBメモリ等の外部記憶装置が拡張I/F218に接続されることにより、外部記憶装置に記憶されているデータの読み取り及び外部記憶装置に対するデータの書き込みを行うことができる。
プリンタ202は、プリンタI/F215から受信した画像データを用紙に印刷すること、及びプリンタ202の状態をプリンタI/F215に伝達することができる。スキャナ203は、スキャナI/F216から受信した画像読み取り指示に従って、自身に置かれた用紙に表示されている情報を読み取ってデジタル化してスキャナI/F216に伝達することができる。また、スキャナ203は、自身の状態をスキャナI/F216に伝達することができる。操作部204は、画像形成装置101に対して各種の指示を行うための操作をユーザーに行わせるためのインターフェイスである。例えば、操作部204は、タッチパネルを有する液晶画面を具備し、ユーザーに操作画面を提供すると共に、ユーザーからの操作を受け付ける。なお操作部204の詳細は後述する。
図3(a)は、画像処理サーバー104のハードウェア構成の一例を示す図である。画像処理サーバー104は、CPU301、RAM302、HDD303、ネットワークI/F304から構成される。CPU301は、装置全体の制御を司り、RAM302、HDD303、及びネットワークI/F304とのデータの送受信を制御することができる。また、CPU301は、HDD303から読み出したプログラムをRAM302に展開し、RAM302に記憶されているプログラムに基づき処理を実行する。CPU301がプログラムに基づき処理を実行することによって、画像処理サーバー104の機能、図5、図8の画像処理サーバー104の処理及び後述する図6、図7のフローチャートの処理が実現される。
画像処理サーバー104は、画像形成装置101よりネットワークI/F304を通じて受信した画像データに対する画像処理を実施することができる。画像処理サーバー104で実施可能な画像処理として、画像データに対するOCR(Optical Character Recognition)処理、及び画像データ内の文字列、背景等の要素ごとの領域ブロックに分割するブロック分割処理等がある。
図3(b)は、外部サーバー111のハードウェア構成の一例を示す図である。外部サーバー111は、CPU311、RAM312、HDD313、ネットワークI/F314から構成される。CPU311は、装置全体の制御を司り、RAM312、HDD313、及びネットワークI/F314とのデータの授受を制御することができる。また、CPU311は、HDD313から読み出したプログラムをRAM312に展開し、RAM312に記憶されているプログラムに基づき処理を実行する。CPU311がプログラムに基づき処理を実行することによって、外部サーバー111の機能、及び後述する図5、図8の外部サーバー111の処理が実現される。
HDD313には、画像処理サーバー104からネットワークI/F304を介して受信した画像データを蓄積することができる。また、外部サーバー111は、受信した画像データに対してメタデータを付与して、HDD313に保存することができる。表1は、画像データに対して設定可能なメタデータの一例を示した表である。
Figure 2021027556
この表1は会計処理に使われるメタデータの例を示している。メタデータにはキーとバリューがそれぞれ存在する。またバリューにはそのキーに対応する値を設定することができる。この例のメタデータは「請求額」「納期」を設定することができる。また、このメタデータはファイル名とフォルダー名も設定することができる。表1の例では「請求額」というキーが存在し、それに対してバリューには数値型の値を設定することができる。また、「納期」というキーに対応する、バリューには日付を設定することができる。また、「接続先」というキーは、対応するバリューとして保存先のクラウドサービスを識別する情報を設定することができる。
また別の例として、特許明細書を管理するのに好適なメタデータの例を表2に示す。この例ではメタデータはキーとして特許番号を持ち、バリューに保存された明細書の特許番号を持つことができる。同様に、このメタデータはキーとして「発明者」を持ち、バリューに保存された明細書の発明者を持つことができる。同様に、このメタデータはキーとして「会社」を持ち、バリューに保存された明細書の発明者が所属する会社名を持つことができる。
Figure 2021027556
このように、外部サーバー111のHDD313に格納された画像データに対し、メタデータを付与することで、ユーザーはサーバーに対しメタデータキーを指定して検索することが可能となる。例えば、表1の例においては「請求額」を基にスキャンした書類で検索を行うこと等ができる。したがって、画像形成システム100は所望の画像データを検索する際にメタデータを使うことで、ファイル名等、限られた情報で検索する場合に比べて、高い精度で検索することをユーザーに可能にする。また複数の業種、又は業務に応じたメタデータを保存することで、画像形成システム100は様々な業種、又は業務に好適な保存及び管理のシステムをユーザーに提供することができる。
また、ストレージサーバ107のHDD313に格納した画像データに対し、メタデータを付与することで、後続のシステムとの連携もスムーズに行うことが可能となる。例えば、ある会計システムに画像データと会計情報を入力する際、原稿のアップロードをした後に、人手で会計情報を転記する必要があるユースケースが存在する。データをアップロードする際に必要となるメタデータを付与することで、そのまま会計システムに登録することが可能となり、転記作業の効率化を行うことが可能となる。
図4は、画像形成装置101の操作部204の一例を示す図である。操作部204は、タッチパネル画面401、設定キー402、キャンセルキー404、開始キー403で構成されている。ユーザーはタッチパネル画面401及び設定キー402を用いて、各ジョブの設定を行い、開始キー403の選択によりジョブを開始する。ユーザーは一度開始されたジョブを、キャンセルキー404を選択することでジョブ中に中止することができる。ここで示すジョブとは、例えばコピージョブ、ネットワークI/F214を介してスキャンした画像データを画像処理サーバー104でOCR処理を行った上で外部サーバー111に送信するジョブ等が挙げられる。
以上説明した構成により、画像形成装置101を用いてスキャンした文書の画像データに外部サーバー111に送信する、実施形態1における一連の情報処理について図面を用いて説明する。
図5は、実施形態1の画像形成システムにおける情報処理の一例を示す図である。
S501、S502、S513で示す処理は画像形成装置101によって実施される処理である。処理に係るプログラムはHDD213に格納されており、RAM212に読み出され、CPU211によって実行される。
また、ステップS503〜S505及びS507〜509、及びS512で示す処理は画像処理サーバー104によって実行される処理である。処理に係るプログラムは及び学習データはHDD303に格納されており、RAM302に読み出され、CPU301によって実行される。
更に、ステップS506、S510〜S511で示す処理は外部サーバー111によって実行される処理である。処理に係るプログラムはHDD313に格納されており、RAM312に読み出され、CPU311によって実行される。
開始キー403の選択等による原稿のスキャン指示を受信すると、S501において、CPU211は、スキャナ203に対してスキャン指示を行い、スキャンを実施し、原稿に対応する画像データを生成する。
続いて、S502において、CPU211は、S501にて生成した画像データを、ネットワークI/F214を介して画像処理サーバー104に送信する。
S503において、画像処理サーバー104のCPU301は、画像形成装置101から画像データをネットワークI/F304が受信したことを検知する。
S504において、CPU301は、受信した画像データにメタデータを付与する際に必要となるデータを生成するための画像処理を実施する。
図6は、S504で画像処理サーバー104によって実行される画像処理の一例を示すフローチャートである。図6のフローチャートで示す処理に係るプログラムは、画像処理サーバー104のHDD303に格納されており、RAM302によって読み出され、CPU301によって実行される。
S601において、CPU301は、S503にて受信した画像データのうち、1ページ分の画像データを読み込む。
続いて、S602において、CPU301は、S601で読み込んだ1ページ分の画像データに対して、ブロック分割処理を実施する。ここでブロック分割処理とは、画像データの帳票構造を解析し、画像データに含まれる背景領域と文字列領域とを分割する処理のことを指す。ブロック分割処理の結果は、分割された領域の属性、即ち該当領域が背景領域か文字列領域かの情報と、画像データ上における該当領域の位置情報とが関連付けられてHDD303に記憶される。実施形態1では、画像データ上における該当領域は矩形で表現され、上述した位置情報は該当領域の左上点の座標と、矩形の幅の大きさと、矩形の高さとの組で表現される。以後、ブロック分割処理の結果分割された各々の矩形領域を「ブロック」と呼称する。なお、分割領域の形状が矩形であることに限定されるものではなく、分割領域の各々が一意に表現される限りにおいて、任意の形状で領域を規定すればよい。
続いて、S603において、CPU301は、S602にてHDD303に記憶したブロック分割結果を読み出し、そのうち、分割領域の属性が文字列である領域の各々についてOCR処理を実施し、文字列領域の文字列の文字コードを取得する。
続いて、S604において、CPU301は、S603で取得した各文字列領域の文字コード情報と、S602によるブロック分割結果の該当領域の位置情報と、更にS601で読み込んだページ画像データとを関連付けてHDD303に記憶する。
次に、S605において、CPU301は、S503にて受信した画像データのうち、S601〜S604を実施していないページ画像データが存在するか否かを判定する。そのようなページ画像データが存在していた場合(S605がNOの場合)、CPU301は、残るページ画像データの数だけS601〜S605の処理を繰り返す。存在しなかった場合(S605がYESの場合)、CPU301は、図6のフローチャートの情報処理を終了する。
以上の手順で画像処理サーバー104における画像処理を実施することで、画像形成装置101においてS501でスキャンされた原稿の各ページ画像データについて、画像データに含まれる文字列の情報と、各文字列領域の位置情報とを関連付けて取得することができる。
続いて図5の情報処理の説明に戻り、S505において、CPU301は、HDD313に保存された学習データとS504で生成した文字情報と、各文字領域の位置情報を用いて、メタデータを生成する。図7は、S505のメタデータ抽出処理の一例を示すフローチャートである。
S701において、CPU301は、S601で読み込んだページ画像データと、図6を用いて説明したページの画像データとブロック分割処理の結果を読み込む。
続いて、S702において、CPU301は、対象となるページ画像データの画像特徴量を計算する。CPU301は、画像特徴量の算出において、ブロックを特徴量として採用する方法を用いる。以下、この文字の位置情報を用いた実施形態を説明するが、それ以外の画像特徴量を用いたとしても実施形態1を実施できる。文字の位置情報を用いた画像特徴量以外のアルゴリズムとして、ベクター画像を用いて画像の特徴点と画像特徴量を求めることができる、SIFTアルゴリズム、SURFアルゴリズム、HoGアルゴリズム等がある。
続いて、S703において、CPU301は、HDD313に保存された学習データを読み込む。この学習データは実施形態1においては表3のような情報を持つ。
Figure 2021027556
表3が示すように、学習データは画像特徴量とメタデータ抽出ルールを持つ。画像特徴量は画像の特徴を定量的に示す。実施形態1では上述したように、ブロックを特徴量としている。このブロックは、実施形態1では始点、ブロックの幅と高さをピクセル単位で表記している。即ち、左上から(x,y)の位置から、(w,h)の大きさのブロックがあることを示しているとすると、[10,12,102,11],[414,15,32,12]…という特徴量の一つ目のブロックが以下の特徴量を持つことを示している。
(x,y)=(10,12)
(w,h)=(102,11)
このようなブロック情報を要素として持つ、一つ以上の集合が実施形態1における画像特徴量である。
更に、実施形態1における学習データはメタデータ抽出ルールを複数個持つことができる。メタデータ抽出ルールは、対象のメタデータのキーに対応する抽出ルールの列を一つ以上持つ。表4はこのメタデータ抽出ルールを説明するために表3から一つの抽出ルールを抜きだしたデータである。この表4が示すように、このメタデータ抽出ルールはキー「ファイル名」に対応する抽出ルールとして[10,12,102,11]といった、画像特徴量の要素と同様のブロックを示すことができる数値を持つ。この例では、[10,12,102,11]即ち、左上から[10,12]の座標から[102,11]の幅及び高さの範囲にある文字を使ってファイル名を抽出するというルールを示している。
Figure 2021027556
表5もこのメタデータ抽出ルールを説明するために表3から一つの抽出ルールを抜きだしたデータである。この表5が示すように、このメタデータ抽出ルールはキー「フォルダー」に対応する抽出ルールとして「請求書」という文字をフォルダー名につけるルールを示している。
Figure 2021027556
以上説明してきたように、学習データはメタデータを生成するためのルール情報として帳票上の文字を抜き出すルールを持つ。また、学習データはメタデータを生成すルール情報として、固定の文字列を持つことができる。
再び、メタデータ抽出処理(S505)を図7に戻って説明する。
S704において、CPU301は、最も近い特徴量を持つ学習データを特定する。この処理で、CPU301は、S702で求めた画像データに対するブロックを用いた特徴量と、S703で読み込んだ学習データ中の画像特徴量とを比較する。そして、CPU301は、二つの比較の結果、閾値以上に近い特徴量を持つ学習データの行を0個以上見つける。この比較処理は、画像特徴量で示されたブロックの位置と大きさの重なりの大きさを用いて計算する。
続いて、S705において、CPU301は、S704で特定した近い特徴量を持つ学習データの行にあるメタデータ抽出ルールと特定する。
続いて、S706において、CPU301は、S705で特定したメタデータ抽出ルールに基づき、各キーに対応するバリューを決定する。本処理は、表4が示すように、抽出ルールが文字の位置を示す場合、S603で説明したOCR処理で求めた文字を用いてバリューの文字情報を決定する。例えば[10,12,102,11]という抽出ルールの場合、CPU301はこのS603で得られたOCR処理の文字のうち、この座標ブロックに最も近い場所の文字情報を用いてバリューの文字情報として決定する。
また、表5で示したように、抽出ルールが文字情報であった場合は、CPU301は、この抽出ルールの文字列を使って、キーに対応するバリューの文字列を決定する。
続いて、S707において、CPU301は、読み込んだ画像データのうち、まだ未処理のページがあるか判定する。もし未処理のページがある場合には、CPU301は、再びS701にもどり、次の未処理ページを対象としたメタデータ設定処理を開始する。一方で、未処理のページがない場合には、CPU301は、メタデータ設定処理を終了する。
実施形態1では以上の処理によって、表6で示すようなメタデータが2つ抽出できたものとし以下に説明する。
Figure 2021027556
再び、図5を用いてメタデータ抽出(S505)以降の処理を以下に説明する。
続いて、S506において、CPU311は、S505で抽出したメタデータ中にあるスキャン画像データの保存先情報を基に、アクセス権を取得する。表6で示した例では、フォルダーというキーに対応するバリューとして「請求書」、接続先というキーに対応するバリューとして「クラウドサービス1」を得ている。この情報に基づき、CPU301は、外部サーバー111内のフォルダー「請求書」に画像形成装置101を操作したユーザーがファイルを書き込むことが可能かを問い合わせる。この問い合わせ処理はREST、又はSOAPと呼ばれる既知の通信技術を用いて、画像処理サーバー104と外部サーバー111との通信によって実現される。もちろん、REST、又はSOAP以外の通信技術を用いて画像処理サーバー104と外部サーバー111が通信したとしても実施形態1を実施できる。
続いて、S507において、CPU301は、S506で得られた情報に基づき、外部サーバー111のリソース、この場合、外部サーバー111のフォルダー「決裁書」及び「請求書」、にアクセス可能かどうかを判定する。もし一つ以上のアクセス可能なリソースがあれば、CPU301は、処理をS508に進める。対して、もしアクセス可能なリソースが一つも見つからない場合は、CPU301は、処理をS512に処理を進める。ここではまず正常系であるS508以下の説明を行う。
S508において、CPU301は、S505で抽出したメタデータを先頭から一行ずつ読み取り、S506の判定でアクセス可能だと判定されたメタデータを特定する。実施形態1ではCPU301は、最初に見つかったメタデータを使って一つのメタデータを設定する。S505、S507及びS508は、ユーザーがアクセス権を有する外部サーバー111のリソースに関する学習データに基づき、スキャン画像データのメタデータを設定する処理の一例である。
続いて、S509において、CPU301は、S503で得たスキャン画像データと、S508で得たメタデータを基に、外部サーバー111にスキャン画像データとメタデータを送信する。
これを受けて、S510において、外部サーバー111のCPU311は、画像データとメタデータを受信する。
続いて、S511において、CPU311は、S510で受信した画像データとメタデータを外部サーバー111内に保存する。
画像形成システム100は以上をもってシステム全体の情報処理を終了する。
一方、S507で外部サーバー111へアクセス不可と判定した場合には、S512において、CPU301は、スキャン画像データを送信できなかった旨を示すメッセージを画像形成装置101に送信する。S512の処理は、スキャン画像データを送信できない旨を、スキャン画像データを生成した画像形成装置101の操作部204に表示させる制御の一例である。
メッセージを受けて、S513において、画像形成装置101のCPU211は、操作部204に画像データを送信できなかった旨、メッセージを表示する。
以上説明した処理により、画像形成装置101のユーザーにとって簡便にスキャン画像データの各ページ画像データにメタデータを付加することができるようになる。加えて、画像形成装置101の他のユーザーが学習させた学習データがユーザーにとって利用できない学習データを含んでいたとしても、画像形成システム100は、複数の学習データからアクセス可能な学習データを選択する。これによって、画像形成装置101のユーザーは、学習データに従い、ユーザーがアクセス可能なリソースに対して画像ファイルとメタデータを送信することができる。
以上で実施形態1の説明を終える。
(変形例1)
変形例1では、外部サーバー111のリソースにアクセスできない場合に学習データを再学習する処理を示す。これによって、外部サーバー111のアクセス権がない画像形成装置101のユーザーであってもフォルダー選択を可能にすることができる。なお、変形例1の説明にあたり、実施形態1と重複する構成及び処理手順には同一の付番で示し、それらの説明は省略し、実施形態1とは異なる構成及び処理について主に説明を行う。
図8は、変形例1の画像形成システムにおける情報処理の一例を示す図である。以下、変形例1における情報処理を、図8を用いながら説明する。
実施形態1同様に、S501、S502、S517,S519で示す処理は画像形成装置101によって実施される処理である。処理に係るプログラムはHDD213に格納されており、RAM212に読み出され、CPU211によって実行される。
また、ステップS503〜S505及びS507〜509、及びS514〜S521で示す処理は画像処理サーバー104によって実行される処理である。処理に係るプログラムは及び学習データはHDD303に格納されており、RAM302によって読み出され、CPU301によって実行される。
更に、ステップS506、S510〜S511、S515で示す処理は外部サーバー111によって実行される処理である。処理に係るプログラムはHDD313に格納されており、RAM312によって読み出され、CPU311によって実行される。
変形例1におけるS501〜S506は実施形態1とその処理が同様であるため、説明を省略する。
S507において、CPU301は、S506で得られた情報に基づき、外部サーバー111のリソース、この場合、外部サーバー111のフォルダー「決裁書」及び「請求書」にアクセス可能かどうかを判定する。もし一つ以上のアクセス可能なリソースがあれば、CPU301は、処理をS520に進める。対して、もしアクセス可能なリソースが一つも見つからない場合は、CPU301はS514に処理を進める。
ここではまず、異常系であるS514以下の説明を行う。
S514において、CPU301は、画像形成装置101のユーザーがアクセス可能な外部サーバー111のリソース一覧を取得する。このリクエストは、S505と同様にREST又はSOAPと呼ばれる通信技術を用いて、画像処理サーバー104と外部サーバー111との通信によって実現される。また、外部サーバー111のリソースへ画像形成装置101のユーザーがアクセス可能なリソースを得るために、CPU301は、外部サーバー111に対して、ユーザーに紐づいたアクセストークンとそれに紐づいたユーザー情報等を送る。この処理はOAuth等の認証、認可技術によって実現される。
通信の結果、S515において、外部サーバー111のCPU311は、画像形成装置101のユーザーがアクセス可能なリソースのパス及び識別子(ID)をXML、JSONといったデータ形式を使って画像処理サーバー104に送信する。
S516において、CPU301は、得られた情報に基づき、操作部204のタッチパネル画面401に、画像形成装置101のユーザーがアクセス可能なリソース一覧を表示するように依頼する通信を画像形成装置101に対して行う。S516の処理は、ユーザーがアクセス権を有するリソースの一覧を含む画面を、スキャン画像データを生成した画像形成装置101の操作部204に表示させる制御の一例である。
これを受けて、S517において、画像形成装置101のCPU211は、得られたアクセス可能なリソース一覧を表示すると共に、画像形成装置101のユーザーによるリソースの選択操作を受け付ける。
図9(a)はユーザーからのリソース選択を受け付けるためのリソース一覧表示画面の一例を示す図である。ユーザーはリソースの一覧表示部405に対してタッチ操作をすることで、画像形成装置に101対して所望のリソースを選択することができる。なお、変形例1においては、リソースの例としてフォルダーを示しているが、それ以外のメタデータ等、外部サーバー111のリソースの選択であれば何であってもよい。そして、ユーザーが表示されているリソースを選択すると、CPU211は、画像処理サーバー104に対して選択されたリソース情報を送信する。
S518において、CPU301は、S517の通信で得られた選択されたリソースに基づき学習データを更新するか判断するための画面表示を画像形成装置101に対して依頼する。S518の処理は、リソースの一覧から選択されたリソースに基づき学習データを更新するかを選択する画面を、操作部204に表示させる制御の一例である。
これを受けて、S519において、画像形成装置101のCPU211は、画像形成装置101のユーザーによる学習可否の選択画面を表示し、ユーザーの選択入力を受け付ける。
図9(b)はユーザーからの選択を受け付ける画面の一例を示す図である。変形例1においては、CPU211は、409に示すように選択されたフォルダーを学習データに上書きするかを問い合わせるメッセージを表示する。この画面で、画像形成装置101のユーザーが上書きする旨の選択をするには410のボタンを選択する。また、この画面で、画像形成装置101のユーザーが上書きしない旨の選択をするには411のボタンを選択する。CPU211は、ユーザーの選択を受けて、その結果を画像処理サーバー104に送信する。
S520において、CPU301は、S519の通信で得られた情報に基づき、学習データを更新するか判定する。もし、この判定で学習データの更新が必要だと判定した場合は、CPU301は、S521に処理を進める。対して、この判定で学習データの更新が不要だと判定した場合には、CPU301は、処理をS508に進める。
S521において、CPU301は、S517で選択されたリソースの情報に基づき、学習DBを更新する。例えば、元の学習DBが表7であり、画像形成装置101のユーザーが選択したリソースが「/会計/見積書」であった場合、CPU301は、表8のように学習DBを更新する。
Figure 2021027556
Figure 2021027556
CPU301は、S521の処理を終了したのちに、処理をS508に進める。
なお、S508以下の処理は実施形態1と同様であるため、説明を省略する。
以上説明した処理により、画像形成装置101のユーザーにとって簡便にスキャン画像データの各ページ画像データにメタデータを付加することができるようになる。更に、実施形態1の効果に加えて、画像形成装置101のユーザーはアクセス可能なリソースを選択し、更に学習データを更新することができる。これによって画像形成装置101のユーザーは、仮に学習データに含まれるリソースにアクセスできない場合にも、ユーザーがアクセス可能なリソースに対して画像ファイルとメタデータを送信することができる。
また更に、仮に学習データに含まれるリソースにアクセスできない場合にも、ユーザーがアクセス可能なリソースを学習データに保存することで、以後もユーザーがアクセス可能なリソースにて画像ファイルとメタデータを送信することができる。
以上で変形例1の説明を終える。
(変形例2)
変形例2では、外部サーバー111のリソースにアクセスできない場合に学習データを再学習する別の処理を示す。これによって、外部サーバー111にアクセス権がない画像形成装置101のユーザーであってもフォルダー選択を可能にすることができる。なお、変形例2の説明にあたり、実施形態1又は変形例1と重複する構成や処理手順には同一の付番で示し、それらの説明は省略し、実施形態1や変形例1とは異なる構成及び処理手順について主に説明を行う。
図10は、変形例2の画像形成システムにおける情報処理の一例を示す図である。以下、変形例2における情報処理を、図10を用いながら説明する。
S516において、CPU301は、S514で得られた情報に基づき、画像形成装置101に対して、画像形成装置101のユーザーがアクセス可能なリソース一覧と、リソースの一覧から選択されたリソースに基づき学習データを更新するかを選択する選択部と、を含む画面を、操作部204に表示するように依頼する通信を行う。S516の処理は、リソースの一覧と、リソースの一覧から選択されたリソースに基づき学習データを更新するかを選択する選択部と、を含む画面を、スキャン画像データを生成した画像形成装置101の操作部204に表示させる制御の一例である。
S517において、画像形成装置101のCPU211は、S516で得られたアクセス可能なリソース一覧を表示すると共に、画像形成装置101のユーザーによるリソースの選択操作を受け付ける。図9(c)は、ユーザーからのリソース選択を受け付けるためのリソース一覧表示画面の一例を示す図である。ユーザーはリソースの一覧表示部405に対してタッチ操作をすることで、画像形成装置に101対して所望のリソースを選択することができる。また、ユーザーは学習の選択部408にタッチすることで、選択したリソース先を使って学習データを更新するかどうか選択することができる。そして、ユーザーが表示されているリソースを確認し、OKを選択すると、CPU211は、画像処理サーバー104に対して選択されたリソース情報を送信する。
S520において、CPU301は、S517の通信で得られた情報に基づき、学習データを更新するか判定する。もし、この判定で学習データの更新が必要だと判定した場合は、CPU301は、処理をS512に進める。対して、この判定で学習データの更新が不要だと判定した場合には、CPU301は、処理をS508に進める。
以上説明した処理により、画像形成装置101のユーザーにとって簡便にスキャン画像データの各ページ画像データにメタデータを付加することができるようになる。更に、実施形態1と変形例1の効果に加えて、画像形成装置101のユーザーはアクセス可能なリソースを選択し、同様の画面で学習データを更新することを選択することができる。
以上で変形例2の説明を終える。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給する。そして、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以上、本発明の実施形態の一例について詳述したが、本発明は係る特定の実施形態に限定されるものではない。
上述した実施形態によれば、ユーザーごとにメタデータを生成し、画像データを保存先にアップロードすることができる。
101 画像形成装置
104 画像処理サーバー
111 外部サーバー

Claims (7)

  1. ユーザーの操作に応じて生成されたスキャン画像データを受信する受信手段と、
    前記ユーザーがアクセス権を有する外部装置のリソースに関する学習データに基づき、前記スキャン画像データのメタデータを設定する設定手段と、
    前記スキャン画像データと、前記メタデータとを、前記外部装置に送信する送信手段と、
    を有することを特徴とする情報処理装置。
  2. 前記ユーザーが前記リソースにアクセス権を有しない場合、前記スキャン画像データを送信できない旨を、前記スキャン画像データを生成した画像形成装置の操作部に表示させる制御手段を更に有することを特徴とする請求項1に記載の情報処理装置。
  3. 前記ユーザーが前記リソースにアクセス権を有しない場合、前記ユーザーがアクセス権を有するリソースの一覧を取得し、前記リソースの一覧を含む画面を、前記スキャン画像データを生成した画像形成装置の操作部に表示させる制御手段を更に有することを特徴とする請求項1に記載の情報処理装置。
  4. 前記制御手段は、前記リソースの一覧から選択されたリソースに基づき前記学習データを更新するかを選択する画面を、前記操作部に表示させることを特徴とする請求項3に記載の情報処理装置。
  5. 前記ユーザーが前記リソースにアクセス権を有しない場合、前記ユーザーがアクセス権を有するリソースの一覧を取得し、前記リソースの一覧と、前記リソースの一覧から選択されたリソースに基づき前記学習データを更新するかを選択する選択部と、を含む画面を、前記スキャン画像データを生成した画像形成装置の操作部に表示させる制御手段を更に有することを特徴とする請求項1に記載の情報処理装置。
  6. 情報処理装置が実行する情報処理方法であって、
    ユーザーの操作に応じて生成されたスキャン画像データを受信する受信工程と、
    前記ユーザーがアクセス権を有する外部装置のリソース(前記スキャン画像データの保存先)に関する学習データに基づき、前記スキャン画像データのメタデータを設定する設定工程と、
    前記スキャン画像データと、前記メタデータとを、前記外部装置に送信する送信工程と、
    を含むことを特徴とする情報処理方法。
  7. コンピュータを、請求項1乃至5の何れか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
JP2019146673A 2019-08-08 2019-08-08 情報処理装置、情報処理方法及びプログラム Pending JP2021027556A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019146673A JP2021027556A (ja) 2019-08-08 2019-08-08 情報処理装置、情報処理方法及びプログラム
US16/983,254 US11303768B2 (en) 2019-08-08 2020-08-03 Information processing apparatus and information processing method for setting metadata to image data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019146673A JP2021027556A (ja) 2019-08-08 2019-08-08 情報処理装置、情報処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2021027556A true JP2021027556A (ja) 2021-02-22

Family

ID=74501821

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019146673A Pending JP2021027556A (ja) 2019-08-08 2019-08-08 情報処理装置、情報処理方法及びプログラム

Country Status (2)

Country Link
US (1) US11303768B2 (ja)
JP (1) JP2021027556A (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5804711B2 (ja) 2011-01-27 2015-11-04 キヤノン株式会社 管理システム、画像形成装置、制御方法、及び、プログラム
US9881225B2 (en) 2016-04-20 2018-01-30 Kabushiki Kaisha Toshiba System and method for intelligent receipt processing
JP7013182B2 (ja) 2017-09-21 2022-01-31 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
US10511730B1 (en) * 2018-06-07 2019-12-17 Kyocera Document Solutions Inc. Method to create a secure distributed data validation system using a distributed storage system and artificial intelligence

Also Published As

Publication number Publication date
US11303768B2 (en) 2022-04-12
US20210044708A1 (en) 2021-02-11

Similar Documents

Publication Publication Date Title
USRE49898E1 (en) Image forming system, information forming apparatus, and computer readable medium having management apparatus with distributed storage
US8472041B2 (en) Information processing apparatus, information processing system and computer-readable storage medium performing first authentication when storing print data and performing second authentication when printing stored print data
US10942689B2 (en) Pull printing via additional security processes
US20100157349A1 (en) Categorized secure scan to e-mail
US20160219173A1 (en) Document print management system and document print management method
US20130057884A1 (en) Information processing apparatus, computer program, and control method
JP2006209261A (ja) 受信帳票ジョブ表示方法及び装置、並びにプログラム
US9940650B2 (en) Equipment unit, information processing system, information processing method, and program
JP2020008954A (ja) 印刷サーバ、画像形成装置、プログラム、印刷システム
JP6476958B2 (ja) 画像処理装置および画像処理システム
JP5900204B2 (ja) 文書処理装置及びプログラム
JP2021027556A (ja) 情報処理装置、情報処理方法及びプログラム
US10552092B2 (en) Image forming apparatus and image processing system
US9866721B2 (en) Information processing apparatus, image forming apparatus, and non-transitory computer readable medium for file distribution to servers
JP2021190834A (ja) 情報処理装置、その処理方法、およびプログラム
JP6614045B2 (ja) 画像形成装置、プログラム及び情報処理システム
JP2015106384A (ja) 情報処理装置およびその制御方法、並びにプログラム
US20220383270A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method
US9335959B2 (en) Image forming apparatus operable to form data based on driver type, method of controlling image forming apparatus, and storage medium
US20230118845A1 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
US10079957B2 (en) Image reading apparatus, image forming apparatus, and non-transitory computer readable medium
JP2018092569A (ja) 情報処理システム、情報処理装置、情報処理方法及びプログラム
US20200019395A1 (en) Information processing apparatus, information processing system, and non-transitory computer readable medium
JP2010191609A (ja) ワークフロー実行装置、ワークフロー実行方法およびワークフロー実行プログラム
JP2023031908A (ja) 画像処理装置、プログラム、画像処理方法