JP2024032563A - Information processing device, control method and program for information processing device - Google Patents
Information processing device, control method and program for information processing device Download PDFInfo
- Publication number
- JP2024032563A JP2024032563A JP2022136284A JP2022136284A JP2024032563A JP 2024032563 A JP2024032563 A JP 2024032563A JP 2022136284 A JP2022136284 A JP 2022136284A JP 2022136284 A JP2022136284 A JP 2022136284A JP 2024032563 A JP2024032563 A JP 2024032563A
- Authority
- JP
- Japan
- Prior art keywords
- information
- series
- processes
- learned
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 230000010365 information processing Effects 0.000 title claims abstract description 28
- 238000012545 processing Methods 0.000 claims description 72
- 230000008569 process Effects 0.000 claims description 61
- 238000000605 extraction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 abstract description 19
- 239000000284 extract Substances 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 19
- 238000004458 analytical method Methods 0.000 description 13
- 238000012546 transfer Methods 0.000 description 12
- 238000010191 image analysis Methods 0.000 description 11
- 238000012015 optical character recognition Methods 0.000 description 10
- 230000004044 response Effects 0.000 description 7
- 238000007726 management method Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013523 data management Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Abstract
【課題】情報処理装置、情報処理装置の制御方法及びプログラムを提供する。【解決手段】帳票のスキャン画像データから文字領域の情報を抽出し、学習データと照合して類似帳票を判定し、対応する文字領域の文字列の認識し学習を行い、学習データをワークフロー毎に記憶する情報処理装置であって、ワークフローで取得する文字領域を学習時に、類似帳票で学習済みのワークフローの一覧を表示しS901、一覧から選択された学習済みのワークフローの抽出する文字領域と、情報の項目のリストを表示しS903、学習済みのワークフローでの情報項目との関連付けを受け付けS904、ワークフローの学習データをワークフローに引き継ぐS909。【効果】表示画面上で学習済みのワークフローと新たなワークフローの抽出する文字領域が容易に関連付けすることができ、学習データを引き継ぐことにより、メタデータの設定するための学習の手間を軽減することができる。【選択図】図9An information processing device, a method for controlling the information processing device, and a program are provided. [Solution] Extract character area information from scanned image data of a form, compare it with learning data to determine similar forms, recognize and learn character strings in the corresponding character area, and use the learning data for each workflow. An information processing device for storing, at the time of learning a character region to be acquired in a workflow, displays a list of learned workflows with similar forms in step S901, and displays a character region to be extracted in a learned workflow selected from the list and information. A list of items is displayed in step S903, an association with information items in the learned workflow is accepted in step S904, and learning data of the workflow is carried over to the workflow in step S909. [Effect] It is possible to easily associate the extracted character area of a learned workflow with a new workflow on the display screen, and by inheriting the learning data, the effort of learning to set metadata is reduced. Can be done. [Selection diagram] Figure 9
Description
本発明は、一連の処理であるワークフローで設定する値をMFP又はPCの画面で表示するスキャン画像から文字領域を学習し抽出し、別のワークフローに学習データを引き継ぐ処理を行う情報処理装置、情報処理装置の制御方法及びプログラムに関する。 The present invention relates to an information processing apparatus and information processing apparatus that learns and extracts character areas from a scanned image displayed on an MFP or PC screen to set values in a workflow, which is a series of processing, and carries over the learning data to another workflow. The present invention relates to a control method and program for a processing device.
従来、紙帳票をスキャンして電子化し、該帳票の記載内容に基づいて電子化した帳票画像のファイル名やクラウドサービスなどの管理装置内で使用するメタデータとして設定することで帳票管理をするシステムがある。このファイル名やメタデータを設定する方法として、帳票画像に文字認識処理を実行した認識結果に基づいて設定する方法がある。また、ユーザがファイル名やメタデータの設定で使用した文字領域を学習することにより、類似するフォーマットの帳票が学習されているかを判定し、スキャンされた際にファイル名やメタデータで使用する文字列をユーザに提示することが可能となる。またスキャン処理からファイル名やメタデータの値を設定、情報処理装置への送信などをワークフローとして定義することで使用用途ごとに一連の処理として複数設定が可能となる。 Conventionally, a system that manages forms by scanning paper forms and digitizing them, and setting the file name of the digitized form image based on the contents of the form and metadata used in a management device such as a cloud service. There is. As a method for setting the file name and metadata, there is a method of setting the file name and metadata based on the recognition result obtained by performing character recognition processing on the form image. In addition, by learning the character area used by the user in file name and metadata settings, it is possible to determine whether a form with a similar format has been learned, and to use the characters used in the file name and metadata when scanned. It becomes possible to present columns to the user. In addition, by defining scan processing, setting file names and metadata values, sending data to an information processing device, etc. as a workflow, multiple settings can be made as a series of processes for each usage.
上記のようなシステムにおいて、各ワークフローが帳票からどの情報をファイル名やメタデータとして使用するかが異なるため、抽出する文字領域についてはワークフローごとに学習する必要がある。また帳票を管理する情報処理装置を変更するときや、用途ごとに別の情報処理装置と使い分ける状況又は抽出する文字領域を変更する必要があるとき、ワークフローを新たに作成する必要がある。その際、帳票フォーマットごとに新しく各項目を学習する必要がある。例えば帳票管理に使用していたクラウドサービスを新しいクラウドサービスに移行した際、使用するメタデータの項目が変わることがある。以前メタデータ「Name」として学習した文字領域の文字列を、新しいクラウドサービスのメタデータ「Title」として使用したいとき、同じ情報を使用したい場合でも帳票をフォーマットごとに学習し直さなければならない。そのため既に以前のワークフローで多くのフォーマットの帳票を学習していた場合、同じ種類の数だけ学習し直す必要がありユーザの作業の負荷となる。
特許文献1には、第一メタデータを別の第二メタデータに引き継ぐ技術が開示されている。第一メタデータの項目を定義したファイルを用意し、そのファイルに第一のメタデータと同一情報を使用する他の第二メタデータとの対応関係を記載する。この定義ファイルを基にメタデータを設定するUIを表示し、第一のメタデータに値を設定すると、第二のメタデータにも同じ情報が付与される。
In the above system, each workflow uses different information from the form as a file name or metadata, so it is necessary to learn the character areas to be extracted for each workflow. Furthermore, when changing the information processing device that manages the form, when using a different information processing device for each purpose, or when it is necessary to change the character area to be extracted, it is necessary to create a new workflow. At that time, it is necessary to newly learn each item for each form format. For example, when migrating a cloud service used for form management to a new cloud service, the metadata items used may change. If you want to use a character string in a character area that was previously learned as metadata ``Name'' as metadata ``Title'' for a new cloud service, you will have to relearn the form for each form even if you want to use the same information. Therefore, if many formats of forms have already been learned in the previous workflow, it is necessary to relearn the same number of formats, which becomes a burden on the user.
しかしながら特許文献1に記載のものでは、メタデータ間の対応関係の定義をファイルとして用意する必要があり、メタデータの項目が変わる度に定義したファイルを修正する必要がありユーザに作業負荷がかかる。また、メタデータ名のみからメタデータ同士を対応付けようとすると、類似のメタデータ名が複数あったときやメタデータの項目数が多いと対応付け誤る可能性がある。
本発明では、スキャンした帳票の内容からファイル名やメタデータを設定する際、既に別のワークフローで同じ文字領域を学習済みであった場合、学習データの引き継ぎ作業を容易にし、ファイル名やメタデータの設定を可能とすることを目的とする。また、ファイル名やメタデータの引き継ぎする際、引き継ぎ元が帳票内のどの情報を選択しているか確認できるようにし、引き継ぎ先が取得したい情報と同じであるか確認できるようにすることで誤りを軽減させる。
However, in the method described in
In the present invention, when setting a file name and metadata from the contents of a scanned form, if the same character area has already been learned in another workflow, it is possible to easily carry over the learning data and set the file name and metadata. The purpose is to enable the setting of In addition, when transferring file names and metadata, it is possible to check which information in the form has been selected by the transfer source, and to check whether the transfer destination is the same information as the information you want to obtain. reduce.
本発明は、帳票のスキャン画像データから文字領域の情報を抽出する抽出手段と、該抽出された文字領域の情報に基づき、学習データと照合して類似帳票を判定する判定手段と、該類似帳票に対応する文字領域の文字列の認識を行う認識手段と、該文字領域の学習を行う学習手段と、前記文字領域の学習データを一連の処理ごとに記憶する記憶手段とを有する情報処理装置であって、第1の一連の処理において取得する文字領域を学習する際、スキャン画像の類似帳票を学習済みの一連の処理の一覧を表示する第1の表示手段と、ユーザが前記学習済みの一連の処理の一覧から学習済みの第2の一連の処理を選択することにより、前記第2の一連の処理の学習済みの抽出する文字領域と、情報の項目のリストを表示する第2の表示手段と、前記学習済みの第2の一連の処理で抽出する情報の項目と学習を行う第1の一連の処理で送信する情報の項目との関連付けを受け付ける受付手段と、該関連付けに基づいて第2の一連の処理の学習データを第1の一連の処理の学習データに複製する複製手段を有することを特徴とする。 The present invention provides an extraction means for extracting character area information from scanned image data of a form, a determination means for comparing the extracted character area information with learning data to determine a similar form, and An information processing apparatus comprising: a recognition means for recognizing a character string in a character region corresponding to a character region; a learning means for learning the character region; and a storage means for storing learning data for the character region for each series of processing. When learning character regions to be acquired in the first series of processing, a first display means for displaying a list of a series of learned processes for similar forms of scanned images; a second display means for displaying a list of learned character regions to be extracted and information items of the second series of processes by selecting a learned second series of processes from a list of processes; a receiving means for accepting an association between an item of information to be extracted in the learned second series of processing and an item of information to be transmitted in the first series of processing for learning; The method is characterized by having a duplication means for duplicating the learning data of the series of processes into the learning data of the first series of processes.
本発明によれば、表示画面上で学習済みのワークフローと新たなワークフローの抽出する文字領域が容易に関連付けすることができ、学習データを引き継ぐことにより、メタデータの設定するための学習の手間を軽減することができる。 According to the present invention, it is possible to easily associate the extracted character area of a learned workflow with a new workflow on the display screen, and by taking over the learning data, the effort of learning for setting metadata is reduced. It can be reduced.
以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。 EMBODIMENT OF THE INVENTION Hereinafter, the form for implementing this invention is demonstrated using drawings. Note that the following embodiments do not limit the claimed invention, and not all combinations of features described in the embodiments are essential to the solution of the invention.
〔第1実施形態〕
<システム構成>
図1は、情報処理システムの全体構成を示す図である。情報処理システムは、MFP(Multifunction Peripheral)110、クライアントPC111、MFP連携サービス120および外部のクラウドサービス130を含んでいる。MFP110及びクライアントPC111は、LAN(Local Area Network)経由でインターネット上の各種サービスを提供する各種装置に対して通信可能に接続されている。
MFP110は、スキャナやプリンタといった複数の機能を有する複合機であり、画像処理装置の一例である。クライアントPC111は、インターネットを介して外部のクラウドサービスの提供を受けることが可能なデスクトップ端末やモバイル端末等の情報処理装置である。
MFP連携サービス120は、MFP110から受け取ったスキャン画像に対し画像解析を行い、また別のサービスに対しMFP110からのリクエストを転送する機能を持つサービスであり、サーバーなどの情報処理装置が実行する。
クラウドサービス130は、クラウドストレージやドキュメント管理を行う外部のクラウドサービスである。インターネットを介してのファイルの保存や、ファイルに対するメタデータの設定のほか、ウェブブラウザでファイルを取得しメタデータの確認などができるサービスであり、サーバーなどの情報処理装置が実行する。
本実施形態の情報処理システムは、MFP110、クライアントPC111、MFP連携サービス120及びクラウドサービス130からなる構成としているがこれに限定されない。例えば、MFP110がクライアントPC111やMFP連携サービス120の役割を兼ね備えてもよい。また、MFP連携サービス120はインターネット上ではなくLAN上に配置されていてもよい。また、クラウドサービス130はメールサーバーなどに置き換えて、スキャンした画像をメールに添付し送信するようにしてもよい。
[First embodiment]
<System configuration>
FIG. 1 is a diagram showing the overall configuration of an information processing system. The information processing system includes an MFP (Multifunction Peripheral) 110, a client PC 111, an MFP
The MFP 110 is a multifunction device having multiple functions such as a scanner and a printer, and is an example of an image processing device. The client PC 111 is an information processing device such as a desktop terminal or a mobile terminal that can receive external cloud services via the Internet.
The MFP
The
The information processing system of this embodiment has a configuration including an MFP 110, a client PC 111, an MFP
<MFPのハードウェア構成>
図2は、MFP110のハードウェア構成図である。MFP110は、制御部210、操作部220、プリンタ部221、スキャナ部222、モデム223で構成される。
制御部210は、MFP110全体の動作を制御する。
CPU211は、ROM212に記憶された制御プログラムを読み出して、読取/印刷/通信などMFP110が有する各種機能を実行・制御する。
RAM213は、CPU211の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施形態では1つのCPU211が1つのメモリ(RAM213又はHDD214)を用いて後述のフローチャートに示す各処理を実行するものとするが、これに限定されない。例えば、複数のCPUや複数のRAM又はHDDを協働させて各処理を実行してもよい。
<MFP hardware configuration>
FIG. 2 is a hardware configuration diagram of the
Control unit 210 controls the overall operation of
The
The
HDD214は、画像データや各種プログラムを記憶する大容量記憶部である。
操作部I/F215は、操作部220と制御部210とを接続するインタフェースである。
操作部220には、タッチパネルやキーボードなどが備えられており、ユーザによる操作/入力/指示を受け付ける。
プリンタI/F216は、プリンタ部221と制御部210とを接続するインタフェースである。印刷用の画像データはプリンタI/F216を介して制御部210からプリンタ部221へ転送され、記録媒体上に印刷される。
スキャナI/F217は、スキャナ部222と制御部210とを接続するインタフェースである。
スキャナ部222は、不図示の原稿台やADF(Auto Document Feeder)にセットされた原稿を読み取ってスキャン画像データを生成し、スキャナI/F217を介して制御部210に入力する。MFP110は、スキャナ部222で生成された画像データをプリンタ部221から印刷出力(コピー)する他、ファイル送信又はメール送信することができる。
モデムI/F218は、モデム223と制御部210とを接続するインタフェースである。
モデム223は、PSTN上のファクシミリ装置との間で画像データをファクシミリ通信する。
ネットワークI/F219は、制御部210(MFP110)をLANに接続するインタフェースである。MFP110は、ネットワークI/F219を用いて、インターネット上の各サービスに画像データや情報を送信したり、各種情報を受信したりする。
以上説明したMFP110のハードウェア構成は一例であり、必要に応じてその他の構成を備えるものであってもよいし、一部の構成を有していなくてもよい。
The HDD 214 is a large capacity storage unit that stores image data and various programs.
The operation unit I/
The
The printer I/
Scanner I/F 217 is an interface that connects
The
Modem I/F 218 is an interface that connects
The
The network I/F 219 is an interface that connects the control unit 210 (MFP 110) to the LAN. The MFP 110 uses the network I/F 219 to transmit image data and information to various services on the Internet, and to receive various information.
The hardware configuration of the
<クライアントPC、MFP連携サービスのハードウェア構成>
図3は、クライアントPC111又はMFP連携サービス120のハードウェア構成図である。クライアントPC111又はMFP連携サービス120は、少なくともCPU311、ROM312、RAM313、HDD314及びネットワークI/F315で構成される情報処理装置である。
CPU311は、ROM312に記憶された制御プログラムを読み出して各種処理を実行することで、全体の動作を制御する。
RAM313は、CPU311の主メモリ、ワークエリア等の一時記憶領域として用いられる。
HDD314は、画像データや各種プログラムを記憶する大容量記憶部である。
ネットワークI/F315は、クライアントPC又はMFP連携サービス120をインターネットに接続するインタフェースである。MFP連携サービス120及びクラウドサービス130は、ネットワークI/F315を介して他の装置(MFP110など)から処理リスエストを受けて各種情報を送受信する。
<Hardware configuration of client PC and MFP cooperation service>
FIG. 3 is a hardware configuration diagram of the
The
The
The
The network I/
<情報処理システムのソフトウェア構成>
図4は、本実施例に係る画像処理システムのソフトウェア構成図である。
(MFP)
MFP110のソフトウェアは、ネイティブ機能部410と追加機能部420の大きく2つに分けられる。ネイティブ機能部410に含まれる各部はMFP110に標準的に備えられたものであるのに対し、追加機能部420はMFP110に追加インストールされたアプリケーションである。追加機能部420はJava(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しない他の追加アプリケーションがインストールされていてもよい。
ネイティブ機能部410は、スキャン実行部411および画像データ保存部412を有する。
追加機能部420は、表示制御部421、スキャン指示部422、連携サービスリクエスト部423を有する。
表示制御部421は、MFP110の操作部220のタッチパネル機能を有する液晶表示部に、ユーザによる操作を受け付けるためのUI画面を表示する。例えば、MFP連携サービス120へアクセスするための認証情報の入力、一連の処理であるワークフロー選択、ならびに、スキャン開始の操作、プレビュー画面などのUI画面を表示する。
スキャン指示部422は、UI画面を介して入力されたユーザ指示に応じたスキャン設定と共にスキャン実行部411にスキャン処理を要求する。
<Software configuration of information processing system>
FIG. 4 is a software configuration diagram of the image processing system according to this embodiment.
(MFP)
The software of the
The native function section 410 includes a
The additional function section 420 includes a
The
The
スキャン実行部411は、スキャン指示部422からのスキャン設定を含んだスキャン要求を受け取る。スキャン実行部411は、スキャン要求に従い、スキャナI/F217を介してスキャナ部222で、原稿台ガラスに置かれた原稿を読み取ることでスキャン画像データを生成する。生成したスキャン画像データは、画像データ保存部412に送られる。スキャン実行部411は、保存したスキャン画像データを一意に示すスキャン画像識別子をスキャン指示部422へ送る。スキャン画像識別子はMFP110においてスキャンした画像をユニークに識別するための番号や記号、アルファベットなどである(不図示)。画像データ保存部412は、スキャン実行部411から受け取ったスキャン画像データをスキャン画像識別子と対応付けてHDD214に保存する。
スキャン指示部422は、スキャン実行部411から受け取ったスキャン画像識別子に対応するスキャン画像データを画像データ保存部412から取得する。スキャン指示部422は、取得したスキャン画像データにMFP連携サービス120で処理を行う指示を連携サービスリクエスト部423に要求する。
連携サービスリクエスト部423は、MFP連携サービス120に対して各種処理の要求を行う。例えば、ログイン、スキャン画像の解析、スキャン画像の送信などの要求を行う。MFP連携サービス120とのやり取りはRESTやSOAPなどのプロトコルを使用するが、その他の通信手段を用いてもよい。
(MFP連携サービス)
MFP連携サービス120は、リクエスト制御部431、画像処理部432、ワークフロー管理部433、クラウドサービスアクセス部434、データ管理部435、表示制御部436を有する。
リクエスト制御部431は、外部装置からの要求を受信できる状態で待機している。処理要求を受けると要求に応じて適宜、画像処理部432、ワークフロー管理部433、クラウドサービスアクセス部434、データ管理部435に処理を指示する。
The
The
The cooperation
(MFP cooperation service)
The
The
画像処理部432は、画像に対して文字領域解析、解析した文字領域に対する文字認識処理(以下OCR(Optical Character Recognition)処理という。)、類似帳票判定、画像の回転や傾き補正などの画像に対する認識処理や画像の加工処理を行う。類似帳票判定は、追って図5のS509~S510の処理で詳細に説明する。
ワークフロー管理部433は、ユーザがあらかじめ作成したスキャンから外部のクラウドサービスへの送信までの一連の処理方法、設定を定義したワークフローの管理を行う。具体的には、スキャンの読み込みに関する設定や、送信するクラウドサービスの送信先設定、格納先ディレクトリ設定、ファイル名の設定ルールの定義などの一連の設定等を管理する。
クラウドサービスアクセス部434は、クラウドサービスに対する処理の要求を行う。クラウドサービスは一般的にRESTやSOAPなどのプロトコルで、クラウドサービスにファイルを保存やメタデータを設定したり、保存したファイルを取得したりするための様々なインタフェースを公開している。クラウドサービスアクセス部434は、公開されたクラウドサービスのインタフェースを使用してクラウドサービスの操作を行う。
データ管理部435は、MFP連携サービス120で管理するユーザ情報や各種設定データ等を保持する。
表示制御部436は、インターネット経由で接続されたPCやモバイル等の別端末(不図示)上で動作しているウェブブラウザからのリクエストを受けて画面表示に必要な画面構成情報(HTML、CSS等)を返す。ユーザは、ウェブブラウザで表示される画面経由でMFP連携サービス120に登録しているユーザ情報を確認したり、スキャンする際の設定を変更したりする。
なお図4ではMFP110に追加機能部420をインストールする構成の例について説明したが、本件はこの構成に限定せず、クライアントPC111に追加機能部420の機能が含まれていてもかまわない。
The
The
The cloud
The
The
Although FIG. 4 describes an example of a configuration in which the additional function unit 420 is installed in the
<全体の処理シーケンス>
図5は、MFP110でスキャンした画像をファイル化してクラウドサービス130に送信する際の各装置間の処理の流れを示すシーケンス図である。ここでは、各装置間のやり取りを中心に説明する。なお、図5ではMFP110がMFP連携サービス120とやり取りを行う記載としているが、後述する解析結果取得、画面の表示、学習の指示等はMFP110でなくクライアントPC111が実行する構成でも構わない。
MFP110は、通常の状態では提供する各機能を実施するためのボタンを並べたメイン画面をタッチパネル上に表示する。
MFP110にスキャン帳票をクラウドストレージサービスに送信するための追加アプリケーション(以下「スキャンアプリ」という。)をインストールすることで、アプリケーションの機能を使用するボタンがMFP110のメイン画面に表示される。このボタンを押すとスキャンした帳票をクラウドサービスに送信するための画面が表示され、図5のシーケンスで示す処理が行われる。
S501で、スキャンアプリは、MFP連携サービス120にアクセスするための認証情報を入力するログイン画面を表示する。
S502で、ユーザはログインのための認証情報を入力し、MFP110は該情報をログイン要求としてMFP連携サービス120に送信する。
S503で、MFP連携サービス120は、ログイン要求に含まれるユーザ名とパスワードが正しいか検証し、正しければアクセストークンをMFP110に返す。以降のMFP110からMFP連携サービス120に対して行う各種リクエストにはこのアクセストークンと共に要求が出され、この情報により処理対象のユーザを特定することができる。ユーザ認証の方法は一般的に公知な手法(Basic認証、Digest認証、OAuthを用いた認可等)を用いて行う。
S504で、MFP連携サービス120は、事前にユーザが作成したスキャンの読み込み設定や、どのクラウドサービスに送信するかの送信先設定、格納先ディレクトリ設定、ファイル名の設定ルールを定義したワークフローの一覧をMFP110に送信する。
<Overall processing sequence>
FIG. 5 is a sequence diagram showing the flow of processing between devices when an image scanned by the
In a normal state, the
By installing an additional application (hereinafter referred to as "scan application") on the
In S501, the scan application displays a login screen for entering authentication information for accessing the
In S502, the user inputs authentication information for login, and the
In S503, the
In S504, the
S505で、MFP110は受信したワークフローの一覧をワークフロー選択画面に表示する。その後、ユーザは、ワークフロー選択画面からワークフローを選択し、原稿台ガラス又はADFにスキャンする対象の紙帳票を置き、「スキャン開始」ボタンを押下する。
S506で、MFP120はスキャンを実行して紙帳票を電子化した画像データを生成する。
そして、S507でMFP120はスキャン処理により生成した画像とともにスキャン画像の解析要求をMFP連携サービス120に送信する。
S508で、MFP連携サービス120は、スキャン画像の解析要求をリクエスト制御部431にて受信するとMFP連携サービス120の画像処理部432に画像解析を依頼する。その後、MFP連携サービス120は、画像解析処理の終了を待たずに、MFP連携サービス120に依頼した解析を一意に示す識別子である”processId”をMFP110に返す。
MFP連携サービス120は、要求受信後、画像処理部432で画像解析処理を行う。
画像解析処理では、まずS509で、画像処理部432は画像内に存在する文字領域の解析を行う。
続いてS510で、画像処理部432は、帳票内の文字領域の配置情報を利用して類似帳票判定の処理を行う。具体的には、使用したワークフローで過去にスキャンした画像の文字領域の配置情報と今回スキャンした画像の文字領域の配置情報を比較し、類似した文字領域の配置を持つ画像かどうかの判定を行う。この判定で使用する過去のスキャン画像の情報は後述するS518の処理により保存、蓄積されたものである。
続いてS511で、画像処理部432は、判定結果に基づいて、解析した領域に対して文字認識処理(OCR処理)を行う。なおS509~S511のOCR処理の詳細については図7で説明を行う。
MFP110は、S512でS507のレスポンスで受け取った”processId”を使用してMFP連携サービス120に定期的(例えば数百ミリ秒から数ミリ秒程度毎など)に”processId”の画像解析の処理状況の確認を行う。図では省略するが、S512の処理はMFP連携サービス120の画像処理完了のレスポンスが取得できるまで(S513のタイミングまで)継続して行う。MFP連携サービス120は、S512の処理状況確認の要求を受けると”processId”の処理の状況を確認し、レスポンスを返す。
In S505, the
In S506, the
Then, in S507, the
In S508, when the
After receiving the request, the
In the image analysis process, first in S509, the
Subsequently, in S510, the
Subsequently, in S511, the
The
レスポンスには、”status”に現在の処理状況を示す文字列が格納される。例えば”status”が”processing”の時は、MFP連携サービス120で「処理中」であることを示し、”completed”の時は処理が「完了」している状態であることを示す。なお、処理が「失敗」した場合に”failed”など、この他のステータスが返ることもある。また処理完了時(“status”が“completed”の場合)のレスポンスは、ステータスと共にスキャン画像を解析した結果やスキャン設定等の情報を含む。
続くS513で、MFP110が、処理の完了を検知すると、S514でレスポンスに含まれる結果情報が格納されたURLから結果情報を取得する。
そして、S515においてS514で取得した結果情報を使用してファイル名やメタデータを設定するための属性設定画面を表示する。図6Bは、MFP110で表示する属性設定画面の一例を示したものである。属性設定画面の詳細については後述する。
属性設定画面でワークフローの設定に基づきスキャン帳票にファイル名やメタデータを設定し、[OK]ボタン623を押す。
S516でファイル名やメタデータを設定するために使用した文字領域の情報をMFP連携サービス120に送信する。
S517で学習のリクエストを受信したMFP連携サービス120のリクエスト制御部431は、画像処理部432に帳票学習を依頼する。
S518で画像処理部432は画像全体の文字領域の情報とS516で受け取った、ユーザがファイル名やメタデータに使用した文字領域の入力情報を保存する。
また、ユーザが属性設定画面でOCR処理によって抽出した文字列の修正を行っている場合、S519でリクエスト制御部431は画像処理部432にOCR処理結果修正の学習を依頼する。
S520で画像処理部432はOCR処理結果の修正情報を保存する。S520の詳細については後述する。
In the response, a character string indicating the current processing status is stored in "status". For example, when "status" is "processing", it indicates that the
In subsequent S513, when the
Then, in S515, an attribute setting screen for setting a file name and metadata is displayed using the result information obtained in S514. FIG. 6B shows an example of an attribute setting screen displayed on the
On the attribute setting screen, set the file name and metadata for the scanned form based on the workflow settings, and press the [OK]
In S516, information on the character area used to set the file name and metadata is sent to the
The
In S518, the
Further, if the user is modifying a character string extracted by OCR processing on the attribute setting screen, the
In S520, the
その後、S521でMFP110はスキャン画像とスキャン画像をファイル化した後に設定するファイル名、メタデータ等の情報をMFP連携サービス120に送信する。
MFP連携サービス120はリクエストを受信するとファイル生成処理を開始するとともにリクエストを正常に受けたことをMFP110に返す。MFP110は送信のレスポンスを受けると処理を終了し、S505のワークフロー選択画面に戻る。
S522で、MFP連携サービス120は、MFP連携サービスに登録された一連の処理であるワークフローのスキャン設定からクラウドストレージ130に送信するファイルフォーマットの情報を取得する。そして、その設定に基づいてスキャン画像からファイルを生成する。
S523で、S521で受信したファイル名をS522で生成したファイルに設定してワークフローの設定で送信先に設定されているクラウドサービス130に送信する。クラウドサービス130からは、送信を受信したことをMFP連携サービス120に返信し、一連のシーケンスを終了する。
Thereafter, in S521, the
When the
In S522, the
In S523, the file name received in S521 is set in the file generated in S522, and the file is sent to the
(MFP、クライアントPCの表示画面)
図6A,BはMFP110又はクライアントPC111が表示する画面の一例を示す図である。
図6Aはスキャン済み帳票一覧画面600の一例を示す図である。本画面はスキャン及び画像解析処理が完了し、クラウドサービス130に送信前の帳票の一覧を閲覧することができる。また本画面はスキャン済み帳票一覧601、送信ボタン602、編集ボタン603、削除ボタン604から構成されている。
スキャン済み帳票一覧601はスキャン及び画像解析(S506~S511)が完了した帳票の一覧を表示する。スキャン済み帳票一覧601は帳票名605、送信先606、ステータス607、ワークフロー608から構成されている。帳票名605は帳票の名前を一意に識別する識別子である。送信先606は帳票のファイルを送信するクラウドサービス130の名前である。ステータス607は帳票に対して類似帳票判定を行った際の結果を示しており、「未学習」又は「学習済」のいずれかが表示される。「未学習」は使用したワークフローにおいて類似帳票が存在しないと判定された、「学習済」は類似帳票が存在したと判定されたことを意味している。ワークフロー608はS504で選択し実行したワークフロー名が表示される。例えばクラウドサービスAに送信するワークフローの1つを「ワークフローA1」の名称で作成した場合、「ワークフローA1」が表示される。またクラウドサービスAに送信するが、スキャン設定やファイル名、メタデータの設定ルールが異なる場合、「ワークフローA2」として別に作成可能であり、「ワークフローA2」が表示される。
送信ボタン602はクラウドサービス130に対して帳票を送信するためのボタンである。スキャン済み帳票一覧601から任意の帳票を選択し(マウスなどで選択することによりグレーアウト表示してもよい。)、送信ボタン602を押下することで送信先606に表示されているクラウドサービス130に対して送信を行う。なお送信が正常に完了した場合、その帳票は一覧から削除される。
編集ボタン603は、後述する図6Bの属性設定画面610に移動するためのボタンである。スキャン済み帳票一覧601から任意の帳票を選択し、編集ボタン603を押下することで選択した帳票の属性設定画面610へと移動する。
削除ボタン604は帳票の削除を行うボタンである。スキャン済み帳票一覧601から任意の帳票を選択し、削除ボタン604を押下することで選択した帳票を削除することができる。
(MFP, client PC display screen)
FIGS. 6A and 6B are diagrams showing examples of screens displayed by the
FIG. 6A is a diagram showing an example of a scanned
A list of scanned
The
The
The
図6Bは属性設定画面610の一例を示す図である。
ファイル名設定領域611は、ワークフローの作成時にユーザが定義したルールに基づきファイル名を設定する領域である。図6Bはワークフロー作成時に「{会社名}_{帳票番号}」のように帳票内の文字列を使用して“{会社名}”、“{帳票番号}”に該当する文字列を選択し、「{会社名}_{帳票番号}」に代入することでファイル名を決定する一例である。
ファイル名設定領域611には帳票から抽出する情報を示す項目名612と項目に対する情報を入力するテキストフィールド613と後述する文字領域の切り抜き画像614が表示される。S510で類似帳票がないと判定され未学習の帳票の場合、文字領域が選択されていない状態となり、テキストフィールドは空であり、切り抜き画像は設定されていない状態で表示される。S510で類似帳票があると判定された場合は、類似帳票で選択した文字領域を用いて、テキストフィールド613と切り抜き画像614が設定された状態となる。
ファイル名表示部615は、ユーザが設定したファイル名の設定ルールに基づきファイル名が表示される。また、項目名612に対応したテキストフィールド613の値が入力されている場合、ファイル名表示部615に記載の項目名はテキストフィールド613の値に置き換えられる。
FIG. 6B is a diagram showing an example of the
The file
Displayed in the file
The file
メタデータ設定領域616は、クラウドサービスに送信するメタデータの値を設定する領域である。メタデータ設定領域616には、ファイル名設定領域611と同様に項目名612Mとテキストフィールド613Mと文字領域の切り抜き画像614Mが表示される。メタデータ設定領域616内の項目名612Mは送信先のクラウドサービスで設定するメタデータ名が表示される。また送信先のクラウドサービスで複数のメタデータを設定可能な場合、項目名612Mとテキストフィールド613Mと文字領域の切り抜き画像614Mはそれぞれメタデータの数だけ表示しても良い。また送信先のクラウドサービスにメタデータの設定がない場合メタデータ設定領域616はなくてもよい。学習済みワークフローリスト617は、現在表示している帳票と同じ形状情報を持つ類似帳票を学習しているワークフロー一覧を表示し、項目名612ごとに学習情報の引き継ぎを行う。詳細の学習情報の引き継ぎ処理は図9、図10A~Eで説明する。プレビュー領域618は、スキャン画像を表示する。画像の文字領域をマウスオーバーすると、当該文字領域に線、枠線などの形状や色を付与する。さらに、テキストフィールド613に当該文字領域の文字列が表示される。また、切り抜き画像614に当該文字領域の切り抜き画像が表示される。マウスオーバーされる文字領域が変わるたびにテキストフィールド613及び切り抜き画像614が切り替わる。
The
[文字領域削除]ボタン619は、設定した文字領域に対応する文字を削除する。[プレビュー拡大]ボタン620は、プレビュー領域に表示している画像の拡大倍率を大きくする。[プレビュー縮小]ボタン621プレビュー領域に表示している画像の拡大倍率を小さくする。拡大および縮小時にプレビュー領域の中央の座標が拡大および縮小前と同一となるように表示位置の調整を行う。[プレビュー初期表示]ボタン622は、スワイプによるプレビュー画像の表示位置の移動や[プレビュー拡大]ボタン620や[プレビュー縮小]ボタン621を押して表示倍率を変更していた場合に、初期状態の倍率と表示位置に戻す。[OK]ボタン623は、属性設定画面で設定したファイル名とメタデータと共にスキャン画像をMFP連携サービス120へ送信し、帳票とOCR処理結果修正の学習処理(S516~S520)を実行する。このタイミングで、以降説明を行うOCR処理結果修正の学習処理も実行される。送信が完了するとスキャン済み帳票一覧画面600に戻る。
The [Delete text area]
・画像解析処理
図7は、本システムにおける画像処理部432が行う画像解析処理の詳細を示すフローチャートである。本フローは図5におけるS508~S511に相当する。
はじめにS701において、入力画像の文字領域を解析し、帳票内の文字領域群を取得する。
続いて、S702において、学習データと照合することにより類似帳票を推定する類似帳票判定を行う。これらのステップは図5で説明を行ったため詳細な説明は省略する。
判定の結果、S703において類似する帳票が見つかった場合(S703でYes)は、S704に進み、類似する帳票が見つからなかった場合(S703でNo)はS708に進む。
(類似帳票が見つかった場合)
S704では、見つかった類似帳票に登録されている文字領域に対応する対象帳票の文字領域を取得する。
そしてS705において、S704で取得した対応する文字領域に対して文字認識処理を実施し、文字列を抽出する。この処理により、対象帳票においてユーザが所望すると思われるファイル名やメタデータを、類似帳票のファイル名設定ルールやメタデータ設定ルールに基づいて提示することができる。
その後S706において、解析結果を学習済み帳票の保存領域に追加する。
最後にS707で学習済み帳票としてリクエスト制御部431に通知し本フローを終了する。
(類似帳票が見つからなかった場合)
S708では帳票の全文字領域に対して文字認識処理を実施し、文字列を抽出する。ここで全文字領域に対して文字認識処理を行うのは、類似帳票が存在しないと判定され、ファイル名やメタデータの設定に使用すると思われる領域が不明なためである。
その後S709において、解析結果を未学習帳票の保存領域に追加する。
S710で、未学習帳票としてリクエスト制御部431に通知し本フローを終了する。
- Image analysis processing FIG. 7 is a flowchart showing details of the image analysis processing performed by the
First, in S701, character areas of an input image are analyzed to obtain a group of character areas within a form.
Subsequently, in S702, similar form determination is performed to estimate similar forms by comparing with learning data. These steps have been explained with reference to FIG. 5, so a detailed explanation will be omitted.
As a result of the determination, if a similar document is found in S703 (Yes in S703), the process proceeds to S704, and if no similar document is found (No in S703), the process proceeds to S708.
(If similar documents are found)
In S704, the character area of the target form corresponding to the character area registered in the found similar form is acquired.
Then, in S705, character recognition processing is performed on the corresponding character area obtained in S704, and a character string is extracted. Through this process, file names and metadata that are considered desired by the user for the target form can be presented based on the file name setting rules and metadata setting rules for similar forms.
Thereafter, in S706, the analysis results are added to the learned form storage area.
Finally, in S707, the
(If no similar form is found)
In S708, character recognition processing is performed on the entire character area of the form, and character strings are extracted. The reason why the character recognition process is performed on the entire character area is because it is determined that no similar form exists and the area that is expected to be used for setting the file name and metadata is unknown.
Thereafter, in S709, the analysis results are added to the unlearned form storage area.
In S710, the
(データ構造)
図8は本システムにおける画像処理部432が行う解析結果保存処理で保存されるデータ構造の一例を示す図である。
はじめに図8(a)は解析結果のデータ構造の概要の一例を示す図である。ここでは大きく3つの保存領域が存在しており、S509の類似帳票判定処理の結果に基づいて分類されている。具体的には、類似帳票が存在しないと判定された帳票群は同一の保存領域に保存され、類似帳票が存在すると判定された場合は、最も類似する帳票毎に同一の保存領域に保存される。ワークフローごとに図8(a)の保存領域を持つ。
(data structure)
FIG. 8 is a diagram showing an example of a data structure saved in the analysis result saving process performed by the
First, FIG. 8(a) is a diagram showing an example of the outline of the data structure of the analysis result. There are roughly three storage areas here, which are classified based on the results of the similar form determination process in S509. Specifically, a group of documents for which it is determined that no similar documents exist are saved in the same storage area, and when it is determined that similar documents exist, the most similar documents are saved in the same storage area. . Each workflow has a storage area as shown in Figure 8(a).
次に図8(b)は解析結果のデータ構造の詳細の一例を示す図である。解析結果には図7のS704で解析した文字領域情報及びS705又はS708で抽出した文字列情報を含んでいる。ルートの“formList”は帳票のリストを表し、複数の帳票に関する解析結果が図8(a)で説明した単位で配列として格納される。各帳票は“formID”、“imageWidth”、“imageHeight”、“regions”を持つ。
“formID”は、帳票に付与される本システムで一意となる識別子である。
“imageWidth”は、解析した画像のX方向(横方向)のピクセル数を示す。
“imageHeight”は、解析した画像のY方向(縦方向)のピクセル数を示す。
“regions”は解析した画像から解析された文字領域の配置情報と文字情報の配列が含まれる。
次に“regions”内の情報について説明する。
“rect”には抽出した文字領域一つの座標を示す。“x”は領域の左上のX座標、“y”は領域の左上のY座標、“width”は領域のX方向のピクセル数、“height”は領域のY方向のピクセル数を示す。
“text”は”rect”の文字領域をOCRして文字認識を行った結果、抽出された文字列を示す。この“rect”と“text”の情報が解析したスキャン画像内の全文字領域分含まれる。
Next, FIG. 8(b) is a diagram showing an example of a detailed data structure of the analysis result. The analysis result includes character area information analyzed in S704 of FIG. 7 and character string information extracted in S705 or S708. The root "formList" represents a list of forms, and the analysis results regarding a plurality of forms are stored as an array in units as explained in FIG. 8(a). Each form has “formID”, “imageWidth”, “imageHeight”, and “regions”.
“formID” is an identifier that is unique in this system and is given to a form.
“imageWidth” indicates the number of pixels in the X direction (horizontal direction) of the analyzed image.
“imageHeight” indicates the number of pixels in the Y direction (vertical direction) of the analyzed image.
“regions” includes the arrangement information of character regions analyzed from the analyzed image and the arrangement of character information.
Next, the information in "regions" will be explained.
“rect” indicates the coordinates of one extracted character area. "x" indicates the X coordinate of the upper left corner of the region, "y" indicates the Y coordinate of the upper left corner of the region, "width" indicates the number of pixels in the X direction of the region, and "height" indicates the number of pixels in the Y direction of the region.
“text” indicates a character string extracted as a result of character recognition performed by OCR on the character area of “rect”. This "rect" and "text" information is included for the entire character area in the analyzed scan image.
・学習データの引き継ぎ処理
図9は、本システムにおけるS516~S520において実行中のワークフローに対して、他のワークフローで学習した抽出する文字領域の学習データの引き継ぎ処理の詳細を示すフローチャートである。図10A~Eの属性設定画面の例を用いて学習データの引き継ぎ処理のフローを説明する。なお、本処理フローは、MFP連携サーバー120のCPU311が、ROM312に格納されたプログラムをRAM313に展開して実行することにより実現される。
図10AはクラウドサービスAに送信するワークフローA1を実行した際の属性設定画面の例であり、既にスキャン画像の類似帳票を学習済みである。ワークフローA1ではファイル名を設定するために「会社名」と「帳票番号」の項目名を持ち、クラウドサービスAではメタデータNameを持つため「Name」を項目名に持つ。
図10BはクラウドサービスBに送信するワークフローB1を実行した際の属性設定画面の例であり、図10Aでスキャンした帳票と同じ画像をスキャンし、類似帳票は未学習である。ワークフローB1ではファイル名を設定するために「会社名」の項目名を持ち、クラウドサービスBではメタデータTitleを持つため「Title」を項目名に持つ。本実施例ではワークフローB1の「会社名」と「Title」に、ワークフローA1で学習した「会社名」と「Name」の文字領域の学習データの引き継ぎを行う例を用いて説明する。なお図10C、図10D、図10Eは属性設定画面における学習データの引き継ぎ時の画面遷移の例である。
S901で、CPU311は、図10Cの現在のプレビュー画面1001に表示されているスキャン画像の類似帳票を学習しているワークフローを取得する。
S902で、CPU311は、取得したワークフローの一覧を学習済みワークフローリストのプルダウンリスト1002に表示し、学習データを引き継ぎたいワークフローの選択が可能とする。またプルダウンリスト1002の選択肢にはワークフローからの引き継ぎしない場合も考慮し、引き継ぎしない主旨の項目も含まれている。S902においてワークフローが選択された場合(S902でYes)は、S903に進み、引き継ぎをしない選択肢を選択された場合(S902でNo)は、S906に進む。
- Handover process of learning data FIG. 9 is a flowchart showing details of the process of handing over the learning data of the character area to be extracted, which has been learned in another workflow, to the workflow being executed in S516 to S520 in this system. The flow of learning data handover processing will be explained using examples of attribute setting screens shown in FIGS. 10A to 10E. Note that this processing flow is realized by the
FIG. 10A is an example of an attribute setting screen when workflow A1 to be sent to cloud service A is executed, and similar forms of scanned images have already been learned. Workflow A1 has the item names "Company Name" and "Form Number" to set the file name, and cloud service A has the metadata Name, so it has "Name" as the item name.
FIG. 10B is an example of an attribute setting screen when executing workflow B1 for sending to cloud service B. The same image as the document scanned in FIG. 10A is scanned, and similar documents have not been learned. Workflow B1 has the item name "Company Name" to set the file name, and cloud service B has the item name "Title" because it has metadata Title. This embodiment will be described using an example in which the learning data of the character areas of "Company Name" and "Name" learned in Workflow A1 is inherited to "Company Name" and "Title" of Workflow B1. Note that FIGS. 10C, 10D, and 10E are examples of screen transitions when learning data is transferred on the attribute setting screen.
In S901, the
In S902, the
図10DはS902でワークフローA1を選択したときの例である。
S903では、CPU311は、S902で選択したワークフローの各項目名が抽出する文字領域を、プレビュー画面に線、枠線などの形状や色を付与する。これにより、図10Dの学習済み文字領域1003のように強調表示し文字領域を目視で確認できるようにする。またワークフローの各設定項目にS902で選択したワークフローの項目名のリストである学習済み項目リスト1004を表示する。学習済み項目リスト1004内にある引き継ぎ項目名1005にマウスオーバーすることにより、引き継ぎ項目名1005とその項目に対応する文字領域1006を、学習済み文字領域1003とは異なる同じ強調表示に変えて表示する。これにより引き継ぎ項目名1005と文字領域1006の対応関係を明確に分るようになる。
S904で、CPU311は、表示されている引き継ぎ項目1005がクリックやタッチ動作で関連付けのために選択されたことを受付ける。引き継ぎ項目1005を関連付けのための選択を受付けた場合(S904でYes)は、S905に進み、引き継ぎ項目1005の選択を受付けなかった場合(S904でNo)は、S906に進む。
S905で、CPU311は、プレビュー画面から対応する文字領域1006が選択状態になり、図6Bの説明と同様にテキストフィールド613と文字領域の切り抜き画像614が引き継ぎ項目1005と関連付けられて設定された状態で表示する。
S906では、CPU311は、図6Bで説明した方法でプレビュー画面から文字領域を選択してテキストフィールド613と文字領域の切り抜き画像614を項目名と関連付けて設定する。
FIG. 10D is an example when workflow A1 is selected in S902.
In S903, the
In S904, the
In S905, the
In S906, the
図10EはS904、S905において、「会社名」の項目にワークフローA1の「会社名」と同じ文字領域を、「Title」の項目にワークフローA1の「Name」と同じ文字領域を選択したときの例である。
S907で、CPU311は、図10Eの[OK]ボタン1007が押され学習を行う。
S908ではCPU311は、各項目名で選択されている文字領域がS902で選択した学習済みのワークフローと同じ文字領域であるか判断する。実行中のワークフローが学習済みのワークフローと同じ文字領域を使用した場合(S908でYes)は、S909に進む。そうでない場合(S908でのNo)は、S910に進み、帳票の抽出する文字領域を学習する。
S909で、CPU311は、学習済みのワークフローの学習データから類似帳票を判定するための帳票の形状情報(文字領域の配置情報等)を全種と、抽出する文字領域の文字列の情報を実行中のワークフローの項目が抽出する情報に複製する。これにより学習済みのワークフローが学習したことがある帳票の類似帳票であれば、実行中のワークフローが未学習であっても、同じ文字領域を抽出できるようになる。図10Eの例ではワークフローB1の項目名「会社名」はワークフローA1の項目名「会社名」の学習データが複製される。そうすると、ワークフローB1が一度も類似帳票をスキャンしたことがない帳票であっても、ワークフローA1が既に学習済みであれば、自動的に文字領域が選択された状態となる。またワークフローB1の項目名「Title」も同様にワークフローA1の「Name」の学習データが複製される。そのためクラウドサービス毎に設定されているメタデータ名が異なっていても同じ情報を帳票から取得したい場合、引き継ぎ処理を行うことで、スキャンした帳票の類似帳票以外の学習データも引き継ぐため、新たに帳票の形状ごとに学習し直す必要がなくなる。これにより例えば50種の帳票を学習済みのワークフローから別のワークフローに移行した際も、一度の引き継ぎ処理を行うことで50種類の帳票を学習した状態になる。
FIG. 10E is an example when the same text area as "Company Name" of Workflow A1 is selected in the "Company Name" item and the same text area as "Name" of Workflow A1 is selected in the "Title" item in S904 and S905. It is.
In S907, the
In S908, the
In S909, the
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
(Other examples)
The present invention provides a system or device with a program that implements one or more of the functions of the embodiments described above via a network or a storage medium, and one or more processors in the computer of the system or device reads and executes the program. This can also be achieved by processing. It can also be realized by a circuit (for example, ASIC) that realizes one or more functions.
110 MFP
120 MFP連携サービス
130 クラウドサービス
110 MFP
120 MFP cooperation service
130 Cloud Services
Claims (7)
該抽出された文字領域の情報に基づき、学習データと照合して類似帳票を判定する判定手段と、
該類似帳票に対応する文字領域の文字列の認識を行う認識手段と、
該文字領域の学習を行う学習手段と、
前記文字領域の学習データを一連の処理ごとに記憶する記憶手段とを有する情報処理装置であって、
第1の一連の処理において取得する文字領域を学習する際、スキャン画像の類似帳票を学習済みの一連の処理の一覧を表示する第1の表示手段と、
ユーザが前記学習済みの一連の処理の一覧から学習済みの第2の一連の処理を選択することにより、前記第2の一連の処理の学習済みの抽出する文字領域と、情報の項目のリストを表示する第2の表示手段と、
前記学習済みの第2の一連の処理で抽出する情報の項目と学習を行う第1の一連の処理で送信する情報の項目との関連付けを受け付ける受付手段と、
該関連付けに基づいて第2の一連の処理の学習データを第1の一連の処理の学習データに複製する複製手段
を有することを特徴とする情報処理装置。 an extraction means for extracting character area information from the scanned image data of the form;
a determination unit that determines similar forms by comparing the information with learning data based on the information of the extracted character area;
recognition means for recognizing a character string in a character area corresponding to the similar form;
a learning means for learning the character area;
An information processing device comprising a storage means for storing learning data of the character area for each series of processing,
a first display means for displaying a list of a series of processes that have been learned for similar forms of scanned images when learning character areas to be obtained in the first series of processes;
When the user selects a learned second series of processes from the list of learned processes, a list of learned character regions to be extracted and information items of the second series of processes is displayed. a second display means for displaying;
a reception unit that accepts an association between an item of information to be extracted in the learned second series of processes and an item of information to be transmitted in the first series of processes to perform learning;
An information processing apparatus comprising: duplication means for duplicating the learning data of the second series of processes into the learning data of the first series of processes based on the association.
該抽出された文字領域の情報に基づき、学習データと照合して類似帳票を判定する判定工程と、
該類似帳票に対応する文字領域の文字列の認識を行う認識工程と、
該文字領域の学習を行う学習工程と、
前記文字領域の学習データを一連の処理ごとに記憶手段に記憶する記憶工程とを有する情報処理装置の制御方法であって、
第1の一連の処理において取得する文字領域を学習する際、スキャン画像の類似帳票を学習済みの一連の処理の一覧を表示する第1の表示工程と、
ユーザが前記学習済みの一連の処理の一覧から学習済みの第2の一連の処理を選択することにより、前記第2の一連の処理の学習済みの抽出する文字領域と、情報の項目のリストを表示する第2の表示工程と、
前記学習済みの第2の一連の処理で抽出する情報の項目と学習を行う第1の一連の処理で送信する情報の項目との関連付けを受け付ける受付工程と、
該関連付けに基づいて第2の一連の処理の学習データを第1の一連の処理の学習データに複製する複製工程
を有することを特徴とする情報処理装置の制御方法。 an extraction step of extracting character area information from the scanned image data of the form;
a determination step of comparing the extracted character area information with learning data to determine similar forms;
a recognition step of recognizing a character string in a character area corresponding to the similar form;
a learning step of learning the character area;
A method for controlling an information processing device, comprising: storing learning data of the character area in a storage means for each series of processing,
a first display step of displaying a list of a series of processes that have been learned for similar forms of the scanned image when learning character areas to be obtained in the first series of processes;
When the user selects a learned second series of processes from the list of learned processes, a list of learned character regions to be extracted and information items of the second series of processes is displayed. a second display step of displaying;
a reception step of accepting an association between an item of information to be extracted in the learned second series of processes and an item of information to be transmitted in the first series of processes for learning;
A method for controlling an information processing apparatus, comprising: a duplication step of duplicating learning data for a second series of processes into learning data for a first series of processes based on the association.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022136284A JP2024032563A (en) | 2022-08-29 | 2022-08-29 | Information processing device, control method and program for information processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022136284A JP2024032563A (en) | 2022-08-29 | 2022-08-29 | Information processing device, control method and program for information processing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024032563A true JP2024032563A (en) | 2024-03-12 |
Family
ID=90192869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022136284A Pending JP2024032563A (en) | 2022-08-29 | 2022-08-29 | Information processing device, control method and program for information processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2024032563A (en) |
-
2022
- 2022-08-29 JP JP2022136284A patent/JP2024032563A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6953230B2 (en) | A device for setting a file name, etc. on a scanned image, its control method, and a program. | |
JP7391672B2 (en) | Image processing system, control method and program for digitizing documents | |
EP3890295A1 (en) | Information processing apparatus for obtaining character string | |
JP7317561B2 (en) | Image processing device for character input using touch panel, its control method and program | |
JP7271149B2 (en) | Apparatus, method and program | |
JP7225017B2 (en) | Image processing device for character input using touch panel, its control method and program | |
US11503170B2 (en) | Image processing apparatus, image processing method, and storage medium | |
US11800032B2 (en) | Apparatus, information processing method, and storage medium | |
JP2023072812A (en) | Information processing apparatus, method for controlling information processing apparatus, program therefor, and image processing system | |
US11528372B2 (en) | Image processing system for providing attribute information, image processing method and storage medium | |
JP2024032563A (en) | Information processing device, control method and program for information processing device | |
JP2021190834A (en) | Information processing device, processing method and program of the same | |
JP7358663B2 (en) | Image processing device for character input using a touch panel, its control method, and program | |
JP2020178280A (en) | Image processing device for setting properties on scanned image, control method of the same, and program | |
JP7387282B2 (en) | Image processing device that displays a preview of a scanned image, its control method, and program | |
US11620840B2 (en) | Image processing apparatus for extracting a desired character string from a scanned image | |
US20230085170A1 (en) | Server, method of controlling the server, and storage medium | |
JP2024040612A (en) | Information processing device, control method for information processing device, and program | |
US20230368558A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2022069405A (en) | Information processing device, information processing system and method and program for controlling information processing device | |
JP2023071227A (en) | Information processing device, method for controlling information processing device and program | |
JP2024034740A (en) | Image processing device, image processing system, image processing method, and program | |
JP2022083074A (en) | Information processing system | |
JP2023167871A (en) | Image processing apparatus, information processing apparatus, image processing system, image processing method, information processing method, and program | |
JP2021118534A (en) | Image processing system for digitizing document, control method of the same, and program |