JP2022100071A - 画像処理装置、画像処理システム、その制御方法及びプログラム - Google Patents

画像処理装置、画像処理システム、その制御方法及びプログラム Download PDF

Info

Publication number
JP2022100071A
JP2022100071A JP2020214215A JP2020214215A JP2022100071A JP 2022100071 A JP2022100071 A JP 2022100071A JP 2020214215 A JP2020214215 A JP 2020214215A JP 2020214215 A JP2020214215 A JP 2020214215A JP 2022100071 A JP2022100071 A JP 2022100071A
Authority
JP
Japan
Prior art keywords
image
image processing
transmission rate
certainty
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020214215A
Other languages
English (en)
Inventor
純也 荒川
Junya Arakawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2020214215A priority Critical patent/JP2022100071A/ja
Priority to US17/544,723 priority patent/US11647139B2/en
Publication of JP2022100071A publication Critical patent/JP2022100071A/ja
Priority to US18/223,721 priority patent/US20230370557A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00209Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax
    • H04N1/00214Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax details of transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00763Action taken as a result of detection
    • H04N1/00766Storing data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00763Action taken as a result of detection
    • H04N1/00774Adjusting or controlling
    • H04N1/00782Initiating operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3226Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image
    • H04N2201/3228Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image further additional information (metadata) being comprised in the identification information
    • H04N2201/3229Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image further additional information (metadata) being comprised in the identification information further additional information (metadata) being comprised in the file name (including path, e.g. directory or folder names at one or more higher hierarchical levels)

Abstract

【課題】文書ファイルの自動送信可否の判定に用いる確信度の適切な信頼度合いを柔軟に設定することを目的とする。【解決手段】本開示に係る画像処理装置は、文書のスキャン画像に対する文字認識処理の結果をプロパティに用いて文書ファイルを自動送信するための画像処理装置であって、文字認識処理の結果の確からしさを表す確信度を抽出する抽出手段と、抽出された確信度が所定の閾値を超える場合に、文字認識処理の結果をプロパティに用いた文書ファイルを自動送信可能と判定する判定手段と、設定手段と、を有する。設定手段は、自動送信される文書ファイルの誤送信率が、目標とする誤送信率を達成できるように所定の閾値を設定することを特徴とする。【選択図】 図9

Description

本発明は、本発明は、文書ファイルにプロパティを設定するための技術に関するものである。
従来、文書の管理手法として、紙文書をスキャンして電子化する手法が広く行われている。そして、文書の電子化に際して、スキャンされた画像であるスキャン画像に対して文字認識処理を行い、認識された文字を使ってファイル名等のプロパティに使用することも行われている。その際、認識された文字の確からしさを表す指標として確信度を参照してプロパティへの採否や文書ファイルの自動送信の可否を決定すること等も行われている。この点、例えば、特許文献1には、処理対象の画像(第1画像)に対する文字認識処理の結果について、その確信度に応じて、参照画像(第2画像)に対する文字認識結果との比較を行い、結果が一致しない場合に警告を出力する技術が開示されている。
特開2020-46819号公報
ここで、文書ファイルの自動送信の可否に上述の確信度を用いる場合を考える。この場合、自動送信を実行した文書ファイルについては、外部ストレージに送信してしまっている。そのため、自動送信済みの文書ファイルのファルダ名やファイル名に使用された文字列に誤りが含まれていたかについては、外部ストレージにアクセスしなければ知ることができない。自動送信においては、スキャン画像の誤送信率を一定以下に抑えること(最適な自動送信の成功率を実現すること)が重要である。そのためには、確信度の信頼度合いを正しく推定することが求められる。しかしながら、特許文献1の手法は、処理対象の画像とは別に参照画像が存在(すなわち、関連文書が存在)することを前提としている。また、確信度が信頼できる度合いを直接的に推定することはできない。
本開示の技術は、上記問題点に鑑みてなされたものであり、文書ファイルの自動送信可否の判定に用いる確信度の適切な信頼度合いを柔軟に設定できるようにすることを目的とする。
本開示に係る画像処理装置は、文書のスキャン画像に対する文字認識処理の結果をプロパティに用いて文書ファイルを自動送信するための画像処理装置であって、前記文字認識処理の結果の確からしさを表す確信度を抽出する抽出手段と、前記抽出手段で抽出された前記確信度が所定の閾値を超える場合に、前記文字認識処理の結果をプロパティに用いた文書ファイルを自動送信可能と判定する判定手段と、前記所定の閾値を設定する設定手段と、を備え、前記設定手段は、自動送信される文書ファイルの誤送信率が、目標とする誤送信率を達成できるように、前記所定の閾値を設定することを特徴とする。
本開示の技術によれば、文書ファイルの自動送信可否の判定に用いる確信度の適切な信頼度合いを柔軟に設定することができる。
本システムの全体構成を示す図である。 MFPのハードウェア構成図である。 クライアントPC及びMFP連携サーバのハードウェア構成図である。 本システムのソフトウェア構成図である。 各機器間の処理の流れを示すシーケンス図である。 MFPまたはクライアントPCが表示するスキャン済み帳票一覧画面及び編集画面の一例を示す図である。 本システムにおける画像処理部が生成する解析結果のデータ構造の一例を示す図である。 本システムにおける画像処理部が行う自動送信判定の詳細を示すフローチャートである。 本システムにおける画像処理部が行う確信度閾値設定の詳細を示すフローチャートである。 実施形態1の誤送信率を推定する方法の一例を示す図である。
以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。
[実施形態1]
<システム構成>
図1は、本実施形態に係る、画像処理システムの全体構成を示す図である。画像処理システムは、MFP(Multifunction Peripheral)110と、インターネット上でクラウドサービスを提供するサーバ装置120及び130とを含む。MFP110は、インターネットを介してサーバ装置120及び130と通信可能に接続されている。
MFP110は、スキャン機能を有する情報処理装置の一例である。MFP110は、スキャン機能に加え印刷機能やBOX保存機能といった複数の機能を有する複合機である。サーバ装置120及び130は、共にクラウドサービスを提供する情報処理装置の一例である。本実施形態のサーバ装置120は、MFP110から受け取ったスキャン画像に対し画像解析を行ったり、別のサービスを提供するサーバ装置130に対しMFP110からのリクエストを転送したりするクラウドサービスを提供する。以下、サーバ装置120が提供するクラウドサービスを「MFP連携サービス」と呼ぶこととする。サーバ装置130は、インターネットを介して送られてきたファイルを保存したり、クライアントPC(不示図)などのウェブブラウザからの要求に応じて保存ファイルを提供したりするクラウドサービス(以下、「ストレージサービス」と呼ぶ。)を提供する。本実施形態では、MFP連携サービスを提供するサーバ装置120を「MFP連携サーバ」と呼び、ストレージサービスを提供するサーバ装置130を「ストレージサーバ」と呼ぶこととする。
図1に示す画像処理システムの構成は一例であって、これに限定されない。例えば、MFP連携サーバ120の機能をMFP110が兼ね備えていてもよい。また、MFP連携サーバ120はインターネット上ではなくLAN(Local Area Network)経由でMFP110と接続されていてもよい。また、ストレージサーバ130を、メール配信サービスを行うメールサーバに置き換えて、文書のスキャン画像をメールに添付し送信する場面に適用してもよい。
<MFPのハードウェア構成>
図2は、MFP110のハードウェア構成を示すブロック図である。MFP110は、制御部210、操作部220、プリンタ部221、スキャナ部222、モデム223で構成される。
制御部210は、以下の各部211~219で構成され、MFP110全体の動作を制御する。CPU211は、ROM212に記憶された様々な制御プログラム(後述のソフトウェア構成図で示す各種機能に対応するプログラム)を読み出して実行する。RAM213は、CPU211の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施例では1つのCPU211が1つのメモリ(RAM213又はHDD214)を用いて後述のフローチャートに示す各処理を実行するものとするが、これに限定されない。例えば、複数のCPUや複数のRAM又はHDDを協働させて各処理を実行してもよい。HDD214は、画像データや各種プログラムを記憶する大容量記憶部である。操作部I/F215は、操作部220と制御部210とを接続するインタフェースである。操作部220には、タッチパネルやキーボードなどが備えられており、ユーザによる操作/入力/指示を受け付ける。なお、タッチパネルへのタッチ操作には、人の指による操作やタッチペンによる操作が含まれる。プリンタI/F216は、プリンタ部221と制御部210とを接続するインタフェースである。印刷用の画像データはプリンタI/F216を介して制御部210からプリンタ部221へ転送され、紙等の記録媒体上に印刷される。スキャナI/F217は、スキャナ部222と制御部210とを接続するインタフェースである。スキャナ部222は、不図示の原稿台やADF(Auto Document Feeder)にセットされた原稿を光学的に読み取ってスキャン画像データを生成し、スキャナI/F217を介して制御部210に入力する。スキャナ部222で生成されたスキャン画像データは、プリンタ部221にて印刷したり(コピー出力)、HDD214に保存したり、LANを介してMFP連携サーバ120等の外部装置にファイル送信したりすることができる。モデムI/F218は、モデム223と制御部210とを接続するインタフェースである。モデム223は、PSTN上のファクシミリ装置(不図示)との間で画像データをファクシミリ通信する。ネットワークI/F219は、制御部210(MFP110)をLANに接続するインタフェースである。MFP110は、ネットワークI/F219を用いて、スキャン画像データをMFP連携サーバ120に送信したり、MFP連携サーバ120から各種データを受信したりする。
以上説明したMFP110のハードウェア構成は一例であり、必要に応じてその他の構成を備えるものであってもよいし、一部の構成を有していなくてもよい。
<サーバ装置のハードウェア構成>
図3は、MFP連携サーバ120及びストレージサーバ130のハードウェア構成を示すブロック図である。MFP連携サーバ120とストレージサーバ130は共通のハードウェア構成を有し、CPU311、ROM312、RAM313、HDD314及びネットワークI/F315で構成される。CPU311は、ROM312に記憶された制御プログラムを読み出して各種処理を実行することで、全体の動作を制御する。RAM313は、CPU311の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD314は、画像データや各種プログラムを記憶する大容量記憶部である。ネットワークI/F315は、制御部310をインターネットに接続するインタフェースである。MFP連携サーバ120及びストレージサーバ130は、ネットワークI/F315を介して他の装置(MFP110など)から様々な処理のリクエストを受け、当該リクエストに応じた処理結果を返す。
<画像処理システムのソフトウェア構成>
図4は、本実施形態に係る、画像処理システムのソフトウェア構成を示すブロック図である。以下、画像処理システムを構成するMFP110及び、MFP連携サーバ120及びストレージサーバ130それぞれの役割に対応したソフトウェア構成を、順に説明する。なお、以下では、各装置が有する諸機能のうち、文書をスキャンして電子化(ファイル化)し、ストレージサーバ130に保存を行うまでの処理に関わる機能に絞って説明を行うものとする。
≪MFPのソフトウェア構成≫
MFP110の機能モジュールは、ネイティブ機能モジュール410とアディショナル機能モジュール420の2つに大別される。ネイティブ機能モジュール410はMFP110に標準的に備えられたアプリケーションであるのに対し、アディショナル機能モジュール420はMFP110に追加的にインストールされたアプリケーションである。アディショナル機能モジュール420は、Java(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しない他の追加アプリケーションがインストールされていてもよい。
ネイティブ機能モジュール410は、スキャン実行部411及びスキャン画像管理部412を有する。また、アディショナル機能モジュール420は、表示制御部421、スキャン制御部422、連携サービスリクエスト部423、画像処理部424を有する。表示制御部421は、操作部220のタッチパネルに、各種のユーザ操作を受け付けるためのUI(User Interface)画面を表示する。各種のユーザ操作には、例えば、MFP連携サーバ120へアクセスするためのログイン認証情報の入力、スキャン設定、スキャンの開始指示、ファイル名設定、ファイルの保存指示などがある。スキャン制御部422は、UI画面でなされたユーザ操作(例えば、「スキャン開始」ボタンの押下)に応じて、スキャン設定の情報と共にスキャン実行部411に対しスキャン処理の実行を指示する。スキャン実行部411は、スキャン制御部422からのスキャン処理の実行指示に従い、スキャナI/F217を介してスキャナ222に文書の読み取り動作を実行させ、スキャン画像データを生成する。生成したスキャン画像データは、スキャン画像管理部412によってHDD214に保存される。この際、保存されたスキャン画像データを一意に示すスキャン画像識別子の情報が、スキャン制御部422へ通知される。スキャン画像識別子は、MFP110においてスキャンした画像をユニークに識別するための番号や記号、アルファベットなどである。スキャン制御部422は、例えばファイル化する対象のスキャン画像データを上記のスキャン画像識別子を使ってスキャン画像管理部412から取得する。そして、ファイル化のために必要な処理のリクエストをMFP連携サーバ120に対して行うよう、連携サービスリクエスト部423に対して指示する。連携サービスリクエスト部423は、MFP連携サーバ120に対して各種処理のリクエストを行ったり、そのレスポンスを受け取ったりする。各種処理には、例えば、ログイン認証、スキャン画像の解析、スキャン画像データの送信などが含まれる。MFP連携サーバ120とのやり取りにはRESTやSOAPなどの通信プロトコルが使用される。画像処理部424は、スキャン画像データに対し所定の画像処理を行って、表示制御部421が表示するUI画面で用いられる画像を生成する。
なお、MFP110とは異なる装置(不図示のクライアントPCなど)が、上述のアディショナル機能モジュール420を備えていてもよい。すなわち、MFP110にて得たスキャン画像の解析リクエストや解析結果に基づくファイル名の設定等を、クライアントPCで行うようなシステム構成でも構わない。
≪サーバ装置のソフトウェア構成≫
まず、MFP連携サーバ120のソフトウェア構成について説明する。MFP連携サーバ120は、リクエスト制御部431、画像処理部432、ストレージサーバアクセス部433、データ管理部434、表示制御部435を有する。リクエスト制御部431は、外部装置からのリクエストを受信できる状態で待機しており、受信したリクエスト内容に応じて、画像処理部432、ストレージサーバアクセス部433、データ管理部434に対し所定の処理の実行を指示する。画像処理部432は、MFP110から送られてくるスキャン画像データに対して、文字領域の検出処理、文字認識処理(OCR処理)、類似文書の判定処理、自動送信判定の処理といった画像解析処理の他、回転や傾き補正といった画像加工処理を行う。なお、以下では、スキャン画像から検出される文字領域を「文字領域」と呼ぶ。また、対象となる文書として、見積書や請求書といった帳票を例に説明を行うこととし、そのスキャン画像を「帳票画像」と呼ぶ。ストレージサーバアクセス部433は、ストレージサーバ130に対する処理のリクエストを行う。クラウドサービスでは、RESTやSOAPなどのプロトコルを用いてストレージサーバにファイルを保存したり、保存したファイルを取得したりするための様々なインタフェースを公開している。ストレージサーバアクセス部433は、公開されたインタフェースを使用して、ストレージサーバ130に対するリクエストを行う。データ管理部434は、リクエスト制御部431からの指示を受けて、スキャン画像を含む文書ファイルを生成する。その際、当該スキャン画像に含まれる文字列について文字認識処理した結果に基づくファイル名を設定する。表示制御部435は、インターネット経由で接続されたPCやモバイル端末(いずれも不図示)上で動作しているウェブブラウザからのリクエストを受けて、画面表示に必要な画面構成情報(HTML、CSS等)を返す。ユーザは、ウェブブラウザで表示される画面経由で、登録されているユーザ情報を確認したり、スキャン設定を変更したりできる。
次に、ストレージサーバ130のソフトウェア構成について説明する。ストレージサーバ130は、リクエスト制御部(不示図)、ファイル管理部(不示図)、表示制御部(不示図)を有する。リクエスト制御部(不示図)は、外部装置からのリクエストを受信できる状態で待機しており、本実施形態においてはMFP連携サーバ120からのリクエストに応じて、受信したファイルの保存や保存ファイルの読み出しをファイル管理部(不示図)に指示する。そして、リクエストに応じたレスポンスをMFP連携サーバ120に返す。表示制御部(不示図)は、インターネット経由で接続されたPCやモバイル端末(いずれも不図示)上で動作しているウェブブラウザからのリクエストを受けて、画面表示に必要な画面構成情報(HTML、CSS等)を返す。ユーザは、ウェブブラウザで表示される画面経由で、保存ファイルを確認したり取得したりすることができる。
<全体の処理の流れ>
図5は、MFP110で文書(例えば、見積書等の帳票)をスキャンし、得られたスキャン画像をファイル化してストレージサーバ130に保存する際の、装置間の処理の流れを示すシーケンス図である。なお、図5のシーケンス図は、スキャン画像をファイル化する際に付与されるファイル名を設定する場合の説明となっているが、ファイル名の他、フォルダパスやメタデータといったプロパティ全般に適用可能である。
MFP110は、起動時にメインメニューのUI画面(以下、「メイン画面」と呼ぶ。)を表示する。文書をスキャンしてファイル化し、クラウドストレージサービスの利用に必要な専用のアプリケーションをMFP110にインストールすることで、メイン画面上に「スキャンしてクラウドストレージに保存」ボタンが表示されるようになる。そして、ユーザがメイン画面内に表示されたメニューボタンの中から「スキャンしてクラウドストレージに保存」ボタンを押下すると、図5のシーケンス図で示される一連の処理が開始する。以下、図5のシーケンス図に沿って、装置間のやり取りを時系列に説明する。なお、以下の説明において記号「S」はステップを表す。
S501において、MFP110は、MFP連携サーバ120にアクセスするためのログイン認証の情報を入力するUI画面(以下、「ログイン画面」と呼ぶ。)を操作部220に表示する。ログイン画面には、「ログイン」ボタン、ID入力欄及びパスワード入力欄が含まれる。
S502において、ユーザが、予め登録されているユーザIDとパスワードとを、ログイン画面上のID入力欄及びパスワード入力欄にそれぞれ入力し「ログイン」ボタンを押下すると、ログイン認証のリクエストがMFP連携サーバ120に送信される。
S503において、ログイン認証のリクエストを受けたMFP連携サーバ120は、当該リクエストに含まれるユーザIDとパスワードを用いて認証処理を行う。認証処理の結果、正規のユーザであることが確認されれば、MFP連携サーバ120は、アクセストークンをMFP110に返す。以後、MFP110からMFP連携サーバ120に対して行う各種リクエストの際にこのアクセストークンを一緒に送ることで、ログイン中のユーザが特定される。本実施形態では、MFP連携サーバ120へのログインの完了によって、ストレージサーバ130へのログインも同時に完了するものとする。このためにユーザは、インターネット上のPC(不図示)のウェブブラウザ等を介して、MFP連携サービスを利用するためのユーザIDとストレージサービスを利用するためのユーザIDとの紐付けを予め行っておく。これにより、MFP連携サーバ120へのログイン認証に成功すれば同時にストレージサーバ130へのログイン認証も完了し、ストレージサーバ130にログインするための操作を省略できる。そして、MFP連携サーバ120においては、自装置にログインしたユーザからのストレージサービスに関するリクエストにも対応可能となる。なお、ログイン認証の方法は一般的に公知な手法(Basic認証、Digest認証、OAuthを用いた認可等)を用いて行えばよい。
S504において、ログインが完了すると、MFP110では、スキャン設定用のUI画面(以下、「スキャン設定画面」と呼ぶ。)が操作部220に表示される。スキャン設定画面には、「スキャン開始」ボタン、カラー設定欄、解像度設定欄が存在する。「スキャン開始」ボタンは、原稿台にセットした文書(本実施形態では見積書や請求書といった帳票を想定)に対するスキャン処理の開始を指示するためのボタンである。カラー設定欄では、スキャン時のカラーモードを設定する。例えばフルカラーやモノクロといった選択肢の中から指定できるようになっている。解像度設定欄では、スキャン時の解像度を設定する。例えば600dpiや1200dpiといった選択肢の中から指定できるようになっている。なお、カラーモードと解像度は設定項目の一例であって、これらすべてが存在しなくてもよいし、これら以外の設定項目が存在してもよい。また、カラーモードや解像度に関する選択肢を、ストレージサービスの要求する設定値のみに限定したりしてもよい。ログイン中のユーザは、このようなスキャン設定画面を介してスキャン処理についての詳細な条件設定を行なう。
S505において、スキャン設定を終えたログイン中のユーザが、MFP110の原稿台にスキャン対象の文書をセットし、「スキャン開始」ボタンを押下するとスキャンが実行される。これにより、紙文書を電子化したスキャン画像データが生成される。
S506において、スキャンの完了後、MFP110は、当該スキャンをすることによって得られたスキャン画像を、そのスキャン画像を解析するためのリクエストである解析リクエストと共にMFP連携サーバ120に送信する。
S507において、スキャン画像の解析リクエストを受けたMFP連携サーバ120では、リクエスト制御部431が画像処理部432に対し、画像解析処理(S508~S511)の実行を指示する。その際、リクエスト制御部431は、受信した解析リクエストを一意に特定可能なリクエストID(“processId”)をMFP110に返す。
MFP連携サーバ120は、要求受信後、画像処理部432で画像解析処理を行う。
S508において、画像解析処理の実行指示を受けた画像処理部432は、解析リクエストに係るスキャン画像に対する画像解析処理を実行する。この画像解析処理では、まず、画像解析処理の対象となるスキャン画像(以下、「対象画像」と呼ぶ。)内に存在する文字領域を検出する処理(文字領域検出処理)を行う。文字領域の検出は、例えば、ある閾値で2値化を行った画像から文字と推測される矩形領域を抽出する方法等、既知の方法(例えば、ブロックセレクション処理など)を適用すればよい。
S509において、画像処理部432は、画像解析処理の対象となる紙文書の画像データが以前に電子化された紙文書の画像と類似しているかどうかを学習データと照合して判定する処理を行う。例えば、画像解析処理の対象となる紙文書の例として、見積書等の帳票が挙げられる。また、画像解析処理の対象となる帳票の画像データが以前に電子化された帳票の画像と類似しているかどうかを学習データと照合して判定する処理のことを、以下、「類似帳票判定処理」と呼ぶ。この類似帳票判定処理では、対象画像内に存在する領域であり且つ、後述の文字認識処理の対象となる文字列が含まれる領域である文字領域(以下、「文字領域」と呼ぶ。)が当該対象画像内のどこにそれぞれ位置するかを示す情報である配置情報が用いられる。具体的には、今回生成する対象帳票画像の配置情報と、学習データに蓄積された過去の帳票画像の配置情報とを比較し、文字領域の配置が同一又は類似であるかどうかを判定する。これは、文字領域の配置が同一又は類似の関係にあれば、それらは同一の文書フォーム(帳票フォーム)を用いて作成された同種の帳票であると推測できることに基づいている。以下、類似帳票判定処理の対象となる帳票画像に係る文書の文書フォーマットと同一の文書フォーマットを有する帳票を「類似帳票」と呼ぶ。また、類似帳票をスキャンして得られたスキャン画像を「類似帳票画像」と呼ぶ。また、対象画像に係る文書とその対象画像に対応する類似帳票とが、同一の文書フォーマットを有していることを、以下、単に「類似する」などと表記する場合がある。この類似帳票判定処理で使用する過去の帳票画像の配置情報は、学習データとして蓄積される。なお、本実施形態では、文字領域の配置の一致度合いのみに基づき帳票の類否判定を行っているが、例えば、文字認識処理の結果から帳票の種別(見積書、請求書等)を特定し、得られた種別の情報を加味して類否判定を行ってもよい。
S510において、画像処理部432は、文字領域検出処理によって見つかった各文字領域に対して、文字認識処理を実行する。
S511において、画像処理部432は、今回の対象画像の文書ファイルを自動送信の対象にしてもよいか否かの判定処理(以下、「自動送信判定処理」と呼ぶ。)を実行する。自動送信判定処理の詳細については図8を用いて後述する。
S512において、MFP110は、上記画像解析処理が行われている間、上述のリクエストIDを使用して、MFP連携サーバ120に対して定期的(例えば数百ミリ秒から数ミリ秒程度毎)に画像解析処理の状況の確認を行う(S512~S513)。この確認は、MFP連携サーバ120から画像解析処理が完了したことを表す情報を含むレスポンスが取得できるまで繰り返し実行される。MFP連携サーバ120のリクエスト制御部431は、画像解析処理の状況の確認をするためのリクエストを受けると、リクエストIDに対応する画像解析処理の進行状況を確認する。他方、画像解析処理が完了していた場合は、完了レスポンスを返す。これらレスポンスの“status”には現在の処理状況を示す文字列が入る。具体的には、MFP連携サーバ120で処理が行われている最中である場合(処理中レスポンス)には“processing”が入り、処理が完了している場合(完了レスポンス)には“completed”が入る。なお、処理が失敗した場合の“failed”など、他のステータスを表す文字列が入ることもある。また、完了レスポンスには、画像解析処理の結果の格納先を示すURLなどの情報も含まれる。そして、MFP110は、上記画像解析処理の完了レスポンスを取得すると、当該完了レスポンスに含まれる、画像解析処理の結果の格納先を示すURLを用いて、画像解析処理の結果を取得するためのリクエストを、MFP連携サーバ120に対して送信する。MFP連携サーバ120のリクエスト制御部431は、当該リクエストを受信すると、画像解析処理の結果を含む情報(結果情報)をMFP110に返信する。この際の結果情報には、対象画像について文字領域判定処理の結果、類似帳票判定処理の結果、文字認識処理の結果、自動送信判定処理の結果が含まれる。
そして、自動送信判定処理の結果が「自動送信不可能」であった場合、ユーザに編集や修正等を促すため、後述するS515~S519の処理を実行する。他方、自動送信判定処理の結果が「自動送信可能」であった場合には、後述するS515~S519の処理を実行することなくS521に進み、対象画像の文書ファイルが自動生成されてストレージサーバ130に対して自動送信される(S522)。文書ファイルの自動生成の際には、文字認識処理で得られた文字列がそのファイル名に使用される。
自動送信判定処理の結果が「自動送信不可能」であった場合、S515において、MFP110は、ユーザがファイル名を設定して送信するためのUI画面を表示する。この際のUI画面の例としては、後述するスキャン済み帳票一覧画面(図6(a))や編集画面(図6(b))が挙げられる。
ユーザによって文書ファイルの保存が指示されると、S516において、MFP110の連携サービスリクエスト部423は、ファイル名設定情報を学習して保存するためのリクエストをMFP連携サーバ120に対して送信する。以下、当該リクエストを「ファイル名設定情報保存リクエスト」と呼ぶ。そして、設定情報保存リクエストには帳票の種別に関する情報を学習(以下、「帳票学習」と呼ぶ。)させるためのリクエストも含まれる。また、MFP110の連携サービスリクエスト部423は、ファイル名設定情報保存リクエストと併せて、再度の類似帳票判定処理を行うためのリクエストをMFP連携サーバ120に対して送信する。以下、再度の類似帳票判定処理を行わせるためのリクエストを「類似帳票再判定リクエスト」と呼ぶ。ここで、確定文字列の修正が行われなかった場合のファイル名設定情報には、文字認識処理された結果、最も確からしい文字列としてフォルダ名入力欄614等に表示された文字列に関する情報が含まれることとなる。さらに、この場合のファイル名設定情報には、その文字列の文字領域情報、その文字列が記載されていた帳票の種別に関する情報を含んでもよい。また、確定文字列の修正が行われた場合のファイル名設定情報には、その修正前後の文字列の情報をさらに含むことになる。
S517において、MFP連携サーバ120のリクエスト制御部431は、ファイル名設定情報保存リクエストをMFP110から受信した場合、画像処理部432に対して当該ファイル名設定情報を保存することを指示する。また、MFP連携サーバ120のリクエスト制御部431は、類似帳票再判定リクエストをMFP110から受信した場合、画像処理部432に対して類似帳票再判定処理の実行を指示する。
S518において、画像処理部432は、リクエスト制御部431からの上記保存指示を受けて、ファイル名設定情報を保存するための処理(以下、「設定情報保存処理」と呼ぶ。)を実行する。設定情報保存処理では、スキャン画像全体における文字領域の情報と、ユーザがファルダ名等に使用したスキャン画像内の文字領域および文字認識結果情報が保存されることとなる。
S519において、画像処理部432は、対象画像について、類似帳票がなかったと判定され、ファイル名等の修正が実行されていない当該対象画像について、再度の類似帳票判定処理を行う。以下、再度の類似帳票判定処理を「類似帳票再判定処理」と呼ぶ。他方、対象画像について、類似帳票が存在していた場合には、学習データに基づきファイル名が自動で設定される。そして、画像処理部432は、設定情報保存処理や類似帳票再判定処理が完了したことを表すステータス情報を含む情報をリクエスト制御部431に渡す。さらに、リクエスト制御部431は、画像処理部432から設定情報保存処理等が完了したことを表すステータス情報を含む情報を取得すると、その事実を表すステータス情報を含むレスポンスをMFP110に対して送信する。
S520において、MFP110は、リクエスト制御部431からのレスポンスを取得すると、当該レスポンスに含まれる情報に基づいて、ファイルを生成するためのリクエスト(以下、「ファイル生成リクエスト」と呼ぶ。)をMFP連携サーバ120に送信する。MFP連携サーバ120のリクエスト制御部431は、ファイル生成リクエストを受信すると、ファイル生成処理を開始するとともに、ファイル生成リクエストを正常に受けたことを表す情報を含むレスポンスをMFP110に返す。MFP110は、リクエスト制御部431からの当該レスポンスを受けると処理を終了し、S504のスキャン設定画面表示に戻る。
S521において、MFP連携サーバ120では、事前に登録されたスキャン設定からファイルフォーマットの情報を取得し、当該ファイルフォーマットに従って対象画像がファイル化(生成)される。
S522において、リクエスト制御部431は、生成されたファイルをストレージサーバ130に送信する。そして、S522において、ストレージサーバ130は、MFP連携サーバ120から送信されたファイルを受信すると、当該ファイルの送信が完了したステータスを表すレスポンスをMFP連携サーバ120に返す。
以上が、画像処理システム全体の処理の大まかな流れである。なお、図5のシーケンス図では、MFP110がMFP連携サーバ120とやり取りを行う内容となっているが、画像解析処理の結果取得、UI画面の表示、学習指示等は、クライアントPC(不図示)等で行なう構成でもよい。
≪スキャン済み帳票一覧画面≫
図6(a)はスキャン済み帳票一覧画面の一例を示す図である。本画面では、ストレージサーバ130に送信する前の帳票のスキャン画像の一覧を閲覧することができる。
また本画面は、帳票リスト601、「送信」ボタン602、「編集」ボタン603、「削除」ボタン604から構成されている。帳票リスト601は画像解析処理が完了したファイル未送信の帳票の一覧を表示する領域である。
帳票リスト601は、帳票ID605、送信先606、ステータス607、ファイル名608の各項目で構成されている。帳票ID605には、帳票を一意に識別する識別子が入る。送信先606には、送信先となるストレージサーバ130の情報が入る。ステータス607には、類似帳票判定処理を行った結果が示され、「未学習」又は「学習済」のいずれかが表示される。「未学習」はそのスキャン画像に類似する帳票画像が過去に存在しないことを表している。他方、「学習済」はそのスキャン画像に類似する帳票画像が過去に存在したことを表している。ファイル名608には、類似する帳票画像が過去に存在した場合に、当該帳票画像に設定されたファイル名が入る。通常、ファイル名608について、ステータス607が「未学習」の場合はファイル名が設定されていない状態であるため空白となっている。
「送信」ボタン602は、ストレージサーバ130に対して帳票画像が含まれる文書ファイルを送信するためのボタンである。帳票リスト601から任意の帳票IDを選択し、「送信」ボタン602を押下することで送信先606に表示されているストレージサーバ130に対して送信を行う。送信が正常に完了した場合、その帳票IDに係るデータは帳票リスト601から削除される。
「編集」ボタン603は、編集画面610に遷移するためのボタンである。帳票リスト601から任意の帳票IDを選択し、「編集」ボタン603を押下することで選択した帳票IDに係るスキャン画像についての編集画面610へと遷移する。
「削除」ボタン604は選択した帳票IDに係るデータの削除を行うボタンである。帳票リスト601から任意の帳票IDを選択し、「削除」ボタン604を押下することで選択した帳票IDに係るデータを削除することができる。
≪編集画面≫
図6(b)は編集画面の一例を示す図である。本画面は、スキャン済み帳票一覧画面600の「編集」ボタン603が押下されることによりスキャン済み帳票一覧画面600から編集画面610へと遷移する。本画面はスキャン画像表示領域611、「キャンセル」ボタン612、「編集終了」ボタン613、フォルダ名入力欄614、ファイル名入力欄615、「日付入力」ボタン616、「ユーザID」入力ボタン617から構成される。
スキャン画像表示領域611には対象のスキャン画像が表示され、背景がグレーで表示された各文字領域が、ユーザが認識可能に表示される。この例においては、類似すると判定された過去の帳票画像に関する情報に基づいて所定の文字領域に対して文字認識処理が実行されている。具体的には、スキャン画像内の「見積書」の文字領域618、「INV20200604」の文字領域619に対して文字認識処理がされている。文字領域618の左上の記号「P2」は、過去の帳票画像についてフォルダ名を設定する際に2番目の文字列として利用された文字列が表示されていた文字領域を表す。文字領域618の左下の記号「F1」は、過去の帳票画像についてファイル名を設定する際に1番目の文字列として利用された文字列が表示されていた文字領域を表す。文字領域619の左上の記号「F2」は、過去の帳票画像についてファイル名を設定する際に2番目の文字列として利用された文字列が表示されていた文字領域を表す。このように、これらの文字領域に関する情報は、対象のスキャン画像における文字認識処理の対象となる文字領域とそれぞれ対応している。そして、例えば、フォルダ名入力欄614については、1番目の文字列として、スキャンを行った日付(例えば、2020年6月4日)が自動入力されている。そして、2番目の文字列である「見積書」が区切り文字「_」で連結され、「20200604_見積書」として、予め入力されている。また、ファイル名入力欄615についても同様に、1番目の文字列について帳票の種別を表す文字列が入力され、2番目の文字列について帳票の管理番号を表す文字列が入力されている。このようにして、ファイル名入力欄615には、予め「見積書_INV20201234」といったファイル名候補が表示されることとなる。このように自動入力されたフォルダ名やファイル名を変更したいユーザは、フォルダ名入力欄614を押下し、例えばスキャン画像表示領域611内の文字領域を指定する。或いは、「日付入力」ボタン616や「ユーザID」入力ボタン617を押下することで対応する文字列を入力してもよい。こうして入力される文字列は区切り文字列である「_」で連結される。同様の方法で、ファイル名についてもユーザは任意の修正を行うことができる。なお、文字認識処理がされていない文字領域があった場合は、適宜、MFP連携サーバ120に文字認識処理をリクエストし、文字認識結果を取得してもよい。
ユーザが「編集終了」ボタン613を押下すると、フォルダ名やファイル名が確定して、スキャン済み帳票一覧画面600に遷移する。遷移後のスキャン済み帳票一覧画面600における帳票リスト601では、確定後の内容がファイル名608に反映される。ユーザが「キャンセル」ボタン612を押下すると、スキャン済み帳票一覧画面600に戻る。
<解析結果の一例>
図7は、解析処理の結果を示すデータ構造の一例を示す図である。“enabledAutoTransmission”には、対象画像がS511の自動送信判定処理により、ユーザの確認や学習を行わずにストレージサーバ130への送信の可否を示す値(「true」や「false」)が格納される。“confidence”には、文字認識処理(S510)の結果のうちファイル名欄等に自動入力された文字列単位の確信度(後述する全体確信度)の値が格納される。この値は、0~1までの実数値で表される。そして、当該実数値が大きいほど、文字認識処理(S510)の結果が誤っている可能性が低く、対象画像を自動送信するのに適していることとなる。画像処理部432は、この値を参照することで、対象画像をストレージサーバ130に自動送信するか、スキャン済み帳票一覧601に表示することでユーザの学習・修正を促すかを決定する。クライアントPC(不示図)は、この値を参照することに基づいて、対象帳票を自動でストレージサーバ130に送信するか否かを決定する。“matched”には、S509において、対象画像に係る帳票と類似する種別である帳票をスキャンして得られたスキャン画像である類似帳票が見つかったかどうかを示す値が格納される。“formId”には、類似する帳票があった場合はその帳票を一意に示す値が格納される。他方、類似する帳票がなかった場合には新たな値が発行され、当該新たな値が格納される。“matchingScore”には、類似する帳票があった場合にどの程度類似していたかを示す値が格納される。“matchingScore”は過去にスキャンした画像の配置情報と今回スキャンした画像の配置情報とが一致する度合いを0~1までの実数値で表す。そして、当該実数値が大きいほど、今回スキャンした画像は、過去にスキャンした画像に類似しているということになる。“rectInfoArray”には、類似する帳票に対して以前にユーザがファイル名を設定したときに使用した文字領域に対応する、今回の解析対象の画像の文字領域を示す情報が格納される。例えば、画像を以前にスキャンして「見積書」と「INV20201234」を使用してファイル名を設定し入力結果学習したとする。その後、新規の画像をスキャンして前記スキャン画像と類似帳票判定を行った結果、類似帳票だと判定された場合、“rectInfoArray”以下には、入力した情報が自動入力対象の情報として格納される。まず、入力結果学習でMFP連携サーバ120のHDD314に保存された情報から以前に設定した「見積書」と「INV20201234」の文字領域の座標情報と一部が重なる文字領域を特定する。すると、一部が重なる文字領域の座標情報と文字とが“rectInfoArray”の後述する“text”に格納される。“key”には、自動入力に使用する文字領域を一意に示す値が格納される。“score”には、文字認識処理に対する結果の確からしさを表す指標である確信度を表す値が格納される。確信度は0~1までの実数値で表される。当該実数値が大きいほど、文字認識処理の結果が確からしいという意味になる。“region”には、文字領域の座標情報とその文字認識した結果抽出した文字が格納される。“rect”は抽出した文字領域一つの座標を示す。“x”は領域の左上のX座標、“y”は領域の左上のY座標、“width”は領域のX方向のピクセル数、“height”は領域のY方向のピクセル数を示す。“text”は“rect”の文字領域を文字認識処理して文字認識を行った結果、抽出された文字を示す。“metadataArray”には、ファイル名を自動入力するためのファイル名に使用する文字領域の順番と区切り文字がどこに入るかを示す情報が格納される。ファイル名以外にもメタデータなどのプロパティを含む情報が設定されている場合は“rectInfoArray”や“metadataArray”に必要な情報が追加される。“key”には、スキャン文書に設定する設定値を一意に示す値が格納される。“keyType”には、“key”の設定値の種別を示す値が格納される。ファイル名に使用する場合は、“key”が“filename”で“keyType”が“filename”となる。“value”には、“key”の値に使用する文字領域と区切り文字の情報が格納される。図8の例では“rectInfoArray”の中の“fileRegion0”の“key”を持つ領域、区切り文字、“fileRegion1”の“key”を持つ領域の順番でファイル名を自動入力されることになる。
ここまで本発明のシステム構成及びフローについて説明してきたが、ここからはMFP連携サーバ120の画像処理部432が行う画像解析処理のうち、本実施形態に重要な自動送信判定処理について説明を行う。
<自動送信判定処理>
本実施形態に係る自動送信判定処理のフローの説明に入る前に、前提となる技術事項について確認しておく。文書ファイルをストレージに自動送信するシステムにおいては、「自動送信率」と「誤送信率」が重要になる。「自動送信率」とは、自動送信の対象となった文書ファイルのファイル名やフォルダ名に誤った文字列が設定されることなく自動送信できる割合を示す概念である。他方、「誤送信率」とは、自動送信の対象となった文書ファイルのファイル名やフォルダ名に誤った文字列が設定されて自動送信されてしまう割合を示す概念である。ここで、自動送信率は、以下の式(1)で定義される。
「自動送信率=自動送信ジョブ数/全ファイリングジョブ数」・・・式(1)
上記式(1)において、自動送信ジョブ数とは、帳票画像の確信度が所定の閾値を超え、自動送信処理が実行された文書ファイルの数である。全ファイリングジョブ数は、ファイリング処理が行われた文書ファイル全ての数である。そして、ユーザによる編集や修正が行われた文書ファイルと自動送信が行われたファイルの両方を足した数となる。
他方、誤送信率は、以下の式(2)で定義される。
「誤送信率=誤送信ジョブ数/自動送信ジョブ数」・・・式(2)
ユーザの利便性向上のためには、自動送信率は高い方がよく、誤送信率は低い方がよい。ユーザは誤送信を抑制したい程度に応じて、目標とする誤送信率を予め設定する。誤送信率の設定方法としては、例えば所定のUI画面においてスライドバーを操作して設定する方法が挙げられる。本実施形態では、帳票画像全体としての確信度が所定の閾値を上回った場合に自動送信してもよいと判定する。
図8は、自動送信判定処理の流れを示すフローチャートである。本フローチャートによる処理は、MFP連携サーバ120が有する記憶手段であるROM312やHDD314に記憶されたプログラムコードがRAM313に展開され、CPU311によって実行される。自動送信判定処理の前提として、ストレージ保存済みの文書ファイルのファイル名に使用された文字列に関する情報が、設定情報保存処理(S518)によって、MFP連携サーバ120のHDD314に保持されているものとする。
S801において、画像処理部432は、類似帳票判定処理(S509)に結果に基づき処理の振り分けを行う。対象画像に類似する帳票画像が見つかっていた場合はS802に進み、類似する帳票画像が見つからなかった場合はS806に進む。
S802において、画像処理部432は、文字認識処理(S510)の結果のうちファイル名欄等に自動入力された文字列単位の確信度に基づいて、対象画像全体における確信度(以下、「全体確信度」と呼ぶ。)を抽出する。まず、文字列単位の確信度について確認しておく。文字認識処理では、予め様々な文字についての特徴量(パターン)が登録された辞書データを用いて、入力文字と特徴量が一致する文字を辞書データの中から見つけることにより特定の文字を認識する。したがって、特徴量が一致する割合が高いほど、文字認識結果が正しい(特定された文字が正解である可能性が高い)ことになる。そして、文字に掠れや潰れがあるほど、この一致率は低下する傾向にある。そこで、文字認識結果における特徴量の一致率を求め、これを文字列単位の確信度とする。そして、本ステップでは、対象画像のファイル名等に使用された文字列単位の確信度の平均値等を算出するなどの方法により、対象画像全体についての確信度である全体確信度を求める。なお、全体確信度を求める際には、さらに別の情報を加味してもよい。一例として、類似帳票画像に関する情報、文字領域に関する情報、文字認識結果に関する情報がある。以下、それぞれについて説明する。
≪類似帳票画像に関する情報≫
類似帳票画像に関する情報は、対象画像が類似すると判定された帳票画像と本当に同一であるかを示す情報であり、類似度スコア、類似スコアが一定以上の帳票画像が他に存在したかといった情報が想定される。他には、当該帳票画像が類似すると判定された累積回数、類似すると判定された直近の日時、ユーザによるファイル名等の修正履歴等がある。
≪文字領域に関する情報≫
文字領域に関する情報は、対象画像と類似帳票画像の間で対応関係にある、ファイル名等に利用された文字領域についての情報である。具体的には、全体位置合わせ結果の差異や部分位置合わせ結果の差異の情報、文字領域高さの差分の情報、文字領域幅の差分の情報、周囲に類似している文字領域があるか否かといった情報が想定される。さらに、類似帳票画像におけるこれらの情報の履歴情報等の利用も考えられる。
≪文字認識結果に関する情報≫
文字認識結果に関する情報は、対象画像と類似帳票画像の間で対応関係にある、ファイル名等に利用された文字列についての情報である。具体的には、文字毎の文字認識処理の信頼度スコアの情報、文字毎の文字認識結果における次候補以降の文字の信頼度スコアの情報、文脈情報を考慮した文字列単位の信頼度スコアの情報が想定される。他にも、類似帳票画像に類似すると判定された過去の帳票画像群の文字認識結果から推定される文字列フォーマットの情報、文字認識結果の間違い傾向の情報が想定される。文字列フォーマットは、対応する文字領域には常に同一の文字列が入るのか、それとも別の文字列が入り得るのか、文字列幅が固定なのか可変なのか、文字列に数字が含まれるのか含まれないのか、等の情報が想定される。文字認識結果の間違い傾向については、文字認識モジュールとしての間違い傾向の情報や、ユーザ毎の間違い傾向の情報等が想定される。
本実施形態では、上記のようにして求めた全体確信度を0~1に正規化し、最も確からしい場合が1になるものとする。なお、全体確信度の求める方法として、例えば、上記の情報を特徴量化して入力データとし、サンプルデータに対する正誤データを用意して、機械学習を行い、生成された識別機(学習済みモデル)を利用して全体確信度を求めてもよい。ここで、サンプルデータは、ユーザのユースケースを想定して、開発者が作成もしくは収集した帳票画像であり、自動送信可能かどうかのフラグ(正誤データ)等が付加されているデータである。機械学習手法は、ニューラルネットワークやSVM(SupportVectorMachine)等の公知の2値分類可能な手法を用いて、出力結果を0~1に正規化すればよい。または、個別にルールを作成して、組み合わせる形を取っても良い。個別のルールは機械学習を用いて生成しても良いし、サンプルデータ(ユーザのユースケースを想定して、開発者が作成もしくは収集したデータ)をもとに人手で作成しても良い。
図8のフローの説明に戻る。
S803において、画像処理部432は、上述のようにして求めた全体確信度に基づいて自動送信するか否か判定する際に用いる閾値(以下、「確信度閾値」と呼ぶ。)を決定する。本フローの開始直後の時点では、デフォルトの確信度閾値が設定されている。ここで、自動送信率を上げるためにデフォルトの確信度閾値を低くすると、誤送信率が上昇してしまう。通常は、誤送信率を所定以下に収めることが可能な範囲で確信度閾値を低くして、自動送信率を向上させることが求められる。デフォルトの確信度閾値は、このような点を考慮して決定されている。なお、確信度閾値設定処理の詳細については、図9を用いて後述する。
S804において、画像処理部432は、S802で抽出された全体確信度とS803で決定された確信度閾値とに基づいて、対象画像の文書ファイルの自動送信可否を判定する。具体的には、全体確信度が確信度閾値を超えていた場合には、S805に進む。他方、全体確信度が、確信度閾値を超えていない場合には、S806に進む。例えば、前述の図7の例では、S802で抽出される全体確信度は“0.9”である。そして、S803で決定される確信度閾値は、“0.767”である。従って、この例では、全体確信度が確信度閾値を超えるので、S805に進むこととなる。
S805において、画像処理部432は、対象画像に関し「自動送信可能」であることを示す付帯情報を設定する。この付帯情報としては、例えば自動送信可能であることを2値で表すフラグ(例えば「自動送信可能」の場合に“1”を「自動送信不可能」の場合に“0”を付与)などが考えられる。こうして「自動送信可能」となった場合、自動送信の可否に関する表示が「“enabledAutoTransmission”:true」となる(図7を参照)。
S806において、画像処理部432は、対象画像に関し、「自動送信不可能」であることを示す付帯情報として、例えば上述のフラグを設定する。
以上が、自動送信判定処理の内容である。なお、上述のS804の処理で全体確信度が確信度閾値を超えていた場合であっても、過去に行われた類似帳票判定処理に関する情報を参照して、対象画像に係る帳票と類似すると判定された帳票画像の数が所定の数以下である場合は、S806に進んでもよい。そして、その類似すると判定された帳票画像に関する情報を取得するようにしてもよい。
<確信度閾値設定処理>
続いて、確信度閾値設定処理(S803)について詳しく説明する。図9は、確信度閾値設定処理の流れを示すフローチャートである。
S901では、確信度閾値の再算出を必要とする一定の条件が満たされたか否かが判定される。例えば、前回の再算出から所定期間(例えば1か月)経過した、前回の再算出後に所定回数(例えば10回)設定情報保存処理(S518)が実行されたといった場合に、確信度閾値の再算出が必要であると判定する。確信度閾値の再算出が必要であると判定された場合、S902に進む。他方、確信度閾値の再算出が必要ないと判定された場合は、S908に進む。
S902では、過去の設定情報保存処理で保存された帳票学習の結果とS802にて導出された全体確信度とに基づいて、過去の誤送信率が導出される。具体的には、まず、過去の帳票画像について、ユーザがファイル名等を修正した場合にはその文字認識処理の結果に誤りがあったと推定し、修正しなかった場合には誤りがなかったと推定する処理を行う。そして、誤りがあったと推定された場合(「誤」と表記)と誤りがなかったと推定された場合(「正」と表記)をまとめた正誤情報を得る。そして、過去の誤送信率を導出する。ここで、図10(a)を参照して、過去の誤送信率がどのように導出されるのかを説明する。いま、図10(a)のテーブル1000には、0.1刻みの全体確信度毎に得た正誤情報が3列目と4列目に示されている。正誤情報を集計する単位は、0.1に限定されるものではなく、スキャン画像の数に応じて、適宜変更すればよい。
図10(a)のテーブル1000において、1列目の値A及び2列目の値Bは、全体確信度の範囲を示す。そして、0.1刻みの1行毎に、「値A≦全体確信度<値B」の条件を満たす全体確信度を持つ対象画像の正誤情報を収集している。図10(a)のテーブル1000の3列目は、「正」と推定された過去の帳票画像の数を示し、4列目は「誤」と推定された過去の帳票画像の数を示す。そして、5列目は自動送信された過去の帳票画像の数を示し、6列目は「誤」と推定された過去の帳票画像と「正」と推定された過去の帳票画像とを合計した数である。この場合において特定の行(例えば3行目から6行目)のスキャン画像の数については、直近のデータほど、推定に与える影響が大きくなるように重みをつけてもよい。例えば、直近の帳票画像については1枚の重みでカウントし、古いものほど重みを減らしていき、一定以上古い帳票画像については、カウントをしないといった具合である。7列目は、以下の式(3)で表される「区間内誤送信率」を示す。
「区間内誤送信率=4列目の「誤」の数/6列目のスキャン画像数」・・・式(3)
ここで、図10(a)の例では8行目からデータが欠損している(「データなし」の部分)。これは、確信度閾値が“0.7”に設定されていたことに因るもので、確信度閾値が0.7を超えるスキャン画像については自動送信がなされたことを意味している。従って、全体確信度が“0.7”を超える領域については正誤情報が存在せず、区間内誤送信率も算出されない。
S903では、S902で導出した過去の誤送信率において欠損しているデータが推定される。ここでの推定は、過去に自動送信されたスキャン画像のプロパティを構成する文字列として提示された文字認識処理の結果が誤っていた割合を推定する処理と言い換えることができる。そして、この推定には公知の外挿手法を用いればよく、サンプルデータにおける合致度が高いモデルを利用すればよい。保守的な推定を行いたい場合(誤送信の抑制を重視する場合)は、モデルフィット時に誤送信率が高くなるようにする。これは、モデルへのフィッティングエラーのペナルティ項について、低くなる方向のずれのペナルティの重みを重くし、高くなる方向のずれのペナルティの重みを軽くすればよい。また、過去の帳票画像の数が少ない区間については、外挿もしくは内挿した値を、その区間の誤送信率として利用するようにしてもよい。外挿の1つの例を図10(b)に示す。図10(b)のテーブル1100において、1列目の値Aと2列目の値Bは、図10(a)のテーブル1000における1列目と2列目と同一である。3列目の代表閾値は、以下の式(4)で算出した値である。
「(A+B)/2」・・・式(4)
本実施形態では、外挿値の計算に利用するために、A~Bの区間における中央の値を代表閾値として扱っている。そして、図10(b)のテーブル1100の4列目の実測値は、図10(a)のテーブル1000の7列目と同一の値である。5列目の外挿値は、データが欠損している部分について、3列目の代表閾値の値と、4列目の実測値を利用して、外挿して求めた値である。この例では、指数近似により、外挿値を求めている。
図10(c)のグラフ1200は、図10(b)のテーブル1100における3列目の代表閾値の値と、4列目の実測値をプロットしたグラフである。このグラフ中の実線は、実測値をプロットした結果であり、点線は指数近似の結果を示す。図10(c)のグラフ1200において、点線と実線は大きく乖離しておらず適切に外挿できていることが分かる。
S904では、S904で得た外挿結果を利用して、現状の誤送信率が導出される。S903までで、確信度の区間毎における区間誤送信率が推定できているので、この区間誤送信率を用いて、現状の誤送信率を導出する。図10(d)に、導出された現状の誤送信率の具体例を示す。
図10(d)のテーブル1300において、1列目の値Aと2列目の値Bは、図10(a)のテーブル1000における1列目と2列目と同一である。3列目のスキャン画像数は、図10(a)のテーブル1000の6列目と同一である。4列目の区間内誤送信率は、図10(b)のテーブル1100の5列目の実測値と6列目の外挿値をマージした結果になっている。5列目の誤送信数は、各行のスキャン画像の数と区間内誤送信率を掛け合わせた結果になっており、全体確信度が“0.7”より大きい区間については推定値である。6列目の「値A以上の累積した誤送信数」における各行の値は、該当行と該当行より1つ下にある5列目の誤送信数を足したものである。これは、確信度閾値が各行の値Aであるときに想定される誤送信数に相当する。この例においては、確信度閾値が“0.7”である場合の誤送信率は、1列目の値Aが“0.7”である行の8列目の値Aの場合の誤送信率、すなわち、0.50%である。このような方法によれば、文書ファイルを自動送信したために「データなし」となっている区間も含めて区間毎の誤送信率を推定し、全ての区間について、現状における誤送信率を推定することが可能となる。
S905では、S904で推定した現状の誤送信率が目標誤送信率上限を上回るか否かが判定される。一般的に、確信度閾値を1に近づける程、誤送信率は低下するが、自動送信の対象となる文書ファイルは減り、自動送信率は低下することになる。他方、確信度閾値を0に近づける程、自動送信の対象となる文書ファイルは増え、自動送信率も増えるが、誤送信率は高くなる。これらを踏まえ、ユーザは、目標誤送信率を予め設定しておく。ここでは、目標誤送信率には上限と下限があり、幅があることを前提としている。これは、確信度閾値がバラつき、システムの挙動が不安定になることを防ぐためである。ただし、目標誤送信率に上限と下限を設けずに常に目標誤送信率となる確信度閾値を計算し直すようにしてもよい。推定誤送信率が目標誤送信率の上限を超える場合、S907に進む。他方、推定誤送信率が目標誤送信率の上限を超えない場合、S906に進む。
S906では、S904で推定した現状の誤送信率が目標誤送信率下限を下回るか否かが判定される。推定誤送信率が目標誤送信率の下限を下回る場合、S907に進む。他方、推定誤送信率が目標誤送信率の下限を下回らない場合、S908に進む。
S907では、目標誤送信率を達成できる新たな確信度閾値が算出され設定される。新たな確信度閾値の算出に先立って、S904と同様な方法で区間毎の誤送信率を計算する。そして、目標誤送信率に近い値となる全体確信度の閾値群を求めて、補間演算を行い、目標誤送信率となる新たな確信度閾値を設定する。補間演算は線形演算等の公知の方法で行えばよい。なお、目標誤送信率に上限と下限を設けていた場合は、誤送信率がその目標誤送信率の上限と下限の範囲内に入るように、新たな確信度閾値を算出する。例えば、誤送信率が目標誤送信率の上限値となるような確信度閾値を算出してもよいし、誤送信率が目標誤送信率の上限と下限の中央値となるような確信度閾値を算出してもよい。また、例えば、現状の誤送信率が目標誤送信率の上限を超えている(S905でYES)の場合は、誤送信率が目標誤送信率の上限値となるような確信度閾値を算出してもよい。一方、現状の誤送信率が目標誤送信率の下限を下回っている(S906でYES)の場合は、誤送信率が目標誤送信率の下限値となるような確信度閾値を算出する、というようにしてもよい。いずれの場合も、新たに算出・設定された確信度閾値によって、誤送信率が目標誤送信率を達成できる(目標誤送信率の上限と下限の範囲内に収まる)ようになる。
S908では、現状の確信度閾値が維持される。
以上が、確信度閾値設定処理の内容である。ここで、新たな確信度閾値を設定する場合におけるS901以下の処理について、具体例を用いて説明する。また、この例の前提として「見積書」の文書ファイルを自動送信するための確信度閾値のデフォルト値として「0.7~0.8」と設定されていたものとする。
例えば、再算出を行う条件として前回の確信度閾値再算出から2週間以上が経過していることであった場合に1か月経過したとする。この場合、確信度閾値の再算出が必要であると判定される(S901で、Yes)。
次に、過去の誤送信率を導出する。まず、「1÷21×100=95.238・・・」という具合に、全体確信度が“0~0.1”、“0.1~0.2”、“0.2~0.3”、・・・といった具合に区間内誤送信率を算出する(図10(a)参照)。その次に、データの実測値が存在しない確信度“0.7”以降については、これまでに算出した区間内誤送信率(95.24%、50.00%、23.08%・・・等)を指数近似することにより外挿する(S904)。これにより、データの実測値が存在しない確信度“0.7”以降についての区間内誤送信率(0.94%、0.49%、0.26%・・・等)を算出する(図10(b)参照)。
そして、外挿結果を利用して、現状の誤送信率を導出する。すなわち、確信度が“0.7”から“0.8”の場合における誤送信率を導出する(S905)。ここでは誤送信率は「0.50%」となる(図10(d)参照)。
そして、導出された現状の誤送信率(0.50%)について、ユーザが任意に設定した目標誤送信率の上限を上回るか否かを判定する(S906)。いま、誤送信率の上限として0.4%が設定されていたとする。そうすると、現状の誤送信率が目標誤送信率の上限を超えることになるので、S908に進む。
次に、目標誤送信率の上限(ここでは0.4%)と、確信度閾値が“0.7”であるときの誤送信率0.5%と、確信度閾値が0.8であるときの誤送信率0.35%を利用した線形補間によって新たな確信度閾値を算出する(図10(d)参照)。具体的には、0.7+(0.5-0.4)/(0.5-0.35)×(0.8-0.7)≒0.767が得られる(この計算により、誤送信率が0.4になると想定される確信度閾値を求めることができる)。こうして得られた値“0.767”を、新たな確信度閾値として設定する(S908)。
[変形例]
上述の実施形態では、過去の帳票画像全てを参照して新たな確信度閾値を算出し設定していた。参照する過去の帳票画像を一部に限定もしてもよい。例えば、対象画像と類似している帳票画像(すなわち、文書のフォーマットが同一である過去の帳票画像)に限定してもよい。この場合、対象画像に類似する帳票画像が所定の数以上(例えば、100個以上)蓄積されていることを条件としてもよい。これにより、確信度閾値の算出精度がより向上する。また、類似する帳票画像が所定数以上あることを条件とした場合において、その中の一定の割合(例えば半分)だけを参照するようにしてもよい。
また、本変形例における過去の類似する帳票画像の範囲は、適宜変更可能である。例えば、文字領域の性質に基づいて類似する帳票画像の範囲を規定する。以下に、文字領域の性質の具体例を示す。
・固定文字列固定幅領域
固定文字列固定幅領域は、常に同一の文字列を含み、かつ、常に同じ幅となる文字領域を指す。ここで、「固定文字列」とは、所定の文字領域に含まれる文字列が常に同一の文字列であることを意味する。また「固定幅領域」は、その文字領域に含まれる文字列は常に同じ文字数であり、常に同一の幅を有していることを意味する。
・複数文字列候補可変幅領域
複数文字列候補可変幅領域は、文字領域に含まれ得る文字列として複数の文字列候補があり、幅が可変の文字領域を指す。ここで、「複数文字列候補」とは、文字領域に含まれる可能性がある文字列として複数の候補があることを意味する。「可変幅領域」とは、文字領域の幅が変化する可能性があることを意味する。
・可変文字列固定幅領域(数字なし)
可変文字列固定幅領域(数字なし)は、文字領域に含まれる文字列は可変であるが数字が入ることはなく、常に同じ幅の文字領域を指す。ここで、「可変文字列」とは、文字領域に含まれる文字列が可変であるという意味である。また、「数字なし」とは、文字領域に含まれる文字列を構成する文字が数字以外であることを意味する。
・可変文字列固定幅領域(数字込み)
「可変文字列固定幅領域(数字込み)」は、文字領域に含まれる文字列が可変であって数字が入ることもあり、常に同じ幅の文字領域を指す。
・可変文字列可変幅領域(数字なし)
「可変文字列固定幅領域(数字なし)」は、文字領域に含まれる文字列が可変であって数字が入ることはなく、その幅が可変である文字領域を指す。
・可変文字列可変幅領域(数字込み)
「可変文字列固定幅領域(数字込み)」は、文字領域に含まれる文字列が可変であって数字が入ることもあり、常に同じ幅の文字領域を指す。
なお、上述の各文字領域の性質に関する情報については、確信度算出のステップ(S802)で取得しておけばよい。
以上説明したように本実施形態によれば、文書ファイルの自動送信可否の判定に用いる確信度の適切な信頼度合いを柔軟に設定することができる。
[他の実施形態]
本開示の技術は、上述の実施形態の1以上の機能を実現するプログラムをネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
110 MFP
120 MFP連携サーバ
130 ストレージサーバ
421 表示制御部
431 リクエスト制御部
432 画像処理部
434 データ管理部

Claims (16)

  1. 文書のスキャン画像に対する文字認識処理の結果をプロパティに用いて文書ファイルを自動送信するための画像処理装置であって、
    前記文字認識処理の結果の確からしさを表す確信度を抽出する抽出手段と、
    前記抽出手段で抽出された前記確信度が所定の閾値を超える場合に、前記文字認識処理の結果をプロパティに用いた文書ファイルを自動送信可能と判定する判定手段と、
    前記所定の閾値を設定する設定手段と、
    を備え、
    前記設定手段は、自動送信される文書ファイルの誤送信率が、目標とする誤送信率を達成できるように、前記所定の閾値を設定する、
    ことを特徴とする画像処理装置。
  2. 前記設定手段は、
    過去に自動送信されなかったスキャン画像のプロパティを構成する文字列として提示された文字認識処理の結果が誤っていた第1の割合を導出する導出手段と、
    前記第1の割合の導出の対象に含まれない、過去に自動送信されたスキャン画像のプロパティを構成する文字列として提示された文字認識処理の結果が誤っていた第2の割合を推定する推定手段と、
    前記導出手段が導出した第1の割合と前記推定手段が推定した第2の割合とに基づいて、予め定められた前記目標とする誤送信率に応じた前記所定の閾値を決定する決定手段と、
    を有する、
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記導出手段は、前記過去に自動送信されなかったスキャン画像のうち新しいスキャン画像ほど、確信度が高くなるように重み付けを行う、ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記推定手段は、外挿することにより前記推定を行うことを特徴とする請求項2に記載の画像処理装置。
  5. 前記決定手段は、線形補間することにより前記所定の閾値を決定することを特徴とする請求項2乃至4のいずれか1項に記載の画像処理装置。
  6. 前記設定手段は、一定の条件が満たされた場合に、前記導出手段、前記推定手段及び前記決定手段を用いて、前記所定の閾値を決定することを特徴とする請求項2乃至5のいずれか1項に記載の画像処理装置。
  7. 前記過去に自動送信されなかったスキャン画像及び前記過去に自動送信されたスキャン画像は、処理対象のスキャン画像に係る文書のフォーマットと同一のフォーマットの文書のスキャン画像であることを特徴とする請求項2乃至5のいずれか1項に記載の画像処理装置。
  8. 前記過去に自動送信されなかったスキャン画像及び前記過去に自動送信されたスキャン画像は、処理対象のスキャン画像に係る文書のフォーマットと同一のフォーマットの文書のスキャン画像であって、所定の数以上のスキャン画像であることを特徴とする請求項7に記載の画像処理装置。
  9. 前記判定手段にて自動送信可能と判定されたスキャン画像の文書ファイルを生成する生成手段をさらに備えたことを特徴とする請求項1乃至7のいずれか1項に記載の画像処理装置。
  10. 前記生成手段が生成した前記文書ファイルを外部装置に送信する送信手段をさらに備えたことを特徴とする請求項9に記載の画像処理装置。
  11. 前記プロパティは、前記スキャン画像のファイル名であることを特徴とする請求項1乃至10のいずれか1項に記載の画像処理装置。
  12. 前記プロパティは、前記文書ファイルが保存されるフォルダ名であることを特徴とする請求項1乃至10のいずれか1項に記載の画像処理装置。
  13. 前記目標とする誤送信率に上限と下限とが設けられている場合、前記設定手段は、前記自動送信される文書ファイルの誤送信率が、前記上限と下限との範囲内のいずれかの値となる場合の前記確信度に係る閾値を算出し、当該算出した閾値を前記所定の閾値として設定することを特徴とする請求項1乃至12のいずれか1項に記載の画像処理装置。
  14. 前記請求項10に記載の画像処理装置と、
    前記送信手段が送信した文書ファイルを受信する受信手段と、
    を備えるサーバ装置と、
    を有することを特徴とする画像処理システム。
  15. 文書のスキャン画像に対する文字認識処理の結果をプロパティに用いて文書ファイルを自動送信するための画像処理装置の制御方法であって、
    前記文字認識処理の結果の確からしさを表す確信度を抽出する抽出ステップと、
    前記抽出ステップにて抽出された前記確信度が所定の閾値を超える場合に、前記文字認識処理の結果をプロパティに用いた文書ファイルを自動送信可能と判定する判定ステップと、
    前記所定の閾値を設定する設定ステップと、
    を含み、
    前記設定ステップでは、自動送信される文書ファイルの誤送信率が、目標とする誤送信率を達成できるように、前記所定の閾値を設定する、
    ことを特徴とする制御方法。
  16. コンピュータを、請求項1乃至13のいずれか一項に記載の装置として機能させるためのプログラム。
JP2020214215A 2020-12-23 2020-12-23 画像処理装置、画像処理システム、その制御方法及びプログラム Pending JP2022100071A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020214215A JP2022100071A (ja) 2020-12-23 2020-12-23 画像処理装置、画像処理システム、その制御方法及びプログラム
US17/544,723 US11647139B2 (en) 2020-12-23 2021-12-07 Image processing apparatus, image processing system, control method thereof, and storage medium
US18/223,721 US20230370557A1 (en) 2020-12-23 2023-07-19 Augmented reality unboxing experience

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020214215A JP2022100071A (ja) 2020-12-23 2020-12-23 画像処理装置、画像処理システム、その制御方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2022100071A true JP2022100071A (ja) 2022-07-05

Family

ID=82022571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020214215A Pending JP2022100071A (ja) 2020-12-23 2020-12-23 画像処理装置、画像処理システム、その制御方法及びプログラム

Country Status (2)

Country Link
US (2) US11647139B2 (ja)
JP (1) JP2022100071A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7353771B2 (ja) * 2019-02-28 2023-10-02 キヤノン株式会社 プログラム、記憶媒体、情報処理装置の制御方法、及び情報処理装置
US11960784B2 (en) 2021-12-07 2024-04-16 Snap Inc. Shared augmented reality unboxing experience

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6104500A (en) * 1998-04-29 2000-08-15 Bcl, Computer Inc. Networked fax routing via email
JP5111268B2 (ja) 2008-07-09 2013-01-09 キヤノン株式会社 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
JP7013182B2 (ja) 2017-09-21 2022-01-31 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
JP7206729B2 (ja) 2018-09-18 2023-01-18 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Also Published As

Publication number Publication date
US11647139B2 (en) 2023-05-09
US20220201141A1 (en) 2022-06-23
US20230370557A1 (en) 2023-11-16

Similar Documents

Publication Publication Date Title
US11616884B2 (en) Image processing system for computerizing document, control method thereof, and storage medium
JP2022096218A (ja) 情報処理装置、情報処理システム、その制御方法及びプログラム
JP7317561B2 (ja) タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7297510B2 (ja) ユーザ操作のためのガイダンスを表示する画像処理装置、その制御方法及びプログラム
US11647139B2 (en) Image processing apparatus, image processing system, control method thereof, and storage medium
US11265431B2 (en) Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
US11765292B2 (en) Information processing apparatus used for converting image to file, image processing system, method of controlling information processing apparatus, and storage medium
JP2021184190A (ja) 画像処理装置、画像処理方法、およびプログラム
US11800032B2 (en) Apparatus, information processing method, and storage medium
US11528372B2 (en) Image processing system for providing attribute information, image processing method and storage medium
US20200336610A1 (en) Image processing apparatus for setting property to scanned image, control method thereof and storage medium
JP2023084495A (ja) 情報処理装置、文書電子化システム、文書処理方法とプログラム
US20220343664A1 (en) Image processing apparatus, image processing method, and recording medium
JP2022137727A (ja) 情報処理装置、情報処理システム、その制御方法及びプログラム
US20230368558A1 (en) Image processing apparatus, image processing method, and storage medium
US20220319218A1 (en) Image processing apparatus, image processing system, control method thereof, and storage medium
JP2023071227A (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
JP2021118534A (ja) 文書を電子化するための画像処理システム、その制御方法及びプログラム
JP2023120267A (ja) タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP2023058616A (ja) タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP2020177526A (ja) スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム
JP2020177523A (ja) スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム
JP2020178284A (ja) スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム
JP2020178282A (ja) スキャン画像のプレビュー表示を行なう画像処理装置、その制御方法及びプログラム