JP2022167157A - 画像処理装置、画像処理方法、及びプログラム - Google Patents
画像処理装置、画像処理方法、及びプログラム Download PDFInfo
- Publication number
- JP2022167157A JP2022167157A JP2021072754A JP2021072754A JP2022167157A JP 2022167157 A JP2022167157 A JP 2022167157A JP 2021072754 A JP2021072754 A JP 2021072754A JP 2021072754 A JP2021072754 A JP 2021072754A JP 2022167157 A JP2022167157 A JP 2022167157A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- folder
- character
- image data
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
- G06F16/168—Details of user interfaces specifically adapted to file systems, e.g. browsing and visualisation, 2d or 3d GUIs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
- G06F16/164—File meta data generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Facsimiles In General (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】画像データを取り扱う処理を効率化することである。
【解決手段】画像データを取得する手段と、前記取得した画像データに対して文字認識処理を行って文字列を検出し、前記検出した文字列を1つ以上含む、前記取得した画像データの保存先を表すフォルダパスを作成する手段と、前記作成したフォルダパスを構成する各字列が、特定のフォルダ名を表す文字列であるか否かを判定し、前記特定のフォルダ名を表す文字列でないと判定された文字列についての前記文字認識処理の結果の確信度がしきい値以下であるか否かを判定し、前記しきい値以下であると判定された文字列が少なくとも1つ存在する場合、前記作成したフォルダパスをユーザによる確認対象にする手段と、を備える。
【選択図】図1
【解決手段】画像データを取得する手段と、前記取得した画像データに対して文字認識処理を行って文字列を検出し、前記検出した文字列を1つ以上含む、前記取得した画像データの保存先を表すフォルダパスを作成する手段と、前記作成したフォルダパスを構成する各字列が、特定のフォルダ名を表す文字列であるか否かを判定し、前記特定のフォルダ名を表す文字列でないと判定された文字列についての前記文字認識処理の結果の確信度がしきい値以下であるか否かを判定し、前記しきい値以下であると判定された文字列が少なくとも1つ存在する場合、前記作成したフォルダパスをユーザによる確認対象にする手段と、を備える。
【選択図】図1
Description
本発明は、画像処理装置、画像処理方法、及びプログラムに関するものである。
従来、MFP(Multifunction Peripheral)等でスキャンして電子化した帳票データを、ストレージに保存して管理することがある。このとき、帳票画像内に記載されている文字列を読み取り、その文字列と、あらかじめ記憶してあるストレージのフォルダパスを表す文字列を比較し、一致する部分に応じて、画像の保存先のフォルダを切り替える技術が知られている(例えば特許文献1)。
電子化した画像データをストレージに保存するとき、そのデータに付与するファイル名、及びそのデータの保存先のフォルダパスを、帳票内の特定の領域から抽出した文字列をもとに、自動で作成することがある。その際には、あらかじめユーザが、帳票内のどの領域に記載されている文字列を、どのように組み合わせてファイル名、及びフォルダパスを作成するかについて、ルールとして設定しておく。なお、ルールはシステムが分類可能な帳票種別ごとに用意しておくものとする。
ファイル名とフォルダパスを作成するためには、スキャン画像に対して、帳票分類処理と文字認識処理を行い、帳票内から必要な文字列を抽出した後、帳票種別に応じたルールに従って、文字列を組み合わせる。このとき、文字認識処理は、画像の中から抽出対象の文字列が存在する領域を抽出する、文字列領域抽出処理と、抽出した文字列領域の中から文字を見つけ出し、テキストデータに変換する、OCR処理とから成る。OCRは、Optical Character Recognitionの略称である。
上記のようなシステムにおいてユーザは、作成したファイル名、及びフォルダパスが正しいかどうかを、MFP又はPC(Personal Computer)の画面上で確認し、それを承認した上で、ファイルを外部ストレージに送信する。また、得られた文字列が誤っている場合は、正しい文字列に修正した上で承認してから送信する。これらの確認作業は、ユーザにとって負担のかかる作業である。これに対して、作成したファイル名、及びフォルダパスが確からしいと判定できる場合には、ユーザに確認を要求することなく、画像ファイルを自動で外部ストレージに送信する処理(自動送信処理)を実行することが考えられる。このとき、ファイル名、及びフォルダパスの確からしさの評価は、それらを構成する、帳票内の特定の領域から抽出した文字列の確からしさを評価することで行う。それを評価するためには、文字列を抽出する際に行った、文字列領域抽出処理、及びOCR処理の結果に紐づいて得られる確信度と呼ばれる値を利用する。この確信度の値が大きいほど、処理結果が正しい可能性が高いことを意味する。したがって、文字列抽出処理、及びOCR処理の結果の確信度があらかじめ設定されたしきい値以上であるときには、帳票内の特定の領域から抽出した文字列は確からしいと判断でき、その結果、ファイル名、及びフォルダパスも確からしいと判断できる。しかしながら、抽出された文字列の少なくとも一部の文字のOCR結果の確信度が低い場合は、ユーザによる確認が必要となってしまう。
一方で、OCR結果に基づき作成したフォルダパスの途中までが、過去にユーザが承認したフォルダパスと一致する場合、一致する部分に関しては、正しいフォルダパスである可能性が高いと考えられる。しかし、少なくとも一部の文字のOCR結果の確信度が低い場合に、フォルダパスを確認対象にした場合、例え、OCR結果に基づき作成したフォルダパスが過去にユーザが承認したフォルダパスに一致したとしても、確信度が低ければ確認対象となってしまう。
本発明は、上記のような課題に鑑みてなされたものであり、画像データを取り扱う処理を効率化することを目的とする。
本発明の一実施形態の画像処理装置は、画像データを取得する手段と、前記取得した画像データに対して文字認識処理を行って文字列を検出し、前記検出した文字列を1つ以上含む、前記取得した画像データの保存先を表すフォルダパスを作成する手段と、前記作成したフォルダパスを構成する各文字列が、特定のフォルダ名を表す文字列であるか否かを判定し、前記特定のフォルダ名を表す文字列でないと判定された文字列についての前記文字認識処理の結果の確信度がしきい値以下であるか否かを判定し、前記しきい値以下であると判定された文字列が少なくとも1つ存在する場合、前記作成したフォルダパスをユーザによる確認対象にする手段と、を備えることを特徴とする。
本発明によれば、画像データを取り扱う処理を効率化することができる。
以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。
<全体構成>
図1は、本発明の実施例1に係る画像処理システムの全体構成を示す図である。画像処理システム100は、MFP110、クライアントPC111、MFP連携サービス120及びクラウドストレージ130を備える。MFP110及びクライアントPC111は、LAN(Local Area Network)経由でインターネット上の各種サービスを提供するサーバに対して通信可能に接続されている。
図1は、本発明の実施例1に係る画像処理システムの全体構成を示す図である。画像処理システム100は、MFP110、クライアントPC111、MFP連携サービス120及びクラウドストレージ130を備える。MFP110及びクライアントPC111は、LAN(Local Area Network)経由でインターネット上の各種サービスを提供するサーバに対して通信可能に接続されている。
MFP110は、スキャナやプリンタといった複数の機能を有する複合機であり、画像処理装置の一例である。クライアントPC111は、MFP連携サービス120に対して依頼したサービスの提供を受けるコンピュータ又はアプリケーションである。MFP連携サービス120は、MFP110でスキャンした画像ファイルを自サーバ上に保存したり、別のストレージサービス等のファイル保存が可能なサービスに転送したりする機能を持つサービスの一例である。クラウドストレージ130は、インターネットを介してファイルを保存したりウェブブラウザでファイルを取得したりすることができるサービスである。
本実施例の画像処理システム100は、MFP110、クライアントPC111、MFP連携サービス120及びクラウドストレージ130からなる構成としているが、本発明はこれに限定されない。例えば、MFP110がクライアントPC111やMFP連携サービス120の役割を兼ね備えてもよい。また、MFP連携サービス120は、インターネット上ではなくLAN上のサーバに配置した接続形態であってもよい。また、クラウドストレージ130は、メールサーバなどに置き換えて、スキャンした画像をメールに添付し送信してもよい。
<MFPのハードウェア構成>
図2は、MFP110のハードウェア構成図である。MFP110は、制御部210、操作部220、プリンタ部221、スキャナ部222及びモデム223を備える。制御部210は、CPU211を備える。CPUは、Central Processing Unitの略称である。制御部210は、ROM212を備える。ROMは、Read Only Memoryの略称である。制御部210は、RAM213を備える。RAMは、Random Access Memoryの略称である。制御部210は、HDD214を備える。HDDは、Hard Disk Driveの略称である。更に、制御部210は、操作部I/F215、プリンタI/F216、スキャナI/F217、モデムI/F218及びネットワークI/F219を備える。I/Fは、Interfaceの略称である。制御部210は、MFP110全体の動作を制御する。
図2は、MFP110のハードウェア構成図である。MFP110は、制御部210、操作部220、プリンタ部221、スキャナ部222及びモデム223を備える。制御部210は、CPU211を備える。CPUは、Central Processing Unitの略称である。制御部210は、ROM212を備える。ROMは、Read Only Memoryの略称である。制御部210は、RAM213を備える。RAMは、Random Access Memoryの略称である。制御部210は、HDD214を備える。HDDは、Hard Disk Driveの略称である。更に、制御部210は、操作部I/F215、プリンタI/F216、スキャナI/F217、モデムI/F218及びネットワークI/F219を備える。I/Fは、Interfaceの略称である。制御部210は、MFP110全体の動作を制御する。
CPU211は、ROM212に記憶された制御プログラムを読み出して、読取/印刷/通信などMFP110が有する各種機能を実行・制御する。RAM213は、CPU211の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施例では1つのCPU211が1つのメモリ(RAM213又はHDD214)を用いて後述のフローチャートに示す各処理を実行するものとするが、本発明はこれに限定されない。例えば、複数のCPUや複数のRAM又はHDDを協働させて各処理を実行してもよい。HDD214は、画像データや各種プログラムを記憶する大容量記憶部である。
操作部I/F215は、操作部220と制御部210とを接続するインタフェースである。操作部220には、タッチパネルやキーボードなどが備えられており、ユーザによる操作/入力/指示を受け付ける。
プリンタI/F216は、プリンタ部221と制御部210とを接続するインタフェースである。印刷用の画像データはプリンタI/F216を介して制御部210からプリンタ部221へ転送され、記録媒体上に印刷される。
スキャナI/F217は、スキャナ部222と制御部210とを接続するインタフェースである。スキャナ部222は、不図示の原稿台やADF(Auto Document Feeder)にセットされた原稿を読み取って画像データを生成し、スキャナI/F217を介して制御部210に入力する。MFP110は、スキャナ部222で生成された画像データをプリンタ部221から印刷出力(コピー)する他、ファイル送信又はメール送信することができる。
モデムI/F218は、モデム223と制御部210とを接続するインタフェースである。モデム223は、PSTN(Public Switched Telephone Network)上のファクシミリ装置との間で画像データをファクシミリ通信する。
ネットワークI/F219は、制御部210(MFP110)をLANに接続するインタフェースである。MFP110は、ネットワークI/F219を用いてインターネット上の各サービスに画像データや情報を送信したり、各種情報を受信したりする。
<クライアントPC、MFP連携サービスのハードウェア構成>
図3は、クライアントPC111及びMFP連携サービス120のハードウェア構成図である。クライアントPC111及びMFP連携サービス120は、CPU311、ROM312、RAM313、HDD314及びネットワークI/F315を備える。
図3は、クライアントPC111及びMFP連携サービス120のハードウェア構成図である。クライアントPC111及びMFP連携サービス120は、CPU311、ROM312、RAM313、HDD314及びネットワークI/F315を備える。
CPU311は、ROM312に記憶された制御プログラムを読み出して各種処理を実行することで、全体の動作を制御する。RAM313は、CPU311の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD314は、画像データや各種プログラムを記憶する大容量記憶部である。ネットワークI/F315は、MFP連携サービス120をインターネットに接続するインタフェースである。MFP連携サービス120及びクラウドストレージ130は、ネットワークI/F315を介して他の装置(MFP110など)から処理リスエストを受けて各種情報を送受信する。
<画像処理システムのソフトウェア構成>
図4は、本実施例に係る画像処理システムのソフトウェア構成図である。MFP110は、ネイティブ機能部410と追加機能部420の大きく2つに分けられる。ネイティブ機能部410に含まれる各部はMFP110に標準的に備えられたものである。これに対し、追加機能部420は、MFP110に追加インストールされたアプリケーションである。追加機能部420は、Java(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しない他の追加アプリケーションがインストールされていても良い。
図4は、本実施例に係る画像処理システムのソフトウェア構成図である。MFP110は、ネイティブ機能部410と追加機能部420の大きく2つに分けられる。ネイティブ機能部410に含まれる各部はMFP110に標準的に備えられたものである。これに対し、追加機能部420は、MFP110に追加インストールされたアプリケーションである。追加機能部420は、Java(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しない他の追加アプリケーションがインストールされていても良い。
ネイティブ機能部410は、スキャン実行部411及び画像データ保存部412を有する。追加機能部420は、表示制御部421、スキャン指示部422及び連携サービスリクエスト部423を有する。
表示制御部421は、MFP110の操作部220のタッチパネル機能を有する液晶表示部に、ユーザによる操作を受け付けるためのUI画面を表示する。UIは、User Interfaceの略称である。表示制御部421は、例えば、MFP連携サービス120へアクセスするための認証情報の入力、スキャン設定、並びに、スキャン開始の操作、プレビュー画面、ファイル名やファイルの保存先のフォルダパスの設定画面などのUI画面を表示する。
スキャン指示部422は、UI画面を介して入力されたユーザ指示に応じたスキャン設定と共にスキャン実行部411にスキャン処理を要求する。スキャン実行部411は、スキャン指示部422からのスキャン設定を含んだスキャン要求を受け取る。スキャン実行部411は、スキャン要求に従い、スキャナI/F217を介してスキャナ部222で、原稿台ガラスに置かれた原稿を読み取ることでスキャン画像データを生成する。生成したスキャン画像データは、画像データ保存部412に送られる。スキャン実行部411は、保存したスキャン画像データを一意に示すスキャン画像識別子をスキャン指示部422へ送る。スキャン画像識別子はMFP110においてスキャンした画像をユニークに識別するための番号や記号、アルファベットなどである(不図示)。画像データ保存部412は、スキャン実行部411から受け取ったスキャン画像データをHDD214に保存する。スキャン指示部422は、スキャン実行部411から受け取ったスキャン画像識別子に対応するスキャン画像データを画像データ保存部412から取得する。スキャン指示部422は、取得したスキャン画像データにMFP連携サービス120で処理を行う指示を連携サービスリクエスト部423に要求する。
連携サービスリクエスト部423は、MFP連携サービス120に対して各種処理の要求を行う。連携サービスリクエスト部423は、例えば、ログイン、スキャン画像の解析、スキャン画像の送信などの要求を行う。連携サービスリクエスト部423とMFP連携サービス120とのやり取りはRESTやSOAPなどのプロトコルを使用するが、その他の通信手段を用いてもよい。RESTは、Representational State Transferの略称である。SOAPは、Simple Object Access Protocolの略称である。
MFP連携サービス120は、リクエスト制御部431、画像処理部432、クラウドストレージアクセス部433、ファイル生成部434及び表示制御部435を有する。
リクエスト制御部431は、外部装置からの要求を受信できる状態で待機している。処理要求を受けると要求に応じて適宜、画像処理部432、クラウドストレージアクセス部433及びファイル生成部434に処理を指示する。
画像処理部432は、画像に対して、帳票分類処理、文字列領域抽出処理や後述するOCR処理から成る文字認識処理、及び、画像の回転や傾き補正などの画像に対する認識処理や画像の加工処理を行う。すなわち、文字認識処理は、文字列領域抽出処理とOCR処理とを有する。文字認識処理は、文字を見つけ出すことで、文字列を検出する。画像処理部432は、文字認識処理で検出された文字列を1つ以上含む画像について、フォルダパスを作成する。
クラウドストレージアクセス部433は、クラウドストレージに対する処理の要求を行う。クラウドサービスは、一般的にRESTやSOAPなどのプロトコルで、クラウドストレージにファイルを保存したり、保存したファイルを取得したりするための様々なインタフェースを公開している。クラウドストレージアクセス部433は、公開されたクラウドストレージのインタフェースを使用してクラウドストレージの操作を行う。
ファイル生成部434は、画像ファイルを生成する。表示制御部435は、インターネット経由で接続されたPCやモバイル等の別端末(不図示)上で動作しているウェブブラウザからのリクエストを受けて画面表示に必要な画面構成情報(HTML、CSS等)を返す。ユーザは、ウェブブラウザで表示される画面経由でMFP連携サービス120に登録しているユーザ情報を確認したり、スキャンする際の設定を変更したりする。
なお、図4ではMFP110に追加機能部420をインストールする構成の例について説明したが、本発明はこの構成に限定されず、クライアントPC111に追加機能部420の機能が含まれていても構わない。
<全体の処理の流れ>
図5は、MFP110でスキャンした画像をファイル化してクラウドストレージに送信する際の各装置間の処理の流れを示すシーケンス図である。ここでは、各装置間のやり取りを中心に説明する。なお、図5ではMFP110がMFP連携サービス120とやり取りを行う記載としているが、後述する解析結果取得、画面の表示、学習の指示等はMFP110でなくクライアントPC111が実行する構成でも構わない。
図5は、MFP110でスキャンした画像をファイル化してクラウドストレージに送信する際の各装置間の処理の流れを示すシーケンス図である。ここでは、各装置間のやり取りを中心に説明する。なお、図5ではMFP110がMFP連携サービス120とやり取りを行う記載としているが、後述する解析結果取得、画面の表示、学習の指示等はMFP110でなくクライアントPC111が実行する構成でも構わない。
MFP110は、通常の状態では提供する各機能を実施するためのボタンを並べたメイン画面をタッチパネル上に表示する。MFP110にスキャン帳票をクラウドストレージに送信するための追加アプリケーション(以降、スキャンアプリと呼ぶ)をインストールすることで、アプリケーションの機能を使用するボタンがMFP110のメイン画面に表示される。このボタンを押すとスキャンした帳票をクラウドストレージに送信するための画面が表示され、図5のシーケンスで示す処理が行われる。
ステップS501においてMFP110は、MFP連携サービス120にアクセスするための認証情報を入力するログイン画面を表示する。ステップS502においてMFP110は、入力された認証情報をもとに、MFP連携サービス120にログインすることを試みる。ステップS503においてMFP連携サービス120は、ログイン要求に含まれるユーザ名とパスワードが正しいか検証し、正しければアクセストークンをMFP110に返す。以降のMFP110からMFP連携サービス120に対して行う各種リクエストにはこのアクセストークンと共に要求が出され、この情報により処理対象のユーザを特定することができる。ユーザ認証の方法は一般的に公知な手法(Basic認証、Digest認証、又はOAuthを用いた認可等)を用いて行う。
MFP110は、ログイン処理が完了したらステップS504でスキャン設定画面を表示する。スキャン設定画面では、ユーザによって各種スキャンの読み込みに関する設定が行われる。ユーザによって、原稿台ガラス又はADFにスキャンする対象の紙帳票が配置され、「スキャン開始」ボタンが押されると、MFP110は、ステップS505でスキャンを実行して紙帳票を電子化した画像データを生成する。そして、MFP110は、ステップS506でスキャン処理により生成した画像とともにスキャン画像の解析要求をMFP連携サービス120に送信する。MFP連携サービス120は、スキャン画像の解析要求を受信するとステップS507において、MFP連携サービス120の画像処理部432で画像解析を開始する。その後、MFP連携サービス120は、画像解析処理の終了を待たずに、MFP連携サービス120に依頼した解析を一意に示す識別子である”processId”をMFP110に返す。
ステップS508においてMFP連携サービス120は、スキャン画像について、帳票種別の分類を行う。帳票種別の分類は、画像内の文字領域の配置情報をもとに行う。具体的には、スキャン画像内の文字領域を抽出し、その配置と、帳票種別ごとに記憶されている過去にスキャンした画像の文字領域の配置を比較し、類似した文字領域の配置を持つ画像を特定し、その画像の帳票種別を判定結果として採用する。
ステップS509においてMFP連携サービス120は、帳票種別ごとに記憶されている抽出対象の文字列領域を抽出する。この処理を文字列領域抽出処理という。
ステップS510においてMFP連携サービス120は、抽出した文字列領域に対してOCR処理を行う。OCR処理は、画像内の注目領域に記載してある文字を認識し、テキストデータに変換する技術である。
ステップS511においてMFP連携サービス120は、ステップS510で行ったOCR処理で得られた文字列を利用し、ファイル名、及びフォルダパスを表す文字列を作成する。ここで、ファイル名は、スキャン画像をもとに作成するファイルの名前である。また、フォルダパスは、スキャン画像をもとに作成するファイルの保存先であるクラウドストレージのフォルダを表すフォルダパスである。ここでは、あらかじめユーザによって帳票種別ごとに設定されている、ファイル名、及びフォルダパスの作成ルールに従って作成する。ルールには、画像内の文字列領域から抽出した文字列、及びユーザが指定した固定文字列をどのように組み合わせて、ファイル名、及びフォルダパスを作成するかが定義されている。例えば、ファイル名:「{請求書番号}.doc」、及びフォルダパス:「/2018/{帳票種別}/{会社名}」のようなルールが設定されている。ここでは、{請求書番号}、{帳票種別}、{会社名}の部分には、それぞれの文言に対応する、画像内の特定の文字列領域から抽出した文字列が代入されるものとする。また、「.doc」、「2018」の部分は、固定文字列がそのまま代入されるものとする。例えば、{請求書番号}、{帳票種別}、及び{会社名}に対応する文字列領域から抽出された文字列が、「123-4567」、「請求書」、及び「品川株式会社」であったとする。この場合、ファイル名、及びフォルダパスはそれぞれ、「123-4567.doc」、及び「/2018/請求書/品川株式会社」と作成される。
ステップS512においてMFP連携サービス120は、クラウドストレージ130へのファイル自動送信が可能か否かの判定を行う。ここでは、作成したファイル名、及びフォルダパスの確からしさを評価し、両方共確からしいと判断できた場合のみ、自動送信の対象とする。ファイル名の確からしさは、ファイル名を構成する、画像内の特定の文字列領域から抽出したすべての文字列の、文字列領域抽出処理、及びOCR処理の結果の確信度をもとに評価される。確信度は、処理結果の確からしさの度合いを0~1までの実数値であらわしたものであり、値が大きいほど確からしいことを意味する。このとき、すべての文字列に関する文字列領域抽出処理、及びOCR処理の結果の確信度が、あらかじめ設定された(経験的に値が決められた)しきい値より大きい場合、ファイル名は確からしいと判断される。フォルダパスの確からしさの判定方法については、後に図8のフローチャートを用いて説明する。
MFP110は、ステップS513で、ステップS506のレスポンスで受け取った”processId”を使用してMFP連携サービス120に定期的に”processId”の画像解析の処理状況の確認を行う。ここで、定期的とは、例えば数百ミリ秒から数ミリ秒程度毎などである。図面では省略するが、ステップS513の処理はMFP連携サービス120の画像処理完了のレスポンスが取得できるまで(ステップS514のタイミングまで)継続して行う。MFP連携サービス120は、ステップS513の処理状況確認の要求を受けると”processId”の処理の状況を確認し、レスポンスを返す。
処理状況確認の要求に対するレスポンスには、”status”に現在の処理状況(ステータス)を示す文字列が格納される。例えば”status”が”processing”の時は、MFP連携サービス120で処理が行われている最中であることを示し、”status”が”completed”の時は処理が完了している状態であることを示す。なお、処理が失敗した場合には”status”が”failed”であるなど、この他のステータスが返ることもある。また処理完了時(”status”が”completed”の場合)のレスポンスは、ステータスと共にスキャン画像を解析した結果やスキャン設定等の情報を含む。
MFP110は、ステップS514において処理の完了を検知すると、ステップS515でレスポンスに含まれる結果情報が格納されたURLから結果情報を取得する。そして解析結果が「ファイル自動送信不可」と判定された場合、ユーザによる確認や承認が必要となるため、ステップS516、ステップS517、ステップS518及びステップS519の処理を実行する。逆に、解析結果が「ファイル自動送信可能」と判定された場合はステップS516~ステップS519の処理は行われない。
ステップS516において、MFP110は、ファイル名、及びファイルの保存先のフォルダパスを設定するための、図6に示されるような、ファイル名フォルダパス設定画面を表示する。ファイル名フォルダパス設定画面にはあらかじめ、ステップS511で作成された文字列が入力されている。ユーザによる確認後、その文字列が正しいと判断された場合は、「送信」ボタンが押下され、文字列が承認される。文字列が正しくないと判断された場合は、設定画面上で正しい文字列がユーザによって再入力され、その後で「送信」ボタンが押下され、承認が行われる。「送信」ボタンが押下されると、MFP110は、ステップS517でファイル名とフォルダパスそれぞれについて、使用した文字列領域、帳票種別、確定文字列、及びユーザ名をMFP連携サービス120に送信する。各種情報を受信したMFP連携サービス120のリクエスト制御部431は、ステップS518で画像処理部432に各種情報の保存を依頼する。画像処理部432は、ステップS519で各種情報をHDD314に保存する。
その後、MFP110は、ステップS520でスキャン画像をファイル化した後に設定するファイル名やフォルダパス等の情報をMFP連携サービス120に送信する。MFP連携サービス120は、リクエストを受信するとファイル生成処理を開始するとともにリクエストを正常に受けたことをMFP110に返す。MFP110は、送信のレスポンスを受けると処理を終了し、ステップS504のスキャン設定画面表示に戻る。
MFP連携サービス120は、ステップS521でMFP連携サービスに登録されたスキャン設定からクラウドストレージ130に送信するファイルフォーマットの情報を取得し、その設定に基づいてスキャン画像からファイルを生成する。そして、ステップS522で、MFP連携サービス120は、ステップS521で生成したファイルをステップS520で受信したファイル名に設定し、保存先のフォルダパスを指定した上でクラウドストレージ130に送信する。
図7は、本システムにおける画像処理部が行う解析結果保存処理で保存するデータ構造の一例を示す図である。
”enabledAutoTransmission”は、解析対象の画像が自動送信判定により、ユーザの確認や学習を行わずにクラウドストレージ130への送信が可能かを示す値が格納される。クライアントPC111はこの値を参照することで、対象の帳票を自動でクラウドストレージに送信するか否かを決定する。
”matched”は、解析対象の画像が類似帳票判定によって以前にスキャンした画像と類似した帳票が見つかったかどうかを示す値が格納される。
”formId”は、類似する帳票があった場合はその帳票を一意に示す値が格納され、類似する帳票がなかった場合には新たな値が発行される。
”matchingScore”は、類似する帳票があった場合にどの程度類似していたかを示す値が格納される。”matchingScore”は過去にスキャンした画像の配置情報と今回スキャンした画像の配置情報の一致度合を0~1までの実数値であらわし、値が大きいほど類似した帳票であることを示す。
”rectInfoArray”は、類似する帳票に対して以前にユーザがファイル名、及びフォルダパス設定時に使用した文字列領域に対応する、今回の解析対象の画像の文字列領域を示す情報が格納される。例えば、画像を以前にスキャンして「見積書」と「品川株式会社」を使用してファイル名とフォルダパスを設定し入力結果学習したとする。その後、新規の画像をスキャンして前記スキャン画像と類似帳票判定を行った結果、類似帳票だと判定された場合、”rectInfoArray”以下には、入力した情報が自動入力対象の情報として格納された状態を示す。まず、入力結果学習でMFP連携サービス120のHDD314に保存された情報から以前に設定した「見積書」と「品川株式会社」の文字列領域の座標情報と一部が重なる文字領域を特定する。そして、一部が重なる文字領域の座標情報と文字を”rectInfoArray”の後述する”text”に格納する。”key”は、自動入力に使用する文字領域を一意に示す値が格納される。”stringAreaScore”、及び”ocrScore”は、それぞれ、文字列領域抽出処理、及びOCR処理の結果の確信度を表す値が格納される。確信度は0~1までの実数値で表され、値が大きいほど確からしいことを示す。”region”は文字列領域の座標情報とその領域を文字認識した結果抽出した文字が格納される。”rect”には抽出した文字列領域一つの座標を示す。”x”は領域の左上のX座標、”y”は領域の左上のY座標、”width”は領域のX方向のピクセル数、”height”は領域のY方向のピクセル数を示す。”text”は”rect”の文字領域をOCRして文字認識を行った結果、抽出された文字を示す。
”metadataArray”はファイル名を自動入力するためのファイル名に使用する文字列領域の順番と区切り文字がどこに入るかを示す情報が格納される。ファイル名以外にもメタデータなどのプロパティ情報が設定されている場合は、”rectInfoArray”や”metadataArray”に必要な情報が追加される。”key”は、スキャン文書に設定する設定値を一意に示す値が格納される。”keyType”は、”key”の設定値の種別を示す値が格納される。ファイル名に使用する場合は、”key”が”filename”で”keyType”が”filename”となる。”value”は、”key”の値に使用する文字領域と区切り文字の情報が格納される。図7の例では”rectInfoArray”の中の”fileRegion0”の”key”を持つ領域、区切り文字、”fileRegion1”の”key”を持つ領域の順番でファイル名を自動入力することを示す。
図8は、MFP連携サービス120がクラウドストレージ130へのファイル自動送信が可能か否かの判定を行う際に、フォルダパスの確からしさを評価する際の処理の流れを示すフローチャートである。本フローチャートによる処理は、HDD314に記憶されたプログラムコードがRAM313に展開され、CPU311によって実行される。
ステップS801において、画像処理部432は、HDD314に保存されている、過去にユーザによって承認されたことのあるすべてのフォルダパス(過去に承認された特定のフォルダパス)を読み込む。ステップS802において、画像処理部432は、ステップS511で作成したフォルダパスに関して、最上位階層からどの階層までが、ステップS801で読み込んだ特定のフォルダパスと一致するか判断する。画像処理部432は、最上位階層からの一致を判断することで、フォルダパスの前方一致を判断している。例えば、ステップS511で作成したフォルダパスが「/2018/請求書/品川株式会社」であるとする。またステップS801で読み込んだファイルパスの中に「/2018/請求書/川崎株式会社」が存在したとする。この場合、「/2018/請求書/」までの各階層の特定のフォルダ名が一致することになる。このとき、「/2018/請求書/」以下の階層まで一致するフォルダパスが存在しない場合、最終的に、「/2018/請求書/」が一致する部分であると判断する。画像処理部432は、一致する部分のフォルダパスの各文字列を、信頼できるフォルダ名(過去にユーザにより承認された特定のフォルダ名)を表す文字列とする。
ステップS803において、画像処理部432は、フォルダパスを構成する文字列ごとに、文字列領域抽出処理とOCR処理の結果の確信度についてのしきい値処理を実行する。この処理については、後に図9のフローチャートを用いて説明する。ステップS804において、画像処理部432は、ステップS803の結果をもとに、ファイルパスの中に確からしくない文字列が存在するかどうか判定する。存在する場合はステップS805へ、存在しない場合はステップS806へ進む。ステップS805において、画像処理部432は、フォルダパスが確からしくないと判断する。画像処理部432は、フォルダパスが確からしくないと判断した場合には、そのフォルダパスをユーザによる確認対象にする。以下の各処理においても、画像処理部432は、フォルダパス又は文字列が確からしくないと判断した場合には、そのフォルダパス又は文字列をユーザによる確認対象にする。ステップS806において、画像処理部432は、フォルダパスが確からしいと判断し、自動で承認する。
図9は、ステップS803で実行される、しきい値処理の詳細な流れを示すフローチャートである。本フローチャートによる処理は、HDD314に記憶されたプログラムコードがRAM313に展開され、CPU311によって実行される。なお、ステップS901からステップS904までの処理、すなわちステップS901、ステップS902、ステップS903及びステップS904の処理は、ファイルパスを構成する文字列単位に対して行われるものとする。例えば、「/2018/請求書/川崎株式会社」というフォルダパスにおいては、「2018」、「請求書」、「川崎株式会社」それぞれの文字列に対して処理が行われる。
ステップS901において、画像処理部432は、対象文字列がスキャン画像内の文字列領域から抽出された文字列であるか判定する。文字列領域から抽出された文字列である場合はステップS902へ、そうでない場合は、ステップS904の終了時点に進む。「2018」、「請求書」及び「川崎株式会社」の例において、「2018」はユーザに指定された固定文字列であるためステップS904の終了時点へ進む。「2018」、「請求書」及び「川崎株式会社」の例において、「請求書」及び「川崎株式会社」は、文字列領域から抽出された文字列であるためステップS902へ進む。
ステップS902において、画像処理部432は、対象文字列が、ステップS802で一致すると判断した文字列であるか否か判定する。一致する文字列である場合はステップS904の終了時点へ、一致しない場合はステップS903へ進む。
ステップS903において、画像処理部432は、ステップS509で実行された文字列領域抽出処理、及びステップS510で実行されたOCR処理の結果の確信度が、あらかじめ設定された(経験的に値が決められた)しきい値以下か否か判定する。しきい値以下の場合はステップS904へ、そうでない場合はステップS904の終了時点へ進む。ステップS904において、画像処理部432は、対象文字列を、確からしくない文字列と判断する。
以上説明したように、本実施例によれば、スキャンデータを外部ストレージに送信する際に、保存先のフォルダパスについてのユーザによる確認の頻度を減らすことができ、処理を効率化することができる。本実施例によれば、フォルダパスの途中までが、過去にユーザが入力又は承認したフォルダパスと一致する場合、一致する部分が正しいフォルダパスである可能性が高いことを考慮することで、ユーザによる目視確認の頻度を減らすことができる。本実施例によれば、OCR処理で得られた文字列を元に作成したフォルダパスと、過去にユーザが入力又は承認したことがあるフォルダパスとを比較する。この比較の結果、一致する部分の文字列については、自動送信の可否を判定するために行う文字列領域抽出処理及びOCR処理の確信度に関するしきい値処理の対象外とすることができ、ユーザによる目視確認の頻度を減らすことができる。
実施例1においては、作成したフォルダパスの途中までが、過去にユーザが承認したことがあるフォルダパスと一致する場合に、一致する部分の文字列についてはしきい値処理の対象から外すことで、ユーザによる確認の頻度を減らした。このとき、一致する部分の文字列に関しても、場合によっては正しくない文字列が得られてしまっている可能性があるため、実施例2ではその問題を解決する。実施例1では図8のステップS803において図9の処理を実行したが、実施例2では、ステップS803において図9の処理に代えて図10の処理を実行する。
ここで、実施例2における、ステップS803で実行される、しきい値処理の詳細な流れについて、図10を用いて説明する。本フローチャートによる処理は、HDD314に記憶されたプログラムコードがRAM313に展開され、CPU311によって実行される。なお、本実施例のシステム構成、及び処理手順は、実施例1で説明したものと同一であるため、その説明を省略し、異なる箇所のみを説明する。具体的には、ステップS1001からステップS1002、及び、ステップS1004からステップS1005は、ステップS901からステップS902、及び、ステップS903からステップS904と同一であるため、説明を省略する。
ステップS1003において、画像処理部432は、ステップS519でHDD314に保存された情報を参照し、対象文字列によって表されるフォルダ階層以下に、所定の回数以上ファイルが保存されたことがあるか否か判定する。所定の回数以上ファイルが保存されたことがある場合はステップS1005の終了時点へ、そうでない場合は、ステップS1004へ進む。なおここでは、あらかじめ決められた回数以上ファイルが保存されたことがあるフォルダのフォルダ名のみ、確からしいフォルダ名と判断し、対象文字列がそれと一致した場合に限り、しきい値処理の対象から外すことが意図されている。
本実施例で示した方法によると、作成したフォルダパスの途中までが、過去にユーザが承認したことがあるフォルダパスと一致する場合においても、一致する部分の文字列が確からしくない場合は、しきい値処理の対象から外さないことが可能になる。
実施例1においては、作成したフォルダパスの途中までが、過去にユーザが承認したことがあるフォルダパスと一致する場合に、一致する部分の文字列についてはしきい値処理の対象から外すことで、ユーザによる確認の頻度を減らした。
また、実施例2においては、作成したフォルダパスの途中までが、過去にユーザが承認したことがあるフォルダパスと一致する場合においても、一致する部分の文字列が確からしくない場合は、しきい値処理の対象から外さないようにした。
しかしながら、一致する部分の文字列が確からしくないケースの中には、実施例2の方法では対応できないケースもある。例えば、対象文字列が、あらかじめ決められた回数以上ファイルが保存されたことがあるフォルダのフォルダ名と一致する文字列であるものの、文字列作成時に行われた文字列領域抽出処理やOCR処理の結果が間違っている可能性が高いケースが考えられる。実施例3ではそのようなケースに対応する。実施例1では図8のステップS803において図9の処理を実行したが、実施例3では、ステップS803において図9の処理に代えて図11の処理を実行する。
ここで、実施例3における、ステップS803で実行される、しきい値処理の詳細な流れについて、図11を用いて説明する。本フローチャートによる処理は、HDD314に記憶されたプログラムコードがRAM313に展開され、CPU311によって実行される。なお、本実施例のシステム構成、及び処理手順は、実施例1で説明したものと同一であるため、その説明を省略し、異なる箇所のみを説明する。具体的には、ステップS1101からステップS1102、及び、ステップS1105からステップS1106は、ステップS901からステップS902、及び、ステップS903からステップS904と同一であるため、説明を省略する。
ステップS1103において、画像処理部432は、ステップS509で実行された文字列領域抽出処理、及びステップS510で実行されたOCR処理の結果の確信度が、あらかじめ設定されたしきい値以下か否か判定する。しきい値以下の場合はステップS1104へ、そうでない場合はステップS1104の終了時点へ進む。ステップS1105で利用するしきい値は、第一のしきい値の一例である。ステップS1103で利用するしきい値は、第二のしきい値の一例である。ステップS1103で利用するしきい値は、ステップS1105で利用するしきい値より、値が小さいものとする。一致している部分の文字列に対して、それ以外の文字列に利用するより小さいしきい値を用いることで、正しい文字列である可能性が高いことを考慮しつつ、文字列領域抽出処理やOCR処理の結果の確信度が著しく低い場合にはユーザに確認させることができる。またこのとき、一致している文字列を過去に承認したのが、操作者と同一ユーザの場合は、確からしい文字列である可能性がより高いと判断して、更に小さいしきい値を利用しても良いものとする。
ステップS1104において、画像処理部432は、対象文字列を、確からしくない文字列と判断する。
本実施例で示した方法によると、過去にユーザが承認したフォルダ名と一致する文字列に関しても、文字列領域抽出処理やOCR処理の結果が間違っている可能性が高い場合は、ユーザに確認させることができる。
実施例1から3においては、作成したフォルダパスが、過去にユーザが承認したことがあるフォルダパスと一致するか否かで、保存先のストレージにそのフォルダパスが存在するか否かを判断していた。しかしながら、そのストレージのフォルダ構造を問い合わせることができる場合には、そちらの方法の方が、判断の確実性が高い。実施例4では、ストレージのフォルダ構造を問い合わせることで、フォルダパスの存在の有無についての判断の確実性を上げる。
ここで、実施例4における、MFP連携サービス120が画像処理部432で行う自動送信判定処理の詳細について、図12を用いて説明する。本フローチャートによる処理は、HDD314に記憶されたプログラムコードがRAM313に展開され、CPU311によって実行される。なお、本実施例のシステム構成、及び処理手順は、実施例1で説明したものと同一であるため、その説明を省略し、異なる箇所のみを説明する。具体的には、ステップS1201、及び、ステップS1203からステップS1206は、ステップS801、及び、ステップS803からステップS806と同一であるため、説明を省略する。
ステップS1202において、画像処理部432は、ネットワークI/F315を介して、クラウドストレージ130に、フォルダ構造を問い合わせる。
次に、実施例4における、ステップS1203で実行される、しきい値処理の詳細な流れについて、図13を用いて説明する。本フローチャートによる処理は、HDD314に記憶されたプログラムコードがRAM313に展開され、CPU311によって実行される。なお、本実施例のシステム構成、及び処理手順は、実施例1で説明したものと同一であるため、その説明を省略し、異なる箇所のみを説明する。具体的には、ステップS1301、及び、ステップS1303からステップS1304は、ステップS901、及び、ステップS903からステップS904と同一であるため、説明を省略する。
ステップS1302において、画像処理部432は、ステップS1202で問い合わせたストレージのフォルダ構造を参照し、対象文字列が、実際に存在するフォルダ名に対応する文字列か否か判定する。存在するフォルダ名に対応する文字列である場合は、ステップS1304の終了時点へ、そうでない場合はステップS1303へ進む。
本実施例で示した方法によると、ストレージのフォルダ構造を問い合わせることで、フォルダパスの存在の有無についての判断の確実性を上げることができる。
実施例1から4においては、作成したフォルダパスの途中までが、過去にユーザが承認したことがあるフォルダパス、又は存在を確認できたフォルダパスと一致する場合は、一致する部分の文字列に対するしきい値処理の有無やしきい値の値を切り替えていた。しかしながら、一致する部分の文字列と類似したフォルダ名を持つフォルダパスが他に存在する場合、しきい値処理の対象から外したり、値の小さいしきい値を用いたりすることは、危険だと考えられる。これは、それらの文字列に対するOCR処理の正しい結果が、類似したフォルダ名に対応する文字列の方である可能性が存在するためである。実施例5では、類似したフォルダ名が存在すると考えられるフォルダ名に対応する文字列については、しきい値処理の対象から外さず、それ以外の文字列と同じ値のしきい値を用いることで、必要に応じてユーザに文字列を確認させる。
ここで、実施例5における、MFP連携サービス120が画像処理部432で行う自動送信判定処理の詳細について、図14を用いて説明する。本フローチャートによる処理は、HDD314に記憶されたプログラムコードがRAM313に展開され、CPU311によって実行される。なお、本実施例のシステム構成、及び処理手順は、実施例1で説明したものと同一であるため、その説明を省略し、異なる箇所のみを説明する。具体的には、ステップS1401からステップS1402、及び、ステップS1404からステップS1407は、ステップS801からステップS802、及び、ステップS803からステップS806と同一であるため、説明を省略する。
ステップS1403において、画像処理部432は、ステップS1403で判断した、一致する部分の文字列に対応する各階層のフォルダ名について、過去にユーザが類似したフォルダ名を承認したことがあるか判断する。このとき、2つのフォルダ名が類似しているか否かは、例えばレーベンシュタイン距離のような、文字列の類似度を示す指標を利用し、その指標が一定のしきい値以下であるか否かによって判断することとする。
次に、実施例5における、ステップS1404で実行される、しきい値処理の詳細な流れについて、図15を用いて説明する。本フローチャートによる処理は、HDD314に記憶されたプログラムコードがRAM313に展開され、CPU311によって実行される。なお、本実施例のシステム構成、及び処理手順は、実施例1で説明したものと同一であるため、その説明を省略し、異なる箇所のみを説明する。具体的には、ステップS1501からステップS1502、及び、ステップS1504からステップS1505は、ステップS901からステップS902、及び、ステップS903からステップS904と同一であるため、説明を省略する。
ステップS1503において、画像処理部432は、ステップS1403の処理の結果をもとに、対象文字列が、類似した名前のフォルダが他に存在しないフォルダの名前に対応する文字列か否か判定する。対応する文字列である場合は、ステップS1505の終了時点へ、そうでない場合はステップS1504へ進む。
本実施例で示した方法によると、類似したフォルダ名が存在すると考えられるフォルダ名に対応する文字列について、しきい値処理の対象から外さずそれ以外の文字列と同じ値のしきい値を用いることで、必要に応じてユーザに文字列を確認させることができる。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以上、本発明の好ましい実施形態について説明したが、本発明は、これらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。
110 MFP
210 制御部
220 操作部
221 プリンタ
222 スキャナ
223 モデム
210 制御部
220 操作部
221 プリンタ
222 スキャナ
223 モデム
Claims (9)
- 画像データを取得する手段と、
前記取得した画像データに対して文字認識処理を行って文字列を検出し、前記検出した文字列を1つ以上含む、前記取得した画像データの保存先を表すフォルダパスを作成する手段と、
前記作成したフォルダパスを構成する各文字列が、特定のフォルダ名を表す文字列であるか否かを判定し、前記特定のフォルダ名を表す文字列でないと判定された文字列についての前記文字認識処理の結果の確信度がしきい値以下であるか否かを判定し、前記しきい値以下であると判定された文字列が少なくとも1つ存在する場合、前記作成したフォルダパスをユーザによる確認対象にする手段と、
を備えることを特徴とする画像処理装置。 - 画像データを取得する手段と、
前記取得した画像データに対して文字認識処理を行って文字列を検出し、前記検出した文字列を1つ以上含む、前記取得した画像データの保存先を表すフォルダパスを作成する手段と、
前記作成したフォルダパスを構成する各文字列が、特定のフォルダ名を表す文字列であるか否かを判定し、前記特定のフォルダ名を表す文字列でないと判定された文字列についての前記文字認識処理の結果の確信度が第一のしきい値以下であるか否かを判定し、前記特定のフォルダ名を表す文字列であると判定された文字列についての前記文字認識処理の結果の確信度が第二のしきい値以下であるか否かを判定し、前記第一のしきい値以下であると判定された文字列および前記第二のしきい値以下であると判定された文字列の少なくともいずれかが少なくとも1つ存在する場合、前記作成したフォルダパスをユーザによる確認対象にする手段と、
を備えることを特徴とする画像処理装置。 - 前記特定のフォルダ名は、過去にユーザにより承認されたフォルダパスを構成するフォルダ名である
ことを特徴とする請求項1又は2に記載の画像処理装置。 - 前記特定のフォルダ名は、過去にユーザにより承認されたフォルダパスを構成するフォルダ名であって、当該過去にユーザにより承認されたフォルダパスのフォルダ階層以下に、所定の回数以上ファイルが保存されたことがあるフォルダパスを構成するフォルダ名である
ことを特徴とする請求項1又は2に記載の画像処理装置。 - 前記特定のフォルダ名は、前記画像データの保存先にフォルダ構造を問い合わせ、得られたフォルダ構造の中に存在するフォルダのフォルダ名である
ことを特徴とする請求項1又は2に記載の画像処理装置。 - 前記特定のフォルダ名は、過去にユーザにより承認されたフォルダパスを構成するフォルダ名であって、同じ階層に類似したフォルダ名を持つフォルダが存在しないフォルダのフォルダ名である
ことを特徴とする請求項1又は2に記載の画像処理装置。 - 画像データを取得する工程と、
前記取得した画像データから文字列領域を抽出し、前記抽出した文字列領域に対して文字認識処理を行って文字列を検出し、前記検出した文字列を1つ以上含む、前記取得した画像データの保存先を表すフォルダパスを作成する工程と、
前記作成したフォルダパスを構成する各文字列が、特定のフォルダ名を表す文字列であるか否かを判定し、前記特定のフォルダ名を表す文字列でないと判定された文字列についての前記文字認識処理の結果の確信度がしきい値以下であるか否かを判定し、前記しきい値以下であると判定された文字列が少なくとも1つ存在する場合、前記作成したフォルダパスをユーザによる確認対象にする工程と、
を備えることを特徴とする画像処理方法。 - 画像データを取得する工程と、
前記取得した画像データから文字列領域を抽出し、前記抽出した文字列領域に対して文字認識処理を行って文字列を検出し、前記検出した文字列を1つ以上含む、前記取得した画像データの保存先を表すフォルダパスを作成する工程と、
前記作成したフォルダパスを構成する各文字列が、特定のフォルダ名を表す文字列であるか否かを判定し、前記特定のフォルダ名を表す文字列でないと判定された文字列についての前記文字認識処理の結果の確信度が第一のしきい値以下であるか否かを判定し、前記特定のフォルダ名を表す文字列であると判定された文字列についての前記文字認識処理の結果の確信度が第二のしきい値以下であるか否かを判定し、前記第一のしきい値以下であると判定された文字列および前記第二のしきい値以下であると判定された文字列の少なくともいずれかが少なくとも1つ存在する場合、前記作成したフォルダパスをユーザによる確認対象に工程と、
を備えることを特徴とする画像処理方法。 - 請求項1乃至6のいずれか1項に記載の画像処理装置の各手段としてコンピュータを機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021072754A JP2022167157A (ja) | 2021-04-22 | 2021-04-22 | 画像処理装置、画像処理方法、及びプログラム |
US17/719,185 US20220343664A1 (en) | 2021-04-22 | 2022-04-12 | Image processing apparatus, image processing method, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021072754A JP2022167157A (ja) | 2021-04-22 | 2021-04-22 | 画像処理装置、画像処理方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022167157A true JP2022167157A (ja) | 2022-11-04 |
Family
ID=83693367
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021072754A Pending JP2022167157A (ja) | 2021-04-22 | 2021-04-22 | 画像処理装置、画像処理方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20220343664A1 (ja) |
JP (1) | JP2022167157A (ja) |
-
2021
- 2021-04-22 JP JP2021072754A patent/JP2022167157A/ja active Pending
-
2022
- 2022-04-12 US US17/719,185 patent/US20220343664A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220343664A1 (en) | 2022-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7391672B2 (ja) | 文書を電子化するための画像処理システム、その制御方法及びプログラム | |
JP7528323B2 (ja) | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム | |
KR20210122147A (ko) | 문자열을 취득하기 위한 정보 처리 장치 | |
JP7467737B2 (ja) | ユーザ操作のためのガイダンスを表示する画像処理装置、その制御方法及びプログラム | |
US20220201146A1 (en) | Information processing apparatus, information processing system, control method of the same, and storage medium | |
JP7225017B2 (ja) | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム | |
US11800032B2 (en) | Apparatus, information processing method, and storage medium | |
US11620840B2 (en) | Image processing apparatus for extracting a desired character string from a scanned image | |
JP2020178280A (ja) | スキャン画像にプロパティを設定するための画像処理装置、その制御方法及びプログラム | |
JP2022167157A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2023072812A (ja) | 情報処理装置、情報処理装置の制御方法、そのプログラム及び画像処理システム | |
JP2021164132A (ja) | 画像処理システム、及びプログラム | |
JP7358663B2 (ja) | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム | |
JP7520563B2 (ja) | 文書を電子化するための画像処理システム、その制御方法及びプログラム | |
JP7508199B2 (ja) | スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム | |
JP2023128455A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2023054708A (ja) | 情報処理装置、文書分割方法、及びプログラム | |
JP2023071227A (ja) | 情報処理装置、情報処理装置の制御方法及びプログラム | |
JP2022189109A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2022137727A (ja) | 情報処理装置、情報処理システム、その制御方法及びプログラム | |
JP2024062604A (ja) | 画像処理システム、画像処理システムの制御方法、及びプログラム | |
JP2023084495A (ja) | 情報処理装置、文書電子化システム、文書処理方法とプログラム | |
JP2023167871A (ja) | 画像処理装置、情報処理装置、画像処理システム、画像処理方法、情報処理方法、およびプログラム | |
JP2020177526A (ja) | スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム | |
JP2022159774A (ja) | 画像処理装置、画像処理システム、その制御方法及びプログラム |