JP2019068324A - スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム - Google Patents

スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム Download PDF

Info

Publication number
JP2019068324A
JP2019068324A JP2017193616A JP2017193616A JP2019068324A JP 2019068324 A JP2019068324 A JP 2019068324A JP 2017193616 A JP2017193616 A JP 2017193616A JP 2017193616 A JP2017193616 A JP 2017193616A JP 2019068324 A JP2019068324 A JP 2019068324A
Authority
JP
Japan
Prior art keywords
character string
user
divided
predetermined
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017193616A
Other languages
English (en)
Other versions
JP6968647B2 (ja
JP2019068324A5 (ja
Inventor
憲 鴇田
Ken Tokita
憲 鴇田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017193616A priority Critical patent/JP6968647B2/ja
Priority to US16/139,996 priority patent/US11386046B2/en
Publication of JP2019068324A publication Critical patent/JP2019068324A/ja
Publication of JP2019068324A5 publication Critical patent/JP2019068324A5/ja
Application granted granted Critical
Publication of JP6968647B2 publication Critical patent/JP6968647B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1456Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00209Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax
    • H04N1/00222Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax details of image data generation or reproduction, e.g. scan-to-email or network printing
    • H04N1/00225Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax details of image data generation or reproduction, e.g. scan-to-email or network printing details of image data generation, e.g. scan-to-email or network scanners
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Abstract

【課題】スキャン画像に対してOCR処理を行って得られた文字列を用いてファイル名等の設定を行う場面において、ユーザの利便性を高める。
【解決手段】スキャン画像内の一続きの文字列と推認される単位領域をユーザが選択可能に表示した、所定の処理を行うためのUI画面を表示する表示制御手段と、前記UI画面を介してユーザが選択した単位領域に対しOCR処理を行って文字列を抽出するOCR処理手段と、前記OCR処理手段により抽出された前記文字列を用いて前記所定の処理のための付帯情報を設定する設定手段と、を備え、前記表示制御手段は、ユーザにより選択された前記単位領域から前記OCR処理手段によって抽出された前記文字列のうち所定の分割条件を満たす文字列を分割して前記UI画面にユーザにより選択可能に表示する。
【選択図】図10

Description

本発明は、スキャン画像の文字認識結果を用いて、当該スキャン画像に対してファイル名等を設定する技術に関する。
従来より、文書の管理手法として、紙文書をスキャンして電子化する手法が広く行われている。そして、文書の電子化に際して、スキャンされた画像データに対して文字認識処理(OCR処理)を行い、認識された文字を、電子化した文書ファイルのファイル名に使用する技術がある。例えば、特許文献1には、原稿を読み取って得たスキャン画像に対しOCR処理を行って文字列を取得し、文字列をスキャン画像と共にユーザに提示し、ユーザにより指定された文字列をスキャン画像のファイル名などに使用する技術が開示されている。
特開2016−024488号公報
しかしながら、特許文献1では、ファイル名として指定可能な文字列にユーザが意図しない文字列を含んでいる場合、ユーザが文字列を指定してファイル名を設定した後に、ユーザが意図しない文字列を削除しなければならず、作業効率が良くなかった。
本発明は、上記の課題に鑑みなされたものであり、スキャン画像に対してOCR処理を行って得られた文字列を用いてファイル名等の設定を行う場面において、ユーザの利便性を高めることを目的としている。
上述した課題を解決する本発明に係る装置は、文書をスキャンして得られたスキャン画像に対して所定の処理を行う装置であって、前記スキャン画像内の一続きの文字列と推認される単位領域をユーザが選択可能に表示した、前記所定の処理を行うためのUI画面を表示する表示制御手段と、前記UI画面を介してユーザが選択した単位領域に対しOCR処理を行って文字列を抽出するOCR処理手段と、前記OCR処理手段により抽出された前記文字列を用いて前記所定の処理のための付帯情報を設定する設定手段と、を備え、前記表示制御手段は、ユーザにより選択された前記単位領域から前記OCR処理手段によって抽出された前記文字列のうち所定の分割条件を満たす前記文字列を分割して前記UI画面にユーザにより選択可能に表示することを特徴とする。
本発明によれば、スキャン画像に対してOCR処理を行って得られた文字列を用いてファイル名等の設定を行う場面において、ユーザの利便性を高めることができる。
画像処理システムの全体構成を示す図 MFPのハードウェア構成図 ファイルサーバのハードウェア構成図 MFPのソフトウェア構成図 スキャン画像の生成からアップロードまでの動作制御の流れを示すフローチャート スキャン設定画面の一例を示す図 プレビュー画面の一例を示す図 プレビュー画面でファイル名が生成された状態を示す図 アップロード設定画面の一例を示す図 ファイル名の生成処理の詳細を示すフローチャート 分割単語リストの一例を示す図 第2の実施形態に係る、ファイル名の入力処理の一例を示す図 第3の実施形態に係る、プレビュー画面の一例を示す図 分割単語領域の表示処理の詳細を示すフローチャート ファイル名の生成処理の詳細を示すフローチャート
以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。
[第1の実施形態]
<画像処理システムの構成>
図1は、本実施形態に係る画像処理システムの全体構成を示す図である。画像処理システムは、MFP110とファイルサーバ120とで構成され、LAN(Local Area Network)を介して互いに通信可能に接続されている。
MFP(Multi Function Printer)110は、スキャナやプリンタといった複数の機能を有する複合機であり、画像処理装置の一例である。ファイルサーバ120は、電子化された文書ファイルを保存・管理する外部サーバの一例である。本実施形態の画像処理システムは、MFP110とファイルサーバ120とからなる構成としているがこれに限定されない。例えば、MFP110がファイルサーバ120の役割を兼ね備えてもよい。また、LANに代えてインターネットなどを介した接続形態であってもよい。また、MFP110は、PSTN(Public Switched Telephone Networks)に接続され、ファクシミリ装置(不図示)との間で画像データをファクシミリ通信することができる。
<MFPのハードウェア構成>
図2は、MFP110のハードウェア構成図である。MFP110は、制御部210、操作部220、プリンタ部221、スキャナ部222、モデム223で構成される。制御部210は、以下の各部211〜219で構成され、MFP110全体の動作を制御する。CPU211は、ROM212に記憶された制御プログラムを読み出して、読取/印刷/通信などMFP110が有する各種機能を実行・制御する。RAM213は、CPU211の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施形態では1つのCPU211が1つのメモリ(RAM213またはHDD214)を用いて後述のフローチャートに示す各処理を実行するものとするが、他の態様であっても構わない。例えば、複数のCPUや複数のRAMまたはHDDを協働させて各処理を実行してもよい。HDD214は、画像データや各種プログラムを記憶する大容量記憶部である。操作部I/F215は、操作部220と制御部210を接続するインタフェースである。操作部220には、タッチパネル機能を有する液晶表示部やキーボードなどが備えられており、ユーザによる操作/入力/指示を受け付ける受付部としての役割を担う。これらのユーザによる操作などは液晶パネルに対するタッチによって受け付けてもよいし、ユーザによるキーボードやボタンなどの操作によって受け付けてもよい。プリンタI/F216は、プリンタ部221と制御部210を接続するインタフェースである。印刷用の画像データはプリンタI/F216を介して制御部210からプリンタ部221へ転送され、記録媒体上に印刷される。スキャナI/F217は、スキャナ部222と制御部210を接続するインタフェースである。スキャナ部222は、不図示の原稿台やADF(Auto Document Feeder)にセットされた原稿を読み取って画像データを生成し、スキャナI/F217を介して制御部210に入力する。MFP110は、スキャナ部222で生成された画像データをプリンタ部221から印刷出力(コピー)するほか、ファイル送信またはメール送信することができる。モデムI/F218は、モデム223と制御部210を接続するインタフェースである。モデム223は、PSTN上のファクシミリ装置との間で画像データをファクシミリ通信する。ネットワークI/F219は、制御部210(MFP110)をLANに接続するインタフェースである。MFP110は、ネットワークI/F219を用いてLAN上の外部装置(ファイルサーバ120など)に画像データや情報を送信したり、各種情報を受信したりする。
<ファイルサーバのハードウェア構成>
図3は、ファイルサーバ120のハードウェア構成図である。ファイルサーバ120は、CPU311、ROM312、RAM313、HDD314及びネットワークI/F315で構成される。CPU311は、ROM312に記憶された制御プログラムを読み出して各種処理を実行することで、ファイルサーバ120全体の動作を制御する。RAM313は、CPU311の主メモリ、ワークエリアなどの一時記憶領域として用いられる。HDD314は、画像データや各種プログラムを記憶する大容量記憶部である。ネットワークI/F315は、ファイルサーバ120をLANに接続するインタフェースである。ファイルサーバ120は、ネットワークI/F315を用いてLAN上の他の装置(例えばMFP110)との間で各種情報を送受信する。
<MFPのソフトウェア構成>
図4は、MFP110のソフトウェア構成図である。MFP110のソフトウェアは、ネイティブ機能モジュール410とアディショナル機能モジュール420の2つに大きく分けられる。ネイティブ機能モジュール410に含まれる各部は、MFP110に標準的に備えられた機能モジュールである。これに対し、アディショナル機能モジュール420に含まれる各部は、MFP110に追加的に備わる機能モジュールであり、例えばアプリケーションのインストールによって実現される機能モジュールである。本実施形態におけるアディショナル機能モジュール420は、Java(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しないほかのアプリケーションがインストールされていても良い。以下、両機能モジュール410及び420を構成する各部について説明する。
アプリケーション表示部423は、操作部220のタッチパネルに、ユーザによる各種操作を受け付けるためのUI画面を表示する表示制御を行う。表示するUI画面の詳細については後述する。スキャン指示部421は、UI画面を介して入力されたユーザ指示に従い、スキャン設定や転送設定の情報を含んだスキャン要求をスキャン実行部411に送信して、スキャン処理を実行させる。このスキャン要求には、後述するアプリケーション受信部422が受信する画像データが、当該スキャン要求に対応したものかどうかを識別するための要求IDも含まれる。
スキャン実行部411は、スキャン指示部421からスキャン要求を受けて、スキャナI/F217を介してスキャナ部222を制御しスキャン処理を実行する。これにより、原稿が読み取られて画像データが生成される。スキャンによって生成された画像データ(以下、「スキャン画像データ」と呼ぶ。)はその転送先を特定する転送特定の情報と共に転送部412に渡される。転送部412は、スキャン実行部411から受け取ったスキャン画像データを、転送設定に従って転送する。スキャン画像データの転送先としては、ファイルサーバ120や、LAN上のPC(不図示)等を設定可能である。ただし、本実施形態ではスキャン実行部411で生成したスキャン画像データは、一旦全て、アディショナル機能モジュール420に転送するように設定されているものとする。転送部412は、FTP(File Transfer Protocol)クライアント機能を有しており、FTPサーバ機能を有するアプリケーション受信部422に対してFTPでスキャン画像データを転送する。
アプリケーション受信部422は、転送部412から内部転送されたスキャン画像データを受信し、アプリケーション転送部424に渡す。アプリケーション転送部424は、受信したスキャン画像データを画像解析部425に渡す。
画像解析部425は、受け取ったスキャン画像データに対して文字列領域の特定や文字列認識や文章方向の特定といった画像解析処理を行なう。そして、スキャン画像データとその解析結果は、アプリケーション転送部424を介して、プレビュー表示部426に渡される。プレビュー表示部426は、スキャン画像データとその解析結果に基づき、ユーザがファイル名設定を行うためのUI画面であるプレビュー画面を生成し、操作部220のタッチパネルに表示するといった表示制御を行う。表示するプレビュー画面の詳細については後述する。
アップロード指示部427は、ユーザがフォルダパス設定を行うためのUI画面を生成し、操作部220のタッチパネルに表示する。アプリケーション転送部424は、ファイルサーバ120にスキャン画像データを転送(送信)する。アプリケーション転送部424は、転送が終了すると、アプリケーション表示部423に転送が終了したことを通知する。アプリケーション表示部423は、アプリケーション転送部424からの通知を受けて、表示内容を更新する。また、アプリケーション転送部424は、SMB(Server Message Block)クライアント機能を有している。これにより、SMBサーバ機能を有するファイルサーバ120に対してSMBを用いてファイル操作及びフォルダ操作を行う。なお、使用するプロトコルは、SMBに限定されるものではなく、WebDAV、FTP、SMTPなどであってもよい。また、SOAPやRESTといったファイル送信目的以外のプロトコルも使用可能である。
続いて、MFP110において原稿からスキャン画像を生成し、ファイルサーバ120にアップロードする際の動作制御について説明する。図5は、スキャン画像データの生成からアップロードまでの制御の流れを示すフローチャートである。この一連の処理は、制御部210がHDD214に記憶された制御プログラムを実行することにより実現される。以下、詳しく説明する。
ステップ501では、アプリケーション表示部423により、スキャン処理のための各種設定を行うためのUI画面(以下、「スキャン設定画面」と呼ぶ。)が、操作部220のタッチパネルに表示される。図6は、スキャン設定画面の一例を示す図である。図6のスキャン設定画面600には、5つの設定ボタン601〜605が存在する。[カラー設定]ボタン601は、原稿をスキャンする際のカラー/モノクロを設定するためのボタンである。[解像度設定]ボタン602は、原稿をスキャンする際の解像度を設定するためのボタンである。[両面読み取り設定]ボタン603は、原稿の両面をスキャンしたい場合に用いる設定ボタンである。[原稿混載設定]ボタン604は、サイズが異なる原稿をまとめてスキャンしたい場合に用いる設定ボタンである。[画像形式設定]ボタン605は、スキャン画像データの保存形式を指定する際に用いる設定ボタンである。これら設定ボタン601〜605を用いた設定時には、MFP110においてサポートされている範囲で設定可能な候補(選択肢)が表示され、ユーザが表示された候補から望むものを選択する。なお、上述の設定ボタンは一例であって、これらすべての設定項目が存在しなくてもよいし、これら以外の設定項目が存在してもよい。ユーザは、このようなスキャン設定画面600を介してスキャン処理についても詳細な設定を行う。[キャンセル]ボタン620は、スキャン設定を中止する場合に用いるボタンである。[スキャン開始]ボタン621は、原稿台等にセットした原稿に対するスキャン処理の開始を指示するためのボタンである。
ステップ502では、アプリケーション表示部423により、ユーザによるボタン操作の内容によって処理の切り分けがなされる。[スキャン開始]ボタン621の押下を検出された場合、アプリケーション表示部423によって各設定ボタン601〜605で設定された内容とスキャン処理の実行開始の受付が、スキャン指示部421に対して伝えられる。一方、[キャンセル]ボタン620の押下を検出された場合は本処理を終える。
ステップ503では、スキャン指示部421からの指示に応答して、スキャン実行部411によってスキャン処理が実行される。これにより得られたスキャン画像データは、ステップ504において、転送部412を通じてアプリケーション受信部422にFTPで内部転送され、さらにアプリケーション転送部424を介して画像解析部425に送られる。
ステップ505では、画像解析部425において、スキャン画像データの解析処理が実行される。具体的には、まず、スキャン画像データに対し、画像信号の二値化やスキャン時にずれた原稿の傾きの修正、原稿が正立する方向への回転などを行って、解析処理を行いやすい状態に補正する。そして、補正されたスキャン画像(2値画像)に対しエッジ抽出などを行って、当該画像内の文字列領域、すなわち、一続きの文字列と推認される塊(単位領域)を特定する。続いて、単位領域ごとに文字列を解析する。以下の表1は、ある見積書のスキャン画像の一部に対して画像解析処理を行った結果の一例を示している。
Figure 2019068324
上記表1において、[番号]は、特定された各文字列領域を一意に示す番号である。この例では1から8までの通し番号が、認識した順番に付けられている。座標はプレビュー領域710の左上を原点(0,0)として右方向にX軸、下方向にY軸をとるものとする。[領域のX座標]は、特定された各文字列領域の左上隅のX座標を示す。[領域のY座標]は、特定された各文字列領域の左上隅のY座標を示す。以後、文字列領域に対して“座標”という場合は、特に断らない限り、文字列領域の左上隅の位置座標のことを意味するものとする。[領域の幅]は、特定された各文字列領域の左辺から右辺までの距離を示す。[領域の高さ]は、特定された各文字列領域の上辺から下辺までの距離を示す。本実施形態では、[領域のX座標]、[領域のY座標]、[領域の幅]、[領域の高さ]はいずれもピクセルで示すが、ポイントやインチ等で示してもよい。スキャン画像から抽出された各文字列領域の情報(以下、「文字列領域情報」と呼ぶ。)は、画像解析データとしてアプリケーション転送部424に渡される。このとき、文字列の情報に、文字列に含まれる一文字ごとの座標情報を含ませることも可能である。
画像解析データは、例えばCSVやXMLのフォーマットとするが、他のフォーマットであっても構わない。また、HDD214に一旦保存した上で、所定のタイミングで渡してもよい。
ステップ506では、アプリケーション転送部424により、ステップ503で読み込まれたスキャン画像が、操作部220のタッチパネルにプレビュー表示される。このプレビュー表示用の画面データは、アプリケーション表示部423によって生成・提供される。ユーザは、スキャン画像がプレビュー表示されたUI画面(以下、「プレビュー画面」と呼ぶ。)を介して、スキャン画像データのファイル名を設定することができる。図7(a)は、プレビュー画面の一例を示す図である。プレビュー画面700において、画面中央にあるプレビュー領域710内には、スキャン画像と共にその表示状態を変更するための複数のボタン711〜714も表示される。ボタン711及び712はスキャン画像の全体を表示しきれないときに現れるボタンで、表示領域を縦方向にスクロールするためのボタンである。MFP110が備えるタッチパネルは通常それほど大きくはない。そこで、例えば、スキャン画像がA4縦・横書きの原稿を読み取ったものである場合は、スキャン画像の幅方向(短手方向)全体がプレビュー領域710にちょうど収まるように上詰めで縮小表示されるよう初期設定される。つまり、初期設定においては、A4縦のスキャン画像の下部は、プレビュー領域710内に表示されないことになる。このようなとき、「↓」のボタン712を押下すると下に表示領域がスクロールし、下部を表示させることができる。さらに、スキャン画像が例えばA4横やA3などの場合には、表示領域を横方向にスクロールするためのボタンをさらに設ければよい。ボタン713及び714は、表示領域を拡大・縮小するためのボタンであり、「+」のボタン713を押下するとズームインし、「−」のボタン714を押下するとズームアウトする。これらボタン操作による動作を、プレビュー画面上でスワイプやピンチアウト/ピンチインといったユーザの指による操作で実現してもよい。また、プレビュー領域710には、ステップ505の画像解析処理によって特定された文字領域が、上述の文字列領域情報に基づき、ユーザに識別可能な態様で表示される。図7(b)は、図7(a)のプレビュー画面700において、各文字列領域が囲み枠によって識別可能に表示された状態を示す図である。文字列領域の表示処理の詳細については後述する。ユーザがプレビュー領域710に表示された文字列領域の中から任意の文字列領域を選択(例えば指でタッチ)すると、そこに含まれる文字列がファイル名入力欄701に表示、すなわち自動入力され、ファイル名を構成する文字列の一部となる。[戻る]ボタン720は、プレビュー表示を中止する場合に用いるボタンである。[次へ]ボタン721は、読み込まれたスキャン画像データのアップロード先を設定する画面に移行するためのボタンである。また、ボタン702はファイル名のフォーマットなどを設定するためのボタンである。なお、上述した各種ボタンの種類、各文字列領域の表示や選択の態様は一例にすぎず、これに限定されない。例えば、ファイル名入力欄701に表示された文字列を修正・変更したり、ファイル名を確定したりするためのボタンがあってもよい。
ステップ507では、プレビュー表示部426により、読み込まれたスキャン画像に対するファイル名の生成がなされる。図8は、ファイル名生成後のプレビュー画面700の状態を示している。この例では、「見積書」、「東京株式会社」、「2017年04月14日」に対応する文字列領域が順次選択されたことで、「見積書_東京株式会社_2017年04月14日」の文字列が、ファイル名入力欄701に表示・設定されている。また、プレビュー領域710では、ユーザがタッチ操作した文字列領域の囲みが、ファイル名の一部として選択されたことを示すため太枠に変わっている。このファイル名生成処理の詳細については後述する。所望するファイル名が生成されてユーザが[次へ]ボタン721を押下すると、ステップ508へ進む。
ステップ508では、プレビュー表示部426により、ステップ502と同様、ユーザによるボタン操作の内容によって処理の切り分けがなされる。[次へ]ボタン721の押下が検出された場合は、ファイル名入力欄701に表示中のファイル名(ファイル名として設定された文字列)の情報がアップロード指示部427へ送られ、ステップ509へ進む。一方、[戻る]ボタン720の押下が検出された場合は、ステップ501(スキャン設定画面の表示)へ戻る。
ステップ509では、アップロード指示部427により、スキャン画像データの転送先を設定するためのUI画面(以下、「アップロード設定画面」と呼ぶ。)が、操作部220のタッチパネルに表示される。ユーザは、このアップロード設定画面を介して、ファイルサーバ120へのアップロードに関する詳細設定を行う。図9は、アップロード設定画面の一例を示す図である。ユーザは、[フォルダパス]入力欄901に、ファイルサーバ120へ外部転送する際のフォルダパスの名称(パス名)を入力する。図9の例では、“2017_04_14”がパス名として入力されている。入力方法としては、例えば[フォルダパス]入力欄901へのタップ操作に応じてキーボード画面のサブウインドウ(不図示)を表示し、ユーザに、当該キーボード画面を介してパス名を入力させる方法がある。あるいは、HDD214内に保持するアドレス帳の中から選択して設定できるようにしてもよい。[戻る]ボタン920は、アップロードに関する詳細設定を中止する場合に用いるボタンである。[アップロード]ボタン921は、[フォルダパス]入力欄901で設定したフォルダパスへのアップロードを指示するためのボタンである。
ステップ510では、アップロード指示部427により、ステップ508と同様、ユーザによるボタン操作の内容によって処理の切り分けがなされる。[アップロード]ボタン921の押下が検出された場合は、ステップ511へ進む。その際、[フォルダパス]入力欄901に入力されたパス名、ステップ507で生成されたファイル名、ファイルサーバ設定は、ファイルサーバ120にスキャン画像データを格納するために必要な情報である。具体的には、ホスト名、フォルダパスの起点、ログイン用のユーザ名とパスワードといった情報を含む。一方、[戻る]ボタン920の押下が検出された場合は、ステップ506(プレビュー画面の表示)へ戻る。
ステップ511では、アプリケーション転送部424により、スキャン画像データの格納先パスが、アップロード指示部427から受け取った情報に基づき生成される。具体的には、ファイルサーバ設定(ファイルサーバ120のホスト名、フォルダパスの起点)にフォルダパスを加えて生成される。これにより、例えば“\\server01\Share\2017_04_14”といった格納先パスが生成される。そして、ステップ512では、アプリケーション転送部424により、ファイルサーバ120に対するアクセスが実行される。この際、ファイルサーバ設定に含まれるユーザ名とパスワードをファイルサーバ120に送信する。ユーザ名とパスワードを受け取ったファイルサーバ120では、認証処理が実行される。
ステップ513では、アプリケーション転送部424により、ファイルサーバ120での認証結果に従って処理の切り分けがなされる。すなわち、ファイルサーバ120から認証成功の通知を受信した場合は、ステップ514に進む。一方、認証失敗の通知を受信した場合は、本処理を終える。
ステップ514では、アプリケーション転送部424により、ステップ511で生成された格納先パスが示すフォルダにスキャン画像データが外部転送され、ファイルサーバ120内に格納される。
以上が、本実施形態に係るスキャン画像の生成からアップロードまでの動作制御の内容である。なお、本実施形態では、ステップ505〜507の処理を、スキャンによって生成された1ページ分の画像データに対して行うことを想定している。例えば、プレビュー画面700内に次のページの画像解析を行うためのボタンを設け、その解析によって得られた次ページのプレビュー表示を行って、次ページ以降の文字列領域からファイル名を構成する文字列を設定できるようにしてもよい。
<ファイル名の生成>
図10は、プレビュー表示部426におけるファイル名生成処理(ステップ507)の詳細を示すフローチャートである。以下、図10のフローに沿って説明する。
ステップ1001では、タッチパネル上に表示されたプレビュー画面700へのユーザによるタッチ操作の有無が監視される。タッチ操作が検出されるとステップ1002へ進む。続くステップ1002では、タッチ操作の内容によって処理の切り分けがなされる。タッチ操作の内容が、[次へ]ボタン721または[戻る]ボタン720の押下であった場合は、本処理を終える。[次へ]ボタン721または[戻る]ボタン720の押下ではなかった場合は、ステップ1003へ進む。
ステップ1003では、タッチ操作がなされたタッチパネル上の位置座標(x,y)が取得される。続くステップ1004では、タッチ操作された位置座標が、いずれかの文字列領域と重なるかどうかが判定される。例えば、タッチ操作された位置座標が、プレビュー領域710に表示された各文字例領域の内側(文字列領域の四隅を表す位置座標で特定される矩形の内側)に含まれるかどうかで判定する。タッチ操作された位置座標がいずれかの文字列領域と重なっている場合は、ステップ1005へ進む。一方、重なっていない場合は、ステップ1001に戻る。
ステップ1005では、タッチ操作された位置座標と重なっている文字列領域の文字列が取得される。文字列の取得は、タッチ操作によって選択された文字列領域(以下、「選択文字列領域」と呼ぶ。)に対するOCR処理を画像解析部425で実行して、文字列を抽出することで取得される。
ステップ1006では、プレビュー表示部426により、前記抽出した文字列情報が単語ごとに分割される。文字列の分割条件に関しては限定しない。例えば、文字列に含まれるスペースやコロンといった特定の文字を区切り文字として複数の単語に分割したり、形態素解析を使用して品詞ごとに分割複数の単語(複数の名詞)を取り出したりしてもよい。
ステップ1007では、プレビュー表示部426により、分割された単語の数が複数存在するか、つまり、分割できたかどうかが判定される。分割単語が複数存在する場合、ステップ1008へ進み、分割単語数分のステップ1008乃至1011を繰り返す。分割されなかった場合、ステップ1017に進む。
ステップ1008では、プレビュー表示部426により、ステップ1006で得られた複数の分割単語の中から1つの分割単語が決定される。
ステップ1009では、プレビュー表示部426により、ステップ1008で決定された分割単語に関し、座標、高さおよび幅が取得される。分割単語の座標、高さおよび幅は、前記画像解析部425から取得した文字の座標から算出してもよいし、文字列領域の座標と単語の文字数から算出してもよい。
ステップ1010では、プレビュー表示部426により、分割単語リスト(選択リスト)に当該分割単語が追加される。このとき、分割単語は表示条件に従い分割単語リストに追加される。表示条件として、例えば、前記タッチ座標と当該分割単語の座標からその距離を算出し、距離に応じて分割単語を分割単語リストに追加する条件を用いることが可能である。分割単語リストでは、例えば、上位にタッチ座標に最も近い分割単語が表示され、下位にタッチ座標から最も離れた分割単語が表示される。このような表示条件に従い分割単語が表示される分割単語リストによれば、ユーザによる選択の意図が反映されており、単語選択の利便性が高められる。タッチ座標の距離の判定方法として、例えば、分割単語の中心座標とタッチ座標の距離を算出した数値を分割単語と共に分割単語リストテーブルに登録し、追加時は距離の数値が小さい順になるように追加される。このとき、分割単語リストの生成時に予め前記選択文字列領域全体の文字列(表2の番号2)およびその中心座標を座標と共に追加しておいてもよい。以下の表2は、分割単語情報が追加された分割単語リストテーブルの一例を示している。
Figure 2019068324
ステップ1011では、プレビュー表示部426により、未処理の分割単語があるか判定される。未処理の分割単語がある場合には、ステップ1008に戻り、ステップ1008〜1010の処理が行われる。他方、未処理の分割単語が無い場合は、ステップ1012に進む。
ステップ1012では、プレビュー表示部426により、分割単語リストがプレビュー画面に表示される。分割単語リストとして、例えば、文字列が複数の単語で構成される場合に複数の単語のそれぞれを表示し、複数の単語のうちの1つをユーザに識別可能な態様で表示する表を用いることが可能である。図11は、文字列領域「見積もり番号:R−1234」の分割単語リストが表示された状態を示す図である。文字列領域「見積もり番号:R−1234」の分割単語リストとして、「R−1234」,「見積もり番号:R−1234」,「見積もり番号:R−1234」の分割単語ボタン1101のそれぞれがユーザに識別可能な態様でプレビュー領域710に表示される。
ステップ1013では、プレビュー表示部426により、タッチパネル上に表示されたプレビュー画面700へのユーザによるタッチ操作の有無が監視される。タッチ操作が検出されるとステップ1014へ進む。続くステップ1014では、プレビュー表示部426によりタッチ操作がなされたタッチパネル上の位置座標(x,y)が取得される。
ステップ1014では、プレビュー表示部426により、タッチ操作された位置座標が、分割単語リストに表示されたいずれかの分割単語ボタン1101と重なるかどうかが判定される。例えば、タッチ操作された位置座標が、一つの分割単語ボタン1101の内側(矩形の四隅を表す位置座標で特定される矩形の内側)に含まれるかどうかで判定される。タッチ操作された位置座標が一つの分割単語ボタン1101と重なっている場合は、ステップ1016へ進む。一方、重なっていない場合は、ステップ1013に戻る。
ステップ1016では、プレビュー表示部426により、選タッチ操作された位置座標と重なり当該タッチ操作によって選択された一つの分割単語ボタンに表示されている単語文字列が取得される。そして、ステップ1017では、ファイル名入力欄701に現在表示中のファイル名が取得される。続くステップ1018では、取得したファイル名の中身が“空”であるか判定する。ここで、ファイル名が“空”とは、ファイル名入力欄701内に何らの文字列も表示されていない空欄状態を意味する。取得したファイル名が“空”であった場合は、ステップ1020に進む。一方、“空”でなかった場合は、ステップ1019に進む。
ステップ1019では、ステップ1016で取得したファイル名の末尾に、所定の区切り文字を追加する処理がなされる。所定の区切り文字として、ここでは、アンダーバーを例に説明するが、これに限定されるものではない。例えばハイフンなどアンダーバー以外の記号・文字でも構わないし、さらにはスペースのような実体を伴わないものでも構わない。
ステップ1020では、ステップ1016で取得した文字列(選択文字列領域から抽出した文字列)が、ファイル名の構成要素として設定される。この際、既に設定された文字列が存在している場合は、その末尾に追加される。そして、ステップ1021では、現時点で設定されている文字列が、ファイル名入力欄701に表示(自動入力)される。
以上が、ファイル名生成処理の内容である。このような処理によって、ユーザに選択された複数の文字列の間に区切り文字が挿入されて、スキャン画像のファイル名が生成される。ユーザにより選択された文字列領域から抽出された文字列と、該文字列を所定の分割条件で分割された分割単語とがユーザに識別可能な態様でUI画面に表示される。そのため、スキャン画像に対してOCR処理を行って得られた文字列を用いてファイル名を設定する場面において、タッチ操作によってユーザが意図した文字列をファイル名の一部として入力でき、ユーザの利便性が高められる。
本実施形態では、スキャン画像内の文字列領域の文字認識結果を用いてファイル名を設定する場面を例に説明したが、本発明の適用範囲はファイル名を設定する場面に限定されるものではない。例えば、スキャン画像データの格納先であるフォルダ名設定や、スキャン画像のアップロード先といったデータの転送先設定や、FAX送信やメール送信の宛先設定に適用してもよい。この場合、例えば、前述の図9のアップロード設定画面900において、スキャン画像内の文字列領域の文字認識結果をフォルダパスの候補として選択可能に表示し、ユーザ選択に応じてパス名を設定できるようにする。また、不図示の宛先設定画面において、スキャン画像内の文字列領域の文字認識結果をFAX番号やメールアドレスの候補として選択可能に表示し、ユーザ選択に応じてFAX番号やメールアドレスを設定できるようにする。このように、ファイル名設定以外の場面、例えばデータの転送先等の設定など、スキャン画像に関連する様々な情報(付帯情報)の設定を行う場面において、本発明は幅広く適用可能である。
[第2の実施形態]
次に、文字列領域から抽出された文字列をファイル名入力欄に表示(入力)すると共に、該文字列領域から抽出された文字列の分割単語を分割単語リスト(選択リスト)にユーザに識別可能に表示する態様を第2の実施形態として説明する。なお、MFP110におけるスキャン動作の制御の流れなど第1の実施形態と共通する内容については説明を省略することとし、以下では本実施形態の特徴である文字列領域の表示処理を中心に説明するものとする。
本実施形態のプレビュー表示部426は、選択された文字列領域から抽出された文字列および該文字列の分割単語のうちの1つをファイル名入力欄に表示(入力)し、残りを分割単語リスト(選択リスト)にユーザに識別可能な態様で表示する機能も有する。プレビュー表示部426は、分割単語リストをファイル名入力欄付近に表示する機能も有する。プレビュー表示部426は、分割単語リストと対応し、ファイル名入力欄に表示された文字列の近傍に分割単語リストを表示することも可能である。
プレビュー表示部426は、タッチ操作に応じて、分割単語リストに表示された文字列と、分割単語リストに対応し、ファイル名入力欄に表示された文字列とを入れ替える機能も有する。
図12は、文字列領域から抽出された文字列の分割単語の1つをファイル名入力欄に表示・設定する手順の説明図である。図12では、文字列領域である「見積もり番号:R−1234]を選択し、分割単語リストの「R−1234」を選択した場合を示している。文字列領域である「見積もり番号:R−1234」にてユーザによるタッチ操作が検出されると、所定の区切り文字であるアンダーバーおよび「見積もり番号:R−1234」がファイル名入力欄1201内のファイル名の末尾に追加して表示(入力)される。同時に、ファイル名入力欄1201の下部に隣接して分割単語リスト1202が表示される。分割単語リスト1202には、一行目に「R−1234」の分割単語ボタンが表示され、二行目に「見積もり番号」の分割単語ボタンが表示される。
続いて、分割単語リスト1202の一行目の「R−1234」の分割単語ボタン1203にてユーザによるタッチ操作が検出されると、ファイル名入力欄1201の「見積もり番号:R−1234」と分割単語リストの「R−1234」とが入れ替わる。これにより、ファイル名入力欄1204には、「2017年04月14日」にアンダーバーおよび「R−1234」が追加して表示される。分割単語リスト1205には、一行目に「見積もり番号:R−1234」が表示される。
以上が、選択された文字列領域の文字列の一部をファイル名入力欄に表示する場合のフローである。
選択された文字列領域の文字列がファイル名入力欄に表示されることから、1回のタッチ操作でファイル名の入力操作を行うことができ、ユーザの利便性が高められる。また、選択された文字列領域の分割単語リストがファイル名入力欄付近にユーザに識別可能な態様で表示されることから、分割単語リストにて分割単語が容易に選択される。
選択された文字列領域に対応した分割単語リストの分割単語とファイル名入力欄に表示された文字列とがタッチ操作に応じて入れ替わることから、ファイル名入力欄にて文字の削除を行う必要が無く、ユーザの利便性が高められる。
また、プレビュー画像1200の文字列領域にてユーザによるタッチ操作が検出されたときにファイル名入力欄に設定される文字列を、第1の実施形態のようにユーザによるタッチ操作が検出された座標に近い分割単語とすることも可能である。
[第3の実施形態]
次に、文字列領域と、文字列領域の分割単語領域とをユーザに識別可能に表示する態様を第3の実施形態として説明する。なお、MFP110におけるスキャン動作の制御の流れなど第1の実施形態と共通する内容については説明を省略することとし、以下では本実施形態の特徴である文字列領域の表示処理を中心に説明するものとする。
本実施形態については、前述の第1の実施形態からの差分のみの説明とし、特に明記しない部分については第1の実施形態と同じ構成/手順となる。
本実施形態のプレビュー表示部426は、文字列領域と、文字列領域を予め分割した分割単語領域とをユーザに識別可能な態様で表示する機能も有する。
図13は、文字列領域と、文字列領域の文字列を予め分割した分割単語領域とをプレビュー画面に表示した状態を示す図である。この例では、「見積書」、「東京株式会社」、「2017年04月14日」に対応する文字列領域が順次選択されたことで、「見積書_東京株式会社_2017年04月14日」の文字列がファイル名入力欄に入力された状態となっている。「見積もり番号:R−1234」に対応する文字列領域1301が表示されている。文字列領域1301から抽出した文字列を分割して取得した各単語の座標情報をもとに、「見積もり番号」,「R−1234]のそれぞれに対応する分割単語領域1302,1303がユーザに識別可能な態様で文字列領域1301の上に表示されている。
図14は、プレビュー表示部426による文字列領域及び分割単語領域の表示処理を示すフローチャートである。
ステップ1401では、プレビュー表示部426により、画像解析部425で得られた複数の文字列領域の中から1つの文字列領域が決定される。
ステップ1402では、プレビュー表示部426により、ステップ1401で決定された文字列領域に関し、ステップ505の画像処理によって特定された文字列領域の情報および文字列領域の座標がアプリケーション転送部424を介して取得される。
ステップ1403では、プレビュー表示部426により、文字列領域1301がプレビュー画面1300に表示される。
ステップ1404〜1407では、上述したステップ1006〜1009と同じ処理が行われており、詳細な説明は割愛する。
ステップ1408では、プレビュー表示部426により、ステップ1407で座標を取得した分割単語領域1302,1303がプレビュー画面1300に表示される。
ステップ1409では、プレビュー表示部426により、未処理の分割単語があるか判定される。未処理の分割単語がある場合には、ステップ1406に戻り、ステップ1406〜1409の処理が行われる。他方、未処理の分割単語が無い場合は、ステップ1410に進む。
ステップ1410では、プレビュー表示部426により、未処理の文字列領域があるか判定される。未処理の文字列領域がある場合には、ステップ1401に戻り、ステップ1401〜1410の処理が行われる。他方、未処理の文字列領域が無い場合は、本処理を終える。
図15は、本実施形態に係るプレビュー表示部426によるファイル名生成処理を示すフローチャートである。
ステップ1501〜1504では、上述したステップ1001〜1004と同じ処理が行われており、詳細な説明は割愛する。
ステップ1505では、プレビュー表示部426により、タッチ操作された位置座標が分割単語領域1302,1303と重なるかが判定される。重なるか否かの判定は、タッチされた座標がプレビュー表示領域810に表示されている分割単語領域1302,1303の座標領域の内側(矩形の四隅を表す位置座標で特定される矩形の内側)に含まれるかどうかで判定される。タッチ操作された位置座標が、分割単語領域と重なっている場合は、ステップ1506に進み、分割単語領域の文字列が取得される。一方、重なっていない場合は、ステップ1507に進み、文字列領域の文字列が取得される。
ステップ1508〜1512では、上述したステップ1017〜1021と同じ処理が行われて、ステップ1506で取得された分割単語またはステップ1507で取得された文字列領域の文字列がファイル名入力欄に追加して表示される。
文字列領域の文字列と該文字列の分割単語とがユーザによるタッチ操作を行う前にユーザに識別可能な態様でプレビュー画面上に表示されることから、1回のタッチ操作によりファイル名の一部に設定することができる。これにより、2回以上のタッチ操作によりファイル名の一部に設定する場合と比べて、ユーザの利便性が高められる。
[変形例]
以下に本実施形態の変形例について説明する。
ファイル名入力欄に表示されたファイル名の先頭に、該ファイル名側から区切り文字およびタッチ操作で選択された文字列を記載順に追加してファイル名を生成することも可能である。
[その他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
110 MFP
120 ファイルサーバ
210 制御部
211 CPU
212 ROM
213 RAM
214 HDD
410 ネイティブ機能モジュール
411 スキャン実行部
420 アディショナル機能モジュール
426 プレビュー表示部

Claims (17)

  1. 文書をスキャンして得られたスキャン画像に対して所定の処理を行う装置であって、
    前記スキャン画像内の一続きの文字列と推認される単位領域をユーザが選択可能に表示した、前記所定の処理を行うためのUI画面を表示する表示制御手段と、
    前記UI画面を介してユーザが選択した単位領域に対しOCR処理を行って文字列を抽出するOCR処理手段と、
    前記OCR処理手段により抽出された前記文字列を用いて前記所定の処理のための付帯情報を設定する設定手段と、
    を備え、
    前記表示制御手段は、ユーザにより選択された前記単位領域から前記OCR処理手段によって抽出された前記文字列のうち所定の分割条件を満たす文字列を分割して前記UI画面にユーザにより選択可能に表示する
    ことを特徴とする装置。
  2. 前記表示制御手段は、前記所定の分割条件を満たす前記文字列が分割された分割単語を含むリストを表示することを特徴とする請求項1に記載の装置。
  3. 前記表示制御手段は、ユーザにより選択された前記単位領域の文字列を前記リストに含めて表示することを特徴とする請求項2に記載の装置。
  4. 前記表示制御手段は、前記リストを、ユーザにより選択された前記単位領域に隣接して表示することを特徴とする請求項2または3に記載の装置。
  5. 前記表示制御手段は、前記リストに含まれる前記分割単語を所定の表示条件に従い表示することを特徴とする請求項2から4の何れか一項に記載の装置。
  6. 前記表示制御手段は、ユーザによる選択位置との距離が近い順に前記分割単語を前記リストに表示することを特徴とする請求項5に記載の装置。
  7. 前記表示制御手段は、前記付帯情報を設定する箇所に、前記所定の分割条件を満たす前記文字列が分割された分割単語および前記単位領域の文字列のうちの1つを表示することを特徴とする請求項1から6の何れか一項に記載の装置。
  8. 前記表示制御手段は、前記所定の分割条件を満たす前記文字列が分割された分割単語を前記単位領域に重ねて表示することを特徴とする請求項1に記載の装置。
  9. 前記設定手段は、前記表示制御手段により前記所定の分割条件を満たす前記文字列が分割された分割単語を用いて前記付帯情報を設定する
    ことを特徴とする請求項1から8の何れか一項に記載の装置。
  10. 前記表示制御手段は、前記スキャン画像と共に、前記所定の分割条件を満たす前記文字列が分割された分割単語および前記単位領域を前記UI画面に表示することを特徴とする請求項1から9の何れか一項に記載の装置。
  11. 前記所定の処理は、前記スキャン画像のデータを保存する処理であり、
    前記付帯情報は、前記スキャン画像を保存する際のファイル名であることを特徴とする請求項1から10の何れか一項に記載の装置。
  12. 前記所定の処理は、前記スキャン画像のデータを保存する処理であり、
    前記付帯情報は、前記スキャン画像を保存する際のフォルダ名であることを特徴とする請求項1から10の何れか一項に記載の装置。
  13. 前記所定の処理は、前記スキャン画像のデータを所定の場所にアップロードする処理であり、
    前記付帯情報は、アップロード先を示すパス名であることを特徴とする請求項1から10の何れか一項に記載の装置。
  14. 前記所定の処理は、前記スキャン画像のデータをFAX送信する処理であり、
    前記付帯情報は、FAX番号であることを特徴とする請求項1から10の何れか一項に記載の装置。
  15. 前記所定の処理は、前記スキャン画像のデータをメール送信する処理であり、
    前記付帯情報は、メールアドレスであることを特徴とする請求項1から10の何れか一項に記載の装置。
  16. 文書をスキャンして得られたスキャン画像に対して所定の処理を行う装置の制御方法であって、
    表示制御手段が、前記スキャン画像内の一続きの文字列と推認される単位領域をユーザが選択可能に表示した、前記所定の処理を行うためのUI画面を表示するステップと、
    OCR処理手段が、前記UI画面を介してユーザが選択した単位領域に対しOCR処理を行って文字列を抽出するステップと、
    設定手段が、前記OCR処理手段により抽出された文字列を用いて前記所定の処理のための付帯情報を設定するステップと、
    を含み、
    前記表示するステップでは、ユーザにより選択された前記単位領域から前記OCR処理手段によって抽出された前記文字列のうち所定の分割条件を満たす文字列を分割して前記UI画面にユーザにより選択可能に表示する
    ことを特徴とする制御方法。
  17. コンピュータを、請求項1から15の何れか一項に記載の装置として機能させる
    ためのプログラム。
JP2017193616A 2017-10-03 2017-10-03 スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム Active JP6968647B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017193616A JP6968647B2 (ja) 2017-10-03 2017-10-03 スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム
US16/139,996 US11386046B2 (en) 2017-10-03 2018-09-24 Apparatus for setting file name for scan image, method of controlling same, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017193616A JP6968647B2 (ja) 2017-10-03 2017-10-03 スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2019068324A true JP2019068324A (ja) 2019-04-25
JP2019068324A5 JP2019068324A5 (ja) 2020-11-19
JP6968647B2 JP6968647B2 (ja) 2021-11-17

Family

ID=65897779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017193616A Active JP6968647B2 (ja) 2017-10-03 2017-10-03 スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム

Country Status (2)

Country Link
US (1) US11386046B2 (ja)
JP (1) JP6968647B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6968647B2 (ja) * 2017-10-03 2021-11-17 キヤノン株式会社 スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム
JP6983675B2 (ja) * 2018-01-23 2021-12-17 キヤノン株式会社 スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム
JP7034730B2 (ja) * 2018-01-23 2022-03-14 キヤノン株式会社 スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP2020098980A (ja) * 2018-12-17 2020-06-25 セイコーエプソン株式会社 画像読取装置、画像読取方法および画像読取システム
JP7225017B2 (ja) * 2019-04-19 2023-02-20 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7317561B2 (ja) * 2019-04-19 2023-07-31 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7391672B2 (ja) * 2020-01-21 2023-12-05 キヤノン株式会社 文書を電子化するための画像処理システム、その制御方法及びプログラム
JP7400548B2 (ja) * 2020-03-03 2023-12-19 富士フイルムビジネスイノベーション株式会社 情報処理装置、画像処理装置、情報処理システム、及びプログラム
JP2022019446A (ja) * 2020-07-17 2022-01-27 キヤノン株式会社 画像処理システム、装置、方法、プログラム
GB2604092A (en) * 2021-01-27 2022-08-31 Canon Europa Nv Method and apparatus for determining a folder path for a scanned image file
JP2022191775A (ja) * 2021-06-16 2022-12-28 キヤノン株式会社 情報処理装置とその制御方法、及びプログラム
JP2023053602A (ja) 2021-10-01 2023-04-13 キヤノン株式会社 装置、情報処理方法、及びプログラム
JP2023160049A (ja) * 2022-04-21 2023-11-02 キヤノン株式会社 情報処理装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH117517A (ja) * 1997-06-16 1999-01-12 Toshiba Corp 画像処理装置、画像領域設定方法、及び画像領域設定を行なうためのプログラムを記録した記録媒体
JP2005275849A (ja) * 2004-03-25 2005-10-06 Canon Inc 文書処理装置および文書処理方法
JP2013074609A (ja) * 2011-09-29 2013-04-22 Konica Minolta Business Technologies Inc ファイル名作成装置およびファイル名作成プログラム
US20150302277A1 (en) * 2014-04-21 2015-10-22 Ricoh Company, Ltd. Image processing apparatus, image processing system, and image processing method
JP2017129926A (ja) * 2016-01-18 2017-07-27 キヤノン株式会社 情報処理装置、制御方法、及びプログラム

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002358514A (ja) * 2000-12-14 2002-12-13 Ricoh Co Ltd 画像歪み補正装置、プログラム、記憶媒体、画像歪み補正方法、画像読取装置および画像形成装置
JP4141235B2 (ja) * 2002-02-08 2008-08-27 株式会社リコー 画像補正装置及びプログラム
JP4371965B2 (ja) * 2004-09-14 2009-11-25 キヤノン株式会社 画像処理装置、画像処理方法
US8335381B2 (en) * 2008-09-18 2012-12-18 Xerox Corporation Handwritten word spotter using synthesized typed queries
US8737728B2 (en) * 2011-09-30 2014-05-27 Ebay Inc. Complementary item recommendations using image feature data
JP2014021650A (ja) 2012-07-17 2014-02-03 Canon Inc 表示制御装置
JP5991139B2 (ja) * 2012-10-26 2016-09-14 ブラザー工業株式会社 情報管理装置及びプログラム
US20160012465A1 (en) * 2014-02-08 2016-01-14 Jeffrey A. Sharp System and method for distributing, receiving, and using funds or credits and apparatus thereof
JP6119689B2 (ja) * 2014-07-11 2017-04-26 コニカミノルタ株式会社 電子文書生成システム、電子文書生成装置およびプログラム
JP2016024488A (ja) 2014-07-16 2016-02-08 キヤノン株式会社 画像処理装置および画像処理装置の制御方法
US9361531B2 (en) * 2014-07-21 2016-06-07 Optum, Inc. Targeted optical character recognition (OCR) for medical terminology
US10007690B2 (en) * 2014-09-26 2018-06-26 International Business Machines Corporation Data ingestion stager for time series database
US10061824B2 (en) * 2015-01-30 2018-08-28 Splunk Inc. Cell-based table manipulation of event data
US11615073B2 (en) * 2015-01-30 2023-03-28 Splunk Inc. Supplementing events displayed in a table format
US11544248B2 (en) * 2015-01-30 2023-01-03 Splunk Inc. Selective query loading across query interfaces
JP2016212563A (ja) 2015-05-01 2016-12-15 キヤノン株式会社 文書解析システムおよび文書解析方法
US20160328432A1 (en) * 2015-05-06 2016-11-10 Squigglee LLC System and method for management of time series data sets
US10606824B1 (en) * 2015-09-09 2020-03-31 A9.Com, Inc. Update service in a distributed environment
US10331657B1 (en) * 2015-09-28 2019-06-25 Amazon Technologies, Inc. Contention analysis for journal-based databases
US20170186066A1 (en) * 2015-12-29 2017-06-29 Susan Kaplan BRUCH System and Method of Searching Style and Fashion
US11200246B2 (en) * 2016-09-26 2021-12-14 Splunk Inc. Hash bucketing of data
US10217020B1 (en) * 2016-12-19 2019-02-26 Matrox Electronic Systems Ltd. Method and system for identifying multiple strings in an image based upon positions of model strings relative to one another
US10296788B1 (en) * 2016-12-19 2019-05-21 Matrox Electronic Systems Ltd. Method and system for processing candidate strings detected in an image to identify a match of a model string in the image
JP7030462B2 (ja) * 2017-09-21 2022-03-07 キヤノン株式会社 スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム
JP6968647B2 (ja) * 2017-10-03 2021-11-17 キヤノン株式会社 スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH117517A (ja) * 1997-06-16 1999-01-12 Toshiba Corp 画像処理装置、画像領域設定方法、及び画像領域設定を行なうためのプログラムを記録した記録媒体
JP2005275849A (ja) * 2004-03-25 2005-10-06 Canon Inc 文書処理装置および文書処理方法
JP2013074609A (ja) * 2011-09-29 2013-04-22 Konica Minolta Business Technologies Inc ファイル名作成装置およびファイル名作成プログラム
US20130268528A1 (en) * 2011-09-29 2013-10-10 Takuya KAWANO File name producing apparatus that produces file name of image
US20150302277A1 (en) * 2014-04-21 2015-10-22 Ricoh Company, Ltd. Image processing apparatus, image processing system, and image processing method
JP2015215878A (ja) * 2014-04-21 2015-12-03 株式会社リコー 画像処理装置及び画像処理システム
JP2017129926A (ja) * 2016-01-18 2017-07-27 キヤノン株式会社 情報処理装置、制御方法、及びプログラム

Also Published As

Publication number Publication date
US11386046B2 (en) 2022-07-12
JP6968647B2 (ja) 2021-11-17
US20190102385A1 (en) 2019-04-04

Similar Documents

Publication Publication Date Title
JP6968647B2 (ja) スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム
JP6891073B2 (ja) スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP6953230B2 (ja) スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP6983675B2 (ja) スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム
JP7034730B2 (ja) スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP7062388B2 (ja) スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
US11144189B2 (en) Determination and relocation of movement targets based on a drag-and-drop operation of a thumbnail across document areas
JP4983610B2 (ja) 画像処理装置
JP2019057174A (ja) スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム
JP2020177521A (ja) タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP2020178286A (ja) ユーザ操作のためのガイダンスを表示する画像処理装置、その制御方法及びプログラム
JP2020184276A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2020178283A (ja) タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7077127B2 (ja) スキャン画像データに関連する情報を設定するための装置、方法、及びプログラム
JP2019068323A (ja) スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム
JP6983687B2 (ja) スキャン画像データに関連する情報を設定するための装置、方法、及びプログラム
JP2021164132A (ja) 画像処理システム、及びプログラム
JP7150967B2 (ja) スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP2021026604A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2021114709A (ja) 画像形成装置、画像形成方法及びプログラム
JP2024040612A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
JP2019114024A (ja) スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP2020178284A (ja) スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム
JP2020177523A (ja) スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム
JP2020178282A (ja) スキャン画像のプレビュー表示を行なう画像処理装置、その制御方法及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201005

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201005

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210928

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211027

R151 Written notification of patent or utility model registration

Ref document number: 6968647

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151