JP6891073B2 - スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム - Google Patents

スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム Download PDF

Info

Publication number
JP6891073B2
JP6891073B2 JP2017159540A JP2017159540A JP6891073B2 JP 6891073 B2 JP6891073 B2 JP 6891073B2 JP 2017159540 A JP2017159540 A JP 2017159540A JP 2017159540 A JP2017159540 A JP 2017159540A JP 6891073 B2 JP6891073 B2 JP 6891073B2
Authority
JP
Japan
Prior art keywords
character
character string
area
scanned image
character area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017159540A
Other languages
English (en)
Other versions
JP2019041150A (ja
JP2019041150A5 (ja
Inventor
大次郎 宮本
大次郎 宮本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017159540A priority Critical patent/JP6891073B2/ja
Priority to US16/100,943 priority patent/US10860785B2/en
Priority to KR1020180094148A priority patent/KR102408019B1/ko
Priority to CN201810960344.5A priority patent/CN109426821B/zh
Publication of JP2019041150A publication Critical patent/JP2019041150A/ja
Publication of JP2019041150A5 publication Critical patent/JP2019041150A5/ja
Application granted granted Critical
Publication of JP6891073B2 publication Critical patent/JP6891073B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • G06F16/166File name conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1456Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00209Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • H04N1/00461Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet marking or otherwise tagging one or more displayed image, e.g. for selective reproduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Description

本発明は、スキャン画像の文字認識結果を用いて、当該スキャン画像に対してファイル名等を設定する技術に関する。
従来より、文書の管理手法として、紙文書をスキャンして電子化する手法が広く行われている。そして、文書の電子化に際して、スキャンされた画像データに対して文字認識処理(OCR処理)を行い、認識された文字を電子化した文書ファイルのファイル名に使用する技術がある。例えば、特許文献1には、スキャンした画像データに対してOCR処理を行う複数の領域を予め設定しておき、さらに予め設定したファイル名の書式を示すルールと各領域の文字認識結果とに従って、ファイル名を設定する技術が開示されている。また、該ファイル名の書式を示すルールには、複数の領域それぞれの文字認識結果の間に、ハイフン等の特殊記号(区切り文字)が付加されるように設定できることも開示されている。
特開2008−176624号公報
しかしながら、特許文献1の方法では、OCR処理の対象領域とファイル名の書式を示すルールとを、文書の種類ごとに設定する必要がある。したがって、種類の異なる様々な文書に対して適切にファイル名を付けるためには、文書の種類に応じて事前にルール設定をする必要があり、その作業に多くの手間がかかってしまう。また、特許文献1の方法では、各領域の文字認識結果の間に挿入される区切り文字は、予め設定したルールに従うため、ファイル名を付与する際に区切り文字を挿入するかどうかを実際のスキャン画像に応じて適応的に変えることができない。図を用いて具体例を示す。図1は、見積書のスキャン画像に対してファイル名を設定する様子を示している。いま、1つのまとまりのある文字列の領域(文字列領域)毎にOCR処理を行い、文字列領域同士の間には区切り文字として「_(アンダーバー)」を挿入するというルールが設定されていたとする。図1に示す例では、「見積書」の各文字(1つ1つの漢字)の間にスペースが存在していることから、本来であれば分離されたくない位置で各文字列領域に分離され、「見_積_書」のようにファイル名が設定されている。このようなケースでは、文字認識結果の間に区切り文字が挿入されないようにしたいが、特許文献1の技術では対応することができない。
本発明は、上述した課題に対応するべく、スキャン画像の文字認識結果を用いて、ユーザが簡単な操作で、当該スキャン画像に対しファイル名等を設定できるようにすることを目的とする。
本発明に係る装置は、文書をスキャンして得られたスキャン画像に対して所定の処理を行う装置であって、前記スキャン画像内の一続きの文字列と推認される単位領域をユーザが選択可能に表示した、前記所定の処理を行うための、UI画面を表示する表示制御手段と、前記UI画面を介してユーザが選択した単位領域に対してOCR処理を行ない、該OCR処理によって抽出された文字列を用いて前記所定の処理のための付帯情報を設定する設定手段と、を備え、前記設定手段は、前記付帯情報を設定する際に、ユーザが選択した単位領域とその周辺にある他の単位領域との位置関係に応じて、前記抽出された文字列の間に区切り文字を挿入する、ことを特徴とする。
本発明によれば、スキャン画像の文字認識結果を用いて、当該スキャン画像についてのファイル名等をユーザは簡単な操作で設定することができる。
従来の問題点を説明する図 画像処理システムの全体構成を示す図 (a)はMFPのハードウェア構成図、(b)はファイルサーバのハードウェア構成図 MFPのソフトウェア構成図 スキャン画像の生成からアップロードまでの動作制御の流れを示すフローチャート スキャン設定画面の一例を示す図 プレビュー画面の一例を示す図 プレビュー画面でファイル名が生成された状態を示す図 アップロード画面の一例を示す図 実施例1に係る、ファイル名生成処理の詳細を示すフローチャート 実施例2に係る、ファイル名生成処理の詳細を示すフローチャート 連続している文字列領域の文字列を自動選択する処理の詳細を示すフローチャート
以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。
<画像処理システムの構成>
図2は、本実施例に係る画像処理システムの全体構成を示す図である。画像処理システムは、MFP110とファイルサーバ120とで構成され、LAN(Local Area Network)を介して互いに通信可能に接続されている。
MFP(Multi Function Printer)110は、スキャナやプリンタといった複数の機能を有する複合機であり、画像処理装置の一例である。ファイルサーバ120は、電子化された文書ファイルを保存・管理する外部サーバの一例である。本実施例の画像処理システムは、MFP110とファイルサーバ120とからなる構成としているがこれに限定されない。例えば、MFP110がファイルサーバ120の役割を兼ね備えてもよい。また、LANに代えてインターネットなどを介した接続形態であってもよい。また、MFP110は、PSTN(Public Switched Telephone Networks)に接続され、ファクシミリ装置(不図示)との間で画像データをファクシミリ通信することができる。
図3(a)は、MFP110のハードウェア構成図である。MFP110は、制御部210、操作部220、プリンタ部221、スキャナ部222、モデム223で構成される。制御部210は、以下の各部211〜219で構成され、MFP110全体の動作を制御する。CPU211は、ROM212に記憶された制御プログラムを読み出して、読取/印刷/通信などMFP110が有する各種機能を実行・制御する。RAM213は、CPU211の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施例では1つのCPU211が1つのメモリ(RAM213またはHDD214)を用いて後述のフローチャートに示す各処理を実行するものとするが、これに限定されない。例えば、複数のCPUや複数のRAMまたはHDDを協働させて各処理を実行してもよい。HDD214は、画像データや各種プログラムを記憶する大容量記憶部である。操作部I/F215は、操作部220と制御部210とを接続するインタフェースである。操作部220には、タッチパネルやキーボードなどが備えられており、ユーザによる操作/入力/指示を受け付ける。プリンタI/F216は、プリンタ部221と制御部210とを接続するインタフェースである。印刷用の画像データはプリンタI/F216を介して制御部210からプリンタ部221へ転送され、記録媒体上に印刷される。スキャナI/F217は、スキャナ部222と制御部210とを接続するインタフェースである。スキャナ部222は、不図示の原稿台やADF(Auto Document Feeder)にセットされた原稿を読み取って画像データを生成し、スキャナI/F217を介して制御部210に入力する。MFP110は、スキャナ部222で生成された画像データをプリンタ部221から印刷出力(コピー)する他、ファイル送信またはメール送信することができる。モデムI/F218は、モデム223と制御部210とを接続するインタフェースである。モデム223は、PSTN上のファクシミリ装置との間で画像データをファクシミリ通信する。ネットワークI/F219は、制御部210(MFP110)をLANに接続するインタフェースである。MFP110は、ネットワークI/F219を用いてLAN上の外部装置(ファイルサーバ120など)に画像データや情報を送信したり、各種情報を受信したりする。
図3(b)は、ファイルサーバ120のハードウェア構成図である。ファイルサーバ120は、CPU311、ROM312、RAM313、HDD314及びネットワークI/F315で構成される。CPU311は、ROM312に記憶された制御プログラムを読み出して各種処理を実行することで、ファイルサーバ120全体の動作を制御する。RAM313は、CPU311の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD314は、画像データや各種プログラムを記憶する大容量記憶部である。ネットワークI/F315は、ファイルサーバ120をLANに接続するインタフェースである。ファイルサーバ120は、ネットワークI/F315を用いてLAN上の他の装置(MFP110など)との間で各種情報を送受信する。
<MFPのソフトウェア構成>
図4は、MFP110のソフトウェア構成図である。MFP110のソフトウェアは、ネイティブ機能モジュール410とアディショナル機能モジュール420の大きく2つに分けられる。ネイティブ機能モジュール410に含まれる各部は、MFP110に標準的に備えられた機能モジュールである。これに対し、アディショナル機能モジュール420に含まれる各部は、MFP110に追加的に備わる機能モジュールであり、例えばアプリケーションのインストールによって実現される機能モジュールである。本実施例におけるアディショナル機能モジュール420は、Java(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しない他のアプリケーションがインストールされていても良い。以下、両機能モジュール410及ぶ420を構成する各部について説明する。
アプリケーション表示部423は、操作部220のタッチパネルに、ユーザによる各種操作を受け付けるためのUI画面を表示する表示制御を行う。表示するUI画面の詳細については後述する。スキャン指示部421は、UI画面を介して入力されたユーザ指示に従い、スキャン設定や転送設定の情報を含んだスキャン要求をスキャン実行部411に送信して、スキャン処理を実行させる。このスキャン要求には、後述するアプリケーション受信部422が受信する画像データが、当該スキャン要求に対応したものかどうかを識別するための要求IDも含まれる。
スキャン実行部411は、スキャン指示部421からのスキャン要求を受けて、スキャナI/F217を介してスキャナ部222を制御しスキャン処理を実行する。これにより、原稿が読み取られて画像データが生成される。スキャンによって生成された画像データ(以下、「スキャン画像データ」と呼ぶ。)はその転送先を特定する転送設定の情報と共に転送部412に渡される。転送部412は、スキャン実行部411から受け取ったスキャン画像データを、転送設定に従って転送する。スキャン画像データの転送先としては、ファイルサーバ120や、LAN上のPC(不図示)等を設定可能である。ただし、本実施例では、スキャン実行部411で生成されたスキャン画像データは、一旦全て、アディショナル機能モジュール420に転送するように設定されているものとする。転送部412は、FTP(File Transfer Protocol)クライアント機能を有しており、FTPサーバ機能を有するアプリケーション受信部422に対してFTPでスキャン画像データを転送する。
アプリケーション受信部422は、転送部412から内部転送されたスキャン画像データを受信し、アプリケーション転送部424に渡す。アプリケーション転送部424は、受信したスキャン画像データを画像解析部425に渡す。画像解析部425は、受け取ったスキャン画像データに対して文字列領域の特定や文字認識といった画像解析処理を行なう。そして、スキャン画像データとその解析結果は、アプリケーション転送部424を介してプレビュー表示部426に渡される。プレビュー表示部426は、スキャン画像データとその解析結果に基づき、ユーザがファイル名設定を行うためのUI画面を生成し、操作部220の液晶パネルに表示するといった表示制御を行う。
アップロード指示部427は、ユーザがフォルダパス設定を行うためのUI画面を生成し、操作部220のタッチパネルに表示する。アプリケーション転送部424は、ファイルサーバ120にスキャン画像データを転送(送信)する。アプリケーション転送部424は、転送が終了すると、アプリケーション表示部423に転送が終了したことを通知する。アプリケーション表示部423は、アプリケーション転送部424からの通知を受けて、表示内容を更新する。また、アプリケーション転送部424は、SMB(Server Message Block)クライアント機能を有している。これにより、SMBサーバ機能を有するファイルサーバ120に対して、SMBを用いてファイル操作及びフォルダ操作を行う。なお、使用するプロトコルは、SMBに限定されるものではなく、WebDAV、FTP、SMTP等であってもよい。また、SOAPやRESTといったファイル送信目的以外のプロトコルも使用可能である。
続いて、MFP110において原稿からスキャン画像を生成し、ファイルサーバ120にアップロードする際の動作制御について説明する。図5は、スキャン画像の生成からアップロードまでの制御の流れを示すフローチャートである。この一連の処理は、制御部210において、CPU211がHDD214に記憶された制御プログラムを実行することにより実現される。以下、詳しく説明する。
ステップ501では、アプリケーション表示部423により、スキャン処理のための各種設定を行うためのUI画面(以下、「スキャン設定画面」と呼ぶ。)が、操作部220のタッチパネルに表示される。図6は、スキャン設定画面の一例を示す図である。図6のスキャン設定画面600には、5つの設定ボタン601〜605が存在する。[カラー設定]ボタン601は、原稿をスキャンする際のカラー/モノクロを設定するためのボタンである。[解像度設定]ボタン602は、原稿をスキャンする際の解像度を設定するためのボタンである。[両面読み取り設定]ボタン603は、原稿の両面をスキャンしたい場合に用いる設定ボタンである。[原稿混載設定]ボタン604は、サイズが異なる原稿をまとめてスキャンしたい場合に用いる設定ボタンである。[画像形式設定]ボタン605は、スキャン画像データの保存形式を指定する際に用いる設定ボタンである。これら設定ボタン601〜605を用いた設定時には、MFP110においてサポートされている範囲で設定可能な候補(選択肢)が表示され、ユーザは表示された候補から望むものを選択する。なお、上述の設定ボタンは一例であって、これらすべての設定項目が存在しなくても良いし、これら以外の設定項目が存在してもよい。ユーザは、このようなスキャン設定画面600を介してスキャン処理についての詳細な設定を行なう。[キャンセル]ボタン620は、スキャン設定を中止する場合に用いるボタンである。[スキャン開始]ボタン621は、原稿台等にセットした原稿に対するスキャン処理の開始を指示するためのボタンである。
ステップ502では、アプリケーション表示部423により、ユーザによるボタン操作の内容によって処理の切り分けがなされる。[スキャン開始]ボタン621の押下が検出された場合は、アプリケーション表示部423によって各設定ボタン601〜605で設定された内容とスキャン処理の実行開始の受付が、スキャン指示部421に対して伝えられる。一方、[キャンセル]ボタン620の押下が検出された場合は本処理を終える。
ステップ503では、スキャン指示部421からの指示に応答して、スキャン実行部411によってスキャン処理が実行される。これにより得られたスキャン画像データは、ステップ504において、転送部412を通じてアプリケーション受信部422にFTPで内部転送され、さらにアプリケーション転送部424を介して画像解析部425に送られる。
ステップ505では、画像解析部425において、スキャン画像データの解析処理が実行される。具体的には、まず、スキャン画像データに対し、画像信号の二値化やスキャン時にずれた原稿の傾きの修正、原稿が正立する方向への回転などを行なって、解析処理を行いやすい状態に補正する。そして、補正されたスキャン画像(2値画像)に対してエッジ抽出などを行って、当該画像内の文字列領域、すなわち、一続きの文字列と推認される塊(単位領域)を特定する。以下の表1は、ある見積書のスキャン画像の一部に対して画像解析処理を行った結果の一例を示している。
Figure 0006891073
上記表1において、[番号]は、特定された各文字列領域を一意に示す番号である。この例では1から11までの通し番号が、認識した順番に付けられている。[領域のX座標]は、特定された各文字列領域の左上隅のX座標を示す。[領域のY座標]は、特定された各文字列領域の左上隅のY座標を示す。以後、文字列領域に対して“座標”と言う場合は、特に断らない限り、文字列領域の左上隅の位置座標のことを意味するものとする。[領域の幅]は、特定された各文字列領域の左辺から右辺までの距離を示す。[領域の高さ]は、特定された各文字列領域の上辺から下辺までの距離を示す。本実施例では、[領域のX座標]、[領域のY座標]、[領域の幅]、[領域の高さ]はいずれもピクセルで示すが、ポイントやインチ等で示してもよい。スキャン画像から抽出された各文字列領域の情報(以下、「文字列領域情報」と呼ぶ。)は、画像解析データとしてアプリケーション転送部424に渡される。画像解析データは、例えばCSVやXMLのフォーマットとするが、他のフォーマットであっても構わない。また、HDD214に一旦保存した上で、所定のタイミングで渡してもよい。
ステップ506では、プレビュー表示部426により、ステップ503で読み込まれたスキャン画像が、操作部220のタッチパネルにプレビュー表示される。このプレビュー表示用の画面データは、アプリケーション表示部423によって生成・提供される。ユーザは、スキャン画像がプレビュー表示されたUI画面(以下、「プレビュー画面」と呼ぶ。)を介して、スキャン画像データのファイル名を設定することができる。図7(a)は、プレビュー画面の一例を示す図である。プレビュー画面700において、画面中央にあるプレビュー領域710内に、読み込まれたスキャン画像が表示される。そして、プレビュー領域710内には、スキャン画像と共にその表示状態を変更するための複数のボタン711〜714も表示される。ボタン711及び712はスキャン画像の全体を表示しきれないときに現れるボタンで、表示領域を縦方向にスクロールするためのボタンである。MFP110が備えるタッチパネルは通常それほど大きくはない。そこで、例えば、スキャン画像がA4縦・横書きの原稿を読み取ったものである場合は、スキャン画像の幅方向(短手方向)全体がプレビュー領域710にちょうど収まるように上詰めで縮小表示されるよう初期設定される。つまり、初期設定においては、A4縦のスキャン画像の下部はプレビュー領域710内に表示されないことになる。このようなとき、「↓」ボタン712を押下すると下に表示領域がスクロールし、下部を表示させることができる。さらに、スキャン画像が例えばA4横やA3などの場合には、表示領域を横方向にスクロールするためのボタンをさらに設ければよい。ボタン713及び714は、表示領域を拡大・縮小するためのボタンであり、「+」のボタン713を押下するとズームインし、「−」のボタン714を押下するとズームアウトする。これらボタン操作による動作を、プレビュー画面上でのスワイプやピンチアウト/ピンチインといったユーザの指による操作で実現してもよい。また、プレビュー領域710には、ステップ505の画像解析処理によって特定された文字列領域が、上述の文字列領域情報に基づき、ユーザに識別可能な態様で表示される。図7(b)は、図7(a)のプレビュー画面700において、各文字列領域が囲み枠によって識別可能に表示された状態を示す図であり、各文字列領域は前述の表1に対応している。ユーザが、プレビュー領域710に表示された文字列領域の中から任意の文字列領域を選択(例えば指でタッチ)すると、そこに含まれる文字列がファイル名入力欄701に表示、すなわち自動入力され、ファイル名を構成する文字列の一部となる。[戻る]ボタン720は、プレビュー表示を中止する場合に用いるボタンである。[次へ]ボタン721は、読み込まれたスキャン画像データのアップロード先を設定する画面に移行するためのボタンである。また、ボタン702はファイル名のフォーマット等を設定するためのボタンである。なお、上述した各種ボタンの種類、各文字列領域の表示や選択の態様は一例にすぎず、これに限定されない。例えば、ファイル名入力欄701に表示された文字列を修正・変更したり、ファイル名を確定したりするためのボタンがあってもよい。
ステップ507では、プレビュー表示部426により、読み込まれたスキャン画像に対するファイル名の生成がなされる。図8は、ファイル名生成後のプレビュー画面700の状態を示している。この例では、「見」、「積」、「書」、「東京株式会社」、「2017年04月14日」に対応する文字列領域が順次選択されたことで、「見積書_東京株式会社_2017年04月14日」の文字列が、ファイル名入力欄701に表示・設定されている。また、プレビュー領域710では、ユーザがタッチ操作した文字列領域の囲みが、ファイル名の一部として選択されたことを示すため太枠に変わっている。このファイル名生成処理の詳細については後述する。所望するファイル名が生成されてユーザが[次へ]ボタン721を押下すると、ステップ508へ進む。
ステップ508では、プレビュー表示部426により、ステップ502と同様、ユーザによるボタン操作の内容によって処理の切り分けがなされる。[次へ]ボタン721の押下が検出された場合は、ファイル名入力欄701に表示中のファイル名(ファイル名として設定された文字列)の情報がアップロード指示部427へ送られ、ステップ509へ進む。一方、[戻る]ボタン720の押下が検出された場合は、ステップ501(スキャン設定画面の表示)へ戻る。
ステップ509では、アップロード指示部427により、スキャン画像データの転送先を設定するためのUI画面(以下、「アップロード設定画面」と呼ぶ。)が、操作部220のタッチパネルに表示される。ユーザは、このアップロード設定画面を介して、ファイルサーバ120へのアップロードに関する詳細設定を行う。図9は、アップロード設定画面の一例を示す図である。ユーザは、[フォルダパス]入力欄901に、ファイルサーバ120へ外部転送する際のフォルダパスの名称(パス名)を入力する。図9の例では、“2017_04_04”がパス名として入力されている。入力方法としては、例えばフォルダパス入力欄901へのタップ操作に応じてキーボード画面のサブウインドウ(不図示)を表示し、ユーザに、当該キーボード画面を介してパス名を入力させる方法がある。あるいは、HDD214内に保持するアドレス帳の中から選択して設定できるようにしてもよい。[戻る]ボタン920は、アップロードに関する詳細設定を中止する場合に用いるボタンである。[アップロード]ボタン921は、[フォルダパス]入力欄901で設定したフォルダパスへのアップロードを指示するためのボタンである。
ステップ510では、アップロード指示部427により、ステップ508と同様、ユーザによるボタン操作の内容によって処理の切り分けがなされる。[アップロード]ボタン921の押下が検出された場合は、ステップ511へ進む。その際、フォルダパス入力欄901に入力されたパス名、ステップ507で生成されたファイル名、ファイルサーバ設定の各情報が、アプリケーション転送部424へ渡される。ここで、ファイルサーバ設定は、ファイルサーバ120にスキャン画像データを格納するために必要な情報であり、具体的には、ホスト名、フォルダパスの起点、ログイン用のユーザ名とパスワードといった情報を含む。一方、[戻る]ボタン920の押下が検出された場合は、ステップ506(プレビュー画面の表示)へ戻る。
ステップ511では、アプリケーション転送部424により、スキャン画像データの格納先パスが、アップロード指示部427から受け取った情報に基づき生成される。具体的には、ファイルサーバ設定(ファイルサーバ120のホスト名、フォルダパスの起点)にフォルダパスを加えて生成される。これにより、例えば“\\server01\Share\2017_04_04”といった格納先パスが生成される。そして、ステップ512では、アプリケーション転送部424により、ファイルサーバ120に対するアクセスが実行される。この際、ファイルサーバ設定に含まれるユーザ名とパスワードをファイルサーバ120に送信する。ユーザ名とパスワードを受け取ったファイルサーバ120では、認証処理が実行される。
ステップ513では、アプリケーション転送部424により、ファイルサーバ120での認証結果に従って処理の切り分けがなされる。すなわち、ファイルサーバ120から認証成功の通知を受信した場合は、ステップ514に進む。一方、認証失敗の通知を受信した場合は、本処理を終了する。
ステップ514では、アプリケーション転送部424により、ステップ511で生成された格納先パスが示すフォルダにスキャン画像データが外部転送され、ファイルサーバ120内に格納される。
以上が、本実施例に係るスキャン画像の生成からアップロードまでの動作制御の内容である。なお、本実施例では、ステップ505〜507の処理を、スキャンによって生成された1ページ分の画像データに対して行うことを想定している。例えば、プレビュー画面700内に次のページの画像解析を行うためのボタンを設け、その解析によって得られた次ページのプレビュー表示を行って、次ページ以降の文字列領域からファイル名を構成する文字列を設定できるようにしてもよい。
<ファイル名の生成>
図10は、プレビュー表示部426におけるファイル名生成処理(ステップ507)の詳細を示すフローチャートである。以下、図10のフローに沿って説明する。
ステップ1001では、タッチパネル上に表示されたプレビュー画面700へのユーザによるタッチ操作の有無が監視される。タッチ操作が検出されるとステップ1002へ進む。続くステップ1002では、タッチ操作の内容によって処理の切り分けがなされる。タッチ操作の内容が、[次へ]ボタン721または[戻る]ボタン720の押下であった場合は、本処理を終了する。[次へ]ボタン721または[戻る]ボタン720の押下ではなかった場合は、ステップ1003へ進む。
ステップ1003では、タッチ操作がなされたタッチパネル上の位置座標(x,y)が取得される。続くステップ1004では、タッチ操作された位置座標が、いずれかの文字列領域と重なるかどうかが判定される。例えば、タッチ操作された位置座標が、プレビュー領域710に表示された各文字例領域の内側(文字列領域の四隅を表す位置座標で特定される矩形の内側)に含まれるかどうかで判定する。タッチ操作された位置座標がいずれかの文字列領域と重なっている場合は、ステップ1005へ進む。一方、重なっていない場合は、ステップ1001に戻る。
ステップ1005では、タッチ操作された位置座標と重なっている文字列領域の文字列が取得される。文字列の取得は、タッチ操作によって選択された文字列領域(以下、「選択文字列領域」と呼ぶ。)に対するOCR処理を画像解析部425で実行して、文字列を抽出することで取得される。そして、ステップ1006では、ファイル名入力欄701に現在表示中のファイル名が取得される。続くステップ1007では、取得したファイル名の中身が“空”であるか判定する。ここで、ファイル名が“空”とは、ファイル名表示領域710内に何らの文字列も表示されていない空欄状態を意味する。取得したファイル名が“空”であった場合は、ステップ1010に進む。一方、“空”でなかった場合は、ステップ1008に進む。
ステップ1008では、現在の選択文字列領域と、1つ前の選択文字列領域との位置関係に基づいて、双方の文字列領域が特定の方向に連続しているかどうかが判定される。横書きの一般的な言語(例えば日本語や英語)の場合は左から右へ文字が続くので、右方向に連続しているかどうか(現在の選択文字列領域が1つ前の選択文字列領域の右隣りにあるかどうか)がチェックされる。もちろん、文書のフォーマットや使用する言語によって、縦方向(下方向)や左方向への連続性がチェックされることはいうまでもない。具体的には、以下の2つの条件を用いて、文字列領域同士が特定の方向に連続しているかどうかをチェックする。
・双方の文字列領域における基準となる位置(ここでは左上隅のY座標)が同じ
・双方の文字列領域が隣り合っている(別の文字列領域が間に存在しない)
なお、基準となる位置の比較においては、スキャン画像の傾き等を考慮し、数ピクセル程度の誤差があっても同じと判定する。また、文字列領域の特定の座標を比較するのに代えて、文字列領域の特定の辺(例えば下辺)の位置を基準として判定に用いてもよい。また、隣り合う文字列領域同士の間の距離を所定の閾値と比較する閾値処理を追加的に行って、当該距離が閾値内の場合にのみ、双方の文字列領域が隣り合うと判定するようにしてもよい。所定の閾値は任意であるが、例えば文字列領域の高さの3倍未満、望ましくは2倍程度である。判定の結果、現在の選択文字列領域が1つ前の選択文字列領域の右隣りにある場合は、ステップ1010に進む。一方、右隣りにない場合は、1009に進む。なお、横書きではなく縦書きの場合は、現在の選択文字列領域が、1つ前の選択文字列領域の下隣りにあるかどうかを、上述の条件に準じてチェックすればよい。
ステップ1009では、ステップ1006で取得したファイル名の末尾に、所定の区切り文字を追加する処理がなされる。所定の区切り文字として、ここでは、アンダーバーを例に説明するが、これに限定されるものではない。例えばハイフンなどアンダーバー以外の記号・文字でも構わないし、さらにはスペースのような実体を伴わないものでも構わない。
ステップ1010では、ステップ1005で取得した文字列(選択文字列領域から抽出した文字列)が、ファイル名の構成要素として設定される。この際、既に設定された文字列が存在している場合は、その末尾に追加される。そして、ステップ1011では、現時点で設定されている文字列が、ファイル名入力欄701に表示(自動入力)される。
以上が、ファイル名生成処理の内容である。このような処理によって、ユーザに選択された複数の文字列領域同士が連続していない場合にのみ、各文字列領域の文字認識結果の間に区切り文字を挿入して、スキャン画像のファイル名が生成される。
ここで、図8で示す「見積書_東京株式会社_2017年04月14日」のファイル名が生成されるまでの過程を、前述の表1を参照して説明する。まず、表1における1〜11の通し番号は、それぞれ以下に示すように各文字列領域と対応付けられている。
1:「見」
2:「積」
3:「書」
4:「東京株式会社」
5:「御中」
6:「見積もり番号」
7:「R-1234」
8:「納品希望日」
9:「2017年04月14日」
10:「横浜株式会社」
11:「横浜市1000-1」
最初に、「見」の文字列領域へのタッチ操作を検知すると、その座標と「見」の文字が取得される(ステップ1001〜1006)。そして、この段階ではファイル名入力欄701は何らの文字列も表示されておらず“空”の状態なので(ステップ1007でYes)、ファイル名入力欄701に「見」が表示される(ステップ1011)。また、プレビュー領域710では、ユーザのタッチ操作によってファイル名の一部として選択されたことを示すため、「見」の文字列領域の囲みが太枠に変わる。
次に、「積」の文字列領域へのタッチ操作を検知すると、その座標と「積」の文字が取得される(ステップ1001〜1006)。そして、この段階ではファイル名入力欄701には「見」の文字が表示されており“空”ではない(ステップ1007でNo)。よって、現在選択中の「積」の文字列領域と、その一つ前の選択に係る「見」の文字列領域とが隣り合うかどうかが、前述の2つの条件に従って判定される(ステップ1008)。まず、双方の文字列領域のY座標はどちらも“5”である(表1を参照)。よって、1つ目の条件は満たしている。次に、2つ目の条件を、当該Y座標上にあるすべての文字列領域をX座標の順番でソートし、一つ前の選択文字列領域と現在の選択文字列領域とがソート後の順番で隣り合うかどうかでチェックする。いま、「見」の文字列領域のY座標上には、「積」の文字列領域と「書」の文字列領域が存在する。これら3つの文字列領域をX座標で昇順にソートすると、「見」「積」「書」の順で横並びになっており、一つ前の選択文字列領域と現在の選択文字列領域は隣り合っている(ステップ1008でYes)。よって、ファイル名入力欄701において、「見」の文字に続けて「積」の文字が追加される(ステップ1010)。この時点で、ファイル名は「見積」となる。そして、文字列領域へのタッチ操作に応答して、同様の処理がなされ、ファイル名入力欄701において「積」の文字に続けて「書」の文字が追加される(ステップ1010)。この時点でファイル名は「見積書」となる。また、プレビュー領域710では、「見」の文字列領域と同様、「積」と「書」の文字列領域の囲みが太枠に変わる。
次に、「東京株式会社」の文字列領域へのタッチ操作を検知すると、その座標と「東京株式会社」の文字が取得される(ステップ1001〜1006)。この場合、現在選択中の「東京株式会社」の文字列領域と、その一つ前の選択に係る「書」の文字列領域とは隣り合わない(ステップ1008でNo)。よって、ファイル名入力欄701において、「見積書」の文字に続けて区切り文字であるアンダーバー“_”が追加設定される(ステップ1009)。この時点でファイル名は「見積書_」となる。その後、さらに「東京株式会社」の文字が追加され(ステップ1010)、ファイル名は「見積書_東京株式会社」となる。そして、ユーザによる「2017年04月14日」の文字列領域へのタッチ操作を検知すると、その座標と「2017年04月14日」の文字が取得される(ステップ1001〜1006)。現在選択中の「2017年04月14日」の文字列領域と、その一つ前の選択に係る「東京株式会社」の文字列領域とは隣り合っていない(ステップ1008でNo)。よって、ファイル名入力欄701において、「東京株式会社」の文字に続けて区切り文字であるアンダーバー“_”が追加設定される(ステップ1009)。この時点でファイル名は「見積書_東京株式会社−」となる。その後、さらに「2017年04月14日」の文字が追加され(ステップ1010)、最終的に「見積書_東京株式会社_2017年04月14日」のファイル名が得られる。また、プレビュー領域710では、「見」「積」「書」の各文字列領域と同様、「東京株式会社」と「2017年04月14日」の文字列領域の囲みも太枠に変わる。
以上が、ファイル名生成処理の内容である。本実施例では、スキャン画像内の文字列領域の文字認識結果を用いてファイル名を設定する場面を例に説明したが、本発明の適用範囲はファイル名を設定する場面に限定されるものではない。例えば、スキャン画像のアップロード先といったデータの転送先設定や、FAX送信やメール送信の宛先設定に適用してもよい。この場合、例えば、前述の図9のアップロード設定画面900において、スキャン画像内の文字列領域の文字認識結果をフォルダパスの候補として選択可能に表示し、ユーザ選択に応じてパス名を設定できるようにする。また、不図示の宛先設定画面において、スキャン画像内の文字列領域の文字認識結果をFAX番号やメールアドレスの候補として選択可能に表示し、ユーザ選択に応じてFAX番号やメールアドレスを設定できるようにする。このように、ファイル名設定以外の場面、例えばデータの転送先等の設定など、スキャン画像に関連する様々な情報(付帯情報)の設定を行う場面において、本発明は幅広く適用可能である。
以上のとおり本実施例によれば、ユーザはスキャン画像内の文字列領域を順に選択することで、適切な位置に区切り文字が挿入されたファイル名等を簡単に設定することができる。
次に、ファイル名等に付けたい単語の構成文字が複数の文字列領域に分離している場合に、そのすべての文字列領域をユーザがいちいち選択しなくても、1つのまとまりのある文字列として自動選択する態様を実施例2として説明する。なお、MFP110におけるスキャン動作の制御の流れなど実施例1と共通する内容については説明を省略することとし、以下では本実施例の特徴であるファイル名生成処理を中心に説明するものとする。
図11は、本実施例に係る、プレビュー表示部426による、ファイル名生成処理の詳細を示すフローチャートである。ステップ1101〜ステップ1109の各処理は、実施例1の図10のフローのステップ1001〜ステップ1009と同じである。図10のフローと異なるのは、ファイル名が“空”と判定(ステップ1107でYes)された後、及び、区切り文字が追加(ステップ1109)された後の処理である。すなわち、ステップ1110では、プレビュー表示部426によって、現に選択中の文字列領域に連続していると判定された文字列領域の文字列を、ファイル名を構成する文字列として自動で選択する処理を行う。図12は、連続している文字列領域の文字列を自動選択する処理の詳細を示すフローチャートである。以下、図12のフローに沿って説明する。
ステップ1201では、現在の選択文字列領域から抽出された文字列が、専用バッファ(以下、「選択文字列バッファ」と呼ぶ。)に保存される。続くステップ1202では、予め用意された辞書データを参照して、選択文字列バッファ内に保存されている文字列と前方一致する単語が、辞書データ内に存在するかどうかが判定される。この場合において、辞書データは、例えばアディショナル機能モジュール420内に予め保持されているものとする。辞書データは、一般的な単語からなる用語集やユーザが事前に任意の単語を登録して生成された独自の用語集、或いはユーザがファイル名として用いた文字列を蓄積した履歴情報などで構成される。表2に、辞書データの一例を示す。
Figure 0006891073
いま、前述の図7(b)のプレビュー画面700において、「見」の文字列領域が選択されていたとする。この場合、「見」の文字列領域から抽出された文字列である「見」と、表2に示す辞書データ内の各単語とが比較され、前方一致する単語があるかどうかが判定される。この例では、番号2の「見積書」が前方一致すると判定されることになる。このように辞書データ内に前方一致する単語が存在した場合は、ステップ1203に進む。一方、前方一致する単語が存在しなかった場合は、本処理を抜けて、図11のフローのステップ1111へ進む。
ステップ1203では、現に選択中の文字列領域に連続している文字列領域が存在するかどうかが判定される。本実施例では、右隣りに連続している文字列領域があるかどうかが、図10のフローのステップ1008の処理と同様の手法で判定することになる。連続している文字列領域が存在する場合は、ステップ1204に進む。一方、連続している文字列領域が存在しない場合は、本処理を抜けて、図11のフローのステップ1111へ進む。
ステップ1204では、連続していると判定された文字列領域に対してOCR処理を行ない、OCR処理によって取得された文字列が上述の選択文字列バッファに追加保存される。これにより、現に選択中の文字列領域に連続している文字列領域の文字列が、現に選択中の文字列領域の文字列に続けて、選択文字列バッファ内に保存される。その後、ステップ1202に戻って、追加保存された文字列を含む選択文字列バッファ内の文字列と前方一致する単語が辞書データ内に存在するかどうかが判定される。そして、連続している文字列が存在しなくなった段階で、本処理を抜ける。こうして、現に選択中の文字列領域に連続するすべての文字列領域から抽出された文字列が、選択文字列バッファ内に順次保存されることになる。
以上が、文字列の自動選択処理の内容である。これにより、例えば、「見」の文字列領域が選択された場合には、その右隣りに連続して存在する「積」と「書」の文字列領域も自動的に選択される。つまり、ユーザは、「積」の文字列領域と「書」の文字列領域をタッチ操作して選択する手間を省くことができる。図11のフローの説明に戻る。
ステップ1111では、選択文字列バッファ内に保存されている全ての文字列が、ファイル名の構成要素として設定される。この際、設定済みの文字列がファイル名入力欄701に存在している場合は、その末尾に追加設定される。そして、ステップ1112では、ステップ1111における追加設定後の文字列が、ファイル名入力欄701に表示される。
以上が、本実施例に係る、ファイル名生成処理の内容である。
<変形例>
上述のようにして得られたファイル名が、ユーザの意に反して区切り文字を含んでいないというケースも考えられる。そこで、ユーザが区切り文字を手動で挿入してファイル名を修正できるようにしてもよい。この場合、例えば、文字列領域同士が連続しているとの判定結果に基づいて区切り文字を挿入しなかった文字列領域間に、区切り文字を挿入するためのボタンを表示する。前述の図7(b)の例では、プレビュー表示領域710内の、「見」文字列領域と「積」の文字列領域との間、及び、「積」の文字列領域と「書」の文字列領域との間にこのボタンを表示する。そして、ユーザが当該ボタンを押下すると、ファイル名を構成する文字列中の対応する位置に区切り文字が挿入されるようにする。この際、当該ボタンを押下する度に、区切り文字の種類(例えば、ハイフン、アンダーバー、スペース、区切り文字なしの4種類)が切り替わるようにしてもよい。また、プレビュー表示領域710内にボタンを設ける代わりに、ファイル名入力欄701に表示中の文字列に対し、区切り文字の挿入候補の位置を指し示す吹き出し表示を行ってもよい。なお、本変形例は、実施例1にも適用可能である。
本実施例によれば、ファイル名等に付けたい単語の構成文字が複数の文字列領域に分離されている場合において、その全ての文字列領域をユーザが選択しなくても、1つのまとまりのある文字列として自動的に選択され得る。これにより、ユーザはより効率的に、スキャン画像に対するファイル名等の設定を行うことができる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。

Claims (15)

  1. 文書をスキャンして得られたスキャン画像に対して設定される付帯情報を生成する装置であって、
    前記スキャン画像に含まれる少なくとも1つの文字領域をユーザに選択させるUI画面上に、前記スキャン画像を表示する表示制御手段と、
    前記UI画面を介してユーザが選択した前記少なくとも1つの文字領域に対してOCR処理を行ない、少なくとも1つの文字列を取得する取得手段と、
    前記取得手段によって取得された前記少なくとも1つの文字列に基づいて前記付帯情報を生成する生成手段と、
    を備え、
    前記生成手段は、
    ユーザが複数の文字領域を選択した場合であって、選択された前記複数の文字領域間の位置関係が所定の条件を満たさない場合、選択された前記複数の文字領域に対して前記OCR処理を行って取得された複数の文字列の間に区切り文字を挿入することにより前記付帯情報を生成し、
    ユーザが複数の文字領域を選択した場合であって、選択された前記複数の文字領域間の位置関係が所定の条件を満たす場合、選択された前記複数の文字領域に対して前記OCR処理を行って取得された複数の文字列に基づき、当該複数の文字列の間に前記区切り文字を挿入することなく前記付帯情報を生成する、
    ことを特徴とする装置。
  2. 前記所定の条件は、現にユーザにより選択された文字領域及びその1つ前に選択された文字領域が特定の方向に連続していることである、ことを特徴とする請求項1に記載の装置。
  3. 前記所定の条件は、現に選択された文字領域における基準となる位置とその1つ前に選択された文字領域における基準となる位置が同じかどうか、及び、現に選択された文字領域とその1つ前に選択された文字領域とが隣り合っているかどうかに基づいて、前記特定の方向に連続していると判定される場合に満たされる、ことを特徴とする請求項2に記載の装置。
  4. 現に選択された文字領域とその1つ前に選択された文字領域の間に別の文字領域が存在しないとき、現に選択された文字領域とその1つ前に選択された文字領域とが隣り合っていると判定される、ことを特徴とする請求項3に記載の装置。
  5. 現に選択された文字領域とその1つ前に選択された文字領域の間に別の文字領域が存在せず、かつ、現に選択された文字列領域とその1つ前に選択された文字列領域の間の距離が所定の閾値内の場合に、現に選択された文字領域とその1つ前に選択された文字領域とが隣り合っていると判定される、ことを特徴とする請求項4に記載の装置。
  6. 前記所定の閾値は、ユーザが選択した文字領域の高さの3倍未満であることを特徴とする請求項5に記載の装置。
  7. 前記生成手段は、
    複数の単語が登録された辞書データを有し、
    ユーザが選択中の文字領域から抽出された文字列と前方一致する単語が前記辞書データ内に存在する場合、当該選択に係る文字領域と特定の方向に連続している文字領域に対してさらに前記OCR処理を行ない、該OCR処理によって抽出された文字列を用いて前記付帯情報を生成する
    ことを特徴とする請求項1乃至6のいずれか1項に記載の装置。
  8. 前記特定の方向は、前記文書のフォーマット又は前記文書で使用されている言語に基づき決定されることを特徴とする請求項2乃至6のいずれか1項に記載の装置。
  9. 前記表示制御手段は、さらに、前記生成手段で生成された付帯情報を表示するとともに、当該表示された付帯情報を構成する文字列の間に区切り文字を挿入するためのボタンを表示し、
    前記生成手段は、前記ボタンがユーザによって押下された場合、当該押下されたボタンに対応する位置に区切り文字を挿入して、前記付帯情報を修正する、
    ことを特徴とする請求項1乃至8のいずれか1項に記載の装置。
  10. 前記付帯情報は、前記スキャン画像のファイル名である、ことを特徴とする請求項1乃至9のいずれか1項に記載の装置。
  11. 前記付帯情報は、前記スキャン画像をアップロードするためのアップロード先を示すパス名である、ことを特徴とする請求項1乃至9のいずれか1項に記載の装置。
  12. 前記付帯情報は、前記スキャン画像をFAX送信するための送信先を示すFAX番号である、ことを特徴とする請求項1乃至9のいずれか1項に記載の装置。
  13. 前記付帯情報は、前記スキャン画像をメール送信するための送信先を示すメールアドレスである
    ことを特徴とする請求項1乃至9のいずれか1項に記載の装置。
  14. 文書をスキャンして得られたスキャン画像に対して設定される付帯情報を生成する方法であって、
    表示されたスキャン画像に含まれる少なくとも1つの文字領域をユーザが選択可能なUI画面上に、前記スキャン画像を表示する表示制御ステップと、
    前記UI画面を介してユーザが選択した前記少なくとも1つの文字領域に対してOCR処理を行ない、少なくとも1つの文字列を取得する取得ステップと、
    前記取得ステップにて取得された前記少なくとも1つの文字列に基づいて前記付帯情報を生成する生成ステップと、
    を含み、
    前記生成ステップでは、
    ユーザが複数の文字領域を選択した場合であって、選択された前記複数の文字領域間の位置関係が所定の条件を満たさない場合、選択された前記複数の文字領域に対して前記OCR処理を行って取得された複数の文字列の間に区切り文字を挿入することにより前記付帯情報が生成され、
    ユーザが複数の文字領域を選択した場合であって、選択された前記複数の文字領域間の位置関係が所定の条件を満たす場合、選択された前記複数の文字領域に対して前記OCR処理を行って取得された複数の文字列に基づき、当該複数の文字列の間に前記区切り文字を挿入することなく前記付帯情報が生成される、
    ことを特徴とする方法。
  15. コンピュータを、請求項1乃至13のいずれか1項に記載の装置の各手段として機能させるためのプログラム。
JP2017159540A 2017-08-22 2017-08-22 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム Active JP6891073B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2017159540A JP6891073B2 (ja) 2017-08-22 2017-08-22 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
US16/100,943 US10860785B2 (en) 2017-08-22 2018-08-10 Apparatus for setting file name and the like for scan image, control method thereof, and storage medium
KR1020180094148A KR102408019B1 (ko) 2017-08-22 2018-08-13 스캔 화상에 대해 파일명 등을 설정하기 위한 장치, 그 제어 방법 및 저장 매체
CN201810960344.5A CN109426821B (zh) 2017-08-22 2018-08-22 对扫描图像进行预定处理的设备、其控制方法和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017159540A JP6891073B2 (ja) 2017-08-22 2017-08-22 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2019041150A JP2019041150A (ja) 2019-03-14
JP2019041150A5 JP2019041150A5 (ja) 2020-09-24
JP6891073B2 true JP6891073B2 (ja) 2021-06-18

Family

ID=65435189

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017159540A Active JP6891073B2 (ja) 2017-08-22 2017-08-22 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム

Country Status (4)

Country Link
US (1) US10860785B2 (ja)
JP (1) JP6891073B2 (ja)
KR (1) KR102408019B1 (ja)
CN (1) CN109426821B (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7062388B2 (ja) * 2017-08-22 2022-05-06 キヤノン株式会社 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP7102284B2 (ja) * 2018-08-23 2022-07-19 株式会社Pfu ファイル管理装置、ファイル管理方法、及びプログラム
JP7358663B2 (ja) 2019-04-19 2023-10-10 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7387282B2 (ja) * 2019-04-19 2023-11-28 キヤノン株式会社 スキャン画像のプレビュー表示を行なう画像処理装置、その制御方法及びプログラム
JP7330742B2 (ja) * 2019-04-19 2023-08-22 キヤノン株式会社 スキャン画像にプロパティを設定するための画像処理装置、その制御方法及びプログラム
JP7297510B2 (ja) * 2019-04-19 2023-06-26 キヤノン株式会社 ユーザ操作のためのガイダンスを表示する画像処理装置、その制御方法及びプログラム
JP7225017B2 (ja) * 2019-04-19 2023-02-20 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7391672B2 (ja) * 2020-01-21 2023-12-05 キヤノン株式会社 文書を電子化するための画像処理システム、その制御方法及びプログラム
JP7400548B2 (ja) * 2020-03-03 2023-12-19 富士フイルムビジネスイノベーション株式会社 情報処理装置、画像処理装置、情報処理システム、及びプログラム
JP7434001B2 (ja) 2020-03-13 2024-02-20 キヤノン株式会社 情報処理装置、プログラム、情報処理方法
JP2021163983A (ja) 2020-03-30 2021-10-11 キヤノン株式会社 サーバー、情報処理方法、プログラム
JP2021184190A (ja) * 2020-05-22 2021-12-02 キヤノン株式会社 画像処理装置、画像処理方法、およびプログラム
JP2022091530A (ja) * 2020-12-09 2022-06-21 キヤノン株式会社 情報処理装置、画像処理システム、制御方法、並びにプログラム
JP2022095391A (ja) * 2020-12-16 2022-06-28 富士フイルムビジネスイノベーション株式会社 情報処理装置、及び情報処理プログラム
JP2023040888A (ja) * 2021-09-10 2023-03-23 キヤノン株式会社 画像処理システム、サーバとその制御方法、及びプログラム
JP2023160049A (ja) * 2022-04-21 2023-11-02 キヤノン株式会社 情報処理装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5689342A (en) * 1994-11-17 1997-11-18 Canon Kabushiki Kaisha Image processing method and apparatus which orders text areas which have been extracted from an image
JP2005056315A (ja) * 2003-08-07 2005-03-03 Ricoh Co Ltd 情報処理装置、プログラム及び記憶媒体
CN100382096C (zh) * 2003-08-20 2008-04-16 奥西-技术有限公司 文档扫描设备及方法
JP2008071050A (ja) * 2006-09-13 2008-03-27 Sharp Corp 情報処理端末装置、情報処理装置、ファイル管理サーバ、情報処理システム、ファイル名自動生成方法、プログラムおよび記録媒体
JP2008176624A (ja) 2007-01-19 2008-07-31 Seiko Epson Corp 文字認識結果の管理装置およびその方法並びにコンピュータプログラム
JP5031472B2 (ja) * 2007-07-23 2012-09-19 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
US9129036B2 (en) * 2008-02-22 2015-09-08 Tigerlogic Corporation Systems and methods of identifying chunks within inter-related documents
US8566088B2 (en) * 2008-11-12 2013-10-22 Scti Holdings, Inc. System and method for automatic speech to text conversion
US8373724B2 (en) * 2009-01-28 2013-02-12 Google Inc. Selective display of OCR'ed text and corresponding images from publications on a client device
US9251428B2 (en) * 2009-07-18 2016-02-02 Abbyy Development Llc Entering information through an OCR-enabled viewfinder
JP5430312B2 (ja) * 2009-09-15 2014-02-26 シャープ株式会社 データ処理装置、データ名生成方法及びコンピュータプログラム
JP5594269B2 (ja) * 2011-09-29 2014-09-24 コニカミノルタ株式会社 ファイル名作成装置、画像形成装置、およびファイル名作成プログラム
JP5950700B2 (ja) * 2012-06-06 2016-07-13 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
CN102831106A (zh) * 2012-08-27 2012-12-19 腾讯科技(深圳)有限公司 一种移动终端的电子文档生成方法及移动终端
KR102147935B1 (ko) * 2013-08-29 2020-08-25 삼성전자주식회사 데이터 처리 방법 및 그 전자 장치
JP2015215878A (ja) * 2014-04-21 2015-12-03 株式会社リコー 画像処理装置及び画像処理システム
JP6090269B2 (ja) * 2014-09-08 2017-03-08 コニカミノルタ株式会社 電子文書生成装置、プログラムおよび電子文書生成システム
JP6220770B2 (ja) * 2014-12-12 2017-10-25 株式会社エヌ・ティ・ティ・データ 帳票定義装置、帳票定義方法、及び帳票定義プログラム
JP6762722B2 (ja) * 2016-01-18 2020-09-30 キヤノン株式会社 情報処理装置、制御方法、及びプログラム

Also Published As

Publication number Publication date
KR20190021161A (ko) 2019-03-05
KR102408019B1 (ko) 2022-06-14
CN109426821B (zh) 2023-09-19
CN109426821A (zh) 2019-03-05
US20190065451A1 (en) 2019-02-28
JP2019041150A (ja) 2019-03-14
US10860785B2 (en) 2020-12-08

Similar Documents

Publication Publication Date Title
JP6891073B2 (ja) スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP6953230B2 (ja) スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP6968647B2 (ja) スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム
JP7034730B2 (ja) スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP6983675B2 (ja) スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム
US10528679B2 (en) System and method for real time translation
JP7030462B2 (ja) スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム
JP7062388B2 (ja) スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
US11144189B2 (en) Determination and relocation of movement targets based on a drag-and-drop operation of a thumbnail across document areas
JP4983610B2 (ja) 画像処理装置
JP7077127B2 (ja) スキャン画像データに関連する情報を設定するための装置、方法、及びプログラム
JP7476557B2 (ja) 機器、処理実行システム、処理実行方法、プログラム
JP4935871B2 (ja) 原稿画像データ化方法、原稿画像データ化装置、およびコンピュータプログラム
JP2019068323A (ja) スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム
JP2021026604A (ja) 画像処理装置、画像処理方法、及びプログラム
JP7150967B2 (ja) スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP7030505B2 (ja) スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP2024034740A (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
JP2021114709A (ja) 画像形成装置、画像形成方法及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200730

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200730

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210526

R151 Written notification of patent or utility model registration

Ref document number: 6891073

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151