JP2018124656A - 画像処理装置とその制御方法、及びプログラム - Google Patents

画像処理装置とその制御方法、及びプログラム Download PDF

Info

Publication number
JP2018124656A
JP2018124656A JP2017014513A JP2017014513A JP2018124656A JP 2018124656 A JP2018124656 A JP 2018124656A JP 2017014513 A JP2017014513 A JP 2017014513A JP 2017014513 A JP2017014513 A JP 2017014513A JP 2018124656 A JP2018124656 A JP 2018124656A
Authority
JP
Japan
Prior art keywords
image data
file name
naming
user
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017014513A
Other languages
English (en)
Other versions
JP6881990B2 (ja
JP2018124656A5 (ja
Inventor
純也 荒川
Junya Arakawa
純也 荒川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017014513A priority Critical patent/JP6881990B2/ja
Priority to KR1020180009124A priority patent/KR102247606B1/ko
Priority to US15/881,482 priority patent/US10706276B2/en
Priority to EP18153735.8A priority patent/EP3355211A1/en
Priority to CN201810082808.7A priority patent/CN108377308B/zh
Publication of JP2018124656A publication Critical patent/JP2018124656A/ja
Publication of JP2018124656A5 publication Critical patent/JP2018124656A5/ja
Priority to US16/906,988 priority patent/US11600090B2/en
Application granted granted Critical
Publication of JP6881990B2 publication Critical patent/JP6881990B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32106Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file
    • H04N1/32112Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file in a separate computer file, document page or paper sheet, e.g. a fax cover sheet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00244Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • G06F18/41Interactive pattern learning with a human teacher
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/778Active pattern-learning, e.g. online learning of image or video features
    • G06V10/7784Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors
    • G06V10/7788Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors the supervisor being a human, e.g. interactive learning with a human teacher
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00411Display of information to the user, e.g. menus the display also being used for user input, e.g. touch screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00413Display of information to the user, e.g. menus using menus, i.e. presenting the user with a plurality of selectable options
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00501Tailoring a user interface [UI] to specific requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2104Intermediate information storage for one or a few pictures
    • H04N1/2158Intermediate information storage for one or a few pictures using a detachable storage unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0081Image reader
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3226Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image
    • H04N2201/3228Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image further additional information (metadata) being comprised in the identification information
    • H04N2201/3229Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image further additional information (metadata) being comprised in the identification information further additional information (metadata) being comprised in the file name (including path, e.g. directory or folder names at one or more higher hierarchical levels)

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Facsimiles In General (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】複雑なファイル命名ルールを設定することにより、誤認識による影響を大きく軽減できるが、このような複雑な命名ルールを登録するのはユーザにとって大きな負担となっていた。【解決手段】画像データのファイル名を作成する命名ルールに従って、取得した画像データのファイル名を作成するとともに、ユーザの指示に応じて命名ルールを変更し、その変更された命名ルールを、対応する画像データの識別情報とともにメモリに記憶する。そして、取得した画像データに類似する画像データの命名ルールが、そのメモリに記憶されているかどうか判定し、記憶されているときは当該類似する画像データの命名に使用した命名ルールを使用し、その取得した前記画像データのファイル名をユーザに提示する。【選択図】 図3

Description

本発明は、画像処理装置とその制御方法、及びプログラムに関する。
帳票等の紙文章(原稿)を読取装置で読み取り、その原稿の画像をデジタル化した画像データを得る業務フローが存在する。その際、そのデジタル化した画像データに、その原稿の種類や内容に応じたファイル名を付与して所定のフォルダに格納することが行われる。このときファイル名の付与をユーザが手入力で行うと、原稿の種類や枚数が多くなるとユーザにとって大きな負担となる。特に、ユーザインターフェース(UI)の制約により、ユーザがソフトウェアキーボードを使用してファイル名を入力する場合は、ユーザの負担はより大きくなる。また、こうして作成したファイルの格納先を指定する場合、新たなフォルダを作成することが必要となることもあり、これもユーザにとって負荷が大きくなる。
このような問題を解決する手法として、特許文献1には以下の方法が記載されている。まず原稿の種類と、ファイル命名ルールや格納先ルール等とを関連付けて登録しておき、読み取った原稿の種類を認識して、それに対応する命名ルールや格納先ルールを用いて、自動的にファイル名や格納先をユーザに推奨する。これによりユーザは、一度、原稿の種類ごとにファイル命名ルールや格納先ルールを設定するだけで、それ以降のファイルの命名や格納先を指定する必要が無くなるため、ユーザの負荷を大きく軽減できる。
特開2011−15348号公報
上述の先行技術は、推奨設定をユーザが予め登録する必要があり、複雑なファイル命名ルールを登録しようとするユーザにとって大きな負担となる。この複雑な命名ルールを登録することによるユーザの負担は、複雑な命名ルールを規定するための多くのユーザ操作が必要となることに起因している。例えば、単にファイルに名称を付すだけであれば、読み取った原稿の特定の箇所の文字認識(OCR)の結果を利用し、その認識した文字列を用いてファイル名に使用するように指示すればよい。しかしながら、より精度の高いファイルの命名を可能にするためには、複雑なファイル命名ルールを登録する必要がある。例えば、「請求書番号22035」という文字認識の結果を利用して、「請求書番号22035.PDF」というファイル名を付したいときは、ユーザは、文字認識の結果の選択と、拡張子の選択とを行えばよい。
しかしながら、ファイル命名ルールを登録する際、その文字認識を行う原稿の箇所と、それ以外の箇所とを分けて登録する必要があり、また文字認識の種類を指定するのが好ましい。上述の例において、例えば「請求書番号」が同じ種類の原稿の画像データのファイル名に共通する固定的な文字列であり、「22035」の部分が各原稿に応じて変更する部分で、この変更する部分は数字のみで構成されているとする。この場合、固定的な文字列「請求書番号」と、「22035」が記述されている部分とを数字限定で文字認識し、その結果と拡張子とを組み合わせてファイル名とするルールを登録する。こうすることにより、同じ種類で、その内容が異なる原稿の画像データで、例えば「請求書番号」が「言青書番号」と誤認識されたとしても固定文字列を利用するように指定しているため、誤認識によるファイル名への影響はない。また文字認識の結果を利用する部分でも、文字認識の対象となる文字列を数字に限定すると、例えば数字の0(ゼロ)をアルファベットのo(オー)と誤って認識されることもなくなる。このように複雑なファイル命名ルールを設定することにより、誤認識による影響を大きく軽減できるようになるが、このような命名ルールを登録するのはユーザにとって大きな負担となっていた。
本発明の目的は、上記従来技術の課題を解決することにある。
本発明の目的は、ユーザの負担を軽減して、複雑な命名ルールを登録でき、その命名ルールを用いてユーザが意図するファイル名を提示できる可能性を高める技術を提供できる技術を提供することにある。
上記目的を達成するために本発明の一態様に係る画像処理装置は以下のような構成を備える。即ち、
原稿の画像データを取得する取得手段と、
前記画像データのファイル名を作成する命名ルールに従って、前記取得手段により取得した画像データのファイル名を作成する作成手段と、
ユーザの指示に応じて前記命名ルールを変更する変更手段と、
前記変更手段により変更された前記命名ルールを、対応する画像データの識別情報とともに記憶する記憶手段と、
前記取得手段により取得した前記画像データに類似する画像データの命名ルールが前記記憶手段に記憶されているかどうか判定し、記憶されているときは当該類似する画像データの命名に使用した命名ルールを使用して、前記取得手段により取得した前記画像データのファイル名をユーザに提示する提示手段と、を有することを特徴とする。
本発明によれば、ユーザの負担を軽減して、複雑な命名ルールを登録でき、その命名ルールを用いてユーザが意図するファイル名を提示できる可能性を高めることができる。
本発明のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。尚、添付図面においては、同じ若しくは同様の構成には、同じ参照番号を付す。
添付図面は明細書に含まれ、その一部を構成し、本発明の実施形態を示し、その記述と共に本発明の原理を説明するために用いられる。
本発明の実施形態1に係る情報処理システムの構成例を示すブロック図。 実施形態1に係る画像処理装置が原稿を読み取り、その画像データにファイル名を付与し、そのファイル名をファイル命名装置に送信する処理を説明するフローチャート。 実施形態1に係るファイル命名装置による画像データのファイルの命名のための情報を生成する処理を説明するフローチャート。 図2のS201で読み取られる原稿の一例を示す図。 実施形態1に係る画像処理装置の表示部に表示されるファイルの命名用のUIの一例を示す図。 実施形態1に係る画像処理装置の表示部に表示されるファイルの命名用のUIの一例を示す図。 実施形態1に係る画像処理装置の表示部に表示されるファイルに命名用のUIの他の例を示す図。 実施形態1に係るファイル命名ルールを説明する図。 実施形態1に係る別のファイル命名ルールの詳細を説明する図。 実施形態1に係る図9の<OCR領域1>のルールの更新の一例を説明する図。 実施形態1に係るファイル命名ルールのOCR設定の一例を説明する図。 実施形態2に係るファイル命名装置による画像データのファイルの命名のための情報を生成する処理を説明するフローチャート。
以下、添付図面を参照して本発明の実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
[実施形態1]
図1は、本発明の実施形態1に係る情報処理システムの構成例を示すブロック図である。実施形態1に係るシステムは、スキャナ等で原稿を光学的に読み取ってその原稿の画像データを取得し、その画像データのファイルにファイル名を付与するシステムとして説明する。図1に示すように、このシステムは、画像処理装置100、ファイル命名装置120とを備えている。ここで画像処理装置100とファイル命名装置120とは、ネットワーク150を介して相互にデータ通信可能に接続されている。
画像処理装置100は、ユーザインターフェース(UI)104、CPU105、RAM106、記憶部107、画像読取部108、画像出力部109、表示部110を備え、これらは制御部101を介して相互に通信可能に接続されている。制御部101は、画像処理装置100全体を制御する装置制御部102と、画像データを処理する画像処理部103とを有する。
CPU105は、画像処理装置100の電源がオンされると記憶部107の初期プログラムを実行して、メインプログラムを記憶部107より読出してRAM106に展開する。RAM106はプログラムの格納用や、ワーク用のメインメモリとして使用される。そしてCPU105は、そのRAM106に展開したプログラムを実行することにより、この画像処理装置100の動作を制御する。よって制御部101の装置制御部102、画像処理部103等の機能は、CPU105が上述のプログラムを実行することにより達成される。
画像読取部108は、例えばスキャナ等であり、紙文書(原稿)を読取って、その原稿の画像をデジタル化した画像データを取得する。制御部101は、画像読取部108で得られた画像データを受取ると、それを記憶部107に記憶する。そして制御部101は、後述する命名処理を実行する際に、その記憶部107に記憶された画像データを、ネットワーク150を介してファイル命名装置120に送信する。また制御部101は、ファイルに命名するための情報を、ネットワーク150を介して、ファイル命名装置120から受信する。このファイルの命名のための情報については、詳しく後述する。
制御部101は、記憶部107に記憶されている原稿の画像データと、ファイル命名装置120から受信したファイルに命名するための情報とを用いて、ファイルに命名するためのUI画面を生成して表示部110に表示する。また制御部101は、記憶部107に記憶された原稿の画像データを画像出力部109に供給すると、画像出力部109は、種々の形式でその画像データを出力する処理を実行する。例えば、画像出力部109は、その原稿に係る画像データを記憶媒体に記憶する処理を実行する。或いは、画像出力部109は、紙媒体等の媒体に、その画像データに基づく画像を印刷する処理を実行する。
ユーザインターフェース104は、例えばキーボード、マウス(登録商標)、その他入出力装置を含み、各種の設定値又は指定値を入力して設定できる。実施形態1に係るユーザインターフェース104は、ユーザがファイルの命名を行うのに利用される。命名したファイル名は、制御部101がネットワーク150を介して、ファイル命名装置120に送信する。
以上説明した画像処理装置100はあくまでも一例であり、画像読取部108及び画像出力部109のうち、画像出力部109を有さない構成の画像処理装置100であってもよい。
ファイル命名装置120は、CPU127、RAM128、記憶部129、表示部130、ユーザインターフェース(UI)131を備え、これらは制御部121を介して相互に通信可能に接続されている。制御部121はさらにファイル命名装置120全体を制御する装置制御部122と、ファイル命名のための情報を生成するファイル命名部123とを有する。実施形態1に係るファイル命名部123は、画像データの文字認識処理(OCR)を行うOCR部124と、画像データ同士のマッチングを行うマッチング部125と、画像データのファイル名の推定を行うファイル名推定部126とを有する。
ユーザインターフェース131は、例えばキーボード、マウス(登録商標)、その他入出力装置を含み、各種の設定値または指定値を入力することができる。CPU127は、ファイル命名装置120の電源オン時に記憶部129の初期プログラムを実行し、メインプログラムを記憶部129より読み出してRAM128に展開する。RAM128はプログラムの格納用や、ワーク用のメインメモリとして使用される。そしてCPU127は、そのRAM128に展開したプログラムを実行することにより、このファイル命名装置120の動作を制御する。よって後述する制御部121の機能は、CPU127が上述のプログラムを実行することにより達成される。また制御部121は、記憶部129に記憶された原稿の画像データを表示部130に表示する処理を実行する。また制御部121は、画像処理装置100から送信され、ファイル命名装置120の記憶部129に保存された画像データをファイル命名部123に提供する。
ファイル命名部123は、その画像データを解析し、ファイルに命名するための情報を生成する。そして制御部121は、生成された情報を、ネットワーク150を介して画像処理装置100に送信する。また制御部121は、画像処理装置100から受信したファイルの命名の結果をファイル命名部123に供給する。ファイル命名部123は、最終的に命名されたファイルの命名の結果を利用して、ファイル命名ルールを更新する。OCR部124は、その画像データに対して文字認識処理を行い、その画像データに含まれる文字情報を抽出する。マッチング部125は、画像データ同士の類似度を算出する。ファイル名推定部126は、過去のファイルの命名の結果の履歴からファイル命名ルールを推定し、入力された画像データに適したファイル名を生成する。
以上説明したファイル命名装置120の構成はあくまでも一例であり、本発明はこれに限らない。例えば、ファイル命名装置120は、サーバ等のコンピュータ装置で実現できるが、記憶部129やファイル命名部123の機能は、クラウドと呼ばれるネットワーク150でつながるリモートの計算資源で実装する構成も考えられる。更に、画像処理装置100がファイル命名装置120の機能を包含する態様で、画像処理装置100を実装してもよい。
次に、本実施形態1に係るシステムにより実行される処理を説明する。
図2は、実施形態1に係る画像処理装置100が原稿を読み取り、その画像データにファイル名を付与し、そのファイル名をファイル命名装置120に送信する処理を説明するフローチャートである。この処理は、ユーザインターフェース104が、ユーザからの原稿の読取指示を受取ることにより開始される。尚、このフローチャートで示す処理は、CPU105が記憶部107からRAM106に展開したプログラムを実行することにより達成される。
まずS201でCPU105は装置制御部102として機能し、画像読取部108を制御して原稿を読み取り、その原稿の画像データを取得する。そしてCPU105は、その画像データに対して画像処理部103により色変換処理、階調補正等の補正処理を行ってRAM106に格納する。そしてRAM106に格納された画像データを記憶部107に保存する。
次にS202に進みCPU105は装置制御部102として機能し、記憶部107に保存されている画像データをネットワーク150を介してファイル命名装置120に送信する。次にS203に進みCPU105は装置制御部102として機能し、ファイルの命名用のUI画面の生成に必要な情報をファイル命名装置120から受信する。ここで受信する情報は、画像データのOCRの結果、及び推奨ファイル名に関する情報を含んでいる。OCR結果の情報は、OCR処理により得られた画像データに含まれる文字列に関する情報を含んでいる。具体的には、その画像データに含まれる全ての文字列ブロックの文字列ブロックID、文字列ブロック位置、文字列ブロックサイズ、文字列ブロックの文字列を含む。推奨ファイル名情報は、画像データの内容から推奨される、その画像データのファイル名に関する情報である。推奨ファイル名情報は、具体的なファイル名の情報でも良いし、ファイル命名用のUI画面に合わせた情報でもよい。後者は、例えば、文字列ブロックID「2」と、文字列ブロックID「5」に含まれる文字列を組み合わせてファイル名とするといった、間接的にファイル名を推奨する情報である。
次にS204に進みCPU105は装置制御部102として機能し、S203でファイル命名装置120から得た情報を利用して、ファイルの命名用のUI画面を生成する。そして、その生成したUI画面を表示部110に表示する。そしてユーザインターフェース104を通じて、ファイルの命名指示を受け付ける。ここでCPU105は、ユーザインターフェース104からの指示に基づき、適宜、ファイルの命名用のUI画面を更新する。またCPU105は、ユーザインターフェース104から、ファイル名を確定した旨の通知を受けるとS205に処理を進める。
ここで、ファイルに命名するためのUI画面の例を図4〜図7を参照して説明する。
図4は、図2のS201で読み取られる原稿の一例を示す図である。ここでは注文書の例で示している。
図5及び図6は、実施形態1に係る画像処理装置100の表示部110に表示されるファイルの命名用のUIの一例を示す図である。ここでは図4に示す原稿を読み取った場合で示している。
図5(A)は、推奨されるファイル名が存在しない場合に、最初に、UI画面として表示される画面例を示している。ここでは、OCR処理された文字列のブロックがグレーの背景色で表示されている。この画像で、文字列部分であるにも拘らず背景色がグレーとなっていない領域があるが、これはOCRで認識されなかった文字列ブロックを示している。この背景色がグレーとなっている文字列ブロックをユーザが選択することにより、その文字列をファイルの命名に利用する文字列ブロックとして指定できる。
図5(B)は、ユーザが「注文書」と書かれている文字列ブロック501を選択した例を示す。文字列ブロック501が選択されると、このUI画面を更新し、文字列ブロック501が選択されたことを示す丸数字「1」を文字列ブロック501の左上に表示する。この丸数字「1」は、1番目に選択された文字列ブロックであることを示している。また文字列ブロック501に含まれるOCRで認識された文字列「注文書」を、ファイル名付け(ファイル名称)のテキストボックス502に表示する。
図6(A)は、更に、ユーザが追加して、「株式会社西取手白山商会 御中」と書かれている文字列ブロック503を選択した状態を示す。この文字列ブロック503が選択されるとUI画面を更新し、文字列ブロック503が選択されたことを示す丸数字「2」を文字列ブロック503の左上に表示する。この丸数字「2」は2番目に選択された文字列ブロックであることを示している。また文字列ブロック503に含まれるOCRで認識された文字列「株式会社西取手白山商会 御中」を、ファイル名付けのテキストボックス502に、既に表示されている文字列「注文書」に「_」で連結して表示する。このとき一般的なファイル名にスペースが含まれるのは好ましくないため、「株式会社西取手白山商会 御中」を「株式会社西取手白山商会御中」とする。この結果、テキストボックス502には、「注文書_株式会社西取手白山商会御中」という文字列が表示される。
このときユーザは、文字列ブロック503を指定して会社名を追加したかっただけであったとしても、「株式会社西取手白山商会」という文字列ブロックと、「御中」という文字列ブロックとが結合して、1つの文字列ブロックとしてOCRで認識されている。このため「御中」という文字列もテキストボックス502に表示される。
図6(B)は、更にユーザが、テキストボックス502を選択して、その内容を編集して「御中」を消去した結果を示している。
図6(B)において、テキストボックス502に含まれる文字列は「注文書_株式会社西取手白山商会」となる。そしてこの状態で、ユーザがファイル名付けボタン504を押下すると、この画像データのファイル名が、テキストボックス502に含まれる文字列「注文書_株式会社西取手白山商会」となる。このようにしてユーザは、ファイル名を手動で入力しなくても、原稿を読み取って得られた画像データの文字認識結果を活用して、ファイルに名称を付与することができる。しかしながら、まだ多少の手間をかける必要がある。ここでのユーザ操作に関する情報を含んだファイルの命名に関する情報は、後述するフローに従って画像処理装置100からファイル命名装置120に送信され、推奨されるファイル名を生成するために活用される。
ここで、例えばファイル命名装置120で作成された推奨されるファイル名が存在する場合、例えば、図6(B)の画面が最初から表示される。この場合は、ユーザは、図6(B)の画面でファイル名付けボタン504を押下するだけでファイルに名称を付与することができるため、ファイルの命名操作の手間が大きく軽減される。
ここで、推奨されるファイル名に関する情報は、ファイルの命名に利用する文字列ブロックに関する情報である。具体的には、文字列ブロック501が1番目の文字列、文字列ブロック503が2番目の文字列として、ファイルの命名に利用されるという情報を含む。更に、文字列ブロック503に含まれる文字列は、実際のOCR結果である「株式会社西取手白山商会御中」から「株式会社西取手白山商会」に修正されている。これは、過去のユーザのファイルの命名結果を利用して推定されたファイル命名ルールに従って、「御中」を削除したものである。一方、ファイル命名装置120では、推定したファイル命名ルールが簡易である場合、「御中」がそのまま含まれる可能性があり、推奨されるファイル名の品質は、推定したファイル命名ルールに左右される。このファイル命名ルールの推定については後述する。
別のUI例について、図7を参照して説明する。
図7は、実施形態1に係る画像処理装置100の表示部110に表示されるファイルに命名するためのUI画面の他の例を示す図である。ここでも図4に示す原稿を読み取った場合で示している。
図7では、ファイルの命名に、OCRの結果だけではなく、他の情報も利用することが可能である。まず図7のUIの各機能部品について説明する。701〜703は文字の表示、編集が可能なフィールドであり、これらフィールドの文字列を組み合わせてファイルの名称を作成できる。このフィールドを選択してアクティブにして、利用するテキスト部分(文字列ブロック501,503)を選択することにより、そのテキスト部品が保持する文字列を入力でき、また、その入力された文字列を編集することもできる。フィールド701〜703は、それぞれ消去ボタン704〜706を用いて、その内容を消去することができる。またファイルの名称を作成する際、各フィールドの文字列の間に区切り文字を指定できる。その区切り文字の指定を行うのが、区切り文字指定707,708である。図7の例では、「区切り文字なし」「_」「(」「)」「−」「#」の中から任意の1つを選ぶことができる。尚、消去ボタン704〜706でフィールドの内容が消去された場合には、その消去されたフィールドに対応する区切り文字指定707,708も消去される。フィールド追加ボタン709が押されると、ファイルの名称を作成する新たなフィールドを追加できる。例えば、フィル―ド701、フィールド702、区切り文字指定707しか存在しない状況で、フィールド追加ボタン709が押下されると、新たにフィールド及びそれに対応する区切り文字指定が追加される。
各フィル―ドへの文字列の入力は、OCRで認識された文字列ブロック、メタ情報ボタン、任意文字列ボタンにより行われる。OCRで認識された文字列ブロックは、図5、図6と同様に、ユーザが、認識された文字列ブロックを選択することにより利用できる。例えば、フィールド701をアクティブにした後、図5の文字列ブロック501を押下すると、文字列ブロック501に含まれる文字列「注文書」がフィールド701に入力される。同様の操作で、フィールド702に、文字列ブロック503に含まれる文字列「株式会社西取手白山商会 御中」を入力することができる。
更に図7の例では、メタ情報ボタンとして、日付ボタン710とユーザ名ボタン711を用意している。例えば、フィールド703をアクティブにした後、日付ボタン710を押下すると、その日付ボタン710を押下した当日の日付がフィールド703に入力される。同様に、ユーザがフィールド703をアクティブにした後、ユーザ名ボタン711を押すと、フィールド703にその操作しているユーザの名称が入力される。この場合は、ユーザは予め画像処理装置100で認証処理を行っているものとする。任意文字列ボタン712は、ユーザが任意の文字列を入力することに利用する。例えば、フィールド703をアクティブにした後、ユーザが任意文字列ボタン712を押下すると、ユーザはフィールド703に、任意の文字列を入力できる。この文字列の入力は、ユーザインターフェース104を用いて行う。
こうして入力された各フィールドの文字列は、ユーザインターフェース104を用いてユーザが編集することができる。図7のUIの特徴は、ユーザはファイル名を効率的に入力できるとともに、システム側はファイル命名ルールを推定するための有効な情報を取得できることである。即ち、システムは、ユーザが、どのような情報を組み合わせて、ファイル名を作成しているかを示す情報を取得できるためである。ユーザが全て手動でファイル名を入力した場合は、どのような情報を組み合わせてファイル名を作成したかという情報を得ることができない。またOCRの結果の文字列ブロックと、任意の文字列だけを利用できる場合は、ユーザ名などのメタ情報を任意の文字列として入力する必要があるため、ルール推定の際に「メタ情報」であると認識するのが難しくなる。つまり、図7のように、ファイル名の構成要素をユーザが選択することにより、ファイル命名ルールの推定精度を向上させることが可能となる。図7は、あくまでも一例であり、他のファイル名の構成要素をユーザが選択できるようにしてもよい。本実施形態1では、以上説明したようなUI画面を用いて、ユーザはファイルの命名を行う。
再び図2に戻ってS205に進みCPU105は装置制御部102として機能し、S204で決定されたファイル名をその画像データに付与する。そしてネットワーク150を介して、ユーザインターフェース104を通じたユーザからの指示に基づく適切な格納先に、その画像データをそのファイル名で格納する。そしてS206に進みCPU105は、ファイルの命名の結果をファイル命名装置120に送信する。ここで送信する情報は、最終的に決定されたファイル名、ファイル名に利用したOCRの文字列ブロックの情報、OCRの文字列ブロックの文字列を、画像処理装置100ユーザが修正した情報等を含む。またファイル名に利用した日付などのメタ情報に関する情報、ユーザが入力した任意の文字列の情報等も含まれる。また推奨されたファイル名が存在した場合には、その名前が、そのままファイル名として利用されたかどうかの情報も含まれる。これに関しては詳しく後述する。
次に実施形態1に係るファイル命名装置120における処理を説明する。
図3は、実施形態1に係るファイル命名装置120による画像データのファイルの命名のための情報を生成する処理を説明するフローチャートである。このフローチャートで示す処理は、画像処理装置100から画像データを受信することにより開始される。尚、このフローチャートで示す処理は、CPU127が記憶部129からRAM128に展開したプログラムを実行することにより達成される。
まずS301でCPU127は装置制御部122として機能し、ネットワーク150を介して画像処理装置100から画像データを受信する。受信した画像データは記憶部129に格納する。次にS302に進みCPU127はOCR部124として機能し、その画像データを記憶部129から読み出してRAM128に展開し、その展開した画像データにOCR処理を行い、認識された文字列ブロックの情報を出力する。ここでの文字列ブロックの情報は、文字列ブロックの位置、文字列ブロックのサイズ、文字列ブロックに含まれる文字列を含んでいる。次にS303に進みCPU127はマッチング部125として機能し、その画像データの特徴量を抽出する。ここで抽出する特徴量は、公知の画像特徴量でも良いし、OCRで得られた文字列ブロックの情報でもよい。こうして得られた画像データの特徴量を文字列ブロックの情報とセットにして記憶部129に保存する。
次にS304に進みCPU127はマッチング部125として機能し、S204で得られた特徴量と、過去の画像データの特徴量とのマッチング処理を行う。ここでのマッチング処理は、特徴量に合わせたマッチング処理を行えばよい。例えば、SIFT等の局所特徴量を利用している場合は、2つ画像データに含まれる局所特徴量群同士のマッチングを行い、その一致した個数を、その2つの画像データの一致度とすればよい。また文字列ブロックの情報を特徴量とする場合は、2つの画像データに含まれる文字列ブロックの重なり具合を一致度とすればよい。この重なり具合は、例えばJaccard index等が利用可能である。尚、ここでのマッチング方法は、これらに限定されず、適切な公知の手法が利用可能である。
次にS305進みCPU127はマッチング部125として機能し、S304で算出した過去の画像データとのマッチング度を評価し、過去に類似した画像データがあったかどうかを判定する。ここで類似した画像データがあったと判定すると、類似した過去の画像データと同じ画像クラスタIDを割り当ててS306に処理を進める。ここで、画像クラスタIDとは、類似した画像データをグループ化して管理するためのID(識別情報)である。グループ化するのは、類似した画像データは、同一のファイル命名ルールを採用している可能性が高いためである。ここでのファイル命名ルールの管理は、この画像クラスタIDの単位で行う。一方、S305で類似した画像データがないと判定した場合は、その画像データに新規の画像クラスタIDを割り当ててS310に遷移する。
S306でCPU127はファイル名推定部126として機能し、その画像データに割り当てられた画像クラスタIDに紐づいたファイル命名ルールを選択する。次にS307に進みCPU127はファイル名推定部126として機能し、S306で選択したファイル命名ルールに基づいて、その画像データに対する推奨ファイル名を生成する。
図8は、実施形態1に係るファイル命名ルールを説明する図である。
ここで、ファイル命名ルールは、例えば、図8(1)のようなものとなる。図8の(1)は、ファイル名のテンプレートとなっている。このテンプレートは、図7のUIで表示されている内容(区切り文字指定707,708で「_」を選択したとする)で、ユーザがファイル名を決定した際に生成されるテンプレートとなる。そして、<>で囲まれた項目が、画像データごとにルールに従って置き換わる部分となり、図7のUI画面のフィールドに対応している。即ち、図7のフィールド701が、テンプレートの<OCR領域1>801に対応している。ここで、置き換え対象となっているOCR領域1は、ユーザがフィールド701と関連付けている文字列ブロック501である。また図7のフィールド702は、テンプレートの<OCR領域2>802に対応している。ここで、置き換え対象となっているOCR領域2は、ユーザがフィールド702と関連付けている文字列ブロック503である。更に、図7のフィールド703がテンプレートの<日付>803に対応している。ここで、置き換え対象が「日付」となっているのは、図7でユーザが、フィールド703と「日付」のメタ情報を示す日付ボタン710とを関連付けたためである。それ以外の部分である「_」は、区切り文字指定に対応している。図7の区切り文字指定707は、テンプレートの「_」804に対応し、図7の区切り文字指定708は、テンプレートの「_」805に対応している。また「.pdf」は、図7では図示されていないファイルの拡張子となる。続いて、それぞれの<>部分の置き換えルールについて説明する。
<OCR領域1>は、画像データの特定の文字列ブロック内の文字列で置き換えることを意味する。そのルールの例を図8(2)に示している。
図8(2)の810は、OCR領域1のサブルールIDを示している。サブルールIDは、ルールが更新されるたびにインクリメントされ、サブルールの履歴の管理に利用される。811は、類似画像データにおける文字列ブロックIDである。ここでは、過去の類似画像データのOCR領域1が、文字列ブロックID「0001」であることを意味している。この情報を利用するために、まず処理対象の画像データの文字列ブロックについて、過去の画像データの文字列ブロックIDとの対応付けを行い、処理対象の画像データの文字列ブロックに文字列ブロックIDを割り当てる。この対応する領域の決定は、文字列ブロックの位置の類似性、OCR結果の文字列の類似性等を利用して行う。
処理対象の画像データにおけるOCR領域1(文字ブロックID「0001」)が決定されると、処理対象の画像データのOCR領域1に含まれるOCR結果の文字列に対して、ルールで定められた所定の処理を加えてファイル名に含まれる文字列とする。そのルールの例を、図8(2)のOCR設定812で示す。この場合、OCR設定812で、文字列が固定文字列「注文書」であると定義されている。このため、OCR結果の文字列に依存せず、固定的に「注文書」という文字列を出力する。これは、過去の類似した画像データのファイルの命名結果から、この部分は可変的な文字列が入らず、固定文字列「注文書」であるとルールを推定したためである。そのため、OCR領域1はOCRの精度に依存しないことになる。
図8(3)は、<OCR領域2>のサブルールを示している。OCR領域1のサブルールとの相違点は、文字列ブロックID820とOCR設定821である。OCR領域2は、文字列ブロックID820で示すように文字列ID「0003」と対応しているため、処理対象の画像データにおける文字ブロックID「0003」の文字列ブロックの文字列が、置き換え対象の文字列となる。そして、更にその処理対象の文字列に対して、OCR設定821を適用する。ここで適用するOCR設定821は、末尾の文字列「 御中」を除去することである。つまり「株式会社西取手白山商会 御中」を「株式会社西取手白山商会」に変更するように設定している。
図8(4)は、<日付>のサブルールを示す。<日付>は、詳細ルールで定義される日付でファイル名に使用されることを意味する。例えば、図8(3)では、830で定義されているように、画像データがスキャンされたときの日付を「YYYYMMDD」の形式に変換して、ファイル名で使用するように設定されている。従って、この例では、2016年07月25日が「20160725」に変換される。
図8(5)は、以上説明したルールを、図7で表示されている画像データに適用した際に生成されるファイル名を示している。ここでは、単純にユーザが適用したファイル名が再生成されるだけであるが、他の同一の画像クラスタIDを持つ類似画像データが入力された場合であっても、同じルールが適用され、生成されたファイル名が推奨されることとなる。
図9は、実施形態1に係る別のファイル命名ルールの詳細を説明する図である。ここでは別のファイル命名ルールの例を、図9を参照して図8と異なる部分について説明する。
図9(1)は、図8(1)と同様に、ファイル名のテンプレートであり、OCR領域、日付、任意の文字列、及びユーザ名の4つからなる。ここでは、図9(1)に対応するUIは図示しないが、図7に比べて区切り文字指定を1つ、フィールドを1つ増やし、各フィールドの対応を変更したものとなる。それぞれの領域のサブルールを図9(2)〜(5)で示している。
図9(2)は、<OCR領域1>の詳細ルールを示す。OCR領域1のOCR結果である文字列は、OCR設定901において、末尾の「 日付」という文字列を削除した9文字の文字列に修正するように定義されている。ここではOCRにおける文字種の指定はない。そして、過去の類似した画像データのOCRの誤変換履歴から、文字毎の誤変換の訂正ルールが902に定められており、ここでは「E」が「3」に修正される。この訂正ルールについては、ユーザの文字列の修正履歴から生成できる。
実際に、図9(2)のルールを適用した例を図9(6)で示す。ここでは元々のOCRの結果として、OCR領域1に含まれる文字列が「注文番号R23E2 日付」であり、正しい文字列が「注文番号R2332」であったとする。この場合、OCR設定901を適用して固定文字列「 日付」を削除する。これにより元々のOCR結果に含まれる文字列905が、文字列「注文番号R23E2」906に修正される。ここではOCRの文字種の指定がないため、再びOCR処理を行ったり、OCR結果を修正することはしない。次に、個別文字の誤変換の訂正ルール902が適用されて、文字列「注文番号R2332」907に修正される。
このようにして、単純なOCR結果に対して、詳細なルールを適用することにより、OCRの結果に間違いがあった場合であっても、正しい文字列に修正できる。このためには、適切な詳細なルールを推定することが重要となる。ルール推定の詳細については後述する。
<日付>は、図9(3)の詳細ルールで定義される日付で、ファイル名に追加されることを意味する。これは、図8(3)と同様である。
<任意文字列>は、図9(4)の詳細ルール903で定義される文字列でファイル名に追加されることを意味する。この文字列は、ユーザが過去の類似した画像データにおいて定義した文字列である。図9(4)の例では、詳細ルール903で定義されるように「担当者」という文字列で置き換える。尚、類似した画像データで、ユーザが定義する文字列が固定化されていない場合には、ここでのルールが不明となる。この場合には、ファイル名の他の部分をユーザに推奨し、この部分については、UI上で画像データごとにユーザが入力するようにしても良い。
<ユーザ名>は、図9(5)の詳細ルール904で定義されるユーザ名でファイル名に追加されることを意味する。図9(5)の例では、詳細ルール904で定義されるように、LDAP(Lightweight Directory Access Protocol)サーバにログイン名で問い合わせ、実際の人名を取得して利用する。尚、LDAPサーバに問い合わせを行わずに、ログイン名そのままを利用して良い。
以上で説明したような変換を行うことにより、例えば、図9(1)のファイル名のテンプレートに基づいて、図9(7)に示すように、画像データのファイル名に変換される。そして、こうして作成されたファイル名が、推奨されるファイル名となる。この推奨されるファイル名は、ルールの曖昧性があって複数の可能性がある場合や、複数のルールがある場合は、複数のファイル名となる場合がある。
再び図3に戻ってS308に進みCPU127は、ファイル命名部123で生成された推奨ファイル名及び、それに関連するUI画面に必要な情報を、ネットワーク150を介して画像処理装置100に送信する。ここで送信する情報は、前述したように、画像データのOCR結果及び推奨ファイル名に関する情報である。図7の例であれば、ファイル名のテンプレートに関する情報と、実際に置き換えられて生成されたファイル名、過去の画像データのOCR領域と関連付けられた文字列ブロックに関する情報である。ここでいう関連付けは、文字列ブロックIDを過去の類似した画像データと共通にすることを意味する。
次にS309に進みCPU127は装置制御部122として機能し、画像処理装置100より、ネットワーク150を介して、ファイルの命名結果に関する情報を受信して記憶部129に保存する。ここで受信する情報は、推奨されたファイル名が実際のファイル名に利用されたかどうかの情報、最終的に決定されたファイル名、ファイル名に利用したOCRの文字列ブロックの情報、OCRの文字列ブロックの文字列をユーザが修正した情報等を含む。また、ファイル名に利用した日付などのメタ情報に関する情報、ユーザが入力した任意文字列の情報等も含まれる。
次にS305からS310に遷移した際の処理を説明する。
まずS310でCPU127は装置制御部122として機能し、UI表示に必要な情報を、ネットワーク150を介して画像処理装置100に送信する。この処理では、推奨するファイル名が存在しないため、それ以外の情報を送信する。OCRの文字列ブロックの情報である文字列ブロックIDについては、対応付けする過去の類似画像データがないため、新規にIDを割り振っておく。尚、ユーザの操作から推定された推奨ファイル名は存在しないが、デフォルトのファイル名のテンプレートに基づく推奨ファイル名を送信するようにしてもかまわない。
次にS311に進みCPU127は装置制御部122として機能し、画像処理装置100より、ネットワーク150を介して、ファイルの命名結果に関する情報を受信して、記憶部129に保存する。ここで受信する情報は、推奨されたファイル名を利用したかの情報を除いてS309と同様である。
こうしてS309或いはS311を実行するとS312に進みCPU127はファイル名推定部126として機能し、ファイル命名ルールを更新する。処理対象の画像データと同一の画像クラスタIDを持つ画像データが十分にあり、ファイル名推定部126が推奨したファイル名が、ユーザにそのまま利用された場合には、十分な精度のファイル命名ルールがあることになる。そのような場合は、S312でファイル命名ルールを更新しなくても良い。
それ以外の場合はS309或いはS311で新しく得られたデータを利用して、記憶部129から既存のファイル命名ルールを読み込み、そのファイル命名ルールを更新する。このとき既存のファイル命名ルールがない場合は、新規にファイル命名ルールを作成する。このファイル命名ルールの更新は、ファイル名推定部126において、同一の画像クラスタIDを持つ画像データ群の最終的なファイル名を共通して推定可能なルールを探索することにより行う。こうしてCPU127は、新規作成、或いは更新されたファイル命名ルールを記憶部129に保存する。
図8で説明したようなテンプレートの概念を持ち、新規の画像クラスタIDである場合は、ファイル名のテンプレートを推定する。これは前述した図7のようなUIを用意しておけば、ユーザが設定した内容が、そのままファイル名のテンプレートとなる。そして、それぞれのテンプレートの要素ごとの詳細なルールの推定を行う。その場合は、1つの画像データしかないので、共通したルールの推定が難しいため、ユーザが設定した内容そのまま用いても良い。
尚、UIの制約上、ファイル名のテンプレートを構成するための情報が欠落している場合には、ファイル名のテンプレート自体の推定が必要であり、画像データの枚数がないとより精度の高い推定ができない。そのような場合には、画像データが増加する度に、ファイル名のテンプレートを推定する。これは、ファイル名が、どのような構成要素から構成されているかという推定である。
一方、新規でない場合には、ファイル名のテンプレートの、それぞれのテンプレートの詳細なルールを更新する。
図9(1)のファイル名のテンプレートの<OCR領域1>の詳細なルールの更新の例を図10を参照して説明する。
図10は、実施形態1に係る図9の<OCR領域1>のルールの更新の一例を説明する図である。
まず、図10(1)は、OCR領域1の現在の詳細ルールを示す。このルールは、図9(2)のルールと同様である。このルールを適用した結果を図10(2)に示す。
ここで、画像クラスタID1001は、類似した画像データを表現するためのIDであり、類似した画像データには同一のIDが割り振られる。画像ID1002は、画像データ固有のIDである。画像ID1003が示す「53」は、最終的な詳細ルール1004を適用した後の文字列「注又番号丁2020」と、ユーザ修正結果1005で示すユーザが最終的に修正した文字列「注又番号丁2020」とが異なっている。
ここで、3つの画像データの共通したルールを推定する。まず3つの画像は、1005〜1007で示されているように、全て「注文番号」という文字列を持つ。そして、画像ID「53」については、ユーザ修正結果1005で示すように、ユーザが修正処理を行って「注文番号T2020」にしているため、「注文番号」が固定文字列である可能性が高い。そこで「注文番号」が固定文字列であるというルールを追加する。また画像ID「53」の例で、ユーザ修正結果1004と1005の文字列を比較すると、ユーザが「丁」の文字列を「T」に修正しているため、その変換ルールも追加する。その結果生成されたルールが、図10(3)である。
図10(3)では、図10(1)のOCR設定ルールに、1008で示すように、固定文字列「注文番号」が追加されている。また個別誤変換訂正ルール1009で示すように、「丁」を「T」に修正するルールが追加されている。このルールを適用した場合に想定される結果を図10(4)に示す。これにより画像ID「53」においても、ユーザ想定修正結果1010で示すように、ユーザによる修正が不要になっている。
このルールは、画像データの増加に伴い、より信頼性のあるルールへ継続して更新していくことが可能である。例えば、画像クラスタIDが「3」である画像データがさらに増加し、図11(1)のようなOCR領域3についての情報を持つ画像データが追加された場合を考える。
この時点では、図10(3)のルールが適用されており、ユーザ修正結果1101及び1102を見ると、画像ID「65」「70」はユーザによる修正がない。一方、ユーザ修正結果1103を見ると、画像ID「81」にはユーザによる修正が行われている。ユーザ修正結果1103と、個別変換訂正ルール適用の文字列1104を比較すると、ユーザによる修正は「q」の「9」への変更、及び「I」から「1」への変更である。そこで、この変換ルールを新しくルールに追加することも考えられる。しかしながら、過去の画像クラスタIDが同一の「3」である画像データの全てにおいて、この部分が4桁の数字列であることを考慮して、この部分は4桁の数字列であるというルールを追加する。これが、図11(2)のOCR設定ルール1106である。その際に、過去に追加したルールである「E」を「3」に変換するというルールは、追加した数字限定に含まれるため除去する。これが図11(2)の個別誤変換訂正ルール1107である。このような複雑なルールを、ユーザが手動で最初から指定すると、ユーザ負荷は非常に大きくなる。またUIも複雑なものとなり、操作性も低下する。しかしながら、ユーザの修正した操作内容の履歴に従って、このようにルールを変更、追加することにより、ユーザの負担を少なくして命令ルールを、より最適なものに更新することができる。
その結果、更新されたルールである図11(2)を、図11(1)の画像データに適用した場合に想定される結果を図11(3)に示す。図11(3)の画像ID「81」のユーザ想定修正結果1109において、ユーザによる修正が想定されず、より良いルールとなっていることが分かる。
このような形で、ルールの更新を続けていき、最終的に、図11(4)に示すようなルールとなることが想定される。図11(2)の1108で示すサブルールID「3」が、図11(4)の1110で示すサブルールID「4」に更新され、更に、1111で示すサブルールID「5」に更新されている。サブルールID5のルールであるOCR設定1112は、OCR結果に対する多くの限定により、OCR結果が間違っていたとしても、高い確率で、自動的に文字認識結果を修正できるルールとなっている。またOCR設定1112で具体的に行う処理は、先頭文字列の固定文字列「注文番号」への変換、2種類(TもしくはR)の文字種に限定した1文字の文字認識、数字だけに限定した4文字の文字認識、固定文字列「 日付」の除去である。
これは図9(2)に示す初期のOCR設定901に比べて、はるかに複雑で、文字認識の誤りに対する耐性が向上していることが分かる。このようなルールを推定するために必要な画像データの数は、OCR設定901を推定したときに比べて多くなる。
どのルールが適用可能かどうかは、予め可能性のある基本ルールを保持しておき、それらを対象の画像クラスタID用にカスタマイズして適用して、各ルールの有用性を判断すればよい。複数のルールが有用である場合には、同一の画像クラスタIDの画像データの数に応じて、どのルールを選択するかを判断する。画像データの数が少ない場合に、汎用性のあるルールを選択すると、間違いが多く生じる可能性がある。そこで、画像データの数が少ない場合には、限定的なルールを選択する。そして、段階的に汎用的なルールを適用することにより対処できる。図9〜図11の例においても、そのような方針でルールを選択している。
このような形で、複数の同一の画像クラスタIDをもつ画像データのルールを利用することにより、より複雑なファイル名を推定できる命名ルールに更新でき、そのルールを使用することにより、より、ユーザが所望するファイル名を提示できるようになる。尚、ここで、説明したルールの更新方法はあくまでも一例であり、例えば、確率モデルを導入し、文字列の生起確率に基づくルールを導入する等の方法を利用しても構わない。
以上説明したように実施形態1によれば、ユーザが通常のファイルの命名操作を繰り返して行うだけで、ファイル命名ルールを自動的に学習し、ユーザにとって、より適切なファイル名の推奨することができる。これにより、ファイル名を決定するルールを設定するユーザの負荷を大きく軽減できる。
[実施形態2]
以下、本発明の実施形態2について、前述の実施形態1と異なる部分について説明する。実施形態1との差分は、図3のフローチャートであるため、図12フローチャートを参照して説明する。よって、実施形態2に係る画像処理装置100及びファイル命名装置120の構成及びこれらを含むシステムは前述の実施形態1と同じであるため、その説明を省略する。
図12は、実施形態2に係るファイル命名装置120による画像データのファイルの命名のための情報を生成する処理を説明するフローチャートである。このフローチャートで示す処理は、画像処理装置100から画像データを受信することにより開始される。尚、このフローチャートで示す処理は、CPU127が記憶部129からRAM128に展開したプログラムを実行することにより達成される。尚、図12において、前述の図3と共通する処理は同じ符号で示し、それらの説明を省略する。但し、実施形態2では、S305において、複数のマッチング度が高い類似した画像データがあった場合には、複数の画像クラスタIDを処理対象の画像データに割り当ててもよいとする。複数の画像クラスタIDが割り当てられた場合には、S306〜S309の処理は、それぞれの画像クラスタIDに対して行われる。
こうしてS309からS1201に進むとCPU127は装置制御部122として機能し、記憶部129に保存されたファイルの命名結果に関する情報を読み出す。そして、推奨されたファイル名が、実際のファイル名に利用されたかどうかを判定する。ここで推奨されたファイル名が実際のファイル名に利用されなかったと判定すると、画像クラスタIDが誤って割り振られた可能性があるためS1203に遷移する。また複数の推奨されたファイル名が存在する場合で、全ての推奨されたファイル名のいずれも実際のファイル名に利用されなかった場合にはS1203に遷移する。また1つでも、推奨されたファイル名が実際のファイル名に利用された場合はS1204に遷移する。
またS311からS1202に遷移した場合、CPU127は装置制御部122として機能し、記憶部129に保存されたファイルの命名結果、及び既存のファイル命名ルールに関する情報を読み出す。そして、既存のファイル命名ルールを処理対象の画像データに適用し、ユーザによって決定されたファイル名が生成することが可能な命名ルールが存在するか探索する。この探索の結果、ユーザによって決定されたファイル名が生成できる命名ルールが存在した場合には、画像クラスタIDが誤って割り振られた可能性があるためS1203に遷移する。ユーザによって決定されたファイル名を生成できる命名ルールが存在しなかった場合はS1204に遷移する。S1203でCPU127はファイル名推定部126として機能し、誤った画像クラスタIDが割り振られた可能性を検証し、必要であれば、画像クラスタIDの再割り当てを行う。ここでS1201からS1203に遷移した場合には、既存のファイル命名ルールが適切でない可能性と、画像データに割り当てられた既存の画像クラスタIDが適切ではない可能性がある。両者のどちらかであるかを切り分けるために、図3のS312と同等の処理を行い、処理対象の画像データのファイル名を適切につけることができるファイル命名ルールに更新できるかどうか検証する。複数の推奨されたファイル名が存在する場合には、全ての画像クラスタIDごとに検証を行う。この検証の結果、ファイル命名ルールの更新ができた場合には、既存のファイル命名ルールが適切でないだけであり、画像クラスタIDに問題はなかったことになる。ここで、ファイル命名ルールの更新が出来なかった画像クラスタIDについては、処理対象の画像データとの紐づけを削除する。こうすることにより、次回以降は、処理対象の画像データに類似した画像は、今回の処理対象の画像とマッチングし、削除されなかった画像IDのみが紐づくため、ユーザが求めるファイル名を推奨する可能性を向上させることが可能となる。
逆に、全てのファイル命名ルールを更新できなかった場合には、既存のファイル命名ルールの問題ではなく、画像クラスタIDに問題があったことになる。これは、例えば、類似しているが、異なるルールを持つ画像データが新規に入力されたときに生じる。その場合には、処理対象の画像データに紐づいている既存の画像クラスタIDを全て削除し、新規の画像クラスタIDを処理対象の画像データに割り当てる。
またS1202からS1203に遷移した場合には、S1202で探索されたユーザによって決定されたファイル名が生成することが可能な命名ルールに紐づいた画像クラスタIDを、処理対象の画像データに割り当てる。
このS1203の画像クラスIDの再割り当てにより、誤った画像クラスタIDが処理対象の画像データに割り当てられた場合でも、それを修正することができる。このように画像クラスタIDの修正が可能であるため、S305における類似の画像データがあったかどうかの閾値が適切でなかった場合でも、正常な動作を保つことが可能となる。また、類似した画像データが多い状況であっても、正常な動作を保つことが可能となる。
そしてS1203からS1204に進みCPU127はファイル名推定部126として機能し、ファイル命名ルールを更新する。ここでの処理は基本的に図3のS312と同様であるため、差異がある部分についてのみ説明を行う。
S1201からS1204に遷移した場合には、複数の推奨ファイル名があった場合でも、実際のファイル名に利用された推奨ファイル名に紐づいた画像データのみが処理対象となる。ここで、処理対象とならなかった画像IDについては、処理対象の画像データとの紐づけを削除する。こうすることにより、S1203における処理と同様に、ユーザが求めるファイル名を推奨する可能性を向上させることが可能となる。一方、S1203からS1204に遷移した場合には、新しく割り当てられた画像ID及び、S1203において、ファイル命名ルールを更新することができ画像IDが処理対象となる。またS1202からS1204に遷移した場合には、処理対象の画像IDは1つしか存在しないため、そのIDの画像データが処理対象となる。このように、特定の画像クラスタIDだけを処理対象とすることにより、複数の画像データとのマッチングを許容しても、適切なファイル名の推定ルールを更新することができる。次にS1205に進みCPU127は装置制御部122として機能し、過去の画像データのうち、所定の年月を経過した原稿の画像データに対して、ファイル命名ルールを推定する際の対象からの除去や重み付けの低下を行う。または、マッチング対象から除去する。こうすることにより、ファイル命名ルールが切り替わり、既に利用されていないファイル命名ルールが推奨されることを防ぐことが可能となる。
以上説明したように実施形態2によれば、処理対象の画像データと過去の画像データとのマッチングが誤った際にも、適切にファイル名の命名ルールを更新することができる。それにより、それ以降に誤ってマッチングされる可能性を低下させることが可能となる。また、複数のファイル名を推奨する際にも、適切にファイル名の命名ルールを更新することが可能になる。更に、ファイル命名ルールが切り替わった場合にも、適切なファイル名を推奨することが可能となる。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は上記実施形態に制限されるものではなく、本発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために、以下の請求項を添付する。
100…画像処理装置、105…CPU、110…表示部、120…ファイル命名装置、124…OCR部、125…マッチング部、126…ファイル名推定部、127…CPU、130…表示部

Claims (13)

  1. 原稿の画像データを取得する取得手段と、
    前記画像データのファイル名を作成する命名ルールに従って、前記取得手段により取得した画像データのファイル名を作成する作成手段と、
    ユーザの指示に応じて前記命名ルールを変更する変更手段と、
    前記変更手段により変更された前記命名ルールを、対応する画像データの識別情報とともに記憶する記憶手段と、
    前記取得手段により取得した前記画像データに類似する画像データの命名ルールが前記記憶手段に記憶されているかどうか判定し、記憶されているときは当該類似する画像データの命名に使用した命名ルールを使用して、前記取得手段により取得した前記画像データのファイル名をユーザに提示する提示手段と、
    を有することを特徴とする画像処理装置。
  2. 前記取得手段により取得した前記画像データに含まれる文字を認識する文字認識手段を更に有し、
    前記作成手段は、前記文字認識手段により認識された文字を含むファイル名を作成することを特徴とする請求項1に記載の画像処理装置。
  3. 前記命名ルールは、前記文字認識手段が文字認識を行う前記画像データの位置、文字の種類の情報を含むことを特徴とする請求項2に記載の画像処理装置。
  4. 前記変更手段は、ファイル名のテンプレートの項目に対して、前記文字認識手段により認識された文字、固定文字列、ユーザの名称、日付、任意の文字列の少なくともいずれかを割り当てた命名ルールを生成するための画面を表示し、当該画面を介したユーザの操作を受け付けることにより前記命名ルールを変更することを特徴とする請求項2又は3に記載の画像処理装置。
  5. 前記変更手段による前記命名ルールの変更は、固定文字列の除去を含むことを特徴とする請求項2又は3に記載の画像処理装置。
  6. 前記画面は更に、前記テンプレートの項目の追加、前記項目の区切り文字を指定及び変更するユーザの操作を受け付けることを特徴とする請求項4に記載の画像処理装置。
  7. 前記ファイル名は、前記取得手段により前記画像データを取得した日付、ユーザの名称の少なくともいずれかを含むことを特徴とする請求項1乃至6のいずれか1項に記載の画像処理装置。
  8. 前記変更手段は、前記提示手段により提示したファイル名と、ユーザが最終的に決定したファイル名との差分に応じて前記命名ルールを変更することを特徴とする請求項1に記載の画像処理装置。
  9. 前記取得手段により取得した前記画像データに類似する画像データは、前記文字認識手段により認識された前記画像データと前記類似する画像データに含まれる文字列の重なり具合に基づいて決定されることを特徴とする請求項2に記載の画像処理装置。
  10. 前記提示手段は、前記類似する画像データをグループ化し、同じグループに対して同一の命名ルールを採用することを特徴とする請求項1乃至9のいずれか1項に記載の画像処理装置。
  11. 前記取得手段は、前記原稿を光学的に読み取って前記原稿の画像データを取得することを特徴とする請求項1乃至10のいずれか1項に記載の画像処理装置。
  12. 画像処理装置を制御する制御方法であって、
    原稿の画像データを取得する取得工程と、
    前記画像データのファイル名を作成する命名ルールに従って、前記取得工程で取得された画像データのファイル名を作成する作成工程と、
    ユーザの指示に応じて前記命名ルールを変更する変更工程と、
    前記変更工程で変更された前記命名ルールを、対応する画像データの識別情報とともにメモリに記憶する記憶工程と、
    前記取得工程で取得した前記画像データに類似する画像データの命名ルールが前記メモリに記憶されているかどうか判定し、記憶されているときは当該類似する画像データの命名に使用した命名ルールを使用して、前記取得工程で取得した前記画像データのファイル名をユーザに提示する提示工程と、
    を有することを特徴とする画像処理装置の制御方法。
  13. コンピュータを、請求項1乃至11のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
JP2017014513A 2017-01-30 2017-01-30 画像処理装置とその制御方法、及びプログラム Active JP6881990B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2017014513A JP6881990B2 (ja) 2017-01-30 2017-01-30 画像処理装置とその制御方法、及びプログラム
KR1020180009124A KR102247606B1 (ko) 2017-01-30 2018-01-25 화상처리장치, 그 제어 방법, 및 기억매체
EP18153735.8A EP3355211A1 (en) 2017-01-30 2018-01-26 Image processing apparatus, control method therefor, and storage medium
US15/881,482 US10706276B2 (en) 2017-01-30 2018-01-26 Image processing apparatus, control method therefor, and storage medium
CN201810082808.7A CN108377308B (zh) 2017-01-30 2018-01-29 图像处理装置及其控制方法和存储介质
US16/906,988 US11600090B2 (en) 2017-01-30 2020-06-19 Image processing apparatus, control method therefor, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017014513A JP6881990B2 (ja) 2017-01-30 2017-01-30 画像処理装置とその制御方法、及びプログラム

Publications (3)

Publication Number Publication Date
JP2018124656A true JP2018124656A (ja) 2018-08-09
JP2018124656A5 JP2018124656A5 (ja) 2020-02-27
JP6881990B2 JP6881990B2 (ja) 2021-06-02

Family

ID=61054266

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017014513A Active JP6881990B2 (ja) 2017-01-30 2017-01-30 画像処理装置とその制御方法、及びプログラム

Country Status (5)

Country Link
US (2) US10706276B2 (ja)
EP (1) EP3355211A1 (ja)
JP (1) JP6881990B2 (ja)
KR (1) KR102247606B1 (ja)
CN (1) CN108377308B (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019113987A (ja) * 2017-12-22 2019-07-11 株式会社Pfu ファイル管理装置、ファイル管理方法、及びプログラム
JP2020030648A (ja) * 2018-08-23 2020-02-27 株式会社Pfu ファイル管理装置、ファイル管理方法、及びプログラム
JP2020149409A (ja) * 2019-03-14 2020-09-17 セイコーエプソン株式会社 情報処理装置、機械学習装置および情報処理方法
JP2020178280A (ja) * 2019-04-19 2020-10-29 キヤノン株式会社 スキャン画像にプロパティを設定するための画像処理装置、その制御方法及びプログラム
CN112866628A (zh) * 2019-11-28 2021-05-28 浙江宇视科技有限公司 图像采集器名称确定方法、装置、服务器及存储介质
JP2021087072A (ja) * 2019-11-26 2021-06-03 京セラドキュメントソリューションズ株式会社 情報処理装置
JP2021107977A (ja) * 2019-12-27 2021-07-29 富士フイルムビジネスイノベーション株式会社 文書管理装置、及び文書管理プログラム
US11252287B2 (en) 2019-04-19 2022-02-15 Canon Kabushiki Kaisha Image processing apparatus that displays guidance for user operation, control method thereof and storage medium
US11265431B2 (en) 2019-04-19 2022-03-01 Canon Kabushiki Kaisha Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
US11330119B2 (en) 2019-04-23 2022-05-10 Canon Kabushiki Kaisha Information processing apparatus, control method and storage medium
US11463594B2 (en) 2019-04-19 2022-10-04 Canon Kabushiki Kaisha Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
US11620844B2 (en) 2019-09-30 2023-04-04 Canon Kabushiki Kaisha Image processing apparatus, control method of image processing apparatus, and storage medium
JP7520563B2 (ja) 2020-01-21 2024-07-23 キヤノン株式会社 文書を電子化するための画像処理システム、その制御方法及びプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11477332B2 (en) 2020-03-30 2022-10-18 Canon Kabushiki Kaisha Information processing apparatus and control method thereof setting a rule for property information to be used during storage
JP6752864B2 (ja) 2018-11-20 2020-09-09 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US11228687B2 (en) * 2020-01-21 2022-01-18 Canon Kabushiki Kaisha Image processing system that computerizes document, control method thereof, and storage medium
CN111291208B (zh) * 2020-05-09 2020-11-10 支付宝(杭州)信息技术有限公司 前端页面元素的命名方法、装置及电子设备
JP2022019446A (ja) * 2020-07-17 2022-01-27 キヤノン株式会社 画像処理システム、装置、方法、プログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005275849A (ja) * 2004-03-25 2005-10-06 Canon Inc 文書処理装置および文書処理方法
JP2006072892A (ja) * 2004-09-06 2006-03-16 Oki Data Corp 画像処理装置
JP2009182794A (ja) * 2008-01-31 2009-08-13 Brother Ind Ltd 画像読取装置、画像読取方法及び読取制御プログラム
JP2009205325A (ja) * 2008-02-27 2009-09-10 Seiko Epson Corp ファイル生成装置、ファイル生成方法およびファイル生成プログラム
JP2009271831A (ja) * 2008-05-09 2009-11-19 Sharp Corp 画像データ処理装置
JP2016143165A (ja) * 2015-01-30 2016-08-08 株式会社Pfu 情報処理装置、方法およびプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8332370B2 (en) * 2006-05-09 2012-12-11 Hewlett-Packard Development Company, L.P. Maintaining commonly named client-specific file content in hard disk drive emulation
JP4590433B2 (ja) * 2007-06-29 2010-12-01 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP6051827B2 (ja) * 2012-12-07 2016-12-27 株式会社リコー 文書処理装置、画像処理装置、文書処理方法及び文書処理プログラム
JP4940270B2 (ja) 2009-07-06 2012-05-30 シャープ株式会社 画像形成装置
US9307025B1 (en) * 2011-03-29 2016-04-05 Riverbed Technology, Inc. Optimized file creation in WAN-optimized storage
JP6427964B2 (ja) 2013-11-28 2018-11-28 株式会社リコー 画像処理システム、情報処理装置及びプログラム
JP6368195B2 (ja) * 2014-08-28 2018-08-01 キヤノン株式会社 情報処理装置とその制御方法、及びプログラム
JP6482361B2 (ja) * 2015-04-09 2019-03-13 キヤノン株式会社 原稿読取装置、原稿読取装置の制御方法、プログラム、及び記憶媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005275849A (ja) * 2004-03-25 2005-10-06 Canon Inc 文書処理装置および文書処理方法
JP2006072892A (ja) * 2004-09-06 2006-03-16 Oki Data Corp 画像処理装置
JP2009182794A (ja) * 2008-01-31 2009-08-13 Brother Ind Ltd 画像読取装置、画像読取方法及び読取制御プログラム
JP2009205325A (ja) * 2008-02-27 2009-09-10 Seiko Epson Corp ファイル生成装置、ファイル生成方法およびファイル生成プログラム
JP2009271831A (ja) * 2008-05-09 2009-11-19 Sharp Corp 画像データ処理装置
JP2016143165A (ja) * 2015-01-30 2016-08-08 株式会社Pfu 情報処理装置、方法およびプログラム

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019113987A (ja) * 2017-12-22 2019-07-11 株式会社Pfu ファイル管理装置、ファイル管理方法、及びプログラム
US11221988B2 (en) 2017-12-22 2022-01-11 Pfu Limited File management device and file management method for presuming naming rule of file names
US11182343B2 (en) 2018-08-23 2021-11-23 Pfu Limited File management device and file management method and non-transitory computer readable medium
JP2020030648A (ja) * 2018-08-23 2020-02-27 株式会社Pfu ファイル管理装置、ファイル管理方法、及びプログラム
JP7102284B2 (ja) 2018-08-23 2022-07-19 株式会社Pfu ファイル管理装置、ファイル管理方法、及びプログラム
JP2020149409A (ja) * 2019-03-14 2020-09-17 セイコーエプソン株式会社 情報処理装置、機械学習装置および情報処理方法
US11575799B2 (en) 2019-04-19 2023-02-07 Canon Kabushiki Kaisha Image processing apparatus for setting property including character strings and separators to scanned image, control method thereof and storage medium
US11463594B2 (en) 2019-04-19 2022-10-04 Canon Kabushiki Kaisha Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
US11843732B2 (en) 2019-04-19 2023-12-12 Canon Kabushiki Kaisha Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
US11252287B2 (en) 2019-04-19 2022-02-15 Canon Kabushiki Kaisha Image processing apparatus that displays guidance for user operation, control method thereof and storage medium
US11265431B2 (en) 2019-04-19 2022-03-01 Canon Kabushiki Kaisha Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
JP7330742B2 (ja) 2019-04-19 2023-08-22 キヤノン株式会社 スキャン画像にプロパティを設定するための画像処理装置、その制御方法及びプログラム
JP2020178280A (ja) * 2019-04-19 2020-10-29 キヤノン株式会社 スキャン画像にプロパティを設定するための画像処理装置、その制御方法及びプログラム
US11330119B2 (en) 2019-04-23 2022-05-10 Canon Kabushiki Kaisha Information processing apparatus, control method and storage medium
US11620844B2 (en) 2019-09-30 2023-04-04 Canon Kabushiki Kaisha Image processing apparatus, control method of image processing apparatus, and storage medium
JP2021087072A (ja) * 2019-11-26 2021-06-03 京セラドキュメントソリューションズ株式会社 情報処理装置
JP7400397B2 (ja) 2019-11-26 2023-12-19 京セラドキュメントソリューションズ株式会社 情報処理装置
CN112866628B (zh) * 2019-11-28 2022-12-09 浙江宇视科技有限公司 图像采集器名称确定方法、装置、服务器及存储介质
CN112866628A (zh) * 2019-11-28 2021-05-28 浙江宇视科技有限公司 图像采集器名称确定方法、装置、服务器及存储介质
JP2021107977A (ja) * 2019-12-27 2021-07-29 富士フイルムビジネスイノベーション株式会社 文書管理装置、及び文書管理プログラム
JP7520563B2 (ja) 2020-01-21 2024-07-23 キヤノン株式会社 文書を電子化するための画像処理システム、その制御方法及びプログラム

Also Published As

Publication number Publication date
CN108377308B (zh) 2020-10-30
EP3355211A1 (en) 2018-08-01
US20200320290A1 (en) 2020-10-08
JP6881990B2 (ja) 2021-06-02
KR20200067238A (ko) 2020-06-12
KR102247606B1 (ko) 2021-05-03
US20180218208A1 (en) 2018-08-02
US11600090B2 (en) 2023-03-07
US10706276B2 (en) 2020-07-07
CN108377308A (zh) 2018-08-07

Similar Documents

Publication Publication Date Title
JP6881990B2 (ja) 画像処理装置とその制御方法、及びプログラム
US11221988B2 (en) File management device and file management method for presuming naming rule of file names
US10949662B2 (en) Image processing apparatus
JP6881991B2 (ja) 画像処理装置、及びその制御方法とプログラム
JP2019115011A (ja) 画像処理装置および画像処理プログラム
KR20240020719A (ko) 정보 처리 장치, 저장 매체, 및 저장 방법
JP2024012448A (ja) 画像処理装置、画像処理装置の制御方法及びそのプログラム
JP2022170175A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2016024488A (ja) 画像処理装置および画像処理装置の制御方法
JP2019117622A (ja) 画像処理装置および画像処理プログラム
JP2019153919A (ja) 画像処理装置、その制御方法、及びプログラム
JP2019114193A (ja) 画像処理装置および画像処理プログラム
JP7102284B2 (ja) ファイル管理装置、ファイル管理方法、及びプログラム
JP2000231505A (ja) データオブジェクト群の自動命名方法およびその記憶媒体
JP2021056722A (ja) 情報処理装置及びプログラム
JP2020201822A (ja) 画像処理装置、その制御方法、及びプログラム
US20220207900A1 (en) Information processing apparatus, information processing method, and storage medium
JP2020087112A (ja) 帳票処理装置および帳票処理方法
JP2020009330A (ja) 作成支援装置および作成支援方法
JP2021064123A (ja) データ入力支援システム、データ入力支援方法、及びプログラム
JP2021034778A (ja) 情報処理装置及び情報処理プログラム
JP2020135095A (ja) 情報処理装置及びプログラム
JP2016031538A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2023041242A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2021068274A (ja) 画像処理システム、画像処理方法、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200110

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201201

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210506

R151 Written notification of patent or utility model registration

Ref document number: 6881990

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151