JP2017068303A - 画像処理装置及びプログラム - Google Patents

画像処理装置及びプログラム Download PDF

Info

Publication number
JP2017068303A
JP2017068303A JP2015189255A JP2015189255A JP2017068303A JP 2017068303 A JP2017068303 A JP 2017068303A JP 2015189255 A JP2015189255 A JP 2015189255A JP 2015189255 A JP2015189255 A JP 2015189255A JP 2017068303 A JP2017068303 A JP 2017068303A
Authority
JP
Japan
Prior art keywords
classification
document
classified
image
types
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015189255A
Other languages
English (en)
Other versions
JP6672668B2 (ja
Inventor
真太郎 安達
Shintaro Adachi
真太郎 安達
岡田 茂
Shigeru Okada
茂 岡田
勝也 小柳
Katsuya Koyanagi
勝也 小柳
邦彦 小林
Kunihiko Kobayashi
邦彦 小林
紘幸 岸本
Hiroyuki Kishimoto
紘幸 岸本
茜 吉崎
Akane Yoshizaki
茜 吉崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2015189255A priority Critical patent/JP6672668B2/ja
Priority to US15/012,369 priority patent/US9875401B2/en
Priority to EP16157485.0A priority patent/EP3147818A1/en
Priority to CN201610130552.3A priority patent/CN106557775B/zh
Publication of JP2017068303A publication Critical patent/JP2017068303A/ja
Application granted granted Critical
Publication of JP6672668B2 publication Critical patent/JP6672668B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • G06V30/1983Syntactic or structural pattern recognition, e.g. symbolic string recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Input (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】画像の分類処理において、各画像が分類される全ての分類先をユーザが予め選択する構成と比較して、ユーザの手間を軽減する。【解決手段】端末装置20は、複数種類の原稿画像を取得する原稿画像受信部22と、取得された複数種類の原稿画像の各々を、複数の分類項目を各々有する複数の分類先のうちの、一の分類先に含まれる何れかの分類項目に分類し、複数種類の原稿画像のうち、一の分類先に分類されなかった原稿画像がある場合には、分類されなかった原稿画像を、何れかの原稿画像が分類された分類項目を1つ以上含む他の分類先に分類する分類処理部24とを備える。【選択図】図4

Description

本発明は、画像処理装置及びプログラムに関する。
特許文献1には、書類に記載されている情報に基づいて、書類の種類を確定し、集計に必要な情報をその書類から読み出し、集計データを作成し、更に、作成した集計データに基づいて、情報の読み出しが終了した書類の仕分パターンを作成し、この作成した仕分パターンに基づいて書類を仕分ける技術が開示されている。
特開2005−242430号公報
例えば帳票等の原稿から読み取った画像を、予め定められた何れかの分類先へ分類する処理を行う場合がある。ここで、各画像が分類される全ての分類先を予めユーザが選択すれば、画像が誤った分類先に分類される可能性が低くなる。しかし、用意されている分類先の数が多くなるほど、分類先の選択に手間を要する。
本発明は、画像の分類処理において、各画像が分類される全ての分類先をユーザが予め選択する構成と比較して、ユーザの手間を軽減することを目的とする。
請求項1に記載の発明は、複数種類の原稿画像を取得する取得手段と、前記取得手段により取得された前記複数種類の原稿画像の各々を、複数の分類項目を各々有する複数の分類先のうちの、一の分類先に含まれる何れかの分類項目に分類する第1分類手段と、前記複数種類の原稿画像のうち、前記第1分類手段により前記一の分類先に分類されなかった原稿画像がある場合には、当該分類されなかった原稿画像を、当該第1分類手段にて何れかの原稿画像が分類された前記分類項目を1つ以上含む他の分類先に分類する第2分類手段とを備える画像処理装置である。
請求項2に記載の発明は、各分類先では、分類される原稿画像の数が分類項目毎に予め指定されており、前記第1分類手段は、前記複数種類の原稿画像の各々を前記一の分類先に含まれる何れかの分類項目に分類した結果、指定された数を超える原稿画像が分類された分類項目がある場合には、予め定められた規則により、指定された数の原稿画像を選択して当該分類項目に分類することを特徴とする請求項1に記載の画像処理装置である。
請求項3に記載の発明は、前記第1分類手段は、前記予め定められた規則として、原稿画像に含まれる文字列と予め指定された文字列とが類似するか否かにより、指定された数の原稿画像を選択することを特徴とする請求項2に記載の画像処理装置である。
請求項4に記載の発明は、前記第1分類手段は、前記予め定められた規則として、先に取得された順番に従って、指定された数の原稿画像を選択することを特徴とする請求項2に記載の画像処理装置である。
請求項5に記載の発明は、前記第1分類手段は、前記予め定められた規則として、ユーザの操作をもとに、指定された数の原稿画像を選択することを特徴とする請求項2に記載の画像処理装置である。
請求項6に記載の発明は、前記第2分類手段は、前記他の分類先に分類されなかった原稿画像がある場合には、当該分類されなかった原稿画像を、前記第1分類手段にて何れかの原稿画像が分類された前記分類項目を含まない別の分類先に分類することを特徴とする請求項1に記載の画像処理装置である。
請求項7に記載の発明は、前記第1分類手段は、ユーザによる前記一の分類先の指定がある場合、指定された当該一の分類先に前記複数種類の原稿画像の各々を分類し、ユーザによる当該一の分類先の指定がない場合、予め定められた規則により選択した当該一の分類先に当該複数種類の原稿画像の各々を分類することを特徴とする請求項1に記載の画像処理装置である。
請求項8に記載の発明は、前記分類項目は、原稿の種類であり、前記分類先は、複数種類の原稿が用いられる業務であることを特徴とする請求項1に記載の画像処理装置である。
請求項9に記載の発明は、コンピュータに、複数種類の原稿画像を取得する機能と、取得された前記複数種類の原稿画像の各々を、複数の分類項目を各々有する複数の分類先のうちの、一の分類先に含まれる何れかの分類項目に分類する機能と、前記複数種類の原稿画像のうち、前記一の分類先に分類されなかった原稿画像がある場合には、当該分類されなかった原稿画像を、何れかの原稿画像が分類された前記分類項目を1つ以上含む他の分類先に分類する機能とを実現させるためのプログラムである。
請求項1記載の発明によれば、画像の分類処理において、各画像が分類される全ての分類先をユーザが予め選択する構成と比較して、ユーザの手間が軽減される。
請求項2記載の発明によれば、指定された数を超える画像が分類された分類項目がある場合に、分類する画像を選択することができる。
請求項3記載の発明によれば、指定された数を超える画像が分類された分類項目がある場合に、予め指定された文字列に類似する文字列を含む画像を選択することができる。
請求項4記載の発明によれば、指定された数を超える画像が分類された分類項目がある場合に、先に取得された順番で画像を選択することができる。
請求項5記載の発明によれば、指定された数を超える画像が分類された分類項目がある場合に、ユーザの操作をもとに画像を選択することができる。
請求項6記載の発明によれば、画像の分類処理において、各画像が分類される全ての分類先をユーザが予め選択する構成と比較して、さらに、ユーザの手間が軽減される。
請求項7記載の発明によれば、分類先の指定がある場合には指定された分類先に分類が行われる一方で、分類先の指定がない場合にも分類を行うことができる。
請求項8記載の発明によれば、画像の分類処理において、複数種類の原稿が用いられる業務毎に分類することができる。
請求項9記載の発明によれば、画像の分類処理において、各画像が分類される全ての分類先をユーザが予め選択する構成と比較して、ユーザの手間を軽減する機能を、コンピュータにより実現できる。
本実施の形態に係る画像処理システムの全体構成例を示した図である。 本実施の形態に係る画像読取装置のハードウェア構成例を示した図である。 本実施の形態に係る端末装置のハードウェア構成例を示した図である。 本実施の形態に係る端末装置の機能構成例を示したブロック図である。 (a)、(b)は、分類処理部が原稿画像を分類する処理の一例を説明するための図である。 (a)、(b)は、分類処理部が原稿画像を分類する処理の一例を説明するための図である。 分類処理部が原稿画像を分類する処理の手順の一例を示したフローチャートである。 指定枚数チェック処理の手順の一例を示したフローチャートである。
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
<画像処理システムの全体構成>
まず、本実施の形態に係る画像処理システム1の全体構成について説明する。図1は、本実施の形態に係る画像処理システム1の全体構成例を示した図である。本実施の形態に係る画像処理システム1は、帳票などの原稿を分類するためのシステムである。具体的には、画像処理システム1では、「納品書」や「請求書」等の様々な種類の原稿がセットされ、原稿の内容に応じて分類が行われる。原稿が分類されることにより、ユーザは、例えば、分類された状態で原稿の記載内容を確認したり、分類毎に決められたフローに従って原稿を処理したりすることができる。
図示するように、画像処理システム1は、原稿に形成された画像を読み取って画像データを生成する画像読取装置10と、ネットワーク30を介して画像読取装置10から画像データを受信して分類を行う端末装置20とを備える。
画像読取装置10は、スキャン機能を有し、帳票等の原稿(用紙)上に形成されている画像を読み取り、読み取った画像を示す画像データ(以下、原稿画像と称する)を生成する。ここで、画像読取装置10は、例えばスキャナ装置であり、光源から原稿に照射した光に対する反射光をレンズで縮小してCCD(Charge Coupled Devices)で受光するCCD方式や、LED光源から原稿に順に照射した光に対する反射光をCIS(Contact Image Sensor)で受光するCIS方式などが用いられる。なお、画像読取装置10としては、スキャン機能に加えて、例えば、プリント機能、コピー機能及びファクシミリ機能等を備えても良い。
端末装置20は、ネットワーク30を介して画像読取装置10が生成した原稿画像を受信し、受信した原稿画像の分類を行う。端末装置20としては、例えばPC(Personal Computer)等を用いれば良い。本実施の形態では、端末装置20が、画像処理装置の一例としての機能を有している。
ネットワーク30は、画像読取装置10と端末装置20との間の情報通信に用いられる通信手段であり、例えば、LAN(Local Area Network)である。
ここで、本実施の形態では、原稿画像が分類される分類先として、複数の分類パターンが予め用意されている。この分類パターンは、原稿が使用される区分を示し、具体的には、例えば、注文処理や納品処理等の業務毎や案件毎、顧客毎に分類パターンが定められている。また、それぞれの分類パターンでは、分類パターンで使用される原稿の種類が予め定められている。例えば、分類パターンが「注文」の業務である場合には、「注文」の業務で使用される原稿の種類が予め定められている。
また、分類に際して、ユーザは、予め用意されている複数の分類パターンの中から、セットした原稿に合った分類パターンを指定する。分類パターンが指定されることで、端末装置20は、各原稿画像の各々を、指定された分類パターンに含まれる原稿の種類の何れかに分類する処理を行う。
ここで、予め用意されている分類パターンは、例えば数千パターン近く存在する場合がある。このような場合、ユーザが分類パターンを指定するのに手間を要する。また、ユーザは、異なる業務などで使用される複数の原稿を1度にまとめてセットする場合もある。このような場合、それぞれの業務毎に分類パターンを指定すると、さらに手間を要することになる。一方、異なる業務で使用される原稿をまとめてセットしているにも関わらず、例えばユーザが1つの分類パターンしか指定しなければ、原稿が誤った分類パターンに分類されることも考えられる。
そこで、本実施の形態では、異なる分類パターンに属する複数の原稿を1度にまとめてセットするような場合に、各原稿の全ての分類パターンをユーザが選択しなくても、端末装置20は、それぞれの原稿に合った分類パターンに分類する処理を行う。
なお、本実施の形態では、分類先の一例として、分類パターンが用いられる。また、分類項目の一例として、原稿の種類が用いられる。
<画像読取装置のハードウェア構成>
次に、画像読取装置10のハードウェア構成について説明する。図2は、本実施の形態に係る画像読取装置10のハードウェア構成例を示した図である。図示するように、画像読取装置10は、CPU(Central Processing Unit)101と、RAM(Random Access Memory)102と、ROM(Read Only Memory)103と、HDD(Hard Disk Drive)104と、表示パネル105と、画像形成部106と、画像読取部107と、通信インタフェース(以下、通信I/Fと称する)108とを備える。なお、これらの各機能部はバス109に接続されており、このバス109を介してデータの授受を行う。
CPU101は、OS(Operating System)やアプリケーション等の各種プログラムを実行する。RAM102は、CPU101の作業用メモリ等として用いられるメモリである。ROM103は、CPU101が実行する各種プログラム等を記憶するメモリである。そして、CPU101は、ROM103等に記憶された各種プログラムをRAM102にロードして実行することにより、画像読取装置10の各機能を実現する。また、HDD104は、各種ソフトウェアに対する入力データや各種ソフトウェアからの出力データ等を記憶する記憶領域である。
表示パネル105は、各種情報の表示やユーザからの操作入力の受付を行う。
画像形成部106は、入力される画像データをもとに記録媒体に画像を形成する。ここで、画像形成部106は、例えばプリンタであり、感光体に付着させたトナーを記録媒体に転写して像を形成する電子写真方式や、インクを記録媒体上に吐出して像を形成するインクジェット方式などが用いられる。
画像読取部107は、例えばスキャナであり、原稿上に形成されている画像を読み取り、読み取った画像を示す原稿画像を生成する。
通信I/F108は、ネットワーク30を介して端末装置20等の外部機器との間で各種データの送受信を行うインタフェースとして機能する。
<端末装置のハードウェア構成>
次に、端末装置20のハードウェア構成について説明する。図3は、本実施の形態に係る端末装置20のハードウェア構成例を示した図である。図示するように、端末装置20は、演算手段であるCPU201と、記憶手段であるメインメモリ202および磁気ディスク装置(HDD)203とを備える。
ここで、CPU201は、OSやアプリケーション等の各種プログラムを実行し、端末装置20の各機能を実現する。また、メインメモリ202は、各種プログラムやその実行に用いるデータ等を記憶する記憶領域である。磁気ディスク装置203は、各種プログラムに対する入力データや各種プログラムからの出力データ等を記憶する記憶領域である。さらに、端末装置20は、外部との通信を行うための通信I/F204と、ビデオメモリやディスプレイ等からなる表示機構205と、キーボードやマウス等の入力デバイス206とを備える。
<端末装置の機能構成>
次に、端末装置20の機能構成について説明する。図4は、本実施の形態に係る端末装置20の機能構成例を示したブロック図である。端末装置20は、原稿画像を分類する際に用いられる情報を記憶する分類情報記憶部21と、ネットワーク30を介して画像読取装置10から原稿画像を受信する原稿画像受信部22と、ユーザからの操作入力を受け付ける操作受付部23と、受信した原稿画像の分類を行う分類処理部24とを備える。
分類情報記憶部21は、原稿画像を分類する際に用いられる情報を記憶する。具体的には、分類情報記憶部21は、予め用意された複数の分類パターンと、各分類パターンで使用される原稿の種類とを記憶している。
また、分類情報記憶部21は、原稿の種類毎に、原稿の種類を特定するための情報を記憶している。ここで、原稿画像を分類する際には、例えばOCR(Optical Character Recognition)により、原稿画像に含まれる文字の認識が行われる。OCRとは、画像データ上にある文字を解析し、コンピュータで扱われる文字データに変換する技術である。そのため、分類情報記憶部21は、原稿の種類毎に、原稿の種類を特定するための文字列等を記憶している。
原稿画像受信部22は、画像読取部107が原稿上に形成されている画像を読み取って生成した原稿画像を、ネットワーク30を介して画像読取装置10から受信する。
操作受付部23は、ユーザからの操作入力を受け付ける。例えば、操作受付部23は、原稿画像の分類に際して、ユーザが分類パターンを指定する操作を受け付ける。
分類処理部24は、原稿画像受信部22が受信した複数種類の原稿画像の分類を行う。具体的には、分類処理部24は、ユーザに指定された分類パターンに従って、原稿画像の各々を、指定された分類パターンに含まれる原稿の種類の何れかに分類する。ここで、指定された分類パターンに含まれるどの種類にも該当しない原稿画像がある場合には、指定された分類パターンには分類されない。この場合、分類処理部24は、指定された分類パターンに分類されなかった原稿画像を、例えば「その他」の項目に分類する。その後、分類処理部24は、「その他」の項目に分類した原稿画像を、指定された分類パターン以外の他の分類パターンで分類する処理を行う。
また、分類処理部24は、原稿画像を分類する際には、上述したように、例えばOCRにより原稿画像に含まれる文字を認識する。具体的には、分類処理部24は、原稿画像内でOCRにより認識した文字列と、分類情報記憶部21が記憶している原稿の種類毎の文字列とを照合することにより、原稿画像に対応する原稿の種類を特定して、分類パターンへの分類を行う。
なお、端末装置20が有するこれらの各機能部は、ソフトウェアとハードウェア資源とが協働することにより実現される。具体的には、CPU201が、端末装置20の各機能部を実現するプログラムを、例えば磁気ディスク装置203からメインメモリ202に読み込んで実行することにより、これらの機能部が実現される。また、分類情報記憶部21は、例えば磁気ディスク装置203により実現される。
また、本実施の形態では、原稿画像受信部22が、取得手段の一例としての機能を有している。さらに、分類処理部24が、第1分類手段及び第2分類手段の一例としての機能を有している。
<原稿画像を分類する処理の説明>
次に、図5及び図6を参照しながら、分類処理部24が原稿画像を分類する処理について説明する。図5及び図6は、分類処理部24が原稿画像を分類する処理の一例を説明するための図である。
まず、図5(a)は、各分類パターンに定められている原稿の種類の一例を示す図である。図5(a)に示す例では、分類パターンとして、パターン1〜4が定められている。また、原稿の種類として、種類1〜6が定められている。そして、各分類パターンでは、「使用有無」の欄に「○」を付して、その分類パターンで使用される原稿の種類を示している。また、「枚数」の欄は、各分類パターンで使用される原稿の枚数として指定された枚数(以下、指定枚数と称する)を、原稿の種類毎に示している。
例えば、パターン1では、種類1、種類2及び種類3の原稿が1枚ずつ使用される。また、例えば、パターン3では、種類3及び種類5の原稿が1枚ずつ使用され、さらに種類1の原稿が2枚使用される。即ち、パターン3の業務を行うためには、種類3及び種類5の原稿は1枚あれば良いが、種類1の原稿は2枚必要になる。
次に、図5(b)は、実際に画像読取装置10にセットされて分類が行われる原稿の一例を説明するための図である。ここで、原稿A〜Eの5枚の原稿が順番に画像読取装置10にセットされるものとする。即ち、原稿Aが1枚目にセットされ、続けて、原稿B、原稿C、原稿D、原稿Eがそれぞれ2枚目〜5枚目にセットされる。また、各原稿について、原稿Aは種類1、原稿Bは種類2、原稿Cは種類3、原稿Dは種類1、原稿Eは種類5の原稿であるものとする。
次に、図6(a)、(b)は、図5(b)に示す各原稿A〜Eを、図5(a)に示す分類パターンで分類した結果の一例を説明するための図である。
まず、ユーザは、分類パターンとして、図5(a)に示す「パターン1」を指定するものとする。「パターン1」が指定されると、分類処理部24は、各原稿画像を、指定された「パターン1」に含まれる原稿の種類の何れかに分類する。具体的には、分類処理部24は、1枚目の原稿Aから順番に文字認識を行い、認識した文字をもとに、各原稿が種類1〜種類3の何れかに該当するか否かを判断していく。
ここで、例えば、1枚目の原稿Aは、認識された文字により種類1と特定されて、種類1に分類される。順に、2枚目の原稿Bは種類2、3枚目の原稿Cは種類3、4枚目の原稿Dは種類1に分類される。一方、5枚目の原稿Eは種類1〜種類3のどの種類にも該当しない。そのため、原稿Eは「その他」に分類される。
その結果、種類1には原稿A及び原稿Dの2枚の原稿が分類される。また、種類2には原稿Bが分類され、種類3には原稿Cが分類される。ここで、「パターン1」では、図5(a)に示すように、種類1〜3の原稿が1枚ずつ使用されるが、ここで種類1に分類された原稿の枚数は2枚であるため、指定枚数を超えることになる。この場合、分類処理部24は、予め定められた規則に従って、指定枚数の原稿画像を選択する。
例えば、分類処理部24は、分類情報記憶部21に記憶されている「種類1」に分類するための文字列と、原稿画像に含まれる文字列との類似度を判断する。そして、分類処理部24は、類似度が高い原稿画像を優先して選択する。ここでは、予め指定された文字列の一例として、「種類1」に分類するための文字列が用いられる。
さらに説明すると、原稿Aには、「種類1」に分類するための文字列と完全に一致する文字列が含まれており、原稿Dには、「種類1」に分類するための文字列のうち1文字を違う文字に置き換えた正規表現が含まれていれば、完全一致の文字列を含む原稿Aが優先される。即ち、原稿Aがパターン1に分類される一方で、原稿Dは「その他」に分類される。
また、類似度については、完全一致文字列や正規表現を用いる場合に限られず、例えば、OCRで文字認識を行った際の確信度を用いても良い。一般に、OCRでは、文字認識を行った文字毎に確信度が割り当てられる。付言すると、同一の文字であっても、文字の大きさや字体によって確信度が変わる場合があり、確信度が高いほど文字認識の信頼性が高いと判断される。そこで、例えば、OCRによる確信度が高い原稿画像を優先して選択することとしても良い。
このようにして、1回目の分類結果では、図6(a)に示すように、原稿Aは種類1、原稿Bは種類2、原稿Cは種類3に分類される。また、原稿D及び原稿Eは「その他」に分類される。
次に、分類処理部24は、1回目の分類結果をもとに他の分類パターンを探索する。そして、分類処理部24は、「その他」に分類された原稿画像の分類を実行する。
ここで、分類処理部24は、1回目に原稿画像が分類された原稿の種類(図6(a)に示す例では、種類1〜3)の1つ以上を含む他の分類パターンを探索する。
図6(a)に示す例では、パターン2及びパターン4では種類1〜3が含まれていないが、パターン3では種類1及び種類3が含まれている。そのため、分類処理部24は、探索の結果、「パターン3」を選択する。そして、分類処理部24は、1回目に「その他」に分類された原稿D及び原稿Eを、「パターン3」に含まれる原稿の種類の何れかに分類する。その結果、図6(a)に示すように、4枚目の原稿Dは種類1に分類され、5枚目の原稿Eは種類5に分類される。このようにして、2回目の分類が終了する。
図6(b)は、最終的な分類結果を示している。図示するように、原稿A〜Cはパターン1に振り分けられ、原稿D及び原稿Eはパターン3に振り分けられる。また、原稿A及び原稿Dは種類1に分類され、原稿Bは種類2に分類される。また、原稿Cは種類3に分類され、原稿Eは種類5に分類される。
ここで、図6(b)に示す結果では、パターン1で使用される原稿は全て揃っている。一方、パターン3で使用される原稿は、種類1の原稿1枚、種類3の原稿1枚が足りない。言い換えると、原稿A及び原稿Cをパターン1ではなくパターン3に分類すれば、パターン3で使用される原稿が全て揃うことになる。このように、図5及び図6に示す例は、パターン1及びパターン3の異なる分類パターンに属する複数の原稿がセットされた場合であり、どちらの分類パターンにも分類可能な原稿が存在している場合を示している。
図5及び図6に示す例のように、ユーザが原稿をまとめてセットする場合には、複数の原稿のうち、異なる分類パターンのどちらにも分類可能な原稿が存在することが考えられる。そこで、本実施の形態では、上記のように、分類処理部24は、1回目の分類として、ユーザに指定された分類パターンで分類を行った後、1回目の分類結果をもとに他の分類パターンを選択する。ここで、分類処理部24は、1回目で原稿画像が分類された原稿の種類の1つ以上を含む他の分類パターンを選択する。そして、分類処理部24は、2回目の分類として、1回目に「その他」に分類した原稿を、選択した他の分類パターンで分類する。
<原稿画像を分類する処理手順>
次に、分類処理部24が原稿画像を分類する処理の手順について説明する。図7は、分類処理部24が原稿画像を分類する処理の手順の一例を示したフローチャートである。初期状態として、ユーザが画像読取装置10に複数の原稿をセットしたものとする。
初めに、ユーザは、セットした原稿に応じて分類パターンを1つ指定する操作を行う。そして、操作受付部23は、分類パターンを指定する操作を受け付ける(ステップ101)。次に、ユーザが画像読取装置10を操作することにより、セットした原稿の読み取りが行われ、生成された原稿画像が端末装置20に送信される。
次に、分類処理部24は、指定された分類パターンで各原稿画像の分類を行う(ステップ102)。ここで、分類処理部24は、各原稿画像の文字認識を行って、指定された分類パターンに含まれる原稿の種類の何れかに分類する。指定された分類パターンに含まれるどの原稿の種類にも該当しないものについては、「その他」に分類される。
次に、分類処理部24は、全ての原稿画像について分類を行ったか否かを判定する(ステップ103)。まだ分類が行われていない原稿画像があると判定された場合(ステップ103でNo)、ステップ102へ移行する。全ての原稿画像について分類が行われたと判定された場合(ステップ103でYes)、分類処理部24は、指定枚数チェック処理を行う(ステップ104)。指定枚数チェック処理では、分類パターンの指定枚数を超える原稿画像が分類された原稿の種類があるか否かのチェックが行われる。指定枚数を超える原稿画像については、「その他」に分類される。指定枚数チェック処理の手順の詳細については後述する。
次に、分類処理部24は、分類結果の中に「その他」に分類された原稿画像があるか否かを判定する(ステップ105)。「その他」に分類された原稿画像がないと判定された場合(ステップ105でNo)、本処理フローは終了する。一方、「その他」に分類された原稿画像があると判定された場合(ステップ105でYes)、分類処理部24は、1回目の分類結果をもとに他の分類パターンを選択する(ステップ106)。ここで、分類処理部24は、1回目に原稿画像が分類された原稿の種類を1つ以上含む他の分類パターンを選択する。
次に、分類処理部24は、選択した分類パターンで、1回目に「その他」に分類された原稿画像の分類を行う(ステップ107)。次に、分類処理部24は、1回目に「その他」に分類された全ての原稿画像について分類を行ったか否かを判定する(ステップ108)。まだ分類が行われていない原稿画像があると判定された場合(ステップ108でNo)、ステップ107へ移行する。一方、全ての原稿画像について分類が行われたと判定された場合(ステップ108でYes)、分類処理部24は、ステップ104と同様に、指定枚数チェック処理を行う(ステップ109)。
次に、分類処理部24は、分類結果の中に「その他」に分類された原稿画像があるか否かを判定する(ステップ110)。「その他」に分類された原稿画像がないと判定された場合(ステップ110でNo)、本処理フローは終了する。一方、「その他」に分類された原稿画像があると判定された場合(ステップ110でYes)、分類処理部24は、さらに他の分類パターンを選択し、「その他」に分類された原稿画像の分類を行う(ステップ111)。そして、本処理フローは終了する。
ここで、ステップ106において、1回目に原稿画像が分類された原稿の種類を1つ以上含む他の分類パターンが、複数存在する場合も考えられる。この場合、分類処理部24は、予め定められた規則に従って、他の分類パターンを1つ選択する。
例えば、分類処理部24は、予め用意された複数の分類パターンの中から、分類パターン毎に事前に付与されている番号の最も小さい分類パターンを選択する。ここで、1回目に原稿画像が分類された原稿の種類をより多く含む分類パターンを優先して選択しても良い。例えば、1回目に原稿画像が分類された原稿の種類が3つであれば、まず、分類処理部24は、その3つの原稿の種類を全て含む分類パターンを優先して選択する。さらに、3つの原稿の種類を全て含む分類パターンが複数ある場合には、分類処理部24は、その中で事前に付与されている番号の最も小さいものを選択する。
さらに、ステップ106において、分類処理部24は、1回目に原稿画像が分類された原稿の種類を1つ以上含む他の分類パターンを選択することとしたが、1回目の分類で原稿画像が全て「その他」に分類されることも考えられる。この場合、例えば、分類処理部24は、まず、分類情報記憶部21に記憶されている情報を参照して、全ての原稿画像の原稿の種類を特定する。そして、分類処理部24は、予め用意された複数の分類パターンの中で、特定した原稿の種類を最も多く含む分類パターンを選択して、2回目の分類を行う。
また、ステップ111でも、残りの分類パターンが複数存在する場合も考えられる。この場合、分類処理部24は、上記のステップ106と同様に、予め定められた規則に従って、さらに他の分類パターンを選択する。
例えば、分類処理部24は、残りの分類パターンの中で、1回目に原稿画像が分類された原稿の種類を含む分類パターンを優先して選択する。また、1回目に原稿画像が分類された原稿の種類を含む分類パターンがなければ、分類処理部24は、事前に付与されている番号の最も小さい分類パターンを選択する。
ステップ111では、このようにして、全ての原稿画像が何れかの分類パターンの原稿の種類に分類されるまで、順番に分類パターンが選択されて処理が行われる。
<指定枚数チェック処理の手順>
次に、図7に示す手順のステップ104及びステップ109で行われる指定枚数チェック処理の手順について説明する。図8は、指定枚数チェック処理の手順の一例を示したフローチャートである。
まず、分類処理部24は、分類パターンの指定枚数を超える原稿画像が分類された原稿の種類があるか否かを判定する(ステップ201)。ステップ201で否定の判断(No)がされた場合、本処理フローは終了する。一方、ステップ201で肯定の判断(Yes)がされた場合、分類処理部24は、指定枚数を超えて分類された原稿の種類において、どの原稿画像を優先させるかを決定する(ステップ202)。ここで、分類処理部24は、上述したように、例えば、分類情報記憶部21に記憶されている文字列との類似度が高い文字列を含む原稿画像を優先させる。優先されなかった原稿画像は、「その他」に分類される。
次に、分類処理部24は、分類パターンに定められた原稿の種類の全てについて、指定枚数以内に収まったか否かを判定する(ステップ203)。ステップ203で否定の判断(No)がされた場合、ステップ202へ移行する。一方、ステップ203で肯定の判断(Yes)がされた場合、本処理フローは終了する。
ここで、ステップ202において、分類情報記憶部21に記憶されている文字列との類似度をもとに優先させる原稿画像を決定することとしたが、このような構成に限られるものではない。例えば、先に原稿がセットされて原稿画像受信部22が原稿画像を受信した順番(即ち、画像読取装置10にて先にスキャンされた順番)に従って、優先させる原稿画像を決定しても良い。例えば、ユーザに指定された分類パターンでは種類1の原稿が1枚使用されることが定められており、分類の結果、1枚目の原稿Aと2枚目の原稿Bとが種類1に分類されたものとする。この場合、先にセットされた1枚目の原稿Aが優先されて、この分類パターンの種類1に分類される。一方、2枚目の原稿Bは「その他」に分類される。
さらに、ユーザの操作をもとに、優先させる原稿画像を決定することとしても良い。例えば、ユーザに指定された分類パターンでは種類1の原稿が1枚使用されることが定められており、分類の結果、1枚目の原稿Aと2枚目の原稿Bとが種類1に分類されたものとする。この場合、原稿Aの画像と原稿Bの画像とを表示機構205等に表示して、どちらを優先させるかをユーザに選択させる。
以上説明したように、本実施の形態に係る端末装置20は、1回目の分類として、ユーザに指定された分類パターンで分類を行った後、1回目の分類結果をもとに他の分類パターンを選択する。ここで、端末装置20は、1回目で原稿画像が分類された原稿の種類を1つ以上含む分類パターンに絞って、2回目の分類で用いる他の分類パターンを選択する。そして、端末装置20は、2回目の分類として、1回目に「その他」に分類された原稿を、選択した他の分類パターンで分類する。そのため、2回目の分類では、ユーザが分類パターンを指定することなく、端末装置20にて分類パターンが選択されて分類が行われる。
また、本実施の形態において、画像読取装置10が画像を読み取る前にユーザが分類パターンを指定することとしたが、画像読取装置10が画像を読み取った後に、分類パターンを指定することとしても良い。また、ユーザは、分類パターンを指定する操作を端末装置20に対して行うこととしたが、画像読取装置10に対して行うこととしても良い。
さらに、本実施の形態において、1回目の分類で用いる分類パターンについても、ユーザが指定するのではなく、端末装置20が予め定められた規則に従って選択することとしても良い。この場合、例えば、端末装置20は、まず、分類情報記憶部21に記憶している情報を参照して、受信した全ての原稿画像について原稿の種類を特定する。そして、端末装置20は、例えば、予め用意された全ての分類パターンの中で、特定された原稿の種類を最も多く含む分類パターンを選択する。ここで候補になる分類パターンが複数ある場合には、端末装置20は、分類パターン毎に事前に付与されている番号の小さい分類パターンを優先させる。さらに、端末装置20が分類パターンを決定するのではなく、ユーザが分類パターンを指定する操作を端末装置20や画像読取装置10に対して行うこととしてもよい。
また、本実施の形態において、画像読取装置10が端末装置20の機能を有することとしても良い。この場合、画像読取装置10は、原稿上に形成されている画像を読み取り、原稿画像を生成する。そして、画像読取装置10は、生成した原稿画像を何れかの分類パターンに振り分けて、各原稿画像を原稿の種類毎に分類する。この場合には、画像読取装置10を、画像処理装置の一例として捉えることができる。
また、本発明の実施の形態を実現するプログラムは、通信手段により提供することはもちろん、CD−ROM等の記録媒体に格納して提供することも可能である。
なお、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態には限定されない。本発明の精神及び範囲から逸脱することなく様々に変更したり代替態様を採用したりすることが可能なことは、当業者に明らかである。
1…画像処理システム、10…画像読取装置、20…端末装置、21…分類情報記憶部、22…原稿画像受信部、23…操作受付部、24…分類処理部、30…ネットワーク

Claims (9)

  1. 複数種類の原稿画像を取得する取得手段と、
    前記取得手段により取得された前記複数種類の原稿画像の各々を、複数の分類項目を各々有する複数の分類先のうちの、一の分類先に含まれる何れかの分類項目に分類する第1分類手段と、
    前記複数種類の原稿画像のうち、前記第1分類手段により前記一の分類先に分類されなかった原稿画像がある場合には、当該分類されなかった原稿画像を、当該第1分類手段にて何れかの原稿画像が分類された前記分類項目を1つ以上含む他の分類先に分類する第2分類手段と
    を備える画像処理装置。
  2. 各分類先では、分類される原稿画像の数が分類項目毎に予め指定されており、
    前記第1分類手段は、前記複数種類の原稿画像の各々を前記一の分類先に含まれる何れかの分類項目に分類した結果、指定された数を超える原稿画像が分類された分類項目がある場合には、予め定められた規則により、指定された数の原稿画像を選択して当該分類項目に分類すること
    を特徴とする請求項1に記載の画像処理装置。
  3. 前記第1分類手段は、前記予め定められた規則として、原稿画像に含まれる文字列と予め指定された文字列とが類似するか否かにより、指定された数の原稿画像を選択すること
    を特徴とする請求項2に記載の画像処理装置。
  4. 前記第1分類手段は、前記予め定められた規則として、先に取得された順番に従って、指定された数の原稿画像を選択すること
    を特徴とする請求項2に記載の画像処理装置。
  5. 前記第1分類手段は、前記予め定められた規則として、ユーザの操作をもとに、指定された数の原稿画像を選択すること
    を特徴とする請求項2に記載の画像処理装置。
  6. 前記第2分類手段は、前記他の分類先に分類されなかった原稿画像がある場合には、当該分類されなかった原稿画像を、前記第1分類手段にて何れかの原稿画像が分類された前記分類項目を含まない別の分類先に分類すること
    を特徴とする請求項1に記載の画像処理装置。
  7. 前記第1分類手段は、ユーザによる前記一の分類先の指定がある場合、指定された当該一の分類先に前記複数種類の原稿画像の各々を分類し、ユーザによる当該一の分類先の指定がない場合、予め定められた規則により選択した当該一の分類先に当該複数種類の原稿画像の各々を分類すること
    を特徴とする請求項1に記載の画像処理装置。
  8. 前記分類項目は、原稿の種類であり、前記分類先は、複数種類の原稿が用いられる業務であること
    を特徴とする請求項1に記載の画像処理装置。
  9. コンピュータに、
    複数種類の原稿画像を取得する機能と、
    取得された前記複数種類の原稿画像の各々を、複数の分類項目を各々有する複数の分類先のうちの、一の分類先に含まれる何れかの分類項目に分類する機能と、
    前記複数種類の原稿画像のうち、前記一の分類先に分類されなかった原稿画像がある場合には、当該分類されなかった原稿画像を、何れかの原稿画像が分類された前記分類項目を1つ以上含む他の分類先に分類する機能と
    を実現させるためのプログラム。
JP2015189255A 2015-09-28 2015-09-28 画像処理装置及びプログラム Active JP6672668B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2015189255A JP6672668B2 (ja) 2015-09-28 2015-09-28 画像処理装置及びプログラム
US15/012,369 US9875401B2 (en) 2015-09-28 2016-02-01 Image processing apparatus, non-transitory computer readable medium, and image processing method for classifying document images into categories
EP16157485.0A EP3147818A1 (en) 2015-09-28 2016-02-25 Image processing apparatus, image processing method and program
CN201610130552.3A CN106557775B (zh) 2015-09-28 2016-03-08 图像处理装置和图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015189255A JP6672668B2 (ja) 2015-09-28 2015-09-28 画像処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2017068303A true JP2017068303A (ja) 2017-04-06
JP6672668B2 JP6672668B2 (ja) 2020-03-25

Family

ID=55588045

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015189255A Active JP6672668B2 (ja) 2015-09-28 2015-09-28 画像処理装置及びプログラム

Country Status (4)

Country Link
US (1) US9875401B2 (ja)
EP (1) EP3147818A1 (ja)
JP (1) JP6672668B2 (ja)
CN (1) CN106557775B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018204660A1 (de) 2017-03-30 2018-10-04 Ngk Insulators, Ltd. Wabenstruktur
JP2020021469A (ja) * 2018-07-20 2020-02-06 株式会社リコー 情報処理装置、情報処理方法及び情報処理プログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111680688B (zh) * 2020-06-10 2023-08-08 创新奇智(成都)科技有限公司 字符识别方法及装置、电子设备、存储介质
US20220147843A1 (en) * 2020-11-12 2022-05-12 Samsung Electronics Co., Ltd. On-device knowledge extraction from visually rich documents

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005242430A (ja) 2004-02-24 2005-09-08 Rkk Computer Service Co Ltd 書類処理システム、書類処理方法及びそのプログラム
JP2007286864A (ja) * 2006-04-17 2007-11-01 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP4899880B2 (ja) * 2007-01-18 2012-03-21 富士ゼロックス株式会社 画像処理装置、画像処理システム及び画像処理プログラム
US7992082B2 (en) * 2007-03-21 2011-08-02 Primatech Corporation System and technique for editing and classifying documents
US8285057B2 (en) * 2010-05-14 2012-10-09 Palo Alto Research Center Incorporated Learning image anchor templates for document classification
US9069768B1 (en) * 2012-03-28 2015-06-30 Emc Corporation Method and system for creating subgroups of documents using optical character recognition data

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018204660A1 (de) 2017-03-30 2018-10-04 Ngk Insulators, Ltd. Wabenstruktur
JP2020021469A (ja) * 2018-07-20 2020-02-06 株式会社リコー 情報処理装置、情報処理方法及び情報処理プログラム
JP7346931B2 (ja) 2018-07-20 2023-09-20 株式会社リコー 情報処理装置、情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
JP6672668B2 (ja) 2020-03-25
EP3147818A1 (en) 2017-03-29
US9875401B2 (en) 2018-01-23
CN106557775A (zh) 2017-04-05
CN106557775B (zh) 2019-09-27
US20170091545A1 (en) 2017-03-30

Similar Documents

Publication Publication Date Title
US9454696B2 (en) Dynamically generating table of contents for printable or scanned content
CN106649420B (zh) 图像处理设备和图像处理方法
US10013606B2 (en) Image processing apparatus, non-transitory computer readable medium, and image processing method
JP6665498B2 (ja) 情報処理装置、画像処理システム及びプログラム
JP6672668B2 (ja) 画像処理装置及びプログラム
JP2017146745A (ja) 情報処理装置、制御方法、情報処理システム、およびプログラム
CN111200697A (zh) 图像处理装置、控制图像处理装置的方法和存储介质
US8743383B2 (en) Image processing apparatus storing destination information and information indicating whether a user is allowed to print image data and control method therefor
JP2018042067A (ja) 画像処理システム、画像処理方法、情報処理装置
US11521404B2 (en) Information processing apparatus and non-transitory computer readable medium for extracting field values from documents using document types and categories
JP2022128202A (ja) 情報処理装置、情報処理システム、及び情報処理プログラム
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
US20230206672A1 (en) Image processing apparatus, control method of image processing apparatus, and storage medium
JP2021034778A (ja) 情報処理装置及び情報処理プログラム
US11659106B2 (en) Information processing apparatus, non-transitory computer readable medium, and character recognition system
JP2019160213A (ja) 情報処理システム、情報処理方法及びプログラム
US20240073345A1 (en) Image forming apparatus, non-transitory computer readable medium storing image forming program, and information processing system
US11238305B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP6946932B2 (ja) 画像処理システム、処理装置及びプログラム
JP2021144302A (ja) 情報処理装置及び情報処理プログラム
JP2008124975A (ja) 画像データ作成装置、画像出力装置、およびプログラム
JP5618099B2 (ja) 端末装置、処理装置、及びプログラム
JP2022187945A (ja) 画像処理システム、画像処理方法及びプログラム
JP2017072942A (ja) 文書振り分けシステム、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200217

R150 Certificate of patent or registration of utility model

Ref document number: 6672668

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350