JP2023141170A - 画像処理装置、その制御方法、プログラム、及び画像処理システム - Google Patents

画像処理装置、その制御方法、プログラム、及び画像処理システム Download PDF

Info

Publication number
JP2023141170A
JP2023141170A JP2022047350A JP2022047350A JP2023141170A JP 2023141170 A JP2023141170 A JP 2023141170A JP 2022047350 A JP2022047350 A JP 2022047350A JP 2022047350 A JP2022047350 A JP 2022047350A JP 2023141170 A JP2023141170 A JP 2023141170A
Authority
JP
Japan
Prior art keywords
electronic data
image processing
specific name
cluster
appearance frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022047350A
Other languages
English (en)
Inventor
優一 八木
Yuichi Yagi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2022047350A priority Critical patent/JP2023141170A/ja
Publication of JP2023141170A publication Critical patent/JP2023141170A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】本発明は、例えば文書分類のためのキーワードのユーザによる登録を簡略化し、処理対象の文書を好適に分類する仕組みを提供する。【解決手段】本画像処理装置は、学習フェーズにおいて、原稿を読み取って出力される電子データを取得し、電子データから特徴量を抽出し、複数の電子データごとに抽出された特徴量を用いて、複数の電子データを複数のクラスタに分類する。さらに、本画像処理装置は、分類されたクラスタごとに、分類された1以上の電子データから抽出された特徴量ごとの出現頻度を示す出現頻度表を生成し、クラスタごとに、出現頻度表を用いて特定名称を登録する。また、本画像処理装置は、推定フェーズにおいて、所定の原稿からの電子データについて、特徴量を抽出し、生成された出現頻度表と抽出した特徴量を用いて、当該電子データとクラスタごとの類似度を示すスコアを取得する。さらに、本画像処理装置は、取得されたスコアに基づいて、所定の原稿からの電子データに対する特定名称を決定する。【選択図】 図4

Description

本発明は、画像処理装置、その制御方法、プログラム、及び画像処理システムに関するものである。
OCRが搭載された画像処理装置などでは、文書原稿を読み取るだけで文字データを含む電子データを生成して出力することができる。生成された電子データは、一旦文書にされた原稿を引用したり修正したりして新たな文書を作成するのに非常に有用である。
このようにOCR機能で生成された電子データは、記憶部に記憶されたり、他の機器へ転送される。したがって、ユーザの利便性を高めるためには、電子データにはファイル名を付与したり、転送先のフォルダ名に付与したりする必要がある。しかし、ユーザが画像処理装置の操作部等からファイル名を入力したり、指定したりする作業は煩雑である。
特許文献1は、文書から読み取られた文字データに予め設定されたキーワードが含まれる場合、そのキーワードに対応した文書種類を判別し、該当する文書種類に関する特定名称をその電子データのファイル名として自動で付与することを提案している。これにより、ファイル名を付与する際の作業を簡素化している。
特開2008-299778号公報
しかしながら、上記従来技術には以下に記載する課題がある。上記従来技術では、キーワードとそれに対応する特定名称を予め設定しておく必要があり、ユーザが扱う文書種類の全てに対して設定するため、大変な労力が必要になる。また、ユーザは扱うキーワードを把握しておく必要があり、キーワードの入力漏れがあると分類ができないといった問題も生じうる。
本発明は、上述の課題の少なくとも一つに鑑みて成されたものであり、文書分類のためのキーワードのユーザによる登録を簡略化し、処理対象の文書を好適に分類する仕組みを提供する。
本発明は、例えば、画像処理装置であって、原稿を読み取って出力される電子データを取得する第1取得手段と、前記電子データから特徴量を抽出する抽出手段と、複数の電子データごとに抽出された前記特徴量を用いて、該複数の電子データを複数のクラスタに分類する分類手段と、前記分類手段によって分類されたクラスタごとに、分類された1以上の電子データから抽出された特徴量ごとの出現頻度を示す出現頻度表を生成する生成手段と、前記クラスタごとに、前記出現頻度表を用いて特定名称を登録する登録手段とを備えることを特徴とする。
また、本発明は、例えば、画像処理システムであって、原稿を読み取って電子データを出力する読取手段と、前記電子データから特徴量を抽出する抽出手段と、複数の電子データごとに抽出された前記特徴量を用いて、該複数の電子データを複数のクラスタに分類する分類手段と、前記分類手段によって分類されたクラスタごとに、分類された1以上の電子データから抽出された特徴量ごとの出現頻度を示す出現頻度表を生成する生成手段と、前記クラスタごとに、前記出現頻度表を用いて特定名称を登録する登録手段とを備えることを特徴とする。
本発明によれば、文書分類のためのキーワードのユーザによる登録を簡略化し、処理対象の文書を好適に分類することができる。
一実施形態に係るシステムの構成例を示す図。 一実施形態に係る画像処理装置のハードウェア構成例を示す図。 一実施形態に係る機械学習サーバのハードウェア構成例を示す図。 一実施形態に係るシステムの機能構成例を示す図。 一実施形態に係るクラスタの生成処理(学習フェーズ)の一例を示すフローチャート。 一実施形態に係る電子データごとに単語と出現数を表した単語出現頻度表の一例を示す図。 一実施形態に係るクラスタ識別IDと分類した電子データを対応付けたクラスタリング結果の一例を示す図。 一実施形態に係るクラスタ毎の単語出現頻度表の一例を示す図。 一実施形態に係る特定名称登録画面の一例を示す図。 一実施形態に係る特定名称付与情報の一例を示す図。 一実施形態に係る文書分類処理(推定フェーズ)の一例を示すフローチャート。 一実施形態に係る特定名称選択画面の一例を示す図。
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
<システムの構成>
以下では、本発明の一実施形態について図面を用いて説明する。まず、図1を参照して、本実施形態に係るシステムの全体構成について説明する。
本システムは、画像処理装置101、機械学習サーバ102、汎用コンピュータ103、及びデータサーバ105を含んで構成される。これらの機器は、有線LAN等のLAN104介して接続され、相互にデータを送受することができる。画像処理装置101は、プリンタ、複合機、FAX、及びスキャナなどの画像処理機能を有する装置である。本実施形態では、画像処理装置としてMFP(multifunction peripheral)を例に説明する。汎用コンピュータ103は、画像処理装置101に対してプリントデータの送信等を行う。データサーバ105は、機械学習サーバ102において機械学習を行うために使用される学習データを外部機器から収集して機械学習サーバ102へ提供する。機械学習サーバ102は、外部から提供される、文書原稿等から読み取られた画像データから特徴を抽出し、文書を分類するためのクラスタリングを行う。なお、これらの装置の種類や数は一例であり、本発明を限定する意図はない。例えば、複数の装置が一体化して設けられてもよいし、より多くの装置に機能分散することにより実現されてもよい。より具体的には、画像処理装置101が機械学習サーバ102及びデータサーバ105の少なくとも1つの機能を有して構成されてもよい。或いは、機械学習サーバ102が画像処理装置101の読取機能以外の機能及びデータサーバ105の機能のうち少なくとも1つの機能を有して構成されてもよい。
<画像処理装置の構成>
次に、図2を参照して、本実施形態に係る画像処理装置101のハードウェア構成について説明する。画像処理装置101は、スキャナ10、プリンタ20、操作部140、及びコントローラ1200を備える。コントローラ1200は、CPU1201、RAM1202、ROM1203、HDD1204、画像バスI/F1205、操作部I/F1206、及びスキャナ・プリンタ通信I/F1208備える。また、コントローラ1200は、LAN I/F1210、及びモデム1211、無線通信I/F1270、及びGPU1291を備える。これらのコンポーネントはシステムバス1207を介して相互にデータを送受することができる。また、コントローラ1200は、デバイスI/F1220、画像回転部1230、画像圧縮部1240、RIP1260、スキャナ画像処理部1280を備える。これらのコンポーネントと画像バスI/F1205とは、画像バス2008を介して相互に画像データを高速に転送することができる。
操作部140は、画像処理装置101を使用するユーザが各種の操作を行うためのユーザインタフェースである。スキャナ10は、操作部140からの指示に従って原稿から画像情報を読み取る。スキャナ10は、スキャナ10を制御するCPUや原稿読取を行うための不図示の照明ランプや走査ミラーなどを有する。プリンタ20は画像データに基づいて用紙へ印刷を実行する。プリンタ20は、プリンタ部の制御を行うCPUや画像形成や定着を行うための不図示の感光体ドラムや定着器を有する。
コントローラ1200は、操作部140、スキャナ10、及びプリンタ20を制御するとともに、LAN104、公衆回線(WAN)3001、及び無線LAN106を介した外部装置との情報の送受を制御する。CPU1201は画像処理装置101を統括的に制御する。RAM1202は、CPU1201が動作するためのシステムワークメモリであり、画像データを一時記憶するための画像メモリでもある。ROM1203は、CPU1201が実行するブートプログラムが格納されている。ハードディスクドライブ(HDD)1204は、システムソフトウェア、画像データ、及びソフトウェアカウンタ値などを格納する。コントローラ1200は、印刷やコピージョブ実行時の、ユーザ名や印刷部数、カラー印刷等、出力属性情報等をジョブ実行時の履歴をジョブログ情報としてHDD1204あるいはRAM1202に記録管理している。
GPU1291はデータをより多く並列処理することで効率的な演算を行うことができるので、ディープラーニングのような学習モデルを用いて複数回に渡り学習を行う場合にはGPU1291で処理を行うことが有効である。本実施形態では、画像処理装置101による処理はCPU1201に加えてGPU1291を用いる。画像処理装置101の処理はCPU1201又はGPU1291のみにより演算が行われてもよい。
また、コントローラ1200は、操作部I/F1206を介して、画像データを操作部140に対して出力する。また操作部I/F1206は操作部140から本画像処理装置を使用するユーザが入力した情報をCPU1201に伝える役割を有する。LAN I/F1210は、LAN104に接続され、汎用コンピュータ103やLAN104上の不図示の外部装置や外部端末との通信(送受信)を制御する。モデム1211は、公衆回線3001に接続され、不図示の外部のファクシミリ装置とのデータの通信(送受信)を行う。無線通信I/F1270は、無線106により外部の端末と接続する。また、スキャナ10及びプリンタ20と夫々通信を行う内部通信I/F1208と、これらを互いに接続するシステムバス1207とを備える。
ImageBusI/F1205は、システムバス1207及び画像バス1212を接続しデータ構造を変換するバスブリッジとして機能する。ラスタイメージプロセッサ(RIP)1260は、LAN104を介してLAN上の汎用コンピュータ103から受信した印刷ジョブに含まれるPDLコードを、ビットマップイメージに展開する。スキャナ画像処理部1280は、スキャナ10から入力された画像データに対して、補正、加工、編集を行う。プリンタ画像処理部1290は、プリンタ20で出力(印刷)される画像データに対して補正、解像度変換等を行う。画像回転部1230は画像データの回転を行う。画像圧縮部1240は、多値画像データについてはJPEG、2値画像データについてはJBIG、MMR又はMHの圧縮伸張処理を実行する。デバイスI/F1220は、スキャナ10及びプリンタ20とコントローラ1200を接続して画像データの同期系/非同期系の変換を行う。
<機械学習サーバ>
次に、図3を参照して、本実施形態に係る機械学習サーバ102の構成例を説明する。機械学習サーバ102は、CPU1301、RAM1302、ROM1303、HDD1304、ネットワーク部1310、IO部1305、及びGPU1306を備える。各コンポーネントは、システムバス1207を介して相互に接続されデータの送受を行うことができる。
CPU1301は、OS(Operating System)やアプリケーションソフトなどのプログラムをHDD1304から読み出して実行することで種々の機能を提供する。RAM1302はCPU1301がプログラムを実行する際のシステムワークメモリである。ROM1303はBIOS(Basic Input Output System)やOSを起動するためのプログラムや設定ファイルを記憶している。HDD1304はハードディスクドライブであって、システムソフトウェアなどが記憶されている。GPU1306はGPU1291と同様である。本実施形態では、機械学習サーバ102による処理にはCPU1301に加えてGPU1306を用いる。機械学習サーバ102の処理はCPU1301またはGPU1306のみにより演算が行われてもよい。
ネットワーク部1310はLAN104に接続され、画像処理装置101などの外部機器と双方向に通信(送受信)を行う。IO部1305はマルチタッチセンサ等を備えた液晶ディスプレイ入出力デバイスとから構成する不図示の操作部との情報を入出力するインタフェースである。操作部にはプログラムが指示する画面情報に基づき所定の解像度や色数等で所定の情報が描画される。例えば、GUI(Graphical User Interface)画面を形成し、操作に必要な各種ウィンドウやデータ等が表示される。 <本システムにおける機能構成>
次に、図4を参照して、図2のハードウェア構成例で示したハードウェア資源とプログラムを利用することで実現される機能構成400の一例について説明する。以下で説明する機能構成を実現するためのプログラムは、その構成要素ごとに各装置のストレージに格納されており、RAMに読み出されてCPUにて実行されるものである。例えば、画像処理装置101では、HDD1204に格納されている制御プログラムがRAM1202に読み出されてCPU1201にて実行されるものである。機械学習サーバ102や、データサーバ105も同様である。
本実施形態に係るシステムによれば、画像処理装置101の読み取った複数の電子データからOCR機能で文字データを抽出し、文字データを形態素解析(Morphological Analysis)して単語へ分解する。Bag-Of-WordsやTf-idf(Term Frequency-Inverse Document Frequency)、Word2Vecなどの手法に分解した単語を入力することによって得られる特徴量をベクトルとして取得する。その後、K-means法などの手法を用いてクラスタリングし、クラスタリングによって分類した複数の電子データからクラスタ毎のBag-Of-Wordsのような単語出現頻度表を生成する。ここでまでの機能が学習フェーズとなる。推定フェーズの機能として、まず単語出現頻度表を用いて新たに読み取った電子データの文字データと単語出現頻度表から類似度を表すスコアを取得する。その後、スコアに基づき電子データのファイル名称や格納先を決定する。これらの処理を実行する各機能部の機能を以下で詳細に説明する。
(画像処理装置)
画像処理装置101は、機能構成として、UI表示部401、データ記憶部402、JOB制御部403、画像読取部404、特定名称付与部405、及びスコア取得部406を含んで構成される。UI表示部401は、操作部I/F1206を介して操作部140に備える画面に対してユーザからの操作設定の受け付けやその操作受付画面を提供する。操作受付画面では特定名称付与部405が用いる名称をユーザに入力させることができる。データ記憶部402は、RAM1202やHDD1204に対して、電子データなど、画像処理装置101が入出力を行うデータの記録を行う。
JOB制御部403は、ユーザの指示に基づきコピーやファックス、プリント、スキャン画像送信等の画像処理装置101の基本機能の実行や基本機能の実行に伴い他のソフト構成要素間の指示やデータの送受信を中心的に行う。また、JOB制御部403は、画像読取部404から受け取った画像データをOCRで文字データを含む電子データに変換する。なお、画像データのOCRによる変換は、機械学習サーバ102やデータサーバ105で行ってもよい。画像読取部404は、JOB制御部403の指示に基づきコピーやスキャン機能を実行する制御を行う場合にスキャナ10により原稿を光学的に読み取る動作を行う。
特定名称付与部405は、JOB制御部403から受け取った電子データに付与する特定名称を決定する。また、特定名称付与部405は、後述のクラスタリング解析部415によって生成されたクラスタ毎の単語出現頻度表を受け取り、単語出現頻度表に対応した特定名称を登録し、特定名称と単語出現頻度表をクラスタ識別IDに対応付けて管理する。特定名称は、UI表示部403でクラスタ毎にユーザが設定することで登録される。ユーザに設定させる際に、単語出現頻度表の結果をUI表示部403に表示させ、ユーザの特定名称の入力を補助する。もちろん予め定めた命名規則によりユーザ入力を必要とすることなく特定名称を決定してもよい。
より詳細には、特定名称付与部405は、JOB制御部から受け取った電子データとクラスタ識別IDに対応付けたクラスタ毎の単語出現頻度表をスコア取得部406に渡し電子データのクラスタ識別ID毎のスコアを受け取る。そして特定名称付与部405は最も高いスコアとなったクラスタ識別IDに対応する特定名称をJOB制御部に渡す。クラスタごとのスコアに所定値以上の差が出なかった場合は、特定名称付与部405はUI表示部401に、クラスタ識別IDに紐づいた特定名称とスコア値とを表示し、使用する特定名称をユーザに選択させ、選択された特定名称をJOB制御部403に渡す。なお、特定名称の登録はユーザに行わせるのではなく、特定名称付与部405が単語出現頻度表に基づいて決定し登録する構成や、後述のクラスタリング解析部415から受け取る構成としてもよい。
スコア取得部406は、特定名称付与部405から受け取った電子データとクラスタ識別IDに対応付けたクラスタ毎の単語出現頻度表を用いて、電子データに含まれるOCR機能で抽出された文字データと単語出現頻度表との類似度を表すスコアを取得する。さらに、スコア取得部406は、取得したクラスタ識別ID毎のスコアを特定名称付与部405に送る。
(データサーバ)
データサーバ105は、データ収集・提供部410とデータ記憶部412とを含んで構成される。データ収集・提供部410は、機械学習サーバ102において学習するための学習データの収集と提供を行う。本発明のシステムにおいては画像処理装置101において原稿から読み取られた電子データを受信し、機械学習サーバ102へ提供する。また、収集先としては、他の画像処理装置や、汎用コンピュータ103、他のデータサーバから収集してもよい。即ち、目的の機械学習をさせるために必要なデータの収集が可能な装置であればよい。データ記憶部412は、収集した学習データの記録管理を行う。
(機械学習サーバ)
機械学習サーバ102は、特徴量抽出部413、クラスタリング部414、クラスタリング解析部415、及びデータ記憶部416を含んで構成される。機械学習サーバ102は、GPU1306やCPU1301を使用して以下で説明する各処理を実行する。
特徴量抽出部413は、複数の電子データの文字データを形態素解析して単語に分解する。そして、特徴量抽出部413は、形態素解析結果をBag-Of-WordsやTf-idf、Word2Vecなどの手法に入力させることによって得られる特徴量をベクトルとして取得する。特徴量抽出部413は、形態素解析して単語に分解した際に、単語の前処理として種々のフィルタリングを行う。例えば、名詞・動詞・形容詞に絞ったり、半角全角をそろえたり、原形に変換したり、3音以上の単語の末尾の長音を除去したり、頻出単語や一般的な単語を除外したり、類語辞書に基づき変換したり等を行う。この処理は、扱う文書の特性に合わせていろいろな処理が考えられるものであり、本発明を上記の処理に限定する意図はない。
クラスタリング部414は、特徴量抽出部413によって取得された電子データのベクトルに基づき、類似したベクトルを有する電子データを同一のクラスタに分類する。具体的には、クラスタリング部414は、K-means法やWard法などの手法を用いることで、電子データをクラスタ分けする。クラスタリングに必要なパラメータ、例えばK-means法のクラスタ数などは、電子データを受け取った際に受け取る構成や予めクラスタリング部414に設定することができる。さらに、クラスタリング部414は、クラスタを識別するためのクラスタ識別IDを各クラスタに付与し、各クラスタと電子データとを紐づけたクラスタリング結果を作成する。
クラスタリング解析部415は、特徴量抽出部413によって生成された各電子データの形態素解析結果をクラスタ毎に収集し、クラスタ毎の単語出現頻度表を生成する。単語出現頻度表の詳細については後述する。データ記憶部416は、データサーバ105から受信したデータや生成された学習データを、機械学習サーバ102のRAM1302やHDD1304へ一時的に記録する。
<クラスタの生成(学習フェーズ)>
次に、図5に示すフローチャートを参照して、本実施形態に係るシステムにおける単語出現頻度表を生成して特定名称を割り当てるクラスタの生成処理について説明する。ここでは、単語出現頻度表の生成と、特定名称の設定とを含む学習フェーズの処理を説明する。また、以下で説明する処理は、説明を容易にするため、画像処理装置101、機械学習サーバ102、及びデータサーバ105における処理が含まれるものとして説明するが、それぞれの処理を実行するプログラムは個別に実行されるプログラムである。また、ここでは、各装置に分散して学習フェーズが行われる例について説明するが、各処理が1つの装置、例えば、画像処理装置101、機械学習サーバ102、及びデータサーバ105が一体として設けられるようにしてもよい。或いは、スキャン機能以外の画像処理装置101の機能と、機械学習サーバ102、及びデータサーバ105が一体として設けられてもよい。この場合は、原稿の読み取りについては画像処理装置101で行い、その他の処理が一体化された装置で行われる。
まずS501で画像処理装置101のJOB制御部403は、ユーザからUI表示部401を経由して文書分類準備処理の実行指示を受け、画像処理装置101に載置された文書原稿束をスキャナ10によって読み取り電子データを作成する。電子データを作成する単位は、スキャナ10を用いて画像読取部404が読み取る原稿1ページごとでもよいし、ユーザが指定したページ単位でもよい。電子データ作成完了後、画像処理装置101は、LAN I/F1210を介してデータサーバ105のデータ収集・提供部410に送信する。送信されたデータはデータ記憶部412に記憶される。
続いて、S502で機械学習サーバ102の特徴量抽出部413は、データサーバ105のデータ記憶部412から複数の電子データを取得し、電子データから特徴量をベクトルとして取得する。ベクトルの取得は、前述した方法を用いて、例えば、図6に示すような電子データごとに単語と出現数を定義した形態素解析結果600、610を生成する。生成される電子データごとの形態素解析結果600、610は文書原稿から読み取られた電子データの含まれる抽出された単語ごとに識別IDと出現数とが紐付けて登録される。例えば、形態素解析結果600では、単語ID”1”の単語「負担」が当該電子データに17回含まれ、最も出現頻度が高く、他の単語と比較してもその出現数は突出した回数となっていることが分かる。一方、形態素解析結果610では、最も出現頻度が高い単語は「書類」、「審判」の2つの単語であり、その出現回数は4回となっており、他の単語と比較して突出した差がないことが分かる。
次に、S503で機械学習サーバ102のクラスタリング部414は、特徴量抽出部413が生成したベクトルを用いてクラスタリングを実行する。クラスタリングは、前述した方法を用いて、例えば、図7に示すようなクラスタ識別IDと分類した電子データを対応付けたクラスタリング結果を生成する。クラスタリング結果には、クラスタ識別ID701と、クラスタごとに分類された電子データの識別子702とが含まれる。図7の例では、クラスタ「1」に電子データ「1、3、4、・・・」が分類されていることが分かる。
S504でクラスタリング解析部415は、クラスタリング部414が生成したクラスタリング結果からクラスタ毎に特徴量抽出部413によって生成された各電子データの形態素解析結果を収集し、クラスタ毎の単語出現頻度表を生成する。単語出現頻度表は、例えばBag-Of-Wordsのような単語と出現数をまとめた、他の文書との類似度を取得できる形式とする。図8は本実施形態に係る単語出現頻度表800、810の一例を示す。単語出現頻度表800、810は、クラスタに分類された複数の電子データの形態素解析結果をまとめたものであり、単語ごとにその識別子である単語IDと、出現数とが紐付けて定義される。さらにクラスタリング解析部415はデータ収集・提供部410にクラスタ毎の単語出現頻度表を送信する。送信された単語出現頻度表はデータ記憶部416に記憶される。
S505で特定名称付与部405は、データサーバ105のデータ記憶部412からクラスタ毎の単語出現頻度表を取得し、UI表示部401に特定名称登録画面を表示し、ユーザから特定名称の入力を受け付け、特定名称付与情報を作成する。このとき、特定名称付与部405は単語出現頻度表をクラスタ識別IDと対応付けてデータ記憶部402に保存する。ユーザからの特定名称登録画面では、例えば、図9に示すような画面からクラスタ識別ID毎にユーザが入力した特定名称を図10に示す特定名称付与情報に登録する。ユーザが特定名称を決めるための情報として図9の特定名称登録画面の表示領域901、911に単語出現頻度表を表示するようにしてもよい。さらに、特定名称付与部405は更新した特定名称付与情報をデータ記憶部402に記憶し、本フローチャートの処理を終了する。
<特定名称登録画面>
次に、図9を参照して特定名称登録画面の一例について説明する。特定名称登録画面900、910はそれぞれ分類されたクラスタごとの特定名称をユーザに決定させるための画面である。特定名称登録画面900、910のそれぞれには、単語出現頻度のヒストグラムを表示する表示領域901、911と、入力領域902、912とが含まれる。表示領域901、911には、抽出された単語ごとに、出現回数を表す棒グラフが表示される。なお、図9に示すように、出現回数が多い単語から順に表示されることが望ましい。これにより、ユーザは出現頻度の高い単語を容易に確認することができ、より利便性を高めることができる。ユーザは出現回数を確認しつつ、入力領域902、912へ当該クラスタの特定名称を入力することができる。ここでは、ユーザが入力する方式を一例に説明したが、ユーザには特定名称に使用する単語を選択させ、選択された単語に従って所定の命名規則により特定名称を決定する方式でもよい。その場合、図9の表示領域901、911の各単語が選択可能に表示される。なお、何れか1つの単語を選択可能としてもよく、複数の単語を選択可能としてもよい。
図10は決定された特定名称付与情報の一例を示す。特定名称付与情報1000には、クラスタごとにクラスタ識別IDと、決定された特定名称とが紐付けて登録される。例えば、クラスタ識別IDが”1”のクラスタには、「輸出関連書類」との特定名称が割り当てられている。これは、例えば当該クラスタの中で最も出現頻度が高い単語は用いられており、即ち、特定名称とは当該クラスタの特徴を表す名称が割り当てられる。
<文書分類処理(推定フェーズ)>
次に、図11に示すフローチャートを参照して、文書分類処理の処理フローについて説明する。ここでは、学習フェーズで生成されたクラスタを用いて、所定の文書を分類する推定フェーズの処理について説明する。なお、本フローチャートは、生成されたクラスタを利用するジョブの一例として、指定された文書を分類して特定名称を割り当ててファイルを作成し、作成したファイルを送信する文書送信ジョブを受け付けた際の処理を示す。以下で説明する処理は、例えば、画像処理装置101のCPU1201がROM1203やHDD1204に格納された制御プログラムをRAM1202に読み出して実行することにより実現される。
まずS1101でJOB制御部403は、ユーザからUI表示部401を経由して文書送信ジョブの指示を受け、ジョブ実行を開始する。文書送信ジョブは、例えば、文書原稿等を読み取って作成した電子データを、指定されたメールアドレスに送信するEメール送信や指定されたファイルサーバのフォルダに電子データを送信するファイル送信である。
S1102でJOB制御部403は、文書原稿をスキャナ10で読み取り、電子データを生成する。ここでは、画像処理装置101の不図示の原稿台に載置された原稿をスキャナ10で読み取って電子データを作成する。なお、既にデータ記憶部402に記憶されている電子データを処理の対象としてもよい。
次に、S1103でJOB制御部403は、作成された電子データのクラスタ識別IDごとのスコアを取得する。より具体的には、まずJOB制御部403は特定名称付与部405に作成された電子データを渡す。特定名称付与部405は、スコア取得部406に電子データとともに、データ記憶部402に保存されたクラスタ識別ID毎の単語出現頻度表を渡す。スコア取得部406は、単語出現頻度表にある単語が、電子データのOCR機能で抽出された文字データに含まれるかを確認し、出現頻度に応じたスコアを取得する。スコアは、単語出現数の総和と単語ごとの出現数の比率で取得するようにし、他の単語出現頻度表のスコアと比較できるようにする。例えば、図8の単語出現頻度表800の単語の総和が217で、ある電子データに単語IDの”1(出現数32)”、”2(出現数30)”が含まれていた場合、「(32+30)/217×100」=28.5とスコアが取得される。スコア取得部406は、クラスタ識別IDごとのスコアを特定名称付与部405に渡す。
次に、S1104で特定名称付与部405は、受け取ったスコア値が、所定値以上の差があるかを確認し、スコア値に差があった場合は、S1105に進み、差がなかった場合はS1107に進む。S1105で特定名称付与部405は最もスコアの高かったクラスタ識別IDに対応する特定名称付与情報の特定名称をJOB制御部403に通知する。なお、特定名称が未登録の場合は、S505と同様に、UI表示部401に図9の特定名称設定画面を表示し、ユーザから特定名称の入力を受け付け、特定名称付与情報を更新するようにしてもよい。
続いて、S1006でJOB制御部403は通知された特定名称を用いて送信ジョブを実行し、本フローチャートの処理を終了する。例えば、Eメール送信を実行する場合は、送信するファイル名に特定名称を付与する。例えば、図10のクラスタ識別IDが”1”の特定名称を使用する場合は、特定名称に日付と識別番号を加えて「輸出関連書類_2021 10 27_0001.pdf」といったファイル名にする。ファイルサーバへの送信を実行する場合は、送信先のフォルダに特定名称をフォルダ名にしたフォルダを作成し、そのフォルダにファイルを送信する。
一方、S1104で所定値以上の差がないと判断した場合、S1107で特定名称付与部405は、UI表示部401に図12に示す特定名称選択画面を表示する。表示する特定名称はスコア値が近いクラスタ識別IDに限定してもよいし、全ての特定名称を表示するようにしてもよい。特定名称付与部405は、UI表示部401を経由して、ユーザが選択した特定名称、又は特定名称を使用しない旨の結果を受け取り、S1108に進む。
S1108で特定名称付与部405は、ユーザが特定名称を選択したか否かを確認する。特定名称が選択された場合は、選択されたクラスタ識別IDに対応する特定名称付与情報の特定名称をJOB制御部403に通知し、S1106に進む。特定名称を使用しない場合は、S1109に進む。S1109でJOB制御部403は特定名称を用いずに送信ジョブを実行し、本フローチャートの処理を終了する。特定名称を用いない場合は、例えば日付と識別番号とからなる名称して送信ジョブを実行する。
<特定名称選択画面>
図12を参照して、本実施形態に係る特定名称選択画面の一例を説明する。特定名称選択画面200は、候補となる特定名称と取得されたそのスコアと紐付けて表示する選択領域201と、ボタン202、203とを含んで構成される。
選択領域201には、例えばスコアの高い特定名称の候補がいくつか選択可能に表示される。図12の例では2つの候補が表示されている例を示すが、さらに多くの候補が表示されてもよく、全ての候補が表示されてもよい。ユーザは所望の候補を選択することができる。図12では1つ目の候補である特定名称「輸出関連書類」が選択された様子を示す。選択された候補の項目は強調して表示されることが望ましい。
ボタン202は特定名称を使用しない場合に選択されるボタンである、ボタン203は、選択領域201で何れかの候補は選択された状態で操作されると、選択した特定名称を用いて送信処理が実行されるボタンである。
以上説明したように、本実施形態に係る画像処理装置は、学習フェーズにおいて、原稿を読み取って出力される電子データを取得し、電子データから特徴量を抽出する。また、本画像処理装置は、複数の電子データごとに抽出された特徴量を用いて、複数の電子データを複数のクラスタに分類する。さらに、本画像処理装置は、分類されたクラスタごとに、分類された1以上の電子データから抽出された特徴量ごとの出現頻度を示す出現頻度表を生成し、クラスタごとに、出現頻度表を用いて特定名称を登録する。また、本画像処理装置は、推定フェーズにおいて、所定の原稿からの電子データについて、特徴量を抽出し、生成された出現頻度表と抽出した特徴量を用いて、当該電子データとクラスタごとの類似度を示すスコアを取得する。さらに、本画像処理装置は、取得されたスコアに基づいて、所定の原稿からの電子データに対する特定名称を決定する。これにより、ユーザの手を介さず、クラスタリング手法を用いて読み取った原稿から文書の分類に用いる単語出現頻度表を生成し、単語出現頻度表を用いることでユーザが予めキーワードを全て把握しておく必要がなく、文書を分類することが可能となる。このように、本実施形態によれば、文書分類のためのキーワードのユーザによる登録を簡略化し、処理対象の文書を好適に分類することができる。
なお、本システムは、画像処理装置101、機械学習サーバ102、及びデータサーバ105が協働して文書を分類する処理について説明したが、本発明を当該構成に限定する意図はない。例えば、画像処理装置101が機械学習サーバ102及びデータサーバ105の機能も備えてもよく、画像処理装置101がスキャナ10による画像読取機能のみを提供し、その他の処理については機械学習サーバ102で実現するようにしてもよい。つまり、本発明の画像処理装置は、画像処理装置、機械学習サーバ、及びデータサーバとして適用することができる。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
101:画像処理装置、102:機械学習サーバ、103:汎用コンピュータ、104:LAN、105:データサーバ

Claims (17)

  1. 画像処理装置であって、
    原稿を読み取って出力される電子データを取得する第1取得手段と、
    前記電子データから特徴量を抽出する抽出手段と、
    複数の電子データごとに抽出された前記特徴量を用いて、該複数の電子データを複数のクラスタに分類する分類手段と、
    前記分類手段によって分類されたクラスタごとに、分類された1以上の電子データから抽出された特徴量ごとの出現頻度を示す出現頻度表を生成する生成手段と、
    前記クラスタごとに、前記出現頻度表を用いて特定名称を登録する登録手段と
    を備えることを特徴とする画像処理装置。
  2. 前記第1取得手段によって取得された所定の原稿からの電子データについて、前記抽出手段によって特徴量を抽出させ、前記生成手段によって生成された前記出現頻度表と該抽出した特徴量を用いて、当該電子データとクラスタごとの類似度を示すスコアを取得する第2取得手段と、
    前記取得されたスコアに基づいて、前記所定の原稿からの電子データに対する特定名称を決定する決定手段と
    をさらに備えることを特徴とする請求項1に記載の画像処理装置。
  3. 前記決定手段は、他のクラスタのスコア値と所定値以上の差を有する最も高いスコア値のクラスタに設定された特定名称を用いて、前記所定の原稿からの電子データに対する特定名称を決定することを特徴とする請求項2に記載の画像処理装置。
  4. 前記決定手段は、他のクラスタのスコア値と所定値以上の差を有する最も高いスコア値のクラスタがない場合には、特定名称の候補となる1以上のクラスタの特定名称を選択可能に表示し、ユーザ入力により選択された特定名称を用いて、前記所定の原稿からの電子データに対する特定名称を決定することを特徴とする請求項2又は3に記載の画像処理装置。
  5. 特定名称の候補となる1以上のクラスタには、前記分類手段によって分類さ有れた前記複数のクラスタの全てが含まれることを特徴とする請求項4に記載の画像処理装置。
  6. 前記登録手段は、前記出現頻度表に含まれる特徴量ごとに出現頻度を表すグラフとともに、特定名称に関するユーザ入力を受け付ける登録画面を表示部に表示し、該ユーザ入力に従って前記クラスタごとの特定名称を登録することを特徴とする請求項1乃至5の何れか1項に記載の画像処理装置。
  7. 前記登録画面では、前記クラスタごとに登録される特定名称がユーザによって入力されることを特徴とする請求項6に記載の画像処理装置。
  8. 前記登録画面では、前記クラスタごとに1以上の特徴量が選択可能に表示され、
    前記登録手段は、選択された特徴量に基づいて前記クラスタごとの特定名称を決定して登録することを特徴とする請求項6に記載の画像処理装置。
  9. 原稿を読み取って電子データを出力する読取手段をさらに備え、
    前記第1取得手段は、前記読取手段から出力された電子データを取得することを特徴とする請求項1乃至8の何れか1項に記載の画像処理装置。
  10. 前記第1取得手段は、外部装置において原稿から読み取られた電子データを取得することを特徴とする請求項1乃至8の何れか1項に記載の画像処理装置。
  11. 前記特徴量は電子データを形態素解析して抽出された単語に対応し、前記出現頻度表は前記特徴量として抽出された単語ごとの出現頻度を示す表であることを特徴とする請求項1乃至10の何れか1項に記載の画像処理装置。
  12. 画像処理装置の制御方法であって、
    第1取得手段が、原稿を読み取って出力される電子データを取得する第1取得工程と、
    抽出手段が、前記電子データから特徴量を抽出する抽出工程と、
    分類手段が、複数の電子データごとに抽出された前記特徴量を用いて、該複数の電子データを複数のクラスタに分類する分類工程と、
    生成手段が、前記分類工程で分類されたクラスタごとに、分類された1以上の電子データから抽出された特徴量ごとの出現頻度を示す出現頻度表を生成する生成工程と、
    登録手段が、前記クラスタごとに、前記出現頻度表を用いて特定名称を登録する登録工程と
    を含むことを特徴とする画像処理装置の制御方法。
  13. 第2取得手段が、前記第1取得工程で取得された所定の原稿からの電子データについて、前記抽出手段によって特徴量を抽出させ、前記生成工程で生成された前記出現頻度表と該抽出した特徴量を用いて、当該電子データとクラスタごとの類似度を示すスコアを取得する第2取得工程と、
    決定手段が、前記取得されたスコアに基づいて、前記所定の原稿からの電子データに対する特定名称を決定する決定工程と
    をさらに含むことを特徴とする請求項12に記載の画像処理装置の制御方法。
  14. 画像処理装置の制御方法における各工程をコンピュータに実行させるためのプログラムであって、前記制御方法は、
    第1取得手段が、原稿を読み取って出力される電子データを取得する第1取得工程と、
    抽出手段が、前記電子データから特徴量を抽出する抽出工程と、
    分類手段が、複数の電子データごとに抽出された前記特徴量を用いて、該複数の電子データを複数のクラスタに分類する分類工程と、
    生成手段が、前記分類工程で分類されたクラスタごとに、分類された1以上の電子データから抽出された特徴量ごとの出現頻度を示す出現頻度表を生成する生成工程と、
    登録手段が、前記クラスタごとに、前記出現頻度表を用いて特定名称を登録する登録工程と
    を含むことを特徴とするプログラム。
  15. 前記制御方法が、
    第2取得手段が、前記第1取得工程で取得された所定の原稿からの電子データについて、前記抽出手段によって特徴量を抽出させ、前記生成工程で生成された前記出現頻度表と該抽出した特徴量を用いて、当該電子データとクラスタごとの類似度を示すスコアを取得する第2取得工程と、
    決定手段が、前記取得されたスコアに基づいて、前記所定の原稿からの電子データに対する特定名称を決定する決定工程と
    をさらに含むことを特徴とする請求項14に記載のプログラム。
  16. 画像処理システムであって、
    原稿を読み取って電子データを出力する読取手段と、
    前記電子データから特徴量を抽出する抽出手段と、
    複数の電子データごとに抽出された前記特徴量を用いて、該複数の電子データを複数のクラスタに分類する分類手段と、
    前記分類手段によって分類されたクラスタごとに、分類された1以上の電子データから抽出された特徴量ごとの出現頻度を示す出現頻度表を生成する生成手段と、
    前記クラスタごとに、前記出現頻度表を用いて特定名称を登録する登録手段と
    を備えることを特徴とする画像処理システム。
  17. 前記読取手段によって所定の原稿から出力された電子データについて、前記抽出手段によって特徴量を抽出させ、前記生成手段によって生成された前記出現頻度表と該抽出した特徴量を用いて、当該電子データとクラスタごとの類似度を示すスコアを取得する取得手段と、
    前記取得されたスコアに基づいて、前記所定の原稿からの電子データに対する特定名称を決定する決定手段と
    をさらに備えることを特徴とする請求項16に記載の画像処理システム。
JP2022047350A 2022-03-23 2022-03-23 画像処理装置、その制御方法、プログラム、及び画像処理システム Pending JP2023141170A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022047350A JP2023141170A (ja) 2022-03-23 2022-03-23 画像処理装置、その制御方法、プログラム、及び画像処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022047350A JP2023141170A (ja) 2022-03-23 2022-03-23 画像処理装置、その制御方法、プログラム、及び画像処理システム

Publications (1)

Publication Number Publication Date
JP2023141170A true JP2023141170A (ja) 2023-10-05

Family

ID=88205960

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022047350A Pending JP2023141170A (ja) 2022-03-23 2022-03-23 画像処理装置、その制御方法、プログラム、及び画像処理システム

Country Status (1)

Country Link
JP (1) JP2023141170A (ja)

Similar Documents

Publication Publication Date Title
JP4311738B2 (ja) 画像形成装置およびその制御方法、並びにコンピュータプログラム
US8326090B2 (en) Search apparatus and search method
US20080263036A1 (en) Document search apparatus, document search method, program, and storage medium
US11652932B2 (en) Image processing apparatus for setting a folder path by using a character string in a document
US11295156B2 (en) Image processing apparatus, method of controlling the same, and storage medium
JP5061151B2 (ja) オブジェクト取得装置、オブジェクト管理システム、オブジェクト管理方法
JP5660100B2 (ja) 文書管理サーバ、文書管理サーバの制御方法、およびそのプログラム、文書管理システム、文書管理システムの制御方法、およびそのプログラム
JP7353771B2 (ja) プログラム、記憶媒体、情報処理装置の制御方法、及び情報処理装置
US11137946B2 (en) Image processing apparatus, method for controlling the same and storage medium
US8266146B2 (en) Information processing apparatus, information processing method and medium storing program thereof
US11301675B2 (en) Image processing apparatus, image processing method, and storage medium
JP4539720B2 (ja) 画像処理装置および方法ならびにそのためのプログラム
US11223731B2 (en) Image processing apparatus, method for controlling the same and storage medium
JP2023141170A (ja) 画像処理装置、その制御方法、プログラム、及び画像処理システム
JP4604787B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JP6135360B2 (ja) 情報機器およびコンピュータープログラム
JP2008242642A (ja) 画像形成装置
JPH10150521A (ja) ドキュメント処理装置およびその制御方法
JP7446724B2 (ja) 画像処理装置、その制御方法及びプログラム
JP2007172233A (ja) 画像処理履歴管理装置
JP2007172234A (ja) 画像処理履歴管理装置
JP4192611B2 (ja) 文書管理プログラム、文書管理装置、および文書管理方法
JP2003234859A (ja) 画像処理装置
JP2009289265A (ja) 画像処理装置、画像処理方法
JP2011097200A (ja) 画像形成装置