JP2012015896A - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP2012015896A
JP2012015896A JP2010152019A JP2010152019A JP2012015896A JP 2012015896 A JP2012015896 A JP 2012015896A JP 2010152019 A JP2010152019 A JP 2010152019A JP 2010152019 A JP2010152019 A JP 2010152019A JP 2012015896 A JP2012015896 A JP 2012015896A
Authority
JP
Japan
Prior art keywords
file
character
image
file name
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010152019A
Other languages
English (en)
Inventor
Hideki Akiyama
英樹 秋山
Koichi Nobeshima
康一 延島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Riso Kagaku Corp
Original Assignee
Riso Kagaku Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Riso Kagaku Corp filed Critical Riso Kagaku Corp
Priority to JP2010152019A priority Critical patent/JP2012015896A/ja
Publication of JP2012015896A publication Critical patent/JP2012015896A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Facsimiles In General (AREA)

Abstract

【課題】原稿の画像を読み取って得た画像データのファイルに、ユーザが認識しやすいファイル名を自動的に付与する。
【解決手段】画像処理装置1は、原稿の画像を読み取る画像読取部2と、画像読取部2で原稿の画像を読み取って得られた画像データから文字を認識する文字認識処理部322と、画像データのファイルを生成するファイル生成部321とを備え、ファイル生成部321は、文字認識処理部322で認識された、原稿上の所定領域内の所定サイズ以上の文字からなる文字列の少なくとも一部をファイルのファイル名として付与する。
【選択図】図1

Description

本発明は、原稿の画像を読み取って電子化する画像処理装置に関する。
従来、原稿の画像を読み取って電子化する装置において、原稿の画像データのファイルを保存等する際に、特に指定されなければ、画像データのファイルにファイル名を自動的に付与することが行われている。この際、読み取りを行った日時等が自動的にファイル名に決定される。
このようなファイル名が付与されると、ファイルの保存先に類似するファイル名が複数存在し、ユーザが目的のファイルを見つけにくいことがあった。
そこで、特許文献1では、原稿の画像を読み取って得た画像データから文字を認識し、原稿中で出現頻度の高い文字列を、画像データのファイル名とする技術が提案されている。
特開2006−211261号公報
しかしながら、出現頻度の高い文字列が、原稿の内容を反映した重要な語句等を示す文字列や、原稿上で視認されやすい文字列などの、ユーザにとって認識しやすい文字列であるとは限らない。このため、特許文献1の技術では、ユーザにとって認識しにくいファイル名が付与されることがあった。
本発明は上記に鑑みてなされたもので、原稿の画像を読み取って得た画像データのファイルに、ユーザが認識しやすいファイル名を自動的に付与することができる画像処理装置を提供することを目的とする。
上記目的を達成するため、本発明に係る画像処理装置の第1の特徴は、原稿の画像を読み取る画像読取部と、前記画像読取部で原稿の画像を読み取って得られた画像データから文字を認識する文字認識処理部と、前記画像データのファイルを生成するファイル生成部とを備え、前記ファイル生成部は、前記文字認識処理部で認識された、原稿上の所定領域内の所定サイズ以上の文字からなる文字列の少なくとも一部を前記ファイルのファイル名として付与することにある。
本発明に係る画像処理装置の第2の特徴は、前記ファイル生成部は、前記ファイルの保存先に前記ファイル名と同一のファイル名を有する保存済みのファイルが存在する場合に、前記ファイル名に他の文字列を付加することにある。
本発明に係る画像処理装置の第3の特徴は、前記ファイル生成部は、本装置にログインしたユーザに係るユーザ情報を示す文字列を前記ファイル名に付加することにある。
本発明に係る画像処理装置の第1の特徴によれば、原稿を読み取って得られた画像データに対して文字認識処理を行い、原稿上の所定領域内の所定サイズ以上の文字からなる文字列の少なくとも一部を画像データのファイルのファイル名とすることで、ユーザが認識しやすいファイル名を自動的に付与することができる。
本発明に係る画像処理装置の第2の特徴によれば、文字認識処理に基づいて決定したファイル名と同一のファイル名が保存先にすでに存在する場合、ファイル名に他の文字列を付加するので、保存先におけるファイル名の重複を回避することができる。
本発明に係る画像処理装置の第3の特徴によれば、画像処理装置にログインしたユーザ情報を示す文字列をファイル名に付加するので、ユーザにとってのファイル名の識別をより容易にすることができる。
本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。 図1に示す画像処理装置においてファイル名を決定する手順を示すフローチャートである。 原稿の一例を示す図である。
以下、本発明の実施の形態について、図面を参照して説明する。
図1は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。図1に示すように、本実施の形態に係る画像処理装置1は、画像読取部2と、制御部3と、記憶部4と、入力部5とを備える。
画像読取部2は、読取センサ21と、A/D変換部22とを備える。
読取センサ21は、複数のCCD(Charge Coupled Device)素子等の光電変換素子が配列されたラインセンサを有し、原稿の画像を光学的に読み取ってアナログの画像信号を出力する。
A/D変換部22は、読取センサ21から入力されるアナログの画像信号をデジタルの画像データに変換する。
制御部3は、CPU、プログラム等を格納するメモリ等を備えて構成され、CPUがプログラムに応じた処理を行うこと等で、読取制御部31、画像処理部32が構成される。
読取制御部31は、画像読取部2の動作を制御する。
画像処理部32は、ファイル生成部321と、文字認識処理部322とを備える。
ファイル生成部321は、画像読取部2で原稿の画像を読み取って得られた画像データにシェーディング補正、ガンマ補正等の所定の画像処理を施した後、PDF,TIFF,JPEG等の形式でファイル化し、この画像データのファイルを記憶部4の所定のフォルダに保存する。この際、ファイル生成部321は、文字認識処理部322で決定されたファイル名をファイルに付与して記憶部4に保存する。
文字認識処理部322は、画像データのファイルに付与するファイル名を決定するために、画像データに対して文字認識処理を行う。文字認識処理部322は、原稿上の所定領域内の所定サイズ以上の文字からなる文字列がある場合、その文字列の少なくとも一部を、画像データのファイルのファイル名に決定する。文字認識処理には、周知のOCR(Optical Character Recognition)技術を用いればよい。
記憶部4は、HDD等の記憶装置からなり、ファイル名が付与された画像データのファイルを保存する。
入力部5は、各種操作ボタン、タッチパネル(いずれも図示せず)等を有し、ユーザによる入力操作を受け付け、操作に応じた操作信号を出力する。
次に、画像処理装置1の動作について説明する。
入力部5からユーザ操作に応じて読み取りの開始を指示する信号が入力されると、読取制御部31は、画像読取部2にセットされた原稿の画像を読み取るよう読取センサ21を制御する。
読取センサ21は、原稿の画像を読み取ると画像信号を出力する。次いで、A/D変換部22は、読取センサ21から入力されるアナログの画像信号をデジタルの画像データに変換する。
文字認識処理部322は、原稿の画像データに対する文字認識処理を行い、画像データのファイルに付与するファイル名を決定する。このファイル名を決定する処理については後述する。
ファイル生成部321は、画像データに所定の画像処理を施した後、所定の形式で画像データのファイルを生成する。そして、ファイル生成部321は、ファイルに文字認識処理部322で決定されたファイル名を付与し、このファイルを記憶部4に保存する。
次に、画像データのファイルに付与するファイル名を決定する処理について、図2に示すフローチャートを参照して説明する。
画像読取部2から原稿の画像データが入力されると、ステップS10において、文字認識処理部322は、画像データに基づいて、原稿における文字領域を抽出する。文字領域の抽出方法としては、さまざまな公知の方法を用いることができるが、例えば、ヒストグラムを用いる方法を適用できる。図3に示す原稿の例では、破線で囲った文字領域が抽出される。なお、文字領域は、図3のように行を単位として抽出してもよいし、段落、節等の他の単位を基準として抽出してもよい。
次いで、文字認識処理部322は、原稿における予め設定された所定領域(タイトル領域)内に、文字領域が存在するか否かを判断する。ここで、予め設定するタイトル領域は、ファイル名にした場合にユーザが認識しやすいと考えられる、原稿のタイトルや見出し等が配置されることが多い領域とする。例えば、横書きの原稿であれば、原稿中の上部や左上部の領域とし、縦書きの原稿であれば、右部や右上部の領域とする。例えば、図3のような原稿において、破線10より上の領域Sをタイトル領域とする。タイトル領域内に文字領域がある場合(ステップS20:YES)、ステップS30に進み、タイトル領域内に文字領域がない場合(ステップS20:NO)、ステップS130に進む。
ステップS30では、文字認識処理部322は、タイトル領域に含まれる最初の文字領域の各文字を、OCR技術を用いて認識する。最初の文字領域は、横書きの原稿であれば、最も上にある文字領域とし、縦書きの原稿であれば、最も右にある文字領域とする。
文字認識処理において、文字認識処理部322は、具体的には、各文字の画像データをそれぞれベクトル量に変換し、変換したベクトル量を、記憶部4等に予め記憶された、各文字カテゴリ単位で構成された内蔵データベースとそれぞれ照合し、類似点が多いものを当該文字として認識する。
次いで、ステップS40において、文字認識処理部322は、文字認識した文字領域に所定サイズ以上の文字が含まれるか否かを判断する。文字のサイズは、文字認識処理部322において、例えば、文字認識した文字の外枠サイズを、記憶部4等に予め記憶された、予めサイズが分かっている内蔵フォントのサイズと比較することで判別する。
所定サイズ以上の文字が含まれる場合(ステップS40:YES)、ステップS50において、文字認識処理部322は、ファイル名を仮に決定する。例えば、文字認識した文字領域内の全文字が所定サイズ以上の文字である場合において、その全文字からなる文字列をファイル名としてもよいし、最初の所定数の文字列をファイル名としてもよい。本実施の形態において、文字列は、1つ以上の文字、記号等からなる。例えば、図3において、領域S内の文字領域11内の全文字が所定サイズ以上とすると、「○○大会のお知らせ」という文字列をファイル名としてもよいし、例えば「○○大会」という文字列をファイル名としてもよい。また、文字領域内に所定サイズ以上の文字と所定サイズ未満の文字とが混在している場合において、所定サイズ以上の文字からなる文字列の少なくとも一部を、ファイル名とするようにしてもよい。
所定サイズ以上の文字が含まれない場合(ステップS40:NO)、ステップS60において、文字認識処理部322は、所定領域(タイトル領域)内に文字認識をまだ行っていない文字領域があるか否かを判断する。文字認識をまだ行っていない文字領域がある場合(ステップS60:YES)、ステップS70に進み、文字認識をまだ行っていない文字領域がない場合(ステップS60:NO)、ステップS130に進む。
ステップS70では、文字認識処理部322は、所定領域(タイトル領域)内の次の文字領域の文字認識を行い、その後、ステップS40に戻る。次の文字領域は、前回文字認識した文字領域に対し、横書きの原稿であれば、直下にある文字領域とし、縦書きの原稿であれば、左に隣接する文字領域とする。
ステップS80では、文字認識処理部322は、記憶部4における保存先のフォルダに保存済みのファイル名のなかに、ステップS50で仮に決定したファイル名と同一のファイル名があるか否かを判断する。同一のファイル名がある場合(ステップS80:YES)、ステップS100に進み、同一のファイル名がない場合(ステップS80:NO)、ステップS90に進む。
ステップS90では、文字認識処理部322は、ステップS50で仮に決定したファイル名を、正式にファイル名に決定する。
ステップS100では、文字認識処理部322は、所定領域(タイトル領域)内における文字認識済みの他の文字領域があるか否かを判断する。ここで、他の文字領域は、所定サイズ以上の文字を含む文字領域が検出される以前に文字認識が行われ、所定サイズ以上の文字を含まない文字領域である。文字認識済みの他の文字領域がある場合(ステップS100:YES)、ステップS110に進み、文字認識済みの他の文字領域がない場合(ステップS100:NO)、ステップS120に進む。
ステップS110では、文字認識処理部322は、文字認識済みの他の文字領域のうちの1つから、ファイル名とする文字列を決定する。例えば、文字認識済みの他の文字領域のなかで最も上の位置(横書き原稿の場合)または最も右の位置(縦書き原稿の場合)にある文字領域の文字列をファイル名として決定してもよいし、文字認識済みの他の文字領域のなかで最も大きなサイズの文字からなる文字列をファイル名に決定してもよい。
この際、文字認識処理部322は、他の文字領域から決定したファイル名と同一のファイル名が保存先に存在するか否かを判断し、同一のファイル名が存在する場合は、さらに他の文字認識済みの文字領域からファイル名とする文字列を決定する。
ステップS120では、文字認識処理部322は、ステップS50で仮に決定したファイル名に、他の文字列を付加してファイル名とする。付加する他の文字列は、例えば、識別番号を示す文字列とする。この際、文字認識処理部322は、他の文字列を付加したファイル名と同一のファイル名が保存先に存在するか否かを判断し、同一のファイル名が存在する場合は、付加する文字列を変更する。
なお、ステップS100,S110は省略し、文字認識処理部322は、ステップS80で「YES」と判断した場合に、そのままステップS120の処理を行うようにしてもよい。
ステップS130では、文字認識処理部322は、予め決められた所定の規則でファイル名を決定する。例えば、今回の読み取りを行った日時を示す文字列をファイル名とする。
上記のような図2のフローチャートの一連の処理により、原稿の所定領域(タイトル領域)内に所定サイズ以上の文字からなる文字列がある場合、その文字列の少なくとも一部がファイルのファイル名に決定される(ステップS90)。ただし、このように決めたファイル名と同一のファイル名が保存先にすでに存在する場合、所定領域(タイトル領域)内における文字認識済みの他の文字領域の文字列からファイル名が決定される(ステップS110)か、上記のように決めたファイル名に識別番号等の他の文字列を付加する(ステップS120)。
また、原稿の所定領域(タイトル領域)内に文字領域がない場合や、文字領域があっても所定サイズ以上の文字がある文字領域がない場合は、予め決められた所定の規則でファイル名が決定される(ステップS130)。
なお、複数ページ分の画像データを1ファイルとする場合は、最初のページを対象として、図2のフローチャートの処理を行ってファイル名を決定すればよい。
以上説明したように本実施の形態によれば、原稿を読み取って得られた画像データに対して文字認識処理を行い、原稿の所定領域(タイトル領域)内の所定サイズ以上の文字からなる文字列の少なくとも一部を、画像データのファイルのファイル名とするので、ユーザが認識しやすいファイル名を自動的に付与することができる。
また、本実施の形態では、ファイル名となる文字列として、所定領域(タイトル領域)内における所定サイズ以上の文字からなる文字列を検出すると、それ以降は文字認識処理を行わない。このため、ファイル名を決定する処理を高速に行うことができる。
また、文字認識処理に基づいて決定したファイル名と同一のファイル名が保存先にすでに存在する場合、ファイル名に他の文字列を付加するので、保存先におけるファイル名の重複を回避することができる。
なお、画像処理装置1がログイン機能を有する場合、文字認識処理部322は、ログインしたユーザのユーザ名等のユーザ情報を示す文字列を、図2のフローチャートの処理で決定したファイル名に付加するようにしてもよい。このようにすれば、ユーザにとってのファイル名の識別をより容易にすることができる。
なお、ファイルの保存先は、画像処理装置1が備える記憶部4に限らず、ネットワークを介して画像処理装置1に接続されたファイルサーバや、USBメモリ等の画像処理装置1に着脱可能な記憶装置であってもよい。
また、画像データのファイルを電子メールで外部装置に送信する場合において、図2のステップS10〜S70,S130と同様の手順を用いてファイル名を決定するようにしてもよい。
1 画像処理装置
2 画像読取部
3 制御部
4 記憶部
5 入力部
21 読取センサ
22 A/D変換部
31 読取制御部
32 画像処理部
321 ファイル生成部
322 文字認識処理部

Claims (3)

  1. 原稿の画像を読み取る画像読取部と、
    前記画像読取部で原稿の画像を読み取って得られた画像データから文字を認識する文字認識処理部と、
    前記画像データのファイルを生成するファイル生成部とを備え、
    前記ファイル生成部は、前記文字認識処理部で認識された、原稿上の所定領域内の所定サイズ以上の文字からなる文字列の少なくとも一部を前記ファイルのファイル名として付与することを特徴とする画像処理装置。
  2. 前記ファイル生成部は、前記ファイルの保存先に前記ファイル名と同一のファイル名を有する保存済みのファイルが存在する場合に、前記ファイル名に他の文字列を付加することを特徴とする請求項1に記載の画像処理装置。
  3. 前記ファイル生成部は、本装置にログインしたユーザに係るユーザ情報を示す文字列を前記ファイル名に付加することを特徴とする請求項1または2に記載の画像処理装置。
JP2010152019A 2010-07-02 2010-07-02 画像処理装置 Pending JP2012015896A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010152019A JP2012015896A (ja) 2010-07-02 2010-07-02 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010152019A JP2012015896A (ja) 2010-07-02 2010-07-02 画像処理装置

Publications (1)

Publication Number Publication Date
JP2012015896A true JP2012015896A (ja) 2012-01-19

Family

ID=45601776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010152019A Pending JP2012015896A (ja) 2010-07-02 2010-07-02 画像処理装置

Country Status (1)

Country Link
JP (1) JP2012015896A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016165059A (ja) * 2015-03-06 2016-09-08 シャープ株式会社 画像処理装置
JP2018190063A (ja) * 2017-04-28 2018-11-29 京セラドキュメントソリューションズ株式会社 情報処理装置
JP2018190062A (ja) * 2017-04-28 2018-11-29 京セラドキュメントソリューションズ株式会社 情報処理装置、及びファイル名設定方法
JP2020184716A (ja) * 2019-05-09 2020-11-12 京セラドキュメントソリューションズ株式会社 画像処理装置、画像処理プログラム及び画像処理方法
JP2020184717A (ja) * 2019-05-09 2020-11-12 京セラドキュメントソリューションズ株式会社 画像処理装置、画像処理プログラム及び画像処理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08153110A (ja) * 1994-11-30 1996-06-11 Canon Inc 文書ファイリング装置及び方法
JP2005056315A (ja) * 2003-08-07 2005-03-03 Ricoh Co Ltd 情報処理装置、プログラム及び記憶媒体
JP2008066819A (ja) * 2006-09-05 2008-03-21 Kyocera Mita Corp 画像形成装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08153110A (ja) * 1994-11-30 1996-06-11 Canon Inc 文書ファイリング装置及び方法
JP2005056315A (ja) * 2003-08-07 2005-03-03 Ricoh Co Ltd 情報処理装置、プログラム及び記憶媒体
JP2008066819A (ja) * 2006-09-05 2008-03-21 Kyocera Mita Corp 画像形成装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016165059A (ja) * 2015-03-06 2016-09-08 シャープ株式会社 画像処理装置
JP2018190063A (ja) * 2017-04-28 2018-11-29 京セラドキュメントソリューションズ株式会社 情報処理装置
JP2018190062A (ja) * 2017-04-28 2018-11-29 京セラドキュメントソリューションズ株式会社 情報処理装置、及びファイル名設定方法
JP2020184716A (ja) * 2019-05-09 2020-11-12 京セラドキュメントソリューションズ株式会社 画像処理装置、画像処理プログラム及び画像処理方法
JP2020184717A (ja) * 2019-05-09 2020-11-12 京セラドキュメントソリューションズ株式会社 画像処理装置、画像処理プログラム及び画像処理方法
JP7246610B2 (ja) 2019-05-09 2023-03-28 京セラドキュメントソリューションズ株式会社 画像処理装置、画像処理プログラム及び画像処理方法
JP7287097B2 (ja) 2019-05-09 2023-06-06 京セラドキュメントソリューションズ株式会社 画像処理装置、画像処理プログラム及び画像処理方法

Similar Documents

Publication Publication Date Title
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
JP2014013534A (ja) 文書処理装置、画像処理装置、文書処理方法及び文書処理プログラム
JP2009193356A (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2012015896A (ja) 画像処理装置
US8538154B2 (en) Image processing method and image processing apparatus for extracting heading region from image of document
US9614984B2 (en) Electronic document generation system and recording medium
JP5661549B2 (ja) 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム
JP5412903B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
US20220068276A1 (en) Information processor, print system, and control method
US11503170B2 (en) Image processing apparatus, image processing method, and storage medium
JP2009169675A (ja) 文書処理装置、文書処理方法および文書処理プログラム
JP5950700B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5412916B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP4811133B2 (ja) 画像形成装置及び画像処理装置
CN113495874A (zh) 信息处理装置和计算机可读取介质
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
US9400926B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
JP5310206B2 (ja) 文書処理装置、文書処理方法および文書処理プログラム
JP7263721B2 (ja) 情報処理装置及びプログラム
JP6201686B2 (ja) テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム
JP2006085234A (ja) 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
JP2012049860A (ja) 画像処理装置、画像処理方法およびプログラム
JP2009026075A (ja) 画像処理装置
JP2007018158A (ja) 文字処理装置、文字処理方法及び記録媒体
JP2007049245A (ja) 音声入力機能付撮影装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130508

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140610

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140806

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20141209