JP2009027648A - Image processing device - Google Patents
Image processing device Download PDFInfo
- Publication number
- JP2009027648A JP2009027648A JP2007191387A JP2007191387A JP2009027648A JP 2009027648 A JP2009027648 A JP 2009027648A JP 2007191387 A JP2007191387 A JP 2007191387A JP 2007191387 A JP2007191387 A JP 2007191387A JP 2009027648 A JP2009027648 A JP 2009027648A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- image
- character
- image processing
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Storing Facsimile Image Data (AREA)
Abstract
Description
本発明は、与えられた画像データのファイルを作成する画像処理装置に関する。 The present invention relates to an image processing apparatus for creating a file of given image data.
原稿をスキャンして画像ファイルを生成する際、ファイル名を自動的に生成する装置が知られている。これらの装置では、シリアルナンバー又はファイル生成時の日付情報を用いてファイル名を生成するものがある。しかし、これではユーザがファイル名を見ても、ファイルの内容が判別できず不便である。 An apparatus that automatically generates a file name when generating an image file by scanning a document is known. Some of these apparatuses generate a file name using serial number or date information at the time of file generation. However, this is inconvenient even if the user looks at the file name and the contents of the file cannot be determined.
そこで、読み取った画像をOCR(Optical Character Reader)処理し、原稿より特徴的な文字列を抽出してファイル名とする技術が提案されている(特許文献1)。特徴的な文字列は原稿中からいくつか抽出されるので、特許文献1ではプリセット領域にのみ文字認識を行い、文字列を抽出する。また、特徴的な文字列が複数抽出された場合には、出現頻度の高い順にならべて表示し、ユーザにそのうちの1つを選択させる技術も提案されている(特許文献2)。この場合でも、抽出された文字列の中の1つでファイルの内容が把握できるとは限らず、ユーザの操作も必要となる。複数の文字列を結合してファイル名とする技術も提案されているが(特許文献3)、複数の文字列を順次キー操作で入力する必要があり、ユーザの負担が大きい。
そこで、本発明の解決すべき課題は、ユーザが画像データの内容を容易に把握できるファイル名を自動的に生成できる画像処理装置の提供である。 Therefore, a problem to be solved by the present invention is to provide an image processing apparatus that can automatically generate a file name that allows a user to easily grasp the contents of image data.
上記の課題を解決するため、画像処理装置が、与えられた画像データの画像の中から文字認識により複数の文字列を抽出する文字認識部と、前記複数の文字列を結合することによって結合文字列を作成する文字列処理部と、前記結合文字列をファイル名として、前記画像データのファイルを生成するファイル生成部とを備える。 In order to solve the above problem, the image processing apparatus combines a character recognition unit that extracts a plurality of character strings by character recognition from an image of given image data, and combines the plurality of character strings. A character string processing unit that generates a sequence; and a file generation unit that generates the image data file using the combined character string as a file name.
また、前記画像処理装置において、前記文字列処理部は、前記結合文字列中に、結合される前の前記文字列間の境界を識別するための区切り記号を挿入する。 In the image processing apparatus, the character string processing unit inserts a delimiter for identifying a boundary between the character strings before being combined into the combined character string.
また、前記画像処理装置において、前記文字認識部は、所定の操作部を介して予め設定された数だけ、前記文字列を前記画像の中から抽出する。 In the image processing apparatus, the character recognition unit extracts the character string from the image by a predetermined number via a predetermined operation unit.
また、前記画像処理装置において、前記文字列処理部は、前記結合文字列の文字数が予め定められた上限値を超える場合には、前記結合文字列の末尾の前記文字列又は末尾の前記文字列中の文字を切り捨てる。 Further, in the image processing device, the character string processing unit, when the number of characters of the combined character string exceeds a predetermined upper limit, the character string at the end of the combined character string or the character string at the end Truncate the characters inside.
また、前記画像処理装置において、前記文字認識部は、前記画像の中から予め定められた特徴を有する文字列を抽出する。 In the image processing apparatus, the character recognition unit extracts a character string having a predetermined characteristic from the image.
また、前記画像処理装置において、原稿の画像を読み取り、前記画像データを出力する読取部をさらに備える。 The image processing apparatus further includes a reading unit that reads an image of a document and outputs the image data.
本発明によれば、文字認識により画像データの画像の中から複数の文字列が抽出され、その複数の文字列が結合されてなる結合文字列が画像データのファイル名として用いられる。これによって、ユーザが画像データの内容を容易に把握できるファイル名を自動的に生成できる。このように生成されたファイル名は、ファイル名に含まれる文字列を用いたキーワード検索等にも利用でき、便利である。 According to the present invention, a plurality of character strings are extracted from the image data image by character recognition, and a combined character string formed by combining the plurality of character strings is used as a file name of the image data. As a result, a file name that allows the user to easily grasp the contents of the image data can be automatically generated. The file name generated in this way can be used for keyword search using a character string included in the file name and is convenient.
また、本発明によれば、ファイル名として用いられる結合文字列中には、結合される前の文字列間の境界を識別するための区切り記号が挿入されるため、ユーザが結合文字列に含まれる各文字列を容易に把握できる。 Further, according to the present invention, since the delimiter for identifying the boundary between the character strings before being combined is inserted into the combined character string used as the file name, the user is included in the combined character string. You can easily grasp each character string.
また、本発明によれば、画像データの画像の中から自動的に抽出させる文字列の数をユーザが予め設定できるため、ユーザの要望の柔軟に対応できる。 Further, according to the present invention, the user can set in advance the number of character strings to be automatically extracted from the image of the image data, so that the user's request can be flexibly handled.
また、本発明によれば、結合文字列の文字数が予め定められた上限値を超える場合には、結合文字列の末尾の文字列又は末尾の文字列中の文字が切り捨てられるため、ファイル名の長さが自動的に適切の範囲内に抑えられる。 Further, according to the present invention, when the number of characters in the combined character string exceeds a predetermined upper limit value, the character string at the end of the combined character string or the character in the character string at the end is truncated. The length is automatically kept within an appropriate range.
また、本発明によれば、画像データの画像の中から予め定められた特徴を有する文字列が抽出され、その文字列を用いて画像データのファイル名が作成されるため、ユーザがファイル名に基づいて画像データの内容を的確に把握できる。 According to the present invention, a character string having a predetermined characteristic is extracted from an image of the image data, and a file name of the image data is created using the character string. Based on this, the contents of the image data can be accurately grasped.
また、本発明によれば、読取部によって読み取った画像データを保存する際に、ユーザが画像データの内容を容易に把握できるファイル名を自動的に生成できる。 Further, according to the present invention, when saving the image data read by the reading unit, a file name that allows the user to easily grasp the contents of the image data can be automatically generated.
図1は、本発明の一実施形態に係る画像処理装置としてのファクシミリ複合装置(以下、単に「複合装置」という)のブロック図である。この複合装置は、図1に示すように、MPU(Micro Processing Unit)11、NCU(Network Control Unit)12、モデム(MODEM)13、読取部としてのCCD(Charge Coupled Device)14、画像処理回路15、ファクシミリ用CODEC(符号化復号器)16、JPEG(Joint Photographic Experts Group)用CODEC17、操作部18、ROM(Read Only Memory)19、SRAM(Static Random Access Memory)20、画像メモリ21、ハードディスクインターフェース22、ハードディスクドライブ(HDD(Hard Disk Drive))23、プリンタ24、及びLAN(Local Area Network)インターフェース25を備えている。この複合装置1に備えられる機能には、プリンタ機能、ファクシミリ機能、インターネットファクシミリ機能、コピー機能、及びスキャナ機能等が含まれる。スキャナ機能には、読み取った画像データを所定の保存先に保存する機能(スキャン・トゥ・フォルダ、又はスキャン・トゥ・FTP(File Transfer Protocol)等)が含まれている。
FIG. 1 is a block diagram of a facsimile composite apparatus (hereinafter simply referred to as “composite apparatus”) as an image processing apparatus according to an embodiment of the present invention. As shown in FIG. 1, the composite apparatus includes an MPU (Micro Processing Unit) 11, an NCU (Network Control Unit) 12, a modem (MODEM) 13, a CCD (Charge Coupled Device) 14 as a reading unit, and an
MPU11は、この複合装置1の制御を統括するものであり、ソフトウェアにより動作する。このMPU11の機能要素としては、読取制御部11a、文字認識部11b、文字列処理部11c及びファイル生成部11dが備えられる。これらの機能要素の役割等については後に詳述する。
The MPU 11 supervises the control of the
NCU12は、アナログの公衆電話回線網(PSTN:Public Switched Telephone Network)との回線の接続等を行うハードウェアであり、必要に応じてモデム13を公衆電話回線網と接続する。モデム13は、ファクシミリ通信が可能なファクシミリモデムから構成されている。
The NCU 12 is hardware for connecting a line to an analog public switched telephone network (PSTN), and connects the
CCD14は、原稿の画像を読み取る素子であり、後述するMPU11の読取制御部11aによって制御される。画像処理回路15は、CCD14から与えられた画像データに対して各種補正等の画像処理を施す。
The
ファクシミリ用CODEC16は、ファクシミリで送信及び受信される画像データのエンコード及びデコード等に用いられる。JPEG用CODEC17は、CCD14によって取得された画像データ等のJPEG圧縮に用いられる。
The
操作部18は、複合装置1の操作のために用いられるものであり、キーボード、液晶表示部等を備える。
The
ROM19には、MPU11に読み込まれる各種ソフトウェア及び設定データ等が保存されている。例えば、ROM19にはMPU11の文字認識部11bが文字認識を行う際に用いられるOCRプログラムが保存されている。SRAM20には、電話帳データ等が保存されている。
The
画像メモリ21は、MPU11が画像処理を行う際のワークエリア等として用いられるものであり、メモリコントローラ211及びSDRAM(Synchronous Dynamic Random Access Memory)212を備えている。
The
プリンタ24は、CCD14により原稿から読み取られた画像データ、ファクシミリで受信された画像データ等を記録紙に印刷する。LANインターフェース25は、ネットワーク(LAN31及びインターネット32等)を介したデータ通信を担う。このため、複合装置1は、LAN31を介してパーソナルコンピュータ等の複数の端末装置33とデータ通信できるとともに、LAN31に接続されたゲートウェイ34を介してインターネット32にも接続できる。
The
次にMPU11の機能について説明する。MPU11の読取制御部11aは、CCD14等を制御し、原稿からの画像の読み取りを行う。
Next, functions of the MPU 11 will be described. The
文字認識部11bは、CCD14によって原稿から取得された画像データの画像の中から、文字認識により予め定められた特徴を有する複数の文字列を抽出する。文字列の抽出方法としては、例えば、強調された文字列又は見出しとなっている文字列を優先して抽出する方法、あるいは、原稿の画像の中からランダムに文字列を抽出する方法などが採用される。ここで、強調された文字列としては、例えば、文字サイズの大きい文字列、太字で表記された文字列、アンダーラインが付与された文字列等が挙げられる。また、見出しとなっている文字列としては、原稿又は各段落の先頭に位置する文字列、各行の中央にセンタリングされている文字列等が挙げられる。また、文字認識部11bによって抽出される文字列の数、及び抽出される各文字列の文字数の上限値は、ユーザによる操作部18を介した操作により、予め設定できる。例えば、文字認識部11bによって抽出される文字列の文字数は、全角で10文字を上限として任意の値に設定できる。
The
文字列処理部11cは、文字認識部11bによって抽出された複数の文字列を結合することによって結合文字列を作成する。このとき、結合文字列中には、結合される前の文字列間の境界を識別するための区切り記号が挿入される。区切り記号としては、ファイル名として使用できる全角又は半角の種々の記号が採用できる。例えば、スペース、ハイフン、アンダーバー又は各種括弧記号が採用できる。区切り文字として括弧記号を使用する場合には、結合される各文字列を前後で挟むように括弧記号が挿入される。本実施形態では、半角スーペースが区切り記号として採用される。
The character
また、文字列処理部11cは、結合文字列の文字数が予め定められた上限値を超える場合には、結合文字列の末尾の文字列又は末尾の文字列中の文字を切り捨てて、結合文字列の文字数を上限値を超えないように調節する。これを、例えば結合文字列の文字数の上限値が全角で52文字である場合について説明する。例えば、文字認識部11bによって、全角で10文字の文字列が6つ抽出されていたとする。この場合、仮にその6つの文字列を、区切り記号(半角スペース)を挿入してすべて結合すれば、結合文字列の文字数は、10+0.5+10+0.5+10+0.5+10+0.5+10+0.5+10=62.5文字となる。よって、上限値である52文字を超えているため、6つ目の文字列が切り捨てられ、5つ目までの文字列が結合されて結合文字列が作成される。
In addition, when the number of characters of the combined character string exceeds a predetermined upper limit value, the character
ファイル生成部11dは、文字列処理部11cによって作成された結合文字列をファイル名として、CCD14によって読み取られた画像データのファイルを生成し、そのファイルを所定の保存先に保存する。保存先としては、例えば、複合装置1内のHDD23、又は外部の端末装置33が用いられる。このときファイル生成部11dは、仮のファイル名を用いて画像データのファイルを生成しておき、文字列処理部11cから結合文字列が与えられた時点で、そのファイルのファイル名を仮のファイル名から結合文字列に書き換えるようにしてもよい。
The
ここで、このような画像認識により得られた結合文字列をファイル名として保存される画像データには、上述のスキャナ機能によって読み取られた画像データ、ファクシミリ送信された画像データ等が挙げられる。なお、変形例として、CCD14で読み取られた画像データだけでなく、ファクシミリ及びインターネットファクシミリで受信された画像データ、LAN31を介して端末装置33から与えられた画像データの保存にも、画像認識により得られた結合文字列をファイル名として用いてもよい。
Here, the image data stored as the file name of the combined character string obtained by such image recognition includes image data read by the above-described scanner function, image data transmitted by facsimile, and the like. As a modification, not only image data read by the
次に、図2を参照して読み取った画像データを保存する際のMUP11の動作を説明する。図2に示すように、ステップS1では、操作部18を介して入力される開始の指示等に応じて、読取部11aがCCD14等を制御して、原稿からの画像の読み取りを行う。このとき、ファイル生成部11dが、その読み取られた画像データのファイルを仮のファイル名を用いて生成してもよい。この仮のファイル名を付与されたファイルは、例えばSDRAM212内に保持される。
Next, the operation of the
続くステップS2では、文字認識部11bが、上述の如くCCD14によって読み取られた画像データの画像の中から、文字認識により予め定められた特徴を有する複数の文字列を抽出する。続くステップS3では、上述の如く文字認識部11bによって抽出された複数の文字列を結合することによって結合文字列を作成する。このとき、結合文字列中には、所定の区切り記号(例えば、半角スペース)が挿入される。
In the subsequent step S2, the
続くステップS4では、文字列処理部11cによって作成された結合文字列をファイル名として、CCD14によって読み取られた画像データのファイルを生成し、そのファイルを所定の保存先に保存する。このときファイル生成部11dは、仮のファイル名を用いて画像データのファイルを既に生成している場合には、そのファイルのファイル名を仮のファイル名から結合文字列に書き換えた上で、そのファイルを所定の保存先に保存する。
In the subsequent step S4, a file of image data read by the
以上のように、本実施形態によれば、文字認識により画像データの画像の中から複数の文字列が抽出され、その複数の文字列が結合されてなる結合文字列が、CCD14で読み取った画像データのファイル名として用いられる。これによって、ユーザが画像データの内容を容易に把握できるファイル名を自動的に生成できる。このように生成されたファイル名は、ファイル名に含まれる文字列を用いたキーワード検索等にも利用でき、便利である。
As described above, according to the present embodiment, a plurality of character strings are extracted from an image of image data by character recognition, and a combined character string formed by combining the plurality of character strings is an image read by the
また、ファイル名として用いられる結合文字列中には、結合される前の文字列間の境界を識別するための区切り記号(例えば、半角スペース)が挿入されるため、ユーザが結合文字列に含まれる各文字列を容易に把握できる。 In addition, a delimiter (for example, a single-byte space) for identifying a boundary between character strings before being combined is inserted in the combined character string used as a file name, so that the user is included in the combined character string. You can easily grasp each character string.
また、画像データの画像の中から自動的に抽出させる文字列の数をユーザが予め設定できるため、ユーザの要望の柔軟に対応できる。 Further, since the number of character strings to be automatically extracted from the image data image can be set in advance by the user, it is possible to respond flexibly to the user's request.
また、結合文字列の文字数が予め定められた上限値を超える場合には、結合文字列の末尾の文字列又は末尾の文字列中の文字が切り捨てられるため、ファイル名の長さが自動的に適切の範囲内に抑えられる。 If the number of characters in the combined character string exceeds a predetermined upper limit, the character string at the end of the combined character string or the character in the end character string is truncated, so the length of the file name is automatically It is kept within the proper range.
また、画像データの画像の中から予め定められた特徴を有する文字列が抽出され、その文字列を用いて画像データのファイル名が作成されるため、ユーザがファイル名に基づいて画像データの内容を的確に把握できる。 In addition, since a character string having a predetermined characteristic is extracted from the image data image, and the file name of the image data is created using the character string, the content of the image data can be determined by the user based on the file name. Can be accurately grasped.
なお、上述の実施形態では、原稿からの画像の読み取り、画像からの文字列の抽出、結合文字列の作成、及びファイルの生成を複合装置1にて行うようにしたが、処理の負荷が大きい画像からの文字列の抽出及び結合文字列の作成を、LAN31を介して外部の情報処理装置に行わせるようにしてもよい。
In the above-described embodiment, reading of an image from a document, extraction of a character string from an image, creation of a combined character string, and generation of a file are performed by the
1 ファクシミリ複合装置
11 MPU
11a 読取制御部
11b 文字認識部
11c 文字列処理部
11d ファイル生成部
14 CCD
18 操作部
1
11a
18 Operation unit
Claims (6)
前記複数の文字列を結合することによって結合文字列を作成する文字列処理部と、
前記結合文字列をファイル名として、前記画像データのファイルを生成するファイル生成部と、を備えることを特徴とする画像処理装置。 A character recognition unit that extracts a plurality of character strings by character recognition from an image of given image data;
A character string processing unit that creates a combined character string by combining the plurality of character strings;
An image processing apparatus comprising: a file generation unit configured to generate a file of the image data using the combined character string as a file name.
前記文字列処理部は、前記結合文字列中に、結合されれる前の前記文字列間の境界を識別するための区切り記号を挿入することを特徴とする画像処理装置。 The image processing apparatus according to claim 1.
The image processing apparatus, wherein the character string processing unit inserts a delimiter symbol for identifying a boundary between the character strings before being combined into the combined character string.
前記文字認識部は、所定の操作部を介して予め設定された数だけ、前記文字列を前記画像の中から抽出することを特徴とする画像処理装置。 The image processing apparatus according to claim 1 or 2,
The image processing apparatus, wherein the character recognizing unit extracts the character string from the image by a predetermined number through a predetermined operation unit.
前記文字列処理部は、前記結合文字列の文字数が予め定められた上限値を超える場合には、前記結合文字列の末尾の前記文字列又は末尾の前記文字列中の文字を切り捨てることを特徴とする画像処理装置。 The image processing apparatus according to any one of claims 1 to 3,
The character string processing unit truncates the character string at the end of the combined character string or the character string at the end when the number of characters of the combined character string exceeds a predetermined upper limit value. An image processing apparatus.
前記文字認識部は、前記画像の中から予め定められた特徴を有する文字列を抽出することを特徴とする画像処理装置。 The image processing apparatus according to any one of claims 1 to 4,
The image processing apparatus, wherein the character recognition unit extracts a character string having a predetermined characteristic from the image.
原稿の画像を読み取り、前記画像データを出力する読取部をさらに備えることを特徴とする画像処理装置。 The image processing apparatus according to any one of claims 1 to 5,
An image processing apparatus, further comprising a reading unit that reads an image of a document and outputs the image data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007191387A JP2009027648A (en) | 2007-07-23 | 2007-07-23 | Image processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007191387A JP2009027648A (en) | 2007-07-23 | 2007-07-23 | Image processing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009027648A true JP2009027648A (en) | 2009-02-05 |
Family
ID=40398991
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007191387A Pending JP2009027648A (en) | 2007-07-23 | 2007-07-23 | Image processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009027648A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2299386A2 (en) | 2009-09-04 | 2011-03-23 | Ricoh Company, Ltd. | Image processing apparatus, image processing system, and image processing method |
JP2011155548A (en) * | 2010-01-28 | 2011-08-11 | Kyocera Mita Corp | Device, program and method for creation of file |
JP2014013534A (en) * | 2012-07-05 | 2014-01-23 | Ricoh Co Ltd | Document processor, image processor, image processing method and document processing program |
EP2779613A1 (en) * | 2013-03-12 | 2014-09-17 | Ricoh Company, Ltd. | Document processing apparatus, document processing method, and document processing computer program product |
-
2007
- 2007-07-23 JP JP2007191387A patent/JP2009027648A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2299386A2 (en) | 2009-09-04 | 2011-03-23 | Ricoh Company, Ltd. | Image processing apparatus, image processing system, and image processing method |
US8605336B2 (en) | 2009-09-04 | 2013-12-10 | Ricoh Company, Ltd. | Image processing apparatus, image processing system, and image conducting character recognition with respect to image data |
US9307109B2 (en) | 2009-09-04 | 2016-04-05 | Ricoh Company, Ltd. | Image processing apparatus, image processing system, and image processing method |
JP2011155548A (en) * | 2010-01-28 | 2011-08-11 | Kyocera Mita Corp | Device, program and method for creation of file |
JP2014013534A (en) * | 2012-07-05 | 2014-01-23 | Ricoh Co Ltd | Document processor, image processor, image processing method and document processing program |
EP2779613A1 (en) * | 2013-03-12 | 2014-09-17 | Ricoh Company, Ltd. | Document processing apparatus, document processing method, and document processing computer program product |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2019176434A (en) | Information processing system and information processing method | |
JP2006277031A (en) | Information processing apparatus and its method | |
JP2005293351A (en) | Image processor and image processing method | |
JP2009027648A (en) | Image processing device | |
JP2010165019A (en) | File name creating system | |
JP4860599B2 (en) | Image processing device | |
JP2006080835A (en) | Multifunction machine | |
JP2009226623A (en) | Image forming device and data storage method of image forming device | |
JP4258666B2 (en) | Network multi-function peripheral and address book data sharing method | |
US20110292426A1 (en) | Communication apparatus and communication method | |
JP4455358B2 (en) | Image processing apparatus and method | |
JP2008242820A (en) | Document processing system | |
JP2005275863A (en) | Composite machine | |
JP2005102041A (en) | Image recording apparatus | |
JP3724729B2 (en) | Structured document processing apparatus and program thereof | |
JP2006203317A (en) | Document management system, and control method thereof, and storage medium | |
JP5062049B2 (en) | Image processing device | |
JP4165482B2 (en) | Image display program and image display apparatus | |
JP4182439B2 (en) | Internet facsimile machine and program thereof | |
JP3682861B2 (en) | Facsimile server and its program | |
JP3724730B2 (en) | Structured document processing apparatus and processing program | |
JP4192711B2 (en) | Image processing apparatus and program | |
JP2011166665A (en) | Multifunctional machine | |
US20020049821A1 (en) | Document transmission apparatus and storage medium in which program for document transmission apparatus is stored | |
JP2005102040A (en) | Control program of image recording apparatus and recording medium recording the same |