JP2009027648A - Image processing device - Google Patents

Image processing device Download PDF

Info

Publication number
JP2009027648A
JP2009027648A JP2007191387A JP2007191387A JP2009027648A JP 2009027648 A JP2009027648 A JP 2009027648A JP 2007191387 A JP2007191387 A JP 2007191387A JP 2007191387 A JP2007191387 A JP 2007191387A JP 2009027648 A JP2009027648 A JP 2009027648A
Authority
JP
Japan
Prior art keywords
character string
image
character
image processing
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007191387A
Other languages
Japanese (ja)
Inventor
Tooru Hamaguchi
徹 濱口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Murata Machinery Ltd
Original Assignee
Murata Machinery Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Murata Machinery Ltd filed Critical Murata Machinery Ltd
Priority to JP2007191387A priority Critical patent/JP2009027648A/en
Publication of JP2009027648A publication Critical patent/JP2009027648A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Storing Facsimile Image Data (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an image processing device which can automatically generate a file name by which a user can comprehend the content of an image data easily. <P>SOLUTION: Based on the image data read by a CCD 14, a plurality of character strings is extracted from the image of the image data by character recognition, a concatenated character string composed by concatenating the plurality of the character strings is used as the file name of the image data. In the concatenated character string used as the file name, a delimiter (for example, en-quad) for identifying the boundary between the character strings before being concatenated is inserted. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、与えられた画像データのファイルを作成する画像処理装置に関する。   The present invention relates to an image processing apparatus for creating a file of given image data.

原稿をスキャンして画像ファイルを生成する際、ファイル名を自動的に生成する装置が知られている。これらの装置では、シリアルナンバー又はファイル生成時の日付情報を用いてファイル名を生成するものがある。しかし、これではユーザがファイル名を見ても、ファイルの内容が判別できず不便である。   An apparatus that automatically generates a file name when generating an image file by scanning a document is known. Some of these apparatuses generate a file name using serial number or date information at the time of file generation. However, this is inconvenient even if the user looks at the file name and the contents of the file cannot be determined.

そこで、読み取った画像をOCR(Optical Character Reader)処理し、原稿より特徴的な文字列を抽出してファイル名とする技術が提案されている(特許文献1)。特徴的な文字列は原稿中からいくつか抽出されるので、特許文献1ではプリセット領域にのみ文字認識を行い、文字列を抽出する。また、特徴的な文字列が複数抽出された場合には、出現頻度の高い順にならべて表示し、ユーザにそのうちの1つを選択させる技術も提案されている(特許文献2)。この場合でも、抽出された文字列の中の1つでファイルの内容が把握できるとは限らず、ユーザの操作も必要となる。複数の文字列を結合してファイル名とする技術も提案されているが(特許文献3)、複数の文字列を順次キー操作で入力する必要があり、ユーザの負担が大きい。
特開2005−56315号公報 特開2006−211261号公報 特開平10−289137号公報
Therefore, a technique has been proposed in which the read image is subjected to OCR (Optical Character Reader) processing, a characteristic character string is extracted from the document, and used as a file name (Patent Document 1). Since some characteristic character strings are extracted from the document, in Japanese Patent Laid-Open No. 2004-228688, character recognition is performed only in the preset area and character strings are extracted. Also, a technique has been proposed in which a plurality of characteristic character strings are extracted and displayed in order of appearance frequency, and the user selects one of them (Patent Document 2). Even in this case, the contents of the file cannot always be grasped by one of the extracted character strings, and a user operation is also required. A technique for combining a plurality of character strings to form a file name has also been proposed (Patent Document 3), but it is necessary to sequentially input a plurality of character strings by key operation, which places a heavy burden on the user.
JP 2005-56315 A JP 2006-211261 A Japanese Patent Laid-Open No. 10-289137

そこで、本発明の解決すべき課題は、ユーザが画像データの内容を容易に把握できるファイル名を自動的に生成できる画像処理装置の提供である。   Therefore, a problem to be solved by the present invention is to provide an image processing apparatus that can automatically generate a file name that allows a user to easily grasp the contents of image data.

上記の課題を解決するため、画像処理装置が、与えられた画像データの画像の中から文字認識により複数の文字列を抽出する文字認識部と、前記複数の文字列を結合することによって結合文字列を作成する文字列処理部と、前記結合文字列をファイル名として、前記画像データのファイルを生成するファイル生成部とを備える。   In order to solve the above problem, the image processing apparatus combines a character recognition unit that extracts a plurality of character strings by character recognition from an image of given image data, and combines the plurality of character strings. A character string processing unit that generates a sequence; and a file generation unit that generates the image data file using the combined character string as a file name.

また、前記画像処理装置において、前記文字列処理部は、前記結合文字列中に、結合される前の前記文字列間の境界を識別するための区切り記号を挿入する。   In the image processing apparatus, the character string processing unit inserts a delimiter for identifying a boundary between the character strings before being combined into the combined character string.

また、前記画像処理装置において、前記文字認識部は、所定の操作部を介して予め設定された数だけ、前記文字列を前記画像の中から抽出する。   In the image processing apparatus, the character recognition unit extracts the character string from the image by a predetermined number via a predetermined operation unit.

また、前記画像処理装置において、前記文字列処理部は、前記結合文字列の文字数が予め定められた上限値を超える場合には、前記結合文字列の末尾の前記文字列又は末尾の前記文字列中の文字を切り捨てる。   Further, in the image processing device, the character string processing unit, when the number of characters of the combined character string exceeds a predetermined upper limit, the character string at the end of the combined character string or the character string at the end Truncate the characters inside.

また、前記画像処理装置において、前記文字認識部は、前記画像の中から予め定められた特徴を有する文字列を抽出する。   In the image processing apparatus, the character recognition unit extracts a character string having a predetermined characteristic from the image.

また、前記画像処理装置において、原稿の画像を読み取り、前記画像データを出力する読取部をさらに備える。   The image processing apparatus further includes a reading unit that reads an image of a document and outputs the image data.

本発明によれば、文字認識により画像データの画像の中から複数の文字列が抽出され、その複数の文字列が結合されてなる結合文字列が画像データのファイル名として用いられる。これによって、ユーザが画像データの内容を容易に把握できるファイル名を自動的に生成できる。このように生成されたファイル名は、ファイル名に含まれる文字列を用いたキーワード検索等にも利用でき、便利である。   According to the present invention, a plurality of character strings are extracted from the image data image by character recognition, and a combined character string formed by combining the plurality of character strings is used as a file name of the image data. As a result, a file name that allows the user to easily grasp the contents of the image data can be automatically generated. The file name generated in this way can be used for keyword search using a character string included in the file name and is convenient.

また、本発明によれば、ファイル名として用いられる結合文字列中には、結合される前の文字列間の境界を識別するための区切り記号が挿入されるため、ユーザが結合文字列に含まれる各文字列を容易に把握できる。   Further, according to the present invention, since the delimiter for identifying the boundary between the character strings before being combined is inserted into the combined character string used as the file name, the user is included in the combined character string. You can easily grasp each character string.

また、本発明によれば、画像データの画像の中から自動的に抽出させる文字列の数をユーザが予め設定できるため、ユーザの要望の柔軟に対応できる。   Further, according to the present invention, the user can set in advance the number of character strings to be automatically extracted from the image of the image data, so that the user's request can be flexibly handled.

また、本発明によれば、結合文字列の文字数が予め定められた上限値を超える場合には、結合文字列の末尾の文字列又は末尾の文字列中の文字が切り捨てられるため、ファイル名の長さが自動的に適切の範囲内に抑えられる。   Further, according to the present invention, when the number of characters in the combined character string exceeds a predetermined upper limit value, the character string at the end of the combined character string or the character in the character string at the end is truncated. The length is automatically kept within an appropriate range.

また、本発明によれば、画像データの画像の中から予め定められた特徴を有する文字列が抽出され、その文字列を用いて画像データのファイル名が作成されるため、ユーザがファイル名に基づいて画像データの内容を的確に把握できる。   According to the present invention, a character string having a predetermined characteristic is extracted from an image of the image data, and a file name of the image data is created using the character string. Based on this, the contents of the image data can be accurately grasped.

また、本発明によれば、読取部によって読み取った画像データを保存する際に、ユーザが画像データの内容を容易に把握できるファイル名を自動的に生成できる。   Further, according to the present invention, when saving the image data read by the reading unit, a file name that allows the user to easily grasp the contents of the image data can be automatically generated.

図1は、本発明の一実施形態に係る画像処理装置としてのファクシミリ複合装置(以下、単に「複合装置」という)のブロック図である。この複合装置は、図1に示すように、MPU(Micro Processing Unit)11、NCU(Network Control Unit)12、モデム(MODEM)13、読取部としてのCCD(Charge Coupled Device)14、画像処理回路15、ファクシミリ用CODEC(符号化復号器)16、JPEG(Joint Photographic Experts Group)用CODEC17、操作部18、ROM(Read Only Memory)19、SRAM(Static Random Access Memory)20、画像メモリ21、ハードディスクインターフェース22、ハードディスクドライブ(HDD(Hard Disk Drive))23、プリンタ24、及びLAN(Local Area Network)インターフェース25を備えている。この複合装置1に備えられる機能には、プリンタ機能、ファクシミリ機能、インターネットファクシミリ機能、コピー機能、及びスキャナ機能等が含まれる。スキャナ機能には、読み取った画像データを所定の保存先に保存する機能(スキャン・トゥ・フォルダ、又はスキャン・トゥ・FTP(File Transfer Protocol)等)が含まれている。   FIG. 1 is a block diagram of a facsimile composite apparatus (hereinafter simply referred to as “composite apparatus”) as an image processing apparatus according to an embodiment of the present invention. As shown in FIG. 1, the composite apparatus includes an MPU (Micro Processing Unit) 11, an NCU (Network Control Unit) 12, a modem (MODEM) 13, a CCD (Charge Coupled Device) 14 as a reading unit, and an image processing circuit 15. , CODEC (encoder / decoder) 16 for facsimile, CODEC 17 for JPEG (Joint Photographic Experts Group), operation unit 18, ROM (Read Only Memory) 19, SRAM (Static Random Access Memory) 20, image memory 21, hard disk interface 22 A hard disk drive (HDD) 23, a printer 24, and a LAN (Local Area Network) interface 25. The functions provided in the composite apparatus 1 include a printer function, a facsimile function, an Internet facsimile function, a copy function, a scanner function, and the like. The scanner function includes a function (scan-to-folder, scan-to-FTP (File Transfer Protocol), or the like) that stores scanned image data in a predetermined storage destination.

MPU11は、この複合装置1の制御を統括するものであり、ソフトウェアにより動作する。このMPU11の機能要素としては、読取制御部11a、文字認識部11b、文字列処理部11c及びファイル生成部11dが備えられる。これらの機能要素の役割等については後に詳述する。   The MPU 11 supervises the control of the multifunction apparatus 1 and operates by software. As functional elements of the MPU 11, a reading control unit 11a, a character recognition unit 11b, a character string processing unit 11c, and a file generation unit 11d are provided. The role of these functional elements will be described in detail later.

NCU12は、アナログの公衆電話回線網(PSTN:Public Switched Telephone Network)との回線の接続等を行うハードウェアであり、必要に応じてモデム13を公衆電話回線網と接続する。モデム13は、ファクシミリ通信が可能なファクシミリモデムから構成されている。   The NCU 12 is hardware for connecting a line to an analog public switched telephone network (PSTN), and connects the modem 13 to the public telephone line network as necessary. The modem 13 is a facsimile modem capable of facsimile communication.

CCD14は、原稿の画像を読み取る素子であり、後述するMPU11の読取制御部11aによって制御される。画像処理回路15は、CCD14から与えられた画像データに対して各種補正等の画像処理を施す。   The CCD 14 is an element that reads an image of a document, and is controlled by a reading control unit 11a of the MPU 11 described later. The image processing circuit 15 performs image processing such as various corrections on the image data given from the CCD 14.

ファクシミリ用CODEC16は、ファクシミリで送信及び受信される画像データのエンコード及びデコード等に用いられる。JPEG用CODEC17は、CCD14によって取得された画像データ等のJPEG圧縮に用いられる。   The facsimile CODEC 16 is used for encoding and decoding of image data transmitted and received by facsimile. The JPEG CODEC 17 is used for JPEG compression of image data and the like acquired by the CCD 14.

操作部18は、複合装置1の操作のために用いられるものであり、キーボード、液晶表示部等を備える。   The operation unit 18 is used for operation of the multifunction apparatus 1 and includes a keyboard, a liquid crystal display unit, and the like.

ROM19には、MPU11に読み込まれる各種ソフトウェア及び設定データ等が保存されている。例えば、ROM19にはMPU11の文字認識部11bが文字認識を行う際に用いられるOCRプログラムが保存されている。SRAM20には、電話帳データ等が保存されている。   The ROM 19 stores various software read by the MPU 11, setting data, and the like. For example, the ROM 19 stores an OCR program used when the character recognition unit 11b of the MPU 11 performs character recognition. The SRAM 20 stores phone book data and the like.

画像メモリ21は、MPU11が画像処理を行う際のワークエリア等として用いられるものであり、メモリコントローラ211及びSDRAM(Synchronous Dynamic Random Access Memory)212を備えている。   The image memory 21 is used as a work area or the like when the MPU 11 performs image processing, and includes a memory controller 211 and an SDRAM (Synchronous Dynamic Random Access Memory) 212.

プリンタ24は、CCD14により原稿から読み取られた画像データ、ファクシミリで受信された画像データ等を記録紙に印刷する。LANインターフェース25は、ネットワーク(LAN31及びインターネット32等)を介したデータ通信を担う。このため、複合装置1は、LAN31を介してパーソナルコンピュータ等の複数の端末装置33とデータ通信できるとともに、LAN31に接続されたゲートウェイ34を介してインターネット32にも接続できる。   The printer 24 prints the image data read from the document by the CCD 14, the image data received by the facsimile, and the like on a recording sheet. The LAN interface 25 is responsible for data communication via a network (such as the LAN 31 and the Internet 32). Therefore, the composite apparatus 1 can perform data communication with a plurality of terminal devices 33 such as personal computers via the LAN 31 and can also connect to the Internet 32 via the gateway 34 connected to the LAN 31.

次にMPU11の機能について説明する。MPU11の読取制御部11aは、CCD14等を制御し、原稿からの画像の読み取りを行う。   Next, functions of the MPU 11 will be described. The reading control unit 11a of the MPU 11 controls the CCD 14 and the like to read an image from a document.

文字認識部11bは、CCD14によって原稿から取得された画像データの画像の中から、文字認識により予め定められた特徴を有する複数の文字列を抽出する。文字列の抽出方法としては、例えば、強調された文字列又は見出しとなっている文字列を優先して抽出する方法、あるいは、原稿の画像の中からランダムに文字列を抽出する方法などが採用される。ここで、強調された文字列としては、例えば、文字サイズの大きい文字列、太字で表記された文字列、アンダーラインが付与された文字列等が挙げられる。また、見出しとなっている文字列としては、原稿又は各段落の先頭に位置する文字列、各行の中央にセンタリングされている文字列等が挙げられる。また、文字認識部11bによって抽出される文字列の数、及び抽出される各文字列の文字数の上限値は、ユーザによる操作部18を介した操作により、予め設定できる。例えば、文字認識部11bによって抽出される文字列の文字数は、全角で10文字を上限として任意の値に設定できる。   The character recognition unit 11b extracts a plurality of character strings having characteristics predetermined by character recognition from the image data image acquired from the document by the CCD. As a method for extracting a character string, for example, a method for preferentially extracting an emphasized character string or a character string serving as a headline, or a method for extracting a character string randomly from an image of a document is adopted. Is done. Here, examples of the emphasized character string include a character string having a large character size, a character string written in bold, and a character string with an underline. Examples of the character string serving as the headline include a character string located at the beginning of the document or each paragraph, a character string centered at the center of each line, and the like. In addition, the number of character strings extracted by the character recognition unit 11b and the upper limit value of the number of characters of each extracted character string can be set in advance by a user operation via the operation unit 18. For example, the number of characters in the character string extracted by the character recognition unit 11b can be set to an arbitrary value with an upper limit of 10 characters.

文字列処理部11cは、文字認識部11bによって抽出された複数の文字列を結合することによって結合文字列を作成する。このとき、結合文字列中には、結合される前の文字列間の境界を識別するための区切り記号が挿入される。区切り記号としては、ファイル名として使用できる全角又は半角の種々の記号が採用できる。例えば、スペース、ハイフン、アンダーバー又は各種括弧記号が採用できる。区切り文字として括弧記号を使用する場合には、結合される各文字列を前後で挟むように括弧記号が挿入される。本実施形態では、半角スーペースが区切り記号として採用される。   The character string processing unit 11c creates a combined character string by combining a plurality of character strings extracted by the character recognition unit 11b. At this time, a delimiter for identifying the boundary between the character strings before being combined is inserted into the combined character string. As the delimiter, various full-width or half-width symbols that can be used as file names can be adopted. For example, a space, hyphen, underbar, or various parenthesis symbols can be adopted. When using a parenthesis symbol as a delimiter, the parenthesis symbol is inserted so as to sandwich each character string to be combined. In this embodiment, a half-width space is adopted as a delimiter.

また、文字列処理部11cは、結合文字列の文字数が予め定められた上限値を超える場合には、結合文字列の末尾の文字列又は末尾の文字列中の文字を切り捨てて、結合文字列の文字数を上限値を超えないように調節する。これを、例えば結合文字列の文字数の上限値が全角で52文字である場合について説明する。例えば、文字認識部11bによって、全角で10文字の文字列が6つ抽出されていたとする。この場合、仮にその6つの文字列を、区切り記号(半角スペース)を挿入してすべて結合すれば、結合文字列の文字数は、10+0.5+10+0.5+10+0.5+10+0.5+10+0.5+10=62.5文字となる。よって、上限値である52文字を超えているため、6つ目の文字列が切り捨てられ、5つ目までの文字列が結合されて結合文字列が作成される。   In addition, when the number of characters of the combined character string exceeds a predetermined upper limit value, the character string processing unit 11c truncates the character string at the end of the combined character string or the character string at the end of the combined character string, Adjust the number of characters so that it does not exceed the upper limit. This will be described, for example, when the upper limit value of the number of characters in the combined character string is 52 full-width characters. For example, it is assumed that six character strings of 10 characters are extracted by the character recognition unit 11b. In this case, if the six character strings are all combined by inserting a delimiter (half-width space), the number of characters in the combined character string is 10 + 0.5 + 10 + 0.5 + 10 + 0.5 + 10 + 0.5 + 10 + 0.5 + 10 = 62.5 characters. Become. Therefore, since the upper limit of 52 characters is exceeded, the sixth character string is truncated, and the fifth character string is combined to create a combined character string.

ファイル生成部11dは、文字列処理部11cによって作成された結合文字列をファイル名として、CCD14によって読み取られた画像データのファイルを生成し、そのファイルを所定の保存先に保存する。保存先としては、例えば、複合装置1内のHDD23、又は外部の端末装置33が用いられる。このときファイル生成部11dは、仮のファイル名を用いて画像データのファイルを生成しておき、文字列処理部11cから結合文字列が与えられた時点で、そのファイルのファイル名を仮のファイル名から結合文字列に書き換えるようにしてもよい。   The file generation unit 11d generates a file of image data read by the CCD 14 using the combined character string created by the character string processing unit 11c as a file name, and stores the file in a predetermined storage location. As the storage destination, for example, the HDD 23 in the multifunction device 1 or the external terminal device 33 is used. At this time, the file generation unit 11d generates a file of image data using the temporary file name, and when the combined character string is given from the character string processing unit 11c, the file name of the file is changed to the temporary file name. The name may be rewritten into a combined character string.

ここで、このような画像認識により得られた結合文字列をファイル名として保存される画像データには、上述のスキャナ機能によって読み取られた画像データ、ファクシミリ送信された画像データ等が挙げられる。なお、変形例として、CCD14で読み取られた画像データだけでなく、ファクシミリ及びインターネットファクシミリで受信された画像データ、LAN31を介して端末装置33から与えられた画像データの保存にも、画像認識により得られた結合文字列をファイル名として用いてもよい。   Here, the image data stored as the file name of the combined character string obtained by such image recognition includes image data read by the above-described scanner function, image data transmitted by facsimile, and the like. As a modification, not only image data read by the CCD 14 but also image data received by facsimile and Internet facsimile, and image data given from the terminal device 33 via the LAN 31 are obtained by image recognition. The combined character string may be used as the file name.

次に、図2を参照して読み取った画像データを保存する際のMUP11の動作を説明する。図2に示すように、ステップS1では、操作部18を介して入力される開始の指示等に応じて、読取部11aがCCD14等を制御して、原稿からの画像の読み取りを行う。このとき、ファイル生成部11dが、その読み取られた画像データのファイルを仮のファイル名を用いて生成してもよい。この仮のファイル名を付与されたファイルは、例えばSDRAM212内に保持される。   Next, the operation of the MUP 11 when storing the read image data will be described with reference to FIG. As shown in FIG. 2, in step S <b> 1, the reading unit 11 a controls the CCD 14 and the like to read an image from a document in accordance with a start instruction input via the operation unit 18. At this time, the file generation unit 11d may generate the read image data file using a temporary file name. The file given the temporary file name is held in the SDRAM 212, for example.

続くステップS2では、文字認識部11bが、上述の如くCCD14によって読み取られた画像データの画像の中から、文字認識により予め定められた特徴を有する複数の文字列を抽出する。続くステップS3では、上述の如く文字認識部11bによって抽出された複数の文字列を結合することによって結合文字列を作成する。このとき、結合文字列中には、所定の区切り記号(例えば、半角スペース)が挿入される。   In the subsequent step S2, the character recognition unit 11b extracts a plurality of character strings having features predetermined by character recognition from the image data image read by the CCD 14 as described above. In the subsequent step S3, a combined character string is created by combining a plurality of character strings extracted by the character recognition unit 11b as described above. At this time, a predetermined delimiter (for example, a half-width space) is inserted into the combined character string.

続くステップS4では、文字列処理部11cによって作成された結合文字列をファイル名として、CCD14によって読み取られた画像データのファイルを生成し、そのファイルを所定の保存先に保存する。このときファイル生成部11dは、仮のファイル名を用いて画像データのファイルを既に生成している場合には、そのファイルのファイル名を仮のファイル名から結合文字列に書き換えた上で、そのファイルを所定の保存先に保存する。   In the subsequent step S4, a file of image data read by the CCD 14 is generated using the combined character string created by the character string processing unit 11c as a file name, and the file is stored in a predetermined storage destination. At this time, if the image data file has already been generated using the temporary file name, the file generation unit 11d rewrites the file name of the file from the temporary file name to the combined character string, Save the file to a specified destination.

以上のように、本実施形態によれば、文字認識により画像データの画像の中から複数の文字列が抽出され、その複数の文字列が結合されてなる結合文字列が、CCD14で読み取った画像データのファイル名として用いられる。これによって、ユーザが画像データの内容を容易に把握できるファイル名を自動的に生成できる。このように生成されたファイル名は、ファイル名に含まれる文字列を用いたキーワード検索等にも利用でき、便利である。   As described above, according to the present embodiment, a plurality of character strings are extracted from an image of image data by character recognition, and a combined character string formed by combining the plurality of character strings is an image read by the CCD 14. Used as data file name. As a result, a file name that allows the user to easily grasp the contents of the image data can be automatically generated. The file name generated in this way can be used for keyword search using a character string included in the file name and is convenient.

また、ファイル名として用いられる結合文字列中には、結合される前の文字列間の境界を識別するための区切り記号(例えば、半角スペース)が挿入されるため、ユーザが結合文字列に含まれる各文字列を容易に把握できる。   In addition, a delimiter (for example, a single-byte space) for identifying a boundary between character strings before being combined is inserted in the combined character string used as a file name, so that the user is included in the combined character string. You can easily grasp each character string.

また、画像データの画像の中から自動的に抽出させる文字列の数をユーザが予め設定できるため、ユーザの要望の柔軟に対応できる。   Further, since the number of character strings to be automatically extracted from the image data image can be set in advance by the user, it is possible to respond flexibly to the user's request.

また、結合文字列の文字数が予め定められた上限値を超える場合には、結合文字列の末尾の文字列又は末尾の文字列中の文字が切り捨てられるため、ファイル名の長さが自動的に適切の範囲内に抑えられる。   If the number of characters in the combined character string exceeds a predetermined upper limit, the character string at the end of the combined character string or the character in the end character string is truncated, so the length of the file name is automatically It is kept within the proper range.

また、画像データの画像の中から予め定められた特徴を有する文字列が抽出され、その文字列を用いて画像データのファイル名が作成されるため、ユーザがファイル名に基づいて画像データの内容を的確に把握できる。   In addition, since a character string having a predetermined characteristic is extracted from the image data image, and the file name of the image data is created using the character string, the content of the image data can be determined by the user based on the file name. Can be accurately grasped.

なお、上述の実施形態では、原稿からの画像の読み取り、画像からの文字列の抽出、結合文字列の作成、及びファイルの生成を複合装置1にて行うようにしたが、処理の負荷が大きい画像からの文字列の抽出及び結合文字列の作成を、LAN31を介して外部の情報処理装置に行わせるようにしてもよい。   In the above-described embodiment, reading of an image from a document, extraction of a character string from an image, creation of a combined character string, and generation of a file are performed by the composite apparatus 1, but the processing load is large. Extraction of a character string from an image and creation of a combined character string may be performed by an external information processing apparatus via the LAN 31.

本発明の一実施形態に係る画像処理装置としてのファクシミリ複合装置のブロック図である。1 is a block diagram of a facsimile complex apparatus as an image processing apparatus according to an embodiment of the present invention. 読み取った画像データを保存する際のMUPの動作を示すフローチャートである。It is a flowchart which shows operation | movement of MUP at the time of preserve | saving the read image data.

符号の説明Explanation of symbols

1 ファクシミリ複合装置
11 MPU
11a 読取制御部
11b 文字認識部
11c 文字列処理部
11d ファイル生成部
14 CCD
18 操作部
1 Facsimile MFP 11 MPU
11a Reading control unit 11b Character recognition unit 11c Character string processing unit 11d File generation unit 14 CCD
18 Operation unit

Claims (6)

与えられた画像データの画像の中から文字認識により複数の文字列を抽出する文字認識部と、
前記複数の文字列を結合することによって結合文字列を作成する文字列処理部と、
前記結合文字列をファイル名として、前記画像データのファイルを生成するファイル生成部と、を備えることを特徴とする画像処理装置。
A character recognition unit that extracts a plurality of character strings by character recognition from an image of given image data;
A character string processing unit that creates a combined character string by combining the plurality of character strings;
An image processing apparatus comprising: a file generation unit configured to generate a file of the image data using the combined character string as a file name.
請求項1に記載の画像処理装置において、
前記文字列処理部は、前記結合文字列中に、結合されれる前の前記文字列間の境界を識別するための区切り記号を挿入することを特徴とする画像処理装置。
The image processing apparatus according to claim 1.
The image processing apparatus, wherein the character string processing unit inserts a delimiter symbol for identifying a boundary between the character strings before being combined into the combined character string.
請求項1又は請求項2に記載の画像処理装置において、
前記文字認識部は、所定の操作部を介して予め設定された数だけ、前記文字列を前記画像の中から抽出することを特徴とする画像処理装置。
The image processing apparatus according to claim 1 or 2,
The image processing apparatus, wherein the character recognizing unit extracts the character string from the image by a predetermined number through a predetermined operation unit.
請求項1ないし請求項3のいずれかに記載の画像処理装置において、
前記文字列処理部は、前記結合文字列の文字数が予め定められた上限値を超える場合には、前記結合文字列の末尾の前記文字列又は末尾の前記文字列中の文字を切り捨てることを特徴とする画像処理装置。
The image processing apparatus according to any one of claims 1 to 3,
The character string processing unit truncates the character string at the end of the combined character string or the character string at the end when the number of characters of the combined character string exceeds a predetermined upper limit value. An image processing apparatus.
請求項1ないし請求項4のいずれかに記載の画像処理装置において、
前記文字認識部は、前記画像の中から予め定められた特徴を有する文字列を抽出することを特徴とする画像処理装置。
The image processing apparatus according to any one of claims 1 to 4,
The image processing apparatus, wherein the character recognition unit extracts a character string having a predetermined characteristic from the image.
請求項1ないし請求項5のいずれかに記載の画像処理装置において、
原稿の画像を読み取り、前記画像データを出力する読取部をさらに備えることを特徴とする画像処理装置。
The image processing apparatus according to any one of claims 1 to 5,
An image processing apparatus, further comprising a reading unit that reads an image of a document and outputs the image data.
JP2007191387A 2007-07-23 2007-07-23 Image processing device Pending JP2009027648A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007191387A JP2009027648A (en) 2007-07-23 2007-07-23 Image processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007191387A JP2009027648A (en) 2007-07-23 2007-07-23 Image processing device

Publications (1)

Publication Number Publication Date
JP2009027648A true JP2009027648A (en) 2009-02-05

Family

ID=40398991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007191387A Pending JP2009027648A (en) 2007-07-23 2007-07-23 Image processing device

Country Status (1)

Country Link
JP (1) JP2009027648A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2299386A2 (en) 2009-09-04 2011-03-23 Ricoh Company, Ltd. Image processing apparatus, image processing system, and image processing method
JP2011155548A (en) * 2010-01-28 2011-08-11 Kyocera Mita Corp Device, program and method for creation of file
JP2014013534A (en) * 2012-07-05 2014-01-23 Ricoh Co Ltd Document processor, image processor, image processing method and document processing program
EP2779613A1 (en) * 2013-03-12 2014-09-17 Ricoh Company, Ltd. Document processing apparatus, document processing method, and document processing computer program product

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2299386A2 (en) 2009-09-04 2011-03-23 Ricoh Company, Ltd. Image processing apparatus, image processing system, and image processing method
US8605336B2 (en) 2009-09-04 2013-12-10 Ricoh Company, Ltd. Image processing apparatus, image processing system, and image conducting character recognition with respect to image data
US9307109B2 (en) 2009-09-04 2016-04-05 Ricoh Company, Ltd. Image processing apparatus, image processing system, and image processing method
JP2011155548A (en) * 2010-01-28 2011-08-11 Kyocera Mita Corp Device, program and method for creation of file
JP2014013534A (en) * 2012-07-05 2014-01-23 Ricoh Co Ltd Document processor, image processor, image processing method and document processing program
EP2779613A1 (en) * 2013-03-12 2014-09-17 Ricoh Company, Ltd. Document processing apparatus, document processing method, and document processing computer program product

Similar Documents

Publication Publication Date Title
JP2019176434A (en) Information processing system and information processing method
JP2006277031A (en) Information processing apparatus and its method
JP2005293351A (en) Image processor and image processing method
JP2009027648A (en) Image processing device
JP2010165019A (en) File name creating system
JP4860599B2 (en) Image processing device
JP2006080835A (en) Multifunction machine
JP2009226623A (en) Image forming device and data storage method of image forming device
JP4258666B2 (en) Network multi-function peripheral and address book data sharing method
US20110292426A1 (en) Communication apparatus and communication method
JP4455358B2 (en) Image processing apparatus and method
JP2008242820A (en) Document processing system
JP2005275863A (en) Composite machine
JP2005102041A (en) Image recording apparatus
JP3724729B2 (en) Structured document processing apparatus and program thereof
JP2006203317A (en) Document management system, and control method thereof, and storage medium
JP5062049B2 (en) Image processing device
JP4165482B2 (en) Image display program and image display apparatus
JP4182439B2 (en) Internet facsimile machine and program thereof
JP3682861B2 (en) Facsimile server and its program
JP3724730B2 (en) Structured document processing apparatus and processing program
JP4192711B2 (en) Image processing apparatus and program
JP2011166665A (en) Multifunctional machine
US20020049821A1 (en) Document transmission apparatus and storage medium in which program for document transmission apparatus is stored
JP2005102040A (en) Control program of image recording apparatus and recording medium recording the same