JP4134056B2 - Image reading apparatus and image reading program - Google Patents

Image reading apparatus and image reading program Download PDF

Info

Publication number
JP4134056B2
JP4134056B2 JP2005020138A JP2005020138A JP4134056B2 JP 4134056 B2 JP4134056 B2 JP 4134056B2 JP 2005020138 A JP2005020138 A JP 2005020138A JP 2005020138 A JP2005020138 A JP 2005020138A JP 4134056 B2 JP4134056 B2 JP 4134056B2
Authority
JP
Japan
Prior art keywords
character string
image reading
file name
image
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005020138A
Other languages
Japanese (ja)
Other versions
JP2006211261A (en
Inventor
新三 岡島
忠和 大桐
裕二 阿部
浩 木下
絋恵 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Mita Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Mita Corp filed Critical Kyocera Mita Corp
Priority to JP2005020138A priority Critical patent/JP4134056B2/en
Publication of JP2006211261A publication Critical patent/JP2006211261A/en
Application granted granted Critical
Publication of JP4134056B2 publication Critical patent/JP4134056B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、複写機などの画像形成装置やファクシミリ装置などに搭載される画像読取り装置および画像読取りプログラムに関し、特に読取り画像から文字を認識し、認識した文字に対応した文字データ(テキストデータ)を出力する、いわゆるOCR(Optical Character Recognition)機能を有するものに関する。   The present invention relates to an image reading apparatus and an image reading program installed in an image forming apparatus such as a copying machine or a facsimile machine, and in particular, recognizes a character from a read image and outputs character data (text data) corresponding to the recognized character. It relates to a device having a so-called OCR (Optical Character Recognition) function.

前記OCR機能は、文書原稿を読取るだけで、文字データを作成して出力するので、一旦文書にされた原稿を引用したり、修正したりして新たな文書を作成するのに非常に有効である。そのOCR機能で得られた文字データは、記憶手段に記憶されたり、他の機器へ転送されることになるが、多くの文書を管理する場合、使用者が管理し易いように、原稿に対するファイル名を登録しておく必要がある。典型的な従来技術では、1つのファイルを作成する毎に、使用者がキーボード等の原稿画像の読取り手段とは別の入力手段からファイル名を入力している。   Since the OCR function creates and outputs character data simply by reading a document document, it is very effective for creating a new document by quoting or correcting a document once documented. is there. The character data obtained by the OCR function is stored in the storage means or transferred to another device. When managing many documents, the file for the manuscript is easy to manage for the user. First name must be registered. In a typical prior art, every time a file is created, a user inputs a file name from an input unit different from a document image reading unit such as a keyboard.

しかしながら、このような手法では、使用者が原稿の内容を判断してファイル名を決定し、入力しなければならず、手間がかかるという問題がある。   However, in such a method, there is a problem that the user has to determine the file name by determining the content of the document and input it, which is troublesome.

そこで、このような不具合を解消するための従来技術が、特許文献1および特許文献2に示されている。特許文献1は、原稿の隅などの予め定めておいたファイル名領域に手書きされたファイル名を読取って、自動的にファイル名に設定する画像読取り装置である。また、特許文献2も、読取った画像の予め定める領域に記載されている文字を読取って、自動的にファイル名に設定するネットワーク画像通信装置である。
特開2002−74321号公報 特開2004−140551号公報
Therefore, Patent Documents 1 and 2 show conventional techniques for solving such problems. Patent Document 1 is an image reading apparatus that reads a file name handwritten in a predetermined file name area such as a corner of a document and automatically sets the file name. Patent Document 2 is also a network image communication apparatus that reads characters written in a predetermined area of a read image and automatically sets a file name.
JP 2002-74321 A JP 2004-140551 A

上述の従来技術では、使用者によるファイル名の入力の手間は省略することができるけれども、原稿の予め定める領域に記載されている文字を読取って、自動的にファイル名に決定してしまうので、使用者が異なると、ファイル名の付与のし方が一定しないという問題がある。   In the above-described prior art, the user can save the input of the file name, but the characters described in the predetermined area of the document are read and automatically determined as the file name. If the users are different, there is a problem that how to assign the file name is not constant.

本発明の目的は、使用者がファイル名を決定して付与する手間を省略することができるとともに、複数の使用者によってファイル名が付与される場合に、その付与されるファイル名の傾向を一定にすることができる画像読取り装置および画像読取りプログラムを提供することである。   The object of the present invention is to save the user from having to decide and give a file name, and when the file name is given by a plurality of users, the tendency of the given file name is fixed. An image reading apparatus and an image reading program can be provided.

本発明の画像読取り装置は、画像読取り手段に対して原稿を相対的に移動させながら原稿画像を読取り、前記画像読取り手段での読取り画像から認識手段が文字を認識し、文字データを出力する画像読取り装置において、前記原稿に対するファイル名として選択可能な文字列を予め記憶している記憶手段と、前記認識手段による認識結果から、出現頻度の高い文字列のうち、前記記憶手段に記憶されている文字列、または記憶されている文字列に類似した文字列を、前記ファイル名として登録する登録手段を含むことを特徴とする。 The image reading apparatus of the present invention reads an original image while moving the original relatively with respect to the image reading means, and recognizes characters from the read image of the image reading means and outputs character data. In the reading device, a storage unit that stores in advance a character string that can be selected as a file name for the document , and a character string that has a high appearance frequency is stored in the storage unit from the recognition result of the recognition unit . the string or strings that are similar to the character string stored, characterized in that it comprises a registration means for registering as a pre-notated Airu name.

上記の構成によれば、画像読取り手段上を原稿が移動することで、または原稿上を画像読取り手段が移動することで、前記画像読取り手段が原稿画像を読取り、その読取り画像から認識手段が文字を認識し、認識した文字に対応した文字データを出力する、いわゆるOCR機能を備える画像読取り装置において、その認識した文字データや読取った画像データを、たとえば記憶手段に記憶したり、他の機器へ転送したりするにあたって、前記原稿に対するファイル名として選択可能な文字列が記憶手段に予め記憶されており、登録手段は、原稿に対するファイル名を、前記認識手段による認識結果から、出現頻度の高い文字列のうち、前記記憶手段に記憶されている文字列、または記憶されている文字列に類似した文字列に決定し、前記文字データや画像データとともに記憶手段に記憶したり、別の記憶手段に記憶したり、他の機器へ転送したりする。たとえば、前記記憶手段に記憶されている文字列、または記憶されている文字列に類似した文字列の内、最も出現頻度の高い文字列のみ、または最も出現頻度の高い文字列から順に、予め定める数だけ前記ファイル名に採用する。 According to the above configuration, when the original moves on the image reading means or the image reading means moves on the original, the image reading means reads the original image, and the recognition means reads the character from the read image. In the image reading apparatus having a so-called OCR function that recognizes the character and outputs the character data corresponding to the recognized character, the recognized character data or the read image data is stored in, for example, a storage unit or sent to another device. When transferring, a character string that can be selected as a file name for the document is stored in advance in the storage unit, and the registration unit uses the recognition result of the file name for the document by a character having a high appearance frequency. of column, to determine a string similar to a string the string is stored or stored, and in the storage means, the character Or stored in the storage means together over data or image data, or stored in a separate storage means, or transfer to another device. For example, among the character strings stored in the storage means or the character strings similar to the stored character strings, only the most frequently occurring character string or the most frequently occurring character string is determined in advance. The number is adopted for the file name.

したがって、使用者がファイル名を決定して付与する手間を省略することができるとともに、複数の使用者によってファイル名が付与される場合に、その付与されるファイル名の傾向を一定にすることができる。また、予め使用者が識別し易いと思われる文字列の候補を記憶手段に登録しておけば、前記登録手段は、単に出現頻度の高い文字列を自動的にファイル名に決定するのではなく、前記候補の中に合致するものや類似するものをファイル名に決定することになるので、より適切なファイル名を選択することができる。 Therefore, it is possible to save the user from having to decide and assign the file name, and when the file name is given by a plurality of users, the tendency of the given file name can be made constant. it can. Further, if registered candidate string pre Me user is likely to easily identify the storage means, the registration means is simply to automatically determine the file name with high string frequency of occurrence is However, since a file name that matches or is similar among the candidates is determined as a file name, a more appropriate file name can be selected.

さらにまた、本発明の画像読取り装置は、表示手段および入力手段をさらに備え、前記登録手段は、前記出現頻度の高い文字列をリスト化して表示手段に表示させ、そのリストから使用者が入力手段で選択した文字列を前記ファイル名として登録することを特徴とする。   Furthermore, the image reading apparatus of the present invention further includes a display unit and an input unit, and the registration unit makes the display unit display a list of the character strings having a high appearance frequency, and the user inputs the input unit from the list. The character string selected in step 1 is registered as the file name.

上記の構成によれば、ファイル名の登録にあたって、前記出現頻度から、自動的かつ適切なファイル名が選び出され(絞り込まれ)ており、それを1つに限らず、或る程度の候補の中から使用者に選択させることで、より適切なファイル名を選択することができる。   According to the above configuration, when registering a file name, an appropriate and appropriate file name is automatically selected (narrowed down) based on the appearance frequency. By letting the user select from among them, a more appropriate file name can be selected.

また、本発明の画像読取り装置では、前記登録手段は、前記文字列にユニークな情報を付加してファイル名として登録することを特徴とする。   In the image reading apparatus of the present invention, the registration unit adds unique information to the character string and registers it as a file name.

上記の構成によれば、単にファイル名だけでなく、通し番号や日時などのファイル名が同一にならないようなユニークな情報を付加しておくことで、同じ文字列をファイル名に採用したファイルが多数存在しても、それらを個別に識別することができ、同じファイル名を登録してしまうことで、既に保存されているファイルが上書き保存されることがなく、またファイルを種類別に管理することが容易になる。   According to the above configuration, not only the file name but also a number of files that use the same character string as the file name by adding unique information such as a serial number and date / time that will not be the same. Even if they exist, they can be identified individually, and by registering the same file name, files that have already been saved are not overwritten and can be managed by type. It becomes easy.

さらにまた、本発明の画像読取りプログラムは、コンピュータに、画像読取り手段での原稿画像の読取り出力から文字を認識させ、認識した文字に対応した文字データを出力させる画像読取りプログラムにおいて、原稿に対するファイル名として選択可能な文字列を予め記憶しておくステップと、前記文字データから、出現頻度の高い文字列を抽出するステップと、抽出された文字列のうち、前記予め記憶されている文字列、または記憶されている文字列に類似した文字列を原稿に対するファイル名として登録するステップとをコンピュータに実行させることを特徴とする。 Furthermore, the image reading program of the present invention causes a computer, to recognize characters from reading the output of the original image by the image reading unit, the image reading program for outputting text data corresponding to the recognized character, the file name for the original A step of preliminarily storing a character string that can be selected as, a step of extracting a character string having a high appearance frequency from the character data, and a character string stored in advance among the extracted character strings, or And causing the computer to execute a step of registering a character string similar to the stored character string as a file name for the document.

上記の構成によれば、画像読取り手段上を原稿が移動することで、または原稿上を画像読取り手段が移動することで、前記画像読取り手段が原稿画像を読取り、その読取り画像から認識手段が文字を認識し、認識した文字に対応した文字データを出力する、いわゆるOCR機能を実現する画像読取りプログラムにおいて、その認識した文字データや読取った画像データを、たとえば記憶手段に記憶したり、他の機器へ転送したりするにあたって、前記原稿に対するファイル名として選択可能な文字列を予め記憶しておき、前記文字データの中で出現頻度の高い文字列を抽出して、そのうち、前記予め記憶されている文字列、または記憶されている文字列に類似した文字列を原稿に対するファイル名として登録し、前記文字データや読取った画像データとともに記憶手段に記憶したり、別の記憶手段に記憶したり、他の機器へ転送したりする。たとえば、前記予め記憶されている文字列、または記憶されている文字列に類似した文字列の内、最も出現頻度の高い文字列のみ、または最も出現頻度の高い文字列から順に、予め定める数だけ前記ファイル名に採用する。 According to the above configuration, when the original moves on the image reading means or the image reading means moves on the original, the image reading means reads the original image, and the recognition means reads the character from the read image. In an image reading program that realizes a so-called OCR function that recognizes the character and outputs the character data corresponding to the recognized character, the recognized character data or the read image data is stored in, for example, a storage means or other device Or the like, a character string that can be selected as a file name for the document is stored in advance, and a character string having a high appearance frequency is extracted from the character data, and the character string is stored in advance. register string, or a string similar to the character string stored as a file name for the document, the text data and the read image And stores in the storage means with the data, or stored in a separate storage means, or transfer to another device. For example, among the character strings stored in advance or the character strings similar to the stored character strings, only the character string having the highest appearance frequency, or the predetermined number in order from the character string having the highest appearance frequency. Adopted in the file name.

したがって、使用者がファイル名を決定して付与する手間を省略することができるとともに、複数の使用者によってファイル名が付与される場合に、その付与されるファイル名の傾向を一定にすることができる。また、予め使用者が識別し易いと思われる文字列の候補を登録しておけば、単に出現頻度の高い文字列を自動的にファイル名に決定するのではなく、前記候補の中に合致するものや類似するものをファイル名に決定することになるので、より適切なファイル名を選択することができる。 Therefore, it is possible to save the user from having to decide and assign the file name, and when the file name is given by a plurality of users, the tendency of the given file name can be made constant. it can. If a character string candidate that is likely to be easily identified by the user is registered in advance, a character string having a high appearance frequency is not automatically determined as a file name, but matches the candidate. Since the file name is determined to be something similar or similar, a more appropriate file name can be selected.

本発明の画像読取り装置および画像読取りプログラムは、以上のように、画像読取り手段上を原稿が移動することで、または原稿上を画像読取り手段が移動することで、前記画像読取り手段が原稿画像を読取り、その読取り画像から認識手段が文字を認識し、認識した文字に対応した文字データを出力する、いわゆるOCR機能を備える画像読取り装置において、たとえばその認識した文字データや読取った画像データを記憶手段に記憶したり、他の機器へ転送したりするにあたって、前記原稿に対するファイル名として選択可能な文字列を記憶手段に予め記憶しておき、登録手段は、原稿に対するファイル名を、前記認識手段による認識結果から、出現頻度の高い文字列のうち、前記記憶手段に記憶されている文字列、または記憶されている文字列に類似した文字列に決定する。 As described above, the image reading apparatus and the image reading program of the present invention allow the image reading means to move the original on the image reading means or the image reading means on the original so that the image reading means can read the original image. In an image reading apparatus having a so-called OCR function in which a recognition means recognizes a character from the read image and outputs character data corresponding to the recognized character. Character strings that can be selected as file names for the originals are stored in advance in the storage means, and the registration means determines the file names for the originals by the recognition means. from the recognition result, of high frequency of appearance string, the string stored in said storage means or is stored, It is determined to be similar to the character string to a character string.

それゆえ、使用者がファイル名を決定して付与する手間を省略することができるとともに、複数の使用者によってファイル名が付与される場合に、その付与されるファイル名の傾向を一定にすることができる。また、予め使用者が識別し易いと思われる文字列の候補を記憶手段に登録しておけば、前記登録手段は、単に出現頻度の高い文字列を自動的にファイル名に決定するのではなく、前記候補の中に合致するものや類似するものをファイル名に決定することになるので、より適切なファイル名を選択することができる。 Therefore, it is possible to save the user from having to decide and assign the file name, and to make the tendency of the given file name constant when the file name is given by multiple users. Can do. In addition, if a character string candidate that can be easily identified by a user is registered in the storage unit in advance, the registration unit does not simply determine a character string having a high appearance frequency as a file name automatically. Since a candidate that matches or is similar among the candidates is determined as a file name, a more appropriate file name can be selected.

[実施の形態1]
図1は、本発明の実施の一形態に係る画像読取り装置であるスキャナ部33を備える複写機31の機械的構成を示す縦断面図である。この複写機31は、大略的に、画像形成を行う本体部32と、前記本体部32の上方側に配設され、原稿読取り装置である前記スキャナ部33と、そのスキャナ部33の上方側に配設されるADF(Auto document feeder)34とを備えて構成される。
[Embodiment 1]
FIG. 1 is a longitudinal sectional view showing a mechanical configuration of a copying machine 31 including a scanner unit 33 which is an image reading apparatus according to an embodiment of the present invention. The copying machine 31 is generally arranged on the upper side of the main body 32 for forming an image, the main body 32, and on the upper side of the scanner 33, which is a document reading device. An ADF (Auto document feeder) 34 is provided.

前記本体部32では、1または複数(図1では3個)の給紙トレイ41,42,43や手差しトレイ44に装填された記録紙41a,42a,43a,44aの何れかが取込みローラ41b,42b,43b,44bで1枚ずつ取出され、レジストローラ45,46にてタイミング調整が行われた後、画像形成部47に搬送される。前記画像形成部47は、感光体ドラム47aの周囲に、図示しない帯電器、レーザ書込みユニット、現像器、転写ユニット47bおよび図示しないクリーニングユニット等が配置され、前記記録紙に電子写真方式で画像形成を行う。こうして記録紙に形成されたトナー像は、定着部48にて定着され、排出ローラ49,50から排紙トレイ51上に排出される。   In the main body 32, one or a plurality of (three in FIG. 1) paper feed trays 41, 42, 43 or one of the recording papers 41a, 42a, 43a, 44a loaded in the manual feed tray 44 is a take-in roller 41b, 42b, 43b, and 44b are taken out one by one, adjusted in timing by registration rollers 45 and 46, and then conveyed to the image forming unit 47. The image forming unit 47 includes a charger (not shown), a laser writing unit, a developing unit, a transfer unit 47b, a cleaning unit (not shown), and the like around the photosensitive drum 47a, and forms an image on the recording paper by electrophotography. I do. The toner image thus formed on the recording paper is fixed by the fixing unit 48 and discharged from the discharge rollers 49 and 50 onto the paper discharge tray 51.

前記レーザ書込みユニットに与えられる原稿画像データは、スキャナ部33および/またはADF34にて読取られる。スキャナ部33では、原稿載置台52の下面には、原稿に照明光を照射し、その反射光を受光するランプユニット53と、前記ランプユニット53で得られた原稿画像を反射するミラーユニット54と、前記ミラーユニット54からの原稿画像を集光する結像レンズ55と、CCDイメージセンサなどから成り、前記結像レンズ55で結像された原稿画像を光電変換する撮像素子56とを備えて構成される。前記ランプユニット53が速度Vで、前記ミラーユニット54が速度V/2で、図1の左右方向に変位することで、前記原稿載置台52に載置されたブック物や1枚物の原稿画像が、常に等しい光路長で前記撮像素子56に結像される。こうして読取られた原稿画像データは、図示しない画像処理ユニットにて濃度調整や輪郭強調などの画像処理が行われ、前記レーザ書込みユニットに与えられる。   Document image data given to the laser writing unit is read by the scanner unit 33 and / or the ADF 34. In the scanner unit 33, the lower surface of the document placing table 52 is irradiated with illumination light on the document and receives a reflected light thereof, and a mirror unit 54 that reflects a document image obtained by the lamp unit 53. And an imaging lens 55 for condensing the original image from the mirror unit 54 and an image sensor 56 that photoelectrically converts the original image formed by the imaging lens 55, such as a CCD image sensor. Is done. The lamp unit 53 is displaced at a speed V and the mirror unit 54 is displaced at a speed V / 2 in the left-right direction in FIG. 1, whereby a book or a single original image placed on the original placement table 52. Is always imaged on the image sensor 56 with the same optical path length. The document image data read in this way is subjected to image processing such as density adjustment and contour enhancement in an image processing unit (not shown), and is given to the laser writing unit.

一方、シート原稿を順次取り込んでゆくADF34では、原稿トレイ61に積層された原稿62は、取込みローラ63によって1枚ずつ取出され、湾曲搬送路64へと供給される。そして前記湾曲搬送路64に設けられた搬送ローラ65,66;67,68によって、主走査方向に延びる原稿載置台72へと搬送され、該原稿載置台72に前記ランプユニット53が臨んだ状態で、順次原稿画像が読取られた後、排出ローラ69,70によって排出トレイ71上へと排出される。   On the other hand, in the ADF 34 that sequentially takes in sheet originals, the originals 62 stacked on the original tray 61 are taken out one by one by the take-in rollers 63 and supplied to the curved conveyance path 64. Then, the paper is transported to the document placing table 72 extending in the main scanning direction by the transport rollers 65, 66; 67, 68 provided in the curved transport path 64, and the lamp unit 53 faces the document placing table 72. The document images are sequentially read and then discharged onto the discharge tray 71 by the discharge rollers 69 and 70.

図2は、上述のように構成される複写機31の電気的構成を示すブロック図である。この図2では、画像読取り手段である前記撮像素子56において、原稿62を読取って得られた画像信号に対する信号処理部分のみを示し、原稿62および記録紙41a,42a,43a,44aの給送系や定着部48の温度制御などの前記画像信号以外に関する部分の構成は省略している。   FIG. 2 is a block diagram showing an electrical configuration of the copying machine 31 configured as described above. FIG. 2 shows only the signal processing portion for the image signal obtained by reading the original 62 in the image pickup device 56 as image reading means, and the feeding system for the original 62 and the recording paper 41a, 42a, 43a, 44a. Further, the configuration other than the image signal such as the temperature control of the fixing unit 48 is omitted.

先ず、前記撮像素子56からの画像信号は、増幅部81において増幅され、アナログ/デジタル変換部82においてデジタル信号に変換された後、マイクロコンピュータやデジタルシグナルプロセッサなどで実現される画像信号処理回路83に入力される。この画像信号処理回路83内で、前記画像信号は、シェーディング補正部84においてシェーディング補正され、さらに画像処理部85において、拡大縮小、濃度調整、輪郭強調などの処理が施された後、前記レーザ書込みユニットへ出力される。   First, an image signal from the image pickup device 56 is amplified by an amplifier 81, converted into a digital signal by an analog / digital converter 82, and then an image signal processing circuit 83 realized by a microcomputer, a digital signal processor, or the like. Is input. In the image signal processing circuit 83, the image signal is subjected to shading correction by a shading correction unit 84, and further subjected to processing such as enlargement / reduction, density adjustment, and contour enhancement in the image processing unit 85, and then the laser writing. Output to the unit.

また、前記画像信号は、認識手段である文字認識部91に与えられ、前記画像信号から、順次文字が認識され、対応する文字データ(テキストデータ)が作成されて、いわゆるOCR機能が実現されている。その文字データは、記憶部92に記憶され、原稿1枚毎や予め定める1纏まりの原稿毎にファイル化され、出力インタフェイス部93から、パーソナルコンピュータやプリンタ或いはネットワークなどの外部機器へ出力される。   Further, the image signal is given to a character recognition unit 91 which is a recognition means, and characters are sequentially recognized from the image signal, and corresponding character data (text data) is created, so-called OCR function is realized. Yes. The character data is stored in the storage unit 92, filed for each original document or for a predetermined batch of originals, and output from the output interface unit 93 to an external device such as a personal computer, a printer, or a network. .

注目すべきは、本発明では、前記記憶部92に記憶された文字データから、出現頻度の高い文字列(語句)を抽出し、原稿62に対するファイル名として登録する登録部94を備えていることである。そして、前記記憶部92内には、たとえば数字のみのように、前記ファイル名として使用してはいけない禁則文字や、登録できる上限の文字数などが、予めメーカー側で、或いは使用者の入力部97からの入力操作によって、制限リスト95として記憶されている。また、本体部32の上面などには、表示部96および前記入力部97のユーザインタフェイスが設けられている。   It should be noted that the present invention includes a registration unit 94 that extracts a character string (word / phrase) having a high appearance frequency from the character data stored in the storage unit 92 and registers it as a file name for the document 62. It is. In the storage unit 92, for example, forbidden characters that should not be used as the file name, such as only numbers, and the upper limit number of characters that can be registered are stored in advance by the manufacturer or by the user input unit 97. Is stored as a restriction list 95 by an input operation from. In addition, a user interface for the display unit 96 and the input unit 97 is provided on the upper surface of the main body 32.

図3は、この画像信号処理回路83における各部を制御する制御部98による画像読取り動作を説明するためのフローチャートである。ステップS1で撮像素子56によって原稿62の画像が読込まれ、文字認識部91において文字認識され、記憶部92に記憶されてゆくと、ステップS2で、登録部94によって、前記入力部97から制限リスト95に設定された文字数を上限として、文字列が抽出される。   FIG. 3 is a flowchart for explaining an image reading operation by the control unit 98 that controls each unit in the image signal processing circuit 83. In step S1, the image of the document 62 is read by the image pickup device 56, and the character recognition unit 91 recognizes the character and stores it in the storage unit 92. In step S2, the registration unit 94 loads the restriction list from the input unit 97. Character strings are extracted with the number of characters set to 95 as the upper limit.

ステップS3では、登録部94は、最も出現頻度の高い文字列を抽出し、ステップS4で、制限リスト95に設定された禁則文字であるか否かを判断し、禁則文字である場合はステップS5において次候補の文字列が選択されて前記ステップS4に戻り、禁則文字でない場合はステップS6に移る。   In step S3, the registration unit 94 extracts a character string having the highest appearance frequency. In step S4, the registration unit 94 determines whether the character is a prohibited character set in the restriction list 95. If the character is a prohibited character, step S5 is performed. Then, the next candidate character string is selected and the process returns to step S4. If it is not a prohibited character, the process proceeds to step S6.

ステップS6では、選択された文字列を含むファイル名が記憶部92において既にファイル名として記憶されているか否か、すなわち過去に同じ文字列を含むファイル名が存在したか否かが判断され、存在している場合にはステップS7において文字列にユニークな情報を付加してファイル名とした後ステップS8に移り、存在していない場合は直接ステップS8に移る。前記ユニークな情報は、通し番号や、日時のデータなど、ファイル名が同一にならないような情報であればよい。   In step S6, it is determined whether or not the file name including the selected character string is already stored as a file name in the storage unit 92, that is, whether or not a file name including the same character string has existed in the past. If so, the process moves to step S8 after adding unique information to the character string in step S7 to make a file name, and directly moves to step S8 if it does not exist. The unique information may be information that does not have the same file name, such as a serial number or date / time data.

このように構成することで、登録部94によってファイル名が自動的に適切なものに登録されるので、使用者がファイル名を決定して付与する手間を省略することができるとともに、複数の使用者によってファイル名が付与される場合に、その付与されるファイル名の傾向を一定にすることができる。   With this configuration, the registration unit 94 automatically registers the file name in an appropriate one, so that the user can save time and effort to determine and give the file name, and a plurality of uses When a file name is given by a person, the tendency of the given file name can be made constant.

[実施の形態2]
図4は、本発明の実施の他の形態に係る画像読取り動作を説明するためのフローチャートである。本実施の形態には、前述の複写機31の構成を用いることができ、前記画像信号処理回路83における制御部98の制御動作が異なるだけである。注目すべきは、本実施の形態では、前記表示部96には出現頻度の高い順に、文字列を予め定める数だけ表示可能であり、使用者が入力部97から選択可能なことである。このため、前記制限リスト96には、文字列の表示可能数が予め設定されている。図4において、図3の処理と同一の処理には、同一のステップ番号を付してその説明を省略し、類似した処理には、同一のステップ番号に添字aを付して示す。
[Embodiment 2]
FIG. 4 is a flowchart for explaining an image reading operation according to another embodiment of the present invention. In the present embodiment, the configuration of the copying machine 31 described above can be used, and only the control operation of the control unit 98 in the image signal processing circuit 83 is different. It should be noted that in the present embodiment, the display unit 96 can display a predetermined number of character strings in descending order of appearance frequency, and the user can select from the input unit 97. For this reason, in the restriction list 96, the number of displayable character strings is preset. In FIG. 4, the same steps as those in FIG. 3 are denoted by the same step numbers and description thereof is omitted, and similar steps are denoted by the suffix “a”.

前記ステップS1からS2で原稿画像が読込まれ、文字認識の後文字列が抽出されると、ステップS3aでは、登録部94は、出現頻度の高い順に、予め前記制限リスト95に設定された数だけ文字列を抽出する。そして、ステップS8aでの表示では、その抽出された文字列のリストを表示部96に表示し、ステップS9aの決定処理でも、使用者によって複数の文字列の中からより適切と判断されたものをファイル名に決定する。   When a document image is read in steps S1 to S2 and character strings are extracted after character recognition, in step S3a, the registration unit 94 sets the number of presets in the order of appearance frequency by the number set in advance in the restriction list 95. Extract a string. In the display in step S8a, the extracted character string list is displayed on the display unit 96, and in the determination process in step S9a, what is determined to be more appropriate by the user from a plurality of character strings is displayed. Determine the file name.

このように構成することで、ファイル名の登録にあたって、前記出現頻度から、自動的かつ適切なファイル名が選び出され(絞り込まれ)ており、それを1つに限らず、或る程度の候補の中から使用者に選択させるので、より適切なファイル名を選択することができる。   With this configuration, when registering a file name, an appropriate file name is automatically selected (narrowed down) based on the appearance frequency, and the number of candidates is not limited to one but to some extent. Since the user selects from among the above, a more appropriate file name can be selected.

[実施の形態3]
図5は、本発明の実施のさらに他の形態に係る画像読取り装置である複写機101の電気的構成を示すブロック図である。この複写機101は、前述の図2で示す複写機31に類似し、対応する部分には同一の参照符号を付して示し、その説明を省略する。なお、機械的構成は、図1と同様である。注目すべきは、この複写機101では、記憶手段である記憶部92aに、予めファイル名として選択可能な文字列を記憶している候補リスト102をさらに備えており、登録部94aは、前記出現頻度の高い文字列のうち、前記候補リスト102に記憶されている文字列、または記憶されている文字列に類似した文字列を前記ファイル名として登録することである。前記類似とは、たとえば抽出された文字列の一部が前記候補リスト102の文字列と一致したり、逆に候補リスト102の文字列の一部が抽出された文字列と一致する場合などを示す。
[Embodiment 3]
FIG. 5 is a block diagram showing an electrical configuration of a copying machine 101 which is an image reading apparatus according to still another embodiment of the present invention. The copying machine 101 is similar to the copying machine 31 shown in FIG. 2 described above, and corresponding portions are denoted by the same reference numerals and description thereof is omitted. The mechanical configuration is the same as in FIG. It should be noted that the copying machine 101 further includes a candidate list 102 in which character strings that can be selected as file names are stored in the storage unit 92a serving as storage means in advance. Among the frequently used character strings, a character string stored in the candidate list 102 or a character string similar to the stored character string is registered as the file name. The similarity is, for example, a case where a part of the extracted character string matches the character string of the candidate list 102 or conversely a part of the character string of the candidate list 102 matches the extracted character string. Show.

図6は、本実施の形態の画像信号処理回路83aにおける制御部98aによる画像読取り動作を説明するためのフローチャートである。この動作は、前述の図4で示す動作に類似している。前記ステップS1からS2で原稿画像が読込まれ、文字認識の後、文字列が抽出されると、ステップS3bでは、登録部94aは、出現頻度の高い順に、予め前記制限リスト95に設定された数だけ文字列を抽出する。このとき、認識された文字列と、前記候補リスト102に予め登録された文字列とを比較し、一致または類似するものだけを抽出する。その後の禁則確認、抽出された文字列のリストの表示および使用者による決定処理は、図4と同様である。   FIG. 6 is a flowchart for explaining an image reading operation by the control unit 98a in the image signal processing circuit 83a of the present embodiment. This operation is similar to the operation shown in FIG. When a document image is read in steps S1 to S2 and character strings are extracted after character recognition, in step S3b, the registration unit 94a sets the number set in advance in the restriction list 95 in descending order of appearance frequency. Just extract the string. At this time, the recognized character string is compared with a character string registered in advance in the candidate list 102, and only those that match or are similar are extracted. Subsequent confirmation of prohibition, display of a list of extracted character strings, and determination processing by the user are the same as in FIG.

このように構成することで、単に出現頻度の高い文字列を自動的にファイル名に決定するのではなく、使用者が識別し易いと思われる文字列の候補を候補リスト102に登録しておき、その中に合致するものや類似するものをファイル名に決定するので、より適切なファイル名を選択することができる。   With this configuration, character strings that are likely to be easily identified by the user are registered in the candidate list 102 instead of automatically determining a character string having a high appearance frequency as a file name. Since a file name that matches or is similar to the file name is determined, a more appropriate file name can be selected.

本発明は、複写機に限らず、OCR機能を備える画像読取り装置として広く実施することができ、画像読取りの手法も、ファクシミリ装置などにおけるADFに密着式イメージセンサ(CIS)から成る構成でもよい。また、ファイル名とともに、読取った日付等の他のデータを付加して、記憶部92,92aに記憶したり、外部へ出力するようにしてもよい。   The present invention is not limited to a copying machine, and can be widely implemented as an image reading apparatus having an OCR function. The image reading method may be a configuration including an image sensor (CIS) that is in close contact with an ADF in a facsimile machine or the like. Further, other data such as the read date may be added together with the file name and stored in the storage units 92 and 92a or output to the outside.

本発明の実施の一形態に係る画像読取り装置であるスキャナ部を備える複写機の機械的構成を示す縦断面図である。1 is a longitudinal sectional view showing a mechanical configuration of a copying machine including a scanner unit that is an image reading apparatus according to an embodiment of the present invention. 図1で示す複写機の電気的構成を示すブロック図である。FIG. 2 is a block diagram showing an electrical configuration of the copying machine shown in FIG. 1. 本発明の実施の一形態に係る画像読取り動作を説明するためのフローチャートである。It is a flowchart for demonstrating the image reading operation | movement which concerns on one Embodiment of this invention. 本発明の実施の他の形態に係る画像読取り動作を説明するためのフローチャートである。It is a flowchart for demonstrating the image reading operation | movement which concerns on other embodiment of this invention. 本発明の実施のさらに他の形態に係る画像読取り装置である複写機の電気的構成を示すブロック図である。FIG. 10 is a block diagram showing an electrical configuration of a copying machine which is an image reading apparatus according to still another embodiment of the present invention. 本発明の実施のさらに他の形態に係る画像読取り動作を説明するためのフローチャートである。It is a flowchart for demonstrating the image reading operation | movement which concerns on other form of implementation of this invention.

符号の説明Explanation of symbols

31,101 複写機
32 本体部
33 スキャナ部
34 ADF
56 撮像素子
62 原稿
81 増幅部
82 アナログ/デジタル変換部
83,83a 画像信号処理回路
84 シェーディング補正部
85 画像処理部
91 文字認識部
92,92a 記憶部
93 出力インタフェイス部
94,94a 登録部
95 制限リスト
96 表示部
97 入力部
98,98a 制御部
102 候補リスト
31, 101 Copier 32 Main Body 33 Scanner 34 ADF
56 Image sensor 62 Document 81 Amplifying unit 82 Analog / digital conversion unit 83, 83a Image signal processing circuit 84 Shading correction unit 85 Image processing unit 91 Character recognition unit 92, 92a Storage unit 93 Output interface unit 94, 94a Registration unit 95 Restriction List 96 Display unit 97 Input unit 98, 98a Control unit 102 Candidate list

Claims (4)

画像読取り手段に対して原稿を相対的に移動させながら原稿画像を読取り、前記画像読取り手段での読取り画像から認識手段が文字を認識し、文字データを出力する画像読取り装置において、
前記原稿に対するファイル名として選択可能な文字列を予め記憶している記憶手段と、
前記認識手段による認識結果から、出現頻度の高い文字列のうち、前記記憶手段に記憶されている文字列、または記憶されている文字列に類似した文字列を、前記ファイル名として登録する登録手段を含むことを特徴とする画像読取り装置。
In an image reading apparatus that reads a document image while moving the document relative to the image reading unit, recognizes characters from a read image by the image reading unit, and outputs character data.
Storage means for storing in advance a character string that can be selected as a file name for the document;
From the recognition result by the recognition unit, and registers of the high frequency of appearance string, the string is stored in the storage means, or a character string similar to the character string stored as pre-notated Airu name image reading apparatus characterized by including a registration unit.
表示手段および入力手段をさらに備え、
前記登録手段は、前記出現頻度の高い文字列をリスト化して表示手段に表示させ、そのリストから使用者が入力手段で選択した文字列を前記ファイル名として登録することを特徴とする請求項1記載の画像読取り装置。
It further comprises display means and input means,
2. The registration unit according to claim 1, wherein the character string having a high appearance frequency is listed and displayed on a display unit, and the character string selected by the user from the list using the input unit is registered as the file name. The image reading apparatus described.
前記登録手段は、前記文字列にユニークな情報を付加してファイル名として登録することを特徴とする請求項1または2記載の画像読取り装置。 The image reading apparatus according to claim 1, wherein the registration unit adds unique information to the character string and registers it as a file name. コンピュータに、画像読取り手段での原稿画像の読取り出力から文字を認識させ、認識した文字に対応した文字データを出力させる画像読取りプログラムにおいて、
原稿に対するファイル名として選択可能な文字列を予め記憶しておくステップと、
前記文字データから、出現頻度の高い文字列を抽出するステップと、
抽出された文字列のうち、前記予め記憶されている文字列、または記憶されている文字列に類似した文字列を原稿に対するファイル名として登録するステップとをコンピュータに実行させることを特徴とする画像読取りプログラム。
In an image reading program for causing a computer to recognize characters from a read output of a document image by an image reading means and outputting character data corresponding to the recognized characters,
Storing in advance a character string that can be selected as a file name for the document;
Extracting a character string having a high appearance frequency from the character data;
An image that causes a computer to execute a step of registering, as a file name for a document, a character string similar to the character string stored in advance or the character string stored in the extracted character string Reader program.
JP2005020138A 2005-01-27 2005-01-27 Image reading apparatus and image reading program Expired - Fee Related JP4134056B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005020138A JP4134056B2 (en) 2005-01-27 2005-01-27 Image reading apparatus and image reading program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005020138A JP4134056B2 (en) 2005-01-27 2005-01-27 Image reading apparatus and image reading program

Publications (2)

Publication Number Publication Date
JP2006211261A JP2006211261A (en) 2006-08-10
JP4134056B2 true JP4134056B2 (en) 2008-08-13

Family

ID=36967626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005020138A Expired - Fee Related JP4134056B2 (en) 2005-01-27 2005-01-27 Image reading apparatus and image reading program

Country Status (1)

Country Link
JP (1) JP4134056B2 (en)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8861856B2 (en) 2007-09-28 2014-10-14 Abbyy Development Llc Model-based methods of document logical structure recognition in OCR systems
JP6051827B2 (en) * 2012-12-07 2016-12-27 株式会社リコー Document processing apparatus, image processing apparatus, document processing method, and document processing program
JP2011155548A (en) * 2010-01-28 2011-08-11 Kyocera Mita Corp Device, program and method for creation of file
JP5494278B2 (en) * 2010-06-22 2014-05-14 コニカミノルタ株式会社 Image forming composite device
US8572231B2 (en) * 2011-07-14 2013-10-29 Google Inc. Variable-length nonce generation
JP2014013534A (en) * 2012-07-05 2014-01-23 Ricoh Co Ltd Document processor, image processor, image processing method and document processing program
US9413912B2 (en) 2012-10-26 2016-08-09 Abbyy Development Llc Scanning device having a bed cover including a pattern of repeated design elements
JP2014174923A (en) * 2013-03-12 2014-09-22 Ricoh Co Ltd Document processor, document processing method, and document processing program
JP7043929B2 (en) 2018-03-29 2022-03-30 株式会社リコー Information processing system and information processing method
JP7400397B2 (en) 2019-11-26 2023-12-19 京セラドキュメントソリューションズ株式会社 information processing equipment
JP7414554B2 (en) * 2020-01-27 2024-01-16 シャープ株式会社 Information processing device, control method and program

Also Published As

Publication number Publication date
JP2006211261A (en) 2006-08-10

Similar Documents

Publication Publication Date Title
JP4134056B2 (en) Image reading apparatus and image reading program
JP3332546B2 (en) Image forming apparatus and image forming method
JP4948360B2 (en) Image reading apparatus and image forming apparatus
JP2003173109A (en) Image forming apparatus and image forming adjustment method
JP2003110829A (en) Device and method for forming image
CN103369173B (en) Electronization device
JP2006321190A (en) Image formation device and method for setting language
JP5741070B2 (en) Image reading apparatus and image forming apparatus
JP5168084B2 (en) Image processing apparatus, program, and image processing method
JP2008211716A (en) Image processing apparatus, image forming apparatus, image processing method and program
JP4801616B2 (en) Image processing apparatus, program, and image processing method
JP4808662B2 (en) Image processing apparatus, program, and image processing method
JP2005167875A (en) Image forming apparatus, and method of printing image forming apparatus
JP4573742B2 (en) Image output device
JP4933382B2 (en) Image processing apparatus and image processing method
JP2005020224A (en) Image processor and image forming device
JP2009010690A (en) Image reader and image forming apparatus
JP4081072B2 (en) Image forming apparatus
JP2011004356A (en) Image forming apparatus
JP4162369B2 (en) Image reading apparatus, image forming apparatus, and image data processing method
JP3987850B2 (en) Image processing apparatus and image forming apparatus
JP3934385B2 (en) Image processing apparatus, image reading apparatus, and image forming apparatus
JP2020112651A (en) Image forming apparatus
JP2005217703A (en) Index image creating apparatus and method therefor
JP3968366B2 (en) Image forming apparatus

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080319

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080501

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080602

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110606

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110606

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120606

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120606

Year of fee payment: 4

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120606

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130606

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140606

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees