JPH06103411A - Document reader - Google Patents

Document reader

Info

Publication number
JPH06103411A
JPH06103411A JP4254354A JP25435492A JPH06103411A JP H06103411 A JPH06103411 A JP H06103411A JP 4254354 A JP4254354 A JP 4254354A JP 25435492 A JP25435492 A JP 25435492A JP H06103411 A JPH06103411 A JP H06103411A
Authority
JP
Japan
Prior art keywords
document
image
character
input
inclination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4254354A
Other languages
Japanese (ja)
Other versions
JP3186246B2 (en
Inventor
Katsumi Marukawa
勝美 丸川
Kazuki Nakajima
和樹 中島
Masashi Koga
昌史 古賀
Yoshihiro Shima
好博 嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP25435492A priority Critical patent/JP3186246B2/en
Publication of JPH06103411A publication Critical patent/JPH06103411A/en
Priority to JP10304988A priority patent/JPH11219409A/en
Application granted granted Critical
Publication of JP3186246B2 publication Critical patent/JP3186246B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Facsimile Scanning Arrangements (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Character Input (AREA)

Abstract

PURPOSE:To read the contents of a document, and to exhibit a corrected picture to a user or to store it by detecting an angle of rotation, and correcting the input picture to a correct direction even in the case that the document is input ted while being rotated by an arbitrary angle to the set direction of a scanner. CONSTITUTION:This reader is provided with a picture input means 105 for inputting a document picture, a character line extracting means 110 for extracting the character line of the inputted document picture, an inclination extracting means 125 for extracting the inclination of the document, a character line coordinate rotating means 165 for rotating the extracted character line by the angles obtained by adding 0 deg., 90 deg., 180 deg., 270 deg. to the inclination of the document, and a document rotation angle judging means 150 for recognizing respectively four rotated character strings and judging the angle of rotation of the most correct one among them as the inclination of the document, and the inclination of the document is corrected.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文書読取装置および電
子ファイル装置およびファクシミリ装置および複写機お
よび計算機に入力する紙の文書を電子的なデータに変換
する装置に関し、特に、予め決まっているスキャナ(走
査線)の読み取り方向(移動方向)に対し、ユーザがこ
の方向を意識せず、紙の文書をスキャナ上に0度から3
60度までのどのような角度で設定しても、文書に記載
されている内容を読み取ったり、あるいは、正しい方向
に入力画像を修正したりする等のユーザの使い勝手を改
善した文書読取装置および電子ファイル装置およびファ
クシミリ装置および複写機および計算機に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document reading device, an electronic file device, a facsimile device, a device for converting a paper document input to a copying machine and a computer into electronic data, and more particularly to a predetermined scanner. The user is not aware of the (scanning line) reading direction (moving direction), and the paper document is read on the scanner from 0 degrees to 3 degrees.
A document reading device and an electronic device with improved usability such as reading the contents described in a document or correcting an input image in the correct direction regardless of the angle set up to 60 degrees The present invention relates to a file device, a facsimile device, a copying machine, and a computer.

【0002】[0002]

【従来の技術】元来、スキャナの読み取り方向と文書の
スキャナ上への設定方向が一致した状態でのみ、文書中
に記載された内容が読み取れる文書読取装置が知られて
いる。しかしながら、近年、文書読取装置が実現される
に及んで、文書が傾いて入力されたり、それと同時にス
キャナの読み取り方向と文書のスキャナ上への設定方向
が不一致であるという設定状態の不十分な場合において
も入力文書の読み取りを行なわなければならない状況が
発生している。
2. Description of the Related Art Originally, there has been known a document reading device which can read the contents described in a document only when the reading direction of the scanner and the setting direction of the document on the scanner match. However, in recent years, with the realization of document reading devices, when a document is input with a tilt, and at the same time, the reading direction of the scanner and the setting direction of the document on the scanner do not match, the setting state is insufficient. There is a situation in which the input document must be read.

【0003】上記の問題を解決する従来例としては、特
開昭62−14277号公報、特開平2−105266
号公報がある。
As a conventional example for solving the above problems, Japanese Patent Laid-Open Nos. 62-14277 and 2-105266 are available.
There is a gazette.

【0004】特開昭62−14277号公報に開示の装
置では、画像から輪郭抽出を行ない、抽出された輪郭か
ら罫線などの直線部分の傾きを抽出して、この直線部分
の傾きが水平(あるいは垂直)になるように傾きを補正
することにより、画像の傾きを補正可能とする。
In the apparatus disclosed in Japanese Patent Laid-Open No. 62-14277, contour extraction is performed from an image, the inclination of a straight line portion such as a ruled line is extracted from the extracted contour, and the inclination of this straight line portion is horizontal (or By correcting the inclination so that it becomes (vertical), the inclination of the image can be corrected.

【0005】特開平2−105266号公報に開示の装
置では、黒画素計数手段により計数した計数結果を比較
しその結果により入力されている文書画像を回転させる
ことにより、文書画像の上下関係の自動修正を図る。
In the apparatus disclosed in Japanese Patent Application Laid-Open No. 2-105266, the counting results counted by the black pixel counting means are compared, and the document image input based on the comparison result is rotated, whereby the vertical relationship of the document images is automatically detected. Fix it.

【0006】[0006]

【発明が解決しようとする課題】しかし、上記の従来の
装置では、上下関係が一致して傾いている状態(傾きが
0〜90度)、あるいは、入力文書に傾きがなく上下関
係が異なっていた状態(傾きが180度)しか文書に記
載された内容を読み取ることができない。
However, in the above-described conventional apparatus, the vertical relationship is the same, and the vertical relationship is the same (the inclination is 0 to 90 degrees), or the input document has no inclination and the vertical relationship is different. The contents described in the document can be read only in the open state (inclination is 180 degrees).

【0007】つまり、上記の従来の装置では、スキャナ
の設定方向に対し任意の角度(0度から360度)回転
されて入力された場合、その内容を読み取ることができ
なかったり、正しい方向に入力画像を修正しユーザに画
像を提示できない等のユーザの使い勝手を考慮した機能
を持っていなかった。
That is, in the above-mentioned conventional apparatus, when the input is rotated by an arbitrary angle (0 to 360 degrees) with respect to the setting direction of the scanner, the contents cannot be read or the input is made in the correct direction. It does not have a function that considers the usability of the user such as modifying the image and not presenting the image to the user.

【0008】これは、図3に示すように、A3スキャナ
2300の走査線が移動する方向2310と文書を設定
する領域2320はあらかじめ決まっている。そのた
め、従来の装置ではシステムが処理する方向はスキャナ
の走査線が移動する方向と一致していなければ処理でき
ない。
As shown in FIG. 3, the direction 2310 in which the scanning line of the A3 scanner 2300 moves and the area 2320 for setting a document are predetermined. Therefore, in the conventional apparatus, the processing direction of the system cannot be processed unless the scanning line of the scanner moves.

【0009】したがって、処理できる許容範囲として
は、図4に示すように、文書2400の上下関係が一致
して多少傾いたもの、あるいは、図5に示すように、文
書2500に傾きが無く上下関係が反転したものであっ
た。図6に示すように、文書2600が90度あるいは
180度あるいは270度の回転に加えて傾きもある場
合、従来のシステムでは文書中に記載された内容を読み
取れなかったし、入力画像を修正しユーザに提示する機
能等を持っていなかった。
Therefore, as the allowable range of processing, as shown in FIG. 4, the document 2400 has the same vertical relationship and is slightly tilted, or, as shown in FIG. 5, the document 2500 has no tilt and the vertical relationship. Was the flipped one. As shown in FIG. 6, when the document 2600 has a tilt in addition to the rotation of 90 degrees, 180 degrees, or 270 degrees, the conventional system cannot read the content described in the document and corrects the input image. It did not have a function to present to the user.

【0010】ここで、回転角とはスキャナの読み取り方
向と文書の上下方向が指示する方向との角度の差として
定義する。例えば、図5の矢印2605は文書の上下方
向を指しており、回転角は文書の上下関係の概念を考慮
した角度である。
Here, the rotation angle is defined as the difference between the reading direction of the scanner and the direction indicated by the vertical direction of the document. For example, the arrow 2605 in FIG. 5 indicates the vertical direction of the document, and the rotation angle is an angle considering the concept of the vertical relationship of the document.

【0011】また、上記の装置では、ユーザが間違えて
文書の裏面を入力した場合とか、文書の読み取るべき部
分がスキャナの読み取り領域からはみ出した場合の検出
あるいはそのような文書の処理方法等のユーザの使い勝
手を考慮した機能を持っていない。
Further, in the above apparatus, the user is required to detect when the user mistakenly inputs the back side of the document or when the portion to be read of the document is out of the reading area of the scanner or the method of processing such a document. It does not have a function considering the usability of.

【0012】また、上記の装置では、文書に記載されて
いない文書に関わる著者、入手先、入手日時、メモ等の
付加情報を入力文書に関する情報に関連付けて入力した
り、文書間同志の関係を持たせる機能が無いため、文書
に記載されていない情報を登録することも検索すること
もできず、また、関連のある他の文書の情報から所望の
文書に関わる情報を検索することができない等のユーザ
の使い勝手を考慮した機能を持っていない。
Further, in the above apparatus, additional information such as an author, a place of acquisition, a date and time of acquisition, a memo, etc. relating to a document not described in the document can be input in association with the information regarding the input document, and the relationship between documents can be established. Since there is no function to have it, it is not possible to register or search information that is not described in the document, and it is not possible to search information related to the desired document from information of other related documents, etc. Does not have a function that considers the usability of the user.

【0013】さらに、上記装置では、データ登録時での
ファイル容量のチェック機能、大量に蓄積・管理された
画像データに対しての読み取り機能、画像回転修正機
能、あるいは、文字認識時での外字処理機能等のユーザ
の使い勝手を考慮していない。
Further, in the above apparatus, a file capacity checking function at the time of data registration, a reading function for a large amount of image data stored and managed, an image rotation correction function, or external character processing at the time of character recognition The user-friendliness of functions and the like are not considered.

【0014】以上のように、従来の装置ではユーザにと
って使い勝手が悪いと言う問題点があった。
As described above, the conventional device has a problem that it is inconvenient for the user.

【0015】そこで、本発明の第1の目的は、文書がス
キャナの設定方向に対し任意の角度(0度から360
度)で回転されて入力された場合でも、その内容を読み
取ることができたり、あるいは、正しい方向に入力画像
を修正しユーザに提示する機能等のユーザの使い勝手を
考慮した文書読取装置あるいは電子ファイル装置あるい
はファクシミリ装置あるいは複写機あるいは計算機を提
供することにある。
Therefore, a first object of the present invention is to set a document at an arbitrary angle (from 0 degree to 360 degrees) with respect to the setting direction of the scanner.
Even if the image is rotated and input, the contents can be read, or a document reading device or an electronic file that considers the usability of the user such as the function of correcting the input image in the correct direction and presenting it to the user. To provide an apparatus, a facsimile machine, a copying machine, or a computer.

【0016】また、本発明の第2の目的は、ユーザが間
違えて文書の裏面を入力した場合とか、文書の読み取る
べき部分がスキャナの読み取り領域からはみ出した場合
の検出、そのような文書の処理方法そしてユーザが再度
文書の設定を行うこと無く自動的にはみ出し領域の内容
を含め読み取る等のユーザの使い勝手を考慮した文書読
取装置あるいは電子ファイル装置あるいはファクシミリ
あるいは複写機あるいは計算機を提供することにある。
A second object of the present invention is to detect when the user mistakenly inputs the back side of the document or when the portion to be read of the document is out of the reading area of the scanner, and to process such a document. A method and a document reading device, an electronic file device, a facsimile, a copying machine, or a computer, which considers the user's usability such as automatically reading the contents of the protruding area without the user having to set the document again. .

【0017】また、本発明の第3の目的は、文書に記載
されていない文書に関わる著者、入手先、入手日時、メ
モ等の付加情報の登録や検索をするができ、また、関連
のある他の文書の情報から所望の文書に関わる情報を検
索できる等のユーザの使い勝手を考慮した機能を持った
文書読取装置あるいは電子ファイル装置あるいはファク
シミリ装置あるいは複写機あるいは計算機を提供するこ
とにある。
The third object of the present invention is to register and retrieve additional information related to a document which is not described in the document, such as author, source, date and time of acquisition, memo, etc. Another object of the present invention is to provide a document reading device, an electronic file device, a facsimile device, a copying machine, or a computer having a function in consideration of user's usability, such as searching information related to a desired document from information of another document.

【0018】さらに、本発明の第4の目的は、データ登
録時でのファイル容量のチェック機能、大量に蓄積・管
理された画像データに対しての読み取り機能、画像回転
修正機能、あるいは、文字認識時での外字処理機能等の
ユーザの使い勝手を考慮した文書読取装置あるいは電子
ファイル装置あるいはファクシミリ装置あるいは複写機
あるいは計算機を提供することにある。
Further, a fourth object of the present invention is to check a file capacity at the time of data registration, a reading function for a large amount of image data stored and managed, an image rotation correction function, or character recognition. Another object of the present invention is to provide a document reading device, an electronic file device, a facsimile device, a copying machine, or a computer in consideration of user's usability such as an external character processing function.

【0019】[0019]

【課題を解決するための手段】上記の第1の目的を達成
するために、文書画像を入力する手段と、入力された文
書画像の文字行を抽出する手段と、文書の傾きを抽出す
る手段と、上記の抽出された文字行を文書の傾きに0
度、90度、180度、270度を加えた角度回転させ
る手段と、回転された4つの文字行をそれぞれ認識を行
ない、その中で最も正しいものの回転角を文書の傾きと
して画像を補正する。
In order to achieve the above first object, means for inputting a document image, means for extracting character lines of the input document image, and means for extracting inclination of a document. And the above extracted character line to the inclination of the document as 0
A unit for rotating an angle of 90 °, 180 °, 270 ° and four rotated character lines are respectively recognized, and the most correct rotation angle among them is used as the inclination of the document to correct the image.

【0020】第2の目的を達成するために、上記の文書
画像の文字行を抽出する手段で、文字行が抽出されない
場合は、文書が裏側で入力されたと判定する手段を備え
た。
In order to achieve the second object, the means for extracting the character line of the document image described above is provided with means for determining that the document is input on the back side when the character line is not extracted.

【0021】また、任意の位置にある文字行を抽出する
手段により得られた文字行の4つの頂点の2頂点以上が
スキャナ読み取り領域の4辺上に存在するか否かに従い
読み取るべき文字行がスキャナ読み取り領域外にあるか
否かを判定する手段を備えた。
Further, the character line to be read depends on whether or not two or more of the four vertices of the character line obtained by the means for extracting the character line at an arbitrary position are present on the four sides of the scanner reading area. A means for determining whether or not it is outside the scanner reading area is provided.

【0022】また、A4スキャナ読み取り領域において
上記手段によりはみ出していると判定した場合、新たに
A3スキャナで文書画像を採取することで自動的にはみ
出し領域であった内容も含め文書中の記載内容を漏らさ
ず読み取る手段とを備えた。
Further, when it is determined that the document is protruding in the A4 scanner reading area by the above-mentioned means, a new document image is collected by the A3 scanner to automatically display the contents described in the document, including the contents of the protruding area. And means for reading without leaking.

【0023】さらに、入力に不備があったと判定された
文書画像の文書番号をリジェクトファイルに登録する手
段や、エラーメッセージのウインド上への表示あるいは
音声での呼び掛けによる警告を促す手段とを備えても良
い。
Further, the apparatus is provided with means for registering the document number of the document image determined to be incomplete in the reject file, and means for displaying an error message on the window or prompting a warning by voice call. Is also good.

【0024】第3の目的を達成するために、入力された
文書画像に文書番号を登録する手段と、文書に関わる入
手日時や目的や入手先等の文書に書かれていない付加情
報を入力するための付加情報入力する手段と、入力され
た付加情報を文書番号や入力文書を処理した文書情報に
対応付けて電子的に記録する手段と、付加情報や文書情
報を検索する手段とを備えた。
In order to achieve the third object, a means for registering a document number in the input document image and additional information which is not written in the document such as date and time of acquisition, purpose and destination of the document are input. Means for inputting additional information, electronically recording the input additional information in association with the document number or the document information obtained by processing the input document, and means for searching the additional information or the document information. .

【0025】また、文書同志の関係情報を電子的に記録
する手段と、文書同志の関係情報を検索して所望の文書
についての文書情報や付加情報を検索する手段とを備え
ても良い。
Further, there may be provided means for electronically recording related information between documents and means for searching for related information between documents and searching for document information or additional information about a desired document.

【0026】第4の目的を達成するために、本発明は、
入力文書画像の処理結果をファイルに出力するための空
き容量を表示する手段と、空き容量が少なくなった場合
には警告をウインド上への表示あるいは音声で促す手段
あるいはネットワークを介しオペレータがいる他の装置
に警告を促す手段とを具備したことを特徴とする文書読
取装置あるいは電子ファイル装置あるいはファクシミリ
装置あるいは複写機あるいは計算機を提供する。
In order to achieve the fourth object, the present invention provides
There is a means to display the free space to output the processing result of the input document image to a file, a means to display a warning on the window or a voice prompt when the free space is low, or an operator via the network. And a document reading device, an electronic file device, a facsimile device, a copying machine, or a computer.

【0027】また、複数枚の文書をスキャナ入力した文
書画像をデータ蓄積装置に格納する手段と、格納時に文
書番号を付加する手段と、格納された文書画像を逐次ロ
ードし画像回転修正あるいは読み取り処理を行う手段と
を備えた。
Further, a means for storing a document image in which a plurality of documents are scanner-input into the data storage device, a means for adding a document number at the time of storage, a stored document image is sequentially loaded to perform image rotation correction or reading processing. And means for performing.

【0028】さらに、文書をディジタル画像として入力
する装置の読み取り処理において、認識対象文字コード
がシステム側に存在しない場合、文字画像を外字として
辞書に登録する手段や、登録された記号を読み取り結果
として割り当てて表示あるいはファイルに出力する手段
を備えても良い。
Further, in the reading process of the apparatus for inputting a document as a digital image, if the character code to be recognized does not exist on the system side, a means for registering the character image as an external character in the dictionary or a registered symbol as a reading result. Means for allocating and displaying or outputting to a file may be provided.

【0029】[0029]

【作用】上記の構成により、文書画像中の任意の位置に
ある文字行を抽出し、スキャナ設定方向に対する文書画
像の傾きを抽出し、スキャナ設定方向に対する文書画像
の回転角を求めるための適切な文字行を選択し、適切な
文字行の部分画像を検出した傾きに4種類の角度0度、
90度、180度、270度を加えた角度だけそれぞれ
回転し、4種類のそれぞれの回転文字行部分画像から部
分画像中の文字を切り出し認識し入力文書画像のスキャ
ナ設定方向に対する回転角を評価する手段あるいはこの
手段に入力文書のレイアウト情報を用いて入力文書画像
のスキャナ設定方向に対する回転角を評価し、求められ
た文書の回転角だけ入力画像を回転修正することがで
き、従来不可能であった任意の回転角で入力された文書
をユーザが見やすいようにディスプレイ上に表示あるい
は蓄積出来、ユーザのデータ操作の使い勝手をはるかに
向上できる。また、回転修正画像に対して文字行を抽出
し直して記載された内容を読み取る手段あるいは求めた
回転角だけ文字行部分画像を回転修正しレイアウト情報
を利用することで回転修正文字行画像を処理する順番を
求め記載された内容を順次読み取ることで、従来不可能
であった任意の回転角で入力された文書中に記載された
文字画像のコード化が可能となり、オートフィーダー等
を用いた自動登録やユーザがマニュアルでデータ入力す
る際の再入力が不要になるため、入力作業の高効率化が
実現可能となる。
With the above structure, a character line at an arbitrary position in the document image is extracted, an inclination of the document image with respect to the scanner setting direction is extracted, and an appropriate angle for obtaining the rotation angle of the document image with respect to the scanner setting direction is obtained. Select a character line, and select four angles of 0 degrees for the tilt that detected the partial image of the appropriate character line,
Rotate by 90 degrees, 180 degrees, and 270 degrees, respectively, and cut out characters in the partial image from each of the four types of rotated character line partial images, recognize them, and evaluate the rotation angle of the input document image with respect to the scanner setting direction. It is possible to evaluate the rotation angle of the input document image with respect to the scanner setting direction by using the means or the layout information of the input document in this means, and rotate and correct the input image by the obtained rotation angle of the document. Further, a document input at an arbitrary rotation angle can be displayed or stored on the display so that the user can easily see it, and the usability of the user's data operation can be greatly improved. In addition, the rotation correction character line image is processed by re-extracting the character line from the rotation correction image and reading the described content or by rotating the character line partial image by the obtained rotation angle and using the layout information. It is possible to encode the character image described in the document input at an arbitrary rotation angle, which was not possible in the past, by sequentially reading the described contents by determining the order to perform, and automatic registration using an auto feeder etc. Since there is no need to re-input data when the user manually inputs data, it is possible to improve the efficiency of input work.

【0030】また、求めた回転角だけ入力画像を修正回
転し、修正画像を順次蓄積でき、ユーザはスキャナ入力
方向を意識せず文書画像の登録作業を行うことが出来
る。また、文書入力はスキャナのカバーを用いて行うた
め、雑誌等の見開き文書の入力作業は1頁おきにスキャ
ナのカーバーが邪魔になり入力作業が困難であった。し
かし、文書の回転角を判定し画像を修正・蓄積するた
め、ユーザは文書の設定方向を全く意識せずに気楽に文
書を反転させてでも入力することが出来るため、入力作
業の高効率化が実現可能となる。
Further, the input image can be corrected and rotated by the obtained rotation angle and the corrected images can be sequentially stored, and the user can register the document image without being aware of the scanner input direction. Further, since the document input is performed by using the cover of the scanner, the input work of the spread document such as a magazine is difficult because the carver of the scanner interferes with every other page. However, since the rotation angle of the document is determined and the image is corrected / stored, the user can easily input the document by reversing the document without paying attention to the setting direction of the document. Can be realized.

【0031】文書画像から抽出した文字行の有無に従
い、入力文書が表で正常に入力されたものか間違えて裏
で入力されたものかを自動的に判定することが出来るた
め、ユーザにエラーを指示することができ、入力作業の
効率化を実現できる。また、入力不備の文書番号をリジ
ェクトファイルに登録するため、マニュアルでのデータ
入力やオートフィダー等を用いた自動登録時に、入力状
況のチェックができ、目視等による人間の確認作業を大
幅に削減できる。
Depending on the presence or absence of character lines extracted from the document image, it is possible to automatically determine whether the input document is normally input on the front side or is input by mistake on the back side. It is possible to give instructions, and the efficiency of input work can be realized. In addition, because the document number of the input error is registered in the reject file, it is possible to check the input status during manual data input or automatic registration using the auto feeder, etc., and it is possible to greatly reduce human confirmation work by visual inspection etc. .

【0032】また、システムが任意の位置にある文字行
を抽出する手段により得られた文字行の4つの頂点の2
頂点以上がスキャナ読み取り領域の4辺上に存在するか
否かに従い、読み取るべき文字行がスキャナ読み取り領
域外にあるか否かを判定することが出来るため、ユーザ
にエラーを指示することができ、入力作業の効率化を実
現できる。また、入力不備の文書番号をリジェクトファ
イルに登録するため、マニュアルでのデータ入力やオー
トフィダー等を用いた自動登録時に、入力状況のチェッ
クができ、目視等による人間の確認作業を大幅に削減で
きる。
Further, 2 of the four vertices of the character line obtained by the means for the system to extract the character line at an arbitrary position.
It is possible to judge whether or not the character line to be read is outside the scanner reading area according to whether or not the vertices and above are present on the four sides of the scanner reading area, and thus it is possible to instruct the user of an error. The efficiency of input work can be realized. In addition, because the document number of the input error is registered in the reject file, it is possible to check the input status during manual data input or automatic registration using the auto feeder, etc., and it is possible to greatly reduce human confirmation work by visual inspection etc. .

【0033】また、上記手段により入力文書がA4スキ
ャナ読み取り領域をはみ出していることがわかった場
合、新たにA3スキャナで文書画像を採取し、これに対
し読み取り処理を行うことにより、ユーザが目視により
はみ出しを確認する必要がなく、かつ、文書を再設定し
て再度読み取り処理を行わなくてもシステムが自動的に
文書中の記載内容を漏らすこと無く読み取ることが出
来、入力作業の効率化を実現できる。
When it is found by the above means that the input document is out of the A4 scanner reading area, a document image is newly picked up by the A3 scanner and the reading process is performed on the document image so that the user can visually check it. There is no need to check the protrusion, and the system can automatically read the contents of the document without leaking it even without resetting the document and performing the reading process again. it can.

【0034】また、システムが入力に不備があったと判
定した場合、エラーメッセージのウインド上への表示あ
るいは音声での呼び掛けによる警告を促すことで、ユー
ザにエラーを指示することが出来るため、入力作業の効
率化を実現できる。
When the system determines that the input is inadequate, the user can be informed of the error by displaying an error message on the window or prompting a warning by calling out by voice. The efficiency of can be realized.

【0035】さらに、入力された文書画像に文書番号を
登録し、ユーザは文書に関わる著者、入手日時、入手先
うあメモ等の文書に書かれていない付加情報を入力する
ための付加情報入力し、入力された付加情報を文書番号
や入力文書を処理した文書情報に対応付けて電子的に記
録するため、ユーザは付加情報や文書情報を指定して、
対応する付加情報や文書情報を検索手段より効率良く検
索し、容易に情報を取り出すことが出来る。
Further, the document number is registered in the input document image, and the user inputs additional information for inputting additional information not written in the document such as the author, date and time of acquisition, and memo of the user. Then, since the input additional information is electronically recorded in association with the document number or the document information obtained by processing the input document, the user specifies the additional information or the document information,
The corresponding additional information or document information can be retrieved more efficiently than the retrieval means, and the information can be retrieved easily.

【0036】また、文書同志の関係情報を電子的に記録
するため、ユーザは検索手段により文書同志関係情報を
容易に検索して、ある文書から他の文書をたぐり、その
文書についての文書情報や付加情報を取り出すことがで
き、ユーザのおぼろげな記憶からでも他の文書に関する
情報を用いて所望の情報を入手することが出来る。
Further, in order to electronically record the relationship information between documents, the user can easily search the document relationship information by the searching means, search for a document from another document, and obtain document information about the document. The additional information can be taken out, and the desired information can be obtained from the user's vague memory by using the information about other documents.

【0037】入力文書画像の処理結果をファイルに出力
するための空き容量を表示し、空き容量が少なくなった
場合には警告をウインド上への表示あるいは音声で促し
たり、あるいは、ネットワークを介しオペレータがいる
他の装置に警告を促すことにより、入力作業のやり直し
やシステムへの弊害を回避することが出来る。
The free space for outputting the processing result of the input document image to a file is displayed, and when the free space becomes small, a warning is displayed on the window or voice is urged, or an operator is requested via a network. It is possible to avoid the redo of the input work and the adverse effect on the system by urging the other device having a warning to warn.

【0038】また、複数枚の文書をスキャナ入力した文
書画像をデータ蓄積装置に格納し、格納時に文書番号を
付加し、格納された文書画像を逐次ロードし読み取り処
理あるいは画像回転修正を行うことで、大量に入力され
た文書画像に対して文書に関する情報を管理しながら文
字画像をコード化でき、ユーザの修正作業を削減でき
る。
Further, by storing a document image in which a plurality of documents are scanner-input into the data storage device, adding a document number at the time of storage, and sequentially loading the stored document images to perform reading processing or image rotation correction. A character image can be encoded while managing information about the document for a large number of input document images, and the correction work of the user can be reduced.

【0039】さらに、文書をディジタル画像として入力
する装置の読み取り処理において、認識対象文字コード
がシステム側に存在しない場合、文字画像を外字として
辞書に登録し、ある記号を登録した外字の読み取り結果
として割り当てて表示あるいはファイルに出力すること
で、システムに存在しない認識不可文字が入力されても
対処できる。また、意味不明な認識結果を出力せず、ユ
ーザが容易に読み取り結果を処理することができ、読み
取り精度を向上させる。
Further, in the reading process of the device for inputting a document as a digital image, if the character code to be recognized does not exist on the system side, the character image is registered in the dictionary as an external character, and a certain symbol is registered as the external character reading result. By allocating and displaying or outputting to a file, it is possible to deal with input of unrecognizable characters that do not exist in the system. In addition, the user can easily process the reading result without outputting the meaningless recognition result, and the reading accuracy is improved.

【0040】[0040]

【実施例】以下、図に示す実施例により本発明を詳細に
説明する。なお、これにより本発明が限定されるもので
はない。
The present invention will be described in detail below with reference to the embodiments shown in the drawings. The present invention is not limited to this.

【0041】図2は本発明の一実施例の文書読取装置の
構成図である。
FIG. 2 is a block diagram of a document reading apparatus according to an embodiment of the present invention.

【0042】この文書読取装置はCPU2110と、主
メモリ2120と、画像メモリ2130と、CRT21
40と、キーボード2150と、マウス2160と、ス
キャナ制御部2170と、スキャナ2180と、データ
蓄積部2190と、磁気ディスク2200と、光ディス
ク2210と、光磁気ディスク2220と、プリントア
ウト装置2230と、スピーカ2240と、バス225
0とから構成される。
This document reading device includes a CPU 2110, a main memory 2120, an image memory 2130, and a CRT 21.
40, a keyboard 2150, a mouse 2160, a scanner control unit 2170, a scanner 2180, a data storage unit 2190, a magnetic disk 2200, an optical disk 2210, a magneto-optical disk 2220, a printout device 2230, and a speaker 2240. And the bus 225
It consists of 0 and.

【0043】図1は本発明の文書読取装置の一実施例の
ブロック図である。
FIG. 1 is a block diagram of an embodiment of the document reading apparatus of the present invention.

【0044】画像入力手段105は前記スキャナ210
8とスキャナ制御部2170とCPU2110と画像メ
モリ2130から構成され、文書101を読み取って文
書画像を得て、これを一時的に記憶し、これをCRT2
55に表示する。
The image input means 105 is the scanner 210.
8, a scanner control unit 2170, a CPU 2110, and an image memory 2130. The document 101 is read to obtain a document image, which is temporarily stored and stored in the CRT 2
Display at 55.

【0045】文字行抽出手段110は前記CPU211
0から構成され、画像メモリ2130上に記憶された文
書画像から文書中の文字行を抽出する。この文字行抽出
方法は、例えば、特開昭62−165284号公報に開
示されている。
The character line extracting means 110 is the CPU 211.
A character line in the document is extracted from the document image which is composed of 0 and is stored in the image memory 2130. This character line extracting method is disclosed in, for example, Japanese Patent Laid-Open No. 62-165284.

【0046】表裏判定手段115は前記CPU2110
から構成され、前記文字行抽出手段110の結果を用い
て、入力された文書101が間違えて裏面で入力されて
いないかどうかを判定する。裏面で入力されたと判定さ
れた場合、リジェクト警告手段245に信号を送り、こ
の手段245が入出力制御手段250を介してCRT2
55上への表示あるいはスピーカ280を用いて、ユー
ザに裏面入力警告を促す。また、リジェクト登録手段2
05により、文書番号登録手段195で付加された文書
番号をリジェクトファイル210に登録する。
The front / back determination means 115 is the CPU 2110.
And the result of the character line extraction means 110 is used to determine whether or not the input document 101 is mistakenly input on the back side. When it is determined that the input is made on the back side, a signal is sent to the reject warning means 245, and this means 245 causes the CRT 2 via the input / output control means 250.
The display on the screen 55 or the speaker 280 is used to prompt the user for a back side input warning. Also, the reject registration means 2
05, the document number added by the document number registration means 195 is registered in the reject file 210.

【0047】はみ出し判定手段120は前記CPU21
10から構成され、前記文字行抽出手段110の結果を
用いて、入力された文書画像がスキャナ2108の読み
取り領域をはみ出しているかどうかを判定する。読み取
り領域をはみ出したと判定された場合、リジェクト警告
手段245に信号を送り、この手段245が入出力制御
手段250を介してCRT255上への表示あるいはス
ピーカ280を用いて、ユーザに裏面入力警告を促す。
また、リジェクト登録手段205により、文書番号登録
手段195で付加された文書番号をリジェクトファイル
210に登録する。
The protrusion determination means 120 is the CPU 21.
It is constituted by 10 and using the result of the character line extraction means 110, it is determined whether or not the input document image is outside the reading area of the scanner 2108. When it is determined that the reading area has been pushed out, a signal is sent to the reject warning means 245, and this means 245 prompts the user to give a backside input warning using the display on the CRT 255 or the speaker 280 via the input / output control means 250. .
Further, the reject registration means 205 registers the document number added by the document number registration means 195 in the reject file 210.

【0048】傾き抽出手段125は前記CPU2110
から構成され、画像メモリ2130上に記憶された文書
画像から入力文書の傾きを抽出する。この傾き抽出方法
は、例えば、特開昭62−14277号公報に開示され
ている。
The inclination extracting means 125 is the CPU 2110.
The inclination of the input document is extracted from the document image stored in the image memory 2130. This inclination extraction method is disclosed in, for example, Japanese Patent Application Laid-Open No. 62-14277.

【0049】最適文字行選択手段130は前記CPU2
110から構成され、文字認識ベース回転角評価手段1
45での評価用文字行として高い精度でかつ高速な処理
を実現するため、前記文字行抽出手段110により得ら
れた文字行から最適な複数個の文字行を選択する。
The optimum character line selection means 130 is the CPU 2
Character recognition based rotation angle evaluation means 1
In order to realize high-accuracy and high-speed processing as the character line for evaluation in 45, a plurality of optimum character lines are selected from the character lines obtained by the character line extracting means 110.

【0050】文字行画像回転手段140は前記CPU2
110から構成され、最適文字行選択手段130により
選択された複数個の文字行の画像を4種類の回転角、す
なわち、傾き抽出手段125により得られた傾きに0度
あるいは90度あるいは180度あるい270度加えた
回転角だけ回転する。
The character line image rotating means 140 is the CPU 2
An image of a plurality of character lines, which is composed of 110 and is selected by the optimum character line selection unit 130, has four types of rotation angles, that is, the inclination obtained by the inclination extraction unit 125 has 0 degree, 90 degrees, or 180 degrees. It rotates by the rotation angle of 270 degrees.

【0051】文字認識ベース回転角評価手段145は前
記CPU2110から構成され、最適文字行選択手段1
30により選択された複数個の文字行を文字行画像回転
手段140により4種類の回転角で回転した回転文字行
画像に対し、それぞれの回転文字行画像に対し文字切り
出しおよび文字認識を行い文字認識結果の類似度を用い
て、4種類の回転角の評価を行う。
The character recognition base rotation angle evaluation means 145 comprises the CPU 2110, and the optimum character line selection means 1
A plurality of character lines selected by 30 are rotated by the character line image rotating means 140 at four types of rotation angles, and character recognition is performed by performing character segmentation and character recognition on each rotated character line image. Four kinds of rotation angles are evaluated using the similarity of the result.

【0052】また、文書の回転角の判定を高精度に求め
るため、文書のレイアウト情報を文字認識ベース回転角
評価手段145の結果に加えて利用する方法について説
明する。
A method of utilizing the layout information of the document in addition to the result of the character recognition-based rotation angle evaluation means 145 to obtain the determination of the rotation angle of the document with high accuracy will be described.

【0053】文字行座標回転手段165は前記CPU2
110から構成され、文字行抽出手段110により得ら
れた文字行の座標を4種類の回転角、すなわち、傾き抽
出手段125により得られた傾きに0度あるいは90度
あるいは180度あるい270度加えて考慮した回転角
だけ回転する。
The character line coordinate rotating means 165 is the CPU 2
110, and the coordinates of the character line obtained by the character line extraction means 110 are added to four types of rotation angles, that is, the inclination obtained by the inclination extraction means 125, 0 degree, 90 degrees, 180 degrees or 270 degrees. Rotate by the rotation angle considered.

【0054】レイアウト情報抽出手段170は前記CP
U2110から構成され、前記文字行座標回転手段16
5により得た4種類の回転角で回転させて得た文字行座
標に対しレイアウト情報を抽出する。このレイアウト情
報抽出方法は、例えば、特開平1−130293号公報
に開示されている。
The layout information extraction means 170 uses the CP
The character line coordinate rotating means 16 is composed of U2110.
Layout information is extracted with respect to the character line coordinates obtained by rotating at four types of rotation angles obtained in step 5. This layout information extraction method is disclosed in, for example, Japanese Patent Application Laid-Open No. 1-130293.

【0055】レイアウトベース回転角評価手段175は
前記CPU2110から構成され、レイアウト知識18
0とレイアウト情報抽出手段170で抽出した4種類の
回転角での回転させて得たレイアウト情報を用いて評価
を行う。
The layout base rotation angle evaluation means 175 is composed of the CPU 2110, and the layout knowledge 18
The evaluation is performed by using 0 and the layout information obtained by rotating the layout information extracting means 170 at four kinds of rotation angles.

【0056】文書回転角判定手段150は前記CPU2
110から構成され、文字認識ベース回転角評価手段1
45、あるいは、この手段とレイアウトベース回転角評
価手段175で得られたそれぞれの4種類の回転角での
評価結果を基にして入力文書の回転角を判定する。この
判定手段により、回転角の判定結果が曖昧であった場
合、リジェクト警告手段245に信号を送り、この手段
245が入出力制御手段250を介してCRT255上
への表示あるいはスピーカ280を用いて、ユーザに回
転角判定不可の警告を促す。また、リジェクト登録手段
205により、文書番号登録手段195で付加された文
書番号をリジェクトファイル210に登録する。
The document rotation angle determination means 150 is the CPU 2
Character recognition based rotation angle evaluation means 1
45, or the rotation angle of the input document is determined on the basis of the evaluation results of the four types of rotation angles obtained by this means and the layout-based rotation angle evaluation means 175. When the determination result of the rotation angle is ambiguous by this determination means, a signal is sent to the reject warning means 245, and this means 245 uses the display on the CRT 255 or the speaker 280 via the input / output control means 250. Prompt the user with a warning that the rotation angle cannot be determined. Further, the reject registration means 205 registers the document number added by the document number registration means 195 in the reject file 210.

【0057】画像回転手段155は前記CPU2110
から構成され、画像メモリ2130上に記憶された文書
画像を文書回転角判定手段150により得られた回転角
だけ回転する。
The image rotation means 155 is the CPU 2110.
The document image stored in the image memory 2130 is rotated by the rotation angle obtained by the document rotation angle determination means 150.

【0058】読取手段160は前記CPU2110から
構成され、画像回転手段155により回転角だけ回転さ
れた修正文書画像に対して、修正画像中の文字画像を文
字コードに変換する。
The reading means 160 is composed of the CPU 2110, and converts the character image in the corrected image into a character code for the corrected document image rotated by the rotation angle by the image rotating means 155.

【0059】読取結果修正手段240は前記CPU21
10から構成され、入出力制御手段250を介して、読
取手段160で処理した内容に対し、CRT255に読
み取り結果や修正結果を表示したり、キーボード260
あるいはマウス265を用いて読み取り結果の修正を行
う。
The reading result correction means 240 is the CPU 21.
10, the reading result and the correction result are displayed on the CRT 255 for the contents processed by the reading unit 160 via the input / output control unit 250, and the keyboard 260 is used.
Alternatively, the mouse 265 is used to correct the reading result.

【0060】文書番号登録手段195は前記CPU21
10から構成され、入力文書101に対し文書番号を付
け、文書番号ファイル200に文書番号を登録する。
The document number registration means 195 is the CPU 21.
The input document 101 is provided with a document number, and the document number is registered in the document number file 200.

【0061】入力画像登録手段185は前記CPU21
10から構成され、文書番号登録手段195によりつけ
られた文書番号と共に画像メモリ2130上に記憶され
た入力文書画像を入力画像ファイル190に登録する。
The input image registration means 185 is the CPU 21.
The input document image which is composed of 10 and is stored in the image memory 2130 together with the document number assigned by the document number registration means 195 is registered in the input image file 190.

【0062】修正画像登録手段215は前記CPU21
10から構成され、画像回転手段155により修正され
た修正文書画像を文書番号と共に修正画像ファイル22
0に登録する。
The corrected image registration means 215 is the CPU 21.
The modified document image composed of 10 and the modified document image modified by the image rotation means 155 together with the document number.
Register to 0.

【0063】読取結果登録手段225は前記CPU21
10から構成され、読取手段160により読み取られた
結果を文書番号と共に読取結果ファイル230に登録す
る。
The reading result registration means 225 is the CPU 21.
The result read by the reading unit 160 is registered in the read result file 230 together with the document number.

【0064】付加情報登録手段275は前記CPU21
10から構成され、スキャナ2180から入力した情報
ではなく、キーボード260あるいはマウス265から
入力した情報を付加、あるいは、関連づけて管理する。
そして、キーボード260あるいはマウス265等のス
キャナ2180以外から入力した情報を付加情報ファイ
ル270に登録する。
The additional information registration means 275 is the CPU 21.
It is composed of 10 units, and the information input from the keyboard 260 or the mouse 265, not the information input from the scanner 2180, is added or associated and managed.
Then, information input from other than the scanner 2180 such as the keyboard 260 or the mouse 265 is registered in the additional information file 270.

【0065】ファイル制御手段235は前記CPU21
10から構成され、上記述べたような複数個のファイル
の登録・管理、あるいは、これらファイル間での情報を
関連づける。そして、複数個のファイル間に対し同一文
書での情報同志および異文書間同志での情報の関係を用
いて管理する。
The file control means 235 is the CPU 21.
It is composed of 10 and registers or manages a plurality of files as described above, or associates information between these files. Then, the management is performed by using the relationship between the information in the same document and the information in the different documents between a plurality of files.

【0066】上記ファイル群はデータ蓄積部2190を
介して磁気ディスク2200あるいは光ディスク221
0あるいは光磁気ディスク2230に格納される。
The above file group is stored in the magnetic disk 2200 or the optical disk 221 via the data storage unit 2190.
0 or stored on the magneto-optical disk 2230.

【0067】次に、本システムの大まかな処理の流れに
ついて図7を用いて説明する。
Next, a rough processing flow of this system will be described with reference to FIG.

【0068】−クレームにあわせて訂正すること。-Correct according to the claim.

【0069】まず、画像入力2700にて紙の文書デー
タを電子的な画像データに変換する。そして、文書番号
登録2705にて変換された文書画像に文書番号を付加
する。そして、文書画像登録2710にて文書画像を登
録する。そして、文字行抽出2715にて文書画像中に
存在する文字行を抽出する。そして、表裏判定2735
にて文字行の有無に従い入力文書が間違えて裏面を入力
されたものか否かを判定する。そして、リジェクト判定
2740にて入力文書をリジェクトすべき否かを判定す
る。そして、もしリジェクトする場合、リジェクト警告
2745そして文書番号をリジェクト登録2750す
る。そして、はみ出し判定2755にて入力文書がスキ
ャナの読み取り領域をはみ出しているか否かを判定す
る。そして、リジェクト判定2760にて入力文書をリ
ジェクトすべき否かを判定する。そして、もしリジェク
トする場合、リジェクト警告2765そして文書番号を
リジェクト登録2770する。そして、傾き検出277
2にてスキャナ読み取り領域での水平線と入力文書水平
線との角度の差である傾きを検出する。そして、最適文
字行選択2774にて入力文書の回転角を求める文字認
識ベース回転角評価2778で評価対象とする最適な文
字行を複数個選択する。そして、文字行画像回転277
6にて選択した複数個の文字行画像を抽出した傾きに0
度、90度、180度、、270度を加えた4種類の回
転角だけ回転する。そして、文字認識ベース回転角評価
2778にてそれぞれの回転角で回転させた文字行画像
から文字を切り出し、認識させ、その時の類似度により
4種類の回転角の評価を行う。そして、レイアウト解析
評価実行2780にて文字認識ベース回転角評価277
8にレイアウト情報を用いた回転角の評価を加えるか否
かにより分岐する。もしレイアウト情報を用いた回転角
の評価も加味させる場合、文字行座標回転2782にて
文字行座標を抽出した傾きに0度、90度、180
度、、270度を加えた4種類の回転角だけ回転する。
そして、レイアウト情報抽出2784にて4種類の回転
角での文字行座標からレイアウト情報を抽出する。そし
て、レイアウトベース回転角評価8655にてそれぞれ
の回転角でのレイアウト情報とレイアウト知識を用いて
回転角の評価を行う。そして、文書回転角判定2779
にて先に求めた文字認識ベース回転角評価結果あるいは
これとレイアウトベース回転角評価結果から入力文書の
回転角を判定する。そして、もし画像回転が必要か否か
を画像回転判定2790にて判定し、もし画像回転が必
要な場合には画像回転2792にて判定した回転角を用
いて文書画像を回転する。そして、回転した修正画像を
登録する(2794)。そして、読み取り2796にて
回転した修正画像中の文字画像を文字コードへと変換す
る。そして、読み取り結果を登録(2798)し、ユー
ザの指示に従って読み取り結果の修正(2799)を行
う。
First, the image input 2700 converts paper document data into electronic image data. Then, the document number is added to the document image converted in the document number registration 2705. Then, the document image is registered in the document image registration 2710. Then, in the character line extraction 2715, the character line existing in the document image is extracted. And front / back determination 2735
At, it is determined whether or not the input document is mistakenly input on the back side according to the presence or absence of character lines. Then, a rejection determination 2740 determines whether or not the input document should be rejected. If rejected, the reject warning 2745 and the document number are reject registered 2750. Then, it is determined whether or not the input document is out of the reading area of the scanner in the out-judgment determination 2755. Then, a rejection determination 2760 determines whether or not the input document should be rejected. If rejected, the reject warning 2765 and the document number are reject registered 2770. Then, the tilt detection 277
At 2, the inclination which is the difference between the horizontal line in the scanner reading area and the horizontal line of the input document is detected. Then, in the optimum character line selection 2774, a plurality of optimum character lines to be evaluated are selected in the character recognition base rotation angle evaluation 2778 for obtaining the rotation angle of the input document. Then, the character line image rotation 277
0 is added to the inclination extracted from the plurality of character line images selected in 6.
It rotates by four types of rotation angles including degrees, 90 degrees, 180 degrees, and 270 degrees. Then, in the character recognition base rotation angle evaluation 2778, characters are cut out from the character line image rotated at each rotation angle and recognized, and four types of rotation angles are evaluated according to the similarity at that time. Then, in layout analysis evaluation execution 2780, character recognition based rotation angle evaluation 277 is performed.
8 is branched depending on whether or not the evaluation of the rotation angle using the layout information is added. If the evaluation of the rotation angle using the layout information is also taken into consideration, the inclination of extracting the character line coordinates in the character line coordinate rotation 2782 is 0 °, 90 °, 180 °.
Rotate by 4 kinds of rotation angles, which are 270 degrees and 270 degrees.
Then, layout information extraction 2784 extracts layout information from the character line coordinates at four types of rotation angles. Then, the layout base rotation angle evaluation 8655 evaluates the rotation angle using the layout information and the layout knowledge at each rotation angle. Then, the document rotation angle determination 2779
The rotation angle of the input document is determined based on the character recognition-based rotation angle evaluation result previously obtained or in the layout-based rotation angle evaluation result. Then, whether the image rotation is necessary is determined by the image rotation determination 2790, and when the image rotation is required, the document image is rotated using the rotation angle determined by the image rotation 2792. Then, the rotated corrected image is registered (2794). Then, the character image in the corrected image rotated by reading 2796 is converted into a character code. Then, the read result is registered (2798), and the read result is corrected (2799) according to the instruction of the user.

【0070】次に、入力画像から抽出した文字行の有無
に従い入力文書が表で正常に入力されたものか間違えて
裏で入力されたものかを判定する方法について説明す
る。
Next, a method of determining whether the input document is normally input on the front side or mistakenly input on the back side according to the presence / absence of character lines extracted from the input image will be described.

【0071】図9に示すように、まず、文字行を抽出す
る(900)。そして、文字行が存在するか否かを判定
する(910)。もし裏面が入力された場合、入力文書
は白紙であるため、文字行が抽出されないので文字行が
存在しない。すなわち、文字行が存在すれば次処理を実
行し(920)、文字行が存在しなければ裏面で入力さ
れたものと判定しリジェクト処理を実行する(93
0)。リジェクト処理では、ユーザにリジェクト入力で
あることを促すかあるいはリジェクト文書としてその文
書番号をリジェクト文書番号ファイルに登録する。
As shown in FIG. 9, first, a character line is extracted (900). Then, it is determined whether a character line exists (910). If the back side is input, the input document is blank and the character line is not extracted, so there is no character line. That is, if the character line exists, the next process is executed (920), and if the character line does not exist, it is determined that the input is made on the back side and the reject process is executed (93).
0). In the reject processing, the user is prompted to reject input or the document number is registered as a reject document in the reject document number file.

【0072】次に、読み取るべき文字行がスキャナ読み
取り領域外にあるか否かを判定する方法について説明す
る。
Next, a method of determining whether the character line to be read is outside the scanner reading area will be described.

【0073】図10に示すように、まず、スキャナ読み
取り領域をはみ出した否かを示すはみ出しフラグをセッ
トする(1000)。そして、文字行数回、次の処理を
繰り返す(1005)。はみ出し文字行の回数を示すC
OUNTを0にセットする(1010)。そして、カレ
ント文字行の頂点数である4回、次の処理を繰り返す
(1015)。1020でスキャナ読み取り領域境界線
である(*、0)上に注目している頂点が存在するか否
かを判定する。もし1020を満たせばCOUNTをイ
ンクリメントとする(1025)。ここで、*は任意の
数値であることを示す。そして、1030でスキャナ読
み取り領域境界線である(0、*)上に注目している頂
点が存在するか否かを判定する。もし1030を満たせ
ばCOUNTをインクリメントとする(1035)。そ
して、1040でスキャナ読み取り領域境界線である
(Xe、*)上に注目している頂点が存在するか否かを
判定する。もし1040を満たせばCOUNTをインク
リメントとする(1045)。ここで、Xeはスキャナ
読み取り領域の最大X座標である。そして、1050で
スキャナ読み取り領域境界線である(*、Ye)上に注
目している頂点が存在するか否かを判定する。もし10
50を満たせばCOUNTをインクリメントとする(1
055)。ここで、Yeはスキャナ読み取り領域の最大
Y座標である。そして、1060にてCOUNTが2以
上であるか否かを判定する。ここで、COUNTが2以
上であるということは文字行がスキャナの非読み取り領
域にあり、入力文書がはみ出していることを示す。も
し、COUNTが2以上ならばその文字行の番号を登録
する(1065)。そして、はみ出しフラグを1にセッ
トする(1070)。以上の処理が終了して、はみ出し
フラグが1でセットされているか否かを判定する(10
75)。そして、もし、はみ出しフラグが1でセットさ
れていれば、リジェクト処理を実行する(1080)。
As shown in FIG. 10, first, a protrusion flag indicating whether or not the scanner reading region is protruded is set (1000). Then, the next process is repeated several times for the character lines (1005). C, which indicates the number of overhanging character lines
OUNT is set to 0 (1010). Then, the next process is repeated four times, which is the number of vertices of the current character line (1015). At 1020, it is determined whether or not the vertex of interest exists on the scanner reading area boundary line (*, 0). If 1020 is satisfied, COUNT is incremented (1025). Here, * indicates an arbitrary numerical value. Then, at 1030, it is determined whether or not the vertex of interest exists on the scanner reading area boundary line (0, *). If 1030 is satisfied, COUNT is incremented (1035). Then, at 1040, it is determined whether or not the vertex of interest exists on the scanner reading area boundary line (Xe, *). If 1040 is satisfied, COUNT is incremented (1045). Here, Xe is the maximum X coordinate of the scanner reading area. Then, at 1050, it is determined whether or not the vertex of interest exists on the scanner reading area boundary line (*, Ye). If 10
If 50 is satisfied, COUNT is incremented (1
055). Here, Ye is the maximum Y coordinate of the scanner reading area. Then, at 1060, it is determined whether COUNT is 2 or more. Here, the fact that COUNT is 2 or more means that the character line is in the non-reading area of the scanner and the input document is protruding. If COUNT is 2 or more, the number of the character line is registered (1065). Then, the protrusion flag is set to 1 (1070). After the above processing is completed, it is determined whether or not the protrusion flag is set to 1 (10
75). If the protrusion flag is set to 1, reject processing is executed (1080).

【0074】次に、はみ出し文字行が検出された場合の
画面表示について説明する。
Next, the screen display when the protruding character line is detected will be described.

【0075】図11に示すように、画面上1100に表
示されたウインド1110上に文字行が表示される。こ
の時、はみ出した文字行であることが容易に判り易いよ
うに、文字行がはみ出していないもの1120と文字行
がはみ出したもの1130の表示の色を違えて表示す
る。
As shown in FIG. 11, character lines are displayed on the window 1110 displayed on the screen 1100. At this time, in order to make it easy to recognize that the character line is protruding, the display color of the object 1120 in which the character line does not protrude and the display 1130 in which the character line protrudes are displayed in different colors.

【0076】次に、ユーザが入力文書の傾きを調整する
方法について説明する。
Next, a method for the user to adjust the inclination of the input document will be described.

【0077】図12に示すように、画面上1200に表
示されたウインド1210上に文字行1220、傾きイ
ンディケータ1240、その初期位置1230、およ
び、傾きインディケータを操作するポインティングデバ
イス1250を表示する。この場合、入力画像として傾
きがあり、それに加えて180度回転した文書である。
そして、ユーザは中央部に表示された傾きインディケー
タを表示された文字行に直接重ねることが出来、容易に
かつ高精度に傾きを調節することが出来る。そして、調
節が完了したら、操作パネル1260上の終了ボタン1
270あるいはキャンセルボタン1280により処理を
終える。
As shown in FIG. 12, a character line 1220, a tilt indicator 1240, its initial position 1230, and a pointing device 1250 for operating the tilt indicator are displayed on a window 1210 displayed on a screen 1200. In this case, the input image has a tilt and is a document rotated by 180 degrees.
Then, the user can directly superimpose the tilt indicator displayed in the center on the displayed character line, and can easily and accurately adjust the tilt. Then, when the adjustment is completed, the end button 1 on the operation panel 1260
The process is terminated by pressing 270 or the cancel button 1280.

【0078】次に、最適文字行選択手段130での文字
行の選択方法について説明する。
Next, a method of selecting a character line by the optimum character line selection means 130 will be described.

【0079】図8に示すように、まず、選択する文字行
のカウンタであるCOUNTの初期化を行う(80
0)。そして、カウンタCOUNTが選択文字行数に至
るまで、以下の処理を繰り返す(810)。カレント文
字行の縦横比あるいは横縦比がある一定値以上の場合
(820)、その文字行を最適文字行の一つとする(8
30)。そして、カウンタCOUNTをインクリメント
とする(840)。そして、選択文字数に至った場合
(850)、最適文字行選択手段を終了する(86
0)。ここで、カレント文字行の縦横比がある一定値以
上の場合は横書き文字行を示し、横縦比がある一定値以
上の場合は縦書き文字行を示す。このように、ある一定
値で判定した根拠として、一つには文字認識の類似度に
より回転角を判定する場合、高い精度で判定する必要が
あり、一文字行中に複数の文字が存在するようにするた
めである。その根拠は、一文字行中に含まれる文字が少
ない場合、日本語の「口」や漢数字「一」等は0度、9
0度、180度、270度と回転しても形状に大きな差
が無く文字認識の類似度による回転角判定が困難である
からである。例えば、章番号等は「1.1」のように書
くため、これが文字行として判定されると0度の回転角
なのか180度の回転角なのか判定は曖昧になる。
As shown in FIG. 8, first, COUNT, which is a counter of selected character lines, is initialized (80).
0). Then, the following processing is repeated until the counter COUNT reaches the number of selected character lines (810). When the aspect ratio or the aspect ratio of the current character line is equal to or greater than a certain value (820), the character line is regarded as one of the optimum character lines (8
30). Then, the counter COUNT is incremented (840). When the number of selected characters is reached (850), the optimum character line selection means is terminated (86).
0). Here, when the aspect ratio of the current character line is equal to or greater than a certain value, it indicates a horizontally written character line, and when the aspect ratio is greater than a certain value, it indicates a vertically written character line. In this way, as a basis for judging with a certain constant value, one is that when judging the rotation angle based on the similarity of character recognition, it is necessary to judge with high accuracy, and it seems that there are multiple characters in one character line. This is because The reason is that if there are few characters in one character line, Japanese words such as "mouth" and Chinese numerals "1" are 0 degrees, 9
This is because there is no big difference in the shapes even if they are rotated by 0 degrees, 180 degrees, and 270 degrees, and it is difficult to determine the rotation angle based on the similarity of character recognition. For example, since the chapter number or the like is written as "1.1", if this is determined as a character line, the determination as to whether the rotation angle is 0 degrees or 180 degrees becomes ambiguous.

【0080】次に、文字行画像回転手段140および文
字認識ベース回転角評価手段145について説明する。
Next, the character line image rotation means 140 and the character recognition base rotation angle evaluation means 145 will be described.

【0081】まず、図13に示すように、最適文字行選
択手段130により選択された複数個の文字行の画像1
305と入力文書画像の傾き1300を4種類の回転処
理部(1315〜1325)に入力させ、各回転処理部
にて複数個の文字行の画像を(−a)度、(90−a)
度、(180−a)度、(270−a)度だけ回転させ
た文字行画像を得る。そして、1330において、各回
転角での文字行画像を対象に、文字切り出し(1335
〜1350)、文字認識(1355〜1370)を実行
する。そして、文字類似度評価処理部(1375〜13
90)にて、文字認識の類似度を用いそれぞれの回転角
での文字行画像に対する評価値を求める。ここで、文字
類似度評価処理部の評価関数としては全ての文字の類似
度の平均値あるいは中央値等が利用される。そして、最
良回転角判定部1397にて、各回転角で求められた評
価値から文書回転角1399を判定し、評価値が曖昧な
場合にはリジェクト情報1399を出力する。
First, as shown in FIG. 13, an image 1 of a plurality of character lines selected by the optimum character line selection means 130.
305 and the inclination 1300 of the input document image are input to four types of rotation processing units (1315-1325), and images of a plurality of character lines are (-a) degrees, (90-a) in each rotation processing unit.
A character line image rotated by 180 degrees, (180-a) degrees, and (270-a) degrees is obtained. Then, in 1330, character segmentation (1335) is performed on the character line image at each rotation angle.
˜1350) and character recognition (1355-1370). Then, the character similarity evaluation processing unit (1375 to 13)
In 90), the evaluation value for the character line image at each rotation angle is obtained using the similarity of character recognition. Here, as the evaluation function of the character similarity evaluation processing unit, the average value or the median value of the similarity of all characters is used. Then, the best rotation angle determination unit 1397 determines the document rotation angle 1399 from the evaluation value obtained at each rotation angle, and outputs reject information 1399 when the evaluation value is ambiguous.

【0082】次に、文字認識ベース回転角評価手段14
5の一実施例について説明する。
Next, the character recognition based rotation angle evaluation means 14
Example 5 will be described.

【0083】図14に示すように、入力文書の回転角を
判定する際、類似度による評価が曖昧な場合には対象文
書をリジェクト扱いにしようというものであり、まず、
得られた4種類の回転角での文字類似度評価値を入力す
る(1400)。そして、最良の評価値(a)を求め
(1410)、次点の評価値(b)を求める(142
0)。そして、a−bの絶対値がある値Kよりも大きい
か否かを判定する(1430)。もし条件を満足すれ
ば、文書の回転角を決定し(1440)、そうでない場
合にはリジェクト処理を行う(1450)。
As shown in FIG. 14, when determining the rotation angle of an input document, if the evaluation based on the similarity is ambiguous, the target document is treated as rejected.
The character similarity evaluation values at the obtained four types of rotation angles are input (1400). Then, the best evaluation value (a) is calculated (1410), and the evaluation value (b) of the next point is calculated (142).
0). Then, it is determined whether the absolute value of ab is larger than a certain value K (1430). If the condition is satisfied, the rotation angle of the document is determined (1440), and if not, reject processing is performed (1450).

【0084】次に、文字行座標回転手段165、レイア
ウト情報抽出手段170とレイアウトベース回転角評価
手段175について説明する。
Next, the character line coordinate rotation means 165, the layout information extraction means 170 and the layout base rotation angle evaluation means 175 will be described.

【0085】まず、図15に示すように、入力文書画像
の傾き1500と最適文字行選択手段130により選択
された複数個の文字行の座標1505を4種類の回転処
理部(1510〜1525)に入力させ、各回転処理部
にて複数個の文字行の座標を(−a)度、(90−a)
度、(180−a)度、(270−a)度だけ回転させ
た文字行座標を得る。そして、レイアウト解析処理部
(1530〜1545)において、各回転角での文字行
座標からレイアウト解析を実行する。そして、レイアウ
ト照合部(1550〜1565)にて、レイアウト知識
(1570〜1585)を用い各回転角の評価値(15
90〜1597)を求める。
First, as shown in FIG. 15, the inclination 1500 of the input document image and the coordinates 1505 of the plurality of character lines selected by the optimum character line selection means 130 are set in four types of rotation processing units (1510 to 1525). Input the coordinates of multiple character lines in each rotation processing unit (-a) degrees, (90-a)
The character line coordinates rotated by degrees, (180-a) degrees, and (270-a) degrees are obtained. Then, the layout analysis processing unit (1530 to 1545) executes layout analysis from the character line coordinates at each rotation angle. Then, the layout collation unit (1550 to 1565) uses the layout knowledge (1570 to 1585) to evaluate the rotation angle (15).
90-1597).

【0086】次に、予め入力文書の縦書き・横書き情報
がわかっている場合のレイアウト情報を用いた回転角の
評価方法について説明する。
Next, a method of evaluating the rotation angle using the layout information when the vertical writing / horizontal writing information of the input document is known in advance will be described.

【0087】まず、図16に示すように、図15の場合
と異なるのはレイアウト照合時に予めレイアウト情報が
わかっているためレイアウト情報信号(1699)をレ
イアウト照合部(1650〜1665)に入力させ、照
合させるレイアウト知識(1670〜1685)を限定
させるものである。
First, as shown in FIG. 16, the difference from the case of FIG. 15 is that the layout information signal (1699) is input to the layout collating section (1650 to 1665) because the layout information is known in advance at the time of layout collation. The layout knowledge (1670 to 1685) to be collated is limited.

【0088】次に、レイアウト情報を照合させる方法に
ついて説明する。
Next, a method of collating layout information will be described.

【0089】文書は1つ以上の節(ブロック)から構成
され、図17に文書を構成するブロックが必ず持つ属性
の縦書き、横書き情報を0度、90度、180度、27
0度回転した時のイメージを示す。この図からわかるよ
うに、横書き・縦書きを各回転させたもののどれも文字
が始まる字下げ座標と中途で終了する文末の座標に特徴
があり、この特徴を用いて照合することで入力文書の回
転角を求めることが出来る。レイアウト知識内に図17
の(1)の(8)の情報を格納し、これとレイアウト解
析させて得られる図17の(1)から(8)のどのパタ
ンとが近いかを調べることで入力文書の回転角の識別が
可能になる。
A document is composed of one or more sections (blocks), and the vertical writing and horizontal writing information of the attributes that the blocks constituting the document necessarily have in FIG. 17 are 0 degrees, 90 degrees, 180 degrees, and 27 degrees.
The image when rotated 0 degrees is shown. As you can see from this figure, each of the horizontal and vertical writing rotated has a feature in the indentation coordinates at which the characters begin and the coordinates at the end of the sentence that ends midway. The rotation angle can be calculated. Figure 17 in the layout knowledge
The rotation angle of the input document is identified by storing the information of (8) of (1) of (1) and checking which pattern of (1) to (8) of FIG. Will be possible.

【0090】次に、文字認識ベース回転角評価手段14
5の結果とレイアウトベース回転角評価手段175の結
果とを合わせた文書回転角の判定方法について説明す
る。
Next, the character recognition based rotation angle evaluation means 14
A method of determining the document rotation angle that combines the result of No. 5 and the result of the layout-based rotation angle evaluation unit 175 will be described.

【0091】図18に示すように、文字認識ベース回転
角評価値(a)を求める(1800)。そして、レイア
ウトベース回転角評価値(b)を求める(1810)。
そして、文書回転各判定(1820)にて、値aとbが
等しい場合には回転角を決定し(1830)、読み取り
処理を行う(1840)。また、値が等しくない場合に
はリジェクト処理を実行する(1850)。
As shown in FIG. 18, a character recognition base rotation angle evaluation value (a) is obtained (1800). Then, the layout base rotation angle evaluation value (b) is obtained (1810).
Then, in each of the document rotation determinations (1820), when the values a and b are equal, the rotation angle is determined (1830) and the reading process is performed (1840). If the values are not equal, reject processing is executed (1850).

【0092】次に、求めた入力文書の回転角を用いて文
書画像中の文字画像を文字コードに変換する処理方法に
ついて説明する。
Next, a processing method for converting a character image in a document image into a character code by using the obtained rotation angle of the input document will be described.

【0093】図19に示すように、文字行座標190
5、文書回転角1910と入力画像1915を画像回転
部1920に入力する。そして、画像回転部1920に
て文書回転角だけ入力文書を回転修正する。そして、文
字行抽出部にて新たに修正画像中から文字行を抽出す
る。そして、文字切出部1935にて文字を切り出し、
文字認識部1940にて文字認識を行い、文字コード1
955に変換し出力する。
As shown in FIG. 19, character line coordinates 190
5. Input the document rotation angle 1910 and the input image 1915 into the image rotation unit 1920. Then, the image rotation unit 1920 rotates and corrects the input document by the document rotation angle. Then, the character line extraction unit newly extracts a character line from the corrected image. Then, the character cutting unit 1935 cuts out the character,
Character recognition unit 1940 performs character recognition and character code 1
Converted to 955 and output.

【0094】次に、求めた入力文書の回転角とレイアウ
ト情報を用いて文書画像中の文字画像を文字コードに変
換する処理方法について説明する。
Next, a processing method for converting a character image in a document image into a character code by using the obtained rotation angle and layout information of the input document will be described.

【0095】図20に示すように、文書回転角2110
と文字行部分画像2105を部分画像回転部2125に
入力する。そして、画像回転部にて文書回転角だけ入力
文書を回転修正する。また、文字行番号2114とレイ
アウト情報2115を読み順決定部2120に入力す
る。この読み順決定部2120で文字コードに変換して
いく文字行の順序求める。そして、回転文字行画像と読
み順情報を文字切出部2130に入力する。そして、読
み順決定部2120で得た順番に従い、文字切出部21
30にて文字を切り出し、文字認識部2135にて文字
認識を実行し、文字コード1955を出力する。
As shown in FIG. 20, the document rotation angle 2110.
And the character line partial image 2105 are input to the partial image rotation unit 2125. Then, the image rotation unit corrects the rotation of the input document by the document rotation angle. Further, the character line number 2114 and the layout information 2115 are input to the reading order determination unit 2120. The reading order determination unit 2120 obtains the order of character lines to be converted into character codes. Then, the rotated character line image and the reading order information are input to the character cutout unit 2130. Then, according to the order obtained by the reading order determining unit 2120, the character cutting unit 21
A character is cut out at 30, a character recognition unit 2135 executes character recognition, and a character code 1955 is output.

【0096】次に、自動的に入力文書の頁番号を読み取
り、これを付加情報として登録する方法について説明す
る。
Next, a method of automatically reading the page number of the input document and registering it as additional information will be described.

【0097】図21に示すように、回転処理部2210
に回転角2200および入力画像2205を入力し文書
画像を回転修正する。そして、頁番号を認識するため
に、まず、頁番号を修正画像から抽出する必要から頁番
号レイアウト情報ファイル2220に格納されている知
識を用いて頁番号画像抽出部2215にて頁番号部分画
像を抽出する。次に、抽出した頁番号部分画像から頁番
号を一文字づつ文字切り出し部2225にて切り出し、
文字認識部2230にて画像データから文字コードに変
換する。最後に、認識した頁番号を付加情報として付加
情報登録部2235にてこれを付加情報ファイル224
0に登録する。
As shown in FIG. 21, the rotation processing unit 2210.
The rotation angle 2200 and the input image 2205 are input to and the document image is rotated and corrected. In order to recognize the page number, the page number image extraction unit 2215 uses the knowledge stored in the page number layout information file 2220 to extract the page number partial image from the corrected image. Extract. Next, the page number is cut out from the extracted page number partial image by the character cutting unit 2225 one by one,
The character recognition unit 2230 converts the image data into a character code. Finally, the recognized page number is treated as additional information by the additional information registration unit 2235, and this is added to the additional information file 224.
Register to 0.

【0098】次に、登録される情報について説明する。
登録されるデータは文書番号、入力画像、リジェクト番
号、修正画像、読取結果そして付加情報がある。この付
加情報には、さらに、図22に示すように、文書名23
05、著者名1:2310、著者名2:2315、雑誌
名2320、入手先2325、入手日時2330等の情
報が登録され、同一文書同士内で関係情報が結び付けら
れる。そして、図23に示すようにファイル制御手段2
440が文書同士の関係を抽出し、文書同士関係ファイ
ル2445に登録する。
Next, the registered information will be described.
The registered data includes a document number, input image, reject number, corrected image, reading result, and additional information. As shown in FIG. 22, the additional information further includes a document name 23
05, author name 1: 2310, author name 2: 2315, magazine name 2320, source 2325, date and time of acquisition 2330, etc. are registered, and related information is linked within the same document. Then, as shown in FIG. 23, the file control means 2
440 extracts the relationship between the documents and registers it in the document relationship file 2445.

【0099】図24に、雑誌名に関する情報ファイルを
示す。このファイルには項目内容とその項目での文書番
号が登録されている。他の登録項目のファイルも同様な
構成である。文書同士関係を生成するファイル制御手段
は各登録項目のファイルの参照時に、同じ項目内容をも
つ文書番号は相互に関係があるものとし、文書番号から
順に関係のある文書番号をリスト化していく。これによ
り、図25の示す如き文書同士関係ファイルが作成され
ることになる。
FIG. 24 shows an information file relating to the magazine name. The content of the item and the document number of the item are registered in this file. Files of other registered items have the same structure. The file control means for generating a document relation assumes that document numbers having the same item contents are related to each other when referring to files of each registered item, and lists related document numbers in order from the document number. As a result, a document relationship file as shown in FIG. 25 is created.

【0100】以上述べたように、上記システムでは同一
文書内の情報の検索はもちろん、登録項目からの関連文
書の検索、また、ユーザが所望の文書に関する情報がお
ぼろげである場合でも、文書同士関係を用いて他の文書
からでも所望の文書に関する情報を入手することが出来
る。
As described above, in the system described above, not only the information in the same document is searched, but also the related document is searched from the registered item, and even if the information about the document desired by the user is vague, the documents are not matched. Relationships can be used to obtain information about a desired document from other documents as well.

【0101】次に、A4スキャナでの読み取り時に生じ
ることがある読み取り領域からの文書のはみ出しを解決
する方法を図27を用いて説明する。
Next, a method for solving the protrusion of the document from the reading area which may occur at the time of reading with the A4 scanner will be described with reference to FIG.

【0102】電子ファイリング装置ではスキャナとして
A3読み取り可能のものが多く、文書をA4で入力する
のでは無く、A3の読み取り領域で入力し(280
0)、その後は図7で示した方法と同様な方法にて入力
文書画像中の内容を読み取る(2805−2870)。
ここで、図7と異なるのははみ出し判定が不必要になる
ことと、それに伴うリジェクト処理が不要になることで
ある。また、処理に関しては図7で示した処理領域を拡
張するのみで良いため容易に実現できる。
Many electronic filing apparatuses are capable of reading A3 as a scanner, and a document is not input in A4 but is input in the reading area of A3 (280
0) and thereafter, the contents in the input document image are read by the same method as that shown in FIG. 7 (2805-2870).
Here, what is different from FIG. 7 is that the protrusion determination is unnecessary and the reject process accompanying it is unnecessary. Further, the processing can be easily realized because only the processing area shown in FIG. 7 needs to be expanded.

【0103】次に、先に示した方法では毎回A3読み取
り領域を処理するため処理時間がA4対応の場合に比べ
て掛かってしまう。そのため、まず、A4読み取り領域
で画像を入力して(2900)、はみ出し処理を行ない
(2905)、その結果に基づきはみ出し判定する(2
910)。はみ出した場合、A3読み取り領域で画像を
再入力し(2915)、図27で示した処理(2805
−2870)ここでは処理29を実行する(292
0)。また、読み取り領域を文書画像がはみ出していな
い場合、A4読み取り領域の画像に対して処理29を実
行する(2925)。以上述べた方法により、ユーザが
読み取りたい文書が読み取り領域をはみ出した場合、毎
回入力文書を整えて入力し直すこと無く、自動的に内容
を読み取ることが出来る。
Next, in the method described above, since the A3 reading area is processed every time, the processing time is longer than that in the case of supporting A4. Therefore, first, an image is input in the A4 reading area (2900), a protrusion process is performed (2905), and a protrusion determination is performed based on the result (2900).
910). If it does, the image is re-input in the A3 reading area (2915) and the processing shown in FIG.
-2870) Here, the process 29 is executed (292).
0). If the document image does not extend beyond the reading area, processing 29 is performed on the image in the A4 reading area (2925). By the method described above, when the user wants to read the document out of the reading area, the contents can be automatically read without adjusting the input document and re-inputting each time.

【0104】次に、読み取るべき文字行がスキャナ読み
取り領域外にあるか否かを判定する方法について図29
を用いて説明する。
Next, a method for determining whether or not the character line to be read is outside the scanner reading area will be described with reference to FIG.
Will be explained.

【0105】図10では文字行の4すみの座標により入
力文書が読み取り領域をはみ出したか否かを判定する方
法を示した。ここでは、もっと簡易な方法で入力文書が
読み取り領域をはみ出したか否かを判定する方法を示
す。図29は、入力画像(3000)に文字行(300
5)が存在しそれがスキャナ読み取り領域をはみ出して
いる図を示している。ここでは、上辺、底辺、左辺、右
辺に対しNビットの幅を持つ矩形(例えば、3010、
3015)に対し周辺分布あるいは累積黒ドット数を積
算する。入力文書が読み取り領域をはみ出した場合、必
ず4辺のどれかに接触するため4つのどれか一つ以上の
矩形の累積黒ドット数はある値Vを超える。図29の場
合、矩形3015の累積黒ドット数が値Vを超えてしま
う。このように、4辺の矩形中の累積黒ドット数の値を
調べることにより容易に入力文書が読み取り領域をはみ
出したか否かを判定することが出来る。
FIG. 10 shows a method of determining whether or not the input document is out of the reading area based on the coordinates of the four corners of the character line. Here, a method for determining whether or not the input document extends beyond the reading area by a simpler method will be shown. FIG. 29 shows that the input image (3000) has a character line (300
5) is present and it extends beyond the scanner reading area. Here, a rectangle having a width of N bits with respect to the top side, the bottom side, the left side, and the right side (for example, 3010,
3015), the peripheral distribution or the cumulative number of black dots is integrated. When the input document extends beyond the reading area, it always touches any of the four sides, so the cumulative number of black dots in any one of the four rectangles exceeds a certain value V. In the case of FIG. 29, the cumulative number of black dots in the rectangle 3015 exceeds the value V. In this way, by checking the values of the cumulative number of black dots in the four-sided rectangle, it is possible to easily determine whether or not the input document exceeds the reading area.

【0106】次に、読み取る入力文書の方向角を決定す
る際に文字認識の結果を利用するが、この時、文字画像
あるい文字行画像を任意の角度に回転させて文字認識を
行う必要がある。この回転の方法としてビットごとに回
転を行う方法が考えられるがこれは処理量が少なくは無
い、そのため、文字行画像中から文字画像を取り出し、
文字認識方法として文字の骨格あるいは輪郭を用いるも
のに対しては、文字の骨格あるいは輪郭を、例えば図3
1に示す8方向のチェーンコードで表現し、回転に必要
な角度だけチェーンコードの番号をずらすのみで処理量
を大幅に削減し容易に実現できる。回転角の文か伊能に
応じて16方向あるいは32方向と言うようにチェーン
コードの方向数を増せば容易に細かい角度での回転が行
える。例えば、「但」と言う文字の骨格データに対し8
方向のチェーンコードでこれを表現した図29に示す。
このように、骨格データを8方向のチェーンで表現で
き、容易に45度単位で回転が行える。
Next, the result of character recognition is used in determining the direction angle of the input document to be read. At this time, it is necessary to rotate the character image or the character line image at an arbitrary angle for character recognition. is there. As a method of this rotation, a method of performing rotation for each bit is conceivable, but this processing amount is not small, so a character image is extracted from the character line image,
For a method that uses a character skeleton or contour as a character recognition method, the character skeleton or contour is described in, for example, FIG.
It is expressed by the 8-direction chain code shown in 1 and can be easily realized by greatly reducing the processing amount only by shifting the chain code number by the angle required for rotation. If the number of directions of the chain cord is increased to say 16 directions or 32 directions depending on the sentence of the rotation angle or Ino, it is possible to easily rotate at a fine angle. For example, 8 for the skeletal data of the character "Ta"
This is shown in FIG. 29 in which this is expressed by the chain code of the direction.
In this way, the skeleton data can be represented by a chain in 8 directions, and rotation can be easily performed in 45 degree units.

【0107】[0107]

【発明の効果】本発明の文書読取装置あるいは電子ファ
イル装置あるいはファクシミリあるいは複写機あるいは
計算機によれば、文書がスキャナの設定方向に対し任意
の角度(0度から360度)で回転されて入力された場
合でも、入力文書の回転角を検出し、正しい方向に入力
画像を修正し、その内容を読み取ることが出来る。ま
た、ユーザに修正した画像を提示あるいは蓄積すること
が出来る。
According to the document reading device, the electronic file device, the facsimile, the copying machine, or the computer of the present invention, the document is input by being rotated at an arbitrary angle (0 to 360 degrees) with respect to the setting direction of the scanner. Even if the input document is rotated, the rotation angle of the input document can be detected, the input image can be corrected in the correct direction, and the content can be read. Further, the corrected image can be presented or stored to the user.

【0108】また、入力された文書がユーザが間違えて
裏面で入力されたものかを判定し、裏面入力時にはユー
ザにメッセージを促すことが出来る。また、入力された
文書の読み取るべき部分がスキャナの読み取り領域から
はみ出しているかを判定し、はみ出して入力された場合
にはユーザにメッセージを促すことが出来る。
Further, it is possible to judge whether the input document is mistakenly input on the back side by the user and prompt the user for a message when inputting on the back side. In addition, it is possible to determine whether or not the portion of the input document to be read extends beyond the reading area of the scanner, and if the portion is input beyond the reading area, a message can be prompted to the user.

【0109】また、文書に記載されていない文書に関わ
る入手先、入手日時、メモ等の付加情報を入力画像やそ
の処理結果に対応づけて記録し、文書情報を指定して、
その文書に関連のある情報を検索し、取り出すことが出
来る。また、関連のある他の文書同志の関係情報を記録
し、その文書同志関係情報を検索して、ある文書からた
の文書をたぐり、所望の文書に関わる情報を検索し、取
り出すことが出来る。
Further, additional information such as a source, a date and time of acquisition, a memo, etc. relating to a document which is not described in the document is recorded in association with the input image and the processing result thereof, and the document information is designated.
You can search and retrieve information related to the document. Further, it is possible to record the related information of other related documents, search for the related information of the documents, search for the document from a certain document, and search for and retrieve the information related to the desired document.

【0110】また、入力文書がA4スキャナ読み取り領
域をはみ出しても、はみ出し領域を判定し再度A3スキ
ャナ読み取り領域で文書画像を自動的に入力することに
より、文書に記載された内容を漏らすこと無く読み取る
ことが出来る。
Even if the input document extends beyond the A4 scanner reading area, the extension area is determined, and the document image is automatically input again in the A3 scanner reading area to read the content described in the document without leaking. You can

【0111】さらに、データ登録時にファイル容量をチ
ェックすることで、処理結果が格納か否かを判定し、ユ
ーザにメッセージを促すことが出来る。また、大量な文
書を入力し、入力画像の回転角を修正し、修正画像を蓄
積すると同時にその画像を管理することが出来る。
Furthermore, by checking the file capacity at the time of data registration, it is possible to judge whether or not the processing result is stored and prompt the user for a message. Also, a large amount of documents can be input, the rotation angle of the input image can be corrected, the corrected images can be stored, and the images can be managed at the same time.

【0112】のユーザの使い勝手を考慮した文書読取装
置あるいは電子ファイル装置あるいはファクシミリ装置
あるいは複写機あるいは計算機を提供することにある。
It is another object of the present invention to provide a document reading device, an electronic file device, a facsimile device, a copying machine, or a computer in consideration of user's usability.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の文書読取装置の一実施例のブロック図
である。
FIG. 1 is a block diagram of an embodiment of a document reading device of the present invention.

【図2】本発明の文書読取装置の一実施例のブロック図
である。
FIG. 2 is a block diagram of an embodiment of a document reading device of the present invention.

【図3】スキャナの捜査線の方向とシステムの処理方向
を示した図である。
FIG. 3 is a diagram showing a scanning line direction of a scanner and a processing direction of a system.

【図4】文書がスキャナ上に傾いて設定された状態を示
す図である。
FIG. 4 is a diagram showing a state in which a document is tilted on a scanner and set.

【図5】文書がシステムの処理方向と反転して設定され
た状態を示す図である。
FIG. 5 is a diagram showing a state in which a document is set upside down with respect to the processing direction of the system.

【図6】文書がシステムの処理方向と任意の回転角で設
定された状態を示す図である。
FIG. 6 is a diagram showing a state in which a document is set with a processing direction of the system and an arbitrary rotation angle.

【図7】本発明の文書読取装置の大まかな処理の過程を
示した図である。
FIG. 7 is a diagram showing a rough process of the document reading apparatus of the present invention.

【図8】最適な文字行を選択するフローを示した図であ
る。
FIG. 8 is a diagram showing a flow for selecting an optimum character line.

【図9】間違えて裏面で入力されたか否かを判定するフ
ローを示す図である。
FIG. 9 is a diagram showing a flow of determining whether or not an input is made on the back side by mistake.

【図10】スキャナの読み取り領域をはみ出したか否か
を判定するフローを示す図である。
FIG. 10 is a diagram showing a flow of determining whether or not the reading area of the scanner is protruded.

【図11】スキャナの読み取り領域をはみ出した部分の
表示方法を示した図である。
FIG. 11 is a diagram showing a display method of a portion outside the reading area of the scanner.

【図12】入力文書の傾きをユーザが設定する方法を示
した図である。
FIG. 12 is a diagram showing a method for a user to set the inclination of an input document.

【図13】文字認識を利用して文書の回転角の評価を示
す図である。
FIG. 13 is a diagram showing evaluation of a rotation angle of a document using character recognition.

【図14】4種類の候補文書回転角から回転角を決定す
る方法を示す図である。
FIG. 14 is a diagram showing a method of determining a rotation angle from four types of candidate document rotation angles.

【図15】レイアウト情報を利用して文書の回転角の評
価を示す図である。
FIG. 15 is a diagram showing evaluation of a rotation angle of a document using layout information.

【図16】予め設定されたレイアウト情報を利用して文
書の回転角の評価を示す図である。
FIG. 16 is a diagram showing evaluation of a rotation angle of a document using preset layout information.

【図17】縦書き・横書きのブロックを0、90、18
0、270度回転させた図である。
FIG. 17: Vertical writing / horizontal writing blocks 0, 90, 18
It is the figure rotated 0,270 degree.

【図18】文字認識を利用して求めた回転角とレイアウ
ト情報を利用して求めた回転角による文書の回転角の決
定方法を示す図である。
FIG. 18 is a diagram showing a method of determining a rotation angle of a document based on a rotation angle obtained by using character recognition and a rotation angle obtained by using layout information.

【図19】入力文書を回転角だけ修正し、記述された内
容の読み取りを示す図である。
FIG. 19 is a diagram showing reading of the described contents by correcting the input document by the rotation angle.

【図20】入力文書をレイアウト情報を用いて、回転角
だけ修正し、記述された内容の読み取り方法を示す図で
ある。
FIG. 20 is a diagram showing a method of reading the described content by correcting only the rotation angle of the input document using layout information.

【図21】文書画像を回転修正し頁番号を認識し、それ
を付加情報として登録する一実施例を示す図である。
FIG. 21 is a diagram showing an embodiment in which a document image is rotated and corrected, a page number is recognized, and the page number is registered as additional information.

【図22】付加情報として登録する内容の一例を示した
図である。
FIG. 22 is a diagram showing an example of contents registered as additional information.

【図23】複数の項目のファイルから文書間同志の情報
を抽出し登録する方法を示す図である。
FIG. 23 is a diagram showing a method of extracting and registering information of inter-document documents from files of a plurality of items.

【図24】雑誌名情報ファイルの例示図である。FIG. 24 is a view showing an example of a magazine name information file.

【図25】文書同志関係情報ファイルの例示例である。FIG. 25 is an example of a document fellowship information file.

【図26】本発明の文書読取装置の一実施例の処理フロ
ーを示した図である。
FIG. 26 is a diagram showing a processing flow of an embodiment of the document reading apparatus of the present invention.

【図27】A3スキャナを用いることにより、A4スキ
ャナの読み取り領域からはみ出すことがない読み取りフ
ローを示す図である。
FIG. 27 is a diagram showing a reading flow in which an A3 scanner is used and the A4 scanner does not extend beyond the reading area.

【図28】A4スキャナの読み取り領域からのはみ出し
を検出した場合、更にA3スキャナの読み取り領域で画
像入力することにより、読み取りを実現する処理フロー
を示す図である。
FIG. 28 is a diagram showing a processing flow for realizing reading by detecting an overflow from the reading area of the A4 scanner and further inputting an image in the reading area of the A3 scanner.

【図29】スキャナの読み取り領域をはみ出したか否か
を判定するフローを示す図である。
FIG. 29 is a diagram showing a flow for determining whether or not the reading area of the scanner is protruded.

【図30】文字画像の回転を行なうこと無く、チェーン
コードにより文字認識対象を高速に回転する表現に用い
るチェーンコードを示す図である。
FIG. 30 is a diagram showing a chain code used for an expression in which the character recognition target is rotated at high speed by the chain code without rotating the character image.

【図31】チェーンコードにより表現されたもの骨格を
示す図である。
FIG. 31 is a diagram showing a skeleton expressed by a chain code.

【符号の説明】[Explanation of symbols]

101 文書、 105 画像入力手段、 110 文字行抽出手段、 125 傾き抽出手段、 150 文書回転角判定手段、 165 文字行座標回転手段。 101 document, 105 image input means, 110 character line extraction means, 125 inclination extraction means, 150 document rotation angle determination means, 165 character line coordinate rotation means.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 嶋 好博 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Yoshihiro Shima 1-280, Higashi Koigokubo, Kokubunji, Tokyo Inside the Central Research Laboratory, Hitachi, Ltd.

Claims (21)

【特許請求の範囲】[Claims] 【請求項1】文書の画像を入力する入力手段と、上記入
力された画像の文字行を抽出する文字行抽出手段と、文
書の傾きを抽出する傾き抽出手段と、上記の抽出された
文字行を文書の傾きに0度、90度、180度、270
度を加えた角度を回転させる回転手段と、上記回転され
た4種類の文字行の認識を行ない、認識から文書の傾き
を判定する判定手段とを備え、上記文書の傾きを補正し
て読み取りを行なうことを特徴とする文書読取装置。
1. An input unit for inputting an image of a document, a character line extracting unit for extracting a character line of the input image, an inclination extracting unit for extracting an inclination of the document, and the extracted character line. To the inclination of the document 0 degrees, 90 degrees, 180 degrees, 270
A rotation means for rotating an angle added with a degree and a determination means for recognizing the rotated four types of character lines and determining the inclination of the document from the recognition are provided, and the inclination of the document is corrected to read. A document reading device characterized by performing.
【請求項2】請求項1記載の文書読取装置において、上
記入力手段は、A3の入力スキャナを用いて全ての文書
画像を入力することを特徴とする文書読取装置。
2. The document reading apparatus according to claim 1, wherein the input means inputs all the document images by using an A3 input scanner.
【請求項3】上記文字行抽出手段は、上記文字行中に複
数個の文字が存在するよう文字行の縦横比あるいは横縦
比がある一定値以上のものを採用する手段を具備したこ
とを特徴とする請求項1記載の文書読取装置。
3. The character line extracting means comprises means for adopting an aspect ratio of a character line or an aspect ratio of a certain value or more so that a plurality of characters are present in the character line. The document reading device according to claim 1, wherein
【請求項4】上記判定手段は、上記4種類の角度で回転
したそれぞれの文字行から文字を切り出し認識し、認識
により得られた複数個の文字の類似度の平均値、中央
値、フィルタをかけて得た値のうち少なくとも一つをも
とに文書の傾きを判定することを特徴とする請求項1記
載の文書読取装置。
4. The determining means recognizes a character cut out from each of the character lines rotated by the four types of angles, and calculates an average value, a median value, and a filter of similarity degrees of a plurality of characters obtained by the recognition. The document reading device according to claim 1, wherein the document inclination is determined based on at least one of the values obtained by the multiplication.
【請求項5】上記判定手段は、上記回転手段により回転
した文字行からレイアウト情報を得て、上記レイアウト
情報をもとに文書の傾きを判定することを特徴とする請
求項1記載の文書読取装置。
5. The document reading device according to claim 1, wherein the determining means obtains layout information from the character line rotated by the rotating means and determines the inclination of the document based on the layout information. apparatus.
【請求項6】上記レイアウト情報は、縦書き・横書きお
よび縦長・横長の情報を組み合わせた4種類の情報であ
ることをを特徴とする請求項5記載の文書読取装置。
6. The document reading device according to claim 5, wherein the layout information is four types of information in which vertical writing / horizontal writing and vertical / horizontal writing information are combined.
【請求項7】請求項1記載の文書読取装置において、上
記文書に文書番号を付加する第1の手段と、上記文書に
関わる文書に書かれていない付加情報を入力するための
付加情報入力する第2の手段と、上記入力された付加情
報を文書番号や入力文書を処理した文書情報に対応付け
て電子的に記憶する第3の手段と、付加情報や文書情報
を検索する第4の手段とを具備したことを特徴とする文
書読取装置。
7. A document reading apparatus according to claim 1, wherein first means for adding a document number to said document and additional information for inputting additional information not written in a document related to said document are inputted. A second means, a third means for electronically storing the input additional information in association with the document number or the document information obtained by processing the input document, and a fourth means for searching the additional information or the document information. A document reading device comprising:
【請求項8】請求項7記載の文書読取装置において、上
記第1の手段は、上記文書の頁番号の画像を抽出する手
段と、上記抽出された頁番号を認識する手段と、上記認
識した頁番号を付加情報として登録する手段とを具備し
たことを特徴とする文書読取装置。
8. The document reading apparatus according to claim 7, wherein the first means recognizes the page number image of the document, recognizes the extracted page number, and recognizes the extracted page number. A document reading device, comprising: means for registering a page number as additional information.
【請求項9】請求項7記載の文書読取装置において、文
書同士の関係情報を電子的に記録する手段と、上記文書
同士の関係情報を検索して所望の文書に関わる文書情報
や付加情報を検索する手段とを具備したことを特徴とす
る文書読取装置。
9. A document reading apparatus according to claim 7, wherein means for electronically recording relationship information between documents and means for retrieving the relationship information between the documents to display document information and additional information relating to a desired document. A document reading device comprising a searching unit.
【請求項10】請求項1記載の文書読取装置において、
上記入力したディジタル画像から抽出した文字行の有無
に従い入力文書が表で正常に入力されたものか間違えて
裏で入力されたものかを判定する手段を具備したことを
特徴とする文書読取装置。
10. The document reading device according to claim 1,
A document reading device comprising means for determining whether the input document is normally input on the front side or is input on the back side by mistake according to the presence / absence of character lines extracted from the input digital image.
【請求項11】請求項1記載の文書読取装置において、
文字行抽出手段により抽出された文字行の4つの頂点の
2頂点以上がスキャナ読取領域の4辺上に存在するか否
かに従い読み取るべき文字行がスキャナ読み取り領域外
にあるか否かを判定する手段とを具備したことを特徴と
する文書読取装置。
11. The document reading apparatus according to claim 1,
It is determined whether the character line to be read is outside the scanner reading area according to whether two or more of the four vertices of the character row extracted by the character row extracting means are present on the four sides of the scanner reading area. A document reading device comprising a means.
【請求項12】請求項11記載の文書読取装置におい
て、文書画像の読み取るべき文字行が領域外にあるとと
判定された場合、上記文書画像を表示するウインドある
いは別のウインド上にエラーの生じた個所を拡大して表
示する手段あるいはエラーの生じた文字行の色を他の文
字行の色と変えて表示する手段とを具備したことを特徴
とする文書読取装置。
12. The document reading device according to claim 11, wherein when it is determined that the character line to be read of the document image is outside the area, an error occurs in a window displaying the document image or another window. A document reading device, comprising: means for enlarging and displaying a portion or a means for displaying a character line in which an error has occurred by changing the color of the character line from that of another character line.
【請求項13】請求項11記載の文書読取装置におい
て、文書画像の読み取るべき文字行が領域外にあるとと
判定された場合、ユーザが入力画像の読み取りを続行す
るか否かをモードにより設定できる手段を具備したこと
を特徴とする文書読取装置。
13. The document reading apparatus according to claim 11, wherein, when it is determined that the character line to be read of the document image is outside the area, whether the user continues to read the input image is set by a mode. A document reading device comprising means capable of performing.
【請求項14】請求項11記載の文書読取装置におい
て、文書画像読み取るべき文字行が領域外にあるとと判
定された場合、上記文書画像の文書番号をリジェクトフ
ァイルに登録する手段、あるいは、エラーメッセージの
ウインド上への表示あるいは音声での呼び掛けによる警
告を促す手段とを具備したことを特徴とする文書読取装
置。
14. The document reading device according to claim 11, wherein when it is determined that the character line to read the document image is outside the area, a means for registering the document number of the document image in a reject file or an error. A document reading device comprising: means for displaying a message on a window or urging a warning by voice call.
【請求項15】文書をディジタル画像として入力する装
置において、上記ディジタル画像の処理結果をファイル
に出力するための空き容量を表示する手段と、上記空き
容量が少なくなった場合には警告をウインド上への表示
または音声で促す手段と、ネットワークを介しオペレー
タがいる他の装置に警告を促す手段とを具備したことを
特徴とする文書読取装置。
15. A device for inputting a document as a digital image, a means for displaying a free space for outputting the processing result of the digital image to a file, and a warning window when the free space becomes small. A document reading apparatus comprising means for prompting by means of a display or voice to a user and means for prompting a warning to another device in which an operator is present via a network.
【請求項16】文書をディジタル画像として入力する装
置において、入力した画像データの上辺Nビット分の矩
形の累積黒ドット数(Nは整数)と右辺Nビット分の矩
形の累積黒ドット数と左辺Nビット分の矩形の累積黒ド
ット数と底辺Nビット分の矩形の累積黒ドット数を求め
る手段と、上記求めた4種類の累積黒ドット数の値が値
V(Vは整数)を超えたか否かを判定する手段と、上記
判定結果が値V(Vは整数)を超えた場合、読み取るべ
き記載内容がスキャナ読み取り領域外にあると判定する
ことを特徴とする文書読取装置。
16. A device for inputting a document as a digital image, wherein the cumulative number of black dots (N is an integer) of a rectangle corresponding to the upper side N bits of the inputted image data and the cumulative number of black dots of a rectangular region corresponding to the right side N bits and the left side. A means for determining the cumulative number of black dots in the rectangle for N bits and the cumulative number of black dots in the rectangle for the bottom N bits, and whether the values of the four types of cumulative black dots obtained above exceed the value V (V is an integer). A means for determining whether or not, and a document reading device, characterized in that when the above determination result exceeds a value V (V is an integer), it is determined that the written content to be read is outside the scanner reading area.
【請求項17】文字の骨格または輪郭をN方向(Nは整
数)のチェーンコードで表現する文字読取装置におい
て、選択された適切な文字行画像から文字を切り出す手
段と、該切り出された文字画像から文字の骨格あるいは
輪郭を抽出しN方向のチェーンコードで表現する手段
と、検出した傾きに4種類の角度0度、90度、180
度、270度を加えた角度に相当するだけチェーンコー
ドをそれぞれ回転させる手段と、上記回転させたチェー
ンコードに対し認識を行う手段とを具備したことを特徴
とする文書読取装置。
17. A character reading device for expressing a skeleton or outline of a character by a chain code in N directions (N is an integer), means for cutting out a character from an appropriate selected character line image, and the cut out character image. Means for extracting a skeleton or contour of a character from the expression and expressing it as a chain code in the N direction, and four kinds of angles 0, 90, 180 for the detected inclination.
A document reading apparatus comprising means for rotating the chain code by an angle corresponding to an angle of +270 degrees and means for recognizing the rotated chain code.
【請求項18】文書の画像を入力する入力手段と、上記
入力された画像を蓄積する蓄積手段と、上記蓄積された
画像を出力する出力手段とを備えた電子ファイル装置に
おいて、上記入力された画像の文字行を抽出する文字行
抽出手段と、文書の傾きを抽出する傾き抽出手段と、上
記の抽出された文字行を文書の傾きに0度、90度、1
80度、270度を加えた角度を回転させる回転手段
と、上記回転された4種類の文字行の認識を行ない、認
識から文書の傾きを判定する判定手段とを備え、上記文
書の傾きを補正して読み取りを行なうことを特徴とする
電子ファイル装置。
18. An electronic file device comprising: input means for inputting an image of a document; storage means for storing the input image; and output means for outputting the stored image. A character line extracting means for extracting a character line of an image, a tilt extracting means for extracting a document inclination, and the above-mentioned extracted character lines for a document inclination of 0 °, 90 °, 1
The inclination of the document is corrected by including a rotation unit that rotates an angle of 80 degrees and 270 degrees and a determination unit that recognizes the four types of rotated character lines and determines the inclination of the document from the recognition. An electronic filing device characterized by performing reading.
【請求項19】文書の画像を入力する入力手段と、上記
入力された画像を蓄積する蓄積手段と、上記蓄積された
画像を出力する出力手段とを備えた電子ファイル装置に
おいて、上記入力された画像の文字行を抽出する文字行
抽出手段と、文書の傾きを抽出する傾き抽出手段と、上
記の抽出された文字行を文書の傾きに0度、90度、1
80度、270度を加えた角度を回転させる回転手段
と、上記回転された4種類の文字行の認識を行ない、認
識から文書の傾きを判定する判定手段とを備え、上記文
書の傾きを補正して読み取りを行なうことを特徴とする
電子ファイル装置。
19. An electronic file device comprising input means for inputting an image of a document, storage means for storing the input image, and output means for outputting the stored image. A character line extracting means for extracting a character line of an image, a tilt extracting means for extracting a document inclination, and the above-mentioned extracted character lines for a document inclination of 0 °, 90 °, 1
The inclination of the document is corrected by including a rotation unit that rotates an angle of 80 degrees and 270 degrees and a determination unit that recognizes the four types of rotated character lines and determines the inclination of the document from the recognition. An electronic filing device characterized by performing reading.
【請求項20】文書の画像を入力する入力手段と、上記
入力された画像を送信する送信手段とを備えたファクシ
ミリ装置において、上記入力された画像の文字行を抽出
する文字行抽出手段と、文書の傾きを抽出する傾き抽出
手段と、上記の抽出された文字行を文書の傾きに0度、
90度、180度、270度を加えた角度を回転させる
回転手段と、上記回転された4種類の文字行の認識を行
ない、認識から文書の傾きを判定する判定手段とを備
え、上記文書の傾きを補正して読み取りを行なうことを
特徴とするファクシミリ装置。
20. A facsimile device comprising an input means for inputting an image of a document and a transmitting means for transmitting the input image, a character line extracting means for extracting a character line of the input image, An inclination extracting unit that extracts the inclination of the document, and the extracted character line to the inclination of the document is 0 degrees,
Rotating means for rotating an angle obtained by adding 90 degrees, 180 degrees, and 270 degrees, and determination means for recognizing the rotated four types of character lines and determining the inclination of the document from the recognition are provided. A facsimile machine characterized by correcting inclination and reading.
【請求項21】文書の画像を入力する入力手段と、上記
蓄積された画像を出力する出力手段とを備えた複写機に
おいて、上記入力された画像の文字行を抽出する文字行
抽出手段と、文書の傾きを抽出する傾き抽出手段と、上
記の抽出された文字行を文書の傾きに0度、90度、1
80度、270度を加えた角度を回転させる回転手段
と、上記回転された4種類の文字行の認識を行ない、認
識から文書の傾きを判定する判定手段とを備え、上記文
書の傾きを補正して読み取りを行なうことを特徴とする
複写機。
21. A character line extracting means for extracting a character line of the input image in a copying machine having an input means for inputting an image of a document and an output means for outputting the accumulated image, Inclination extraction means for extracting the inclination of the document, and the above extracted character lines to the inclination of the document are 0 °, 90 °, 1
The inclination of the document is corrected by including a rotation unit that rotates an angle of 80 degrees and 270 degrees and a determination unit that recognizes the four types of rotated character lines and determines the inclination of the document from the recognition. A copying machine characterized by scanning and reading.
JP25435492A 1992-09-24 1992-09-24 Document reading device Expired - Fee Related JP3186246B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP25435492A JP3186246B2 (en) 1992-09-24 1992-09-24 Document reading device
JP10304988A JPH11219409A (en) 1992-09-24 1998-10-27 Document reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25435492A JP3186246B2 (en) 1992-09-24 1992-09-24 Document reading device

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP30498798A Division JP3186712B2 (en) 1998-10-27 1998-10-27 Document reading device
JP10304988A Division JPH11219409A (en) 1992-09-24 1998-10-27 Document reader

Publications (2)

Publication Number Publication Date
JPH06103411A true JPH06103411A (en) 1994-04-15
JP3186246B2 JP3186246B2 (en) 2001-07-11

Family

ID=17263831

Family Applications (2)

Application Number Title Priority Date Filing Date
JP25435492A Expired - Fee Related JP3186246B2 (en) 1992-09-24 1992-09-24 Document reading device
JP10304988A Pending JPH11219409A (en) 1992-09-24 1998-10-27 Document reader

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP10304988A Pending JPH11219409A (en) 1992-09-24 1998-10-27 Document reader

Country Status (1)

Country Link
JP (2) JP3186246B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100247970B1 (en) * 1997-07-15 2000-03-15 윤종용 Direction correction method of document image
US6546215B2 (en) 2001-09-10 2003-04-08 Toshiba Tec Kabushiki Kaisha Image forming apparatus and method having document orientation control
JP2005346607A (en) * 2004-06-07 2005-12-15 Fuji Xerox Co Ltd Document image decision device, document image decision method and program therefor
US7106904B2 (en) 2001-04-25 2006-09-12 Hitachi, Ltd. Form identification method
EP2093994A1 (en) 2008-02-19 2009-08-26 Canon Kabushiki Kaisha Electronic document producing device, electronic document producing method and storage medium
JP2010109547A (en) * 2008-10-29 2010-05-13 Brother Ind Ltd Image reader, image read method and image read program
WO2011111315A1 (en) * 2010-03-09 2011-09-15 パナソニック株式会社 Image processing method

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003283766A (en) * 2002-03-22 2003-10-03 Ricoh Co Ltd Image input apparatus

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0727713B2 (en) * 1986-01-07 1995-03-29 キヤノン株式会社 Remaining amount display method in image matching device
JPS6319049A (en) * 1986-07-11 1988-01-26 Nec Corp File capacity display system
JPS63215153A (en) * 1987-03-03 1988-09-07 Sumitomo Electric Ind Ltd Display device for deviation of visual field in optical image input device

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100247970B1 (en) * 1997-07-15 2000-03-15 윤종용 Direction correction method of document image
US6169822B1 (en) 1997-07-15 2001-01-02 Samsung Electronics Co., Ltd. Method for correcting direction of document image
US7106904B2 (en) 2001-04-25 2006-09-12 Hitachi, Ltd. Form identification method
US6546215B2 (en) 2001-09-10 2003-04-08 Toshiba Tec Kabushiki Kaisha Image forming apparatus and method having document orientation control
JP2005346607A (en) * 2004-06-07 2005-12-15 Fuji Xerox Co Ltd Document image decision device, document image decision method and program therefor
EP2093994A1 (en) 2008-02-19 2009-08-26 Canon Kabushiki Kaisha Electronic document producing device, electronic document producing method and storage medium
US8532386B2 (en) 2008-02-19 2013-09-10 Canon Kabushiki Kaisha Electronic document producing device, electronic document producing method and storage medium
JP2010109547A (en) * 2008-10-29 2010-05-13 Brother Ind Ltd Image reader, image read method and image read program
WO2011111315A1 (en) * 2010-03-09 2011-09-15 パナソニック株式会社 Image processing method

Also Published As

Publication number Publication date
JPH11219409A (en) 1999-08-10
JP3186246B2 (en) 2001-07-11

Similar Documents

Publication Publication Date Title
US5761344A (en) Image pre-processor for character recognition system
US5809167A (en) Page segmentation and character recognition system
US5867277A (en) Reduced resolution document storage and retrieval system
US5619594A (en) Image processing system with on-the-fly JPEG compression
US8270721B2 (en) Method and system for acquiring data from machine-readable documents
US5650799A (en) Programmable function keys for a networked imaging computer system
JPH08255236A (en) Device and method for filing image
WO1990015386A1 (en) Document identification by characteristics matching
US6711292B2 (en) Block selection of table features
JP2006031546A (en) Character direction identifying device, character processing device, program and storage medium
JPH06103411A (en) Document reader
US20010043742A1 (en) Communication document detector
EP1202213B1 (en) Document format identification apparatus and method
JPH03214378A (en) Character recognizing device
EP0519713B1 (en) Character input method and apparatus
US5991440A (en) Method and apparatus for recognizing input handwritten characters associated with title information
JP3186712B2 (en) Document reading device
JPH08180068A (en) Electronic filing device
JPH0689330A (en) Image filing system
JP7480536B2 (en) Document processing device and program
JP3620299B2 (en) Document filing device and document filing method
JPH04348475A (en) Method and device for retrieving image information
JPH06259594A (en) Method an device for processing optical read data
JPH08329186A (en) Document reader
JPH11224307A (en) Device and method for recognizing document

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080511

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090511

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100511

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees