JPS638988A - Character reader - Google Patents
Character readerInfo
- Publication number
- JPS638988A JPS638988A JP61153232A JP15323286A JPS638988A JP S638988 A JPS638988 A JP S638988A JP 61153232 A JP61153232 A JP 61153232A JP 15323286 A JP15323286 A JP 15323286A JP S638988 A JPS638988 A JP S638988A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character line
- image
- slip
- detecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 claims description 16
- 238000010586 diagram Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Abstract
Description
【発明の詳細な説明】
[発明の目的]
(産業上の利用分野)
本発明は、特に書籍、雑誌及び新聞等の紙面から文字を
読取る際に好適する文字読取装置に関する。DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] (Industrial Application Field) The present invention relates to a character reading device particularly suitable for reading characters from pages such as books, magazines, and newspapers.
(従来の技術)
従来から、各種事務処理分野において光学的文字読取装
置が広く用いられているが、近年、ジャーナリズムの分
野にも普及しつつある。(Prior Art) Optical character reading devices have been widely used in various office processing fields, but in recent years they have also become popular in the field of journalism.
この分野では、読取らせたい対象が書籍、雑誌および新
聞等の紙面のように文字や写真等が多様にレイアウトさ
れている帳票である場合が多く、従来の文字読取装置で
は対応できない場合が多い。In this field, the objects to be read are often forms with various layouts of text and photographs, such as the pages of books, magazines, and newspapers, and are often not compatible with conventional text reading devices. .
一般的な文字読取装置では帳票の読取りを行なう場合、
たとえば第3図(A>に示したように、文字行が存在す
る位置をフォーマット情報として、予め指定しておく必
要がある。When reading a form with a general character reading device,
For example, as shown in FIG. 3 (A>), it is necessary to specify in advance the position where a character line exists as format information.
この場合、文字行の位置は、帳票の端部から11の位置
、L2の位置、・・・というような絶対的な位置情報で
示す場合が多い。In this case, the position of the character line is often indicated by absolute positional information such as position 11 from the edge of the form, position L2, and so on.
近年、帳票上の文字行を自動釣に検出し、連続して読取
りを実行することができる文字読取装置が開発されてい
るが、この文字読取装置により、第3図(B)に示した
ような文字行を持つ帳票(端部からLlおよびLlの位
置に文字行が存在する)と、第3図(C)に示したよう
な文字行を持つ帳票(端部からLlおよびL3の位置に
文字行を持つ)との読取りを行なった場合、両帳票の各
文字行に同じ文章が書かれていると、読取結果が全く同
じになる。In recent years, character reading devices have been developed that can automatically detect character lines on a form and read them continuously. There are two types of forms with character lines (character lines exist at positions Ll and Ll from the end) and a form with character lines as shown in Figure 3 (C) (character lines exist at positions Ll and L3 from the end). If the same text is written in each character line of both forms, the reading results will be exactly the same.
すなわち従来の自動文字行検出型の文字読取装置では、
文字自体の読取り結果のみが得られ、そのフォーマット
に関する情報は得られない。このため、後に特定の文字
行が帳票上のいかなる位置に存在していたのかを知るこ
とは不可能であった。In other words, in conventional automatic character line detection type character reading devices,
Only the results of reading the characters themselves are obtained; no information about their format is obtained. For this reason, it was impossible to later know where a particular character line was located on the form.
しかしながら書籍、雑誌および新聞等の読取りを行なう
場合には、再版等の事情で後にフォーマット情報が必要
になる可能性が高いため、従来の文字読取装置を用いる
と、紙面上のフォーマットに関する情報を他の手段で別
個に検出および記録しなければならないという問題があ
った。However, when reading books, magazines, newspapers, etc., there is a high possibility that format information will be needed later for reasons such as reprinting, so if you use a conventional character reading device, it is necessary to read information about the format on the paper. There was a problem in that it had to be detected and recorded separately by means of
(発明が解決しようとする問題点)
本発明は上述したような事情により成されたもので、文
字の認識は勿論、読取った帳票のフォーマットをも自動
的に検出することができ、書籍、雑誌および新聞等の読
取りを行なう際に特に有効となる文字読取装置の提供を
目的としている。(Problems to be Solved by the Invention) The present invention has been made in view of the above-mentioned circumstances, and is capable of automatically detecting not only characters but also the format of read forms. The present invention also aims to provide a character reading device that is particularly effective when reading newspapers and the like.
[発明の構成]
(問題点を解決するための手段)
本発明の文字読取装置は、帳票のイメージを格納するイ
メージ格納手段と、前記イメージから濃度値ヒストグラ
ムを得て各文字行の存在を検出する文字行検出手段と、
前記濃度値ヒストグラムから前記帳票上における各文字
行位置を検出する文字行位置検出手段と、検出した文字
行の各文字を認識する文字認識手段とを備え、各文字の
認識結果と文字行位置を示す情報とを共に出力するよう
に構成されている。[Structure of the Invention] (Means for Solving the Problems) The character reading device of the present invention includes an image storage means for storing an image of a form, and detects the presence of each character line by obtaining a density value histogram from the image. a character line detection means for
A character line position detecting means for detecting the position of each character line on the form from the density value histogram, and a character recognition means for recognizing each character in the detected character line. The configuration is such that the information shown is output together with the information shown.
(作 用)
本発明の文字読取装置は、濃度値ヒストグラムから各文
字行の存在を検出して各文字の認識を行なうのみならず
、帳票上における各文字行の位置を検出して出力するの
で、磁気ディスク装置等に認識結果とともに位置情報を
記録しておけば、後に帳票のフォーマットを容易に知る
ことができる。(Function) The character reading device of the present invention not only detects the presence of each character line from the density value histogram and recognizes each character, but also detects and outputs the position of each character line on a form. If the position information is recorded together with the recognition result in a magnetic disk device or the like, the format of the form can be easily known later.
(実施例) 以下、本発明の実施例の詳細を図面に基づい説明する。(Example) Hereinafter, details of embodiments of the present invention will be described based on the drawings.
第1図は本発明の一実施例装置の構成を示すブロック図
である。FIG. 1 is a block diagram showing the configuration of an apparatus according to an embodiment of the present invention.
同図において1は読取るべき帳票を光学的に走査してイ
メージ信号を出力する光電変換部、2は1ペ一ジ分のイ
メージを暫定的に格納するページバッファ、3はページ
バッファ2をX方向およびY方向に走査して、X方向お
よびY方向の濃度値ヒストグラムを求め、各文字行およ
び各文字の存在を検出し、切出しを行なう検出切出し部
、4は前記濃度値ヒストグラムから各文字行の存在位置
を、たとえば帳票の端部から何センチという概念で検出
する文字行検出部、6は各部の制御を司る制御部、7は
ホストシステムとのデータの入出力を司るインターフェ
イス部である。In the figure, 1 is a photoelectric conversion unit that optically scans the form to be read and outputs an image signal, 2 is a page buffer that temporarily stores the image of one page, and 3 is the page buffer 2 in the X direction. and a detection/cutting unit that scans in the density value histogram to obtain density value histograms in the X and Y directions, detects the presence of each character line and each character, and performs cutting; A character line detection section detects the existing position, for example, in terms of how many centimeters from the edge of the form, a control section 6 controls each section, and an interface section 7 controls data input/output with the host system.
そして第2図は前記検出切出し部3および文字行検出部
4の機能を示す図である。FIG. 2 is a diagram showing the functions of the detection cutout section 3 and the character line detection section 4.
検出切出し部3は、ページバッファ2に格納されたイメ
ージSをX方向およびY方向に走査して、X方向よびY
方向の1走査ラインごとの黒ドツト数の累計を求め、濃
度値ヒストグラムHを得る。The detection cutting unit 3 scans the image S stored in the page buffer 2 in the X direction and the Y direction, and
The total number of black dots per scanning line in the direction is calculated to obtain a density value histogram H.
なお第2図においてY方向の濃度値ヒストグラムは省略
されている。そしてこの濃度値ヒストグラムHから文字
行の存在を検出する。このとき文字行検出部4は、前記
濃度値ヒストグラムHにおいて文字行が存在すると判断
された箇所(ピーク位置)の、原点(Olo)からの距
離をカウントし、各文字行が帳票の端部からどの位の距
離に位置しているかを検出する。Note that the density value histogram in the Y direction is omitted in FIG. The presence of a character line is then detected from this density value histogram H. At this time, the character line detection unit 4 counts the distance from the origin (Olo) of the location (peak position) where it is determined that a character line exists in the density value histogram H, and determines whether each character line is from the edge of the form. Detect how far away you are located.
すなわち本実施例装置では、光電変換部1から帳票のイ
メージが入力され、1ペ一ジ分の文字イメージがページ
バッファに入力されると、検出切出し部3が1ペ一ジ分
の文字イメージの濃度値ヒストグラムを求め、文字行の
存在を検出し、文字行検出部4が各文字行の帳票の端部
からの距離(絶対的な距離)を検出する。そして文字認
識部5が文字イメージの認識処理を実行する。この認識
処理が修了したら、インターフェイス部7を介して認識
結果および各文字行の位置情報がホストシステムに出力
され、磁気ディスク装置等に順次記憶される。That is, in the device of this embodiment, when an image of a form is input from the photoelectric conversion unit 1 and character images for one page are input to the page buffer, the detection cutting unit 3 converts the character image for one page. A density value histogram is obtained, the presence of a character line is detected, and a character line detecting section 4 detects the distance (absolute distance) of each character line from the edge of the form. The character recognition unit 5 then executes character image recognition processing. When this recognition process is completed, the recognition result and the position information of each character line are output to the host system via the interface section 7 and are sequentially stored in a magnetic disk device or the like.
なお本実施例において、一旦記録された各文字行の位置
を示す情報は、ホストシステム側の指定により、たとえ
ばインチ、センチまたはミリメートル単位等、目的に即
した形に変換して出力するようにする。In this embodiment, the information indicating the position of each character line once recorded is converted to a format suitable for the purpose, such as inches, centimeters, or millimeters, according to the specifications of the host system, and then output. .
かくして本実施例の文字読取装置は、各文字の認識結果
とともに各文字行の存在位置を示すデータを出力するの
で、特に書籍、雑誌および新聞等、多様なレイアウトの
ものが存在する紙面を読取らせる場合に特に有効であり
、たとえば再版用のデータベース等を比較的容易に構築
することができる。In this way, the character reading device of this embodiment outputs data indicating the position of each character line along with the recognition result of each character, so it is particularly useful for reading pages with various layouts such as books, magazines, and newspapers. This is particularly effective when printing, for example, reprint databases, etc., which can be constructed relatively easily.
なお上述した実施例装置では、文字行の存在位置を帳票
の端部からの距離、すなわち絶対位置として検出してい
るが、各文字行の間の距離、すなわち相対位置として検
出することも考えられる。Note that in the above-described embodiment device, the position of the character line is detected as the distance from the edge of the form, that is, the absolute position, but it is also possible to detect the position as the distance between each character line, that is, as the relative position. .
また上述した実施例装置では、帳票のイメージがページ
バッファ2に格納されるようにしているが、文字行の位
置をカウントする手段を設けておけば帳票のイメージは
ラインバッファに格納されるようにしてもよい。Furthermore, in the above-described embodiment, the image of the form is stored in the page buffer 2, but if a means for counting the position of character lines is provided, the image of the form can be stored in the line buffer. You can.
[発明の効果]
以上説明したように本発明の文字読取装置は、各文字の
認識結果のみならず、各文字行の存在位置を示す情報も
出力するので、特に書籍、雑誌および新聞の紙面等、多
様なレイアウトのものが存在する読取り等を行なう場合
、後に各紙面のフォーマット情報を容易に知ることがで
き、極めて有効である。[Effects of the Invention] As explained above, the character reading device of the present invention outputs not only the recognition result of each character but also the information indicating the position of each character line. This is extremely effective when performing reading, etc. where there are various layouts, since the format information of each page can be easily known later.
第1図は本発明の一実施例装置の構成を示すブロック図
、第2図は同実施例装置にあける検出切出し部および文
字行検出部の機能を示す図、第3図(A)〜(C)は、
従来の文字読取装置の読取り対象としての帳票における
文字行のレイアウトについて説明する図である。
1・・・・・・・・・光電変換部
2・・・・・・・・・ページバッファ
3・・・・・・・・・検出切出し部
4・・・・・・・・・文字行検出部
5・・・・・・・・・文字認識部
6・・・・・・・・・制御部
7・・・・・・・・・インターフェイス部出願人
株式会社 東芝
代理人 弁理士 須 山 佐 −
第1図FIG. 1 is a block diagram showing the configuration of a device according to an embodiment of the present invention, FIG. 2 is a diagram showing the functions of a detection cutout section and a character line detection section provided in the same embodiment device, and FIGS. C) is
FIG. 2 is a diagram illustrating the layout of character lines in a form that is to be read by a conventional character reading device. 1...Photoelectric conversion unit 2...Page buffer 3...Detection cutting unit 4...Character line Detection unit 5...Character recognition unit 6...Control unit 7...Interface unit Applicant
Toshiba Corporation Representative Patent Attorney Sasa Suyama - Figure 1
Claims (2)
前記イメージから濃度値ヒストグラムを得て各文字行の
存在を検出する文字行検出手段と、前記濃度値ヒストグ
ラムから前記帳票上における各文字行位置を検出する文
字行位置検出手段と、検出した文字行の各文字を認識す
る文字認識手段とを備え、各文字の認識結果と文字行位
置を示す情報とを共に出力するように構成されているこ
とを特徴とする文字読取装置。(1) image storage means for storing an image of a form;
character line detection means for detecting the presence of each character line by obtaining a density value histogram from the image; character line position detection means for detecting the position of each character line on the form from the density value histogram; 1. A character reading device comprising: character recognition means for recognizing each character, and configured to output both a recognition result of each character and information indicating a character line position.
の絶対的な位置を検出するように構成されている特許請
求の範囲第1項記載の文字読取装置。(2) The character reading device according to claim 1, wherein the character line position detection means is configured to detect the absolute position of each character line on a form.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61153232A JPS638988A (en) | 1986-06-30 | 1986-06-30 | Character reader |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61153232A JPS638988A (en) | 1986-06-30 | 1986-06-30 | Character reader |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS638988A true JPS638988A (en) | 1988-01-14 |
Family
ID=15557941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61153232A Pending JPS638988A (en) | 1986-06-30 | 1986-06-30 | Character reader |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS638988A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09506668A (en) * | 1994-05-24 | 1997-06-30 | アライドシグナル・インコーポレーテッド | Room temperature curable silicone compositions using phenyl-substituted tris-functional ketoxime silanes |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6054082A (en) * | 1983-09-05 | 1985-03-28 | Mitsubishi Electric Corp | Optical character reader |
-
1986
- 1986-06-30 JP JP61153232A patent/JPS638988A/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6054082A (en) * | 1983-09-05 | 1985-03-28 | Mitsubishi Electric Corp | Optical character reader |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09506668A (en) * | 1994-05-24 | 1997-06-30 | アライドシグナル・インコーポレーテッド | Room temperature curable silicone compositions using phenyl-substituted tris-functional ketoxime silanes |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5854860A (en) | Image filing apparatus having a character recognition function | |
JPS638988A (en) | Character reader | |
JPS5845743B2 (en) | information processing system | |
JPH0149998B2 (en) | ||
JPH0652236A (en) | Electronic filing device | |
JP2666931B2 (en) | Optical character reader | |
JP2590099B2 (en) | Character reading method | |
JP3954247B2 (en) | Document input method, recording medium recording document input program, and document input device | |
JP2823350B2 (en) | Multimedia input device | |
JPS5949671A (en) | Optical character reader | |
JPH0228785A (en) | Optical character reading device | |
JP2619915B2 (en) | Information processing method and apparatus | |
JPS58123169A (en) | Cut-out system of character line | |
JPH04192090A (en) | Optical character reader | |
JPH04309B2 (en) | ||
JPH0557632B2 (en) | ||
JPH02128292A (en) | Optical character reader | |
JPS58207184A (en) | Recording information recognizer | |
JPS6334680A (en) | Character reader | |
CN101303731B (en) | Method for generating printing line | |
JPH0426153B2 (en) | ||
JPS63167991A (en) | Character recognition device | |
JPH0420506B2 (en) | ||
JPH01199285A (en) | Optical character reader | |
JPS6039276A (en) | Optical character reader |