JPS638988A - Character reader - Google Patents

Character reader

Info

Publication number
JPS638988A
JPS638988A JP61153232A JP15323286A JPS638988A JP S638988 A JPS638988 A JP S638988A JP 61153232 A JP61153232 A JP 61153232A JP 15323286 A JP15323286 A JP 15323286A JP S638988 A JPS638988 A JP S638988A
Authority
JP
Japan
Prior art keywords
character
character line
image
slip
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61153232A
Other languages
Japanese (ja)
Inventor
Katsumi Yaguchi
矢口 克己
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61153232A priority Critical patent/JPS638988A/en
Publication of JPS638988A publication Critical patent/JPS638988A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To easily know the format of a slip by detecting and outputting the position of respective character rows on the slip. CONSTITUTION:The image of a slip is inputted from a photoelectric converting part 1, the character image for one page is inputted to a page buffer, and then, a detecting cutting-out part 3 obtains the concentration value histogram of the character image for one page, detects, the presence of a character row and a character row detecting part 4 detects a distance (absolute distance) from the edge part of the slip of respective character rows. A character recognizing part 5 executes the recognizing processing of a character image. When the recognizing processing is completed, the recognizing result and the position information of respective character rows are outputted through an interface part 7 to a host system and successively stored into a magnetic disk device etc.

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、特に書籍、雑誌及び新聞等の紙面から文字を
読取る際に好適する文字読取装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] (Industrial Application Field) The present invention relates to a character reading device particularly suitable for reading characters from pages such as books, magazines, and newspapers.

(従来の技術) 従来から、各種事務処理分野において光学的文字読取装
置が広く用いられているが、近年、ジャーナリズムの分
野にも普及しつつある。
(Prior Art) Optical character reading devices have been widely used in various office processing fields, but in recent years they have also become popular in the field of journalism.

この分野では、読取らせたい対象が書籍、雑誌および新
聞等の紙面のように文字や写真等が多様にレイアウトさ
れている帳票である場合が多く、従来の文字読取装置で
は対応できない場合が多い。
In this field, the objects to be read are often forms with various layouts of text and photographs, such as the pages of books, magazines, and newspapers, and are often not compatible with conventional text reading devices. .

一般的な文字読取装置では帳票の読取りを行なう場合、
たとえば第3図(A>に示したように、文字行が存在す
る位置をフォーマット情報として、予め指定しておく必
要がある。
When reading a form with a general character reading device,
For example, as shown in FIG. 3 (A>), it is necessary to specify in advance the position where a character line exists as format information.

この場合、文字行の位置は、帳票の端部から11の位置
、L2の位置、・・・というような絶対的な位置情報で
示す場合が多い。
In this case, the position of the character line is often indicated by absolute positional information such as position 11 from the edge of the form, position L2, and so on.

近年、帳票上の文字行を自動釣に検出し、連続して読取
りを実行することができる文字読取装置が開発されてい
るが、この文字読取装置により、第3図(B)に示した
ような文字行を持つ帳票(端部からLlおよびLlの位
置に文字行が存在する)と、第3図(C)に示したよう
な文字行を持つ帳票(端部からLlおよびL3の位置に
文字行を持つ)との読取りを行なった場合、両帳票の各
文字行に同じ文章が書かれていると、読取結果が全く同
じになる。
In recent years, character reading devices have been developed that can automatically detect character lines on a form and read them continuously. There are two types of forms with character lines (character lines exist at positions Ll and Ll from the end) and a form with character lines as shown in Figure 3 (C) (character lines exist at positions Ll and L3 from the end). If the same text is written in each character line of both forms, the reading results will be exactly the same.

すなわち従来の自動文字行検出型の文字読取装置では、
文字自体の読取り結果のみが得られ、そのフォーマット
に関する情報は得られない。このため、後に特定の文字
行が帳票上のいかなる位置に存在していたのかを知るこ
とは不可能であった。
In other words, in conventional automatic character line detection type character reading devices,
Only the results of reading the characters themselves are obtained; no information about their format is obtained. For this reason, it was impossible to later know where a particular character line was located on the form.

しかしながら書籍、雑誌および新聞等の読取りを行なう
場合には、再版等の事情で後にフォーマット情報が必要
になる可能性が高いため、従来の文字読取装置を用いる
と、紙面上のフォーマットに関する情報を他の手段で別
個に検出および記録しなければならないという問題があ
った。
However, when reading books, magazines, newspapers, etc., there is a high possibility that format information will be needed later for reasons such as reprinting, so if you use a conventional character reading device, it is necessary to read information about the format on the paper. There was a problem in that it had to be detected and recorded separately by means of

(発明が解決しようとする問題点) 本発明は上述したような事情により成されたもので、文
字の認識は勿論、読取った帳票のフォーマットをも自動
的に検出することができ、書籍、雑誌および新聞等の読
取りを行なう際に特に有効となる文字読取装置の提供を
目的としている。
(Problems to be Solved by the Invention) The present invention has been made in view of the above-mentioned circumstances, and is capable of automatically detecting not only characters but also the format of read forms. The present invention also aims to provide a character reading device that is particularly effective when reading newspapers and the like.

[発明の構成] (問題点を解決するための手段) 本発明の文字読取装置は、帳票のイメージを格納するイ
メージ格納手段と、前記イメージから濃度値ヒストグラ
ムを得て各文字行の存在を検出する文字行検出手段と、
前記濃度値ヒストグラムから前記帳票上における各文字
行位置を検出する文字行位置検出手段と、検出した文字
行の各文字を認識する文字認識手段とを備え、各文字の
認識結果と文字行位置を示す情報とを共に出力するよう
に構成されている。
[Structure of the Invention] (Means for Solving the Problems) The character reading device of the present invention includes an image storage means for storing an image of a form, and detects the presence of each character line by obtaining a density value histogram from the image. a character line detection means for
A character line position detecting means for detecting the position of each character line on the form from the density value histogram, and a character recognition means for recognizing each character in the detected character line. The configuration is such that the information shown is output together with the information shown.

(作 用) 本発明の文字読取装置は、濃度値ヒストグラムから各文
字行の存在を検出して各文字の認識を行なうのみならず
、帳票上における各文字行の位置を検出して出力するの
で、磁気ディスク装置等に認識結果とともに位置情報を
記録しておけば、後に帳票のフォーマットを容易に知る
ことができる。
(Function) The character reading device of the present invention not only detects the presence of each character line from the density value histogram and recognizes each character, but also detects and outputs the position of each character line on a form. If the position information is recorded together with the recognition result in a magnetic disk device or the like, the format of the form can be easily known later.

(実施例) 以下、本発明の実施例の詳細を図面に基づい説明する。(Example) Hereinafter, details of embodiments of the present invention will be described based on the drawings.

第1図は本発明の一実施例装置の構成を示すブロック図
である。
FIG. 1 is a block diagram showing the configuration of an apparatus according to an embodiment of the present invention.

同図において1は読取るべき帳票を光学的に走査してイ
メージ信号を出力する光電変換部、2は1ペ一ジ分のイ
メージを暫定的に格納するページバッファ、3はページ
バッファ2をX方向およびY方向に走査して、X方向お
よびY方向の濃度値ヒストグラムを求め、各文字行およ
び各文字の存在を検出し、切出しを行なう検出切出し部
、4は前記濃度値ヒストグラムから各文字行の存在位置
を、たとえば帳票の端部から何センチという概念で検出
する文字行検出部、6は各部の制御を司る制御部、7は
ホストシステムとのデータの入出力を司るインターフェ
イス部である。
In the figure, 1 is a photoelectric conversion unit that optically scans the form to be read and outputs an image signal, 2 is a page buffer that temporarily stores the image of one page, and 3 is the page buffer 2 in the X direction. and a detection/cutting unit that scans in the density value histogram to obtain density value histograms in the X and Y directions, detects the presence of each character line and each character, and performs cutting; A character line detection section detects the existing position, for example, in terms of how many centimeters from the edge of the form, a control section 6 controls each section, and an interface section 7 controls data input/output with the host system.

そして第2図は前記検出切出し部3および文字行検出部
4の機能を示す図である。
FIG. 2 is a diagram showing the functions of the detection cutout section 3 and the character line detection section 4.

検出切出し部3は、ページバッファ2に格納されたイメ
ージSをX方向およびY方向に走査して、X方向よびY
方向の1走査ラインごとの黒ドツト数の累計を求め、濃
度値ヒストグラムHを得る。
The detection cutting unit 3 scans the image S stored in the page buffer 2 in the X direction and the Y direction, and
The total number of black dots per scanning line in the direction is calculated to obtain a density value histogram H.

なお第2図においてY方向の濃度値ヒストグラムは省略
されている。そしてこの濃度値ヒストグラムHから文字
行の存在を検出する。このとき文字行検出部4は、前記
濃度値ヒストグラムHにおいて文字行が存在すると判断
された箇所(ピーク位置)の、原点(Olo)からの距
離をカウントし、各文字行が帳票の端部からどの位の距
離に位置しているかを検出する。
Note that the density value histogram in the Y direction is omitted in FIG. The presence of a character line is then detected from this density value histogram H. At this time, the character line detection unit 4 counts the distance from the origin (Olo) of the location (peak position) where it is determined that a character line exists in the density value histogram H, and determines whether each character line is from the edge of the form. Detect how far away you are located.

すなわち本実施例装置では、光電変換部1から帳票のイ
メージが入力され、1ペ一ジ分の文字イメージがページ
バッファに入力されると、検出切出し部3が1ペ一ジ分
の文字イメージの濃度値ヒストグラムを求め、文字行の
存在を検出し、文字行検出部4が各文字行の帳票の端部
からの距離(絶対的な距離)を検出する。そして文字認
識部5が文字イメージの認識処理を実行する。この認識
処理が修了したら、インターフェイス部7を介して認識
結果および各文字行の位置情報がホストシステムに出力
され、磁気ディスク装置等に順次記憶される。
That is, in the device of this embodiment, when an image of a form is input from the photoelectric conversion unit 1 and character images for one page are input to the page buffer, the detection cutting unit 3 converts the character image for one page. A density value histogram is obtained, the presence of a character line is detected, and a character line detecting section 4 detects the distance (absolute distance) of each character line from the edge of the form. The character recognition unit 5 then executes character image recognition processing. When this recognition process is completed, the recognition result and the position information of each character line are output to the host system via the interface section 7 and are sequentially stored in a magnetic disk device or the like.

なお本実施例において、一旦記録された各文字行の位置
を示す情報は、ホストシステム側の指定により、たとえ
ばインチ、センチまたはミリメートル単位等、目的に即
した形に変換して出力するようにする。
In this embodiment, the information indicating the position of each character line once recorded is converted to a format suitable for the purpose, such as inches, centimeters, or millimeters, according to the specifications of the host system, and then output. .

かくして本実施例の文字読取装置は、各文字の認識結果
とともに各文字行の存在位置を示すデータを出力するの
で、特に書籍、雑誌および新聞等、多様なレイアウトの
ものが存在する紙面を読取らせる場合に特に有効であり
、たとえば再版用のデータベース等を比較的容易に構築
することができる。
In this way, the character reading device of this embodiment outputs data indicating the position of each character line along with the recognition result of each character, so it is particularly useful for reading pages with various layouts such as books, magazines, and newspapers. This is particularly effective when printing, for example, reprint databases, etc., which can be constructed relatively easily.

なお上述した実施例装置では、文字行の存在位置を帳票
の端部からの距離、すなわち絶対位置として検出してい
るが、各文字行の間の距離、すなわち相対位置として検
出することも考えられる。
Note that in the above-described embodiment device, the position of the character line is detected as the distance from the edge of the form, that is, the absolute position, but it is also possible to detect the position as the distance between each character line, that is, as the relative position. .

また上述した実施例装置では、帳票のイメージがページ
バッファ2に格納されるようにしているが、文字行の位
置をカウントする手段を設けておけば帳票のイメージは
ラインバッファに格納されるようにしてもよい。
Furthermore, in the above-described embodiment, the image of the form is stored in the page buffer 2, but if a means for counting the position of character lines is provided, the image of the form can be stored in the line buffer. You can.

[発明の効果] 以上説明したように本発明の文字読取装置は、各文字の
認識結果のみならず、各文字行の存在位置を示す情報も
出力するので、特に書籍、雑誌および新聞の紙面等、多
様なレイアウトのものが存在する読取り等を行なう場合
、後に各紙面のフォーマット情報を容易に知ることがで
き、極めて有効である。
[Effects of the Invention] As explained above, the character reading device of the present invention outputs not only the recognition result of each character but also the information indicating the position of each character line. This is extremely effective when performing reading, etc. where there are various layouts, since the format information of each page can be easily known later.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例装置の構成を示すブロック図
、第2図は同実施例装置にあける検出切出し部および文
字行検出部の機能を示す図、第3図(A)〜(C)は、
従来の文字読取装置の読取り対象としての帳票における
文字行のレイアウトについて説明する図である。 1・・・・・・・・・光電変換部 2・・・・・・・・・ページバッファ 3・・・・・・・・・検出切出し部 4・・・・・・・・・文字行検出部 5・・・・・・・・・文字認識部 6・・・・・・・・・制御部 7・・・・・・・・・インターフェイス部出願人   
   株式会社 東芝 代理人 弁理士  須 山 佐 − 第1図
FIG. 1 is a block diagram showing the configuration of a device according to an embodiment of the present invention, FIG. 2 is a diagram showing the functions of a detection cutout section and a character line detection section provided in the same embodiment device, and FIGS. C) is
FIG. 2 is a diagram illustrating the layout of character lines in a form that is to be read by a conventional character reading device. 1...Photoelectric conversion unit 2...Page buffer 3...Detection cutting unit 4...Character line Detection unit 5...Character recognition unit 6...Control unit 7...Interface unit Applicant
Toshiba Corporation Representative Patent Attorney Sasa Suyama - Figure 1

Claims (2)

【特許請求の範囲】[Claims] (1)帳票のイメージを格納するイメージ格納手段と、
前記イメージから濃度値ヒストグラムを得て各文字行の
存在を検出する文字行検出手段と、前記濃度値ヒストグ
ラムから前記帳票上における各文字行位置を検出する文
字行位置検出手段と、検出した文字行の各文字を認識す
る文字認識手段とを備え、各文字の認識結果と文字行位
置を示す情報とを共に出力するように構成されているこ
とを特徴とする文字読取装置。
(1) image storage means for storing an image of a form;
character line detection means for detecting the presence of each character line by obtaining a density value histogram from the image; character line position detection means for detecting the position of each character line on the form from the density value histogram; 1. A character reading device comprising: character recognition means for recognizing each character, and configured to output both a recognition result of each character and information indicating a character line position.
(2)文字行位置検出手段が、帳票上における各文字行
の絶対的な位置を検出するように構成されている特許請
求の範囲第1項記載の文字読取装置。
(2) The character reading device according to claim 1, wherein the character line position detection means is configured to detect the absolute position of each character line on a form.
JP61153232A 1986-06-30 1986-06-30 Character reader Pending JPS638988A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61153232A JPS638988A (en) 1986-06-30 1986-06-30 Character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61153232A JPS638988A (en) 1986-06-30 1986-06-30 Character reader

Publications (1)

Publication Number Publication Date
JPS638988A true JPS638988A (en) 1988-01-14

Family

ID=15557941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61153232A Pending JPS638988A (en) 1986-06-30 1986-06-30 Character reader

Country Status (1)

Country Link
JP (1) JPS638988A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09506668A (en) * 1994-05-24 1997-06-30 アライドシグナル・インコーポレーテッド Room temperature curable silicone compositions using phenyl-substituted tris-functional ketoxime silanes

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6054082A (en) * 1983-09-05 1985-03-28 Mitsubishi Electric Corp Optical character reader

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6054082A (en) * 1983-09-05 1985-03-28 Mitsubishi Electric Corp Optical character reader

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09506668A (en) * 1994-05-24 1997-06-30 アライドシグナル・インコーポレーテッド Room temperature curable silicone compositions using phenyl-substituted tris-functional ketoxime silanes

Similar Documents

Publication Publication Date Title
US5854860A (en) Image filing apparatus having a character recognition function
JPS638988A (en) Character reader
JPS5845743B2 (en) information processing system
JPH0149998B2 (en)
JPH0652236A (en) Electronic filing device
JP2666931B2 (en) Optical character reader
JP2590099B2 (en) Character reading method
JP3954247B2 (en) Document input method, recording medium recording document input program, and document input device
JP2823350B2 (en) Multimedia input device
JPS5949671A (en) Optical character reader
JPH0228785A (en) Optical character reading device
JP2619915B2 (en) Information processing method and apparatus
JPS58123169A (en) Cut-out system of character line
JPH04192090A (en) Optical character reader
JPH04309B2 (en)
JPH0557632B2 (en)
JPH02128292A (en) Optical character reader
JPS58207184A (en) Recording information recognizer
JPS6334680A (en) Character reader
CN101303731B (en) Method for generating printing line
JPH0426153B2 (en)
JPS63167991A (en) Character recognition device
JPH0420506B2 (en)
JPH01199285A (en) Optical character reader
JPS6039276A (en) Optical character reader