JPS6364314B2 - - Google Patents

Info

Publication number
JPS6364314B2
JPS6364314B2 JP15687579A JP15687579A JPS6364314B2 JP S6364314 B2 JPS6364314 B2 JP S6364314B2 JP 15687579 A JP15687579 A JP 15687579A JP 15687579 A JP15687579 A JP 15687579A JP S6364314 B2 JPS6364314 B2 JP S6364314B2
Authority
JP
Japan
Prior art keywords
character
signal
pattern
reading
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP15687579A
Other languages
Japanese (ja)
Other versions
JPS5680462A (en
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP15687579A priority Critical patent/JPS5680462A/en
Publication of JPS5680462A publication Critical patent/JPS5680462A/en
Publication of JPS6364314B2 publication Critical patent/JPS6364314B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は、漢字OCR(光学文字読み取り)装置
により原稿から文字を読取り、それを認識・記憶
し、そのデータを電算写植機へ与え、それから印
刷用版下を作成するようにした印刷漢字OCR装
置に関する。
[Detailed Description of the Invention] The present invention reads characters from a manuscript using a kanji OCR (optical character reading) device, recognizes and stores the characters, provides the data to a computer typesetting machine, and then creates a printing block. Regarding the printing kanji OCR device.

従来、この種装置において電算写植を行なう際
には、漢字データの入力は、人為的な手操作に依
存していたが、この方法は入力が人間によるもの
で、多大の労力を要し、技能習得による能率の向
上にも限界があつた。
Conventionally, when performing computerized typesetting on this type of device, the input of kanji data has relied on manual operations, but this method requires a great deal of effort and skill. There were limits to the improvement in efficiency through learning.

ここにおいて、本発明は、これらの人為的入力
手段の隘路を解決すべくなされたもので、原稿読
取りの入力から印刷用版下への出力まで、自動的
に行なわれる装置を提供することをその目的とす
る。
The present invention has been made in order to solve the bottlenecks of these artificial input means, and its purpose is to provide a device that automatically performs everything from the input of reading a manuscript to the output of a printing plate. purpose.

第1図は、本発明の一実施例のブロツク図であ
る。
FIG. 1 is a block diagram of one embodiment of the present invention.

9は印刷漢字OCR装置を表わし、1は読み取
られる前の原稿、2は読み取り後の原稿、3は
CRTデイスプレイとキーボード、4はタブレツ
トカーソル、5は機構走査部、6は前処理・認識
部、7はコア・メモリー、8は制御装置を示す。
9 represents the printed kanji OCR device, 1 is the original before being read, 2 is the original after being read, 3 is the original
A CRT display and a keyboard, 4 a tablet cursor, 5 a mechanical scanning section, 6 a preprocessing/recognition section, 7 a core memory, and 8 a control device.

そして、10は記憶された文字コード、11は
記憶された文字の大きさ位置のデータ、12は編
集機、13は磁気テープ、14はフオントメモ
リ、15は演算装置(CPU)、16はページメモ
リ、100はレーザビームプリンタ、17はゲ
ラ、18は版下、19は割付原稿供給システムで
ある。
10 is the stored character code, 11 is the stored character size and position data, 12 is the editing machine, 13 is the magnetic tape, 14 is the font memory, 15 is the arithmetic unit (CPU), and 16 is the page memory. , 100 is a laser beam printer, 17 is a galley, 18 is a printing plate, and 19 is a layout document supply system.

印刷漢字OCR装置9はオペレータによつて供
給された文書・原稿1中の任意の部分を読み取
り、結果を磁気テープ等の記憶媒体を介して出力
するものである。
The printed kanji OCR device 9 reads any part of the document/original 1 supplied by the operator and outputs the result via a storage medium such as a magnetic tape.

それは主たる部材の機構走査部5、前処理認識
部6、辞書パターン・メモリ7、制御装8とから
構成されている。
It is composed of a mechanism scanning section 5, a preprocessing recognition section 6, a dictionary pattern memory 7, and a control device 8 as main members.

機構走査部5には、対話によつて文書中の任意
の部分を読取領域として指定する(フオーマツト
指定)ためのCRTデイスプレイとキーボード3、
および座標入力用のタブレツトとカーソル4が付
随している。
The mechanical scanning unit 5 includes a CRT display and a keyboard 3 for specifying an arbitrary part of a document as a reading area through dialogue (format specification);
A tablet and cursor 4 for inputting coordinates are also attached.

読取用紙・原稿1の搬送部は40Kg連量以上の厚
さの原稿1を読取台に真空吸着した状態で読取ヘ
ツドの下に搬送する。紙送りのピツチは50μmを
単位として制御装置8からの指定により自由に変
えることができる。
The reading paper/original 1 transport section transports the original 1 with a thickness of 40 kg or more under the reading head while vacuum suctioning it to the reading table. The paper feed pitch can be freely changed in units of 50 μm according to instructions from the control device 8.

走査・光電変換部はCCD(charge coupled
device・電荷結合装置)自己走査型素子をラン
プ、光学系と共に組込んだ読取ヘツドを30cm/秒
の速度でサーボモータにより定速駆動し、行方向
に走査・光電変換を行なう。この部分は60μmの
解像度を有し、9ポイント活字を縦横45点でサン
プリングすることができる。文字行の傾きは±3゜
まで許容され、走査範囲は20cm/行である。
The scanning/photoelectric conversion section is a CCD (charge coupled
(charge-coupled device) A reading head incorporating a self-scanning element together with a lamp and an optical system is driven at a constant speed of 30 cm/sec by a servo motor to perform scanning and photoelectric conversion in the row direction. This part has a resolution of 60 μm and can sample 9-point type at 45 points horizontally and vertically. The inclination of character lines is allowed up to ±3°, and the scanning range is 20 cm/line.

前処理・認識部6のうちその第1の前処理部
(検出切出し、標本化)では1行中の文字位置を
予測し、字並びの不整を検出し修正する検出初出
し方式を用いて、一行中の文字を切出したのち標
本化操作を行なう。その第2の候補文字選択パラ
メータ抽出部では検出切出しした文字パターンか
ら複雑指数を計算し、標本化パターンから四辺コ
ードの抽出を行なう。その第3の候補文字リスト
作成部ではこれら2つのパラメータをキーとして
専用ハードウエアにより全認識対象文字の中から
入力パターンの候補文字の選択を高速に行なう。
その第3の類似度計算部では2000字種の辞書パタ
ーンの中から候補文字リストで与えられた文字に
対して、複合類似度もしくは混合類似度の計算を
行なう。なお、その第4として候補文字リスト作
成部がある。辞書パターン・メモリのコア・メモ
リ7は1メガバイトのコア・メモリーである。こ
の部分に記憶する辞書パターンの構成プログラム
により自由に選択・組替えができ、複数字体の混
在も可能である。
The first preprocessing part (detection cutting, sampling) of the preprocessing/recognition part 6 uses a detection first appearance method to predict the character position in one line, detect and correct irregularities in character arrangement, After cutting out the characters in one line, a sampling operation is performed. The second candidate character selection parameter extraction section calculates a complexity index from the detected and extracted character pattern, and extracts a four-sided code from the sampled pattern. The third candidate character list creation section uses these two parameters as keys and uses dedicated hardware to quickly select candidate characters for the input pattern from among all characters to be recognized.
The third similarity calculating section calculates the composite similarity or mixed similarity for the characters given in the candidate character list from among the 2000 character dictionary patterns. Note that the fourth part is a candidate character list creation section. The core memory 7 of the dictionary pattern memory is 1 megabyte of core memory. Dictionary patterns can be freely selected and rearranged by the configuration program stored in this part, and a plurality of fonts can be mixed.

制御装置8はハードウエア各部をパイプライン
で動作させ、類似度値から読取結果を定めて磁気
テープに出力するが、文字認識速度は100字/秒
である。読取拒否文字に対しては走査パターンと
類似度の高い順に第1位から第5位までの文字を
CRTデイスプレイに表示する。対話によりオペ
レーターからの音訓入力を受取り、答文字の修正
を行なうことができる。
The control device 8 operates each part of the hardware in a pipeline, determines the reading result from the similarity value, and outputs it to the magnetic tape, and the character recognition speed is 100 characters/second. For characters that cannot be read, the first to fifth characters are selected in order of similarity to the scanning pattern.
Display on CRT display. Through dialogue, you can receive phonetic input from the operator and modify the answer letters.

このようにして、制御装置8において、テープ
10に穿孔された文字コードは、別置の割付原稿
供給システム19からのテープ11に穿孔された
所謂「割付情報」である文字の大きさ・位置・上
下左右の余白・横組み縦組みの組み方・行間の間
隔・文字と文字の間隔・段数等のレイアウトに係
る各種データとともに編集機12に入力され、こ
れら入力データに基づいて編集機12は原稿で与
えられた所望の文章を編集する。なお、テープ1
0,11は種々の記録手段たとえばフロツピーデ
イスク(商品名)その他でもよい。
In this way, in the control device 8, the character code punched on the tape 10 is determined by the size, position, It is input to the editing machine 12 along with various data related to the layout, such as top, bottom, left and right margins, horizontal and vertical composition, spacing between lines, spacing between characters, number of columns, etc. Based on these input data, the editing machine 12 edits the manuscript. Edit the given desired text. In addition, tape 1
0 and 11 may be various recording means such as floppy disk (trade name) and others.

しかして、編集機12で編集された文章は一旦
記憶装置としての磁気テープ13に記憶され、こ
の記憶データは明朝体、ゴシツク体等の文字体か
ら構成されているフオントメモリ14のデータと
共に演算装置(CPU)15に入力される。
The text edited by the editing machine 12 is temporarily stored on a magnetic tape 13 as a storage device, and this stored data is calculated together with data in a font memory 14 made up of fonts such as Mincho and Gothic fonts. It is input to the device (CPU) 15.

この演算装置15は指定入力された文字の大き
さ、位置及び文字体に従つて1頁分の文章の大き
さ、位置等を演算して形成し、これを順次ページ
メモリ16に記憶させる。
This arithmetic unit 15 calculates and forms the size, position, etc. of one page of text according to the size, position, and font of the specified input characters, and sequentially stores this in the page memory 16.

かくして、ページメモリ16に記憶された各1
頁分の文章データはレーザビームプリンタ100に
与えられ、ここで普通紙に印刷されて先ず校正用
のゲラ17が作成される。オペレータ等はこのゲ
ラ17を見て文字の大きさ、位置等にミスがない
かをチエツクし、誤字や脱字がある場合にはテー
プ10を修正し、文字の大きさや位置にミスがあ
る場合にはテープ11を修正して文章を校正す
る。こうして、印刷されたゲラ17にミスがなく
なれば次に版下18を作成し、この版下18を印
刷工程に送付する。
Thus, each one stored in the page memory 16
The page worth of text data is given to a laser beam printer 100, where it is printed on plain paper to first create a galley 17 for proofreading. The operator, etc., looks at this galley 17 and checks if there are any mistakes in the size or position of the characters, and if there are any typos or omissions, corrects the tape 10, and if there is a mistake in the size or position of the characters, corrects tape 11 and proofreads the text. In this way, once the printed galley 17 is free of mistakes, a block copy 18 is created next, and this block copy 18 is sent to the printing process.

ここで、レーザビームプリンタ100の構成例を
第2図に示して説明すると、レーザ光源101か
らのレーザビーム102は光偏光器103及び回
転鏡104を介して感光ドラム105に与えら
れ、帯電部106で帯電された感光ドラム105
がその走査に従つて感光される。
Here, an example of the configuration of the laser beam printer 100 will be described with reference to FIG. A photosensitive drum 105 charged with
is exposed according to the scanning.

しかして、感光された感光ドラム105は現像
部107を通つて転写用帯電器108位置に達
し、ここでホツパ109から送られて来る転写紙
(普通紙)110に転写され、定着部111で定
着された後にパワースタツカ112に保留される
ようになつている。
The exposed photosensitive drum 105 passes through the developing section 107 and reaches the position of the transfer charger 108, where it is transferred onto transfer paper (plain paper) 110 fed from the hopper 109, and fixed at the fixing section 111. After the power is stored, the power is stored in the power stacker 112.

なお、転写用帯電器108位置で転写紙110
に転写された後の感光ドラム105は除電部11
3で除電され、クリーニング部114で清掃され
て帯電部106に送られるようになつている。
Note that the transfer paper 110 is placed at the transfer charger 108 position.
The photosensitive drum 105 after being transferred to the static eliminating section 11
3, the charge is removed by a cleaning unit 114, and the battery is sent to a charging unit 106.

かくして、ページメモリ16からのデータに基
づいて光偏光器103及び回転鏡104を制御す
れば、ページメモリ16に記憶された文章が転写
紙110上に転写され、これがゲラ17又は版下
18として得られるのである。
Thus, by controlling the light polarizer 103 and the rotating mirror 104 based on the data from the page memory 16, the text stored in the page memory 16 is transferred onto the transfer paper 110, and this is obtained as a galley 17 or a block copy 18. It will be done.

以上のように、本発明によれば、印刷漢字原
稿・活字タイプ原稿・活字清刷版下等を光学的に
読み取る部位にセツトすれば、漢字列から一字を
切り出し、OCRで認識し、その漢字を記録し、
このデータにより電算写植機に負荷することによ
り、普通紙で出力され費用が低廉となり、出力紙
の現象工程が不要になるために作業の効率が向上
するとともに、作業ミスの防止を図ることができ
る。
As described above, according to the present invention, if a printed kanji manuscript, a typeface type manuscript, a typeface clearing plate, etc. is placed in an optical reading area, one character is cut out from a kanji string, recognized by OCR, and then read. record kanji,
By loading this data onto a computer phototypesetting machine, it is possible to output on plain paper, reducing costs, and eliminating the need for the printing process, which improves work efficiency and prevents work errors. .

なお、OCRの出力と電算写植機の入力修正に
テープ10,11を用いているが、カードその他
の手段によることも可能であり、記憶装置として
ICメモリその他を用いることも可能であつて、
印刷漢字OCR装置9の回路構成も第1図の手段
に限るものではない。
Although tapes 10 and 11 are used for OCR output and computer phototypesetting input correction, it is also possible to use cards or other means, and they can also be used as storage devices.
It is also possible to use IC memory and other
The circuit configuration of the printed kanji OCR device 9 is not limited to the means shown in FIG.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例のブロツク図、第2
図はそのレーザプリンタの構成を示す説明図であ
る。 1,2……原稿、3……CRTデイスプレイと
キーボード、4……タブレツトカーソル、5……
機構走査部、6……前処理・認識部、7……辞書
パターン・メモリ(コア・メモリー)、8……制
御装置、9……印刷漢字OCR装置、10,11
……テープ、12……編集機、13……磁気テー
プ、14……フオントメモリ、15……演算装置
(CPU)、16……ページメモリ、17……ゲラ、
18……版下、19……割付原稿供給システム、
100……レーザビームプリンタ。
FIG. 1 is a block diagram of one embodiment of the present invention, and FIG.
The figure is an explanatory diagram showing the configuration of the laser printer. 1, 2...Manuscript, 3...CRT display and keyboard, 4...Tablet cursor, 5...
Mechanism scanning unit, 6... Preprocessing/recognition unit, 7... Dictionary pattern memory (core memory), 8... Control device, 9... Printed Kanji OCR device, 10, 11
...tape, 12 ... editing machine, 13 ... magnetic tape, 14 ... font memory, 15 ... arithmetic unit (CPU), 16 ... page memory, 17 ... galley,
18... Version copy, 19... Layout manuscript supply system,
100...Laser beam printer.

Claims (1)

【特許請求の範囲】 1 対話によつて文書中の任意の部分を読取領域
として指定するCRTデイスプレイとキーボード
ならびに座標入力用のタブレツトとカーソルを設
け、 読取用紙の原稿を読取台に真空吸着させて逐次
自由に搬送し、電荷結合装置の自己走査型素子か
らなる読取ヘツドで原稿の表面を走査して光電変
換し、二値化パターン信号aを送出する機構走査
部をそなえ、 二値化パターン信号aを導入し1行中の文字位
置を予測し字並びの不整を修正し、1行中の文字
を切出し後標本化を行ない、検出切出しした文字
パターンから複雑指数を計算し、標本化パターン
から四辺コードの抽出を行なうとともに、それら
2つのパラメータより全認識対象文字の中から入
力パターンの候補文字の選択を行ない、候補文字
信号bと辞書パターン信号cと類似度信号dを送
出する前処理・認識部を持ち、 候補文字名信号dならびに辞書パターン信号c
を受け入れて辞書パターンを記憶し、さらに記憶
した辞書パターン信号cを前処理・認識部へ送出
するメモリを有し、 各部を動作させ類似度信号dから読取結果を定
めて磁気記録媒体へ出力する制御装置から形成さ
れた光学的に文字を読みとる漢字OCR装置と、 その漢字OCR装置により認識された漢字デー
タを磁気記録媒体に記録する装置と、 この記憶された所定の文字を指定する文字コー
ド及び文字の大きさデータ並びに位置データを入
力して文章を編集する編集機と、 その編集機の出力を一時的に記憶する記憶装置
と、 その演算装置の出力から1頁毎の印刷データを
記憶して出力するページメモリと、 このページメモリの出力によつて普通紙に印刷
するレーザービームプリンタと を具えたことを特徴とする印刷用版下を作成する
印刷漢字OCR装置。
[Claims] 1. A CRT display and keyboard for specifying any part of a document as a reading area through dialogue, as well as a tablet and a cursor for inputting coordinates are provided, and the document on the reading paper is vacuum-adsorbed on the reading stand. It is equipped with a mechanical scanning section that sequentially freely conveys the document, scans the surface of the document with a reading head consisting of a self-scanning element of a charge-coupled device, performs photoelectric conversion, and sends out a binary pattern signal a. a is introduced to predict the character position in one line, correct the irregular character arrangement, extract the characters in one line, perform sampling, calculate the complexity index from the detected extracted character pattern, and calculate the complexity index from the sampled pattern. In addition to extracting the four-sided code, a candidate character for the input pattern is selected from among all recognition target characters based on these two parameters, and a candidate character signal b, a dictionary pattern signal c, and a similarity signal d are sent out. It has a recognition unit and receives a candidate character name signal d and a dictionary pattern signal c.
It has a memory that accepts the dictionary pattern and stores the dictionary pattern, and further sends the stored dictionary pattern signal c to the preprocessing/recognition section, and operates each section to determine the reading result from the similarity signal d and output it to the magnetic recording medium. A kanji OCR device that optically reads characters formed by a control device, a device that records kanji data recognized by the kanji OCR device on a magnetic recording medium, and a character code and code that designate the stored predetermined characters. An editing machine that edits text by inputting character size and position data, a storage device that temporarily stores the output of the editing machine, and a storage device that stores print data for each page from the output of the arithmetic device. 1. A printing kanji OCR device for creating printing blocks, characterized by comprising a page memory for outputting the page memory, and a laser beam printer for printing on plain paper by the output of the page memory.
JP15687579A 1979-12-05 1979-12-05 Printed chinese character ocr device for making printing plate Granted JPS5680462A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15687579A JPS5680462A (en) 1979-12-05 1979-12-05 Printed chinese character ocr device for making printing plate

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15687579A JPS5680462A (en) 1979-12-05 1979-12-05 Printed chinese character ocr device for making printing plate

Publications (2)

Publication Number Publication Date
JPS5680462A JPS5680462A (en) 1981-07-01
JPS6364314B2 true JPS6364314B2 (en) 1988-12-12

Family

ID=15637292

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15687579A Granted JPS5680462A (en) 1979-12-05 1979-12-05 Printed chinese character ocr device for making printing plate

Country Status (1)

Country Link
JP (1) JPS5680462A (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5171026A (en) * 1974-11-11 1976-06-19 Ibm

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5171026A (en) * 1974-11-11 1976-06-19 Ibm

Also Published As

Publication number Publication date
JPS5680462A (en) 1981-07-01

Similar Documents

Publication Publication Date Title
US5133024A (en) Image data bank system with selective conversion
JPH04311275A (en) Picture forming device
JPH0221024B2 (en)
JPS6118033A (en) Print processor
JPS6364314B2 (en)
JPS59146332A (en) Form reading and printing program generating method using form design system
JPH1058819A (en) Braille printing device
JPH08127152A (en) Printer and translation printing method thereof
JPS5971528A (en) Original forming machine
JP2682873B2 (en) Recognition device for tabular documents
JPH07262317A (en) Document processor
Luna Books and Bits: Texts and Technology since 1970
JPS6246902B2 (en)
JPH0451871B2 (en)
Bechard Trends In Design Concepts For Direct Exposure Platemaking
JPH0584187B2 (en)
JPS63309956A (en) Phototype setting system
JPH08185394A (en) Document information processor
JP3028630B2 (en) Computer typesetting printer
JPS6360493A (en) Document processor
Buckler Utilizing A Laser-Based Composition System For Management Training And Research In The United Kingdom
JPH0156910B2 (en)
JPH0353665B2 (en)
Holder Computer Systems for Technical Publishing
JPH01173153A (en) Magazine editing system