JPH03268084A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH03268084A
JPH03268084A JP2066821A JP6682190A JPH03268084A JP H03268084 A JPH03268084 A JP H03268084A JP 2066821 A JP2066821 A JP 2066821A JP 6682190 A JP6682190 A JP 6682190A JP H03268084 A JPH03268084 A JP H03268084A
Authority
JP
Japan
Prior art keywords
document
read
layout
layout information
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2066821A
Other languages
Japanese (ja)
Inventor
Koichi Sekiguchi
関口 康一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2066821A priority Critical patent/JPH03268084A/en
Publication of JPH03268084A publication Critical patent/JPH03268084A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To read an undefined document with high accuracy by outputting the read undefined document after laying out in a prescribed format. CONSTITUTION:A control part 1 is provided together with a scanner part 2, a recognizing part 3, a recognizing result store part 4, a layout processing part 5, a key word dictionary part 6, a layout information store part 7, a CRT 8, a key input part 9, and a printer 10. Then a key word necessary for layout of a read document is previously registered together with the priority corresponding to the key word and the layout information. A read undefined document is automatically laid out and outputted in a prescribed format. Thus it is possible to omit the editing processing to be carried out by an operator and to improve the reading efficiency of the undefined document.

Description

【発明の詳細な説明】 「5発明の目的) (産業上の利用分野) 本発明は帳票上の文書を読み取る光学的文字読取装置に
係わり、特に読み取った文書のフォーマット設定処理に
関する。
DETAILED DESCRIPTION OF THE INVENTION 5. OBJECTS OF THE INVENTION (Industrial Application Field) The present invention relates to an optical character reading device for reading documents on a form, and particularly relates to a formatting process for a read document.

(従来の技術) 従来、光学的文字読取装置にて読み取られる文書のフォ
ーマットは予め決定されており、帳票上に印刷された枠
内に文書を書き込むようになっている。従って、光学的
文字読取装置はこのようにフォーマットが決められた文
書を読み取ると、読み収った文書を前記にフォーマツl
へにて出力するようになっていた。
(Prior Art) Conventionally, the format of a document read by an optical character reading device is determined in advance, and the document is written within a frame printed on a form. Therefore, when an optical character reading device reads a document formatted in this way, it formats the read document as described above.
It was supposed to be output in .

このような従来の光学的文字読取装置によりフォーマッ
トが決まっていない不定形の文書を読み取った場合、読
み取ったイメージ位置に文字を配置した不定形の文書の
ままでしが出力することができなかった。
When such a conventional optical character reading device reads an irregularly shaped document with no fixed format, it is not possible to output the irregularly shaped document with characters placed at the scanned image position. .

(発明が解決しようとする課題) 上記の如〈従来の光学的文字読取装置によって、フォー
マットが決まっていない不定形の文書を読み収った場合
の出力文書の邪悪は、やはり読み取った不定形の文書の
ままでしかなかった。従って、これを所定のフォーマッ
トに直すには、読み取った文書をバージナルコンピュー
タ等に読み込んだ後、オペレータがキー操作等を行って
し・イアウドし直さなければならなかった。
(Problems to be Solved by the Invention) As mentioned above, when a conventional optical character reading device reads an amorphous document with no fixed format, the output document is evil. It remained nothing more than a document. Therefore, in order to convert the document into a predetermined format, the operator had to read the document into a virgin computer or the like and then perform key operations or the like to read it again.

そこで本発明は上記の欠点を除去するもので、読み取っ
た不定形の文書を所定のフォーマットにレイアウトして
出力することができる光学的文字読取装置を提供するこ
とを目的としている。
SUMMARY OF THE INVENTION In order to eliminate the above-mentioned drawbacks, the present invention aims to provide an optical character reading device that can layout and output a read irregularly shaped document in a predetermined format.

〔発明の構成〕[Structure of the invention]

(課顕を解決するための手段) 本発明は帳票上の文字を光電変換して読み取って認識す
る光学的文字読取装置において、読み取って認識した文
書を編集するための編集情報を登録する編集情報登録手
段と、読み取って認識した文書のフォーマットを決定す
るためのレイアウト情報を登録するレイアウト情報登録
手段と、読み取って認識した文書を前記登録手段に登録
されている編集情報に基づいて編集すると共に、前記レ
イアウト情報登録手段に登録されているレイアウト情報
に基づいて所定のフォーマットを有するように文章の位
置や段組及び書式を設定する文書編集手段とを具備した
構成を有する。
(Means for Solving Problems with Problems) The present invention provides an optical character reading device that photoelectrically converts characters on a form to read and recognize the characters. a registration means, a layout information registration means for registering layout information for determining the format of the read and recognized document, and editing the read and recognized document based on editing information registered in the registration means; The document editing means includes a document editing means for setting the position, columns, and format of a text so as to have a predetermined format based on the layout information registered in the layout information registration means.

(作用) 本発明の光学的文字読取装置において、編集情報登録手
段は読み取って認識した文書を編集するための編集情報
を登録する。レイアウト情報登録手段は読み取って認識
した文書のフォーマットを決定するためのレイアウト情
報を登録する。文書編集手段は読み取って認識した文書
を前記登録手段に登録されている編集情報に基づいて編
集すると共に、前記レイアウト情報登録手段に登録され
ているレイアウト情報に基づいて所定のフォーマットを
有するように文章の位置や段組及び書式を設定する。
(Operation) In the optical character reading device of the present invention, the editing information registration means registers editing information for editing the read and recognized document. The layout information registration means registers layout information for determining the format of the read and recognized document. The document editing means edits the read and recognized document based on the editing information registered in the registration means, and edits the document so that it has a predetermined format based on the layout information registered in the layout information registration means. Set the position, columns, and format.

(実施例) 以下、本発明の一実施例を図面を参照して説明する。第
1図は本発明の光学的文字読取装置の一実施例を示した
ブロック図である。1は制御部で、以下に述べる装置の
各部を制御して文書の読み取り及び読み取った文書のレ
イアウト処理制御等を行う。2は帳票上の文書を光電変
換して読み取るスキャナ部、3はスキャナ部2によって
読み取った文字イメージから文字を認識する認識部、4
は認識部3によって認識された1シ一ト分の認識結果を
格納する認識結果格納部、5はレイアウト処理部で、認
識結果格納部4をサーチしてキーワードを取り出し、こ
のキーワードの優先順位をキーワード辞書部6より探し
出した後、探し出しな優先順位とレイアウト情報格納部
7から入力されるレイアウト情報に基づいて、認識した
文書のレイアウトを行って所定のフォーマットに編集す
る。6はキーワード(編集情報の一種)と優先順位との
関係を格納したキーワード辞書部、7は横書き、縦書き
、段組、1行の文字数及び行間等のレイアウト情報を格
納しているレイアウト情報格納部、8は読み取りイメー
ジ、認識結果及びレイアウト結果等の各種情報を表示す
るCRT、9は各種設定情報等をキー人力するキー人力
部、10は所定のフォーマットに編集された読み取り文
書を出力するプリンタて゛ある。
(Example) Hereinafter, an example of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of the optical character reading device of the present invention. Reference numeral 1 denotes a control unit that controls various parts of the apparatus described below to read documents, control layout processing of the read documents, and the like. 2 is a scanner unit that photoelectrically converts and reads a document on a form; 3 is a recognition unit that recognizes characters from the character image read by the scanner unit 2; 4
5 is a recognition result storage unit that stores the recognition results for one sheet recognized by the recognition unit 3, and 5 is a layout processing unit that searches the recognition result storage unit 4, extracts a keyword, and sets the priority of this keyword. After searching for keywords from the keyword dictionary section 6, the recognized document is laid out and edited into a predetermined format based on the search priority and layout information input from the layout information storage section 7. 6 is a keyword dictionary section that stores the relationship between keywords (a type of editing information) and priorities, and 7 is a layout information storage that stores layout information such as horizontal writing, vertical writing, columns, number of characters in one line, and line spacing. 8 is a CRT that displays various information such as read images, recognition results, and layout results; 9 is a key input unit that manually inputs various setting information; and 10 is a printer that outputs the read document edited in a predetermined format. There is.

ここで、キー人力部9とレイアウト処理部5とキーワー
ド辞書部6は編集情報登録手段を、キー人力部9とレイ
アウト処理部5とレイアウト情報格納部7はレイアウト
情報登録手段を、レイアラI・処理部5は文書編集手段
を構成している。
Here, the key human power section 9, layout processing section 5, and keyword dictionary section 6 function as editing information registration means, the key human power section 9, layout processing section 5, and layout information storage section 7 function as layout information registration means, The unit 5 constitutes a document editing means.

次に本実施例の動作について説明する。スキャナ部2は
文書が不定形で記載されている例えば第2図(A)に示
すような帳票を読み取ってイメージ情報とし、これを認
識部3に出力する。認識部3は入力されたイメージ情報
から文字部分を抽出した後認識し、1シ一ト分の認識結
果を認識結果格納部4に格納する。次にレイアラI・処
理部5は前記認識結果格納部4をサーチしてキーワード
となる文字(単語)を探し出す。但し、このキーワード
は予めキー人力部9からレイアウト処理部5に設定しで
あるものとする。次に、レイアウト処理部5はキーワー
ド辞書部6を参照して、探し出したキーワードの優先順
位を特定する。即ち、前記第2図(A>に示した例の帳
票を読み取った場合、レイアラI・処理部5はキーワー
ドとして、「概況」、「それは」、「今日」、「終り」
を抽出し、第3図に示すようなキーワード辞書部6の記
憶内容を参照して、各キーワードの優先順位、即ち、報
告−=:1、それは−3、今日=2、終り二4であると
サーチする。
Next, the operation of this embodiment will be explained. The scanner unit 2 reads a document in which a document is written in an irregular form, such as the one shown in FIG. The recognition unit 3 extracts and recognizes character parts from the input image information, and stores the recognition results for one sheet in the recognition result storage unit 4. Next, the layerer I processing unit 5 searches the recognition result storage unit 4 to find characters (words) that serve as keywords. However, it is assumed that this keyword is set in advance from the key personnel section 9 to the layout processing section 5. Next, the layout processing section 5 refers to the keyword dictionary section 6 and specifies the priority order of the found keywords. That is, when reading the example form shown in FIG.
is extracted, and with reference to the stored contents of the keyword dictionary section 6 as shown in FIG. Search for

その後、レイアウト処理部5は認識結果格納部4から前
記キーワードを含む認識結果を文章単位(例えば、「天
気概況」)で読み出し、文章が含むキーワードの優先順
泣顔に第2図(B)に示すように文章を並べ変えると共
に、レイアウト情報格納部7から読み出したレイアウト
情報に従って、1行当りの文字数、行間、及び段組み等
を決めることにより、読み取り文書の編集を行って所定
のフォーマットに直した後、プリンタ10に出力する。
After that, the layout processing unit 5 reads the recognition results including the keyword from the recognition result storage unit 4 in units of sentences (for example, "weather overview"), and displays the priority order of the keywords included in the sentences as shown in FIG. 2(B). In addition to rearranging the sentences as shown in FIG. After that, it is output to the printer 10.

プリンタ10ては所定のフォーマットにし・イアウドさ
れた例えば第2図(B)に示すような1シ一ト分の読み
取り文書を記録紙に印刷して出力する。尚、レイアウト
処理部5はCRT8に認、識結果格納部に格納された不
定形の文書を表示すると共に、この文書に施したし、イ
アウ)−処理結果もCRT8に適宜表示する。
The printer 10 prints and outputs one sheet of the read document, which has been formatted and read in a predetermined format, as shown in FIG. 2(B), for example, on recording paper. The layout processing section 5 displays the amorphous document stored in the recognition and recognition result storage section on the CRT 8, and also displays the processing results applied to this document on the CRT 8 as appropriate.

ここで、キーワード辞書部6には、予めオペドータによ
ってキー人力部9からキーワードとその優先順位がレイ
アウト処理部5を介して例えば第3図に示す如く登録さ
れいているものとする。又、レイアウト情報格納部7に
もオペレータによってキー人力部9から横書き、縦書き
、段組、]行の文字数及び行間等の各種レイアウト処理
部が予め格納されているものとする。尚、登録したキー
ワードとその優先順位及びレイアラ1〜情報はレイアラ
■・処理部5により適宜CRT 8に表示されて、オペ
レータが確認できるようになっている。
Here, it is assumed that keywords and their priorities are registered in advance in the keyword dictionary section 6 from the key personnel section 9 by the operator via the layout processing section 5, for example, as shown in FIG. Further, it is assumed that various layout processing sections such as horizontal writing, vertical writing, columns, number of characters in ] lines, and line spacing are stored in advance in the layout information storage section 7 from the key manual section 9 by the operator. It should be noted that the registered keywords, their priorities, and information on Layer 1 to Layer 1 are appropriately displayed on CRT 8 by Layer 1 and processing section 5 so that the operator can confirm them.

第4図は第1図に示した装置の動作を示したフローチャ
ートである。先ず、ステ・ツブ401にて1枚の帳票を
スキャナ部2により読み取り、ステップ402にてその
読み取り文字・イメージを認識部3により認識して、認
識結果を認識結果格納部4に格納する。次にステップ4
03にて、レイアラ1−処理部5は前記格納された認識
結果からキーワードを抽出してキーワードがあるかない
かを判別し、ない場合は認識結果をそのままプリンタ1
0に出力してステップ405に進み、ある場合はステッ
プ404に進む。ステリプ404にて、レイアラ1〜処
理部5は抽出したキーワードの優先順位とレイアウト情
報から認識結果をレイアウトして所定のフォーマットに
した後、プリンタ10に出力して、ステ・ツブ405に
進む9ステ・・ノブ405にて、プリンタ10は与えら
れたテークを印刷データに変換した後、記録紙に印字し
て出力する。その後、次の帳票を読み取るべくして、ス
テップ401に戻る。
FIG. 4 is a flowchart showing the operation of the apparatus shown in FIG. First, in step 401, a single document is read by scanner section 2, and in step 402, the read characters and images are recognized by recognition section 3, and the recognition result is stored in recognition result storage section 4. Next step 4
At step 03, the layerer 1-processing unit 5 extracts keywords from the stored recognition results and determines whether the keywords exist or not.
It outputs 0 and proceeds to step 405, and if there is, proceeds to step 404. In step 404, the layerer 1 to processing unit 5 lay out the recognition results based on the priority order of the extracted keywords and the layout information, convert them into a predetermined format, output them to the printer 10, and proceed to step 405 in nine steps. With the knob 405, the printer 10 converts the given take into print data, and then prints it on recording paper and outputs it. Thereafter, the process returns to step 401 to read the next form.

第5図は第1図に示した装置に第2図(A)で示した不
定形文書を読み取らせた場合の他のフォーマ・・ノドに
よる出力結果例を示した図である5図中、(A>は横書
きで且つ多段組指定の例であり、図中、(B)は縦書き
で且つ多段組指定の例である。
FIG. 5 is a diagram showing an example of the output result by another former when the apparatus shown in FIG. 1 reads the irregular document shown in FIG. 2(A). (A> is an example of horizontal writing and multi-column designation, and (B) in the figure is an example of vertical writing and multi-column designation.

本実施例によれは、読み取り文書を]フイアウ)−する
ためのキーワードと、これに対応する優先順位及びシイ
アウト情報を予め装置に登録しておけば、読み取った不
定形文書を自動的にレイアラ1へして所定のフォーマッ
トの読み取り文書を出力することができ、縦来必要であ
ったオペレータによる編集処理を省くことができ、不定
形の文書の読み取り効率を著しく高めることができる。
According to this embodiment, if a keyword for reading a document and the corresponding priority order and selection information are registered in advance in the device, the read irregular-form document can be automatically transferred to the layerer. Thus, a read document in a predetermined format can be output, the editing process by an operator that is previously required can be omitted, and the reading efficiency of irregularly shaped documents can be significantly improved.

〔発明の効果〕〔Effect of the invention〕

以上記述した如く本発明の光学的文字読取装置によれば
、読み取った不定形の文書を所定のフォーマットにレイ
アラ1〜して出力することができる、
As described above, according to the optical character reading device of the present invention, it is possible to output a read irregularly shaped document in a predetermined format as a layerer.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の光学的文字読取装置の一実施例を示し
たブロック図、第2図は第1図の装置に読み込ませる不
定形文書及び同装置より出力される所定のフォーマット
を有する読み取り文書例を示した図、第3図は第1図に
示したキーワード辞書部に登録されるキーワードと優先
順位との関係を示した模式図、第・1図は第1図に示し
た装置の動作を示しlソロ−・チャー1〜、第5図は第
1−図の装置から出力される所定のフォーマットを有す
る読み取り文書の他の例を示した図である。 1・・・制御部 2・・・スキャナ部 3・・・認識部 4・・・認識結果格納部 5・・・レイアウト処理部 6・・・キーワード辞書部 7・・・し・イアウ]〜情報格納部 8・・・CRT 9・・・キー人力部 10・・・プリンタ
FIG. 1 is a block diagram showing an embodiment of the optical character reading device of the present invention, and FIG. 2 shows an irregularly shaped document read into the device shown in FIG. Figure 3 is a diagram showing a document example; Figure 3 is a schematic diagram showing the relationship between keywords registered in the keyword dictionary section shown in Figure 1 and their priorities; FIG. 5 is a diagram showing another example of a read document having a predetermined format output from the apparatus of FIG. 1. 1... Control unit 2... Scanner unit 3... Recognition unit 4... Recognition result storage unit 5... Layout processing unit 6... Keyword dictionary unit 7... Information Storage section 8...CRT 9...Key human power section 10...Printer

Claims (1)

【特許請求の範囲】[Claims] 帳票上の文字を光電変換して読み取って認識する光学的
文字読取装置において、読み取って認識した文書を編集
するための編集情報を登録する編集情報登録手段と、読
み取って認識した文書のフォーマットを決定するための
レイアウト情報を登録するレイアウト情報登録手段と、
読み取って認識した文書を前記登録手段に登録されてい
る編集情報に基づいて編集すると共に、前記レイアウト
情報登録手段に登録されているレイアウト情報に基づい
て所定のフォーマツトを有するように文章の位置や段組
及び書式を設定する文書編集手段とを具備したことを特
徴とする光学的文字読取装置。
In an optical character reading device that photoelectrically converts and reads characters on a form, the editing information registration means registers editing information for editing the read and recognized document, and determines the format of the read and recognized document. layout information registration means for registering layout information for
The read and recognized document is edited based on the editing information registered in the registration means, and the position and column of the text are changed to have a predetermined format based on the layout information registered in the layout information registration means. 1. An optical character reading device comprising: document editing means for setting a set and format.
JP2066821A 1990-03-19 1990-03-19 Optical character reader Pending JPH03268084A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2066821A JPH03268084A (en) 1990-03-19 1990-03-19 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2066821A JPH03268084A (en) 1990-03-19 1990-03-19 Optical character reader

Publications (1)

Publication Number Publication Date
JPH03268084A true JPH03268084A (en) 1991-11-28

Family

ID=13326900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2066821A Pending JPH03268084A (en) 1990-03-19 1990-03-19 Optical character reader

Country Status (1)

Country Link
JP (1) JPH03268084A (en)

Similar Documents

Publication Publication Date Title
US5450537A (en) Method and apparatus for completing a partially completed document in accordance with a blank form from data automatically retrieved from a database
JP3491962B2 (en) Document search method and system
JP2862626B2 (en) Electronic dictionary and information retrieval method
EP0435316B1 (en) Image information recording apparatus
JPH03161873A (en) Electronic filing device having data base constructing function
KR20000006006A (en) Order receiving method and apparatus for making sound-accompanying photographs
JP2001126026A (en) Information input device
JPH07200631A (en) Electronic filing device
JPH03268084A (en) Optical character reader
JPS60100264A (en) Device for retrieving information
JP3480888B2 (en) Document information management system
JPS62219768A (en) Electronic filing system
JPH08153110A (en) Device and method for filing document
JPH09284446A (en) Information processor, digital copying machine and information recording medium
JP2928515B2 (en) Translated word output device
GB2143064A (en) Registering and calling document texts
JPH09204511A (en) Filing device
JPH10254895A (en) Document information management system and method for generating medium paper
JP3424942B2 (en) Bilingual image forming device
JPH08161350A (en) Method and device for electronic filing
JP2682873B2 (en) Recognition device for tabular documents
JPS6336671A (en) Electronic file system
JPH0756924A (en) Bilingual device
JPH05298374A (en) Digital copying machine
JP2002245392A (en) Routine document input device