JPH0373914B2 - - Google Patents
Info
- Publication number
- JPH0373914B2 JPH0373914B2 JP57053479A JP5347982A JPH0373914B2 JP H0373914 B2 JPH0373914 B2 JP H0373914B2 JP 57053479 A JP57053479 A JP 57053479A JP 5347982 A JP5347982 A JP 5347982A JP H0373914 B2 JPH0373914 B2 JP H0373914B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- information
- code
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000000034 method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 101100385969 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CYC8 gene Proteins 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
〔発明の技術分野〕
この発明は、文字および画像を含む帳票上の情
報の読取りを行なうことができる文字画像処理装
置に関する。DETAILED DESCRIPTION OF THE INVENTION [Technical Field of the Invention] The present invention relates to a character image processing device that can read information on a form including characters and images.
帳票上の文字情報と画像情報を区別して入力す
ることができる文字画像処理装置の読取り制御方
式には、文字情報が存在する文字領域、画像情報
が存在する画像領域を座標値等で指定し、フオー
マツトコントロールデータ(以下FCデータとい
う)として記憶しておくいわゆるFC制御方式や、
直接帳票上に特殊なマークや赤印を付しておき、
読込み時にそのマーク等を検出して制御するマー
ク検出識別方式がある。
The reading control method of a character image processing device that can distinguish and input character information and image information on a form involves specifying a character area where character information exists and an image area where image information exists using coordinate values, etc. The so-called FC control method, which is stored as format control data (hereinafter referred to as FC data),
Put special marks or red marks directly on the form,
There is a mark detection and identification method that detects and controls the mark etc. at the time of reading.
しかしながら、上記前者の方式では、入力装置
の制御方式として、多様のフオーマツトに対し
て、、FCデータを作る煩雑さがあり、迅速性に欠
けるという問題がある。また、上記後者の方式で
は、簡便ではあるが正確さや美感を損なうという
問題がある。さらに、最近ではフリーフオーマツ
ト方式の読取方式も英文タイプした帳票の読取り
に使用されているが、文字情報と画像情報を含む
帳票の読取りには上記2つの方式のうちのいずれ
かを採用しなければならないという情況にある。
However, in the former method, as a control method for an input device, there is a problem in that it is complicated to create FC data for various formats and lacks speed. Furthermore, although the latter method is simple, there is a problem in that accuracy and aesthetics are impaired. Furthermore, recently, free-format reading methods have also been used to read forms typed in English, but one of the above two methods must be adopted to read forms that contain text and image information. The situation is such that it cannot be done.
この発明は上記のような事情に鑑みてなされた
もので、FCデータを必ずしも作成する必要がな
く、また帳票上にも文字領域と画像領域を区別す
るためのマークを記入する必要がなく、文字情報
と画像情報を区別して読取ることができる文字画
像処理装置を提供することを目的とする。
This invention was made in view of the above circumstances, and it is not necessary to create FC data, and there is no need to write marks on the form to distinguish between text areas and image areas. It is an object of the present invention to provide a character image processing device that can distinguish and read information and image information.
この発明は、帳票上を光学的に走査する走査部
から出力される光電変換信号パターンが文字情報
によるものか画像情報によるものかを判別し、文
字情報である場合には認識を行ない認識結果の文
字コードを出力する識別部を設け、この識別部で
画像情報と判断された領域の光電変換信号パター
ンをイメージバツフアに記憶し、このイメージバ
ツフアに記憶された光電変換信号パターンを所定
容量単位でイメージコード化回路で画像有の場合
に特殊コード(イメージコード)に変換し、入力
部からの指示データおよび識別部から出力される
位置情報に基づき上記文字コードおよび特殊コー
ドの編集を行なうと共に、そのデータを表示する
ようにし、帳票上の文字情報と画像情報を区別し
て入力することができるようにしたものである。
This invention determines whether a photoelectric conversion signal pattern output from a scanning unit that optically scans a form is text information or image information, and if it is text information, it is recognized and the recognition result is An identification unit that outputs a character code is provided, a photoelectric conversion signal pattern of an area determined as image information by this identification unit is stored in an image buffer, and the photoelectric conversion signal pattern stored in this image buffer is converted into a predetermined capacity unit. If there is an image, the image encoding circuit converts it into a special code (image code), and edits the character code and special code based on the instruction data from the input section and the position information output from the identification section. The data is displayed so that character information and image information on the form can be input separately.
以下、図面を参照してこの発明の一実施例を説
明する。第1図はこの発明の一実施例の概略構成
図である。図中、1は走査部で、図示せぬ帳票表
面を光学的に走査し、帳票表面からの反射光を電
気信号に変換した後、帳票上の黒および白に応じ
た2値化した信号に変換する機能を持つている。
2は識別部で、走査部1から送られてくる信号を
所定容量単位で記憶し、記憶されたパターンにつ
いて文字パターンとしての認識を行ない、認識可
能であつた場合にはその部分を文字領域と判断
し、さらに認識された文字パターンの帳票上の相
対位置(あるいは絶対座標)を記憶するようにな
つている。3はイメージバツフアで、識別部2で
文字領域と判断されなかつた領域、すなわち画像
領域の光電変換された走査部から送られてくるパ
ターンが記憶されるようになつている。4はイメ
ージコード化回路で、イメージバツフア3から送
られてくる画像パターンを画像の有無により所定
の容量単位で特別のコード(以下イメージコード
という)に置換する機能を持つている。5は入力
部で、具体的にはキーボードであり各種制御デー
タを入力することができるようになつている。6
は編集部で、識別部2から送られてくる文字領域
における認識結果の文字コードと、イメージコー
ド化回路4から送られてくるイメージコード(特
殊コード)とを帳票の座標に合わせて合成する機
能、および入力部5からのデータにより認識不能
を示す文字コード(以下リジエクトコードとい
う)を修正編集する機能等を持つている。7は
CRTコントローラで、編集部6で合成あるいは
編集されたコードデータを表示用のパターンに変
換してCRT8に表示するように制御する機能を
持つている。9はFC制御部で、編集部6から送
られてくる前の読取帳票のFCデータが記憶され
るようになつており、次の読取帳票が同一のフオ
ーマツトの場合に、識別部2にそのFCデータが
転送されるようになつている。すなわち、この
FC制御部9は選択的に動作させることができる
ようになつている。
Hereinafter, one embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a schematic diagram of an embodiment of the present invention. In the figure, 1 is a scanning unit that optically scans the surface of a form (not shown), converts the reflected light from the surface of the form into an electrical signal, and then converts it into a binary signal corresponding to black and white on the form. It has the ability to convert.
2 is an identification unit that stores the signal sent from the scanning unit 1 in a predetermined capacity unit, recognizes the stored pattern as a character pattern, and if it can be recognized, sets that part as a character area. Then, the relative position (or absolute coordinates) of the recognized character pattern on the form is stored. Reference numeral 3 denotes an image buffer, which stores patterns sent from the scanning section in which areas that are not determined to be character areas by the identification section 2, ie, image areas, are subjected to photoelectric conversion. Reference numeral 4 denotes an image encoding circuit which has a function of replacing the image pattern sent from the image buffer 3 with a special code (hereinafter referred to as image code) in a predetermined capacity unit depending on the presence or absence of an image. Reference numeral 5 denotes an input unit, specifically a keyboard, which allows input of various control data. 6
is an editing department that combines the character code of the recognition result in the character area sent from the identification section 2 and the image code (special code) sent from the image encoding circuit 4, matching them to the coordinates of the form. , and a function of correcting and editing a character code indicating unrecognizability (hereinafter referred to as a reject code) using data from the input unit 5. 7 is
The CRT controller has a function of converting the code data synthesized or edited by the editing section 6 into a display pattern and displaying it on the CRT 8. 9 is an FC control unit which stores the FC data of the previous read form sent from the editing unit 6, and when the next read form has the same format, the identification unit 2 stores the FC data of the previous read form sent from the editing unit 6. Data is now being transferred. That is, this
The FC control unit 9 can be operated selectively.
次に、上記実施例の動作を説明する。走査部1
から出力される2値化信号は、識別部2にある容
量単位で記憶され、識別部2はこの記憶されたパ
ターンを文字パターンであるとして認識を開始す
る。(この場合、完全なフリーフオーマツトであ
るよりも、汎用のフオーマツトの帳票を用意して
おくことが精度を高めるために適している。)こ
のとき、識別部2は認識不能であつた箇所や、文
字パターンとして区切れない部分は、画像情報と
してイメージバツフア3に記憶される。なお、こ
のイメージバツフア3の記憶容量は、帳票上の情
報全部が記憶することができるようになつている
ことが望ましい。このようにして、識別部2の制
御によりイメージバツフア3に記憶された画像情
報は、イメージコード化回路4により一定容量単
位で画像有の場合には逐次イメージコードに変換
される。編集部6では識別部2から送られてくる
認識結果の文字コードと、イメージコード化回路
4から送られてくるイメージコードを識別部2で
得られた座標情報をもとに合成、編集を行ない、
帳票一枚分の文字コードおよびイメージコードか
らなるデータを作成する。このデータはCRTコ
ントローラ7に送られ、表示データに変換されて
CRT8に表示される。具体的には、第2図Aに
示すような文字情報と、画像情報を含む帳票の読
取の場合、文字情報CDの部分は、第2図Bに示
されるようにCRT8の表示画面に識別部2にお
ける認識結果の文字コードに対応した表示が行な
われる。認識不能であつた文字はリジエクトコー
ドRCの表示がなされる。また、帳票における画
像情報IDの部分は、第2図Bに示すように、イ
メージコードICの表示がなされる。さらに、帳
票における汚れ部分DTも画像情報とみなされる
ので、イメージコードICの表示がなされる。 Next, the operation of the above embodiment will be explained. Scanning section 1
The binarized signal output from the character recognition unit 2 is stored in a certain capacity unit in the recognition unit 2, and the recognition unit 2 starts recognizing the stored pattern as a character pattern. (In this case, it is better to prepare a general-purpose format form than a completely free format form to improve accuracy.) At this time, the identification unit 2 can identify the parts that were unrecognizable. , portions that cannot be separated as character patterns are stored in the image buffer 3 as image information. Note that it is desirable that the storage capacity of the image buffer 3 is such that all the information on the form can be stored. In this way, the image information stored in the image buffer 3 under the control of the identifying section 2 is sequentially converted into an image code by the image encoding circuit 4 in units of a certain capacity when an image exists. The editing section 6 synthesizes and edits the character code of the recognition result sent from the identification section 2 and the image code sent from the image encoding circuit 4 based on the coordinate information obtained by the identification section 2. ,
Create data consisting of character code and image code for one form. This data is sent to the CRT controller 7 and converted to display data.
Displayed on CRT8. Specifically, when reading a form that includes text information and image information as shown in Figure 2A, the text information CD part is displayed as an identification section on the display screen of the CRT 8 as shown in Figure 2B. A display corresponding to the character code of the recognition result in step 2 is displayed. Unrecognized characters are displayed as a reject code RC. Further, in the image information ID portion of the form, an image code IC is displayed as shown in FIG. 2B. Furthermore, since the dirty portion DT on the form is also regarded as image information, an image code IC is displayed.
オペレータは、この表示を見て文字情報の認識
結果と、画像を示す表示されたイメージコードの
パターンをチエツクし、読取られた帳票の情報が
正しく文字情報と画像情報に区別されている場合
には、リジエクトコードの修正を入力部5の操作
により行なつた後そのデータを外部装置へ出力す
る。また、読取られた帳票の情報が正しく文字情
報と画像情報に区別されていない場合には、オペ
レータは入力部5を操作して正しいデータの入力
を行なつて修正を行ない、さらにリジエクトコー
ドの修正を行なつた後、そのデータを外部装置へ
出力する。なお、このような修正を行なう際に
は、編集部6は、リジエクト文字の修正の際には
入力部5から入力されたコードをリジエクトコー
ドと置換したり、リジエクトパターンの表示を行
なうように制御する。また、文字情報と画像情報
の領域の変更の指示があつた場合には、編集部6
はその変更後の領域の情報をCRT8に表示させ
たり、変更すべき領域の情報をイメージバツフア
3から読出して表示させる等の制御を行なう。 The operator looks at this display and checks the recognition result of the text information and the pattern of the displayed image code indicating the image, and if the information on the read form is correctly distinguished into text information and image information, After modifying the reject code by operating the input unit 5, the data is output to an external device. In addition, if the information on the read form is not correctly distinguished into text information and image information, the operator operates the input section 5 to input the correct data and make corrections, and then inputs the reject code. After making the corrections, the data is output to an external device. Note that when making such corrections, the editing section 6 replaces the code input from the input section 5 with a reject code when modifying reject characters, or displays a reject pattern. control. In addition, when there is an instruction to change the area of text information and image information, the editing department 6
performs controls such as displaying information on the area after the change on the CRT 8, reading information on the area to be changed from the image buffer 3, and displaying the information.
さらに、編集部6で最終的に得られた文字情報
からなる文字領域を示す座標位置および画像領域
におけるイメージコードの座標位置は、同様なフ
オーマツトの帳票の読取りが行なわれる場合に備
えてFCデータとしてFC制御部9に記憶される。
このような状態の場合、次に、FC制御部9に記
憶されているFCデータと同様なフオーマツトの
帳票の読取りを行なう場合には、このFC制御部
9に記憶されたFCデータに基づき識別部2は帳
票の読取りを行なう。 Furthermore, the coordinate position indicating the character area consisting of character information finally obtained by the editing unit 6 and the coordinate position of the image code in the image area are stored as FC data in case a form with a similar format is to be read. It is stored in the FC control unit 9.
In such a state, when reading a form with the same format as the FC data stored in the FC control unit 9, the identification unit will read the form based on the FC data stored in the FC control unit 9. 2 reads the form.
なお、入力部5からの指示により、CRT8に
リジエクト文字パターンの表示だけでなく、画像
領域のイメージが正しいイメージとして良好な画
質に変換されていることが確認することができる
ように、指示された領域が表示されるようなイメ
ージ表示できるようにすることにより一層高い信
頼性を持つた文字画像処理装置を提供することが
できる。 Note that the instructions from the input unit 5 not only display the reject character pattern on the CRT 8, but also display instructions to confirm that the image in the image area is a correct image and has been converted to a good image quality. By being able to display an image in which a region is displayed, it is possible to provide a character image processing device with even higher reliability.
したがつて、このような文字画像処理装置は、
FCデータをその度作成することがなく、文字、
画像入力を比較的精度よく行なうことができる。
また、帳票上に一々画像領域と文字領域を区別す
るマーク等を記入する必要がなく画像領域および
文字領域の読取りを行なうことができる。さら
に、種々のフオーマツトの帳票のFCデータの作
成にも利用することができる。 Therefore, such a character image processing device is
There is no need to create FC data each time, characters,
Image input can be performed with relatively high accuracy.
Further, it is not necessary to write marks or the like to distinguish between image areas and text areas on a form, and it is possible to read image areas and text areas. Furthermore, it can be used to create FC data for forms in various formats.
以上述べたようにこの発明によればFCデータ
を必ずしも作成する必要がなく、また帳票上にも
文字領域と画像領域を区別するためのマークを記
入する必要がなく、文字情報と画像情報を区別し
て読取ることができる文字画像処理装置を提供す
ることができる。
As described above, according to the present invention, it is not necessary to create FC data, and there is no need to write marks on the form to distinguish between text areas and image areas. It is possible to provide a character image processing device that can read characters separately.
第1図はこの発明の一実施例の概略構成図、第
2図Aは同実施例に使用される帳票の一例を示す
図、第2図Bは上記帳票の読取りを行なつた場合
にCRTに表示される表示例を示す図である。
1……走査部、2……識別部、3……イメージ
バツフア、4……イメージコード化回路、5……
入力部、6……編集部、7……CRTコントロー
ラ、8……CRT、9……FC制御部。
FIG. 1 is a schematic diagram of an embodiment of the present invention, FIG. 2A is a diagram showing an example of a form used in the same embodiment, and FIG. FIG. 3 is a diagram showing an example of a display displayed on the screen. 1...Scanning section, 2...Identification section, 3...Image buffer, 4...Image encoding circuit, 5...
Input section, 6...editing section, 7...CRT controller, 8...CRT, 9...FC control section.
Claims (1)
走査部と、 この走査部から出力される光電変換信号につい
て所定の単位で文字認識処理を行なう文字認識手
段と、 この文字認識手段による文字認識処理の結果に
基づいて、文字情報であるか否かを判別し、文字
情報と判別された場合には文字情報を所定の文字
コードに変換し、文字情報と判別されなかつた場
合には前記所定の単位の光電変換信号を出力する
判別手段と、 この判別手段から出力された光電変換信号を前
記文字情報と識別できる前記画像情報に対応する
特殊コードに変換する画像コード変換部と、 を具備したことを特徴とする文字画像処理装置。[Scope of Claims] 1. A scanning unit that photoelectrically converts characters and image information on a form; Character recognition means that performs character recognition processing in a predetermined unit on the photoelectric conversion signal output from this scanning unit; and This character recognition. Based on the result of character recognition processing by the means, it is determined whether or not it is character information, and if it is determined to be character information, the character information is converted to a predetermined character code, and if it is not determined to be character information. a discrimination means for outputting a photoelectric conversion signal of the predetermined unit; and an image code conversion section for converting the photoelectric conversion signal output from the discrimination means into a special code corresponding to the image information that can be distinguished from the text information. A character image processing device characterized by comprising the following.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57053479A JPS58169682A (en) | 1982-03-31 | 1982-03-31 | Character and picture processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57053479A JPS58169682A (en) | 1982-03-31 | 1982-03-31 | Character and picture processor |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS58169682A JPS58169682A (en) | 1983-10-06 |
JPH0373914B2 true JPH0373914B2 (en) | 1991-11-25 |
Family
ID=12943977
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57053479A Granted JPS58169682A (en) | 1982-03-31 | 1982-03-31 | Character and picture processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58169682A (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6097479A (en) * | 1983-10-31 | 1985-05-31 | Nec Corp | Picture processing device |
JPS60181878A (en) * | 1984-02-29 | 1985-09-17 | Toshiba Corp | Pattern recognizing device |
JPH0782522B2 (en) * | 1985-03-11 | 1995-09-06 | 三菱電機株式会社 | Document reader |
JPS61226885A (en) * | 1985-03-30 | 1986-10-08 | Toshiba Corp | Optical character reader |
JPS6255778A (en) * | 1985-09-05 | 1987-03-11 | Mitsubishi Electric Corp | Sentence reader |
JPH01259470A (en) * | 1988-04-11 | 1989-10-17 | Canon Inc | Character recognizing device |
JP2579356B2 (en) * | 1989-01-13 | 1997-02-05 | 三菱電機株式会社 | Document reading device |
JP2579397B2 (en) * | 1991-12-18 | 1997-02-05 | インターナショナル・ビジネス・マシーンズ・コーポレイション | Method and apparatus for creating layout model of document image |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS559222A (en) * | 1978-06-30 | 1980-01-23 | Nec Corp | Picture input unit |
JPS5621274A (en) * | 1979-07-27 | 1981-02-27 | Fujitsu Ltd | Character read-in and correction system |
JPS5635276A (en) * | 1979-08-30 | 1981-04-07 | Toshiba Corp | Rejected character processing system for optical character reading device |
JPS5660981A (en) * | 1979-10-24 | 1981-05-26 | Mitsubishi Electric Corp | Character reader |
JPS573173A (en) * | 1980-06-05 | 1982-01-08 | Sony Corp | Document generating device |
-
1982
- 1982-03-31 JP JP57053479A patent/JPS58169682A/en active Granted
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS559222A (en) * | 1978-06-30 | 1980-01-23 | Nec Corp | Picture input unit |
JPS5621274A (en) * | 1979-07-27 | 1981-02-27 | Fujitsu Ltd | Character read-in and correction system |
JPS5635276A (en) * | 1979-08-30 | 1981-04-07 | Toshiba Corp | Rejected character processing system for optical character reading device |
JPS5660981A (en) * | 1979-10-24 | 1981-05-26 | Mitsubishi Electric Corp | Character reader |
JPS573173A (en) * | 1980-06-05 | 1982-01-08 | Sony Corp | Document generating device |
Also Published As
Publication number | Publication date |
---|---|
JPS58169682A (en) | 1983-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
USRE36581E (en) | Character reader and recognizer with a specialized editing function | |
JPH0373914B2 (en) | ||
US5233672A (en) | Character reader and recognizer with a specialized editing function | |
JPS62259192A (en) | Rejection correction system | |
JPH0991371A (en) | Character display device | |
JPH0473192B2 (en) | ||
JPH0459669B2 (en) | ||
JPH0459668B2 (en) | ||
JPH0473193B2 (en) | ||
JPH0573725A (en) | Hand-written character and graphic recognition device | |
JP3221969B2 (en) | Character recognition device | |
JPS61147379A (en) | Optical character reader | |
JPH0132145Y2 (en) | ||
JP3027232B2 (en) | Character recognition device | |
JPH06295359A (en) | Character recognition device | |
JPH08202824A (en) | Document picture recognition device | |
JP3162575B2 (en) | Character recognition device | |
JPH04156694A (en) | Character recognition system | |
JP2001084330A (en) | Mark correction confirming system and method and program recording medium for confirmation | |
JP2683711B2 (en) | How to recognize / correct character / symbol data | |
JPH02272688A (en) | Optical character reader | |
JPS6115285A (en) | Optical character reader | |
JPS5831028B2 (en) | character recognition device | |
JPH04262660A (en) | Picture recognition output device | |
JPS61289479A (en) | Character recognizing device for reading out connected characters |