JPH05501778A - Method and apparatus for automatic text separation using automatic electronic filtering of multiple dropout colors for optical character recognition of preprinted forms - Google Patents

Method and apparatus for automatic text separation using automatic electronic filtering of multiple dropout colors for optical character recognition of preprinted forms

Info

Publication number
JPH05501778A
JPH05501778A JP3512695A JP51269591A JPH05501778A JP H05501778 A JPH05501778 A JP H05501778A JP 3512695 A JP3512695 A JP 3512695A JP 51269591 A JP51269591 A JP 51269591A JP H05501778 A JPH05501778 A JP H05501778A
Authority
JP
Japan
Prior art keywords
color
pixel
processing
black
grayscale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3512695A
Other languages
Japanese (ja)
Inventor
ルダク,ピーター
Original Assignee
イーストマン・コダック・カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イーストマン・コダック・カンパニー filed Critical イーストマン・コダック・カンパニー
Publication of JPH05501778A publication Critical patent/JPH05501778A/en
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/143Sensing or illuminating at different wavelengths

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。 (57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 11 工の 工 i二のために ドロップアウトカー−の ・な゛ ・フィルタ リング いた ・ のための び 発朋Ω技術的分! この発明はカラー電子走査器を用いたドロップアウトカラーの自動選択及び検出 に関係しており、更に詳細には、光学式文字認m (COR)システムが書式を 光学的フィルタに整合させる代わりに書式自体に基づいて自動的にフィルタリン グパラメータを調整することを可能にする。[Detailed description of the invention] 11 Dropout car filter The ring was for... Departure Ω technical minute! This invention provides automatic selection and detection of dropout colors using a color electronic scanner. More specifically, optical character recognition (COR) systems Automatically filter based on format itself instead of matching optical filters allows you to adjust parameters.

発肌の背量 光学式文字認識(OCR)は事務用書式を処理するための有効な技法である。amount of skin growth Optical character recognition (OCR) is an effective technique for processing office forms.

機械読取りシステムは数人のデータ入力操作員に取って代わり、データ捕獲の費 用を低減することができる。Machine-reading systems replace several data entry operators and reduce the cost of data capture. It is possible to reduce the amount of use.

−Cに、OCR過程の最初の段階は書類を電子的に走査して情報のすべてをディ ジタルビットマノブに変換することである。−たん画像が電子的形式で捕獲され ると、読み取られるべき情報は背景情報から分離される。箱枠及び案内本文は無 視されなければならず、書き入れ本文は読み取られるべきである。この分離が完 成されると、本文の電子的画像はOCRアルゴリズムによって処理され、その際 関心のある文字はASCIIデータに変換される。-C, the first step in the OCR process is to scan the document electronically to extract all of the information. It is to convert to digital bit manob. - The image is captured in electronic form. The information to be read is then separated from the background information. No box frame or guide text The text of the entry should be read. This separation is complete. Once created, the electronic image of the text is processed by an OCR algorithm, during which Characters of interest are converted to ASCII data.

事務用書式を処理するほとんどすべてのOCRシステムは「ドロップアウトカラ ー」の技法を使用している。所定の色(通常パステルカラー)で書類を印刷し且 つ電子的走査器において同し色の光学的フィルタを使用することによって書類に おける書き入れ本文は印刷書式から分離されることができる0色フィルタは走査 器にその色で印刷された情報を無視させる(W予約走査器に対して、書式の色は 用紙の白色背景と等価であるものとして現れる)、シかしながら、書き入れ本文 は典型的には黒(又は他の暗色)でタイプされ又は印刷されているので、この情 報は走査器によって里として捕獲される。それゆえ、事前印刷書式は白色背景に 変換され、従って書き入れ本文はOCRアルゴリズムによって容易に処理される ことができる。Almost all OCR systems that process office forms use "dropout color". -' technique is used. Print documents in predetermined colors (usually pastel colors) and documents by using color-matched optical filters in an electronic scanner. The text can be separated from the print format and the 0-color filter can be scanned cause the device to ignore information printed in that color (for W reservation scanners, the color of the form is (appears equivalent to the white background of the paper), while the text This information is typically typed or printed in black (or other dark colors). The information is captured by a scanner. Therefore, the preprinted format is on a white background. The input text is therefore easily processed by OCR algorithms. be able to.

光学的フィルタの使用はこの応用においてはよく機能するが、それは顧客を書式 における非常に特定の色(走査器に取り付けられた光学的フィルタの特性に精密 に整合するもの)に制限する。付加的な光学的フィルタを加えることによって走 査器に付加的なドロップアウトカラーを含めることができる。従って、特定の書 式の処理は適当な光学的フィルタを選択し且つ書式を処理する前にそれを機械的 に挿入することを必要とするであろう。The use of optical filters works well in this application, but it very specific colors (precisely due to the characteristics of the optical filter attached to the scanner) (consistent with). by adding additional optical filters. Additional dropout colors can be included in the scanner. Therefore, certain books Form processing involves selecting a suitable optical filter and mechanically processing the form before processing it. will need to be inserted into.

しかしながら、印刷過程におけるわずかな変動は印刷書式の実際の色における変 化性を生して、これにより「ドロップアウト」効果を低減することがある。その ような変更は雑音を加えさせることがあり(走査器は事前印刷書式情報を白では なく黒として見る)、このためにOCRアルゴリズムが誤った結果を生しること がある6別の方法として、印刷の際のこれらのわずがな変動に適応するように光 学的フィルタを変更することは実用的ではないが、それはこの変更が、それぞれ がわずかに異なった特性を持った多数のフィルタを必要とすることになるであろ うからである。それゆえ、この問題を実用的に調整する唯一の方法は印刷過程を 厳格に制御して一様なドロップアウトカラーを確保することである。その結果と して、現在使用されているOCR書式読取りシステムは一般に「閉ループ」であ り、これは、外部の会社により生成された書式が色変動のために適当に読み取ら れないことがあるので、書式処理会社(例えば保険会社)が書式の印刷について 統制を維持しなければならないことを意味する。However, slight variations in the printing process may cause variations in the actual color of the printed form. This may reduce the "dropout" effect. the Such changes can add noise (scanners do not print pre-printed formatting information in white). (see as black), which causes the OCR algorithm to produce erroneous results. 6 Alternatively, the light can be adjusted to accommodate these slight variations during printing. Although it is not practical to change the analytic filter, it is important to note that this change would require multiple filters with slightly different characteristics. It's your body. Therefore, the only way to practically adjust this problem is to modify the printing process. The goal is to ensure uniform dropout color through strict control. The result and Therefore, OCR format reading systems currently in use are generally “closed loop”. This is because formats produced by outside companies may not read properly due to color variations. The form processing company (e.g. insurance company) may not be able to assist you in printing the form. It means you have to maintain control.

この発明では、走査器はすべての画像を三つの原色、赤、緑及び青に分解するで あろう。画像の白黒表現は単に二つの色成分を加えることによって生成されるこ とができる。赤、緑及び青信号を独立して処理することによって、装置がすべて の色をフィルタして、OCR読取りのために高コントラストの本文だけを残すよ うに、共通の白!情報から色情報を分離することができる。In this invention, the scanner can separate all images into three primary colors: red, green and blue. Probably. A black and white representation of an image can be created simply by adding the two color components. I can do it. By processing the red, green and blue signals independently, the device Filter the colors to keep only high-contrast text for OCR reading. Uni, common white! Color information can be separated from information.

発咀■回示 この発明においては、すべての画素の間で一様な色及び振幅応答を確保するため に三つのディジタルチャネルが適当な係数により乗算される。この三つの信号は 、−たん一様性のために補正されると、独立したビデオ信号として処理されて画 像の三つの二進値表現を生成する。この信号を、三つのすべてのチャネルに共通 の情報だけを保存するような方法で組み合わすことによって、任意のカラー事前 印刷情報から「黒色」本文を分離することができるr全色」フィルタが生成され る。実効上、二つの出力は色空間におけるドロップアウトカラーのすべての可能 な組合せを用いて書類画像を表現する。Dispatch■Return In this invention, to ensure uniform color and amplitude response among all pixels, The three digital channels are multiplied by appropriate coefficients. These three signals , - once corrected for uniformity, is processed as an independent video signal and displayed in the image. Generate three binary representations of the image. This signal is common to all three channels. By combining in such a way that only the information of A "full color" filter is generated that can separate "black" text from print information. Ru. Effectively, the two outputs represent all possible dropout colors in the color space. A document image is expressed using a combination of

区回Ω固拳な説所 図1はカラー走査のために使用され得る固体電荷結合素子の形態を図解しており 、 図2はこの発明による電子的カラーフィルタリングのために使用される回路の構 成図を図示しており、又 図3A−Bは白黒校正と関連して使用される流れ図を図解している。Ward episode Ω solid fist preaching place Figure 1 illustrates a solid-state charge-coupled device configuration that can be used for color scanning. , FIG. 2 shows the structure of the circuit used for electronic color filtering according to the invention. The composition diagram is illustrated, and 3A-B illustrate a flowchart used in connection with black and white proofing.

発肌を1施1ゑ方法 図1はプログラム可能なドロップアウトカラーを生成するために使用される電子 的走査器の典型例を図解している。この走査器はすべての画像を三つの原色、赤 、緑、及び青、に分解するであろう1画像の白黒表現(典型的な電子的走査器が 今日生成するようなもの)は単に三つの色成分を加えることによって生成される ことができる。1 treatment 1 method for skin regrowth Figure 1 shows the electronics used to generate programmable dropout colors. A typical example of a digital scanner is illustrated. This scanner scans all images in three primary colors, red , green, and blue (a typical electronic scanner (such as the one we generate today) is generated by simply adding the three color components be able to.

この発明の装置における使用のために意図された電子的走査器は、トシμ(To shiba)により作られたモデルTCD126Cとして現在入手可能な「接触 形JCCD (電荷結合素子)10に基づいている。このCODは実際には単一 の基板上の数個のCCD配列であって、1200画素/画素子の水平解像度を持 っており且つ12インチの長さがある。大抵のOCRアルゴリズムは200ない し400画素/インチの走査解像度で正確に読取りを行うことができるので、色 検出のためには付加された解像度を使用することができる。そのような検出は適 当な赤、緑及び青の光学的フィルタで隣接画素を覆うことによって実施されるが 、これらのフィルタのスペクトル内容はCCD素子自体のスペクトル特性に基づ いている。The electronic scanner intended for use in the device of this invention is ``Contact'' currently available as model TCD126C made by It is based on the JCCD (charge coupled device) 10. This COD is actually a single several CCD arrays on a substrate with a horizontal resolution of 1200 pixels/pixel. It has a length of 12 inches. Most OCR algorithms are less than 200 400 pixels/inch scanning resolution allows for accurate reading Additional resolution can be used for detection. Such detection is This is done by covering adjacent pixels with appropriate red, green and blue optical filters. , the spectral content of these filters is based on the spectral characteristics of the CCD element itself. I'm there.

図1に示されたように、三つの隣接したセル12.14、及び16は、単一のr 1画素」18を形成していて、それぞれ赤、緑及び青の光学的フィルタ20、赤 26、緑28、及び青30のビデオ信号の三チャフル出力を含んでいる。As shown in FIG. 1, three adjacent cells 12, 14, and 16 are connected to a single r 1 pixel" 18, red, green and blue optical filters 20, red respectively, 26, green 28, and blue 30 video signals.

図2はOCR読取りのための自動的本文分離、及び全画像捕獲における使用のた めのブロフク図を図示している。カラー走査器10は画素当り三つのビデオ信号 −赤26、緑28、及び青30−を各走査線に対して区分化方式で出力すす。こ れらのR,G、B信号はそれぞれのA/D変換器32.34及び36によってグ レースケールディジタル表現に変換される。各画素の赤、緑、及び青成分は次に それぞれ乗算器38.40及び42に供給される。Figure 2 shows automatic text separation for OCR reading and for use in full image capture. This diagram shows the first blog diagram. Color scanner 10 has three video signals per pixel. - 26 red, 28 green, and 30 blue colors are output in a segmented manner for each scan line. child These R, G, and B signals are grouped by respective A/D converters 32, 34, and 36. Converted to a race-scale digital representation. The red, green, and blue components of each pixel are are fed to multipliers 38, 40 and 42, respectively.

マイクロプロセッサ・RAM記憶サブシステム52は走査線内の各画素を監視し て、画素ビデオデータと校正係数38.40及び42との間の適当な相関を確保 し、これらの係数はそのそれぞれの色チャネルに対する対応する乗算器46.4 8及び50に送られる。これらの乗算器の出力は、グレースケールカラー画像と して使用され得る校正された赤56、緑57、及び青58i!ii素の区分化ピ ント流の形式になっている。この校正色情報は又加金せ接合部59に供給され、 ここで各画素に対する三つの色成分は加えられて、その出力としてグレースケー ル白黒画像を形成する。加えて、校正赤56、緑57、及び青58ビデオデータ は診断目的のためにマイクロプロセッサ・RAM記憶サブシステム52に供給さ れる。A microprocessor and RAM storage subsystem 52 monitors each pixel within the scan line. to ensure proper correlation between pixel video data and calibration coefficients 38, 40 and 42. and these coefficients are applied to the corresponding multipliers 46.4 for their respective color channels. 8 and 50. The output of these multipliers is a grayscale color image and Calibrated Red 56, Green 57, and Blue 58i! ii element segmentation pi It has a modern style. This calibration color information is also supplied to the gilding joint 59, Here the three color components for each pixel are added and the output is a grayscale form a black and white image. In addition, calibration red 56, green 57, and blue 58 video data is provided to the microprocessor/RAM storage subsystem 52 for diagnostic purposes. It will be done.

校正赤56、緑57、及び青58ビデオデータは又、赤、緑及び青に対してlピ ッ)/N素ビデオデータを生成するそれぞれのしきい値回路41.43及び45 によって処理される。しきい値回路41.43及び45は単純な比較器の形式を していてもよく、又は適応しきい値設定を有するMXN畳込みフィルタのように 精巧なものでもよい、各しきい値回路41.43及び45の出力は二進値であっ て、rl、が「暗」画素に対応し、且つ「0」が「明」画素に対応している。The calibrated red 56, green 57, and blue 58 video data is also )/N element video data generating threshold circuits 41, 43 and 45, respectively; Processed by Threshold circuits 41, 43 and 45 take the form of simple comparators. or like an MXN convolution filter with adaptive threshold settings. The output of each threshold circuit 41, 43 and 45, which may be sophisticated, is a binary value. , rl corresponds to a "dark" pixel, and "0" corresponds to a "bright" pixel.

これらの二進値信号の三つすべて(各画素に対する赤、緑及び前値に対応してい る)はANDゲート63に送られる。所与の画素の三つの色成分のうちのどれか が「明」すなわち「0」であるなちば、ANDゲートは「白」に対応して「0」 になる0画素の三つすべての色成分が「1」すなわち「暗」である場合には、A NDゲートの出力は「黒」に対応して「1」になる。All three of these binary signals (corresponding to red, green and previous value for each pixel) ) is sent to AND gate 63. Which of the three color components of a given pixel is "light" or "0", the AND gate corresponds to "white" and returns "0". If all three color components of the 0 pixel are "1", that is, "dark", then A The output of the ND gate becomes "1" corresponding to "black".

ANDゲート63の出力はパステルドロップアウトカラーを使用した典型的な書 式に対する「本文ノ出力と考えられ得る0色背景情報は除去されて、タイプされ た本文情報だけがOCRアルゴリズムへ送られる。例えば、ノンカーボン赤イン クで印刷されていてカーボン式リボンを用いたタイプライタで書き入れられた書 式はこの発明を用いて容易に処理されることができるであろう。すべての印刷賃 料(事前印刷された赤及びタイプされた属)の画像を生成するような通常の走査 システムとは異なり、この発明のシステムは事前印刷された赤を無視して、タイ プされた本文の画像だけを生成するであろう。The output of AND gate 63 is a typical book using pastel dropout colors. The 0-color background information that could be considered the ``body output'' for the expression is removed and typed. Only the text information that has been detected is sent to the OCR algorithm. For example, non-carbon red ink typewriter using carbon ribbon Equations could be easily processed using this invention. All printing fees Normal scanning to produce an image of the material (pre-printed red and typed genera) system, the system of this invention ignores the pre-printed red and will only generate an image of the typed text.

光学的赤フィルタを事前印刷情報のために使用されたインクの色とW&密に整合 させ且つ通常の走査システムと共にこのフィルタを用いることによって1(以の 結果を達成することができる。しかしながら、光学的赤フィルタは緑インクをド ロップアウトすることができないであろう。好都合にも、この発明は任意のノン カーボンインクを除去することができ、これによってより大きい順応性を与える 。Optical red filter closely matches the ink color used for pre-printed information 1 (below) by using this filter and with a conventional scanning system. able to achieve results. However, optical red filters do not drive green ink. Will not be able to drop out. Advantageously, this invention Carbon ink can be removed, thereby giving greater flexibility .

使用者はフィルタの変更を心配することなく種種の色の混在書類を使用すること ができるであろう。Users can use mixed-color documents without worrying about changing filters. will be possible.

従って、特定の書式において使用された任意のドロップアウトカラーは、書き入 れ本文のスペクトル内容についである仮定を行うことによって自動的に検出され 且つ抑制されることができる。事務用書式を書き入れるために使用された大抵の 本文は「カーボン主成分式Jとして類別化されることができる。この類別には大 抵のタイプ書きリボン、ペン又は鉛筆が含まれる。そのような本文は使用された 任意の色フィルタに関係なく興として通用するであろうから、本文は「全色フィ ルタ」を適用することによって任意の事前印刷色情報から分離されることができ る。Therefore, any dropout color used in a particular format will detected automatically by making certain assumptions about the spectral content of the text. and can be suppressed. most used for filling out office forms The main text is ``Carbon can be classified as principal component formula J. Includes standard typing ribbon, pen or pencil. Such a text was used Since it will work regardless of any color filter, the main text is ``all color filters''. Any pre-printed color information can be separated from Ru.

車色校正 白色校正は画素ごとの方式で任意のスペクトル異常又は感度変動を補償すること により走査器性能を最適化するために使用されることができる。ここで論述され た白色校正方法は、補償が運転の直前に行われ、このために老化又はTIJ損に よる差異をも補償することができるので、走査器からの一様な応答を確保するた めの好適な方法である。car color calibration White calibration is a pixel-by-pixel method to compensate for any spectral anomalies or sensitivity variations. can be used to optimize scanner performance. discussed here In the white calibration method, the compensation is done immediately before operation, which prevents aging or TIJ losses. To ensure a uniform response from the scanner, This is the preferred method.

白色(空白)紙片をカラー走査器を通して供給すると、三つすべてのカラー信号 が同時に働く。白色紙片は既知の予測可能なスペクトル曲線を持っているので、 色利得係数は走査器がこの理想的応答をまねることを可能にするような方法でプ ログラムされることができる。図3A及びBは白色校正を実施するための流れ図 を示している。段階(ステップ)80は赤、緑及び青の利得係数のすべてを1の 値に設定するようにマイクロプロセッサ・RAM記憶サブシステム52(図2) に要求し、次に段階82において(マイクロプロセッサ・RAM記憶サブシステ ム52に配置された)画素累算器のすべてはOに設定される。段階84において 、操作員は応答を校正するために白色紙片をカラー走査器を通して供給する。段 階86においてページの初めが検出されて校正過程が始まる。カラー走査器10 は、白紙書類の各水平線を走査するときに、順次式三色データ′f、(R,G、 B)を出力する。この情報は、各チャフルに対して一つずつの、A/D変換器3 2.34及び36によってディジタル化される。ディジタル化信号はそれぞれ乗 算器38.40及び42に送られる。マイクロブロセ、す52が前にすべての利 得を1の値に設定しているので、各乗算器の出力は各画素のR,G、 B値に等 価である。マイクロプロセッサ52はこの順次式線のグレースケール色情報を段 階88においてそれ自体の記憶装置(RAM)内に捕獲し、そして次に段階90 に従って各画素の赤、緑及び青の値を適当な累算器に加える。When a white (blank) piece of paper is fed through a color scanner, all three color signals are detected. work at the same time. Since a piece of white paper has a known and predictable spectral curve, The color gain factor is programmed in such a way as to allow the scanner to mimic this ideal response. can be programmed. Figures 3A and B are flowcharts for performing white calibration. It shows. Step 80 sets all of the red, green and blue gain factors to 1. microprocessor-RAM storage subsystem 52 (FIG. 2) to set the value to and then in step 82 (microprocessor RAM storage subsystem All of the pixel accumulators (located in system 52) are set to O. In step 84 , the operator feeds a piece of white paper through the color scanner to calibrate the response. step At floor 86, the beginning of the page is detected and the proofing process begins. color scanner 10 When scanning each horizontal line of a blank document, sequential three-color data 'f, (R, G, B) is output. This information is transmitted to the A/D converter 3, one for each chaffle. 2.34 and 36. The digitized signals are each multiplied by It is sent to calculators 38, 40 and 42. Microblosse, Su 52 has all the benefits before Since the value is set to 1, the output of each multiplier is equal to the R, G, and B values of each pixel. It is worth it. The microprocessor 52 converts the grayscale color information of this sequential line into stages. capture into its own memory (RAM) at step 88 and then step 90 Add the red, green and blue values of each pixel to the appropriate accumulators accordingly.

マイクロプロセッサは各画素に対するR、 G、及びB値のための別別の累算器 を保持している(累算器の総数=3×水平画素の数〕。この累算過程はページの 終わりが段階92において検出されるまで継続する。処理された線の総数は段階 94において線計数器によって保持される。ページの走査が完了すると、マイク ロプロセッサ52は各累算器値を線計数(捕獲された線の数)で除算することに よって段階96において各画素に対する平均赤、緑、及び前値を計算する。この 情報は各水平画素に対する平均色応答に対応している。The microprocessor has separate accumulators for R, G, and B values for each pixel. (total number of accumulators = 3 x number of horizontal pixels). This accumulation process The process continues until the end is detected at step 92. The total number of lines processed is in stages 94 by a line counter. Once the page has been scanned, the microphone The processor 52 divides each accumulator value by the line count (number of lines captured). Thus, in step 96, the average red, green, and previous values for each pixel are calculated. this The information corresponds to the average color response for each horizontal pixel.

この色応答が知られると、赤、緑、及び青係数は段階98において各画素に対し て計算されることができる。これは応答を「正規化する」ために行われるが、こ の正規化は各画素が類イ以の入力を与えられた場合類憤の方法で応答することを 保証する。利得係数は理想的又は最適R,G、 B応答を各画素の平均R,G、 B応答で除算することによって計算される。最適応答は白色人力に対する理想的 R。Once this color response is known, the red, green, and blue coefficients are determined for each pixel in step 98. can be calculated as follows. This is done to "normalize" the response, but this Normalization means that each pixel responds in a similar manner when given inputs of similar type A or higher. Guarantee. The gain coefficient is the ideal or optimal R, G, B response for each pixel. Calculated by dividing by the B response. Optimal response is ideal for white human power R.

G、B値に基づいている。利得係数は、画素当り3、計算されると、段階100 に従って二重ポート式記憶装置(図示されていないが、マイクロプロセ、す・R AM記憶サブすステムの一部分)に記憶され、マイクロプロセッサ・RAM記憶 サブシステム52はそれによって白色校正過程を完了する。−たん校正されると 、装置(図2)は各画素の赤、緑及び青ビデオ値を画像補償係数で乗算すること によって任意の色又は利得異常を補償することができる。動作中、カラー走査器 IOは各水平画素に対する赤、緑及び青信号を順次出力し、そして各カラー信号 はA/D変換器32.34及び36によってディジタル化される。各画素に対す るディジタルグレースケール色情報は次にそれぞれ乗算器回路38.40及び4 2に送られる。マイクロプロセッサ・RAM記憶サブシステム52は水平走査に おける各画素に対する独特のRlG、B利得係数を呼び出して、これらの係数を 三つの乗算器に同時に与え、これにより各画素の赤、緑及び前値をこれらの対応 する利得係数で乗算する。これらの乗算器の出力は各画素に対する正規化赤、緑 及び前値を表している0校正を行い、各画素に対する独特の色利得係数を記憶し 、その後利得係数を用いて各画素に対するR、G、B応答を正規化することによ って、カラー走査器10の出力は正しい一様なスペクトル応答に対して平衡させ られる。Based on G and B values. The gain factor is 3 per pixel, calculated in steps 100 A dual-port storage device (not shown, but a microprocessor, A part of the AM memory subsystem) and microprocessor/RAM memory. Subsystem 52 thereby completes the white calibration process. - Once calibrated , the device (Figure 2) multiplies the red, green and blue video values of each pixel by an image compensation factor. Any color or gain anomaly can be compensated for by In operation, color scanner The IO sequentially outputs red, green and blue signals for each horizontal pixel, and each color signal are digitized by A/D converters 32, 34 and 36. for each pixel The digital grayscale color information is then applied to multiplier circuits 38, 40 and 4, respectively. Sent to 2. The microprocessor/RAM storage subsystem 52 is configured for horizontal scanning. Call the unique RlG,B gain coefficients for each pixel in The red, green, and previous values of each pixel are applied to three multipliers simultaneously, thereby converting the red, green, and previous values of each pixel into their corresponding Multiply by the gain factor. The output of these multipliers is the normalized red, green for each pixel. and zero calibration representing the previous value and memorize the unique color gain coefficient for each pixel. , by then normalizing the R, G, B response for each pixel using a gain factor. Therefore, the output of color scanner 10 is balanced for the correct uniform spectral response. It will be done.

この発明はその特定の実施例に関連して説明されたが、多くの代替例、変更例、 及び変形例が前述の説明に照らして技術に通した者に明らかであることは明白で ある。従って、添付の諸請求項の精神及び広い範囲内に入るようなすべての代替 例、変更例、及び変形例を包含することが意図されている。Although this invention has been described in connection with particular embodiments thereof, many alternatives, modifications, and and variations thereof will be apparent to those skilled in the art in light of the foregoing description. be. Therefore, all alternatives that come within the spirit and broad scope of the appended claims. Examples, modifications, and variations are intended to be covered.

占び の゛ この発明は色情報の自動的フィルタリングにより書式における本文情報を分離す る方法として光学式文字認識システムと関連して事務用書式を処理するために有 効である。この走査器システムはすべての画像を三つの原色、すなわち赤、緑及 び青へ分解するであろう0画像の白黒表現は単に三つの色成分を加えることによ って生成されることができる。この発明は機械的フィルタ挿入と関連したドロッ プアウトカラー能力問題を除去するのに有利である。この変化性は書式に使用さ れたインクの色の印刷バッチごとに変化することによって引き起こされ得るので 、機械的フィルタは許容範囲外のインクで印刷された書式における印刷本文を除 去するのに無能であった。Fortune-telling This invention separates text information in a format by automatically filtering color information. Useful for processing office forms in conjunction with optical character recognition systems as a method of It is effective. This scanner system scans all images in three primary colors: red, green and The black and white representation of the 0 image, which would be decomposed into blue and blue, can be achieved by simply adding three color components. can be generated. The present invention provides a droplet associated with mechanical filter insertion. Advantageous in eliminating pull-out color capability problems. This variability is used in formatting. This can be caused by the color of the ink changing from printing batch to printing batch. , mechanical filters remove printed text on forms printed with non-acceptable inks. He was incompetent to leave.

そのうえ、この発明はバッチ内に異なった色の書類を混在させること且っ又単− の書類に種種のドロップアウトカラーを持たせること(例えば、赤及び青の事前 印刷情報ををする書式)を可能にする。この発明の使用なしで、従来技術におい て実施されたように機械的フィルタ挿入を用いてこれを実施することは不可能で あろう。Moreover, the present invention allows for the mixing of different colored documents within a batch and the ability to Documents with different dropout colors (e.g. red and blue pre-printed) (format that prints information). Without the use of this invention, the prior art It is not possible to do this using mechanical filter insertion as was done in Probably.

FfG、3B 事前印刷書式の光学式文字認識のために多数ドロンプアウトカラーの自動的な電 子的フィルタリングを用いた自動的本文分離のための方法及び装置 !−的−1 事務用書式を満たすために使用された本文が「カーボン主成分式Jとして類別化 されることができ且つこのような本文が使用された任意の色フィルタに関係なく 黒として通用するであろうという仮定に基づいて事前印刷資料から本文を分離す るための方法及び装置。本文は「全色フィルタ」を適用することによって任意の 事前印刷色情報から分離されることができる。FfG, 3B Automatic electronics with multiple drop-out colors for optical character recognition of pre-printed forms. Method and apparatus for automatic text separation using child filtering ! -Target-1 The text used to fill out the office form was classified as ``Carbon Principal Component Formula J''. and such a body can be used regardless of any color filter used. Separate text from pre-printed material based on the assumption that it will pass as black. method and apparatus for The main text can be changed to any color by applying the "all color filter". Can be separated from preprint color information.

国際調査報告 。rTVl、。017ncnA111−一ユニ叩にと?叩−−− −−−−−1に二?を二2o−−−−老二うニー−5oo6艷2−−−−一門二 叩二艶−−−□ □International search report. rTVl,. 017ncnA111-To hit Uni? Hit--- ------1 to 2? 22 o----old 2 nee-5oo6 艷2----ichimon 2 Tapping two gloss---□ □

Claims (11)

【特許請求の範囲】[Claims] 1.カラー走査器によって発生された三成分カラー信号を、前記の信号成分が、 各色成分と関連したアナログ1ディジタル変換器によって画素ごとの方式でグレ ースケールディジタル形式に変換された後に処理するための装置であって、それ ぞれが画素の赤、緑及び青成分に対応している三つの二進値、1ビット毎画素ビ デオ信号を生成するためのカラービデオ信号のそれぞれに対する処理装置、並び に 二進値カラー信号のすべてが画素を黒であると同定したときにだけ黒情報を保存 するように前記のカラービデオ信号を組み合わすための装置、によって特徴づけ られている前記の三成分カラー信号を処理するための装置。1. A three-component color signal generated by a color scanner is defined by the signal components as follows: Graying is performed on a pixel-by-pixel basis by an analog-to-digital converter associated with each color component. - A device for processing after conversion to scale digital format, which Three binary values, one bit per pixel bit, each corresponding to the red, green and blue components of the pixel. a processing device for each of the color video signals to produce a video signal; to Stores black information only when all of the binary color signals identify a pixel as black a device for combining said color video signals, characterized by An apparatus for processing said three-component color signal. 2.組合せ装置がANDゲートの形式をとっている、請求項1に記載の装置。2. 2. The device of claim 1, wherein the combination device is in the form of an AND gate. 3.前記の組合せ装置の出力が、OCR読取りのために適した1ビット毎画素区 分化走査線である、請求項2に記載の装置。3. The output of the combination device described above is in one bit per pixel section suitable for OCR reading. 3. The device of claim 2, which is a differentiated scan line. 4.走査線内の各画素を三つの色成分により表現されたような振幅及び色応答に ついて補償するための装置を更に備えている、請求項1に記載の装置。4. Each pixel in a scan line has an amplitude and color response as represented by three color components. 2. The device of claim 1, further comprising a device for compensating for. 5.カーボン主成分のインクを用いて書き入れられたカラー書式を処理するため の装置であって、 赤、緑及び青成分を持った区分化画素を有する走査線を発生する複数のグレース ケールカラー出力を有するカラー走査器、各出力を画素ごとの方式でグレースケ ールディジタル形式に変換するための装置、 カラーグレースケール情報の少なくとも一つの走査線を記憶するための記憶装置 、 走査線内の各画素を三つの色成分により表されたような振幅及び色応答について 補償するための装置、 カラービデオ信号のそれぞれを処理して、それぞれが画素の赤、縁及び青成分に 対応している三つの二進値1ビット毎画素ビデオ信号を生成するようにするため の装置、並びに 前記の二進値カラー出力のすべてが画素を黒であるとして表示しているときに、 カーボン主成分のインクと関連した黒情報を保存するように前記の二進値カラー 情報を組み合わすための装置、 によって特徴づけられている、前記のカラー書式を処理するための装置。5. To process color formats written using carbon-based inks A device, Multiple grays that generate scan lines with segmented pixels with red, green, and blue components A color scanner with scale color outputs, each output grayscaled in a pixel-by-pixel manner. equipment for converting files into digital format; a storage device for storing at least one scan line of color grayscale information; , For amplitude and color response such that each pixel in a scan line is represented by three color components equipment for compensating; Processes each of the color video signals to separate the red, edge and blue components of the pixel. In order to generate a corresponding three binary value 1 bit per pixel video signal equipment, and While all of the binary color outputs above are displaying the pixel as being black, Binary color to preserve the black information associated with carbon-based ink devices for combining information; Apparatus for processing said color format, characterized by: 6.補償装置がディジタル乗算器の形式をとっている、請求項5に記載の装置。6. 6. Apparatus according to claim 5, wherein the compensation device is in the form of a digital multiplier. 7.カーボン主成分のインクを用いて書き入れられたカラー書式を処理する方法 であって、 カラー書式を走査して、各色成分に対する区分化画素を有する少なくとも二つの グレースケールカラー出力を発生する段階、各出力を画素ごとの方式でグレース ケールディジタル形式に変換する段階、各グレースケール色成分の少なくとも一 つの走査線を記憶する段階、走査線内の各画素を各色成分により表現されたよう な振幅及び色応答について補償する段階、 カラービデオ信号のそれぞれを処理して、それぞれが各画素に対する色成分に対 応している三つの二進値1ビット毎画素ビデオ信号を生成する段階、並びに前記 の二進値カラー情報を比較して、色成分のすべてが画素を黒として表示している ときに、カーボン主成分のインクと関連した黒情報を保存するようにする段階、 によって特徴づけられている前記の方法。7. How to process color formatting written using carbon-based inks And, Scan the color format to create at least two segmented pixels for each color component. The stage of generating grayscale color output, grading each output in a pixel-by-pixel manner. converting to scale digital format, at least one of each grayscale color component; A step in which each pixel in a scan line is stored as represented by each color component. compensating for amplitude and color response; Each color video signal is processed so that each color component corresponds to each pixel. generating three corresponding binary bit-per-pixel video signals; Comparing the binary color information of, all of the color components display the pixel as black. a step of preserving black information associated with carbon-based ink; Said method characterized by. 8.組み合わす段階が前記の出力のすべての論理積をとることを意味している、 請求項7に記載のカラー書式を処理する方法。8. the combining step is meant to AND all of said outputs; A method for processing color formats according to claim 7. 9.組合せ出力がOCR読取りに適している、請求項7に記載のカラー書式を処 理する方法。9. Processing a color format according to claim 7, wherein the combined output is suitable for OCR reading. How to manage. 10.グレースケールカラー出力の和がグレースケール白黒画像を生成する、請 求項7に記載のカラー書式を処理する方法。10. The sum of the grayscale color outputs produces a grayscale black and white image. A method for processing color formatting as described in claim 7. 11.グレースケールカラー出力信号がグレースケールカラー画像を生成する、 請求項7に記載のカラー書式を処理する方法。11. the grayscale color output signal produces a grayscale color image; A method for processing color formats according to claim 7.
JP3512695A 1990-07-24 1991-07-18 Method and apparatus for automatic text separation using automatic electronic filtering of multiple dropout colors for optical character recognition of preprinted forms Pending JPH05501778A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US55729490A 1990-07-24 1990-07-24
US557,294 1990-07-24

Publications (1)

Publication Number Publication Date
JPH05501778A true JPH05501778A (en) 1993-04-02

Family

ID=24224826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3512695A Pending JPH05501778A (en) 1990-07-24 1991-07-18 Method and apparatus for automatic text separation using automatic electronic filtering of multiple dropout colors for optical character recognition of preprinted forms

Country Status (3)

Country Link
EP (1) EP0491923A1 (en)
JP (1) JPH05501778A (en)
WO (1) WO1992001998A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193429A (en) * 2008-02-15 2009-08-27 Mitsubishi Electric Corp Image reading device
JP2010244331A (en) * 2009-04-07 2010-10-28 Mitsubishi Electric Corp Image reading device

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9202127B2 (en) 2011-07-08 2015-12-01 Qualcomm Incorporated Parallel processing method and apparatus for determining text information from an image

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5003613A (en) * 1988-12-21 1991-03-26 Recognition Equipment Incorporated Document processing system and method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193429A (en) * 2008-02-15 2009-08-27 Mitsubishi Electric Corp Image reading device
US7936488B2 (en) 2008-02-15 2011-05-03 Mitsubishi Electric Corporation Image reading apparatus
JP2010244331A (en) * 2009-04-07 2010-10-28 Mitsubishi Electric Corp Image reading device

Also Published As

Publication number Publication date
WO1992001998A1 (en) 1992-02-06
EP0491923A1 (en) 1992-07-01

Similar Documents

Publication Publication Date Title
JP3132829B2 (en) Color image information reading device
CN102318330B (en) Image processing system for processing a digital image and image processing method of processing a digital image
EP0491941B1 (en) Automatic detection and selection of a drop-out color using zone calibration in conjunction with optical character recognition of preprinted forms
US7580569B2 (en) Method and system for generating contone encoded binary print data streams
US6035058A (en) Automatic color dropout using luminance-chrominance space processing
EP0168818A2 (en) Color image copying apparatus
JPH06501144A (en) How to display multitone images
US7436994B2 (en) System of using neural network to distinguish text and picture in images and method thereof
US5764816A (en) Image forming apparatus capable of converting the resolution
US8184340B2 (en) Method for color rendering using scanned halftone classification
EP0586139A2 (en) Printing apparatus and method for more than five colors
JPH05501778A (en) Method and apparatus for automatic text separation using automatic electronic filtering of multiple dropout colors for optical character recognition of preprinted forms
US6693731B1 (en) Image processing apparatus and method
US20060232797A1 (en) Image processing for expressing gradation
US7251030B2 (en) Digital workflow independent output matching
JP4039176B2 (en) Color image processing device
JP3121026B2 (en) Color image processing equipment
JP3037336B2 (en) Color copier
JPH01192561A (en) Image information processing system
JPS6110362A (en) Color picture output device
JP4322639B2 (en) Color pixel data conversion apparatus, color pixel data conversion program, computer-readable recording medium recording color pixel data conversion program, and data conversion method
JP2547738B2 (en) Color image processing device
JP2000324512A (en) Color image printer
Choi et al. Color printer calibration technique based on human visual perception
JP3103083B2 (en) Image processing method