JPS63204488A - 光学式文字読取装置 - Google Patents
光学式文字読取装置Info
- Publication number
- JPS63204488A JPS63204488A JP62035786A JP3578687A JPS63204488A JP S63204488 A JPS63204488 A JP S63204488A JP 62035786 A JP62035786 A JP 62035786A JP 3578687 A JP3578687 A JP 3578687A JP S63204488 A JPS63204488 A JP S63204488A
- Authority
- JP
- Japan
- Prior art keywords
- scanning
- word
- image signal
- character
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012015 optical character recognition Methods 0.000 title 1
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 238000003384 imaging method Methods 0.000 claims description 9
- 230000003287 optical effect Effects 0.000 claims description 9
- 230000007246 mechanism Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 5
- 239000000872 buffer Substances 0.000 abstract description 21
- 238000013139 quantization Methods 0.000 abstract description 7
- 238000000034 method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 6
- 238000005286 illumination Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は光学式文字読取装置(以下、OCRと略す)に
関し、特に英語文書などを光学的に走査し、その文章を
構成する単語の切出しに関するものである。
関し、特に英語文書などを光学的に走査し、その文章を
構成する単語の切出しに関するものである。
(従来の技術)
従来、英語文字などの外国文書を電子的に処理する方法
としては、文書を光学的に走査し、光電変換して得られ
たデータをイメージファイルとして保存する、いわゆる
イメージリーダがある。しかし、イメージリーダでは保
存するイメージ量が莫大となるため、ファイル量が非常
に多くなシ価格も高価となってしまう。
としては、文書を光学的に走査し、光電変換して得られ
たデータをイメージファイルとして保存する、いわゆる
イメージリーダがある。しかし、イメージリーダでは保
存するイメージ量が莫大となるため、ファイル量が非常
に多くなシ価格も高価となってしまう。
そこでこのような欠点を避けるため、文書上の文字を文
字認識によってコード化し、文字コードとして保存する
方法があり、この手段としてOCRが提供されている。
字認識によってコード化し、文字コードとして保存する
方法があり、この手段としてOCRが提供されている。
第3図は従来のOCRの一構成例を示すブロック図であ
る。同図において、1は読取るべき文書の記載された帳
票、2は文書を構成する文字群から成る文字行を完全に
含む形で光学的走査をすべき範囲を示す走i範囲、3は
光学的走査の主走査線、4は副走査方向、5は結像レン
ズ、6は光電変換素子、7は棒状ランプ、8は光電変換
素子の出力をアナログ的に量子化処理する量子化回路、
9は量子化回路からの出力を格納するイメージバッファ
、10はイメージバッファからの出力に基づき文字の切
シ出しを行う文字切出し回路、11は切シ出された文字
の認識を行う文字認識回路、12は文字コードを出力す
る端子である。
る。同図において、1は読取るべき文書の記載された帳
票、2は文書を構成する文字群から成る文字行を完全に
含む形で光学的走査をすべき範囲を示す走i範囲、3は
光学的走査の主走査線、4は副走査方向、5は結像レン
ズ、6は光電変換素子、7は棒状ランプ、8は光電変換
素子の出力をアナログ的に量子化処理する量子化回路、
9は量子化回路からの出力を格納するイメージバッファ
、10はイメージバッファからの出力に基づき文字の切
シ出しを行う文字切出し回路、11は切シ出された文字
の認識を行う文字認識回路、12は文字コードを出力す
る端子である。
以上のように構成されるOCRの動作について説明する
。
。
先ず、棒状ランプ7で帳票1上を照射し、その反射光を
結像レンズ5を介して光電変換素子6に結像させる。こ
の時点で、光電変換センサ6の出力は帳票上の文字の濃
淡に比例した電気信号となっておシ、この電気信号を量
子化回路8でアンプ等のアナログ処理後適当な閾[直に
よって量子化し、これをイメージバッファ9に格納する
。上記動作が終了した時点でイメージバッファ9には主
走査線3に該当する画像が格納されたことになる。
結像レンズ5を介して光電変換素子6に結像させる。こ
の時点で、光電変換センサ6の出力は帳票上の文字の濃
淡に比例した電気信号となっておシ、この電気信号を量
子化回路8でアンプ等のアナログ処理後適当な閾[直に
よって量子化し、これをイメージバッファ9に格納する
。上記動作が終了した時点でイメージバッファ9には主
走査線3に該当する画像が格納されたことになる。
次に副走査を副走査方向4の向きに行い、前述と同様の
動作を順次実施し、走査範囲2の全域の画像信号をイメ
ージバッファ9へ格納する。ここで、副走査の数は予め
設定された固定値であシ、図示しない制御回路で制御さ
れる。文字切出回路10は、この制御回路によシ副走査
範囲2の走査完了時に指令を受け、イメージバッファに
格納されている量子化画像の処理を行い、1文字分の画
像を切出して文字認識部11へ送出する。そして文字認
識された結果は、文字コードとして端子12から例えば
外部機器等に出力される。この動作を順次行い、イメー
ジバッファ9に格納されている画像全体について文字認
識処理を行い、当該読取行に対する認識処理を終了する
。
動作を順次実施し、走査範囲2の全域の画像信号をイメ
ージバッファ9へ格納する。ここで、副走査の数は予め
設定された固定値であシ、図示しない制御回路で制御さ
れる。文字切出回路10は、この制御回路によシ副走査
範囲2の走査完了時に指令を受け、イメージバッファに
格納されている量子化画像の処理を行い、1文字分の画
像を切出して文字認識部11へ送出する。そして文字認
識された結果は、文字コードとして端子12から例えば
外部機器等に出力される。この動作を順次行い、イメー
ジバッファ9に格納されている画像全体について文字認
識処理を行い、当該読取行に対する認識処理を終了する
。
全く同様の動作を帳票1の読取面全体について順次行う
ことにより、当該帳票の文字認識処理が完了することに
なる。
ことにより、当該帳票の文字認識処理が完了することに
なる。
ところで、当該帳票1の文字行の主走査開始位置検出方
法については、帳票上端からの距離によって予め定義し
たフォーマット情報を図示しない制御部に保存しておき
、副走査を実施する時に帳票の上端を検出し上記フォー
マット情報に基づき文字行を検出するようにしても良い
。この場合は、副走査は図示しない走行機構によって自
動的に副走査方向4と逆方向に帳票を移動させることに
よって行うか、又は結像レンズ5、光電変換部6、及び
棒状ランプ7を一体化しておき、これを副走査方向4に
沿って移動させるかの2つの方式が一般に良く知られて
いる。
法については、帳票上端からの距離によって予め定義し
たフォーマット情報を図示しない制御部に保存しておき
、副走査を実施する時に帳票の上端を検出し上記フォー
マット情報に基づき文字行を検出するようにしても良い
。この場合は、副走査は図示しない走行機構によって自
動的に副走査方向4と逆方向に帳票を移動させることに
よって行うか、又は結像レンズ5、光電変換部6、及び
棒状ランプ7を一体化しておき、これを副走査方向4に
沿って移動させるかの2つの方式が一般に良く知られて
いる。
また、以上のような光学的読取手段をいわゆる電子辞書
の入力方式に適用したものがある。電子辞書とは、ある
言語の単語又は熟語を他の言語の単語又は熟語に電子的
に翻訳する装置である。この場合も上記OCRと同様に
、光学的走査すべき走査範囲3内の原語を走査し、走査
して得られた原語の画像データから各文字の切出しを行
い、翻訳部で切出した文字を認識するとともに翻訳し、
この文字コードにより表示パネルに翻訳言語を表示させ
る。
の入力方式に適用したものがある。電子辞書とは、ある
言語の単語又は熟語を他の言語の単語又は熟語に電子的
に翻訳する装置である。この場合も上記OCRと同様に
、光学的走査すべき走査範囲3内の原語を走査し、走査
して得られた原語の画像データから各文字の切出しを行
い、翻訳部で切出した文字を認識するとともに翻訳し、
この文字コードにより表示パネルに翻訳言語を表示させ
る。
(発明が解決しようとする問題点)
しかしながら、上記OCRや電子辞書には次のような問
題点があった。
題点があった。
OCRはイメージリーダによる電子ファイリングと比較
すると価格的には優利であるが、文書の記載された帳票
全体を走査するだめの機構を必要とするだめ、装置が大
型化しかつ手軽に使用できる価格で提供できず、その結
果大巾な普及には至っていなかった。
すると価格的には優利であるが、文書の記載された帳票
全体を走査するだめの機構を必要とするだめ、装置が大
型化しかつ手軽に使用できる価格で提供できず、その結
果大巾な普及には至っていなかった。
また、文章というものは文章の中の特定のキーワードを
保存しておけば文書全体を構成する各文字を保存してお
かなくても文書を再現できるという点に着目し、上記O
CRや電子辞書で文章中の特定の1単語を読取シたい場
合でも、これらの装置は走査範囲内のすべての単語につ
いて読取ってしまい読取った単語の中から特定の1単語
を抽出(切出し)を行うことはできなかった。このため
、OCRや電子辞書に保存機能(バッファ以外のメを格
納し、これらのすべてを印−又は表示出力させていた。
保存しておけば文書全体を構成する各文字を保存してお
かなくても文書を再現できるという点に着目し、上記O
CRや電子辞書で文章中の特定の1単語を読取シたい場
合でも、これらの装置は走査範囲内のすべての単語につ
いて読取ってしまい読取った単語の中から特定の1単語
を抽出(切出し)を行うことはできなかった。このため
、OCRや電子辞書に保存機能(バッファ以外のメを格
納し、これらのすべてを印−又は表示出力させていた。
そこで本発明は上記問題点を解決し、特定の単語の読取
シを行うことのでき、かつ実用性の優れたOCRを提供
することを目的とする。
シを行うことのでき、かつ実用性の優れたOCRを提供
することを目的とする。
(問題点を解決するための手段)
本発明は前記問題点を解決するために、帳票上の読取対
象を光学的に走査して前記読取対象の認識処理を行う光
学式文字読取装置において、以下の手段を設けて構成さ
れる。
象を光学的に走査して前記読取対象の認識処理を行う光
学式文字読取装置において、以下の手段を設けて構成さ
れる。
上記光学式文字読取装置は、所定の走査範囲を光学的に
走査するため、照光された帳票からの反射光を電気的な
画像信号に変換し、該画像信号を出力するユニットと、
該ユニットからの画像信号を前記走査範囲に対応′する
格納範囲に格納する格納手段と、該格納範囲を走査する
ことにより各単語の間隔及び読取対象行間隔を検出して
該検出情報を出力し、かつ格納された画像信号から文字
の切出しを行う文字切出手段と、前記検出情報に基づき
画像信号から単語を特定し、特定した単語の画像信号に
ついて文字の切出しを行うように前記文字切出手段を制
御する単語切出手段と、前記文字切出手段によシ切出さ
れた文字の認識処理を行う認識手段とを具備して構成さ
れる。
走査するため、照光された帳票からの反射光を電気的な
画像信号に変換し、該画像信号を出力するユニットと、
該ユニットからの画像信号を前記走査範囲に対応′する
格納範囲に格納する格納手段と、該格納範囲を走査する
ことにより各単語の間隔及び読取対象行間隔を検出して
該検出情報を出力し、かつ格納された画像信号から文字
の切出しを行う文字切出手段と、前記検出情報に基づき
画像信号から単語を特定し、特定した単語の画像信号に
ついて文字の切出しを行うように前記文字切出手段を制
御する単語切出手段と、前記文字切出手段によシ切出さ
れた文字の認識処理を行う認識手段とを具備して構成さ
れる。
本発明の好適な実施態様としては、前記ユニットが帳票
を照光する光源と、帳票からの反射光を結像する結像レ
ンズと、結祿した反射光を画像信号に変換する光電変換
素子と、走査範囲の副走査方向の走査を行うための副走
査機構とから一体に、構成されることである。
を照光する光源と、帳票からの反射光を結像する結像レ
ンズと、結祿した反射光を画像信号に変換する光電変換
素子と、走査範囲の副走査方向の走査を行うための副走
査機構とから一体に、構成されることである。
(作用)
本発明は以上のようにOCRを構成したので、各技術的
手段の作用は次のようになる。
手段の作用は次のようになる。
本発明によるOCRにおいて、帳票上の読取対象の認識
する場合、先ず、操作者(オペレータ)はユニットによ
シ所望の読取対象を読取らせる。
する場合、先ず、操作者(オペレータ)はユニットによ
シ所望の読取対象を読取らせる。
すると該ユニットは帳票からの反射光を電気的な画像信
号に変換し、この画像信号を格納手段へ与える。格納手
段は、ユニットの走査範囲に対応した格納範囲に画像信
号を格納する。文字切出手段は単語切出手段の制御下に
て格納範囲を走査することにより各単語の間隔及び読取
対象行間の検出を行い、該検出情報に基づき単語切出手
段によって特定された単語の画像信号について文字の切
出しを行う。認識部はこのようにして切出された文字に
ついて認識処理を行う。
号に変換し、この画像信号を格納手段へ与える。格納手
段は、ユニットの走査範囲に対応した格納範囲に画像信
号を格納する。文字切出手段は単語切出手段の制御下に
て格納範囲を走査することにより各単語の間隔及び読取
対象行間の検出を行い、該検出情報に基づき単語切出手
段によって特定された単語の画像信号について文字の切
出しを行う。認識部はこのようにして切出された文字に
ついて認識処理を行う。
−以上のように本発明によれば、走査範囲内に入る複数
単語の中から各単語の切出しを行うことができ、走査範
囲の大小を任意に決定すれば特定の単語の切出しも可能
となる。よって従来技術の問題点を解決できるのである
。
単語の中から各単語の切出しを行うことができ、走査範
囲の大小を任意に決定すれば特定の単語の切出しも可能
となる。よって従来技術の問題点を解決できるのである
。
(実施例)
以下、本発明の一実施例について図面を参照して詳細に
説明する。
説明する。
第1図は本発明の一実施例によるOCRの内部構成を示
すブロック図であシ、図中従来技術の説明で用いた第3
図の構成要素と同一のものについては同一参照番号を附
しである。
すブロック図であシ、図中従来技術の説明で用いた第3
図の構成要素と同一のものについては同一参照番号を附
しである。
同図において、1は読取るべき帳票の記載された帳票で
あり、13.14は文章を構成する文章性である。15
は副走査開始位置、16は副走査終了位置、17は主走
査終了位置、18は主走査開始位置を示す。ここで主走
査範囲、副走査範囲はそれぞれ1単語長程度、文字群の
最大高さ程度に設定してあり、具体的には50 mm
+ 10mm程度である。19,20,21.22はO
CRの走査範囲に入った単語を示し、これは部分的に入
った単語も含む。
あり、13.14は文章を構成する文章性である。15
は副走査開始位置、16は副走査終了位置、17は主走
査終了位置、18は主走査開始位置を示す。ここで主走
査範囲、副走査範囲はそれぞれ1単語長程度、文字群の
最大高さ程度に設定してあり、具体的には50 mm
+ 10mm程度である。19,20,21.22はO
CRの走査範囲に入った単語を示し、これは部分的に入
った単語も含む。
23は帳票を照光するための照明用ランプである。
24は、照明用ランプ23、結像用レンズ5、光°電変
換素子6、及び副走査機構(図中省略)を一体構成した
手持式ユニットである。尚、副走査機構は回転ミラー等
の公知技術によって容易に構成できる。手持式ユニット
24 に内蔵された光電変換素子6の出力は、従来と同
様に量子化回路8に入力され、ここで量子化画像信号と
なってイメージバッファ9へ格納される。25は制御回
路(図中省略)の制御下において文字切出回路10 を
起動し、1単語の切出しを行う単語切出回路である。
換素子6、及び副走査機構(図中省略)を一体構成した
手持式ユニットである。尚、副走査機構は回転ミラー等
の公知技術によって容易に構成できる。手持式ユニット
24 に内蔵された光電変換素子6の出力は、従来と同
様に量子化回路8に入力され、ここで量子化画像信号と
なってイメージバッファ9へ格納される。25は制御回
路(図中省略)の制御下において文字切出回路10 を
起動し、1単語の切出しを行う単語切出回路である。
次に、本実施例の動作について説明する。
先ず、OCRを使用する人が前述の手持式ユニット24
を手に取シ、帳票1の所望する単語をねらってその位置
に手持式ユニット24を置く。この操作によって副走査
開始位置5が一意的に決定する。また、これとともにラ
ンプ13からの照射光が帳票1に当たシ、その反射光は
大きな値となるので量子化回路8でその変化が検知され
、該検知信号は図示しない制御回路へ供給される。そし
て該制御回路の指示によシ自動的に主走査が開始される
。
を手に取シ、帳票1の所望する単語をねらってその位置
に手持式ユニット24を置く。この操作によって副走査
開始位置5が一意的に決定する。また、これとともにラ
ンプ13からの照射光が帳票1に当たシ、その反射光は
大きな値となるので量子化回路8でその変化が検知され
、該検知信号は図示しない制御回路へ供給される。そし
て該制御回路の指示によシ自動的に主走査が開始される
。
1主走査終了後は、前記制御回路によって副走査機構(
図中省略)を駆動することにより順次副走査を行い、最
終的に副走査終了位置16まで走査することになる。以
上の走査により、15.16゜17、18で囲まれる走
査領域全体の量子化画像信号がイメージバッファ9に格
納される。
図中省略)を駆動することにより順次副走査を行い、最
終的に副走査終了位置16まで走査することになる。以
上の走査により、15.16゜17、18で囲まれる走
査領域全体の量子化画像信号がイメージバッファ9に格
納される。
ここで前述したように主走査範囲と副走査範囲は、それ
ぞれ50龍、10朋程度であるが、第1図に示すように
行間隔が狭くしかも1単語の長さが短い場合には走査範
囲(15,16,17,18で囲まれる範囲)には複数
行かつ複数単語が含まれることになる。即ち、単語19
,20,21.22がこれに該当する。尚、イメージバ
ッファの容量としては、光電変換する分解能を32本/
朋として、主走査方向1600ピツト、副走査方向32
0ビツトとなる。
ぞれ50龍、10朋程度であるが、第1図に示すように
行間隔が狭くしかも1単語の長さが短い場合には走査範
囲(15,16,17,18で囲まれる範囲)には複数
行かつ複数単語が含まれることになる。即ち、単語19
,20,21.22がこれに該当する。尚、イメージバ
ッファの容量としては、光電変換する分解能を32本/
朋として、主走査方向1600ピツト、副走査方向32
0ビツトとなる。
次に、単語切出回路25は、制御回路(図中省略)の制
御下において、文字切出回路10 を制御し、イメージ
バッファ9に格納された画像信号から単語の切出しを行
う。
御下において、文字切出回路10 を制御し、イメージ
バッファ9に格納された画像信号から単語の切出しを行
う。
この切出動作を第2図を参照して詳細に説明する0
第2図はイメージバッファの格納状態を示す図であシ、
第1図に示すものと同一のものには同一番号を附しであ
る。同図において、26.27は共に単語間のスペース
(間隔)を示し、28は行間を示している。
第1図に示すものと同一のものには同一番号を附しであ
る。同図において、26.27は共に単語間のスペース
(間隔)を示し、28は行間を示している。
単語の切出しにあたって、先ず文字切出回路10は単語
切出回路25からの指令によシイメージバソファ9内を
主走査方向にラスクスキャンし、行の分離及び単語の分
離を行う。これは、上方からラスクスキャンを行い、最
初に単語10.11間のスペース26を検出する。この
検出は1単語内の文字(アルファベット)間の間隔と単
語間隔において前者が0.3〜0.5朋に対して後者が
1〜3間程度であるため容易に行うことができる。
切出回路25からの指令によシイメージバソファ9内を
主走査方向にラスクスキャンし、行の分離及び単語の分
離を行う。これは、上方からラスクスキャンを行い、最
初に単語10.11間のスペース26を検出する。この
検出は1単語内の文字(アルファベット)間の間隔と単
語間隔において前者が0.3〜0.5朋に対して後者が
1〜3間程度であるため容易に行うことができる。
また、行の分離については1ラスタスキヤン内で全ビッ
トが空白であった走査線の数を積算し、この値が固定値
以上となった時点で行間スペース28の検出が行われ、
行間分離は終了される。以上の動作をイメージバッファ
領域に適用した結果、文字切出回路10から単語切出回
路25へはイメージバッファ内の各単語の左右上下位置
及び各単語がイメージバッファの上下左右境界(走査範
囲の境界)に接触しているか否かの情報が送られること
になる。この情報に基づき単語切出回路25はイメージ
バッファ境界に接触していない単語(図中、″Comp
uter ” : 22と” this ’ : 21
)のみを有効とし、先ず上方の単語22 を対象とし
て再度単語22の上下左右位置を示す情報を文字切出回
路lOへ転送し、今度は1文字単位の切出指示を行う。
トが空白であった走査線の数を積算し、この値が固定値
以上となった時点で行間スペース28の検出が行われ、
行間分離は終了される。以上の動作をイメージバッファ
領域に適用した結果、文字切出回路10から単語切出回
路25へはイメージバッファ内の各単語の左右上下位置
及び各単語がイメージバッファの上下左右境界(走査範
囲の境界)に接触しているか否かの情報が送られること
になる。この情報に基づき単語切出回路25はイメージ
バッファ境界に接触していない単語(図中、″Comp
uter ” : 22と” this ’ : 21
)のみを有効とし、先ず上方の単語22 を対象とし
て再度単語22の上下左右位置を示す情報を文字切出回
路lOへ転送し、今度は1文字単位の切出指示を行う。
この1文字単位の切出方法については公知技術であり、
ここでは省略する。
ここでは省略する。
1文字単位に切出された文字の画像信号は文字認識部1
1へ供給され、文字認識後文字コードとなって出力端子
12から外部へ出力される。この認識動作を1単語全体
に実施し、更に次の単語2Lを対象として一連の動作を
行う。
1へ供給され、文字認識後文字コードとなって出力端子
12から外部へ出力される。この認識動作を1単語全体
に実施し、更に次の単語2Lを対象として一連の動作を
行う。
尚、本実施例では、手持式ユニット24を照明用ランプ
23、結像用レンズ5及び光゛電変換素子6とから構成
したが、これに限らず量子化回路8、イメージバッファ
9、文字切出回路10.単語切出回路25等の他の構成
要素を含んでユニット化することも可能である。
23、結像用レンズ5及び光゛電変換素子6とから構成
したが、これに限らず量子化回路8、イメージバッファ
9、文字切出回路10.単語切出回路25等の他の構成
要素を含んでユニット化することも可能である。
(発明の効果)
以上、詳細に説明したように本発明によれば、例えば結
像レンズと光電変換部と光源と副走査機構とを一体に具
備したユニットによ)所定の走査範囲で帳票上の読取対
象の光学的走査を行い、さらに単語切出手段によシ走査
範囲に入る複数単語の切出しを行うようにしたので、装
置として安い価格で提供でき、また上記ユニットを帳票
上に設定することにより文書中の特定のキーワードを読
取ることができ、例えば外国文書の電子ファイリングシ
ステムなどp入力装置として大巾な普及が期待できるの
である。
像レンズと光電変換部と光源と副走査機構とを一体に具
備したユニットによ)所定の走査範囲で帳票上の読取対
象の光学的走査を行い、さらに単語切出手段によシ走査
範囲に入る複数単語の切出しを行うようにしたので、装
置として安い価格で提供でき、また上記ユニットを帳票
上に設定することにより文書中の特定のキーワードを読
取ることができ、例えば外国文書の電子ファイリングシ
ステムなどp入力装置として大巾な普及が期待できるの
である。
更に以上の説明から明らかなように、文章を構成する単
語を例えば文字コード群で出力すると次のような応用が
考えられる。
語を例えば文字コード群で出力すると次のような応用が
考えられる。
(1)文章の特定キーワード(単語)を抽出し、これを
保存しておくことによシ文章のインデックスとして使用
する電子ファイリングシステムを構成することができる
。
保存しておくことによシ文章のインデックスとして使用
する電子ファイリングシステムを構成することができる
。
(2)言語翻訳機能を付加しく上記ユニットに一体構成
しても良い)、単語の翻訳を行うことができる(いわゆ
る電子辞書への適用〕。
しても良い)、単語の翻訳を行うことができる(いわゆ
る電子辞書への適用〕。
例えば、文書が英語で起案されている時にわからない単
語を当該装置にて抽出し、その日本語訳を操作者に提供
する。
語を当該装置にて抽出し、その日本語訳を操作者に提供
する。
第1図は本発明の一実施例によるOCRの内部構成を示
す図、第2図はイメージバッファの格納状態を示す図、
第3図は従来のOCRの内部構成を示す図である。 1・・・帳票、 2・・・走査範囲、3・
・・主走査線、 4・・・副走査方向、5・・
・結像レンズ、 6・・・光電変換素子、7・・
・棒状ランプ、 8・・・量子化回路、9・・・
イメージバッファ、10・・・文字切出回路、11・・
・文字認識部、12・・・出力端子、13.14・・・
文章性、 15・・・副走査開始位置、16・・
・副走査終了位置、17・・・主走査終了位置、18・
・・主走査開始位置、23・・・照明用ランプ、24・
・・手持式ユニット、25・・・単語切出回路、26
、27・・・単語間隔、28・・・行間。
す図、第2図はイメージバッファの格納状態を示す図、
第3図は従来のOCRの内部構成を示す図である。 1・・・帳票、 2・・・走査範囲、3・
・・主走査線、 4・・・副走査方向、5・・
・結像レンズ、 6・・・光電変換素子、7・・
・棒状ランプ、 8・・・量子化回路、9・・・
イメージバッファ、10・・・文字切出回路、11・・
・文字認識部、12・・・出力端子、13.14・・・
文章性、 15・・・副走査開始位置、16・・
・副走査終了位置、17・・・主走査終了位置、18・
・・主走査開始位置、23・・・照明用ランプ、24・
・・手持式ユニット、25・・・単語切出回路、26
、27・・・単語間隔、28・・・行間。
Claims (2)
- (1)帳票上の読取対象を光学的に走査して前記読取対
象の認識処理を行う光学式文字読取装置において、 所定の走査範囲を光学的に走査するため、照光された帳
票からの反射光を電気的な画像信号に変換し、該画像信
号を出力するユニットと、 該ユニットからの画像信号を前記走査範囲に対応する格
納範囲に格納する格納手段と、 該格納範囲を走査することにより各単語の間隔及び読取
対象行間隔を検出して該検出情報を出力し、かつ格納さ
れた画像信号から文字の切出しを行う文字切出手段と、 前記検出情報に基づき画像信号から単語を特定し、特定
した単語の画像信号について文字の切出しを行うように
前記文字切出手段を制御する単語切出手段と、 前記文字切出手段により切出された文字の認識処理を行
う認識手段とを具備して構成されることを特徴とする光
学式文字読取装置。 - (2)前記ユニットが帳票を照光する光源と、帳票から
の反射光を結像する結像レンズと、結像した反射光を画
像信号に変換する光電変換素子と、走査範囲の副走査方
向の走査を行うための副走査機構とから一体に構成され
ることを特徴とする特許請求の範囲第1項記載の光学式
文字読取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62035786A JPS63204488A (ja) | 1987-02-20 | 1987-02-20 | 光学式文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62035786A JPS63204488A (ja) | 1987-02-20 | 1987-02-20 | 光学式文字読取装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63204488A true JPS63204488A (ja) | 1988-08-24 |
Family
ID=12451591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62035786A Pending JPS63204488A (ja) | 1987-02-20 | 1987-02-20 | 光学式文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63204488A (ja) |
-
1987
- 1987-02-20 JP JP62035786A patent/JPS63204488A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3139521B2 (ja) | 自動言語決定装置 | |
JPH01279368A (ja) | キャラクタデータの転送方式 | |
JPS63204488A (ja) | 光学式文字読取装置 | |
JPH05303619A (ja) | 電子スクラップブック | |
JPH0554072A (ja) | デジタル翻訳装置 | |
JPH0136154B2 (ja) | ||
JPH0615327Y2 (ja) | 光学式文字読取装置 | |
JPH0564396B2 (ja) | ||
JPS6095689A (ja) | 光学的文字読取装置 | |
JPS59158477A (ja) | 光学的文字読取装置 | |
JPH05274464A (ja) | 電子ファイリング装置 | |
JP2833040B2 (ja) | 光学的文字読み取り装置 | |
JPH09311859A (ja) | 対訳画像形成装置 | |
JPS5856076A (ja) | 光学的文字読取装置 | |
JPH07234917A (ja) | 画像処理装置 | |
JPH04348475A (ja) | 画像情報検索方法及びその装置 | |
JPH05101219A (ja) | 直線式の検索方式 | |
JPH05233695A (ja) | 電子辞書 | |
JP2003016065A (ja) | 対訳画像形成装置 | |
JPS5556257A (en) | Detecting segmentation unit for character with agate | |
JPS60254282A (ja) | 文字認識方式 | |
JPH08185475A (ja) | 画像認識装置 | |
JPH04365189A (ja) | 画像処理方法及び装置 | |
JPS63155361A (ja) | 電子辞書 | |
JPH06243285A (ja) | 文字認識方法 |