JPS62269288A - 光学文字認識装置 - Google Patents

光学文字認識装置

Info

Publication number
JPS62269288A
JPS62269288A JP61111833A JP11183386A JPS62269288A JP S62269288 A JPS62269288 A JP S62269288A JP 61111833 A JP61111833 A JP 61111833A JP 11183386 A JP11183386 A JP 11183386A JP S62269288 A JPS62269288 A JP S62269288A
Authority
JP
Japan
Prior art keywords
character recognition
character
sample image
sample
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61111833A
Other languages
English (en)
Inventor
Masahiro Ito
正博 伊藤
Toshio Yamamoto
敏雄 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61111833A priority Critical patent/JPS62269288A/ja
Publication of JPS62269288A publication Critical patent/JPS62269288A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は光学文字認識装置、とくにその光学文字認識用
辞書の選択方式に関する。
従来技術 光学文字認識装置 (OCR)は、ワードプロセッサや
翻訳装置などを含む文字を扱う処理システム、および文
字信号を伝送するデータ通信などの通信システムへの入
力装置として多く利用される。
紙などの記録媒体に可視情報として記録された文字は、
光学文字認識装置のスキャナによってシステムに読み込
まれる。光学文字認識装置には、文字フォントのイメー
ジ情報が基準画情報としてあらかじめ登録された光学文
字認識用辞書が設けられている。光学文字認識装置は、
光学文字認識用辞書を参照し、入力された図形としての
文字を辞書のイメージ情報と比較してパターンマツチン
グをとることによってこれを特定の文字として認識し、
それに対応する文字コードを発生する。
一般に使用される文字種のデザイン、すなわちフォント
には様々な種類のものがある。光学文字認識装置は、通
常用いられる文字種についてそのセー、トごとに文字認
識用辞書を備えている。そこで、光学文字認識装置によ
っである文書を入力する場合、その文書の文字を適切に
認識させるために、認識すべき文字種のフォントに適し
た文字認識用辞書を使用するよう、最初にその選択操作
を行なう、従来の光学文字認識装置では一般に、このフ
ォント選択操作は、文字種の名称ないしはそれを指定す
るコードをキー人力することによって行なわれていた。
一般に文字種は、そのデザインについての知識や経験を
有する利用者であって初めて見分けられ、またその名称
を指定できる。しかし、今後光学文字認識装置の大幅な
普及が予想され、そのような文字種についての予備知識
のない利用者が大半を占めるのは必至であろう。そのよ
うな利用者にとって、光学文字認識装置を使用する際の
従来の文字種指定方式では、文字種の指定に困難が予想
され、利用者に多大の不便を与えることになろう。現状
の技術では、光学文字認識手法に関しての進歩が著しい
が、装との操作性の向上についてはあまり考慮されてい
ないのが実情である。
目   的 本発明はこのような従来技術の欠点を解消し、認識すべ
き文字種を操作者がたやすく指定することができる光学
文字認識装置を提供することを目的とする。
構  成 本発明は上記の目的を達成させるため、文字を含む画情
報を入力する入力手段と、文字種に応じた文字認識用基
準画情報が格納される辞書手段と、辞書手段を参照して
入力画情報に含まれる文字を認識し、対応する文字信号
を出力する文字認識手段と、操作者に対するガイダンス
を表示する表示手段と、操作者の指示を入力する操作手
段と、操作手段に応動して入力手段、辞書手段、文字認
識手段および表示手段を制御する制御手段とを有する光
学文字認識装置は、文字種のサンプルイメージのデータ
を蓄積する記憶手段を有し、制御手段は、記憶手段から
サンプルイメージデータを読み出してそのサンプルイメ
ージを表示手段に表示させ、操作手段からサンプルイメ
ージを選択する指示が入力されると、認識手段に、辞書
手段における指示に対応した文字種の文字認識用基準画
情報を使用して文字認識を行なわせることを特徴とした
ものである。以下1本発明の一実施例に基づいて具体的
に説明する。
第2図を参照すると1本発明による光学文字認識装置を
英文ワードプロセッサや英文オフィスコンピュータなど
の英文処理システムに適用した実施例が示されている0
本実施例の装置は、基本的には装置本体10、光学文字
認識装置(OCR) 12、スキャナ14、キーボード
1BおよびCRTなどの表示装+a18からなる。その
システム構成を第1図に示す。
装置本体10には、中央処理装置(cpu) 20、ハ
ードデ(スフ(HD) 22.画面メ(−IJ (VR
AM) 24J ヨヒ表示1111装置(flJTc)
 26が搭載され、図示のように接続されている。中央
制御装置20は、本装置全体の動作を統括、制御する制
御機ず上部であり、これには光学文字認識装置12、ス
キャナ14およびキーボード1Bが接続されている。
スキャナ14は、光学文字認識装置12に入力すべき文
書を光電的に走査してそれに記録されている画情報を2
値のイメージデータとして読み込む画情報入力装置であ
る。キーボード16は、上として操作者の指示や文字デ
ータを本装置に入力する通常の操作装置であり、たとえ
ば英数字キーなどの文字キー、およびカーソル移動キー
などの機能キーを有する通常のキーボードである。
光学文字認識装置12は、光学文字認識用辞書を参照し
、スキャナ14から入力された画情報を辞書の登録情報
と比較してパターンマツチングをとることによってこれ
を特定の文字として認識し、それに対応する文字コード
を発生する機能部である。この辞書は、フォントごとに
各文字の特徴を抽出し平均化したデータとして文字コー
ドに対応して用意され、本実施例では光学文字認識装置
12内のI’lONにフォント別に格納されている。ま
たは、ハードディスク22にOCRソフトとして格納さ
れるように構成してもよい。
一般に使用される文字種のフォントには様々な種類のも
のがあり、光学文字認識用辞書は、通常用いられる文字
種ごとに用意され、各辞書には、そのセットの文字の基
準パターンを規定する画情報が格納されている。そこで
、光学文字認識装置によっである文書を入力する場合、
認識すべき文字種のフォントに対応する文字認識用辞書
を使用するようキーボード18によって指示する。この
辞書選択処理は中央処理装置20の制御により行なわれ
る。これについては後に詳述する。
画面メモリ24は、通常のVRAMであり、CRT 1
8の画面に表示すべき画情報がこれにドツトデータの形
で展開される6表示制御装置26は、画面メモリ24に
展開されているドツトデータをこれから読み出してCR
T 18に出力表示させる。 CRT 18には、スキ
ャナ14から入力された英文テキスト、すなわち光学文
字認識装N12で認識された文字列のみならず、操作者
に対する様々な指示が可視情報として表示される。この
指示にはたとえば、とくに本発明に関連して、文字認識
辞書を選択する際のサンプルイメージも含まれる。
光学文字認識装M12から出力された文字コードは、中
央処理装置20が文字発生部(図示せず)にアクセスし
てそれに対応するドツトパターンデータに変換され、V
RAM 24に展開される。これは、表示制御装置26
によって順次読み出され、CRT 18に出力表示され
る。
ところで文字認識辞書の選択操作は、文書を入力する際
最初に、CRT 1Bの表示に従ってキーボード16を
操作して行なわれる。操作者がキーボード16を操作し
て文字認識辞書の選択を指示すると、中央処理装置20
はこれに応動じて、操作者に対するガイダンス表示の1
つとして文字認識辞書選択画面50(第3図)をCRT
 18に表示させる。この選択画面50は、この例では
6つの文字種選択用のサンプルイメージ52を含む。
サンプルイメージ52は、本実施例ではフォントAから
Fまでの6つの字体について英語の”the“が示され
ている。サンプルイメージ52として”the”を採用
したのは主として次の理由による。
まず、この3文字は個別に見て英文中に出現する頻度が
比較的高い。とくに文字“e”は最も出現頻度が高い。
また、これらの文字の組合せ、すなわち”the”は、
英文では定冠詞であるので、一般に、読み取るべき文書
でもこれが含まれる可能性が非常に高い。さらに1文字
”t”や”h”は文字種のデザイン上の特徴が顕著に表
われる文字の類に屈する。したがって、このような文字
列をサンプルイメージとして選択することは、効果的で
ある。
これらのサンプルイメージは、たとえばスキャナ14を
使用して本装置に入力することができる。
他の画像入力手段によって入力するように構成してもよ
い、スキャナ14から読み込まれたサンプルイメージは
、本実施例では中央処理装置20の制御によりハードデ
ィスク22にサンプルイメージデータとして格納される
。サンプルイメージ52は、第4図に示すように横mバ
イト、縦nラインのドツトイメージデータで構成される
。したがってサンプルイメージ1個のデータ量はnxm
バイトである。このサンプルイメージデータは、ハード
ディスク22には、第5図に示すようなバイト列の形で
記憶される。
まず、サンプル文字を含む原稿画像をスキャナ14から
読み込む。これは2イ直のイメージデータとして中央処
理装置20の制御によりVRAM 24に書き込まれる
。これは、CRT 18の表示画面50に読込みイメー
ジ56として表示される。その際、反転表示によるサン
プルイメージ指定用のカーソル58を読込みイメージ5
6内に表示する。カーソル58に含まれる字数、すなわ
ちカーソル58の大きさは固定でも可変でもよい、そこ
で操作者は、017画面50の下部に表示されているカ
ーソル移動のガイダンス指示に従ってキーボード16を
操作し、カーソル5日をサンプルイメージとすべき文字
、すなわちこの例ではthe″に移動させる。これによ
って、VRAに24内のイメージデータのうち指示され
た文字が反転され、017画面50の読込みイメージ領
域5Bに表示される。
そこで操作者は、キーボード18を操作してイメージサ
ンプルの指示キーを操作し、サンプルイメージの読込み
を指示する。これに応動して中央処理袋M20は、VR
AM 24上のイメージデータのうちカーソル58で指
示されている部分のイメージデータを読み出し、記憶す
る。この手順は丁度、サンプルイメージの表示と逆の手
順であり、VRA)124からハードディスク22に転
送され、蓄積される。この処理フローを第8図に示す。
文字種選択画面50の表示がキーボード16から指示さ
れると、中央処理袋N20はこれに応動して同画面50
のイメージデータをVRAM 24に展開する。
その際、ハードディスク22からサンプルイメージ52
のイメージデータをmバイトごとに切り出して読み出し
、VRAM 24にこれを展開する。展開する位置はサ
ンプルイメージ52の数による。
サンプルイメージ52の展開アルゴリズムを第6図に示
す、これによれば、VRAM 24の記憶位置が見掛は
上サンプルイメージ52の左上から右下へ継続して画像
領域を形成し、サンプルイメージデータの先頭アドレス
位置がポインタとしてセグメントレジスタに格納され、
ラインカウンタの歩進に従ってmバイトずつVRAII
I 24のオフセット位置に順次格納される。その際、
中央処理装置20は、ガイダンス文字「原稿の文字種を
選んで下さい」とともにカーソル54のイメージデータ
も展開する。
こうして展開された辞書選択画面50のイメージデータ
は、表示制御装置2BによってVl’1A)124から
読み出され、CRT 18に出力表示される。操作者は
、「原稿の文字種を選んで下さい、」なる指示に従って
キーボードを操作し、フォント52のいずれかを指定す
る数字をキー人力する。中央処理装置20はこれに応動
して、選択されたフォント52をその数字の反転表示5
3(第3図)によって表示画面50に表示する。勿論そ
の際、カーソル54の位置に選択された数字を表示して
もよい、数字キー人力を繰り返すことによって、フォン
トの指定を変更することができる。所望のフォントが選
択されると、たとえばリターンキーなどの実行キーを操
作することによって中央処理装置20はフォント指定を
確定する。この処理動作を第9図のフローチャートに示
す。
中央処理装置20は、文字認識処理を実行する際、この
フォント指定キー人力で選択された文字種に従って、そ
の基準イメージ情報が格納されている光学文字認識用辞
書データをハードディスク22から光学文字認識装置X
2に読み込む。つまり、キー人力された数字は、使用す
る文字認識用辞書の番号として利用される。以降これに
従って、そのフォントの文字認識処理が行なわれる。
光学文字認識装置12は、スキャナ14から画情報が入
力されると、これを辞書の基準イメージ情報と比較して
パターンマツチングをとることによって特定の文字とし
て認識し、それに対応する文字コードを発生する。光学
文字認識装置12から出力された文字コードは、中央処
理装置20が文字発生部によってそれに対応するドツト
パターンデータに変換され、VRAM 24に展開され
る。これは、表示制御装置2Bによって順次読み出され
、CRT 1Bに文字として可視表示される。
効  果 本発明によればこのように1文字フォントのサンプルを
ガイダンス表示するよう構成されているので、認識すべ
き文字種の名称または指定コードを操作者が知らなくて
も、サンプルイメージを指定することで認識すべき文字
種をたやすく指定することができる。
【図面の簡単な説明】
第1図は1本発明による光学文字認識装置を英文処理シ
ステムに適用した実施例の基本構成を示す機能ブロック
図、 第2図は同実施例の装置の外観を示す外観斜視図、 第3図は同実施例のCRTに表示される文字認識辞書選
択画面の例を示す説明図、 第4図は文字認識辞書選択画面に表示されるサンプルイ
メージの例を示す説明図、 第5図は、第4図に示すサンプルイメージのデータフォ
ーマットの例を示す説明図、第6図はサンプルイメージ
の展開アルゴリズムの例を示すフロー図、 第7図はサンプルイメージ読込みの際の表示画面の例を
示す説明図、 第8・図は2サンプルイメージの読込み処理の例を示す
フロー図、 第9図は、サンプルイメージの選択処理の例を示すフロ
ー図である。 主要部分の符号の説明 12、、、光学文字認識装置 1.4.、、スキャナ 16゜0.キーボード 13、、、CRT 20、、、中央処理装置 22、、、ハードディスク 50、、、文字認識辞書選択画面 52、、、サンプルイメージ

Claims (1)

  1. 【特許請求の範囲】 1、文字を含む画情報を入力する入力手段と、文字種に
    応じた文字認識用基準画情報が格納される辞書手段と、 該辞書手段を参照して前記入力された画情報に含まれる
    文字を認識し、対応する文字信号を出力する文字認識手
    段と、 操作者に対するガイダンスを表示する表示手段と、 操作者の指示を入力する操作手段と、 該操作手段に応動して前記入力手段、辞書手段、文字認
    識手段および表示手段を制御する制御手段とを有する光
    学文字認識装置において、該装置は、 文字種のサンプルイメージのデータを蓄積する記憶手段
    を有し、 前記制御手段は、該記憶手段から該サンプルイメージデ
    ータを読み出してそのサンプルイメージを前記表示手段
    に表示させ、 前記操作手段から該サンプルイメージを選択する指示が
    入力されると、前記認識手段に、前記辞書手段における
    該指示に対応した文字種の文字認識用基準画情報を使用
    して文字認識を行なわせることを特徴とする光学文字認
    識装置。 2、特許請求の範囲第1項記載の装置において、前記サ
    ンプルイメージは、3文字のアルファベット“t”“h
    ”および“e”を文字種に応じた書体で含むことを特徴
    とする光学文字認識装置。
JP61111833A 1986-05-17 1986-05-17 光学文字認識装置 Pending JPS62269288A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61111833A JPS62269288A (ja) 1986-05-17 1986-05-17 光学文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61111833A JPS62269288A (ja) 1986-05-17 1986-05-17 光学文字認識装置

Publications (1)

Publication Number Publication Date
JPS62269288A true JPS62269288A (ja) 1987-11-21

Family

ID=14571309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61111833A Pending JPS62269288A (ja) 1986-05-17 1986-05-17 光学文字認識装置

Country Status (1)

Country Link
JP (1) JPS62269288A (ja)

Similar Documents

Publication Publication Date Title
EP0359110B1 (en) Entry text display system
JPS62269288A (ja) 光学文字認識装置
JPS61228572A (ja) 文書作成編集装置
JPH0823744B2 (ja) 文字列処理装置
GB2143064A (en) Registering and calling document texts
US20010033285A1 (en) Character attribute setting device and method in document preparing apparatus
JPS61279973A (ja) 日本語処理装置
JP2878461B2 (ja) 文書入力装置
JP2639797B2 (ja) 文書作成編集装置
JP2657091B2 (ja) 文書作成装置
JPH024026A (ja) 文書処理装置
JPH0340418B2 (ja)
JPH0682379B2 (ja) 文書作成編集装置
JPH04305764A (ja) 文書作成装置
JPS60245074A (ja) 自動ルビ表示方式
JPH05233601A (ja) かな漢字変換モード自動設定の文書処理装置
JPH0644219A (ja) 文書作成装置及びモード設定制御方法
JPH04133165A (ja) かな漢字変換装置
JPS62267888A (ja) 文字情報入力装置
JPS62271089A (ja) 文字情報入力装置
JPH04213156A (ja) 日本語入力装置
JPH09293067A (ja) 文書処理装置
JPH06119323A (ja) 文書作成装置
JPS63223864A (ja) 文章作成装置
JPH04118751A (ja) 文書作成装置