JPS62271089A - 文字情報入力装置 - Google Patents

文字情報入力装置

Info

Publication number
JPS62271089A
JPS62271089A JP61113534A JP11353486A JPS62271089A JP S62271089 A JPS62271089 A JP S62271089A JP 61113534 A JP61113534 A JP 61113534A JP 11353486 A JP11353486 A JP 11353486A JP S62271089 A JPS62271089 A JP S62271089A
Authority
JP
Japan
Prior art keywords
character
image
image data
code data
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61113534A
Other languages
English (en)
Inventor
Takashi Katooka
隆 加登岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61113534A priority Critical patent/JPS62271089A/ja
Publication of JPS62271089A publication Critical patent/JPS62271089A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 14九! この発明は、ワードプロセッサや自動翻訳装置等への文
字情報入力装置に関し、特にイメージスキャナと光学文
字認識装置とを用いた文字情報入力装置に関する。
盗」U1擢 イメージスキャナと光学文字認識装置(OCR)とを用
いた文字情報入力装置は、ワードプロセッサや自動翻訳
装置などを含む文字を扱う処理システム、および文字信
号を伝送するデータ通信などの通信システムへの文字情
報の入力効率を、キーボード入力に対して大幅に向上さ
せることができる。
その場合1紙などの記録媒体に可視情報として記憶され
た文字は、イメージスキャナによって光電的に走査され
てイメージデータとして光学文字認識装置に入力される
その光学文字認識装置には、文字フォントのイメージデ
ータが基準画情報としてあらかじめ登録された光学文字
認識用辞書が設けられており1文字認識手段がその光学
文字認識用辞書を参照し。
入力された文字のイメージデータを辞書のイメージデー
タと比較してパターンマツチングをとることによって、
これを特定の文字として・認識し、それに対応する文字
コードデータを発生する。
一般に使用される文字種のデザイン、すなわちフォント
には様々な種類のものがある。そのため、光学文字認識
装置は、通常用いられる文字種についてそのセットごと
に文字認識用辞書を備えている。
そこで、この文字情報入力装置によっである文書を入力
する場合、その文書の文字を適切に認識させるために、
認識すべき文字種のフォントに適した文字認識用辞書を
使用するように、最初にその選択操作を行なう必要があ
る。
従来の光学文字認識装置では、一般にこのフォント選択
操作は、文字種の名称ないしはそれを指定するコードを
キー人力することによって行なわれていた。
しかしながら、一般にこの文字種は、そのデザインにつ
いての知識や経験を有する利用者であって初めて見分け
られ、その名称を指定できるが、そのような知識や経験
のない利用者にとっては指定が困難であるという問題点
があった。
1−旗 この発明は、このような従来の文字情報入力装置におけ
る問題点を解消し、認識すべき文字種を操作者の視覚に
よらず正しく選択することができるようにして、操作性
を向上することを目的とする。
遭−」え この発明は上記の目的を達成させるため、上述のような
イメージスキャナと光学文字認識手段。
及び表示手段、操作手段ならびにこれらの制御手段とを
有する文字情報入力装置において、イメージスキャナに
よって入力されたイメージデータから所要の文字部分を
抽出して一時記憶する抽出記憶手段と、この抽出記憶手
段で抽出した文字列と同一文字列を操作手段から入力し
たときの文字コードデータを一時記憶する入力文字記憶
手段とを設け、制御手段が操作手段から原稿文字種を判
別する指示が入力されると、入力文字記憶手段で記憶し
た文字コードデータと、抽出記憶手段で記憶したイメー
ジデータから文字認識手段がそれぞれの文字種に応じた
辞書手段を参照して発生した各文字コードデータとを比
較して原稿文字種の判別を行なわせるようにしたもので
ある。
以下、この発明の一実施例に基づいて具体的に説明する
第1図は、この発明による文字情報入力装置を備えた英
文ワードプロセッサ、英文オフィスコンピュータ、英日
自動翻訳装置等に使用できる英文処理システムの一例を
示す外観斜視図である。
この英文処理システムは、入力装置として、英数字キー
などの文字キー及びカーソル移動キーなどの機能キーを
有し、操作者の指示を入力する操作手段であるキーボー
ド1と1m稿を光電的に走査して文字を含む画情報をイ
メージデータとして入力するイメージスキャナ2とを備
えている。
また、出力装置として、操作者に対するガイダンスを含
む各種情報を表示するための表示手段であるCRTディ
スプレイ装置(以下単にrcRTJという)3と、この
システムで処理した各種情報をプリントアウトするため
のレーザプリンタ4とを備えている。
さらに、本体5内にイメージスキャナ2で読取ったイメ
ージデータを文字コードデータに変換する文字認識手段
である光学文字認識装置(OCR)6(第2図参照)と
、記憶装置としてハードディスク装置(HDD)7とを
備えている。
第2図は、この英文処理システムの構成を示すブロック
図であり1本体S内には前述の0CR6及びHDD7の
他に、このシステム全体の動作を統括制御する制御手段
としての中央処理装置I (CPU)10と、画面:A
%IJ (VRAM)11及び表示制御装置であるCR
Tコントローラ12が設けられている。
° この中央処理袋5!10は、演算、記憶、制御の各
機能を有するマイクロコンピュータに相当するものであ
り1文字種が選択される前は、イメージスキャナ2が読
み取った原稿画像のイメージデータを0CR6を介して
そのまま入力してHDD7に格納する。
キーボード1からコード変換指示及び文字種の選択指示
を受けた後は、0CR6を制御してイメージスキャナ2
からの文字のイメージデータを入力しコードデータに変
換して、それをHDD7に格納する。
また、このようにしてHDD7に格納したイメージデー
タあるいは文字コードデータを表示するようにキーボー
ド1から指示された時には、この中央処理袋r1110
は、HDD7から該当するデータを読み出して、ビデオ
信号発生用メモリであるVRAMIIに転送する。
それにより、CRTコントローラ12が、VRAM1l
によってドツトデータの形で展開されたビデオ信号を順
次CRT3へ送って表示させる。
次に、この実施例の作用を第3図以降も参照して説明す
る。
この英文処理システムに、イメージスキャナ2にセット
した原稿の文!(文字情報)を入力する際には、最初に
文字種の指定を行なう必要がある。
しかし、操作者が原稿文字の文字種を判別することが困
難であり1文字種の判別を指示すると、中央処理装置1
10はこれに応動して、第3図に示す原稿文字種判別処
理を実行する。
この処理では、まずイメージスキャナ2を動作させ、原
稿文書を2値のイメージデータのまま読込んで、第4図
に示すような原稿文字抽出画面をCRT3に表示する。
この原稿文字抽出画面には、読込んだ原稿文書のイメー
ジデータの一部をイメージ画像で表示しており、さらに
、この表示したイメージ画像の一部を反転表示して、抽
出する部分のイメージデータを示す抽出フレーム21と
している。
次に、操作者がキーボード1上の数字キー〔8゜2.4
.6)の操作によってこの抽出フレーム21を上下左右
に移動して任意の箇所に位置させ。
数字キー〔5〕を押したときは、その抽出フレーム21
の部分のイメージデータをサンプルイメージとして抽出
しHDD7に一時記憶させる(第5図(イ)参照)。
そして、操作者がサンプルイメージの文字列と同一の文
字列をキーボード1から入力すると、その文字コードデ
ータをHDD7に記憶させた(第5図(ロ)参照)後、
各文字種毎に文字ご識及びキーボード1から入力した文
字コードとの比較を行なう。
ここでは、まず、0CR6に対して文字認識用辞書の指
定(文字種切換え)を行なう。そして。
0CR6は指定された文字認識用辞書のイメージデータ
を参照しなからHDD7に記憶している抽出したサンプ
ルイメージを取り出して文字コードデータに変換(文字
認識処理)する。
そこで、0CR6で変換した文字コードデータとキーボ
ード1から入力した文字コードデータとを比較して、正
しく文字認識できた割合を示す正読率(正読率=正しく
認識できた文字/全体の文字数X100)を求める。
そして、○CR5が認識できる全ての文字種について上
記の正統率を求める処理が終了したか否かを判別し、全
ての文字種について終了していないときは1文字認識用
辞書を指定する処理(文字種切換え)に戻り、他の未処
理の辞書を指定して上記の処理を繰り返して実行する。
こうして1文字認識可能な全ての文字種(辞書)につい
て処理が終了したときは、第5図(ハ)(ニ)(ホ)に
示すように、文字種毎に正続率(A=8Q%、B=10
0%、C=70%)が求められているので、この文字種
毎の正読率を比較して、正読率の最も高い文字種(ここ
では文字種B)を判別する。なお、第5図(ハ)(ニ)
(ホ)において「−」は、認識できなかった文字あるい
は間違えて認識された文字を示し、またSPはスペース
を示している。
このように、この実施例の文字情報入力装置においては
、イメージスキャナで読込んだ原稿文書から任意の文字
部分のイメージデータを抽出すると共に、キーボードか
らその抽出した文字列と同一の文字列を入力しておき、
OCRが認識できる全ての文字種毎に抽出した原稿文字
イメージから認識した文字列(コードデータ)と、キー
ボードから入力した文字列(コードデータ)とを比較し
て、最も正読率の高かった文字種を指定文字種として採
用するようにしたので、文字種のデザインに関して予備
知識のない利用者でも、視覚によらず容易且つ正確に原
稿の文字種に合った文字種の指定を行なうことができる
なお、上記実施例においては、原稿文書から抽出する部
分を示す抽出フレームの大きさを固定し。
上下左右に移動させる例について述べたが、マウス等の
ポインティング・デバイスを用いて抽出する部分を指示
するようにしてもよい。
また、上記実施例においては、3種類の文字種を認識可
能なOCRを用いた例について述べたが、2種類あるい
は4種類以上の文字種を認識可能なOCRを用いる場合
にも同様に実施することができる。
さらに、上記実施例ではOCRを本体に内蔵した例につ
いて述べたが、これを本体の外部に別に設けてスキャナ
と接続したり、あるいはスキャナに内蔵させるようにし
てもよい。
さらにまた、この発明は英文字の入力装置に限るもので
はなく、日本の漢字、仮名文字やその他各国の文字によ
る文書の入力装置にも同様に適用できるものである。
亙−釆 以上説明してきたように、この発明によれば文字情報入
力装置の操作性が向上し、文字を扱う各種処理システム
への文字情報の入力を高能率で行なうことができる。
【図面の簡単な説明】
第1図はこの発明による文字情報入力装置を備えた英文
処理システムの一例を示す外観斜視図、 第2図は同じくその文書情報入力装置に係わる部分の構
成を示すブロック図、 第3図は中央処理装置が実行する原稿文字種判別処理の
一例を示すフロー図、 第4図及び第5図は第3図の原稿文字種判別処理でCR
T画面上に表示する原稿文字抽出画面の一例を示す図及
び判別処理の説明に供する説明図である。 1・・・キーボード     2・・・イメージスキャ
ナ3・・・CRTディスプレイ装置 4・・・レーザプリンタ   5・・・本体6・・・光
学文字LyjP識装雪(OCR)7・・・ハードディス
ク装置(Hr) D)10・・・中央処理装置(CP 
U) 11・・・画像メモリ(VRAM) 12・・・CRTコントローラ 第3図 第4図 第5図 (イ)  サンプル  [←ゴ不IIEE二■=]イメ
ーノ (ハ)文字種A    −9−t   t   h  
 e   r   esP(SO%) (3)   文字l   Q   9 0   +  
 t   h  e   r   esP(H)6%)
(ホ)  文字種Ca  g  −−t   h   
e、 −e  5P(7゜チノ

Claims (1)

  1. 【特許請求の範囲】 1 原稿を光電的に走査して文字を含む画情報をイメー
    ジデータとして入力するイメージスキャナと、 それぞれ文字種に応じた文字認識用基準画情報が格納さ
    れた辞書手段と、 該辞書手段を参照して前記イメージスキャナによって入
    力されたイメージデータに含まれる文字を認識して対応
    する文字コードデータを発生する文字認識手段と、 操作者に対するガイダンスを表示する表示手段と、 操作者の指示を入力する操作手段と、 該操作手段に応動して前記イメージスキャナ、辞書手段
    、文字認識手段および表示手段を制御する制御手段とを
    有する文字情報入力装置において、前記イメージスキャ
    ナによって入力されたイメージデータから所要の文字部
    分を抽出して一時記憶する抽出記憶手段と、 前記抽出記憶手段によって抽出した文字列と同一文字列
    を前記操作手段から入力したときの文字コードデータを
    一時記憶する入力文字記憶手段とを設け、 前記制御手段が、前記操作手段から原稿文字種を判別す
    る指示が入力されると、前記入力文字記憶手段で記憶し
    た文字コードデータと、前記抽出記憶手段で記憶したイ
    メージデータから前記文字認識手段がそれぞれの文字種
    に応じた前記辞書手段を参照して発生した各文字コード
    データとを比較して原稿文字種の判別を行なわせるよう
    にしたことを特徴とする文字情報入力装置。
JP61113534A 1986-05-20 1986-05-20 文字情報入力装置 Pending JPS62271089A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61113534A JPS62271089A (ja) 1986-05-20 1986-05-20 文字情報入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61113534A JPS62271089A (ja) 1986-05-20 1986-05-20 文字情報入力装置

Publications (1)

Publication Number Publication Date
JPS62271089A true JPS62271089A (ja) 1987-11-25

Family

ID=14614758

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61113534A Pending JPS62271089A (ja) 1986-05-20 1986-05-20 文字情報入力装置

Country Status (1)

Country Link
JP (1) JPS62271089A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0219986A (ja) * 1988-07-08 1990-01-23 Fujitsu Ltd 文字認識における適合辞書決定方法および該方法を実施する文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0219986A (ja) * 1988-07-08 1990-01-23 Fujitsu Ltd 文字認識における適合辞書決定方法および該方法を実施する文字認識装置

Similar Documents

Publication Publication Date Title
US5191622A (en) Hand-written character recognition apparatus with a personal dictionary preparation function
KR100298547B1 (ko) 문자입력장치
JPS62271089A (ja) 文字情報入力装置
JPH10177623A (ja) 文書認識装置および言語処理装置
JPH0589280A (ja) 入力装置
JPS58109927A (ja) キ−ボ−ドディスプレイ装置
JPH10320107A (ja) 手書き文字認識機能を有する手書き文字入力装置
JPH0660053A (ja) 入力装置
JPH01137383A (ja) 文字認識装置
JP2002245470A (ja) 言語特定装置及び翻訳装置及び言語特定方法
JPH01103787A (ja) 個人辞書作成機能付手書文字認識装置
JP2629946B2 (ja) 文書処理装置
JPH0644216A (ja) 入力装置
JPS61226883A (ja) 文字認識装置
JPH0612522A (ja) 文字認識装置
JPH0830730A (ja) 文字認識処理装置
JPH0628336A (ja) 入力装置
JPS63244257A (ja) 文書作成システム
JPS62269288A (ja) 光学文字認識装置
JPH06208430A (ja) 表示機能付入力装置
JPH0528127A (ja) 情報処理装置
JPH05120258A (ja) 入力装置
JPH05233695A (ja) 電子辞書
JPH0668067A (ja) 入力装置
JPS62267888A (ja) 文字情報入力装置