JPS60207981A - 辞書登録方式 - Google Patents

辞書登録方式

Info

Publication number
JPS60207981A
JPS60207981A JP59063565A JP6356584A JPS60207981A JP S60207981 A JPS60207981 A JP S60207981A JP 59063565 A JP59063565 A JP 59063565A JP 6356584 A JP6356584 A JP 6356584A JP S60207981 A JPS60207981 A JP S60207981A
Authority
JP
Japan
Prior art keywords
dictionary
memory
ocr
characters
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59063565A
Other languages
English (en)
Inventor
Masaki Komiya
小宮 雅紀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59063565A priority Critical patent/JPS60207981A/ja
Publication of JPS60207981A publication Critical patent/JPS60207981A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [光明の技術分野] 本発明は、特に漢字OCRの文字認識用辞−を作成して
登録する辞書登録方式に関する。
[発明の伎1も的背県とその問題点] 従来、OCR<光学的文字読取装置)は通爪、文字単位
の認*ta理を行なうように構成されており、単語又は
所定の文字列単位で識別、照合するような方式は適用さ
れていない。ところで近年、パターン認識技術の進歩に
より平田き、活字の漢字の読取を行なうことができるO
CRが開発されている。このような漢字読取の可能なO
CRを利用すれば、文章の情報入力装置への応用が可能
となる。
このような情報入力装置では、11g1単位の入力。
修正及び文脈処理を利用した照合、eA集処理を行なう
OCRを必要とする。しかしながら、このようなOCR
では単語単位の認識処理に必要な後処理用のAPIが必
要となるが、従来においてはOCRの後処理用辞mをユ
ーザ側で作成することは困難であった。
[発明の目的] 本発明は上記の点に鑑みてなされたもので、その目的は
、単語単位の読取の可能な漢字OCRの文字認識用辞膚
である後処理用単語辞痛を簡単な操作で作成できる辞書
登録方式を提供することにある。
[発明の概要] 本発明では、予め辞書登録用の単語又は個別文字を記録
するための辞書登録用シートが用意される。この辞書登
録用シートに記録された漢字を含む単語又は文字を読取
るOCRが設けられる。修正手段は、OCRにより読取
られた単語又は文字に対して読取不能文字の修正または
文字の追加。
削除等の修正を行なう。辞書作成手段は、上記OCRに
より読取られた単語9文字及び上記修正手段の修正結果
に基づいてOCRの後処理用単語辞書を作成する1能を
有している。辞書作成手段により作成された後処理用辞
書は、登録手段により所定の辞書メモリに記憶される。
このような構成により、ユーザは辞書登録用シートに必
要な単語を記入し、又修正手段を操作するだけでOCR
の後処理用辞書を作成できる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わる構成を示すブロック図である。第
1図において、漢字OCR10は、例えば第2図に示す
ような辞書登録用シー1−20に記録された漢字を含む
単語又は文字を読取る装置である。辞書メモリ11は、
漢字OCR10の読取処理に必要な全文字種の標準パタ
ーンを記憶している。漢字OCR10で読取られた単語
又は文字(、i、制御lB置12に出力される。この制
御装置i12は、漢字OCR10から与えられる読取結
果を一時中間フアイルメモリ13に記憶し、この中間フ
ァイルメモリ13内のデータに基づいてOCRの後処理
用単Xll辞書を作成する機能を有している。入出力1
1i14は、キーボード及びCRTディスプレイ装置か
らなり、中間ファイルメモリ13から読取結果を読出し
て、読取不能文字の修正等を行なう。出力ファイルメモ
リ15は、制御ll装置12で作成された後処理用単重
辞書を所定の後処理用辞書メモリに登録する際に使用さ
れるメモリである。プリンタ1Gは制御装置12により
ダンプされる漢字OCR10の読取結果を印字する。
このような構成において、一実施例に係わる動作を説明
する。先ず、ユーザは第2図に示すような辞書登録用シ
ート20に必要な単語(特定の文字組合わせを含む)又
は文字を記入する。この辞書登録用シート20には、例
えば単語又は文字を記入する登録欄21.継続@22.
読取結果欄23.修正チェックlIl!124及び修正
欄25が設けられている。継続1III122は登録欄
21に記入する文字列が一行以上である場合、次行に継
続することを指示する鞠である。
読取結果1ThI123は、プリンタ16により制御装
置12から出力される読取結果を印字する欄である。こ
の読取結果がミスであれば、修正チェック欄24にチェ
ック記号が記入され、さらに修正欄25に修正された文
字列が記入されることになる。
上記のような辞!登録用シート20が、漢字0CR10
により読取処理される。この場合、漢字0CR10は辞
書メモリ11内の全文字種辞書に基づいて、文字単位の
読取処理を行なう。漢字OCR10から出力される読取
結果は、制御装置12に送られる。
制tlll@[12は、漢字OCR10からの読取結果
を一度中間ファイルメモリ13に記憶する。次に、ユー
ザは入出力[i14のキーボードを操作して、中間ファ
イルメモリ13から漢字OCR10の読取結果を読出し
、CRTディスプレイ装置に表示する。ユーザは、CR
Tディスプレイ装置の表示と辞!登録用シート20を比
較チェックして、読取不能文字をキーボードで修正する
。制御ll装置12は、上記のようにして修正された読
取結果をプリンタ16に出力する。このプリンタ16は
、ユーザによりセットされた辞書登録用シート20の読
取結果1i’1l123にルリ罪装置12からの読取結
果を印字する。ユーザは、辞書登録用シート20の登録
l11121と読取結果欄23をチェックして、読取ミ
スがあれば修正(11!25に修正した文字列を記入す
る。そして、修正した後の辞書登録用シート20を漢字
OCR10で読取らせるか、又は入出力装置14のキー
ボードで修正@25の修正結果を制gfJ装置11i1
2に入力する。
上記のようなユーザによる照合確認が終了すると、制W
装@12は同一文字の排除等の重復チェックを行なって
、修正語の読取結果に基づいてOCRの後処理用単語辞
書を作成する。ここで、単語読取用のOCRにおける後
処理には、主として照合と編集の各日能がある。照合礪
能は、単なる単語の登録有無の確認、又階層構造になっ
ているデータのチェック例えば東京都と部内の市町村区
との関係を照合する動作である。又、編集灘能とはデー
タの付加、省略KIの補正動作であり、例えば郵便番号
から住所を付加するなどの櫟能である。
したがって、後処理用単語辞書は上記のような照合及び
sin能を実現するための辞書である。制御0装置12
は、作成した後処理用単語辞書を出力ファイルメモリ1
5に記憶する。この出力ファイルメモリ15から所定の
後処理用の辞書メモリに後処理用型R■1が登録される
ことになる。
このようにして、ユーザは予め用意された辞書登録用シ
ート20に必要な単語を記入し、また入出力装[14を
利用した修正処理を行なうだけで、単にR読取用のOC
Rの後処理用型in i 四を確実に作成できる。
「発明の効果コ 以上詳述したように本発明によれば、単&n I収用O
CRの後処理用単語辞書を簡単な操作でしかも確実に作
成できる。したがって、単語読取用OCRを容易に実現
でき、このOCRを適用づれば文章の情報入力装置を容
易に構成できるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる辞囚Ω録方式の構成
を示すブロック図、第2図は静間登録用シートの一例を
示す図である。 10・・・漢字OCR,11・・・辞書メモリ、12・
・・制御装置、13・・・中間ファイルメモリ、14・
・・入出力装置、15・・・出力ファイルメモリ、1G
・・・プリンタ。 出願人代理人 弁理士 鈴江武彦

Claims (1)

    【特許請求の範囲】
  1. 予め辞II登録用の申關又は個別文字を記録するための
    辞m登録用シートと、この辞書登録用シートに記録され
    た漢字を含む単!!R又は文字を読取るOCRど、この
    OCRの読取結果に対して読取不能文字の修正または文
    字の追加、削除等の修正を行なう修正手段と、上記OC
    Rから出力される読取結果及び上記修正手段の修正結果
    に基づいてOCRの後処理用型;n辞四を作成する辞書
    作成手段と、この辞書作成手段により作成された後処理
    用単317辞書を所定の辞重メモリに配憶する登録手段
    とを具備してなることを特徴とする辞書登録方式。
JP59063565A 1984-03-31 1984-03-31 辞書登録方式 Pending JPS60207981A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59063565A JPS60207981A (ja) 1984-03-31 1984-03-31 辞書登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59063565A JPS60207981A (ja) 1984-03-31 1984-03-31 辞書登録方式

Publications (1)

Publication Number Publication Date
JPS60207981A true JPS60207981A (ja) 1985-10-19

Family

ID=13232884

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59063565A Pending JPS60207981A (ja) 1984-03-31 1984-03-31 辞書登録方式

Country Status (1)

Country Link
JP (1) JPS60207981A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5930176A (ja) * 1982-08-10 1984-02-17 Nippon Telegr & Teleph Corp <Ntt> 文字判定処理方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5930176A (ja) * 1982-08-10 1984-02-17 Nippon Telegr & Teleph Corp <Ntt> 文字判定処理方式

Similar Documents

Publication Publication Date Title
JPS60207981A (ja) 辞書登録方式
JP2865443B2 (ja) カナ氏名もしくはカナ法人名表記の漢字変換装置
JPH0373913B2 (ja)
JP3217442B2 (ja) 光学的文字読み取り装置
JP3058706B2 (ja) 住所カナの漢字変換方法
JPH06103419A (ja) 単語辞書編成方式
JP2988046B2 (ja) かな漢字変換装置
JPS61202273A (ja) 電子式辞書
JPH01293463A (ja) 文字処理装置
JPS6148067A (ja) 文書フアイル装置
JPH0484261A (ja) 誤り表記検索方式
JPS6074094A (ja) 文字認識装置
JPS63131289A (ja) 単語照合装置
JPH04323774A (ja) 画像処理装置
JPS6356756A (ja) コレクト機能付欧文作成装置
JPH0498358A (ja) カナ住所知識処理方式
JPH069053B2 (ja) 住所辞書照合装置
JPS6247874A (ja) プログラム動作装置の初期化方法
JPS63113787A (ja) 文字認識装置の帳票デ−タ入力方式
JPH0338786A (ja) 文字認識処理装置
JPH0636069A (ja) 文字認識装置
JPH0756951A (ja) データ校正用シート及びデータ校正用シート出力システム
JPS5833782A (ja) 読取り誤り減少方式
JPH04304584A (ja) 文字読取装置
JPS57147750A (en) Japanese input device