JPS60207981A - 辞書登録方式 - Google Patents
辞書登録方式Info
- Publication number
- JPS60207981A JPS60207981A JP59063565A JP6356584A JPS60207981A JP S60207981 A JPS60207981 A JP S60207981A JP 59063565 A JP59063565 A JP 59063565A JP 6356584 A JP6356584 A JP 6356584A JP S60207981 A JPS60207981 A JP S60207981A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- memory
- ocr
- characters
- kanji
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[光明の技術分野]
本発明は、特に漢字OCRの文字認識用辞−を作成して
登録する辞書登録方式に関する。
登録する辞書登録方式に関する。
[発明の伎1も的背県とその問題点]
従来、OCR<光学的文字読取装置)は通爪、文字単位
の認*ta理を行なうように構成されており、単語又は
所定の文字列単位で識別、照合するような方式は適用さ
れていない。ところで近年、パターン認識技術の進歩に
より平田き、活字の漢字の読取を行なうことができるO
CRが開発されている。このような漢字読取の可能なO
CRを利用すれば、文章の情報入力装置への応用が可能
となる。
の認*ta理を行なうように構成されており、単語又は
所定の文字列単位で識別、照合するような方式は適用さ
れていない。ところで近年、パターン認識技術の進歩に
より平田き、活字の漢字の読取を行なうことができるO
CRが開発されている。このような漢字読取の可能なO
CRを利用すれば、文章の情報入力装置への応用が可能
となる。
このような情報入力装置では、11g1単位の入力。
修正及び文脈処理を利用した照合、eA集処理を行なう
OCRを必要とする。しかしながら、このようなOCR
では単語単位の認識処理に必要な後処理用のAPIが必
要となるが、従来においてはOCRの後処理用辞mをユ
ーザ側で作成することは困難であった。
OCRを必要とする。しかしながら、このようなOCR
では単語単位の認識処理に必要な後処理用のAPIが必
要となるが、従来においてはOCRの後処理用辞mをユ
ーザ側で作成することは困難であった。
[発明の目的]
本発明は上記の点に鑑みてなされたもので、その目的は
、単語単位の読取の可能な漢字OCRの文字認識用辞膚
である後処理用単語辞痛を簡単な操作で作成できる辞書
登録方式を提供することにある。
、単語単位の読取の可能な漢字OCRの文字認識用辞膚
である後処理用単語辞痛を簡単な操作で作成できる辞書
登録方式を提供することにある。
[発明の概要]
本発明では、予め辞書登録用の単語又は個別文字を記録
するための辞書登録用シートが用意される。この辞書登
録用シートに記録された漢字を含む単語又は文字を読取
るOCRが設けられる。修正手段は、OCRにより読取
られた単語又は文字に対して読取不能文字の修正または
文字の追加。
するための辞書登録用シートが用意される。この辞書登
録用シートに記録された漢字を含む単語又は文字を読取
るOCRが設けられる。修正手段は、OCRにより読取
られた単語又は文字に対して読取不能文字の修正または
文字の追加。
削除等の修正を行なう。辞書作成手段は、上記OCRに
より読取られた単語9文字及び上記修正手段の修正結果
に基づいてOCRの後処理用単語辞書を作成する1能を
有している。辞書作成手段により作成された後処理用辞
書は、登録手段により所定の辞書メモリに記憶される。
より読取られた単語9文字及び上記修正手段の修正結果
に基づいてOCRの後処理用単語辞書を作成する1能を
有している。辞書作成手段により作成された後処理用辞
書は、登録手段により所定の辞書メモリに記憶される。
このような構成により、ユーザは辞書登録用シートに必
要な単語を記入し、又修正手段を操作するだけでOCR
の後処理用辞書を作成できる。
要な単語を記入し、又修正手段を操作するだけでOCR
の後処理用辞書を作成できる。
[発明の実施例]
以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わる構成を示すブロック図である。第
1図において、漢字OCR10は、例えば第2図に示す
ような辞書登録用シー1−20に記録された漢字を含む
単語又は文字を読取る装置である。辞書メモリ11は、
漢字OCR10の読取処理に必要な全文字種の標準パタ
ーンを記憶している。漢字OCR10で読取られた単語
又は文字(、i、制御lB置12に出力される。この制
御装置i12は、漢字OCR10から与えられる読取結
果を一時中間フアイルメモリ13に記憶し、この中間フ
ァイルメモリ13内のデータに基づいてOCRの後処理
用単Xll辞書を作成する機能を有している。入出力1
1i14は、キーボード及びCRTディスプレイ装置か
らなり、中間ファイルメモリ13から読取結果を読出し
て、読取不能文字の修正等を行なう。出力ファイルメモ
リ15は、制御ll装置12で作成された後処理用単重
辞書を所定の後処理用辞書メモリに登録する際に使用さ
れるメモリである。プリンタ1Gは制御装置12により
ダンプされる漢字OCR10の読取結果を印字する。
図は一実施例に係わる構成を示すブロック図である。第
1図において、漢字OCR10は、例えば第2図に示す
ような辞書登録用シー1−20に記録された漢字を含む
単語又は文字を読取る装置である。辞書メモリ11は、
漢字OCR10の読取処理に必要な全文字種の標準パタ
ーンを記憶している。漢字OCR10で読取られた単語
又は文字(、i、制御lB置12に出力される。この制
御装置i12は、漢字OCR10から与えられる読取結
果を一時中間フアイルメモリ13に記憶し、この中間フ
ァイルメモリ13内のデータに基づいてOCRの後処理
用単Xll辞書を作成する機能を有している。入出力1
1i14は、キーボード及びCRTディスプレイ装置か
らなり、中間ファイルメモリ13から読取結果を読出し
て、読取不能文字の修正等を行なう。出力ファイルメモ
リ15は、制御ll装置12で作成された後処理用単重
辞書を所定の後処理用辞書メモリに登録する際に使用さ
れるメモリである。プリンタ1Gは制御装置12により
ダンプされる漢字OCR10の読取結果を印字する。
このような構成において、一実施例に係わる動作を説明
する。先ず、ユーザは第2図に示すような辞書登録用シ
ート20に必要な単語(特定の文字組合わせを含む)又
は文字を記入する。この辞書登録用シート20には、例
えば単語又は文字を記入する登録欄21.継続@22.
読取結果欄23.修正チェックlIl!124及び修正
欄25が設けられている。継続1III122は登録欄
21に記入する文字列が一行以上である場合、次行に継
続することを指示する鞠である。
する。先ず、ユーザは第2図に示すような辞書登録用シ
ート20に必要な単語(特定の文字組合わせを含む)又
は文字を記入する。この辞書登録用シート20には、例
えば単語又は文字を記入する登録欄21.継続@22.
読取結果欄23.修正チェックlIl!124及び修正
欄25が設けられている。継続1III122は登録欄
21に記入する文字列が一行以上である場合、次行に継
続することを指示する鞠である。
読取結果1ThI123は、プリンタ16により制御装
置12から出力される読取結果を印字する欄である。こ
の読取結果がミスであれば、修正チェック欄24にチェ
ック記号が記入され、さらに修正欄25に修正された文
字列が記入されることになる。
置12から出力される読取結果を印字する欄である。こ
の読取結果がミスであれば、修正チェック欄24にチェ
ック記号が記入され、さらに修正欄25に修正された文
字列が記入されることになる。
上記のような辞!登録用シート20が、漢字0CR10
により読取処理される。この場合、漢字0CR10は辞
書メモリ11内の全文字種辞書に基づいて、文字単位の
読取処理を行なう。漢字OCR10から出力される読取
結果は、制御装置12に送られる。
により読取処理される。この場合、漢字0CR10は辞
書メモリ11内の全文字種辞書に基づいて、文字単位の
読取処理を行なう。漢字OCR10から出力される読取
結果は、制御装置12に送られる。
制tlll@[12は、漢字OCR10からの読取結果
を一度中間ファイルメモリ13に記憶する。次に、ユー
ザは入出力[i14のキーボードを操作して、中間ファ
イルメモリ13から漢字OCR10の読取結果を読出し
、CRTディスプレイ装置に表示する。ユーザは、CR
Tディスプレイ装置の表示と辞!登録用シート20を比
較チェックして、読取不能文字をキーボードで修正する
。制御ll装置12は、上記のようにして修正された読
取結果をプリンタ16に出力する。このプリンタ16は
、ユーザによりセットされた辞書登録用シート20の読
取結果1i’1l123にルリ罪装置12からの読取結
果を印字する。ユーザは、辞書登録用シート20の登録
l11121と読取結果欄23をチェックして、読取ミ
スがあれば修正(11!25に修正した文字列を記入す
る。そして、修正した後の辞書登録用シート20を漢字
OCR10で読取らせるか、又は入出力装置14のキー
ボードで修正@25の修正結果を制gfJ装置11i1
2に入力する。
を一度中間ファイルメモリ13に記憶する。次に、ユー
ザは入出力[i14のキーボードを操作して、中間ファ
イルメモリ13から漢字OCR10の読取結果を読出し
、CRTディスプレイ装置に表示する。ユーザは、CR
Tディスプレイ装置の表示と辞!登録用シート20を比
較チェックして、読取不能文字をキーボードで修正する
。制御ll装置12は、上記のようにして修正された読
取結果をプリンタ16に出力する。このプリンタ16は
、ユーザによりセットされた辞書登録用シート20の読
取結果1i’1l123にルリ罪装置12からの読取結
果を印字する。ユーザは、辞書登録用シート20の登録
l11121と読取結果欄23をチェックして、読取ミ
スがあれば修正(11!25に修正した文字列を記入す
る。そして、修正した後の辞書登録用シート20を漢字
OCR10で読取らせるか、又は入出力装置14のキー
ボードで修正@25の修正結果を制gfJ装置11i1
2に入力する。
上記のようなユーザによる照合確認が終了すると、制W
装@12は同一文字の排除等の重復チェックを行なって
、修正語の読取結果に基づいてOCRの後処理用単語辞
書を作成する。ここで、単語読取用のOCRにおける後
処理には、主として照合と編集の各日能がある。照合礪
能は、単なる単語の登録有無の確認、又階層構造になっ
ているデータのチェック例えば東京都と部内の市町村区
との関係を照合する動作である。又、編集灘能とはデー
タの付加、省略KIの補正動作であり、例えば郵便番号
から住所を付加するなどの櫟能である。
装@12は同一文字の排除等の重復チェックを行なって
、修正語の読取結果に基づいてOCRの後処理用単語辞
書を作成する。ここで、単語読取用のOCRにおける後
処理には、主として照合と編集の各日能がある。照合礪
能は、単なる単語の登録有無の確認、又階層構造になっ
ているデータのチェック例えば東京都と部内の市町村区
との関係を照合する動作である。又、編集灘能とはデー
タの付加、省略KIの補正動作であり、例えば郵便番号
から住所を付加するなどの櫟能である。
したがって、後処理用単語辞書は上記のような照合及び
sin能を実現するための辞書である。制御0装置12
は、作成した後処理用単語辞書を出力ファイルメモリ1
5に記憶する。この出力ファイルメモリ15から所定の
後処理用の辞書メモリに後処理用型R■1が登録される
ことになる。
sin能を実現するための辞書である。制御0装置12
は、作成した後処理用単語辞書を出力ファイルメモリ1
5に記憶する。この出力ファイルメモリ15から所定の
後処理用の辞書メモリに後処理用型R■1が登録される
ことになる。
このようにして、ユーザは予め用意された辞書登録用シ
ート20に必要な単語を記入し、また入出力装[14を
利用した修正処理を行なうだけで、単にR読取用のOC
Rの後処理用型in i 四を確実に作成できる。
ート20に必要な単語を記入し、また入出力装[14を
利用した修正処理を行なうだけで、単にR読取用のOC
Rの後処理用型in i 四を確実に作成できる。
「発明の効果コ
以上詳述したように本発明によれば、単&n I収用O
CRの後処理用単語辞書を簡単な操作でしかも確実に作
成できる。したがって、単語読取用OCRを容易に実現
でき、このOCRを適用づれば文章の情報入力装置を容
易に構成できるものである。
CRの後処理用単語辞書を簡単な操作でしかも確実に作
成できる。したがって、単語読取用OCRを容易に実現
でき、このOCRを適用づれば文章の情報入力装置を容
易に構成できるものである。
第1図は本発明の一実施例に係わる辞囚Ω録方式の構成
を示すブロック図、第2図は静間登録用シートの一例を
示す図である。 10・・・漢字OCR,11・・・辞書メモリ、12・
・・制御装置、13・・・中間ファイルメモリ、14・
・・入出力装置、15・・・出力ファイルメモリ、1G
・・・プリンタ。 出願人代理人 弁理士 鈴江武彦
を示すブロック図、第2図は静間登録用シートの一例を
示す図である。 10・・・漢字OCR,11・・・辞書メモリ、12・
・・制御装置、13・・・中間ファイルメモリ、14・
・・入出力装置、15・・・出力ファイルメモリ、1G
・・・プリンタ。 出願人代理人 弁理士 鈴江武彦
Claims (1)
- 予め辞II登録用の申關又は個別文字を記録するための
辞m登録用シートと、この辞書登録用シートに記録され
た漢字を含む単!!R又は文字を読取るOCRど、この
OCRの読取結果に対して読取不能文字の修正または文
字の追加、削除等の修正を行なう修正手段と、上記OC
Rから出力される読取結果及び上記修正手段の修正結果
に基づいてOCRの後処理用型;n辞四を作成する辞書
作成手段と、この辞書作成手段により作成された後処理
用単317辞書を所定の辞重メモリに配憶する登録手段
とを具備してなることを特徴とする辞書登録方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59063565A JPS60207981A (ja) | 1984-03-31 | 1984-03-31 | 辞書登録方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59063565A JPS60207981A (ja) | 1984-03-31 | 1984-03-31 | 辞書登録方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60207981A true JPS60207981A (ja) | 1985-10-19 |
Family
ID=13232884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59063565A Pending JPS60207981A (ja) | 1984-03-31 | 1984-03-31 | 辞書登録方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60207981A (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5930176A (ja) * | 1982-08-10 | 1984-02-17 | Nippon Telegr & Teleph Corp <Ntt> | 文字判定処理方式 |
-
1984
- 1984-03-31 JP JP59063565A patent/JPS60207981A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5930176A (ja) * | 1982-08-10 | 1984-02-17 | Nippon Telegr & Teleph Corp <Ntt> | 文字判定処理方式 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS60207981A (ja) | 辞書登録方式 | |
JP2865443B2 (ja) | カナ氏名もしくはカナ法人名表記の漢字変換装置 | |
JPH0373913B2 (ja) | ||
JP3217442B2 (ja) | 光学的文字読み取り装置 | |
JP3058706B2 (ja) | 住所カナの漢字変換方法 | |
JPH06103419A (ja) | 単語辞書編成方式 | |
JP2988046B2 (ja) | かな漢字変換装置 | |
JPS61202273A (ja) | 電子式辞書 | |
JPH01293463A (ja) | 文字処理装置 | |
JPS6148067A (ja) | 文書フアイル装置 | |
JPH0484261A (ja) | 誤り表記検索方式 | |
JPS6074094A (ja) | 文字認識装置 | |
JPS63131289A (ja) | 単語照合装置 | |
JPH04323774A (ja) | 画像処理装置 | |
JPS6356756A (ja) | コレクト機能付欧文作成装置 | |
JPH0498358A (ja) | カナ住所知識処理方式 | |
JPH069053B2 (ja) | 住所辞書照合装置 | |
JPS6247874A (ja) | プログラム動作装置の初期化方法 | |
JPS63113787A (ja) | 文字認識装置の帳票デ−タ入力方式 | |
JPH0338786A (ja) | 文字認識処理装置 | |
JPH0636069A (ja) | 文字認識装置 | |
JPH0756951A (ja) | データ校正用シート及びデータ校正用シート出力システム | |
JPS5833782A (ja) | 読取り誤り減少方式 | |
JPH04304584A (ja) | 文字読取装置 | |
JPS57147750A (en) | Japanese input device |