JPS58163072A - 文字修正方式 - Google Patents

文字修正方式

Info

Publication number
JPS58163072A
JPS58163072A JP57045393A JP4539382A JPS58163072A JP S58163072 A JPS58163072 A JP S58163072A JP 57045393 A JP57045393 A JP 57045393A JP 4539382 A JP4539382 A JP 4539382A JP S58163072 A JPS58163072 A JP S58163072A
Authority
JP
Japan
Prior art keywords
candidate
word
character
section
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57045393A
Other languages
English (en)
Other versions
JPH0411914B2 (ja
Inventor
Eiichiro Yamamoto
山本 栄一郎
Hiroshi Kamata
洋 鎌田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP57045393A priority Critical patent/JPS58163072A/ja
Publication of JPS58163072A publication Critical patent/JPS58163072A/ja
Publication of JPH0411914B2 publication Critical patent/JPH0411914B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、文字認識装置に係り、特に誤読文字を修正す
る文字修正方式に関する。
〔従来技術と問題点〕
第1図は入力文字とその認識結果の比較例を示す図であ
る。(a)は入力文字、(b)は認識結果を示す。
第1図に示すように、入力文字(a)が「日本語」であ
るのに対して文字認識装置における認識結果(b)が1
日本語」であった場合には、第2文字目の認識結果の「
木」を「本」に修正しなげればならない。従来、このよ
うな場合の文字修正方式としては、入力文字「本」の認
識候補文字を表示し、その中からオペレータが選択する
という方式、或はキー・ボードを用いてオペレータが「
本」の文字のコードを入力する方式等がある。しかしな
がら前者の方式では、1文字ごとに修正するため認識候
補文字が多(なり、その中からオペレータが選択して!
u大文字修正する点でオペレータの負担が重くなり、ま
た後者の方式でも、やはり1文字ごとにオペレータがキ
ス・ボードを操作して誤読文字を修正しなければならず
、オペレータの負担が重くなる。このように、従来の方
式はいずれにしても操作が煩雑であり、オペレータの負
担も重くなるという欠点があった。
〔発明の目的〕
本発明は、上記の欠点を排除するものであって入力文字
と認識結果が異なったときにおける誤読文字の修正の操
作を容易にすることを目的とするものである。
〔発明の構成〕
上記目的を達成するため本発明の文字修正方式は、入力
文字の画情報を読取る観測部と、該観測部からの画情報
にもとづいて入力文字の特徴を抽出する特徴抽出部と、
複数個の文字種の標準特徴が格納された認識辞書部と、
上記特徴抽出部によって抽出された入力文字の特徴と上
記認識辞書部に格納された標準特徴とを比較して1個の
入力文字に対し複数個の候補文字を選択する識別部と、
上記識別部によって選択された1個の入力文字に対する
複数個の候補文字を類似度の順位にしたがって区分けし
て格納する候補カテゴリ・バッファと、複数個の単語が
格納された単語辞書部と、表示部と、修正制御部とを備
え、上記修正制御部は、上記候補カテゴリ・バッファの
第1順位に格納されている候補文字列を上記表示部に表
示し、上記表示部から誤読単語の指定がなされた場合に
は上記候補カテゴリ・バッファの各順位の該当する単語
と上記単語辞書部の内容とを照合して候補単語を選択し
、該候補単語を上記表示部に表示するように構成された
ことを特徴とするものである。
〔発明の実施例〕
以下、本発明を図面を参照しつつ説明する。
第2図は本発明の1実施例を示すブロック図、第3図は
入力文字の認識結果を表示した例を示す図、第4図は単
語置換表示による文字修正方式を説明する図、第5図は
単語別欄表示による文字修正方式を説明する図、第6図
は単語のマツチングの方法の1例を説明する図である。
第1図において、1は観測部、2は特徴抽出部、3は識
別部、4は認識辞書、5は候補カテゴリ・バッファ、6
は修正制御部、7は単語辞書、8は表示部を示す。
第2図において、観測部1は、文字の書かれた用紙から
入力文字を読取って光電変換するものであり、その出力
が特徴抽出部2の入力に供給される。特徴抽出部2は、
観測部1から供給された文字図形情報より入力文字の特
徴を抽出するものであり、その出力が識別部3の入力に
供給される。
識別部3は、特徴抽出部2から供給された入力文字の特
徴と予め認識辞書4に格納されている文字の標準特徴と
を比較することにより入力文字に近いと判定された候補
カテゴリを職別するものであり、標準特徴が認識辞書4
から入力され、出力を候補カテゴリ・バッファ5の入力
に供給される。
識別部3においては1個の入力文字に対し複数個の候補
文字が選択される。候補カテゴリ・パン7ア5は、識別
部3から供給された候補カテゴリを蓄積するものであり
、その出力が修正制御部6の入力に供給される。候補カ
テゴリ・バッファ5はh段の領域を有しており、第1順
位の候補文字は第1段の領域に格納され、同様に第i゛
順位の候補文字は第n段の領域に格納される。各段の領
域の大きさは例えば1画面分の候補文字が格納できる。
修正制御部6は、候補カテゴリ・バッファ5の第1順位
に格納されている候補文字列を表示部8に表示する。ま
た表示部8から誤読単語の指定がなされた場合には候補
カテゴリ・バッファ5の各順位に該当する単語を単語辞
書7の内容と照合して候補単語を選択し、その候補単語
を表示部8に表示する。
次に文字修正法について第2図ないし第5図を参照゛し
つつ説明する。観測部1により入力文字の画情報が読み
取られるとその画情報は特徴抽出部2に転送される。特
徴抽出部において画情報から入力文字の特徴が抽出され
、その特徴は識別部3に転送される。識別部3は特徴抽
出部2によって抽出された入力文字の特徴と認識辞書4
に格納された標準特徴とを比較して1個の入力文字に対
し複数個の候補文字を選択する。識別部3によって選択
された複数個の候補文字は類似度の順位にしたがって区
分けされ、第1順位の候補文字は候補カテゴリ・バッフ
ァ5の第1段の領域に、同様に第n順位の候補文字は候
補カテゴリ・バッファ5の第n段の領域に格納される。
各候補文字が候補カテゴリ・バッファ5に格納されると
、候補カテゴリ・バッファ5の第1段に格納された候補
文字列が修正制御部6によって表示部8に表示される。
表示部8から誤読単語の指定があると修正制御部6によ
り候補カテゴリ・バッファ5の各順位に該当する単語と
単語辞V7の内容とを照合して候補単語を選択し、その
選択された候補単語が表示部8に表示される。
入力文字の認識結果を表示部8に表示した例を示したの
が第3図である。第3図において、誤読文字を含む文字
列をみると1計算機」、「演字」と「日本人」がある。
そこで、オペレータが表示部8をみて、誤読単語をライ
ト・ペン或はカーソル等を用いることにより上記訳読文
字を含む文字列のうち「計算機」の部分を指示すると、
修正制御部6によって単語辞書7から3文字の単語が順
次読出され、候補カテゴリ・バッファ5の候補カテゴリ
とのマツチング処理が行なわれる。単語のマツチングが
行われた後、修正制御部6によって入力文字列に近いと
判定された候補単語が幾つか表示されるように表示部8
が制御される。表示の方法は、第4図に斜線部で示すよ
うにもとの単語が表示されている部分を最大候補単語で
置換する方法、或は第5図で表示画面の下部に示すよう
に複数の候補単語を一括して別欄に表示する方法等があ
る。後者の方法ではオペレータが表示された単語の中か
らどの単語かを指定することによって誤読文字が修正さ
れる。修正されると候補カテゴリ・バッファ5の該当す
る第1順位の文字は修正された文字に書きかえられる。
単語のマツチングの方法の1例を第6図により説明する
。第6図(a)は、入力文字例「計算機」が入力された
とき、特徴抽出部2で抽出された特徴とV!識辞曹4に
格納されている標準特徴とが識別部3で比較され、入力
文字に近いと判定された候補カテゴリの例である。入力
文字「計」に対しては、「討」、「計」、「許」の順位
で、入力文字「算」に対しては、「算」、「真」、「尊
」の順位で、入力文字「機」に対しては、「機」、「織
」、「械」の順位で候補カテゴリが判定され、そしてそ
の順位に従って重み1.2.3が付加されている。
認識結果の表示は、この第1順位の候補カテゴリが選択
される。第6図Cb)は誤読文字として指示された「計
算機」に対して単語辞書7に登録されている単語のうち
から修正制御部6によって引き出された3文字単語の例
を示すものである。第6図(0)は単語辞書から引き出
された3文字単語と候補カテゴリとの距離計算をした例
を示す図である。
距離計算に当っては、例えば第6図(a)のように、第
1順位の候補カテゴリには数値″1”、第2順位の候補
カテゴリには数値″2”、第3順位の候補カテゴリには
数値II3” 候補カテゴリにないものには数値″4′
″の重みが割当てられる。この重みを第6図(b)の単
語辞書7から引き出された3文字単語の夫々について加
算すると、第6図(c)のように「計算機」が4と最も
小さく、次いで[討論食が9.「計数器」が10となる
。その結果、入力文字列に一番類似している単語は「計
算機」と判定される。第4図或いは第5図に表示される
候補単語は上記計算結果の小さいものから、即ちより類
似していると判定された順位にしたがってなされる。
以上の説明は、候補カテゴリがそれぞれ第3順位まで候
補カテゴリ・バッファ5に蓄積され、その順位にしたが
って数値″1″′ないし3″′の重みを付加し、また候
補カテゴリ以外の文字は数値″4”′の重みを付加して
説明したが、これらの数値は適宜変更しても何らさしつ
かえない。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、誤読
文字、認識不能文字を文字例(単語)単位で修正するこ
とができるので、修正するときの候補文字も少な(なり
、文字修正の操作が容易になるという効果を奏する。
【図面の簡単な説明】
第1図は入力文字と認識結果の比較例を示す図、第2図
は本発明の1実施例を示すブロック図、第3図は入力文
字の認識結果を表示した例を示す図第4図は単語置換表
示による文字修正方式を説明する図、第5図は単語別欄
表示による文字修正方式を説明する図、第6図は単語の
マツチングの方法の1例を説明する図である。 1・・・観測部、2・・・特徴抽出部、3・・・識別部
、4・・・認識辞書、5・・・候補カテゴリ・バッファ
、6・・・修正制御部、7・・・単語辞書、8・・・表
示部特許出願人 電子計算機基本技術研究組合代理人弁
理士 京 谷 四 部 プ 1 図 一′X 2 図 1 痺 3図 少牛区 伏5図 吹 ん 凹 (久)イ屍不屯カ子ゴリ             C
し)U−tj卒書(C)

Claims (1)

    【特許請求の範囲】
  1. 入力文字の画情報を読取る観測部と、該観測部からの画
    情報にもとづいて入力文字の特徴を抽出する特徴抽出部
    と、複数個の文字種の標準特徴が格納された認識辞書部
    と、上記特徴抽出部によって抽出された入力文字の特徴
    と上記認識辞書部に格納された標準特徴とを比較して1
    個の入力文字に対し複数個の候補文字を選択する識別部
    と、上記識別部によって選択された1個の入力文字に対
    する複数個の候補文字を類似度の順位にしたがって区分
    けして格納する候補カテゴリ・バッファと、複数個の単
    語が格納された単語辞書部と、表示部と、修正制御部と
    を備え、上記修正制御部は、上記候補カテゴリ・バッフ
    ァの第1順位に格納されている候補文字列を上記表示部
    に表示し、上記表示部から誤読単語の指定がなされた場
    合には上記候補カテゴリ・バッファの各順位の該当する
    単語と上記単語辞’IF T=”Jの内容とを照合して
    候補単語を選択し1核候補単語を上記表示部に表示する
    ように構成されたことを特徴とする文字修正方式。
JP57045393A 1982-03-20 1982-03-20 文字修正方式 Granted JPS58163072A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57045393A JPS58163072A (ja) 1982-03-20 1982-03-20 文字修正方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57045393A JPS58163072A (ja) 1982-03-20 1982-03-20 文字修正方式

Publications (2)

Publication Number Publication Date
JPS58163072A true JPS58163072A (ja) 1983-09-27
JPH0411914B2 JPH0411914B2 (ja) 1992-03-02

Family

ID=12718015

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57045393A Granted JPS58163072A (ja) 1982-03-20 1982-03-20 文字修正方式

Country Status (1)

Country Link
JP (1) JPS58163072A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0384692A (ja) * 1989-08-29 1991-04-10 Hitachi Ltd 手書文字認識方式および装置
JP2010067179A (ja) * 2008-09-12 2010-03-25 Casio Comput Co Ltd 辞書機能を備えた電子機器およびプログラム
JP2021149531A (ja) * 2020-03-19 2021-09-27 株式会社Pfu 情報処理装置、修正候補表示方法、及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5838377A (ja) * 1981-08-28 1983-03-05 Mitsubishi Electric Corp 点火時期制御装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5838377A (ja) * 1981-08-28 1983-03-05 Mitsubishi Electric Corp 点火時期制御装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0384692A (ja) * 1989-08-29 1991-04-10 Hitachi Ltd 手書文字認識方式および装置
JP2010067179A (ja) * 2008-09-12 2010-03-25 Casio Comput Co Ltd 辞書機能を備えた電子機器およびプログラム
JP2021149531A (ja) * 2020-03-19 2021-09-27 株式会社Pfu 情報処理装置、修正候補表示方法、及びプログラム

Also Published As

Publication number Publication date
JPH0411914B2 (ja) 1992-03-02

Similar Documents

Publication Publication Date Title
US7257528B1 (en) Method and apparatus for Chinese character text input
US4951202A (en) Oriental language processing system
CN1672118A (zh) 优化世界文字信息数字化运算编码输入方法及其信息处理系统
JPH11120293A (ja) 文字認識/修正方式
US4677585A (en) Method for obtaining common mode information and common field attribute information for a plurality of card images
US7711541B2 (en) Chinese input method, Chinese input device, and computer-readable medium
JP2003524258A (ja) 電子ドキュメントを処理する方法および装置
US5072386A (en) Method for culturally predictable keysort within a national language support (nls) data processing system
CN110765107B (zh) 基于数字化编码的题型识别方法及其系统
JPS58163072A (ja) 文字修正方式
WO2000043861A1 (en) Method and apparatus for chinese character text input
JP3940450B2 (ja) 文字読取装置
JPH08263587A (ja) 文書入力方法および文書入力装置
US5198978A (en) System for facilitating the sorting of national language keys in a data processing system
JP3803253B2 (ja) 漢字入力のための方法および装置
JPH1055409A (ja) 手書き入力情報処理装置
JP3663865B2 (ja) 帳票処理装置及び記憶媒体
JPH0452509B2 (ja)
JPH11250182A (ja) 文字認識装置
JPH06203018A (ja) 文書処理装置
JPH05298489A (ja) 文字認識方式
JPS61133487A (ja) 文字認識装置
JPH0728929A (ja) 文字入力装置
JPH0253832B2 (ja)
JPH03240183A (ja) 認識文字自動修正方式