JPS6097477A - 誤読文字修正方式 - Google Patents

誤読文字修正方式

Info

Publication number
JPS6097477A
JPS6097477A JP58204183A JP20418383A JPS6097477A JP S6097477 A JPS6097477 A JP S6097477A JP 58204183 A JP58204183 A JP 58204183A JP 20418383 A JP20418383 A JP 20418383A JP S6097477 A JPS6097477 A JP S6097477A
Authority
JP
Japan
Prior art keywords
character
characters
word
misread
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58204183A
Other languages
English (en)
Other versions
JPH0319590B2 (ja
Inventor
▲はい▼ 東善
Touzen Hai
Eiichiro Yamamoto
山本 栄一郎
Yukikazu Kaburayama
蕪山 幸和
Yoshihisa Fujii
敬久 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58204183A priority Critical patent/JPS6097477A/ja
Publication of JPS6097477A publication Critical patent/JPS6097477A/ja
Publication of JPH0319590B2 publication Critical patent/JPH0319590B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の技術分野 本発明は、単語辞書を備えた文字認識装置における誤読
文字修正方式に関する。
従来技術と問題点 手書き又は印刷された文字列を光学的に読取る文字認識
装置では、認識結果をディスプレイに表示して、誤って
認識した文字(誤読文字)があればそれをオペレータの
指示により修正する機能が付加されている。
従来の誤読文字修正方式の代表的なものは、各文字に対
する認識結果を第1位から第N位まで用意し、誤読文字
があればそれをオペレータに指示させ、この指示に従っ
て次の順位の認識結果を表示し、それも誤読文字であれ
ば次の順位の認識結果を表示し、以下同様にして順次順
位の低い文字候補を表示しながら正しい文字をオペレー
タに選択してもらう方法である。、この方法の欠点は誤
読文字と前後の文字との関係を利用しないために、例え
ば1つの単語の1文字が誤読されている場合、他の文字
と組合わせても既存の単語を構成しない無意味な文字候
補も、単に候補に挙げられているというだけで順次出力
してオペレータに選択させ、オペレータ負担を重くし修
正に要する時間を長びかせる点である。
そこで本発明者等は先に単語辞書を利用した誤読文字修
正方式を提案した。この方式は@読文字を含む単語の範
囲をオペレータが指定すると、認識装置側が該範囲内の
各文字の候補を組合せて構成されるfp、語候補のうち
、実際に単語辞書に存在する単語だけを選択して出力す
るものである。従って、単語を構成しない文字候補は一
切出力されないので、その分オペレータによる修正作業
は簡略化され、高速化される。
しかし、この方式を実用化するには次の点に留意する必
要がある。即ら、単語は2文字、3文字などで構成され
るが、2文字の単語は非常に多い。
そこで該単語の各文字に対する第1〜第N位候補間で有
意の単語を作ってしまい、オペレータにそれではないと
指示させる結果となるものが多発する恐れがある。例え
ば、如何に単語辞書を引いて該辞書にある単語として出
力されたものであっても、その単語が誤読文字と組合わ
されたものでは、その中に正解はない。
発明の目的 本発明は上述した単語単位の誤読文字修正方式を更に改
善して、正解文字はそのま\採用しそれに誤読文字に対
する他の候補文字を組合せた単語だけを出力することで
誤読文字の修正を高速化しようとするものである。
発明の構成 本発明は、光学的に読取った入力文字列を文字単位で識
別する識別部と、該識別部で参照する各種の文字候補を
予め格納した認識辞書と、該識別部により認識され、且
つ1文字当り複数位に順位付けされた認識結果を格納す
る候補カテゴリバッファと、該バッファ内の第1順位の
文字による文字列を表示する表示部と、該表示部で表示
された文字列の修正個所を指定できる操作部と、単語単
位の文字修正時に参照される各種の単語を格納した単語
辞書とを備える文字認識装置の誤読文字修正方式におい
て、該操作部によって誤読文字と該文字を含む単語の範
囲を該表示部上で指定することにより、正解文字はその
ま\とじてそれに誤読文字に対する他の候?+!i文字
を組合せて該範囲と同じ単語長になる単語を作り、それ
を単語辞書で検索して該辞宿に存在した単語を取出し、
その各々について該候補文字に関するd:1記バツフア
内の順位を参照して距離計算し、該距離が最小の単語を
該誤読文字を含む単語範囲の他の候補として表示するこ
とを特徴とするが、以下図示の実施例を参照しながらこ
れを詳細に説明する。
発明の実施例 表1は一般的な文字認識装置において認識した入力文字
列「この分野における進歩・・・・・・」に対する認識
結果即ち1文字ごとの1位から5位までの候補文字を示
したものである。
表 1 候補文字(候補カテゴリ)の順位1,2.・・・・・・
は類似度の高い順で、各文字の1位が優先して先ず表示
される。オペレータはその表示から入力文字列が正しく
読み取られたかを判断する。表1の例では入力文字列第
4文字目の「野」と第9文字目の「進」がそれぞれ「師
」と「追」に誤読されていることが判る。そこで修正が
必要となる。
表2は誤りを文字単位で指示する従来方式1と、誤りを
単語単位で指定する従来方式2と、本発明方式とを指示
要領別及び選択順位別に対比して示したものである。
表 2 従来方式1は誤読文字を文字単位で修正するものである
ため、第4文字目の「野」に相当する部分をカーソル等
で指定して誤りであることを示すと、表1の候補カテゴ
リがら順位2の文字「貯」が代って表示され、それも誤
りであることを指示すると順位3の文字「終」が表示さ
れ、以下同様であってこうして順次順位の低い文字が表
示される。目的とする「野」は4位であるから、オペレ
ータが3回選択操作をすると修正される。第9文字目の
「進」についても候補カテゴリは3位であるから2回目
の選択で修正できる。以下同様であり、目的とする文字
の順位が低いほど多くの選択操作が必要となる。
従来方式2は単語辞書を用いる方式である。但し、単語
範囲(誤読文字を含む単語)だけを指示して該単語の複
数個ある文字のどれが誤読文字であるかは示さないので
、各文字毎の複数個の候補文字の全てについての組合せ
を単語辞書で引き、該組合せが辞書にあるか否かをチェ
ックすることになる。例えば第3および第4文字からな
る単語(「分野」に相当する)を指示した場合には、第
3文字候補と第4文字候補の全ての組合せ(5X5−2
5通り)の中に単語として意味を持つものがあるか否か
を単語辞書で調べることになる。そして、この場合は偶
然、この組合せの中に意味を持つもの従って辞書にある
ものは「分野」だけであるから問題ない(直接、正解が
得られる)が、第9および第10文字からなる単語(「
進歩」に相当する)の場合には、選択順位の1位に誤読
文字の1追」を含んで意味をもつ単語「追手」が入り、
正解の単語「進歩」が2位になる欠点がある。
この場合は先ず「追手」が表示され、オペレータがこれ
ではないと指示して次のメニューを出させる必要がある
本発明では上記従来方式2の単語範囲の指示に加え、ど
の文字が誤読されているかの指示も行う。
この点は表2には示してないが、かかる誤読文字の指示
を行えば単語辞書の検索範囲が狭くなりその分時間が短
縮されるが、それだけでなく表2に示すように「進歩」
が第1順位で選択されるようになる(後述する)のでオ
ペレータの操作が更に楽になる。
第1図は上述した処理をなす本発明の一実施例を示す要
部構成図、第2図は文字認識装置全体のブロック図であ
る。先ず第2図を参照して全体の概略動作を説明する。
観測部1は光学式の文字読取り機能を有し、手書き又は
印刷された入力文字列を読取る(光電変換する)。特徴
抽出部2は読取られた入力文字列の各文字の特徴を検出
して以後の認識操作がしやすいようにする。識別部3は
特徴抽出部2の出力を認識辞書4内の認識用のパターン
又はパラメータ等と比較、照合して距離針筒を行い、各
文字毎に類似度が高い1位から5位までの候補カテゴリ
(表1参照)をバッファ5に格納する。ここまでは表2
の全ての方式に共通であり、各文字毎に1位の文字を配
列した認識結果(文字列)がディスプレイ制御部8を通
して表示部9に表示される。オペレータはこの表示を見
て誤読されている文字があれば該誤読文字とそれを含む
単語範囲を指示する。これらの修正指示は例えばキーボ
ード(操作部)10から行なう。修正指示を受けた文字
認識装置は単語マツチング部7を起動し、l■ハ辞書6
を参照しての単語単位の文字修正を行う。
この動作を第1図で説明する。同図は表1の第9、第1
O文字の単語「進歩」を例としたものである。キーボー
ド10からは単語範囲と誤読文字を指示するので、その
修正指示情報Aを受けた単語辞書6は単語長が“2”で
最後が「歩jとなる単語B(NS1文字が誤読文字「追
」の第2〜第5候補で、第2文字が歩である単語)を全
て単語マツチング部7に出力する。この単語Bが「進歩
」「退歩」・・・・・・など複数あるときは、単語マツ
チング部7はバッファ5内の誤読文字に関する順位を参
照して単語Bに順位付けを行う。つまり2文字目を「歩
」に固定して1文字目を表1の第9文字のいずれかとに
11合一しると5通りの単語1侯補Cが生ずる(エラー
と判っζいる第1位は無視してよい)。
そこで、単語マソヂング部7は辞書6からの単語Bと上
記の単語候補Cの距離計算を行う。この際2文字目の1
−歩」については考える必要がないので、実際には1文
字目についてだけ距離計算を行先ず、単語Bの「進歩」
について単語候補Cと距離計算を行うと、1文字目の「
進」が候補順位3位であるため、順位に位に距%II(
K−1)という値を与えるものとすれば、「進歩」の距
AIDは2”となる。同様の考えから単語Bの「退歩」
については距離“4″が与えられる。このように単語B
の全てについて距離計算を行った後、距離が最小の単語
(この場合「進歩」)が表示部9に表示される。従って
、表2に示す従来方式2のように、「進歩」の前に誤読
文字を含む単語「追手」が出力されることはない。
発明の効果 以上述べたように本発明によれば、誤読された文字を含
む単語の範囲のみならず該文字そのものも指定するので
、単語辞書の検索範囲が狭くなって処理時間が短縮され
ると共に、該誤読文字に関する認識時の文字候補順位も
参照するので修正用の出力単語の正解率が高まる利点が
ある。
【図面の簡単な説明】
第1図は本発明の一実施例を示す要部説明図、第2図は
本発明を適用した文字認識装置全体のブロック図である
。 図中、1は観測部、2は特徴抽出部、3は識別部、4は
認識辞古、5は候補カテゴリバ・ノファ、6は単語辞書
、7は単語マツチング部、8はディスプレイ制御部、9
は表示部、10は操作部である。 出願人 富士通株式会社 代理人弁理士 青 柳 稔

Claims (1)

  1. 【特許請求の範囲】 光学的に読取った入力文字列を文字単位で識別する識別
    部と、該識別部で参照する認識辞書と、該識号:j部に
    より認識され、且つ1文字当り複数位に順位イリリされ
    た認識結果を格納する候補カテゴリバッファと、該バッ
    ファ内の第1順位の文字による文字列を表示する表示部
    と、該表示部で表示された文字列の修正+1lil所を
    指定できる操作部と、単語単位の文字修正時に参照され
    る各種の単語を格納した単語辞7(−とを備える文字認
    識装置の誤読文字修正方式において、 該操作部によって誤読文字と該文字を含む単語の範囲を
    該表示部」二で指定することにより、正解文字はそのま
    \とじてそれに誤読文字に対する他の候補文字を組合せ
    て該範囲と同じ単語長になる単語を作り、それをf1語
    辞訃で検索して該辞書に存在した単語を取出し、その各
    々について該候補文字に関する前記バッファ内の順位を
    参照して距離計算し、該距離が最小の単語を該誤読文字
    を含む単語範囲の他の候補として表示することを特徴と
    する誤読文字修正方式。
JP58204183A 1983-10-31 1983-10-31 誤読文字修正方式 Granted JPS6097477A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58204183A JPS6097477A (ja) 1983-10-31 1983-10-31 誤読文字修正方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58204183A JPS6097477A (ja) 1983-10-31 1983-10-31 誤読文字修正方式

Publications (2)

Publication Number Publication Date
JPS6097477A true JPS6097477A (ja) 1985-05-31
JPH0319590B2 JPH0319590B2 (ja) 1991-03-15

Family

ID=16486208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58204183A Granted JPS6097477A (ja) 1983-10-31 1983-10-31 誤読文字修正方式

Country Status (1)

Country Link
JP (1) JPS6097477A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6330990A (ja) * 1986-07-25 1988-02-09 Matsushita Electric Ind Co Ltd 文字認識装置
JPS63157292A (ja) * 1986-12-22 1988-06-30 Yokogawa Electric Corp 手書き漢字ocr装置
JP2007219849A (ja) * 2006-02-16 2007-08-30 Fujitsu Ltd 単語検索装置、単語検索方法、及びコンピュータプログラム
JP2011140829A (ja) * 2010-01-08 2011-07-21 Kazuo Kurokawa 水力発電用導水路及び山岳部水力発電方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6330990A (ja) * 1986-07-25 1988-02-09 Matsushita Electric Ind Co Ltd 文字認識装置
JPS63157292A (ja) * 1986-12-22 1988-06-30 Yokogawa Electric Corp 手書き漢字ocr装置
JP2007219849A (ja) * 2006-02-16 2007-08-30 Fujitsu Ltd 単語検索装置、単語検索方法、及びコンピュータプログラム
JP4744317B2 (ja) * 2006-02-16 2011-08-10 富士通株式会社 単語検索装置、単語検索方法、及びコンピュータプログラム
US8208730B2 (en) 2006-02-16 2012-06-26 Fujitsu Limited Word search using handwriting recognition input with dictionary-based correction suggestions
JP2011140829A (ja) * 2010-01-08 2011-07-21 Kazuo Kurokawa 水力発電用導水路及び山岳部水力発電方法

Also Published As

Publication number Publication date
JPH0319590B2 (ja) 1991-03-15

Similar Documents

Publication Publication Date Title
US6513005B1 (en) Method for correcting error characters in results of speech recognition and speech recognition system using the same
US7047238B2 (en) Document retrieval method and document retrieval system
JPS5816488B2 (ja) 日本語文入力方式
JPS6097477A (ja) 誤読文字修正方式
JP4301496B2 (ja) データベース検索装置、データベース検索方法およびプログラム
JP3274014B2 (ja) 文字認識装置および文字認識方法
JPS6210763A (ja) 仮名漢字変換処理装置
CN112990181B (zh) 文本识别的方法、装置、设备和存储介质
JPS61239378A (ja) 認識処理装置
JPS59229683A (ja) 認識処理装置
JP3935374B2 (ja) 辞書構築支援方法、装置及びプログラム
JP3442548B2 (ja) 文字認識方法および装置
JP3387421B2 (ja) 単語入力支援装置及び単語入力支援方法
JP2001283150A (ja) データ入力方法およびイメージエントリシステム
JPH0632090B2 (ja) パタ−ン認識装置
JP2001283156A (ja) 住所認識装置、住所認識方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0582621B2 (ja)
JP2669897B2 (ja) 誤読文字の修正方法
JPS61163472A (ja) 文字認識装置
JP2890788B2 (ja) 文書認識装置
JP5560105B2 (ja) 文字列選択装置、文字列選択方法およびプログラム
JPH08263487A (ja) 文字認識装置
JPH03135684A (ja) 文字認識装置
JPH06290298A (ja) 誤字の修正方法
JPH0359761A (ja) 英単語綴りの誤り訂正装置