JPS6286475A - パターン認識装置 - Google Patents

パターン認識装置

Info

Publication number
JPS6286475A
JPS6286475A JP60226731A JP22673185A JPS6286475A JP S6286475 A JPS6286475 A JP S6286475A JP 60226731 A JP60226731 A JP 60226731A JP 22673185 A JP22673185 A JP 22673185A JP S6286475 A JPS6286475 A JP S6286475A
Authority
JP
Japan
Prior art keywords
word
character
recognition
dictionary
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60226731A
Other languages
English (en)
Other versions
JPH0632086B2 (ja
Inventor
Osamu Kunisaki
国崎 修
Toshihiro Hananoi
花野井 歳弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60226731A priority Critical patent/JPH0632086B2/ja
Publication of JPS6286475A publication Critical patent/JPS6286475A/ja
Publication of JPH0632086B2 publication Critical patent/JPH0632086B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、文字1九は音−を対象とシ2、あらかじめ登
録した単飴辞1を用いた単語11れ合を併用I5゜たパ
ターン認識方式に関する。
〔発明の背景〕
従来、パターン認識装置、例えば文字認識装置において
、特に、漢字のように字種数の多いものを認識対象にし
た場合には、認識結果に対し、単語照合など前彼の文字
の連接情報や言語情報を利用して性能向上を図る処理を
併用することが知ら釘ている(たとえに、特開昭58−
39378号)。
この場合、認識の対象とする単語の組みあわせは、一般
には、ユーザの使用目的に応じて異なってくる。このた
めに、従来の文字認識装置では単語照合に用いら扛る単
語辞書は、例えは、住所9氏名など限らn、*範囲の単
語からなり、したがって、対象を限定した使い方をして
いた。このように。
使用する単語辞書に対応して認識対象字種(例えば、「
束」、「京」などの文字コードで区別されるものの種類
で、以下、字種という)が限定さ扛ることから、単語辞
書や文字認識のための認識辞書は共に固定のものとなっ
ており、特に、ユーザの使い刀に適応する配慮はなさ扛
ていなかっ几〇一方、英数字9片仮名記号を対象とする
文字認識装置では、数字だけを読み取る数字モードや全
学al′fr読み取る混在モードなど読み取9対象字種
セットに応じて開繊辞1の内容を切換えることにより%
紡織性能を向上させることが知ら扛ている。
その1例として、字種セットの内弁をユーザかフラグな
どを用いて指定するものであり、こ才]により、認識対
象字mf限定することで開繊性能の向上を図るものであ
る。しかしながら、漢字のように、I3i!識対象字種
が多((1jl rl O〜5000字f1りなると、
個々の字種に対応し皮フラグをセットするなどしてユー
ザか個々の字′l@4′ff指定することは非常に手間
がかかるという欠点があった。
〔発明の目的〕
本発明の目的は、上記従来技術の欠点を除き、ユーザの
使用目的に応じて認識対象字Nを答終に限定し、iu!
識性能を向上させることができるようにしたバクーン認
識方式を提供するにある。
〔発明の概要〕
この目的を達成する次めに、本発明は、ユーザの使用目
的に応じ友単粕辞誓f登録可能と゛するとともに、該単
N14i!Fv、蕾の字種によって認識辞書の紹誌対象
字釉を限定するようにした虞に特徴がある。
ここで、本発明の処理手順を第4図によって概略的に説
明する。
同図において、ユーザFi、まず、読み取りの対象とし
たい巣@fr;hらかしめキーボードなどから登録し、
卑飴辞礪を作成する友めの情報を入力する。次に、登録
さ扛た単語辞1がら互いに異なる字種のみを抽出しく出
現字種の解析)%認識対象字種テーブルを自動的に作成
する。従来のOCRでは、約150種の英字数字7片仮
名記号の中からユーザが使用する字種を定義するために
、フラグ情報を用いることが知らnている。この場合、
字種セットの定義は、個々の字種にフラグを立てるなど
する必要があシ、約150種の中から必要な字種を選択
する場合には、字種数か少ないことがらほとんど問題は
ないが、漢字のよりに、1ooo字種以」二の場合には
、必要な字種を選択するのに手間がかかる欠点が存在し
た。
本発ψjでは、この欠点を解消するため、上述のように
、使用するために登録さ扛た単語にまり、自動的に認識
辞書から認識文字種セットを登録することを1つのポイ
ントとじて−る。
本発明において、文字t−li!!識する場合には、例
えij:、JIS第1水準などのように、汎用的に用い
らする比較的大きい字種セットを対象とした開繊用字′
!I71を用いる。従って、使用単語を登録する際には
、認識辞書に登録してない字種があるか否かのチェック
を行い、もし認識辞書に存在しない字種がある場合には
、登録単語を変更する必要がある。このような場合に対
処するために、g識用辞書としては、JI&第2水準ま
でのもの、更には、特殊文字を追加し皮ものなどいくつ
かをオプションとして用意しておく必要かある〇ここで
、文字U識のための認識辞書として比較的大きい字種セ
ットのものを使用する理由管述べる。一般的には、字種
セットに応じて認識辞書を構成する方が、処理1. M
識性能などの点から効率が良い。しかしながら、生釉セ
ッ)K応じて認辞11を再構成させるためには、単に会
費々字種の標準パターンを集めるだけでは不十分であり
1字種セットの変化により対象パターン空間の構造か変
化するため、判定用閾値など相互関係に関するパラメー
タを調整する必要がある。このパラメータ調整を自動的
に行うことは、冥際上、困難であ夛、試行錯IAKよる
調整か行わ扛るのが普通であって、こtが谷メーカの重
要なノウハウとなっているo L、fCがって、できる
だけ字種セット対応の&!!識用辞書は、固定にする方
が開発効率の点から有利である〇 さて、上述のよう圧して文字認識さ扛た結果は、入力単
語ごとに認識結果候補文字テーブルの形で出力さ扛る。
この認識結果候補文字テーブルの中から、認識対象字種
テーブルに存在する字種のみが抽出さ扛、修正さrた候
補文字テーブルを作成する。この処理によって、認識用
辞書を変更することなく、認識対象字種のみが認識結果
となる。
そして、既に登録しである単語辞書を用い、修正さf′
L次候補文字テーブルに対して単語照合を行い、最も確
からしい単語が認識結果として出力される。
第5図は登録さ扛た単語辞書から異なる字種セットを抽
出した例を示している。この例でハ、4つの単語が登録
さ:rL友場合を示しており、丸で囲んだ「」、「立」
・・・「究」の11文字が異なる字種であって、こfら
が認識対象字種と彦る。
第6図は第4図における文字認識から単語照合1での処
理の例を示している。第6図の(a’)は「立研兜所」
を入力単語とした場合の第4図の認識結果候補文字テー
ブルを示してお夛、最大3位までの候補が出力さnてい
る。こ牡らの候補のうち、第5図で示した認識対象字&
テーブル(第4図)認識対象字種に人っ友ものを丸で囲
んである0第6図(b)は第6図(&)の丸を囲んだ候
補文字をピックアップして作成し友、修正さnft候補
文字テーブル(第4図)を示1−1おシ、最大2位まで
の候補が上っている。この修正さ−n+候補文字テーブ
ルを第5図で示し九単語辞書と照合すると、第6図(b
)の丸で囲んだ「 立研究所」と最も良く整合がとn、
第6図(clK示す結果が得らnる。
以上のように、ユーザが登録し九単語辞書から認識対象
字種セットを自動的に抽出することによって、従来のよ
うに、個別に*ya定耽フラグをセットする手間をなく
[またことができ、こ扛が本発明の第1の特徴がある。
また、認識用辞1け汎用の字種セットに対応する標準パ
ターン辞1とし、認識対象字種セットの変化には、認識
部の時識結釆候補文字デープルの修正で対応し、認識用
辞−〇変#!f必要しない。
こ扛が本発明の第2の%徽がある。このことにより、認
識対象字種セントの変化に対応してIu!繊用利用判定
パラメー可調整が不要となる。
〔発明の実施例〕
以下1本発明の実施例全図tk+によって曲、明する。
第4図は本発明によるパターン藺繊方式の一実施例を示
すブロック図である。全体の制御は制御5100で行ワ
扛、こむ田通常のマイクロコンピュータにより実現さ才
′しる。同図においてをま、制御部100からの制御情
報のtAc、 fL會71<す線の表記を省略しである
まず、ユーザij:耽み取りたい給断ケビテオデータ端
末(VDT)とキーホ□−ドから成る端末機1゜から、
例えば、仮名漢字変換を用いて入力」7、単飴登録部2
0において、単飴辞1″25に登録する。
次に、認識対象字種抽出部30において、互いに異なる
字種を抽出し、l!識対象字種テーブル65を作成する
一方、帳票に誉かれた文字パターンは、勧測部40によ
って観測さ扛、スキャナによってティジメルパターン変
換さ1.る。−帳票分の画像パターン41け、文字切出
し部50において、−文字づつの文字パターンに分離さ
扛、正規化など文字認識に会費な前処理が施さnる。−
文字毎に切り出さn−7t−文字パターン51は昭w&
部60に送ら扛る。
この認識部60では、認識に使用する特徴が抽出さ才ま
た彼、標準パターン辞書65との整合および判定による
文字認識が行わ釘る。文字認識の結果、墜飴毎の複数候
補文字系列61、すなわち、第4図におけるI&iii
識結果候補文字テーブルが得ら扛。
あらかじめ作成し次認識対象字種テーブル35と共に認
識結果修正s70に送ら扛る。この認識結果修正部70
では、複数候補文字系列61の中からlu!識対象字種
テーブル35に存在する文字種のみが抽出さn、修正さ
fL次候補文字系列71(すなわち、第4図の修正さn
次候補文字テーブル)が作成さ扛る。次に、この候補文
字系列71は単語照合部80に送らtl、牟飴辞膏25
と、例えば第1位候補との順位差を距離と17で照合全
行い、最も距離の小さい率!fg81を出力する。出力
さnた単語81は表示部9oにて表示すると共に、認識
結果配憶部95に順次格納さ1する。
以上説明した実施例において、観測部40.文字切出し
部50  wll郡部60嚇粕照合部8o、表示部qO
buWa結束記憶部95は、公知の技術で実現可能であ
る。
ここでは、琳飴登録部2(〕および認認識対象字種抽出
部0の処理を第2図を用いて経細に説明する。
まず、VDTおよびギーボード端末機1oがら入力され
た仮名文字系列が、大刀文字バッファ11に格納さ扛る
。入カバノファ11に格納さ扛た仮名文字系列は、仮名
漢字変換部21において、仮名漢字変換辞誉22を用い
て漢字系列に変換さn、変換文字バッファ25に格納さ
nる。次に、単語登録部24において、f換文字バッフ
ァ2Sから取り出さtL′fi:、単語の文字系列か順
次チェックされて標準パターン辞4A65に登録しであ
ることが確藺さnfl、、稜、単飴辞豊25に登録さn
る。もし。
標準パターン辞書65に登録さ扛ていない文字が出現し
た場合には、その旨VDT10に表示し、登録する単語
を変更するよう指示する。次に、登録さ一!L几傘飴の
文字系列に対し、61において、互いに異なる文字のチ
ェックを行う。これは、既に登録しである認識対象字種
テーブル55と、順次取シ出した文字との比較を行い、
新たに出現した字種の場合には、文字登録部32によっ
て認識対象字種テーブル65に登録する。
次に、第1図における認識結果修正部70の処理内容に
ついて第6図を用いて説明する。
認識i1s 60から出力さ扛た候補文字系列61は、
入力単語長をL、単語中第1番目の文字の認識結果候補
文字数をn (1,)とすると。
と表わさnる。一方、醪識iJ象字楠テーブルは、[D
(k)、  k= 1・・・1Mまただし、Mllに臘
?l象字梢数 と表わさ扛る。
このとき%y!縁結来修IF音1(70では、第5図に
示す処理によって、修iFさtl、7’j候補文字系列
71を出力する。ここで修正さjlだ候補文字系列71
を と表わす。
すなわち、まず、カウンターを0にセラ!・シておき、
順次カウンターを増加させ、入力単語長りとなるまで以
下の処理Aを繰り返す。
処理A:まずカウンターkoにセットしておき、カウン
タJをター用(7て、第11¥目の文字の認識結果候補
文字数n(1)に達゛J−るまで以下の処理Bを繰り返
す。
処理B:カウンタkを使用して、g繊対象字種数Mに達
するまで、候補C(i、J)が認識対象字種テーブルD
 (k)と一致するか否かを比較し、一致する場合には
カウンタlを増加させて、新たな候補テーブルC’(i
、J)にD (k)をセットする。kがMを越え次場合
には、処理AのカウンタJの増加処理に戻る。
この実施例において、登録する単語の入力方法として、
キーボードを用いた仮名漢字変換を採用しているが、こ
の他にベンタッチによるタブレット入力、連想コードに
よる入力、OCRを用い友人力、音声認識装置と仮名漢
字変換の組合せによる入フハ あるいはオンライン文字
認識装置による入力などの方法を用いても実現可能なこ
とは云うまでもない◇また、互いに異なる文字種の抽出
を単語登録の後に行っているが、単語登録の前に行って
も同様の効果が得らn、ることは明らかである。
更に、登録琳飴の文字が紡織辞書に登録さ扛ていない場
合に、その旨表示して登録嗅飴を変更させる代りに、字
梱数の更に大きい認識辞書に切替させても良いことは言
う壕でもない。
また%認識対象を音声とした場合にも、大規模語索単飴
音声μ識方式として適用可能であることは言うまでもな
い。この場合、昭m牟位は音韻あるいは音素、音節など
を採用することが塙えらn2、こ扛らが上記の中詰とい
うζ、とになる。
以上のように、この実施例によtlば、ユーザ毎に読み
取り単語を登録できるうえ、認識対象字種を個々に指定
する必要がないため、認識部および認識用辞書を変更′
Jることなく、使用目的に適り友単飴の文字読み取りが
iiJ能となる利点がある。
〔発明の効果〕
以上説明したように、本発明によ扛は、ユーザの使用目
的に最適な認識対象を限定した認識が実現でき、かつ、
その14!!が微妙な藺識用辞1のパラメータ調整が不
要とがるため、個別の閲識畢位に対応した辞1作成の工
数が削減できるという優nた効果が得ら扛る0
【図面の簡単な説明】
第1図は本発明によるパターン認識方式の−実施例を示
すブロック図、第2図は第1図における中詰登#!部お
よび認識対象字種抽出部の処理を示すフローチャート、
第5図は第1図における認識結果修正部の処理を示すフ
ローチャート、第4図は本発明の処理手Illの概略説
明図、第5図は第4図にお&−Jる認識対象字種テーブ
ルの作成手順の説明図、第6図は島4図における文字認
識から巣語賭合までの手順の説明図である。 20・・・単#登録部、60・・・認識対象字種抽出部
、25・・・単語辞書、65・・・g繊対象字種テーブ
ル、6])・・・文字昭繊部、70・・・!i!!!繊
結果修正部、80°°°牟飴照合部。

Claims (1)

    【特許請求の範囲】
  1. 入力単語毎に文字認識を行って該入力単語毎に複数個の
    候補単語を得、さらに、あらかじめ登録されている単語
    辞書と照合して該複数個の候補単語のうちの最も確から
    しい候補単語を選択するようにしたパターン認式方式に
    おいて、前記単語辞書は入力単語の種類に応じて変更可
    能とし、かつ、前記単語辞書から認識対象となる単位集
    合を抽出し、該単位集合によって前記候補単語を修正し
    て前記単語辞書と照合するようにしたことを特徴とする
    パターン認識方式。
JP60226731A 1985-10-14 1985-10-14 パターン認識装置 Expired - Lifetime JPH0632086B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60226731A JPH0632086B2 (ja) 1985-10-14 1985-10-14 パターン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60226731A JPH0632086B2 (ja) 1985-10-14 1985-10-14 パターン認識装置

Publications (2)

Publication Number Publication Date
JPS6286475A true JPS6286475A (ja) 1987-04-20
JPH0632086B2 JPH0632086B2 (ja) 1994-04-27

Family

ID=16849723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60226731A Expired - Lifetime JPH0632086B2 (ja) 1985-10-14 1985-10-14 パターン認識装置

Country Status (1)

Country Link
JP (1) JPH0632086B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02230488A (ja) * 1989-03-03 1990-09-12 Nec Corp 文字認識装置
JPH02302888A (ja) * 1989-05-18 1990-12-14 Nec Corp 単語辞書照合装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5847066A (ja) * 1981-09-16 1983-03-18 Nippon Oil & Fats Co Ltd 防汚塗料

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5847066A (ja) * 1981-09-16 1983-03-18 Nippon Oil & Fats Co Ltd 防汚塗料

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02230488A (ja) * 1989-03-03 1990-09-12 Nec Corp 文字認識装置
JPH02302888A (ja) * 1989-05-18 1990-12-14 Nec Corp 単語辞書照合装置

Also Published As

Publication number Publication date
JPH0632086B2 (ja) 1994-04-27

Similar Documents

Publication Publication Date Title
CN113591457A (zh) 文本纠错方法、装置、设备及存储介质
CN109545183A (zh) 文本处理方法、装置、电子设备及存储介质
JPS6286475A (ja) パターン認識装置
JP3274014B2 (ja) 文字認識装置および文字認識方法
JPS59229683A (ja) 認識処理装置
KR20020039811A (ko) 음성 인식용 문자 변환 장치 및 그 방법
JPS5842904B2 (ja) 手書きカナ・漢字の文字認識装置
JP2660998B2 (ja) 日本語処理装置
JP2004206659A (ja) 読み情報決定方法及び装置及びプログラム
JP2640472B2 (ja) 文字認識方法
JPH0259513B2 (ja)
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPS62224859A (ja) 日本語処理方式
JPH11120294A (ja) 文字認識装置および媒体
JPH0411914B2 (ja)
JPS63308690A (ja) 筆跡認識方法
JP2874815B2 (ja) 日本語文字読取装置
JP2886690B2 (ja) 光学的文字読取装置における文字認識方法
JPS62117060A (ja) 文字・音声入力変換方式
CN116232584A (zh) 密码生成方法、装置及设备
CN117291149A (zh) 生僻字解码方法、装置、电子设备及存储介质
JP2905334B2 (ja) オンライン手書き文字認識用辞書作成方法およびオンライン手書き文字認識用辞書作成装置
JPH06308994A (ja) 日本語音声認識方法
JPS62247451A (ja) 日本語処理装置の単語辞書構成法
JPH04256194A (ja) 文字認識処理方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term