JPH09282418A - 認識方式複合化装置および方法 - Google Patents

認識方式複合化装置および方法

Info

Publication number
JPH09282418A
JPH09282418A JP8093832A JP9383296A JPH09282418A JP H09282418 A JPH09282418 A JP H09282418A JP 8093832 A JP8093832 A JP 8093832A JP 9383296 A JP9383296 A JP 9383296A JP H09282418 A JPH09282418 A JP H09282418A
Authority
JP
Japan
Prior art keywords
recognition
character
candidate
result
methods
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8093832A
Other languages
English (en)
Other versions
JP3375819B2 (ja
Inventor
Kazuki Nakajima
和樹 中島
Yoshihiro Shima
好博 嶋
Katsumi Marukawa
勝美 丸川
Hiroshi Shinjo
広 新庄
Kazumi Suzuki
和美 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP09383296A priority Critical patent/JP3375819B2/ja
Publication of JPH09282418A publication Critical patent/JPH09282418A/ja
Application granted granted Critical
Publication of JP3375819B2 publication Critical patent/JP3375819B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 複数の認識方式を組み合わせて,高精度な認
識方式を作成する。 【解決手段】 複数の認識方式105,106,107
の認識結果を利用し,複数の認識結果を組み合わせる。 【効果】 認識方式の精度が向上する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,OCR(Optical Char
acter Reader;光学的文字読取装置)や音声認識等におけ
るパタンを認識する装置において,複数の認識方式を組
合せ,より高精度な認識を可能とする認識方式複合化方
法および装置に関する。
【0002】
【従来の技術】従来,例えば文字認識の分野において,
パタンを認識するには,高精度文字認識手法開発のため
の方法論と図形検証法(中野,他:昭 58 信学総全大,S
10-1,1983年)に記載のパタンの構造を逐次的に解析し
認識する構造解析認識方式や,パタンの形状を全体的に
認識するパタンマッチング認識方式などが単独に存在す
るのみであった。複数手法における候補カテゴリーの識
別値を統合処理する神経回路による手書き漢字認識(木
村,他:電子情報通信学会論文誌 D-II,Vol.J-77-D-II
No.4,pp.791-800,1994.4)に記載の複合化方式もあ
ったが,複合化にニューラルネットを使用しており,複
合化処理が複雑となり,実用化には遠かった。
【0003】
【発明が解決しようとする課題】上述した従来から単独
に存在していた認識方式を組み合わせるためには,認識
に用いられる特徴量の選定が必須であり,どのように組
み合わせるかが課題となる。
【0004】
【課題を解決するための手段】認識方式の認識結果のみ
に着目する。認識結果を利用することで,認識方式の内
部に立ち入らないで,複数の認識方式を複合化できるよ
うになる。例えば,複数の認識方式の認識結果のうち、
それぞれの方式の第一位の候補文字に着目し,最も多い
文字を最終的な認識結果とする。5つの認識方式がある
とすると、3つ以上が同じ文字であればそれを最終的な
認識結果とできる。この場合、単純な多数決でも良い
が、閾値を設けることもできる。認識の誤りを減らした
い場合は,全部の方式で,認識結果が一致した時のみを
複合化の認識結果とすれば,誤りは極限まで減らすこと
ができる。
【0005】また、さらに精度を上げるためには、単純
に候補文字の順位のみを利用するのではなく、順位のそ
れぞれに重み付けをすることも好ましい。
【0006】多種多様な認識方式の認識結果のみに着目
することにより,認識方式の内部処理を考慮する必要な
く,複数の認識方式を複合化できる。
【0007】
【発明の実施の形態】以下本発明の実施例について図を
用いて説明する。
【0008】図1は,本発明を構成する装置の概観であ
る。本図は,認識方式A(105),認識方式B(10
6),認識方式C(107)を認識方式複合化制御部1
08にて複合化する場合を表している。認識方式の個数
は任意であるし,そのすべてを使う必要はない。入力部
109から入力されたパタンは,入力制御部101にお
いて,認識可能な形態になるよう加工され,各認識方式
へと入力される。各認識結果は認識方式複合化制御部1
08において複合化され,その認識結果やパタン等が表
示制御部102を通し,表示可能な形態に加工され,表
示部110にて表示される。各認識方式にて認識される
際に,認識に必要な情報,例えば辞書などは,記憶装置
111にあらかじめ格納しておく場合が多い。
【0009】認識方式は,例えば,文字認識の場合,パ
タンの構造を部分的に解析し認識する構造解析認識方式
(構造解析法)や,パタンの全体の形状を認識するパタ
ンマッチング認識方式(パタンマッチング法,あるいは
単にマッチングと呼ぶ)などがある。これらの認識方式
には,認識の得意なパタンと不得意なパタンが存在す
る。例えば,構造解析法の場合,かすれた文字は認識が
困難であるが,パタンの全体的な形状を認識するパタン
マッチング法では認識が簡単である。このように,ある
認識方式には,不得手なパタンが存在するものの,どれ
かの認識方式が得手なパタンであることが多い。このよ
うな事実に基づき,複数の認識方式をうまく組み合わせ
る(複合化)と,認識の精度が高まることが予想され
る。本発明はこの複合化に関する方式を提供する。
【0010】一般に複数の認識方式を複合化する場合,
認識方式の内部処理に踏み込むことは困難である。そこ
で,本発明では,認識の内部にまで踏み込む必要のな
い,認識結果を利用する。ここでの認識結果とは,候補
文字,類似度,候補マスク等である。候補文字とは,認
識方式が,認識結果である文字を第一位から順に第n位
まで出力する場合の文字に相当する。
【0011】例えば,数字の場合は,0から9までの文
字が,認識結果に応じて順位付けられ,候補文字として
出力される。類似度とは,各候補文字における認識結果
の確からしさを表す数値であり,通常,0.0から1.0まで
の間の数値で出力される。もし,0.0から1.0までの間の
数値で出力されないような認識方式を複合化したい場合
は,0.0から1.0の間に入るように正規化すればよい。例
えば,最小値がおおよそaで,最大値がおおよそbである
ような方式の場合は,aを引いてから(b-a)で割れば良
い。候補マスクとは,候補文字というカテゴリが複数に
わかれている場合があり(サブカテゴリと呼ぶ),マス
クとはサブカテゴリのことである。例えば,数字9とい
うカテゴリが一つあっても,そのバリエーション(傾い
ているとか,ループの大小,文字の大きさ)は複数存在
する。これらをサブカテゴリと呼び,このようにバリエ
ーションを正確に把握することによって,認識精度を高
めることができる。
【0012】認識結果を利用することで,認識方式の内
部に立ち入らないで,複数の認識方式を複合化できるよ
うになる。例えば,第一位の候補文字に着目し,最も多
い文字を認識結果とする方法である。5つの認識方式が
あるとする。3つ以上が同じ文字であればそれを認識結
果とする方法である。認識の誤りを減らしたい場合は,
全部の方式で,認識結果が一致した時のみを複合化の認
識結果とすれば,誤りは極限まで減らすことができる。
【0013】図4で認識結果の中の候補文字を利用し複
合化する基本的な方式を説明する。図4は手書き数字の
「7」が入力された場合の各認識方式における候補文字
の様子を説明する図である。認識方式Aの候補文字は,
第一位から順に,「9」,「7」,「1」であり(第4
位以下は省略),認識方式Bの候補文字は第一位から順
に,「7」,「1」,「9」である。この場合,認識方
式Aの認識結果(第一位の候補文字)は誤りで,認識方
式Bの認識結果は正しいとする。この2つの認識方式の
認識結果を複合化するために,図4に示した得点(カッ
コ内)を付与する。文字ごとに得点を合計すると,図4
の「複合化」の箇所に示すような得点付けと候補文字
が,複合化認識結果として出力される。この場合は,
「7」の得点が16点と最も多く,認識結果は正解とな
る。
【0014】以上述べた方法は,2つの方式の場合であ
ったが,複数の方式に対しても,本方式は容易に拡張可
能である。候補文字についても,同様であり,これが候
補マスクであってもよいし,候補文字が必ずしも,カテ
ゴリと一対一対応していなくてもよい。例えば,漢字の
場合は,3つの候補文字,「木」,「本」,「大」を一
つのカテゴリにまとめることがある。
【0015】図4に示したように、得点を付ける際に,
あらかじめ与えられた10点,6点,4点などの数値
に,認識結果である類似度(0.0から1.0の値)を,掛け
合わせることによって,精度をさらに高めることができ
る。類似度が1.0の場合は,最も認識結果が信じられる
場合であり,このような時は,得点をまるまる与える。
類似度が,例えば,0.5と,認識結果が半分程度の信頼
性しかない場合は,0.5をかけることによって,半分の
得点を与える。このように得点に重みづけることによっ
て,我々の実験では,従来の認識誤りの半分を減らすこ
とが可能となった。ここで,従来と呼んでいるのは,図
形検証法と呼ばれる構造解析法であり,数値は,この認
識方式とパタンマッチング認識方式を複合化した場合で
ある。類似度は,いわゆる単純類似度,方向類似度,複
合類似度等の2つのパタンの類似性を表現する尺度であ
ってもよいし,方式独自に設定した尺度であってもよ
い。
【0016】図2は上述の例において従来の図形検証法
の認識フローであり、図3は我々が作成した認識フロー
である。
【0017】図2において、前処理201では,入力さ
れたパタンから構造を取り出すための画像処理が行われ
る。例えば,細線化や輪郭抽出である。一段判定処理2
02では,認識結果が出力される。二・三段判定203
では,認識候補ごとの対を作り,この対にもとづいて詳
細な認識を行う。検定処理204では,最終的な認識結
果を確認する。
【0018】図3において,前処理201と一段判定2
02は,図2と同等の処理を用いる。マッチング処理3
01は,一段判定処理202と同等の処理と位置づけら
れる。一段判定処理202は構造解析認識方式であり,
マッチング処理301はパタンマッチング認識方式であ
る。これら2つの認識方式を複合化するために,複合化
処理302において複合化の計算を実行する。複合化検
定処理304は,検定処理204とほぼ同等の処理内容
であるが,複合化認識方式用に改訂された処理である。
【0019】具体的な複合化の計算方法を以下に,一例
として示す。
【0020】以下に示す行列Cは候補文字ごとに複合化
類似度を並べた行列であり,列方向(縦方向)に候補文字
が対応するn×1の行列である。nは候補文字の個数であ
り,候補カテゴリ数でもある。つまり,数字を対象とす
るならn=9であり,行列Cの要素c0はカテゴリ0に,c9は
カテゴリ9に対応する。行列Cを複合化類似度行列と呼
ぶ。
【0021】行列Mは各方式の候補文字の類似度を並べ
た行列であり,列方向は候補文字に対応し,行方向は各
方式に対応する。mは方式数である。行列Mを類似度行列
と呼ぶ。行列Sは得点である。得点は,方式毎,候補順
位ごとに値を設定する。基本的には,上位の候補に対し
て得点を高くし,下位の候補に対して得点を低くする。
得点は,候補順位に対して与えられるので,行列Sを用
いた計算の時には,候補順位に対応するよう並べ変える
必要がある。行列Sを得点行列と呼ぶ。
【0022】
【数1】
【0023】上記の類似度行列Mと得点行列Sを使って,
複合化類似度行列Cは以下のように計算される。
【0024】
【数2】
【0025】ここで,関数f()は以下のような行列Aに対
して,
【0026】
【数3】
【0027】以下のような変換を与える。
【0028】
【数4】
【0029】複合化類似度行列Cの中で最大値を与える
複合化類似度は,
【0030】
【数5】
【0031】として計算でき,i が第一位の複合化候補
文字であり,複合化認識結果となる。ただし,ciがr(リ
ジェクトの閾値)未満の場合はリジェクトとする。
【0032】図5にデータ形式の一例を示す。図の例
は,認識結果が,候補文字501,類似度502,候補
マスク503の組が,各候補順位ごとに並んだ例であ
る。候補順位の数はn個としている。このデータ形式
は,各認識方式の認識結果であり,図3では,一段判定
処理202,マッチング処理301の認識結果に相当す
る。もちろん,複合化判定処理303における認識結果
であっても,図5に示す共通化した認識結果のデータ構
造を使うと,この複合化判定処理にさらに別の認識方式
を複合化する際にも便利である。データ形式をこのよう
に共通化することによって,認識方式をどのように組み
合わせても良いことになり,組合せの自由度が増す。
【0033】図6は,複合化の計算のフローである。先
に示した,式(3.4)〜(3.10)と同様の計算を実行するフ
ローであり,計算機内部での実際の計算の例である。簡
単に説明すると,認識候補の個数nと,認識方式数mと
の2重ループ計算によって実現する。
【0034】
【発明の効果】以上に説明した通り,本発明は,複数の
認識方式を複合化し高精度な認識が可能となる効果があ
る。
【図面の簡単な説明】
【図1】本願発明の装置の構成図。
【図2】従来の認識方式のフロー図。
【図3】複合化認識方式のフロー図。
【図4】複合化計算の一例の概念図。
【図5】データ形式の一例のチャート図。
【図6】複合化方式計算の一例のフロー図。
【符号の説明】
105 認識方式A,106 認識方式B,107 認
識方式C,108 認識方式複合化制御部,109 入
力部,101 入力制御部,108 認識方式複合化制
御部,102 表示制御部,110 表示部,111
記憶装置,201前処理,202 一段判定処理,20
3 二・三段判定,204 検定処理,301 マッチ
ング処理,302 複合化処理,304 複合化検定処
理。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 新庄 広 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 鈴木 和美 神奈川県小田原市国府津2880番地 株式会 社日立製作所ストレージシステム事業部内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】パタンを認識する認識手段を複数備え,そ
    れぞれの認識手段における認識結果を組み合わせて複合
    化することを特徴とする認識方式複合化装置。
  2. 【請求項2】前記認識手段の一つは構造解析認識手段で
    あり,他の一つはパタンマッチング手段であることを特
    徴とする請求項1記載の認識方式複合化装置。
  3. 【請求項3】複数の認識手段による文字認識結果を組み
    合わせる複合化方法において,認識候補の候補順位に応
    じた高い得点を与え,最も高い得点を得た文字認識結果
    を,最終的な認識結果とすることを特徴とする認識方式
    複合化方法。
  4. 【請求項4】各得点にそれぞれの類似度を掛け合わせる
    ことを特徴とする請求項3記載の認識方式複合化方法。
JP09383296A 1996-04-16 1996-04-16 認識方式複合化方法及びその方法を行う装置 Expired - Lifetime JP3375819B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09383296A JP3375819B2 (ja) 1996-04-16 1996-04-16 認識方式複合化方法及びその方法を行う装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09383296A JP3375819B2 (ja) 1996-04-16 1996-04-16 認識方式複合化方法及びその方法を行う装置

Publications (2)

Publication Number Publication Date
JPH09282418A true JPH09282418A (ja) 1997-10-31
JP3375819B2 JP3375819B2 (ja) 2003-02-10

Family

ID=14093373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09383296A Expired - Lifetime JP3375819B2 (ja) 1996-04-16 1996-04-16 認識方式複合化方法及びその方法を行う装置

Country Status (1)

Country Link
JP (1) JP3375819B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11282964A (ja) * 1998-03-26 1999-10-15 Nec Corp 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体
JP2003280678A (ja) * 2002-03-20 2003-10-02 Asahi Kasei Corp 音声認識装置
JP2003323196A (ja) * 2002-05-08 2003-11-14 Nec Corp 音声認識システム、音声認識方法および音声認識用プログラム
JP2004325688A (ja) * 2003-04-23 2004-11-18 Toyota Motor Corp 音声認識システム
JP2010182167A (ja) * 2009-02-06 2010-08-19 Toshiba Corp 画像処理装置および画像処理方法
JP2016517023A (ja) * 2013-07-18 2016-06-09 三菱電機株式会社 音響信号を処理する方法
JP2019074608A (ja) * 2017-10-13 2019-05-16 京セラドキュメントソリューションズ株式会社 画像形成装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11282964A (ja) * 1998-03-26 1999-10-15 Nec Corp 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体
JP2003280678A (ja) * 2002-03-20 2003-10-02 Asahi Kasei Corp 音声認識装置
JP2003323196A (ja) * 2002-05-08 2003-11-14 Nec Corp 音声認識システム、音声認識方法および音声認識用プログラム
JP2004325688A (ja) * 2003-04-23 2004-11-18 Toyota Motor Corp 音声認識システム
JP2010182167A (ja) * 2009-02-06 2010-08-19 Toshiba Corp 画像処理装置および画像処理方法
JP2016517023A (ja) * 2013-07-18 2016-06-09 三菱電機株式会社 音響信号を処理する方法
JP2019074608A (ja) * 2017-10-13 2019-05-16 京セラドキュメントソリューションズ株式会社 画像形成装置

Also Published As

Publication number Publication date
JP3375819B2 (ja) 2003-02-10

Similar Documents

Publication Publication Date Title
CA2105494C (en) Method and apparatus for recognizing cursive writing from sequential input information
KR100249055B1 (ko) 문자인식장치및방법
US5923778A (en) Hierarchical representation of reference database for an on-line Chinese character recognition system
JPH0797373B2 (ja) 文書フアイリングシステム
JP2673871B2 (ja) ニューラル・ネットワークによるパターン認識方法及び装置
JP3375819B2 (ja) 認識方式複合化方法及びその方法を行う装置
Poon et al. Scribbler: A tool for searching digital ink
JPS592191A (ja) 手書き日本語文の認識処理方式
JPS58186882A (ja) 手書き文字入力装置
JP2538543B2 (ja) 文字情報認識装置
JPH0210957B2 (ja)
JP5132430B2 (ja) 姓名候補を生成する情報処理装置、情報処理方法、およびプログラム
JP2640472B2 (ja) 文字認識方法
JPH10198766A (ja) 文字認識装置及びその方法並びに記憶媒体
JP3281530B2 (ja) 文字認識装置
JPH0795337B2 (ja) 単語認識方式
JPH04337888A (ja) 文字認識装置
Pandey et al. A Robust Approach to Plagiarism Detection in Handwritten Documents
Rautela et al. Automated Virtual Character Detection System from Live Video Streaming using Deep CNN
Razzak et al. Effect of ghost character theory on arabic script based languages character recognition
JPS58163072A (ja) 文字修正方式
JP2865443B2 (ja) カナ氏名もしくはカナ法人名表記の漢字変換装置
JPS63138479A (ja) 文字認識装置
CN114360497A (zh) 语音识别方法、装置、计算机设备及存储介质
Stevens Nonnumeric Data Processing in Europe: A Field Trip Report, August-October 1966

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071129

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081129

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081129

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091129

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101129

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101129

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111129

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111129

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121129

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121129

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131129

Year of fee payment: 11

EXPY Cancellation because of completion of term