JP3375819B2 - 認識方式複合化方法及びその方法を行う装置 - Google Patents
認識方式複合化方法及びその方法を行う装置Info
- Publication number
- JP3375819B2 JP3375819B2 JP09383296A JP9383296A JP3375819B2 JP 3375819 B2 JP3375819 B2 JP 3375819B2 JP 09383296 A JP09383296 A JP 09383296A JP 9383296 A JP9383296 A JP 9383296A JP 3375819 B2 JP3375819 B2 JP 3375819B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- candidate
- methods
- recognition result
- compounding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
acter Reader;光学的文字読取装置)や音声認識等におけ
るパタンを認識する装置において,複数の認識方式を組
合せ,より高精度な認識を可能とする認識方式複合化方
法および装置に関する。
パタンを認識するには,高精度文字認識手法開発のため
の方法論と図形検証法(中野,他:昭 58 信学総全大,S
10-1,1983年)に記載のパタンの構造を逐次的に解析し
認識する構造解析認識方式や,パタンの形状を全体的に
認識するパタンマッチング認識方式などが単独に存在す
るのみであった。複数手法における候補カテゴリーの識
別値を統合処理する神経回路による手書き漢字認識(木
村,他:電子情報通信学会論文誌 D-II,Vol.J-77-D-II
No.4,pp.791-800,1994.4)に記載の複合化方式もあ
ったが,複合化にニューラルネットを使用しており,複
合化処理が複雑となり,実用化には遠かった。
に存在していた認識方式を組み合わせるためには,認識
に用いられる特徴量の選定が必須であり,どのように組
み合わせるかが課題となる。
に着目する。認識結果を利用することで,認識方式の内
部に立ち入らないで,複数の認識方式を複合化できるよ
うになる。例えば,複数の認識方式の認識結果のうち、
それぞれの方式の第一位の候補文字に着目し,最も多い
文字を最終的な認識結果とする。5つの認識方式がある
とすると、3つ以上が同じ文字であればそれを最終的な
認識結果とできる。この場合、単純な多数決でも良い
が、閾値を設けることもできる。認識の誤りを減らした
い場合は,全部の方式で,認識結果が一致した時のみを
複合化の認識結果とすれば,誤りは極限まで減らすこと
ができる。
に候補文字の順位のみを利用するのではなく、順位のそ
れぞれに重み付けをすることも好ましい。
することにより,認識方式の内部処理を考慮する必要な
く,複数の認識方式を複合化できる。
用いて説明する。
る。本図は,認識方式A(105),認識方式B(10
6),認識方式C(107)を認識方式複合化制御部1
08にて複合化する場合を表している。認識方式の個数
は任意であるし,そのすべてを使う必要はない。入力部
109から入力されたパタンは,入力制御部101にお
いて,認識可能な形態になるよう加工され,各認識方式
へと入力される。各認識結果は認識方式複合化制御部1
08において複合化され,その認識結果やパタン等が表
示制御部102を通し,表示可能な形態に加工され,表
示部110にて表示される。各認識方式にて認識される
際に,認識に必要な情報,例えば辞書などは,記憶装置
111にあらかじめ格納しておく場合が多い。
タンの構造を部分的に解析し認識する構造解析認識方式
(構造解析法)や,パタンの全体の形状を認識するパタ
ンマッチング認識方式(パタンマッチング法,あるいは
単にマッチングと呼ぶ)などがある。これらの認識方式
には,認識の得意なパタンと不得意なパタンが存在す
る。例えば,構造解析法の場合,かすれた文字は認識が
困難であるが,パタンの全体的な形状を認識するパタン
マッチング法では認識が簡単である。このように,ある
認識方式には,不得手なパタンが存在するものの,どれ
かの認識方式が得手なパタンであることが多い。このよ
うな事実に基づき,複数の認識方式をうまく組み合わせ
る(複合化)と,認識の精度が高まることが予想され
る。本発明はこの複合化に関する方式を提供する。
認識方式の内部処理に踏み込むことは困難である。そこ
で,本発明では,認識の内部にまで踏み込む必要のな
い,認識結果を利用する。ここでの認識結果とは,候補
文字,類似度,候補マスク等である。候補文字とは,認
識方式が,認識結果である文字を第一位から順に第n位
まで出力する場合の文字に相当する。
字が,認識結果に応じて順位付けられ,候補文字として
出力される。類似度とは,各候補文字における認識結果
の確からしさを表す数値であり,通常,0.0から1.0まで
の間の数値で出力される。もし,0.0から1.0までの間の
数値で出力されないような認識方式を複合化したい場合
は,0.0から1.0の間に入るように正規化すればよい。例
えば,最小値がおおよそaで,最大値がおおよそbである
ような方式の場合は,aを引いてから(b-a)で割れば良
い。候補マスクとは,候補文字というカテゴリが複数に
わかれている場合があり(サブカテゴリと呼ぶ),マス
クとはサブカテゴリのことである。例えば,数字9とい
うカテゴリが一つあっても,そのバリエーション(傾い
ているとか,ループの大小,文字の大きさ)は複数存在
する。これらをサブカテゴリと呼び,このようにバリエ
ーションを正確に把握することによって,認識精度を高
めることができる。
部に立ち入らないで,複数の認識方式を複合化できるよ
うになる。例えば,第一位の候補文字に着目し,最も多
い文字を認識結果とする方法である。5つの認識方式が
あるとする。3つ以上が同じ文字であればそれを認識結
果とする方法である。認識の誤りを減らしたい場合は,
全部の方式で,認識結果が一致した時のみを複合化の認
識結果とすれば,誤りは極限まで減らすことができる。
合化する基本的な方式を説明する。図4は手書き数字の
「7」が入力された場合の各認識方式における候補文字
の様子を説明する図である。認識方式Aの候補文字は,
第一位から順に,「9」,「7」,「1」であり(第4
位以下は省略),認識方式Bの候補文字は第一位から順
に,「7」,「1」,「9」である。この場合,認識方
式Aの認識結果(第一位の候補文字)は誤りで,認識方
式Bの認識結果は正しいとする。この2つの認識方式の
認識結果を複合化するために,図4に示した得点(カッ
コ内)を付与する。文字ごとに得点を合計すると,図4
の「複合化」の箇所に示すような得点付けと候補文字
が,複合化認識結果として出力される。この場合は,
「7」の得点が16点と最も多く,認識結果は正解とな
る。
ったが,複数の方式に対しても,本方式は容易に拡張可
能である。候補文字についても,同様であり,これが候
補マスクであってもよいし,候補文字が必ずしも,カテ
ゴリと一対一対応していなくてもよい。例えば,漢字の
場合は,3つの候補文字,「木」,「本」,「大」を一
つのカテゴリにまとめることがある。
あらかじめ与えられた10点,6点,4点などの数値
に,認識結果である類似度(0.0から1.0の値)を,掛け
合わせることによって,精度をさらに高めることができ
る。類似度が1.0の場合は,最も認識結果が信じられる
場合であり,このような時は,得点をまるまる与える。
類似度が,例えば,0.5と,認識結果が半分程度の信頼
性しかない場合は,0.5をかけることによって,半分の
得点を与える。このように得点に重みづけることによっ
て,我々の実験では,従来の認識誤りの半分を減らすこ
とが可能となった。ここで,従来と呼んでいるのは,図
形検証法と呼ばれる構造解析法であり,数値は,この認
識方式とパタンマッチング認識方式を複合化した場合で
ある。類似度は,いわゆる単純類似度,方向類似度,複
合類似度等の2つのパタンの類似性を表現する尺度であ
ってもよいし,方式独自に設定した尺度であってもよ
い。
の認識フローであり、図3は我々が作成した認識フロー
である。
れたパタンから構造を取り出すための画像処理が行われ
る。例えば,細線化や輪郭抽出である。一段判定処理2
02では,認識結果が出力される。二・三段判定203
では,認識候補ごとの対を作り,この対にもとづいて詳
細な認識を行う。検定処理204では,最終的な認識結
果を確認する。
02は,図2と同等の処理を用いる。マッチング処理3
01は,一段判定処理202と同等の処理と位置づけら
れる。一段判定処理202は構造解析認識方式であり,
マッチング処理301はパタンマッチング認識方式であ
る。これら2つの認識方式を複合化するために,複合化
処理302において複合化の計算を実行する。複合化検
定処理304は,検定処理204とほぼ同等の処理内容
であるが,複合化認識方式用に改訂された処理である。
として示す。
類似度を並べた行列であり,列方向(縦方向)に候補文字
が対応するn×1の行列である。nは候補文字の個数であ
り,候補カテゴリ数でもある。つまり,数字を対象とす
るならn=9であり,行列Cの要素c0はカテゴリ0に,c9は
カテゴリ9に対応する。行列Cを複合化類似度行列と呼
ぶ。
た行列であり,列方向は候補文字に対応し,行方向は各
方式に対応する。mは方式数である。行列Mを類似度行列
と呼ぶ。行列Sは得点である。得点は,方式毎,候補順
位ごとに値を設定する。基本的には,上位の候補に対し
て得点を高くし,下位の候補に対して得点を低くする。
得点は,候補順位に対して与えられるので,行列Sを用
いた計算の時には,候補順位に対応するよう並べ変える
必要がある。行列Sを得点行列と呼ぶ。
複合化類似度行列Cは以下のように計算される。
して,
複合化類似度は,
文字であり,複合化認識結果となる。ただし,ciがr(リ
ジェクトの閾値)未満の場合はリジェクトとする。
は,認識結果が,候補文字501,類似度502,候補
マスク503の組が,各候補順位ごとに並んだ例であ
る。候補順位の数はn個としている。このデータ形式
は,各認識方式の認識結果であり,図3では,一段判定
処理202,マッチング処理301の認識結果に相当す
る。もちろん,複合化判定処理303における認識結果
であっても,図5に示す共通化した認識結果のデータ構
造を使うと,この複合化判定処理にさらに別の認識方式
を複合化する際にも便利である。データ形式をこのよう
に共通化することによって,認識方式をどのように組み
合わせても良いことになり,組合せの自由度が増す。
に示した,式(3.4)〜(3.10)と同様の計算を実行するフ
ローであり,計算機内部での実際の計算の例である。簡
単に説明すると,認識候補の個数nと,認識方式数mと
の2重ループ計算によって実現する。
認識方式を複合化し高精度な認識が可能となる効果があ
る。
識方式C,108 認識方式複合化制御部,109 入
力部,101 入力制御部,108 認識方式複合化制
御部,102 表示制御部,110 表示部,111
記憶装置,201前処理,202 一段判定処理,20
3 二・三段判定,204 検定処理,301 マッチ
ング処理,302 複合化処理,304 複合化検定処
理。
Claims (2)
- 【請求項1】互いに異なる複数の認識手段による文字認
識結果を組み合わせる複合化方法において,それぞれの
認識手段における認識候補の候補順位に応じた数値を与
え,かつ、各数値にそれぞれの類似度を掛け合わせてそ
の得点とし、最も高い得点を得た文字認識結果を,最終
的な認識結果とすることを特徴とする認識方式複合化方
法。 - 【請求項2】上記複数の認識手段と、上記認識結果を導
き出す認識方式複合化制御部とを有する請求項1の認識
方式複合化方法を行う装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09383296A JP3375819B2 (ja) | 1996-04-16 | 1996-04-16 | 認識方式複合化方法及びその方法を行う装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09383296A JP3375819B2 (ja) | 1996-04-16 | 1996-04-16 | 認識方式複合化方法及びその方法を行う装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09282418A JPH09282418A (ja) | 1997-10-31 |
JP3375819B2 true JP3375819B2 (ja) | 2003-02-10 |
Family
ID=14093373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09383296A Expired - Lifetime JP3375819B2 (ja) | 1996-04-16 | 1996-04-16 | 認識方式複合化方法及びその方法を行う装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3375819B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3095069B2 (ja) * | 1998-03-26 | 2000-10-03 | 日本電気株式会社 | 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体 |
JP2003280678A (ja) * | 2002-03-20 | 2003-10-02 | Asahi Kasei Corp | 音声認識装置 |
JP2003323196A (ja) * | 2002-05-08 | 2003-11-14 | Nec Corp | 音声認識システム、音声認識方法および音声認識用プログラム |
JP2004325688A (ja) * | 2003-04-23 | 2004-11-18 | Toyota Motor Corp | 音声認識システム |
JP4869365B2 (ja) * | 2009-02-06 | 2012-02-08 | 株式会社東芝 | 画像処理装置および画像処理方法 |
US9601130B2 (en) * | 2013-07-18 | 2017-03-21 | Mitsubishi Electric Research Laboratories, Inc. | Method for processing speech signals using an ensemble of speech enhancement procedures |
JP6822374B2 (ja) * | 2017-10-13 | 2021-01-27 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
-
1996
- 1996-04-16 JP JP09383296A patent/JP3375819B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH09282418A (ja) | 1997-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6956969B2 (en) | Methods and apparatuses for handwriting recognition | |
Rath et al. | Word spotting for historical documents | |
EP0114250B1 (en) | Confusion grouping of strokes in pattern recognition method and system | |
US20060050962A1 (en) | System, process and software arrangement for recognizing handwritten characters | |
JP3452774B2 (ja) | 文字認識方法 | |
WO1997044758A9 (en) | Methods and apparatuses for handwriting recognition | |
US7929769B2 (en) | Script recognition for ink notes | |
KR19980018029A (ko) | 문자 인식 장치 | |
JP3375819B2 (ja) | 認識方式複合化方法及びその方法を行う装置 | |
Poon et al. | Scribbler: A tool for searching digital ink | |
JPS592191A (ja) | 手書き日本語文の認識処理方式 | |
JPS58186882A (ja) | 手書き文字入力装置 | |
Parwej | English sentence recognition using artificial neural network through mouse-based gestures | |
JP2538543B2 (ja) | 文字情報認識装置 | |
JP3281530B2 (ja) | 文字認識装置 | |
JP3374762B2 (ja) | 文字認識方法及びその装置 | |
JPH0954814A (ja) | 入力記号表現の分析及び入力記号表現の可能解釈のスコアリングシステム | |
JPH10198766A (ja) | 文字認識装置及びその方法並びに記憶媒体 | |
Rautela et al. | Automated Virtual Character Detection System from Live Video Streaming using Deep CNN | |
JP2851865B2 (ja) | 文字認識装置 | |
KR900005141B1 (ko) | 문자인식장치 | |
Touj et al. | Segmentation stage of a PHMM-based model for off-line recognition of Arabic handwritten city names | |
Pandey et al. | A Robust Approach to Plagiarism Detection in Handwritten Documents | |
JP2865443B2 (ja) | カナ氏名もしくはカナ法人名表記の漢字変換装置 | |
JP3007697B2 (ja) | 単語照合装置及び単語照合方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071129 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081129 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081129 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091129 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101129 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101129 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111129 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111129 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121129 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121129 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131129 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term |