JPH052661A - 単語読取装置 - Google Patents

単語読取装置

Info

Publication number
JPH052661A
JPH052661A JP3153087A JP15308791A JPH052661A JP H052661 A JPH052661 A JP H052661A JP 3153087 A JP3153087 A JP 3153087A JP 15308791 A JP15308791 A JP 15308791A JP H052661 A JPH052661 A JP H052661A
Authority
JP
Japan
Prior art keywords
word
input
neural network
output
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3153087A
Other languages
English (en)
Inventor
Taizou Kameshiro
泰三 亀代
Kozo Tomono
浩三 伴野
Keiji Kobayashi
啓二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP3153087A priority Critical patent/JPH052661A/ja
Publication of JPH052661A publication Critical patent/JPH052661A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 ニューラルネットワークの並列単語決定方式
で入力パターンのカテゴリから単語情報を用い出力単語
を決定する。 【構成】 認識部1で入力単語10の個別文字ごとに認
識文字辞書3からの認識文字40との類似度を計算し生
成する入力パターンのカテゴリとしての類似度データ2
0を、後処理部2に設ける並列単語決定手段のニューラ
ルネットワークに入力する。ニューラルネットワーク入
力層からの類似度データ20と学習された結合の重みと
の積和を出力するニューラルネットワーク中間層からの
出力データと学習された結合の重みとの積和を各読取単
語ごとにニューラルネットワーク出力層で計算する。最
も値の大きい当該読取単語を最終読取結果の出力単語3
0として決定する。ニューラルネットワークはバックプ
ロパゲーション法で学習される。 【効果】 この発明の並列単語決定方式による高速単語
読取りの効果は従来の遂次単語決定方式と比べ、読取単
語数や入力単語の文字数による入力データ数が増えるほ
ど顕著になる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は読取単語数や入力単語
の文字数が増えても高速に単語読取りができるニューラ
ルネットワークを用いる単語読取装置に関する。
【0002】
【従来の技術】たとえば文献(蕉山他:手書漢字認識に
おける単語情報の利用、昭57信学総全大、1341)
に示す従来例の単語読取装置は図3のように、認識部1
aは、入力単語10の個別文字ごとに認識文字辞書3か
ら類似する認識文字40aを選択し、認識順位をつけ入
力パターンのカテゴリとして候補単語20aを生成す
る。後処理部2aは、認識部1aからの候補単語20a
の個別文字ごとに読取単語辞書4からマッチングする読
取単語50を選択し、複数あるときは最小の不一致度を
示すものを出力単語30として決定する。認識文字辞書
3と読取単語辞書4は、基準パターンとなる認識文字4
0aと読取対象となる読取単語50とをそれぞれ予め登
録する。
【0003】上記従来例の単語読取装置は、各読取単語
50ごとに各候補単語20aの個別文字すべてとマッチ
ング処理をし、不一致度を計算し最終読取結果としての
出力単語30を決定する方式(遂次単語決定方式)を採
る。
【0004】後処理部2aは図4のように、まず認識部
1aから入力単語10の「鳥取県」を認識した順位第1
位の「鳥敢県」、第2位の「烏取具」、第3位の「島耽
呉」、第4位の「罵根倶」の各候補単語20aを入力す
る。つぎに読取単語辞書4から取出した読取単語50ご
とに各候補単語20aの個別文字すべてとマッチング処
理をし、各読取単語50の不一致度(個別文字ごとの認
識順位−1を加算した値)を計算し、予め決めるしきい
値以下の不一致度をもつ読取単語50、たとえば「鳥取
県」と「島根県」を選択する。「鳥取県」の不一致度は
「鳥」が認識した順位第1位で1−1=0、「取」が同
じく第2位で2−1=1、「県」が同じく第1位で1−
1=0であるから0+1+0=1となる。同じように
「島根県」の不一致度は「島」が第3位、「根」が第4
位、「県」が第1位であるから5となる。さらに最小の
不一致度を示す読取単語50の「鳥取県」を最終読取結
果の出力単語30として決定する。
【0005】
【発明が解決しようとする課題】上記のような従来の単
語読取装置では、後処理部で読取単語辞書からの各読取
単語ごとに認識部からの各候補単語の個別文字すべてと
マッチング処理をし、不一致度を計算し最終読取結果と
しての出力単語を決定する遂次単語決定方式を採るか
ら、読取単語数や入力単語したがって候補単語の文字数
に比例しマッチング処理時間が膨大になる問題点があっ
た。たとえば47都道府県名の読取単語と3文字の候補
単語とのマッチング処理に個別文字当り1μsかかると
し候補単語を20位で足切りするとしても、最大マッチ
ング処理時間は47×3×20=2820μsかかる。
【0006】この発明が解決しようとする課題は、単語
読取装置で読取単語数や入力単語の文字数が増えても高
速に単語読取りができる並列単語決定方式を提供するこ
とにある。
【0007】
【課題を解決するための手段】この発明の単語読取装置
は、認識部で入力単語の個別文字パターン(入力パター
ン)から抽出する特徴(パターンを代表する情報)を予
め登録する辞書の基準パターンと比較し入力パターンの
カテゴリを決定し、後処理部でその入力パターンのカテ
ゴリから単語情報を用い出力単語を決定するもので、上
記課題を解決するためつぎの手段を設け、並列単語決定
方式を採ることを特徴とする。
【0008】並列単語決定手段は、後処理部に設け、認
識部から入力パターンのカテゴリを学習済のニューラル
ネットワークに入力し、並列分散処理をし入力パターン
に最も近い単語読取結果を出力単語として決定する。
【0009】
【作用】この発明の読取単語装置は上記手段で、認識部
から後処理部の並列単語決定手段に入力パターンのカテ
ゴリ(たとえば入力単語の個別文字ごとの類似度データ
など)を入力し、ニューラルネットワーク入力層からの
入力データと学習された結合の重みデータとの積をニュ
ーラルネットワーク中間層で総和し、ニューラルネット
ワーク中間層からの出力データと学習された結合の重み
データとの積をニューラルネットワーク出力層で読取対
象となる各読取単語に対応する出力データごとに総和
し、最も値の大きい出力データを最終読取結果の出力単
語として決定する。
【0010】
【実施例】この発明を示す一実施例の単語読取装置は図
1のように、認識部1は、入力単語10の各番目の個別
文字と、認識文字辞書3からの認識文字40(読取対象
となる読取単語、たとえば都道府県名の各番目の個別文
字)との類似度(特徴値の2乗誤差の総和)を計算し、
入力パターンのカテゴリとして入力単語10の個別文字
ごとの類似度データ20を生成する。たとえば入力単語
10の「鳥取県」の1番目の「鳥」と、認識文字辞書3
からの認識文字40の「北」(「北海道」の1番目)、
「青」(「青森県」の1番目)、「東」(「東京都」の
1番目)などとの類似度を計算し、a種類の類似度デー
タ20(S11〜S1a)を生成する。ここで「福島県」と
「福井県」と「福岡県」の「福」のように同じ認識文字
40との類似度は1度しか計算しない。同じように入力
単語10の「鳥取県」の2番目と3番目の「取」と
「県」も、認識文字辞書3からの認識文字40の
「海」、「森」、「京」と「道」、「県」、「都」など
との類似度を計算し、それぞれb種類とc種類の類似度
データ20(S21〜S2bとS31〜S3c)を生成する。後
処理部2は、認識部1から入力単語10の個別文字ごと
の類似度データ20を並列単語決定手段の学習済ニュー
ラルネットワークに入力し、並列分散処理をし入力パタ
ーンに最も近い単語読取結果を出力単語30として決定
する。認識文字辞書3は、基準パターンとなる認識文字
40として読取対象となる読取単語の各番目の個別文字
を予め登録する。
【0011】上記実施例の単語読取装置は、入力単語1
0の各番目の個別文字ごとの類似度データを学習済ニュ
ーラルネットワークに入力し、並列分散処理をし最終読
取結果としての出力単語30を決定する方式(並列単語
決定方式)を採る。
【0012】後処理部2は図2ように、学習機能をもつ
3階層構造のニューラルネットワークからなる並列単語
決定手段を設ける。まず認識部1からニューラルネット
ワーク入力層に入力単語10の個別文字ごとの類似度デ
ータ20)S11〜S1a、S21〜S2b、S31〜S3c)を入
力する。つぎにニューラルネットワーク入力層で受けた
類似度データ20と学習された結合の重みデータとの積
をニューラルネットワーク中間層に入力し総和する。さ
らにニューラルネットワーク中間層の各出力データと学
習された結合の重みデータとの積をニューラルネットワ
ーク出力層に入力し、各読取単語(たとえば都道府県
名)に対応する出力単語30ごとに総和し最も値の大き
いものを最終読取結果として決定する。上記3階層構造
のニューラルネットワークは、予め用意する学習パター
ンと辞書パターンとの類似度(入出力過程時と同じ)を
入力としてニューラルネットワークからの出力に正解を
与え、バックプロパゲーション法(誤差逆伝播法)で学
習される。並列単語決定手段でニューラルネットワーク
の入力から出力まで5μsかかるとし入力データ数が2
倍になっても、シナプス結合数に相当するニューラルネ
ットワーク結合の配線数は2倍になるがニューロンに相
当するニューラルネットワーク中間層と出力層で並列処
理をするから10μs以下しかかからない。また追加し
たい読取単語を学習データに加え自動学習させるだけで
よいから、読取単語を容易に追加できる。
【0013】なお上記実施例で読取単語は、都道府県名
だけでなく市長村名、人名、会社名その他の単語名でも
よい。またニューラルネットワーク入力層への入力値
は、入力パターンと基準パターンとの類似度だけでなく
入力パターンと基準パターンとの距離や認識結果の候補
文字の認識順位でもよい。またニューラルネットワーク
の学習法は、バックプロパゲーション法に限らない。
【0014】
【発明の効果】上記のようなこの発明の単語読取装置で
は、入力パターンのカテゴリを学習済のニューラルネッ
トワークに入力し、並列分散処理をし入力パターンに最
も近い単語読取結果を出力単語として決定する並列単語
決定方式を採るから、従来のように個別文字すべてとマ
ッチング処理をする遂次単語決定方式と比べ、読取単語
数や入力単語の文字数が増えても高速に単語読取がで
き、入力データ数が増えるほど従来方式との処理速度差
が顕著になる効果がある。
【図面の簡単な説明】
【図1】この発明を示す一実施例の単語読取装置の機能
ブロック図。
【図2】図1に示す後処理部の並列単語決定方式を説明
する図。
【図3】従来例の単語読取装置の機能ブロック図。
【図4】図3に示す後処理部の遂次単語決定方式を説明
する図。
【符号の説明】
1 認識部 2 後処理部 3 認識文字辞書 10 入力単語 20 入力単語の各番目の個別文字ごとの類似度データ 30 出力単語 40 認識文字(読取単語の各番目の個別文字) なお図中、同一符号は同一または相当部分を示す。

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 入力単語の個別文字パターン(入力パタ
    ーン)から抽出する特徴を予め登録する辞書の基準パタ
    ーンと比較し該入力パターンのカテゴリを決定する認識
    部と、前記入力パターンのカテゴリから単語情報を用い
    出力単語を決定する後処理部とを備える単語読取装置に
    おいて、前記後処理部で前記入力パターンのカテゴリを
    学習済のニューラルネットワークに入力し、並列分散処
    理をし前記入力パターンに最も近い単語読取結果を出力
    単語として決定する並列単語決定手段を設けることを特
    徴とする単語読取装置。
JP3153087A 1991-06-25 1991-06-25 単語読取装置 Pending JPH052661A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3153087A JPH052661A (ja) 1991-06-25 1991-06-25 単語読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3153087A JPH052661A (ja) 1991-06-25 1991-06-25 単語読取装置

Publications (1)

Publication Number Publication Date
JPH052661A true JPH052661A (ja) 1993-01-08

Family

ID=15554695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3153087A Pending JPH052661A (ja) 1991-06-25 1991-06-25 単語読取装置

Country Status (1)

Country Link
JP (1) JPH052661A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07319880A (ja) * 1994-05-20 1995-12-08 Fujitsu Ltd キーワード抽出・検索装置
JP2004005761A (ja) * 2003-09-29 2004-01-08 Fujitsu Ltd キーワード抽出・検索装置
JP2004030695A (ja) * 2003-09-29 2004-01-29 Fujitsu Ltd キーワード抽出・検索装置
JP2020184109A (ja) * 2019-04-26 2020-11-12 Arithmer株式会社 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07319880A (ja) * 1994-05-20 1995-12-08 Fujitsu Ltd キーワード抽出・検索装置
JP2004005761A (ja) * 2003-09-29 2004-01-08 Fujitsu Ltd キーワード抽出・検索装置
JP2004030695A (ja) * 2003-09-29 2004-01-29 Fujitsu Ltd キーワード抽出・検索装置
JP2020184109A (ja) * 2019-04-26 2020-11-12 Arithmer株式会社 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム

Similar Documents

Publication Publication Date Title
Tank et al. Collective computation in neuronlike circuits
JP2940933B2 (ja) パターン認識方式
Matan et al. Multi-digit recognition using a space displacement neural network
US5588091A (en) Dynamically stable associative learning neural network system
US4429414A (en) Pattern recognition system operating by the multiple similarity method
US5446829A (en) Artificial network for temporal sequence processing
US5802507A (en) Method for constructing a neural device for classification of objects
US5832108A (en) Pattern recognition method using a network and system therefor
US5511134A (en) Image recognition device and image recognition method
Gader et al. Handwritten character recognition
EP0709800B1 (en) Method for designing classification trees
JPH052661A (ja) 単語読取装置
Anigbogu et al. Hidden Markov models in text recognition
CN111831805A (zh) 一种模型创建方法、装置、电子设备和可读存储装置
Wang Learning and retrieving spatio-temporal sequences with any static associative neural network
JP3222699B2 (ja) パターン認識装置
US5712959A (en) Neural network architecture for non-Gaussian components of a mixture density function
JP2736361B2 (ja) ニューラルネット構成方法
JP3485420B2 (ja) 大規模ニューラルネットワーク構築装置
Bourbakis et al. Handwriting recognition using a reduced character method and neural nets
JP3303253B2 (ja) パターンマッチング方法および装置
JP2743418B2 (ja) 学習方法
Nugroho et al. Artificial Neural Networks For Pattern Recognize Handwritten
KR0162770B1 (ko) 신경망을 위한 곱셈기 및 그 곱셈방법
Huang Interpretations of Deep Learning by Forests and Haar Wavelets