JPH04151786A - Pattern recording device - Google Patents

Pattern recording device

Info

Publication number
JPH04151786A
JPH04151786A JP2277160A JP27716090A JPH04151786A JP H04151786 A JPH04151786 A JP H04151786A JP 2277160 A JP2277160 A JP 2277160A JP 27716090 A JP27716090 A JP 27716090A JP H04151786 A JPH04151786 A JP H04151786A
Authority
JP
Japan
Prior art keywords
pattern
dictionary
feature
image information
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2277160A
Other languages
Japanese (ja)
Inventor
Masateru Sakata
坂田 正輝
Toshiaki Ninomiya
寿朗 二宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Engineering Co Ltd
Original Assignee
Hitachi Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Engineering Co Ltd filed Critical Hitachi Engineering Co Ltd
Priority to JP2277160A priority Critical patent/JPH04151786A/en
Publication of JPH04151786A publication Critical patent/JPH04151786A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To improve the recognition rate and to increase the recognition speed by storing feature patterns having a high frequency in use in dictionaries for first read and copying feature patterns of dictionaries for reread to dictionaries for first read at the time of extracting feature patterns corresponding to an input character or an input voice from dictionaries for reread. CONSTITUTION:When a feature pattern related to an input character type does not exist in dictionaries 16A to 18A for first read, the feature pattern of the input character type is collated with feature pattern groups in dictionaries 16B to 18B for reread. When the feature pattern related to the input character type exists in dictionaries 16B to 18B for reread, this feature pattern is copied to dictionaries 16A to 18A for first read; and feature patterns in dictionaries 16A to 18A for first read are successively extended as a set of specific pattern groups to reduce the recognition processing for dictionaries 16B to 18B for reread. Thus, the recognition object character type can be recognized by the recognition processing or the like of dictionaries 16A to 18A for first read, and dictionaries 16A to 18A for first read are optimized to improve the recognition rate and to increase the recognition speed.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はパターン認識装置に係り、特に、文字図形等の
文字種パターンあるいは音声情報に関するパターンを認
識するに好適なパターン認識装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a pattern recognition device, and particularly to a pattern recognition device suitable for recognizing character type patterns such as characters and figures, or patterns related to voice information.

〔従来の技術〕[Conventional technology]

例えば、漢字の印刷或いは手書き文字を認識する場合一
般に入力文字の特徴を抽出し、これを辞書と比較して認
識している。この場合、不特定の筆者或いは書体に共用
の汎用辞書を使用するが、筆者或いは書体間の類似度が
それほど高くないと、筆者或いは書体間の差異の吸収が
難しく、認識率を高めることが出来ないが、認識のため
の辞書が膨大なものとなり、認識速度が低下すると共に
認識率が低下する。
For example, when recognizing printed or handwritten Chinese characters, the characteristics of the input characters are generally extracted and compared with a dictionary for recognition. In this case, a common general-purpose dictionary is used for unspecified authors or fonts, but if the similarity between authors or fonts is not very high, it is difficult to absorb differences between authors or fonts, and the recognition rate cannot be improved. However, the dictionary for recognition becomes enormous, which reduces recognition speed and recognition rate.

そのため従来では、文字認識を例に取れば、特開昭63
−155390号公報に見られるように文字辞書をその
書体毎に用意し、書体判別を行う手段や、あるいは、音
声認識では話者側、また、手書き文字認識では筆者別の
専用辞書を用意するといった手段が取られてきた。しか
しながら、筆者或いは書体は非常に多数存在するために
、このような手段では、一般に辞書が膨大なものとなり
現実的でない。
Therefore, conventionally, if we take character recognition as an example,
- As seen in Publication No. 155390, a means for discriminating typefaces by preparing a character dictionary for each typeface, or a special dictionary for each speaker for voice recognition and for each writer for handwritten character recognition. Measures have been taken. However, since there are a large number of authors and fonts, such a method would generally result in a huge dictionary, making it impractical.

特開昭63−216390号公報では、光学的文字認識
装置において、認識結果が誤っている文字について文字
の修正をおこなうに際し、その修正した文字の画像イメ
ージの特徴を辞書に反映させ、その後の文字について、
修正済の辞書を用いて再認識させて自動修正を行わせる
ことを提案している。しかし、このような方式では辞書
が装置の使用者の筆者或いは書体に次第に特化されてし
まい、不特定の筆者に対応し切れなくなるという問題が
有る。
In Japanese Patent Application Laid-Open No. 63-216390, when correcting a character whose recognition result is incorrect in an optical character recognition device, the image characteristics of the corrected character are reflected in a dictionary, and subsequent characters are about,
It is proposed that automatic correction be performed by re-recognizing the dictionary using a revised dictionary. However, with this method, there is a problem that the dictionary gradually becomes specialized to the author or typeface of the user of the device, and it becomes unable to deal with unspecified authors.

特開平1−173273号公報では、文字または音声の
認識方式において、不特定多数の者に対して認識を行う
とき、多数の筆者の書き擲に応じたテンプレートを辞書
内に用意し、あらがしめ指定した特定文字をサンプル記
入させることにより、その個人に最も適したパターンの
テンプレートを選択してテンポラリ辞書として使用する
という認識辞書の選択学習方式を提案している。しかし
、本方式は辞書の選択方式についての提案であって、本
質的には、認識に必要な辞書の構成方式の問題を解決し
ている訳ではない。
In Japanese Patent Application Laid-Open No. 1-173273, when recognition is performed for an unspecified number of people in a character or voice recognition method, templates corresponding to the writings of many authors are prepared in a dictionary, and a We have proposed a selective learning method for recognition dictionaries in which a template with a pattern most suitable for the individual is selected and used as a temporary dictionary by having the individual fill in samples of specified specific characters. However, this method is a proposal for a dictionary selection method, and does not essentially solve the problem of a dictionary construction method necessary for recognition.

また、特開平1−241689号公報では、使用頻度の
高い文字種を格納した第1の辞書と、使用頻度の低い文
字種を格納する第2の辞書とを有する辞書部とを用意し
、読み取り情報を第1の辞書に格納された文字種に基づ
き認識処理し、認識結果が誤認識又は認識不能であった
場合には読取り対象文字を、第2の辞書に格納された文
字種に基づき再認識処理する方法を提案している。しか
し、この方法においては階層構造をなす辞書に含まれる
文字種が固定されているため、ユーザの使用目的に応じ
て変化する文字種の出現頻度に対応することが出来ず、
ユーザによっては一定の文字が使用頻度が高いにもかか
わらず、使用頻度の低い文字種を格納する第2の辞書に
おかれたり、あるいはその逆に、一定の文字が使用頻度
が低いにもかかわらず、使用頻度の高い文字種を格納す
る第1の辞書におかれたりするなどの問題点が有った。
Furthermore, in Japanese Patent Application Laid-Open No. 1-241689, a dictionary unit having a first dictionary storing frequently used character types and a second dictionary storing infrequently used character types is prepared, and reading information is stored in the dictionary section. A method of performing recognition processing based on the character type stored in a first dictionary, and re-recognizing the character to be read based on the character type stored in a second dictionary if the recognition result is incorrect recognition or unrecognized. is proposed. However, in this method, the character types included in the hierarchical dictionary are fixed, so it is not possible to respond to the frequency of appearance of character types that changes depending on the user's purpose of use.
Some users may place certain characters in a second dictionary that stores characters that are used less frequently even though they are used frequently, or vice versa. , there were problems such as the first dictionary storing frequently used character types.

また、特開平1−267790号公報では、汎用文字認
識部と個人用文字認識部を備えた文字認識方法において
、個人用文字認識部の認識辞書を汎用文字認識部の認識
辞書により初期化する方式を提案している。しかし、こ
の方式は、個人用文字認識部の認識辞書が汎用文字認識
部の認識辞書の複製として作成されるため、個人用文字
認識部の認識辞書の中には、特定のユーザが高頻度に使
用しない文字種が多数台まれることとなり、辞書サイズ
が不必要に増大し、また、認識率・認識速度に関して不
利に寄与する結果となっている。さらに、認識実行時は
両者からの結果を付き合わせる方式であるため、常に汎
用文字認識部と個人用文字認識部を同時に実行する必要
が有り、装置構成上2倍の負荷が必要とされる。
Furthermore, Japanese Patent Application Laid-Open No. 1-267790 discloses a method of initializing the recognition dictionary of the personal character recognition section with the recognition dictionary of the general-purpose character recognition section in a character recognition method that includes a general-purpose character recognition section and a personal character recognition section. is proposed. However, with this method, the recognition dictionary of the personal character recognition unit is created as a copy of the recognition dictionary of the general-purpose character recognition unit, so some of the recognition dictionaries of the personal character recognition unit are frequently used by specific users. This results in a large number of unused character types, unnecessarily increasing the dictionary size, and contributing disadvantageously to recognition rate and recognition speed. Furthermore, since the results from both are collated during recognition execution, it is always necessary to run the general-purpose character recognition section and the personal character recognition section simultaneously, which requires twice the load on the device configuration.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

以上のように、これらの方法においては、いずれも不特
定多数の筆者、書体の文字あるいは不特定多数の話者の
音声の認識辞書の現実的な構成方式が提案されていない
という問題点が有った。
As mentioned above, each of these methods has the problem that a realistic construction system for recognition dictionaries for the recognition of a large number of unspecified authors, characters in fonts, or voices of a large number of unspecified speakers has not been proposed. It was.

一般に、不特定多数の筆者、書体の文字あるいは不特定
多数の話者の音声認識辞書は、多数の筆者、書体あるい
は話者のデータを収集して、これらのデータを平均化し
て作成される。しかし、平均化した辞書は、特定の筆者
、書体あるいは話者の辞書に比して認識率において劣る
のが普通である。そこで、特定の筆者、書体あるいは話
者の辞書部の認識率を実現するような不特定多数の筆者
、書体の文字または不特定多数の音声の認識辞書の構成
方式が必要とされている。
In general, a speech recognition dictionary for characters of an unspecified number of authors and fonts or for an unspecified number of speakers is created by collecting data of a large number of authors, fonts, or speakers and averaging these data. However, an averaged dictionary usually has a lower recognition rate than a dictionary of a particular author, typeface, or speaker. Therefore, there is a need for a system for configuring a recognition dictionary for characters of an unspecified number of authors, typefaces, or voices of an unspecified number of authors, which achieves the recognition rate of the dictionary section for a particular author, typeface, or speaker.

本発明の目的は、不特定のユーザの文字種あるいは音声
に関するパターンを迅速に認識することができるパター
ン認識装置を提供することにある。
An object of the present invention is to provide a pattern recognition device that can quickly recognize patterns related to character types or voices of unspecified users.

〔課題を解決するための手段〕[Means to solve the problem]

前記目的を達成するために、本発明は、第1の装置とし
て、ユーザ固有の文字種群のうち特定のものの特徴パタ
ーンを格納する初読用辞書と、各ユーザ共通の文字種群
についての特徴パターンを格納する再読用辞書と、文字
種に関する画像情報を入力する画像情報入力手段と、画
像情報入力手段の入力による画像情報から文字種のパタ
ーンを生成するパターン生成手段と、パターン生成手段
の生成によるパターンから入力文字種の特徴を抽出する
特徴抽出手段と、特徴抽出手段により抽出された入力文
字種の特徴パターンと前記両辞書のうち少くとも一方の
辞書に格納された文字種群の特徴パターンと比較照合す
るパターン認識制御手段と、パターン認識制御手段の認
識結果を画像表示する表示手段とを備え、前記パターン
認識制御手段は、入力文字種の特徴パターンと初読用辞
書の特徴パターン群とを照合して辞書の中に入力文字種
に相当する特徴パターンが存在するか否かを判定する第
1判定部と、第1判定部により肯定の判定結果が得られ
たときに辞書の中から入力文字種に相当する特徴パター
ンを抽出する第1パターン抽出部と、第1パターン抽出
部の抽出した特徴パターンの文字種に関する画像情報を
出力する第1画像情報出力部と、第1判定部により否定
の判定結果が得られたときに入力文字種の特徴パターン
と再読用辞書の特徴パターン群とを照合して辞書の中に
入力文字種に相当する特徴パターンが存在するか否かを
判定する第2判定部と、第2判定部により肯定の判定結
果が得られたときに辞書の中から入力文字種に相当する
特徴パターンを抽出する第2パターン抽出部と、第2パ
ターン抽出部の抽出した特徴パターンの文字種に関する
画像情報を出力する第2画像情報出力部と、第2パター
ン抽出部の抽出による特徴パターンを初読用辞書に複写
するパターン複写部と、第2判定部により否定の判定結
果が得られたときに、この判定結果に関する画像情報を
出力する第2画像情報出力部とから構成されているパタ
ーン認識装置を構成したものである。
In order to achieve the above object, the present invention includes, as a first device, a dictionary for initial reading that stores characteristic patterns of a specific character type group unique to a user, and a characteristic pattern of a character type group common to each user. a rereading dictionary to be stored, an image information input means for inputting image information regarding character types, a pattern generation means for generating a pattern of character types from the image information inputted by the image information input means, and an input from the pattern generated by the pattern generation means. Feature extracting means for extracting features of character types, and pattern recognition control for comparing and matching the feature pattern of the input character type extracted by the feature extracting means with the feature pattern of a group of character types stored in at least one of the two dictionaries. and a display means for displaying an image of the recognition result of the pattern recognition control means, the pattern recognition control means collating the characteristic pattern of the input character type with the characteristic pattern group of the dictionary for initial reading, and displaying the recognition result in the dictionary. a first determination unit that determines whether or not a feature pattern corresponding to the input character type exists; and a feature pattern that corresponds to the input character type is extracted from the dictionary when a positive determination result is obtained by the first determination unit. a first image information output section that outputs image information regarding the character type of the feature pattern extracted by the first pattern extraction section; a second determining unit that compares the characteristic pattern of the character type with a group of characteristic patterns in the rereading dictionary to determine whether or not a characteristic pattern corresponding to the input character type exists in the dictionary; a second pattern extraction unit that extracts a feature pattern corresponding to the input character type from the dictionary when a determination result is obtained; and a second image that outputs image information regarding the character type of the feature pattern extracted by the second pattern extraction unit. an information output section; a pattern copying section that copies the characteristic pattern extracted by the second pattern extraction section into a dictionary for initial reading; and, when a negative judgment result is obtained by the second judgment section, image information regarding this judgment result; This is a pattern recognition device that includes a second image information output section that outputs a second image information output section.

第2の装置として、ユーザ固有の音声情報のうち特定の
ものの特徴パターンを格納する初読用辞書と、各ユーザ
共通の音声情報についての特徴パターンを格納する再読
用辞書と、音声情報を入力する音声情報入力手段と、音
声情報入力手段の入力による音声情報から音声に関する
パターンを生成するパターン生成手段と、パターン生成
手段の生成によるパターンから音声の特徴を抽出する特
徴抽出手段と、特徴抽出手段により抽出された音声の特
徴パターンと前記両辞書のうち少くとも一方の辞書に格
納された音声の特徴パターンとを比較照合するパターン
認識制御手段と、パターン認識制御手段の認識結果を画
像表示する表示手段とを備え、前記パターン認識制御手
段は、入力音声の特徴パターンと初読用辞書の特徴パタ
ーン群とを照合して辞書の中に入力音声に相当する特徴
パターンが存在するか否かを判定する第1判定部と、第
1判定部により肯定の判定結果がえられたときに辞書の
中から入力音声に相当する特徴パターンを抽出する第1
パターン抽出部と、第1パターン抽出部の抽出した特徴
パターンの音声に関する画像情報を出力する第1画像情
報出力部と、第1判定部により否定の判定結果がえら得
たときに入力音声の特徴パターンと再読用辞書の特徴パ
ターン群とを照合して辞書の中に入力音声に相当する特
徴パターンが存在するか否かを判定する第2判定部と、
第2判定部により肯定の判定結果が得られたときに辞書
の中から入力音声に相当する特徴パターンを抽出する第
2パターン抽出部と、第2パターン抽出部の抽出した特
徴パターンの音声に関する画像情報を出力する第2画像
情報出力部と、第2パターン抽出部の抽出による特徴パ
ターンを初読用辞書に複写するパターン複写部と、第2
判定部により否定の判定結果が得られたときに、この判
定結果に関する画像情報を出力する第3画像情報出力部
とから構成されているパターン記憶装置を構成したもの
である。
As a second device, a dictionary for initial reading stores feature patterns of specific audio information specific to the user, a dictionary for rereading stores feature patterns of audio information common to each user, and audio information is inputted. A voice information input means, a pattern generation means for generating a pattern related to voice from voice information inputted by the voice information input means, a feature extraction means for extracting a voice feature from a pattern generated by the pattern generation means, and a feature extraction means. pattern recognition control means for comparing and collating the extracted voice characteristic pattern with a voice characteristic pattern stored in at least one of the two dictionaries, and a display means for displaying an image of the recognition result of the pattern recognition control means. The pattern recognition control means compares the characteristic pattern of the input voice with a group of characteristic patterns of the initial reading dictionary to determine whether a characteristic pattern corresponding to the input voice exists in the dictionary. a first determining unit; and a first determining unit that extracts a feature pattern corresponding to the input voice from the dictionary when a positive determination result is obtained by the first determining unit.
a first image information output section that outputs image information regarding the sound of the feature pattern extracted by the first pattern extraction section; and a first image information output section that outputs image information regarding the sound of the feature pattern extracted by the first pattern extraction section; a second determination unit that compares the pattern with a group of characteristic patterns in the rereading dictionary to determine whether or not a characteristic pattern corresponding to the input voice exists in the dictionary;
a second pattern extraction unit that extracts a feature pattern corresponding to the input audio from the dictionary when a positive determination result is obtained by the second determination unit; and an image related to the audio of the feature pattern extracted by the second pattern extraction unit; a second image information output section that outputs information; a pattern copy section that copies the characteristic pattern extracted by the second pattern extraction section into a dictionary for initial reading; and a second image information output section that outputs information;
The pattern storage device includes a third image information output section that outputs image information regarding the determination result when a negative determination result is obtained by the determination section.

第1または第2の装置を含む第3の装置として、初読用
辞書として複数の辞書を備えていると共に操作に応じ照
合用辞書として前記辞書を順次指定する初読用辞書選択
手段を備えているパターン認識装置を構成したものであ
る。
A third device including the first or second device is provided with a plurality of dictionaries as first reading dictionaries, and includes first reading dictionary selection means for sequentially specifying the dictionaries as checking dictionaries in response to an operation. This is a configuration of a pattern recognition device.

第1または第2の装置を含む第4の装置として、再読用
辞書として複数の辞書を備えていると共に、操作に応じ
て照合用辞書として前記辞書を順次指定する再読用辞書
選択手段を備えているパターン認識装置を構成したもの
である。
A fourth device including the first or second device is provided with a plurality of dictionaries as rereading dictionaries, and further includes rereading dictionary selection means for sequentially specifying the dictionaries as checking dictionaries in accordance with an operation. This is a configuration of a pattern recognition device.

第1または第2の装置を含む第5の装置として、切続用
#書として複数の辞書を備えていると共に、操作に応じ
照合用辞書として前記辞書を順次指定する初読用辞書選
択手段を備え、再読用辞書として複数の辞書を備えてい
ると共に、操作に応じ照合用辞書として前記辞書を順次
指定する再読用辞書選択手段を備えているパターン認識
装置を構成したものである。
A fifth device including the first or second device is provided with a plurality of dictionaries as a number book for discontinuation, and includes first reading dictionary selection means for sequentially specifying the dictionaries as check dictionaries according to operations. The pattern recognition apparatus is provided with a plurality of dictionaries as rereading dictionaries, and a rereading dictionary selection means for sequentially specifying the dictionaries as checking dictionaries in response to an operation.

第1〜第5の装置のうちいずれか一つの装置を含む第6
の装置として、第1画像情報出力部と第2画像情報出力
部は、抽出された特徴パターンの格納元の辞書を特定す
る情報を画像情報に付して出力してなるパターン認識装
置を構成したものである。
A sixth device including any one of the first to fifth devices
As the device, the first image information output section and the second image information output section constitute a pattern recognition device that outputs information specifying the dictionary from which the extracted feature pattern is stored, attached to the image information. It is something.

第1〜第6の装置のうちいずれか一つの装置を含む第7
の装置として、認識対象パターンに対して修正された特
徴パターンを初読用辞書へ格納する特徴パターン入力手
段を備えているパターン認識装置を構成したものである
A seventh device including any one of the first to sixth devices
This apparatus is a pattern recognition apparatus including a characteristic pattern input means for storing a characteristic pattern corrected with respect to a recognition target pattern in a dictionary for initial reading.

〔作用〕[Effect]

認識対象の文字種に関する情報が入力されると、この入
力文字種に関する画像情報がパターンに変換され、この
パターンと初読用辞書に格納された特定パターンとの照
合がまず行われる。そして初読用辞書に入力文字種に相
当する特徴パターンが存在するときにはその特徴パター
ンに関する画像情報が表示され、初読用辞書内に入力文
字種に関する特徴パターンが存在しないときには入力文
字種の特徴パターンと再読用辞書の特徴パターン群との
照合が行われる。そして再読用辞書内に入力文字種に関
する特徴パターンが存在するときには。
When information regarding a character type to be recognized is input, image information regarding this input character type is converted into a pattern, and this pattern is first compared with a specific pattern stored in a dictionary for initial reading. When a feature pattern corresponding to the input character type exists in the first-reading dictionary, image information about that feature pattern is displayed, and when there is no feature pattern related to the input character type in the first-reading dictionary, the feature pattern of the input character type and the re-reading dictionary are displayed. A comparison with a group of feature patterns in the dictionary is performed. And when there is a feature pattern related to the input character type in the rereading dictionary.

この入力文字種に関する画像情報が表示されると共に再
読用辞書内に存在した特徴パターンを初読用辞書に複写
し、初読用辞書内の特徴パターンを特定なものの特定パ
ターン群の集合として順次拡張し、再読用辞書に対する
認識処理を低減させる。
Image information related to this input character type is displayed, and the feature patterns existing in the re-reading dictionary are copied to the first-reading dictionary, and the feature patterns in the first-reading dictionary are sequentially expanded as a set of specific patterns of specific things. , reducing recognition processing for the rereading dictionary.

これにより初読用辞書に対する認識処理等で認識対象文
字種に対する認識を行うことが可能となり、初読用辞書
が最適化され、認識率の向上および認識速度の向上を図
ることができる。音声情報に対しても同様な処理が行わ
れるため、音声情報に対しても認識率の向上および認識
速度の向上を図ることができる。
This makes it possible to recognize the target character type through recognition processing for the first reading dictionary, optimizing the first reading dictionary, and improving the recognition rate and recognition speed. Since similar processing is performed on audio information, it is possible to improve the recognition rate and recognition speed for audio information as well.

また初読用辞書として複数の辞書を備えたり、あるいは
再読用辞書として複数の辞書を備えたりすれば、多くの
情報の中から認識対象パターンを選択することができ認
識率の向上を図ることができる。
Furthermore, by providing multiple dictionaries for initial reading or multiple dictionaries for rereading, it is possible to select recognition target patterns from a large amount of information and improve the recognition rate. can.

また認識処理において必要なパターンが得られないとき
に、認識対象パターンに対して修正された特定パターン
を初読用辞書へ格納する学習処理を行えば初読用辞書を
最適化することが可能となる。
In addition, when the required pattern cannot be obtained in the recognition process, it is possible to optimize the first reading dictionary by performing a learning process that stores a specific pattern modified from the recognition target pattern in the first reading dictionary. Become.

〔実施例〕 以下、本発明の一実施例を図面に基づいて説明する。〔Example〕 Hereinafter, one embodiment of the present invention will be described based on the drawings.

第1図において、パターン認識装置はキーボード10、
認識制御部11.スキャナ12、イメージバッファ13
、前処理部14、特徴抽出部15、大分類用辞書部16
、中分類用辞書17、小分類用辞書部18、CRT19
を備えて構成されており、各辞書部16.17.18は
それぞれ切続用大分類用辞書16A、切続用中分類用辞
書17A、切続用小分類用辞書18A、再読用大分類用
辞書16B、再読用中分類用辞書17B、再読用小分類
用辞書18Bに階層化されている。
In FIG. 1, the pattern recognition device includes a keyboard 10,
Recognition control unit 11. Scanner 12, image buffer 13
, pre-processing unit 14, feature extraction unit 15, broad classification dictionary unit 16
, medium classification dictionary 17, small classification dictionary section 18, CRT 19
Each dictionary section 16, 17, and 18 includes a dictionary for major classification for cutting and continuing 16A, a dictionary for medium classification for cutting and continuing 17A, a dictionary for small classification for cutting and continuing 18A, and a dictionary for major classification for rereading. It is hierarchically divided into a dictionary 16B, a dictionary for medium classification for rereading 17B, and a dictionary for small classification for rereading 18B.

キーボード10は各種の情報および指令を入力する入力
手段として構成されており、キーボード10の操作ボタ
ンが操作されると、この操作ボタンに従った指令が認識
制御部11を介して各部に伝送されると共にCRT19
の画面上に操作内容が画像表示されるようになっている
。スキャナ12は認識制御部11からの指令に従って、
帳票上の文字を光学的に走査し、走査により得られた画
像情報を出力する画像情報入力手段として構成されてお
り、画像情報がイメージバッファ13に格納されるよう
になっている。イメージバッファ13に格納された画像
情報は前処理部14により文字の切り出しおよび正規化
処理等の前処理が施され、スキャナ12の操作による入
力文字のパターンが生成されるようになっている。すな
わちイメージバッファ13、前処理部14は画像情報か
ら文字のパターンを生成するパターン生成手段として構
成されている。そして前処理部14で生成されたパター
ンは特徴抽出部15に転送され、切り出された文字の特
徴が抽出される。すなわち特徴抽出部15は入力文字の
特徴を抽出する特徴抽出手段として構成されている。
The keyboard 10 is configured as an input means for inputting various information and commands, and when an operation button on the keyboard 10 is operated, the command according to the operation button is transmitted to each section via the recognition control section 11. with CRT19
The content of the operation is displayed as an image on the screen. The scanner 12 follows instructions from the recognition control unit 11.
It is configured as an image information input means that optically scans characters on a form and outputs image information obtained by scanning, and the image information is stored in the image buffer 13. The image information stored in the image buffer 13 is subjected to preprocessing such as character extraction and normalization processing by a preprocessing section 14, so that a pattern of input characters is generated by operation of the scanner 12. That is, the image buffer 13 and the preprocessing section 14 are configured as pattern generation means for generating character patterns from image information. The pattern generated by the preprocessing section 14 is then transferred to the feature extraction section 15, where the features of the cut out characters are extracted. That is, the feature extracting section 15 is configured as a feature extracting means for extracting features of input characters.

辞書部16,17.18のうち初読用辞書16A、17
A、18Aにはユーザ固有の文字、図形などの文字種群
のうち特定のものの特徴パターンとして1例えば筆者あ
るいは書体毎に固有な特徴パターンとして使用頻度の高
い特徴パターンを大分類、中分類、小分類に分割した大
分類のものが初読用辞書16Aに、中分類のものが初読
用辞書]、7A、小分類のものが初読用辞書18Aにそ
れぞれ格納されている。一方、再読用辞書16B。
Initial reading dictionary 16A, 17 among dictionary parts 16, 17, 18
A, 18A shows the characteristic patterns of specific types of characters such as characters and figures that are unique to the user.For example, characteristic patterns unique to each author or typeface are categorized into major, medium, and minor categories. The major classifications are stored in the first reading dictionary 16A, the middle classifications are stored in the first reading dictionary], 7A, and the small classifications are stored in the first reading dictionary 18A. On the other hand, rereading dictionary 16B.

17B、18Bには、各ユーザ共通の文字種群の特徴パ
ターンとして、例えば筆者あるいは書体間で共通な特徴
を有する文字の特徴パターンを大分類、中分類、小分類
に分割した時の大分類のものが再読用辞書16Bに、中
分類のものが再読用辞書17B、小分類のものが再読用
辞書18Bにそれぞれ格納されている。すなわち各再読
用辞書16B、17B、18Bには、多数の筆者あるい
は書体のデータを集取して、これらのデータを平均化し
て作成された特徴パターン群のデータが格納されている
。また辞書16A、16Bには文字の外部構造に関する
特徴パターンが格納され、辞書17A、17Bには文字
の内部構造に関する特徴パターンが格納され、辞書18
A、18Bには文字の位相構造に関する特徴パターンが
格納されている。
17B and 18B contain feature patterns of character type groups common to each user, such as major classifications when character characteristic patterns having common characteristics among authors or fonts are divided into major classifications, medium classifications, and small classifications. are stored in the rereading dictionary 16B, those in the medium category are stored in the rereading dictionary 17B, and those in the small category are stored in the rereading dictionary 18B. That is, each of the rereading dictionaries 16B, 17B, and 18B stores data of a feature pattern group created by collecting data of a large number of authors or fonts and averaging these data. Further, the dictionaries 16A and 16B store feature patterns related to the external structure of characters, the dictionaries 17A and 17B store feature patterns related to the internal structure of characters, and the dictionary 18
Feature patterns related to the topological structure of characters are stored in A and 18B.

認識制御部11は、パターン認識制御手段として、入力
文字種の特徴パターンと初読用辞書16A、17A、1
8Aの特徴パターン群とを照合して辞書の中に入力文字
種に相当する特徴パターンが存在するか否かを判定する
第1判定部と、第1判定部により肯定の判定結果が得ら
れたときに辞書の中から入力文字種に相当する特徴パタ
ーンを抽出する第1パターン抽出部と、第1パターン抽
出部の抽出した特徴パターンの文字種に関する画像情報
を出力する画像情報出力部と、第1判定部に指定の判定
結果が得られたときに入力文字種の特徴パターンと再読
用辞書16B、17B、18Bの特徴パターン群とを照
合して辞書の中に入力文字種に相当する特徴パターンが
存在するが否かを判定する第2判定部と、第2判定部に
より肯定の判定結果が得られたときに辞書の中から入力
文字種に相当する特徴パターンを抽出する第2パターン
抽出部と、第2パターン抽出部の抽出した特徴パターン
の文字種に関する画像情報を出力する第2画像情報出力
部と、第2パターン抽出部の抽出による特徴パターンを
初読用辞書16A、17A、18Aに複写するパターン
複写部と、第2判定部により否定の判定結果が得られた
ときにこの判定結果に関する画像情報を出力する第3画
像情報出力部を備えて構成されている。更にキーボード
10からの指令に応じ照合用辞書として各初読用辞書1
6A、17A、18Aを順次指定する初読用辞書選択手
段と、照合用辞書として再読用辞書16B、17B、1
8Bを順次指定する再読用辞書選択手段を構成するよう
になっている。更に認識対象パターンに対して修正され
た特徴パターンを初読用辞書16A、17A、18Aへ
格納する学習処理を実行するための特徴パターン入力手
段を構成するようになっている。
The recognition control unit 11, as a pattern recognition control means, uses the characteristic pattern of the input character type and the initial reading dictionaries 16A, 17A, 1
a first determining unit that determines whether or not a characteristic pattern corresponding to the input character type exists in the dictionary by comparing the characteristic pattern group of 8A; and when an affirmative determination result is obtained by the first determining unit; a first pattern extraction unit that extracts a feature pattern corresponding to the input character type from a dictionary; an image information output unit that outputs image information regarding the character type of the feature pattern extracted by the first pattern extraction unit; and a first determination unit. When a specified determination result is obtained, the feature pattern of the input character type is compared with the feature pattern groups in the rereading dictionaries 16B, 17B, and 18B to determine whether there is a feature pattern corresponding to the input character type in the dictionary. a second determination unit that determines whether the input character type is the same; a second pattern extraction unit that extracts a feature pattern corresponding to the input character type from the dictionary when the second determination unit obtains a positive determination result; a second image information output section that outputs image information regarding the character type of the feature pattern extracted by the second pattern extraction section; a pattern copy section that copies the feature pattern extracted by the second pattern extraction section to the initial reading dictionary 16A, 17A, 18A; The third image information output section is configured to output image information regarding the determination result when a negative determination result is obtained by the second determination section. Furthermore, each first reading dictionary 1 is used as a collation dictionary in response to commands from the keyboard 10.
Initial reading dictionary selection means for sequentially specifying 6A, 17A, and 18A, and rereading dictionaries 16B, 17B, and 1 as checking dictionaries.
A rereading dictionary selection means for sequentially specifying 8B is configured. Further, it constitutes a feature pattern input means for executing a learning process of storing feature patterns corrected for the recognition target pattern in the initial reading dictionaries 16A, 17A, and 18A.

以上の構成において、操作者の操作によりキーボード1
0から指令が発せられると、スキャナ12により帳票上
の文字列が光学的に走査され、この文字列に関する画像
情報がイメージバッファ13に入力される。この画像情
報は前処理部14で文字の切り出しと大きさの正規化が
施され、文字パターンが生成される。そして切り出され
た文字の特徴が特徴コードとして特徴抽出部15で抽出
される。この後認識判定部11の処理により特徴抽出部
]5で抽出された文字の特徴パターンに関する特徴コー
ドと初読用辞書1.6A、17A、18Aに格納された
特徴パターンに関する特徴コードとの比較照合が行われ
る。ここで両者の特徴コードの比較照合を行う場合、両
者のコード間の相違度合いを゛′距離″として、この距
離の値に従って候補文字の絞り込みを行う。すなわち、
初読用辞書16Aから順番に初読用辞書17A、18A
を照合し、入力文字の特徴コードに相当する特徴コード
がいずれかの辞書に存在するか否かの処理を実行する。
In the above configuration, the keyboard 1 is
When a command is issued from 0, the character string on the form is optically scanned by the scanner 12, and image information regarding this character string is input into the image buffer 13. This image information is subjected to character extraction and size normalization in the preprocessing section 14, and a character pattern is generated. Then, the features of the cut out characters are extracted as feature codes by the feature extractor 15. Thereafter, through the process of the recognition determination unit 11, the feature extraction unit] 5 compares and matches the feature code related to the character feature pattern extracted by the feature code with the feature code related to the feature pattern stored in the initial reading dictionary 1.6A, 17A, 18A. will be held. When comparing and matching the two feature codes, the degree of difference between the two codes is defined as the "distance", and candidate characters are narrowed down according to the value of this distance. In other words,
Dictionaries for first reading 17A and 18A in order from first reading dictionary 16A
and executes processing to determine whether a feature code corresponding to the feature code of the input character exists in any of the dictionaries.

そして一定のしきい値以下の距離を有する候補文字が存
在する場合には、入力文字と距離の最も近い文字を認識
結果文字とし、以下距離順に少数の候補文字を切続結果
として出力する。
If there is a candidate character having a distance less than a certain threshold, the character closest to the input character is taken as the recognition result character, and a small number of candidate characters are output as discontinuation results in order of distance.

更に認識結果文字および候補文字にはそれらがいずれか
の初読用辞書から出力されたかを特定するための情報を
画像情報に付して出力する。
Furthermore, the recognition result characters and candidate characters are outputted along with image information for specifying from which initial reading dictionary the recognition result characters and candidate characters are output.

一方、初読用辞書16A、17A、18A内に入力文字
の特徴コードに相当する特徴コードが存在しないときに
は、再読用辞書16B’、17B。
On the other hand, when there is no feature code corresponding to the feature code of the input character in the initial reading dictionaries 16A, 17A, 18A, the rereading dictionaries 16B', 17B.

18B内の特徴コートを順次参照する処理を実行する。A process of sequentially referencing the feature coats in 18B is executed.

このときも、前述の処理と同様に、一定のしきい値以下
の距離を有する候補文字が存在するときには、入力文字
と距離の最も近い文字を認識結果文字として、以下距離
の順に少数の候補文字を再読結果として出力する。更に
再読結果によって得られた文字の特徴コードをそれぞれ
初読用辞書16A、17A、18Aに複写する。例えば
、再読用辞書16Bから候補文字が選択されたときには
、この候補文字の特徴コードを初読用辞書16Aに複写
する。更に認識結果文字および候補文字には、それらの
文字が選択された辞書を特定するための識別情報が画像
情報に付加されて出力される。
In this case, as in the process described above, if there is a candidate character with a distance less than a certain threshold, the character closest to the input character is selected as the recognition result character, and then a small number of candidate characters are selected in order of distance. Output as the rereading result. Furthermore, the character feature codes obtained as a result of rereading are copied to the initial reading dictionaries 16A, 17A, and 18A, respectively. For example, when a candidate character is selected from the rereading dictionary 16B, the feature code of this candidate character is copied to the first reading dictionary 16A. Furthermore, identification information for specifying the dictionary from which the characters were selected is added to the image information of the recognition result characters and candidate characters and output.

また再読処理によっても一定のしきい値以下の距離を有
する候補文字が存在しないときには、認識不能として画
像情報にリジェクト符号を付して出力する。そして各再
読結果に関する画像情報はCRT19の画面上に画像表
示される。
Further, if there is no candidate character having a distance equal to or less than a certain threshold value even after the rereading process, the image information is outputted with a reject code attached thereto as unrecognizable. Image information regarding each rereading result is displayed as an image on the screen of the CRT 19.

切続結果あるいは再読結果がCRT19の画面上に表示
される場合、識別結果文字および候補文字に付加された
識別情報が表示されるため、画像表示された文字が切続
結果により得られた文字か再読結果によって得られた文
字であるかを操作者が識別することができる。そして操
作者は、CRT19の画面上に画像表示された内容から
、バタン認識の結果を確認し、認識結果が正しい場合に
はそのままとし、誤読の場合には候補文字群および読み
取り対象イメージを表示させ、候補カテゴリ内に正しい
文字が存在するときはその文字を選択し、候補カテゴリ
内に正しい文字が存在しないあるいはりジェクトである
場合には正しい文字を、例えば文字コードとして入力す
れば誤読の修正を行うことができる。
When the discontinuation result or rereading result is displayed on the screen of the CRT 19, the identification information added to the identification result character and the candidate character are displayed, so it is easy to check whether the character displayed in the image is a character obtained by the discontinuation result. The operator can identify whether the characters are obtained from the rereading results. The operator then checks the results of the button recognition from the image displayed on the screen of the CRT 19, and if the recognition result is correct, leave it as it is; if the recognition result is incorrect, display the candidate character group and the image to be read. , if the correct character exists in the candidate category, select that character, and if the correct character does not exist in the candidate category or is a displacement, enter the correct character, for example as a character code, to correct misreading. It can be carried out.

このとき、認識対象パターンに対して修正された特徴パ
ターンを初読用辞書16A、17A、18Aへ格納する
学習処理を実行する。この学習処理は初読用辞書16A
、17A、18Aにもカテゴリの新規追加として実行さ
れ、新たに追加された文字コードが既に存在する場合に
は、カテゴリへの重ね合わせとして、例えば新旧画情報
の論理和として実行される。この結果、認識対象文字の
再読を行うまでは、初読用辞書16A、17A。
At this time, a learning process is executed in which the feature pattern corrected for the recognition target pattern is stored in the initial reading dictionaries 16A, 17A, and 18A. This learning process is performed by the first reading dictionary 16A.
, 17A, and 18A are also executed as a new addition of a category, and if the newly added character code already exists, it is executed as an overlay on the category, for example, as a logical sum of old and new image information. As a result, the initial reading dictionaries 16A and 17A are used until the characters to be recognized are reread.

18Aに入っていない文字の情報が再読後は辞書に入っ
ていることと成り、次の文字が帳票に表れた場合には再
読処理が不要となる。このため、初期状態の辞書に含ま
れる文字種を十分少くしておいても、このプロセスを適
度に繰り返すことにより、最終的には初読用辞書16A
、17A、18Aに必要とされる使用頻度の高い文字種
の特徴パターンを格納することができる。
After rereading, the information on the characters that are not included in 18A is included in the dictionary, and when the next character appears on the form, rereading processing is not necessary. Therefore, even if the number of character types included in the initial dictionary is sufficiently small, by repeating this process appropriately, the initial reading dictionary 16A
, 17A, and 18A can store characteristic patterns of frequently used character types.

このように、本実施例によれば、初読用辞書16A、1
7A、18Aから使用頻度の高い特徴パターンが順次成
長しながら格納されるため、初読用辞書16A、17A
、18Aによる認識率が向上し、OCRシステムとして
の認識率および認識速度の向上を図ることが可能となる
In this way, according to the present embodiment, the initial reading dictionaries 16A, 1
Frequently used feature patterns are stored sequentially from 7A and 18A, so first reading dictionaries 16A and 17A
, 18A improves the recognition rate, and it becomes possible to improve the recognition rate and recognition speed as an OCR system.

なお、操作者が修正作業を行う場合には、キーボードの
10の一つの操作ボタンに、例えば「再読」を割り当て
、このキーボタンの押し下げ信号および修正作業を行う
場合には、キーボード10の一つの操作ボタンに、例え
ば「再読」を割り当て、このキーボタンの押し下げ信号
および修正を行う文字についての情報を入力することに
よって実行される。そして更に操作者がシステムの起動
時にユーザ辞書作成モードとユーザ辞書実行モードのう
ちユーザ辞書作成モードが指定されたときにのみ学習処
理が行われるようになっている。このようなモードの指
定によって学習処理の実行を選択するようにすれば、操
作者が辞書の実行状態を明確に把握して作業を行うこと
ができる。
When the operator performs correction work, he assigns, for example, "Reread" to one of the 10 operation buttons on the keyboard, and when the operator performs the correction work, he assigns, for example, "Reread" to one of the 10 operation buttons on the keyboard. This is executed by assigning, for example, "reread" to an operation button, and inputting a signal for pressing this key button and information about the character to be corrected. Further, the learning process is performed only when the operator specifies the user dictionary creation mode out of the user dictionary creation mode and the user dictionary execution mode when the system is started. If execution of the learning process is selected by specifying such a mode, the operator can work while clearly grasping the execution state of the dictionary.

また上記実施例において、切続用の辞書として、筆者あ
るいは書体に応じた辞書を分類毎に用意すれば、操作者
の使用目的に応じて任意の辞書を選択することが出来、
○CRシステムとしての認識率および認識速度を更に向
上させることが可能となる。この場合の初読用辞書の選
択例が第2図に示されている。
In addition, in the above embodiment, if a dictionary corresponding to the author or typeface is prepared for each category as a dictionary for discontinuation, the operator can select any dictionary according to the purpose of use.
○It becomes possible to further improve the recognition rate and recognition speed as a CR system. An example of selecting a dictionary for initial reading in this case is shown in FIG.

また、操作者が修正作業を行う場合、操作メニューの1
つに、例えば「学習」を割り当て、このメニューの選択
により学習を行うか行わないかを選択させることも可能
であり、「学習」の指定をCRT19の画面上にメニュ
ーにより実現した例が第3図に示されている。この場合
、指定はメニューにより割り当てられたファンクション
キーおよびマウス等のポインティングデイバイスによっ
て実行される。
In addition, when the operator performs correction work, 1.
For example, it is possible to assign "Learning" to "Learning" and have the user select whether or not to perform learning by selecting this menu. As shown in the figure. In this case, the specification is performed using function keys assigned by the menu and a pointing device such as a mouse.

また前記実施例においては、文字、図形等の文字種のパ
ターンを認識するものについて述べたが、音声情報を認
識するものにも前記実施例を適用することができる。
Furthermore, in the embodiment described above, a system that recognizes patterns of character types such as letters and figures has been described, but the embodiment can also be applied to systems that recognize speech information.

例えば、スキャナ12の代りにマイクロホン等の音声入
力装置を用い、イメージバッファ13の代りに音声人カ
バソファを用いる。そして、音声入力装置により入力さ
れた音声信号を音声周波数の時間変化を表わしたパター
ンであるTSP(T−ime Spectrum Pa
ttern)として表現し、これをTSPのピーク近傍
を(1)、その他を(0)とする2値パターンに変換す
る処理を行う。2値パターン(Binary Time
 Spectrum Pattern)は文字認識の2
値化イメージと同様に取り扱うことが可能であり、この
2値化された音声情報は前処理部14で音節体の切り落
としと、音節間の正規化が施され、切り出された音節の
特徴が特徴コードとして特徴抽出部15で抽出される。
For example, an audio input device such as a microphone may be used instead of the scanner 12, and an audio speaker sofa may be used instead of the image buffer 13. Then, the audio signal inputted by the audio input device is converted into a TSP (T-ime Spectrum Pa), which is a pattern representing the temporal change in audio frequency.
ttern), and converts this into a binary pattern in which the vicinity of the TSP peak is set to (1) and the others are set to (0). Binary pattern (Binary Time)
Spectrum Pattern) is character recognition 2
It can be handled in the same way as a digitized image, and the preprocessing unit 14 cuts off the syllable body and normalizes the syllables, and this binarized speech information is processed by cutting out the syllable body and normalizing the syllables. It is extracted as a code by the feature extraction unit 15.

この後の処理は文字種パターンのd識処理と同じ処理を
実行することにより、音声パターンの認識を行うことが
できる。
The subsequent processing is the same as the d recognition processing for character type patterns, so that speech patterns can be recognized.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明によれば、使用頻度の高い
特徴パターンを初読用辞書に格納すると共に入力文字あ
るいは入力音声に相当する特徴パターンが再読用辞書か
ら抽出されたときには再読用辞書の特徴パターンを初読
用辞書に複写するようにしたため、初読用辞書が最適化
され、再読用辞書を認識するための処理が低減されるの
で、認識率の向上および認識速度の向上を図ることが可
能となる。
As explained above, according to the present invention, frequently used feature patterns are stored in the first reading dictionary, and when feature patterns corresponding to input characters or input speech are extracted from the rereading dictionary, the rereading dictionary is stored. Since the feature patterns are copied to the first reading dictionary, the first reading dictionary is optimized and the processing required to recognize the rereading dictionary is reduced, thereby improving the recognition rate and recognition speed. becomes possible.

また再読辞書が原型通りに保存され、学習により劣化す
る危険がなくかつ切続辞書の内容が更新されても再読用
辞書の内容を再利用することができる。
Furthermore, the rereading dictionary is stored in its original form, so there is no risk of deterioration due to learning, and even if the contents of the continuous dictionary are updated, the contents of the rereading dictionary can be reused.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例を示す全体構成図、第2図は
初読用辞書の選択用画面の表示例を示す図、第3図は「
学習J指定をCRT上の画面のメニューにより実現した
表示例を示す図で・ある。 10・・・キーボード、11・・・認識制御部、12・
・・スキャナ、13・・・イメージバッファ、14・・
・前処理部、15・・・特徴抽出部、16A・・・切続
用大分類用辞書、 16B・・・再読用大分類用辞書、 17A・・・切続用中分類用辞書、 17B・・・再読用中分類用辞書、 18A・・・切続用小分類用辞書、 18B・・再読用小分類用辞書、 19・・・CRT。
FIG. 1 is an overall configuration diagram showing one embodiment of the present invention, FIG. 2 is a diagram showing a display example of a selection screen for a dictionary for initial reading, and FIG.
It is a diagram showing an example of a display in which learning J designation is realized by a menu on a screen on a CRT. DESCRIPTION OF SYMBOLS 10... Keyboard, 11... Recognition control part, 12.
...Scanner, 13...Image buffer, 14...
- Preprocessing unit, 15... Feature extraction unit, 16A... Dictionary for large classification for discontinuation, 16B... Dictionary for large classification for rereading, 17A... Dictionary for medium classification for discontinuation, 17B. ... Dictionary for intermediate classification for rereading, 18A... Dictionary for small classification for discontinuation, 18B... Dictionary for small classification for rereading, 19... CRT.

Claims (1)

【特許請求の範囲】 1、ユーザ固有の文字種群のうち特定のものの特徴パタ
ーンを格納する初読用辞書と、各ユーザ共通の文字種群
についての特徴パターンを格納する再読用辞書と、文字
種に関する画像情報を入力する画像情報入力手段と、画
像情報入力手段の入力による画像情報から文字種のパタ
ーンを生成するパターン生成手段と、パターン生成手段
の生成によるパターンから入力文字種の特徴を抽出する
特徴抽出手段と、特徴抽出手段により抽出された入力文
字種の特徴パターンと前記両辞書のうち少くとも一方の
辞書に格納された文字種群の特徴パターンと比較照合す
るパターン認識制御手段と、パターン認識制御手段の認
識結果を画像表示する表示手段とを備え、前記パターン
認識制御手段は、入力文字種の特徴パターンと初読用辞
書の特徴パターン群とを照合して辞書の中に入力文字種
に相当する特徴パターンが存在するか否かを判定する第
1判定部と、第1判定部により肯定の判定結果が得られ
たときに辞書の中から入力文字種に相当する特徴パター
ンを抽出する第1パターン抽出部と、第1パターン抽出
部の抽出した特徴パターンの文字種に関する画像情報を
出力する第1画像情報出力部と、第1判定部により否定
の判定結果が得られたときに入力文字種の特徴パターン
と再読用辞書の特徴パターン群とを照合して辞書の中に
入力文字種に相当する特徴パターンが存在するか否かを
判定する第2判定部と、第2判定部により肯定の判定結
果が得られたときに辞書の中から入力文字種に相当する
特徴パターンを抽出する第2パターン抽出部と、第2パ
ターン抽出部の抽出した特徴パターンの文字種に関する
画像情報を出力する第2画像情報出力部と、第2パター
ン抽出部の抽出による特徴パターンを初読用辞書に複写
するパターン複写部と、第2判定部により否定の判定結
果が得られたときに、この判定結果に関する画像情報を
出力する第2画像情報出力部とから構成されているパタ
ーン認識装置。 2、ユーザ固有の音声情報のうち特定のものの特徴パタ
ーンを格納する初読用辞書と、各ユーザ共通の音声情報
についての特徴パターンを格納する再読用辞書と、音声
情報を入力する音声情報入力手段と、音声情報入力手段
の入力による音声情報から音声に関するパターンを生成
するパターン生成手段と、パターン生成手段の生成によ
るパターンから音声の特徴を抽出する特徴抽出手段と、
特徴抽出手段により抽出された音声の特徴パターンと前
記両辞書のうち少くとも一方の辞書に格納された音声の
特徴パターンとを比較照合するパターン認識制御手段と
、パターン認識制御手段の認識結果を画像表示する表示
手段とを備え、前記パターン認識制御手段は、入力音声
の特徴パターンと初読用辞書の特徴パターン群とを照合
して辞書の中に入力音声に相当する特徴パターンが存在
するか否かを判定する第1判定部と、第1判定部により
肯定の判定結果がえられたときに辞書の中から入力音声
に相当する特徴パターンを抽出する第1パターン抽出部
と、第1パターン抽出部の抽出した特徴パターンの音声
に関する画像情報を出力する第1画像情報出力部と、第
1判定部により否定の判定結果がえら得たときに入力音
声の特徴パターンと再読用辞書の特徴パターン群とを照
合して辞書の中に入力音声に相当する特徴パターンが存
在するか否かを判定する第2判定部と、第2判定部によ
り肯定の判定結果が得られたときに辞書の中から入力音
声に相当する特徴パターンを抽出する第2パターン抽出
部と、第2パターン抽出部の抽出した特徴パターンの音
声に関する画像情報を出力する第2画像情報出力部と、
第2パターン抽出部の抽出による特徴パターンを初読用
辞書に複写するパターン複写部と、第2判定部により否
定の判定結果が得られたときに、この判定結果に関する
画像情報を出力する第3画像情報出力部とから構成され
ているパターン記憶装置。 3、初読用辞書として複数の辞書を備えていると共に、
操作に応じ照合用辞書として前記辞書を順次指定する初
読用辞書選択手段を備えている請求項1または2記載の
パターン認識装置。 4、再読用辞書として複数の辞書を備えていると共に、
操作に応じて照合用辞書として前記辞書を順次指定する
再読用辞書選択手段を備えている請求項1または2記載
のパターン認識装置。 5、初読用辞書として複数の辞書を備えていると共に、
操作に応じ照合用辞書として前記辞書を順次指定する初
読用辞書選択手段を備え、再読用辞書として複数の辞書
を備えていると共に、操作に応じ照合用辞書として前記
辞書を順次指定する再読用辞書選択手段を備えている請
求項1または2記載のパターン認識装置。 6、第1画像情報出力部と第2画像情報出力部は、抽出
された特徴パターンの格納元の辞書を特定する情報を画
像情報に付して出力してなる請求項1、2、3、4また
は5記載のパターン認識装置。 7、認識対象パターンに対して修正された特徴パターン
を初読用辞書へ格納する特徴パターン入力手段を備えて
いる請求項1、2、3、4、5または6記載のパターン
認識装置。
[Claims] 1. An initial reading dictionary that stores feature patterns of specific character types among user-specific character types, a rereading dictionary that stores feature patterns of character types common to each user, and images related to character types. An image information input means for inputting information, a pattern generation means for generating a character type pattern from the image information input by the image information input means, and a feature extraction means for extracting characteristics of the input character type from the pattern generated by the pattern generation means. , a pattern recognition control means for comparing and matching the characteristic pattern of the input character type extracted by the characteristic extraction means with the characteristic pattern of a character type group stored in at least one of the two dictionaries; and a recognition result of the pattern recognition control means. and display means for displaying an image of the input character type, and the pattern recognition control means compares the characteristic pattern of the input character type with a group of characteristic patterns in the dictionary for initial reading to determine whether a characteristic pattern corresponding to the input character type exists in the dictionary. a first determination unit that determines whether or not the character type is inputted; a first pattern extraction unit that extracts a feature pattern corresponding to the input character type from the dictionary when the first determination unit obtains a positive determination result; a first image information output unit that outputs image information regarding the character type of the feature pattern extracted by the pattern extraction unit; and a first image information output unit that outputs image information regarding the character type of the feature pattern extracted by the pattern extraction unit; a second determination unit that determines whether or not a feature pattern corresponding to the input character type exists in the dictionary by comparing the pattern group; a second pattern extraction section that extracts a feature pattern corresponding to the input character type from among them; a second image information output section that outputs image information regarding the character type of the feature pattern extracted by the second pattern extraction section; and a second pattern extraction section. a pattern copying section that copies the feature pattern extracted by the first reading dictionary; and a second image information output section that outputs image information regarding the determination result when the second determination section obtains a negative determination result. A pattern recognition device consisting of. 2. An initial reading dictionary that stores characteristic patterns of specific voice information unique to the user, a rereading dictionary that stores characteristic patterns of voice information common to each user, and voice information input means that inputs voice information. a pattern generation means for generating a pattern related to speech from the speech information input by the speech information input means; a feature extraction means for extracting features of the speech from the pattern generated by the pattern generation means;
pattern recognition control means for comparing and matching the voice feature pattern extracted by the feature extraction means with the voice feature pattern stored in at least one of the two dictionaries; the pattern recognition control means compares the characteristic pattern of the input voice with a group of characteristic patterns of the initial reading dictionary to determine whether there is a characteristic pattern corresponding to the input voice in the dictionary. a first determination unit that determines whether the input voice is the same; a first pattern extraction unit that extracts a feature pattern corresponding to the input voice from the dictionary when the first determination unit obtains a positive determination result; a first image information output section that outputs image information regarding the sound of the feature pattern extracted by the section; and a feature pattern of the input sound and a group of feature patterns of the rereading dictionary when a negative judgment result is obtained by the first judgment section. a second determination unit that determines whether or not a feature pattern corresponding to the input voice exists in the dictionary by comparing the characteristic pattern with the input voice; a second pattern extraction unit that extracts a feature pattern corresponding to the input audio; a second image information output unit that outputs image information regarding the audio of the feature pattern extracted by the second pattern extraction unit;
a pattern copying section that copies the feature pattern extracted by the second pattern extraction section into a dictionary for initial reading; and a third pattern copying section that outputs image information regarding the judgment result when a negative judgment result is obtained by the second judgment section. A pattern storage device comprising an image information output section. 3. Equipped with multiple dictionaries for first reading,
3. The pattern recognition device according to claim 1, further comprising a first reading dictionary selection means for sequentially specifying the dictionary as a reference dictionary in response to an operation. 4. Equipped with multiple dictionaries for rereading,
3. The pattern recognition device according to claim 1, further comprising rereading dictionary selection means for sequentially specifying the dictionary as a reference dictionary in accordance with an operation. 5. Equipped with multiple dictionaries for first reading,
A first-reading dictionary selection means for sequentially specifying the dictionary as a collation dictionary according to an operation, a plurality of dictionaries as a rereading dictionary, and a rereading dictionary for sequentially specifying the dictionary as a collation dictionary according to an operation. 3. The pattern recognition device according to claim 1, further comprising dictionary selection means. 6. Claims 1, 2 and 3, wherein the first image information output section and the second image information output section output image information along with information specifying a dictionary from which the extracted feature pattern is stored. 6. The pattern recognition device according to 4 or 5. 7. The pattern recognition apparatus according to claim 1, further comprising a feature pattern input means for storing a feature pattern modified with respect to the recognition target pattern in a dictionary for initial reading.
JP2277160A 1990-10-16 1990-10-16 Pattern recording device Pending JPH04151786A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2277160A JPH04151786A (en) 1990-10-16 1990-10-16 Pattern recording device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2277160A JPH04151786A (en) 1990-10-16 1990-10-16 Pattern recording device

Publications (1)

Publication Number Publication Date
JPH04151786A true JPH04151786A (en) 1992-05-25

Family

ID=17579641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2277160A Pending JPH04151786A (en) 1990-10-16 1990-10-16 Pattern recording device

Country Status (1)

Country Link
JP (1) JPH04151786A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7581180B2 (en) * 2000-05-12 2009-08-25 Sony Corporation Portable terminal, method for inputting the information, method and apparatus for dictionary retrieval and medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7581180B2 (en) * 2000-05-12 2009-08-25 Sony Corporation Portable terminal, method for inputting the information, method and apparatus for dictionary retrieval and medium

Similar Documents

Publication Publication Date Title
US7428516B2 (en) Handwriting recognition using neural networks
JP2007317022A (en) Handwritten character processor and method for processing handwritten character
JP2000353215A (en) Character recognition device and recording medium where character recognizing program is recorded
JPS63155386A (en) Document data reader
JPH09190505A (en) Device for recognizing character and its method
US5621818A (en) Document recognition apparatus
JPH11194793A (en) Voice word processor
US6035062A (en) Character recognition method and apparatus
JPH04151786A (en) Pattern recording device
JP3727422B2 (en) Character recognition apparatus and method
JP3266687B2 (en) Mark recognition method
Amin Recognition of printed Arabic text using machine learning
JP2001092924A (en) Method and device for recognizing pattern
JP3209197B2 (en) Character recognition device and recording medium storing character recognition program
JPS60173688A (en) Pattern processing device
JPH0757040A (en) Filing device provided with ocr
JP2660998B2 (en) Japanese language processor
JPH06251187A (en) Method and device for correcting character recognition error
JPS6061875A (en) Generation system of standard pattern
JPH08305851A (en) Handwritten symbol recognition system
JPH07107698B2 (en) Character recognition method
JPH11120294A (en) Character recognition device and medium
JP2986255B2 (en) Character recognition device
JP3290110B2 (en) Handwritten character recognition device
JPH08202830A (en) Character recognition system