JPH0221032B2 - - Google Patents

Info

Publication number
JPH0221032B2
JPH0221032B2 JP56047069A JP4706981A JPH0221032B2 JP H0221032 B2 JPH0221032 B2 JP H0221032B2 JP 56047069 A JP56047069 A JP 56047069A JP 4706981 A JP4706981 A JP 4706981A JP H0221032 B2 JPH0221032 B2 JP H0221032B2
Authority
JP
Japan
Prior art keywords
samples
dictionary
sample
distance
constituent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56047069A
Other languages
Japanese (ja)
Other versions
JPS57161987A (en
Inventor
Hideaki Sugawara
Eiichiro Yamamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56047069A priority Critical patent/JPS57161987A/en
Publication of JPS57161987A publication Critical patent/JPS57161987A/en
Publication of JPH0221032B2 publication Critical patent/JPH0221032B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing

Description

【発明の詳細な説明】 本発明は文字認識装置に係り特に多数のサンプ
ルから効率良く複数の辞書を作成する方式に関す
る。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a character recognition device, and particularly to a method for efficiently creating a plurality of dictionaries from a large number of samples.

通常文字認識装置において入力信号とのマツチ
ングを行なう辞書は、1カテゴリに対して1辞書
であつた。
Normally, in a character recognition device, there is one dictionary for each category for matching input signals.

又、1カテゴリ当たりの辞書を複数にし、より
正確な文字認識を行なう試みが成されているもの
の、各辞書内でのサンプル間に重複が生じる、各
構成サンプル数に著しい差がある等適切な辞書の
作成が困難であるばかりでなく、辞書作成に複雑
な手順を要するものであつた。
In addition, although attempts have been made to use multiple dictionaries per category to perform more accurate character recognition, there are cases where there are overlaps between samples within each dictionary, significant differences in the number of constituent samples, etc. Not only was it difficult to create a dictionary, but it also required complicated procedures.

本発明は、上記複数辞書作成に関し、新規な方
式を提供するものであり、以下これに詳細な説明
を加える。
The present invention provides a novel method for creating multiple dictionaries, which will be described in detail below.

第1図乃至第4図は複数辞書作成工程の1例で
10個のサンプルa乃至jを用いてそのクラス分け
について示すものである。図中、各サンプル間の
2次元的距離は、それぞれ特徴を抽出した後相互
の距離マトリツクスを求め、それを模式的に表わ
している。即ち各サンプル間の距離が大きいもの
ほど、その特徴が異なるものである。
Figures 1 to 4 are examples of the process of creating multiple dictionaries.
The classification is shown using 10 samples a to j. In the figure, the two-dimensional distance between each sample is calculated by calculating a mutual distance matrix after extracting the respective features, and then schematically representing it. That is, the larger the distance between each sample, the more different the characteristics.

第1図は、従来1カテゴリに対して1つの辞書
を作成する場合のクラス分けである。単一の辞書
作成に関しては、全てのサンプルの平均Aを求め
そこから辞書を作成するものである。これは、本
発明に関する複数辞書作成においても同様であ
り、それぞれのクラスの構成サンプルを選出した
後、該構成サンプルの平均から辞書を作成する。
FIG. 1 shows the classification when one dictionary is conventionally created for one category. Regarding the creation of a single dictionary, the average A of all samples is found and a dictionary is created from there. This also applies to the creation of multiple dictionaries according to the present invention; after selecting constituent samples of each class, a dictionary is created from the average of the constituent samples.

本発明では、N個のサンプルからK個の複数辞
書を作成するに際し、第1番目から、第{K−N
+(n1*K)}番目の辞書についてはn1=|N/K
|個の、第{K−N+(n1*K)+1}番目から第
K番目の辞書については(n1+1)個の構成サン
プルを選出する。又、構成サンプルの選出はそれ
ぞれ各辞書の核となるサンプルS1,S2を定め該
S1,S2に近いサンプルごとにそれぞれ重複しない
ように行なう。即ち、初めに最も距離を隔てた2
つのサンプルを核として定め、該サンプルを核と
して各辞書の構成サンプルを選出した後は、既に
選出の終了したサンプルについてマスクをかけ、
次工程よりは、残されたサンプルのみをクラス分
けの対象とするものである。
In the present invention, when creating K plural dictionaries from N samples, from the first to {K-N
+(n 1 *K)}th dictionary, n 1 = |N/K
For the | {K-N+(n 1 *K)+1}-th to K-th dictionaries, (n 1 +1) constituent samples are selected. In addition, the selection of constituent samples involves determining samples S 1 and S 2 , which are the core of each dictionary.
This is done for each sample close to S 1 and S 2 so as not to overlap each other. That is, the two most distant initially
After selecting one sample as a core and selecting constituent samples of each dictionary using this sample as the core, mask the samples that have already been selected.
From the next step onwards, only the remaining samples will be classified.

上記の式において、 N……1カテゴリにおけるサンプル数 K……1カテゴリに対して作成する辞書の数 n1……1辞書におけるサンプル数 それぞれ示す。 In the above equation, N...Number of samples in one category K...Number of dictionaries created for one category n1 ...Number of samples in one dictionary, respectively.

尚、上記N個のサンプルからK個の辞書パター
ンを作成する場合に、NがKの整数倍であれば各
辞書パターンは全てN/K個(整数)のサンプル
を用いて複数辞書を作成すれば良いので、何等問
題はない。
In addition, when creating K dictionary patterns from the above N samples, if N is an integer multiple of K, multiple dictionaries should be created using N/K (integer) samples for each dictionary pattern. It's fine, so there's no problem.

一方、必ずNがKの整数倍であるということが
ない場合も考えられることから、そのような状態
が発生した時についてもなるべく各辞書パターン
を作成するサンプルの数を平均化したいとの希望
がある。
On the other hand, since there may be cases where N is not always an integral multiple of K, it is desirable to average the number of samples used to create each dictionary pattern even when such a situation occurs. be.

従つて、NがKの整数倍でない時は、〔N/K〕
個のサンプルから作成される辞書パターンと、 〔N/K〕+1個のサンプルから作成される辞
書パターンの2種類をつくれば、各辞書パターン
を作成するサンプルの数は略平均化されている。
Therefore, when N is not an integral multiple of K, [N/K]
By creating two types of dictionary patterns: one created from N/K samples and one created from [N/K]+1 samples, the number of samples used to create each dictionary pattern is approximately averaged.

即ち、上記2つの式は、〔N/K〕個のサンプ
ルから作成する辞書パターンの数、及び〔N/
K〕+1個のサンプルから作成する辞書パターン
の数を求めるためのものである。
That is, the above two equations represent the number of dictionary patterns to be created from [N/K] samples, and [N/K]
This is to find the number of dictionary patterns to be created from K]+1 samples.

第2図にK=2、即ち、10個のサンプルから2
個の辞書を作成する場合について示す。ここで、
N=10、K=2であるためn1=|10/2|=5と
なり、又K−N+(n1*K)=2−10+5×2=
2、より第1番目より第2番目の辞書(全ての辞
書)についてそれぞれ5個づつの構成サンプルを
選出する。
In Figure 2, K=2, that is, 2 out of 10 samples.
This example shows how to create dictionaries. here,
Since N=10 and K=2, n 1 =|10/2|=5, and K-N+(n 1 *K)=2-10+5×2=
2. Select five constituent samples for each of the first and second dictionaries (all dictionaries).

初めに、サンプルxとyとの距離について入力
文字をビデオ信号に変換し、入力ビデオから種々
の特徴を抽出することにより以下のように設定す
る。
First, the distance between samples x and y is set as follows by converting an input character into a video signal and extracting various features from the input video.

d(x,y)=nl=1 |xl−yl| (但しlはmから成る次元数) この様にして10個のサンプルについて、それぞ
れのサンプル間距離を求め距離マトリツクスを形
成したものである。
d(x,y)= nl=1 |x l −y l | (where l is the number of dimensions consisting of m) In this way, calculate the inter-sample distance for each of the 10 samples and form a distance matrix. This is what I did.

第2図において、最大サンプル間距離を有する
ものは、a−c間であるため、ここでは辞書の核
としてaとcを選ぶ。次いで、a又はcのどちら
かから、該サンプルに最も近接するサンプル、即
ち、サンプル間距離の小さいものをそれぞれ5個
づつ選出する。
In FIG. 2, since the distance between a and c has the maximum distance between samples, a and c are selected here as the core of the dictionary. Next, from either a or c, five samples are each selected that are closest to the sample, that is, those with a small inter-sample distance.

例えば、先にaを核とする辞書を作成する場
合、aに関してサンプル間距離の小さいh,b,
f,gをそれぞれ選出する。又、ここでは作成す
る辞書数が2であるため、前記aを核とする辞書
の構成サンプルを選出した後、残存するサンプル
を全て他のもう1つの辞書の構成サンプルとすれ
ば良い。
For example, when first creating a dictionary with a as the core, h, b, which has a small distance between samples with respect to a,
Select f and g, respectively. In addition, since the number of dictionaries to be created here is two, after selecting the constituent samples of the dictionary with the above-mentioned a as the core, all remaining samples may be used as constituent samples of another dictionary.

各辞書の構成サンプルを選出した後は、従来の
辞書作成の手段により、各々の平均をとり、各辞
書を作成する。かかる工程は、単に従来の技術を
適用したに過ぎないため以下の説明においては省
略する。
After selecting constituent samples of each dictionary, each dictionary is created by taking the average of each using conventional dictionary creation means. Since such a step is merely an application of a conventional technique, it will be omitted in the following description.

第3図に10個のサンプルから3個の複数辞書を
作成する場合について示す。前記第2図と同様の
工程と同様に第1番目の辞書作成のためのクラス
k1をサンプルaを核として、第2番目のクラスk2
をサンプルcを核としてそれぞれ構成サンプルを
選出した後、残存するサンプルから第3番目のク
ラスk3を作成する。
FIG. 3 shows the case where three multiple dictionaries are created from ten samples. A class for creating the first dictionary in the same process as in Figure 2 above.
k 1 with sample a as the core, second class k 2
After selecting constituent samples using sample c as a core, a third class k3 is created from the remaining samples.

ここでは、n1=|10/3|=3,K−N+(n1
*K)=2より、k1,k2についてはそれぞれ3個
づつの構成サンプルを、k3については(n1+1)
(=4)個の構成サンプルを選出する。
Here, n 1 = | 10/3 | = 3, K-N + (n 1
*K) = 2, for k 1 and k 2 , 3 configuration samples each, for k 3 , (n 1 + 1)
(=4) configuration samples are selected.

第4図は、10個のサンプルから4個の複数辞書
を作成する場合について示している。
FIG. 4 shows a case where four plural dictionaries are created from ten samples.

前記第1図、第2図での説明と同様に核a,c
を選出し、クラスk1,k2をそれぞれ作成する。次
いで、核クラスk1,k2の構成サンプルであるa,
h,j,cにマスクをする。
Nuclei a and c are similar to the explanation in FIGS. 1 and 2 above.
, and create classes k 1 and k 2 respectively. Next, a, which is a sample of the core classes k 1 and k 2 ,
Mask h, j, and c.

尚ここでn1=2,K−N+(n1*K)=2のため
第1番目のクラスk1、第2番目のクラスk2の構成
サンプル数はそれぞれ2個、第3番目のクラス
k3、第4番目のクラスk4の構成サンプル数はそれ
ぞれ(n1+1=)3個とする。
Here, since n 1 = 2, K - N + (n 1 * K) = 2, the number of constituent samples for the first class k 1 and the second class k 2 is 2 each, and the number of samples for the third class is 2.
The number of constituent samples of k 3 and the fourth class k 4 are each (n 1 +1=) 3.

前記クラスk1,k2の構成サンプルにマスクをし
た後前記と同様の工程により残存する。b,e,
d,f,g,i,のサンプルを対象としてクラス
分けを行なう。ここで、最もサンプル間距離の大
きいものはg,iであるため、これらをクラス分
けの核とする。
After the constituent samples of the classes k 1 and k 2 are masked, they remain in the same process as above. b, e,
Classification is performed for samples d, f, g, and i. Here, since g and i have the largest inter-sample distance, these are used as the core of classification.

前述のように、第3番目及び第4番目の辞書作
成のための構成サンプル数は3個であるため例え
ば第3番目の核としてiを選びサンプルb,f,
iから成るクラスk3を形成する。従つてクラスk4
はサンプルd,e,gから構成されるものとな
る。
As mentioned above, the number of constituent samples for creating the third and fourth dictionaries is three, so for example, i is selected as the third kernel and samples b, f,
Form a class k 3 consisting of i. So class k 4
is composed of samples d, e, and g.

又、ここで第3番目の核としてサンプルgを選
ぶことも可能である。サンプルgを第3番目の核
とした場合にはそのクラスの構成はb,e,gと
なり、第4番目のクラスは残存するd,f,iか
ら構成されることになる。かかる構成サンプルの
相違は、最大のサンプル間距離を有する2つのサ
ンプルのうち、どちらを先に核として構成サンプ
ルを決定するかにより生じるものであるが、本発
明の適用に於いてはそれぞれのサンプル間距離の
和が小さくなるように、即ち、近接するサンプル
ごとで各クラスを構成することが好ましい。
It is also possible to select sample g as the third nucleus here. If sample g is used as the third nucleus, its class will consist of b, e, and g, and the fourth class will consist of the remaining d, f, and i. Such a difference in the constituent samples occurs depending on which of the two samples with the largest inter-sample distance is used as the core to determine the constituent samples first, but in applying the present invention, each sample It is preferable to configure each class so that the sum of the distances between them is small, that is, each class is composed of adjacent samples.

以上本発明による複数辞書作成は、第5図にそ
の概要を示すように入力文字をビデオ信号に変換
する観測部からの信号により、その特徴を抽出す
る特徴抽出部と、該特徴から各サンプル間の距離
を前述の手段により算出する距離マトリツクス生
成部と、各々の辞書の核を検出する検出部と、該
核となるサンプルから各々の辞書を構成するサン
プルを検出する構成サンプル検出部と、、前記核
となるサンプルに関する距離マトリツクスにマス
クをかけるマスクド距離マトリツクス生成部と、
各々のクラスに分類された構成サンプルの特徴の
平均からの複数の辞書を作成する辞書作成部を具
備して成る複数辞書作成装置により行なわれる。
As described above, the creation of multiple dictionaries according to the present invention consists of a feature extraction section that extracts the characteristics of input characters based on a signal from an observation section that converts input characters into a video signal, and an interval between each sample based on the characteristics. a distance matrix generation unit that calculates the distance of each dictionary by the above-mentioned means; a detection unit that detects the core of each dictionary; and a constituent sample detection unit that detects the samples that constitute each dictionary from the core sample. a masked distance matrix generation unit that masks the distance matrix regarding the core sample;
This is performed by a multiple dictionary creation device comprising a dictionary creation unit that creates a plurality of dictionaries from the average of the features of constituent samples classified into each class.

以下第6図を参照して各部の基本的動作原理に
ついて説明をする。
The basic operating principle of each part will be explained below with reference to FIG.

図中1は距離マトリツクス、2はセレクタ部、
3は第1検出部、4は第2検出部、5は第1レジ
スタ、6は構成サンプル検出部、7はマスクド距
離マトリツクス生成部、8はマスクド距離マトリ
ツクス、9は第2レジスタをそれぞれ表わしてい
る。又、CL1〜CL3はそれぞれクロツク信号の
入力を示すものである。
In the figure, 1 is the distance matrix, 2 is the selector section,
3 represents a first detection unit, 4 represents a second detection unit, 5 represents a first register, 6 represents a configuration sample detection unit, 7 represents a masked distance matrix generation unit, 8 represents a masked distance matrix, and 9 represents a second register. There is. Further, CL1 to CL3 each indicate the input of a clock signal.

前述の如く観測部でビデオ信号に変換された入
力文字の特徴を特徴抽出部において抽出し、距離
マトリツクス1を形成する。該工程は、従来の単
数辞書作成装置においても行なわれていたもので
あり、その手段は特に問わない。
As described above, the features of the input characters converted into video signals by the observation unit are extracted by the feature extraction unit to form a distance matrix 1. This step has been carried out in conventional singular dictionary creation devices, and the method used is not particularly limited.

次いで、セレクタ部2では作成する辞書が第1
番目のそれである場合には前記距離マトリツクス
1からの信号を、第2番目以降の場合にはマスク
ド距離マトリツクス8からの信号を選出する。こ
こで、該選出を行なわせる手段としては、上記セ
レクタ部2に現在何番目の辞書を作成しているか
を確認するカウンタkを内蔵若しくは接続すれば
良い。
Next, the selector unit 2 selects the first dictionary to be created.
If it is the second one, the signal from the distance matrix 1 is selected, and if it is the second one or more, the signal from the masked distance matrix 8 is selected. Here, as a means for making the selection, a counter k for checking the number of the dictionary currently being created may be built into or connected to the selector section 2.

第1検出部3では作成する辞書が奇数番目のそ
れである(カウンタkの値が奇数)場合、即ち2
回の入力のうち1回のみクロツク2(CL2以下
同様とする)で動作し、距離マトリツクス1若し
くはマスクド距離マトリツクス8内の最大サンプ
ル間距離を求め核となるサンプルS1,S2の番号を
検出する。例えば第6図に示す例ではc―f間の
距離が56で最大となるため辞書作成の核としてサ
ンプルcとfを検出する。
In the first detection unit 3, if the dictionary to be created is an odd numbered dictionary (the value of the counter k is an odd number), that is, 2
It operates at clock 2 (the same applies for C L 2 and below) only once among the input times, and calculates the maximum inter-sample distance in distance matrix 1 or masked distance matrix 8, and calculates the numbers of core samples S 1 and S 2 . Detect. For example, in the example shown in FIG. 6, the distance between c and f is maximum at 56, so samples c and f are detected as the core for dictionary creation.

第1検出部での検出が終了するとCL3はONに
なり第1検出部からの信号を第2検出部でとり込
み、核となるサンプルと他のサンプルとの距離を
第1レジスタ5へ転送する。ここではサンプルc
と他のサンプルとの距離を第1レジスタ5へ転送
している。
When the detection at the first detection section is completed, C L 3 is turned ON, the signal from the first detection section is taken in by the second detection section, and the distance between the core sample and other samples is stored in the first register 5. Forward. Here sample c
The distance between the sample and the other sample is transferred to the first register 5.

構成サンプル検出部6は、前記第1レジスタ5
のデータのうち第1番目から第{K−N+(n1
K)}番目の辞書作成においてはn1(=|N/K
|)個のサンプルを(k=1〜{K−N+(n1
K)}の場合)、第{K−N+(n1*K)+1}番目
から第K番目の辞書作成においては(n1+1)個
のサンプルをそれぞれ距離の小さいものから検出
する。
The configuration sample detection unit 6 includes the first register 5
The first to {K-N+(n 1 *
K)}-th dictionary creation, n 1 (=|N/K
|) samples (k=1~{K-N+(n 1 *
In the case of {K-N+(n 1 *K)+1}-th to K-th dictionary creation, (n 1 +1) samples are detected from the one with the smallest distance.

ここでは、N=7,K=3としており、又k=
1の場合であるためn1=|7/3|=2で、小さ
いものから2個サンプルを検出する。検出された
サンプルはbとcである。
Here, N=7, K=3, and k=
Since this is the case of 1, n 1 =|7/3|=2, and two samples from the smallest one are detected. The detected samples are b and c.

この結果は第2レジスタ9へ転送され、保持さ
れる。
This result is transferred to the second register 9 and held there.

マスクド距離マトリツクス生成部7は先に検出
したサンプルに関する距離マトリツクスに対して
Oのマスクをかける。即ち、同じサンプルを重複
して作成する辞書の構成サンプルとしないためで
ある。
The masked distance matrix generation unit 7 applies a mask of O to the distance matrix regarding the previously detected sample. That is, this is to prevent the same sample from being used as a constituent sample of a dictionary that is created repeatedly.

該マスクド距離マトリツクス8のデータは前記
セレクタ部2へと転送される。
The data of the masked distance matrix 8 is transferred to the selector section 2.

その後、第2レジスタ9のデータは辞書生成部
(図示せず)へ送られその内容に従つて辞書を作
成する。
Thereafter, the data in the second register 9 is sent to a dictionary generation section (not shown) to create a dictionary according to its contents.

以上実施例により明確となつたように本発明に
よれば適切な複数辞書作成を単純に、短時間で行
なうことが可能である。
As has become clear from the above embodiments, according to the present invention, it is possible to create appropriate multiple dictionaries simply and in a short time.

又、上記実施例に於いては第1番目から第{K
−N+(n1*K)}番目の辞書についてはn1個の構
成サンプルを、第{K−N+(n1*K)}番目から
第K番目の辞書については(n1+1)個の構成サ
ンプルを選出していたが、本発明の適用はこれに
限るものではない。
Further, in the above embodiment, from the first to the {K
−N+(n 1 *K)}th dictionary, use n 1 configuration samples, and for {K−N+(n 1 *K)}th to Kth dictionaries, use (n 1 +1) samples. Although a configuration sample was selected, the application of the present invention is not limited to this.

即ち、第1番目から第{N−(n1*K)}番目の
辞書については(n1+1)個の、第{N−(n1
K)+1}番目から第K番目の辞書についてはn1
個の構成サンプルを選出する等、任意の{N−
(n1*K)}個の辞書において(n1+1)個の構成
サンプルを選出することが可能である。
That is, for the first to {N-(n 1 *K)}-th dictionaries, there are (n 1 +1) {N-(n 1 *K)}-th dictionaries.
n 1 for the Kth dictionary from
For example, select {N−
It is possible to select (n 1 +1) constituent samples in (n 1 *K)} dictionaries.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は従来の単数辞書作成におけるクラス分
けを、第2図乃至第4図は本発明の複数辞書作成
におけるクラス分けをそれぞれ示している。又、
第5図は、本発発明による辞書作成方式の主たる
構成を、第6図はその詳細をそれぞれ示してい
る。 図中1は距離マトリツクス、2はセレクタ部、
3は第1検出部、4は第2検出部、5は第1レジ
スタ、6は構成サンプル検出部、7はマスクド距
離マトリツクス生成部、8はマスクド距離マトリ
ツクス、9は第2レジスタである。
FIG. 1 shows the classification in the conventional creation of a single dictionary, and FIGS. 2 to 4 show the classification in the creation of a plurality of dictionaries according to the present invention. or,
FIG. 5 shows the main structure of the dictionary creation method according to the present invention, and FIG. 6 shows its details. In the figure, 1 is the distance matrix, 2 is the selector section,
3 is a first detection section, 4 is a second detection section, 5 is a first register, 6 is a configuration sample detection section, 7 is a masked distance matrix generation section, 8 is a masked distance matrix, and 9 is a second register.

Claims (1)

【特許請求の範囲】 1 文字認識装置の複数辞書作成工程において、
N個の辞書作成用文字サンプル各々の入力ビデオ
から該文字の特徴を抽出する特徴抽出部と、該特
徴から各サンプル間の距離を算出する距離マトリ
ツクス生成部と、作成する辞書の番号により距離
マトリツクスからの信号を選択するセレクタ部
と、該センクタ部からの信号により最大の距離を
隔てるサンプルSを選び該サンプルSと他のサン
プルとの距離を選出する検出部と、該検出部から
の信号のうち前記サンプル間の距離の小さなもの
から特定数のサンプルを検出す構成サンプル検出
部と、該構成サンプル検出部の出力から該構成サ
ンプルの特徴の平均を求め辞書を生成する辞書生
成部と、前記セレクタ部からの信号のうちサンプ
ルSに関するものに対しマスクをかけマスクド距
離マトリツクスを生成し前記セレクタ部へ転送す
るマスクド距離マトリツクス生成部とを具備して
成ることを特徴とする複数辞書作成装置。 2 K個の複数辞書を作成するに際し前記構成サ
ンプル検出部において第1番目から第{K−N+
(n1*K)}番目の辞書についてはn1(=|N/K
|)個の構成サンプルを、第{K−N+(n1*K)
+1}番目から第K番目の辞書については(n1
1)個の構成サンプルをそれぞれ選出することを
特徴とする特許請求の範囲第1項記載の複数辞書
作成装置。
[Claims] 1. In the step of creating multiple dictionaries of a character recognition device,
A feature extraction unit that extracts the characteristics of each of the N dictionary creation character samples from the input video; a distance matrix generation unit that calculates the distance between each sample from the features; and a distance matrix generation unit that calculates the distance between each sample based on the number of the dictionary to be created. a selector section that selects a signal from the sensor section, a detection section that selects a sample S separated by the maximum distance from the signal from the sensor section and a distance between the sample S and other samples, and a detection section that selects a signal from the sensor section. a constituent sample detection unit that detects a specific number of samples starting from those having a small distance between the samples; a dictionary generation unit that generates a dictionary by calculating the average of the features of the constituent samples from the output of the constituent sample detection unit; 1. A plurality of dictionary creation device comprising: a masked distance matrix generation unit that masks signals related to sample S among signals from a selector unit to generate a masked distance matrix and transfers the masked distance matrix to the selector unit. 2. When creating K multiple dictionaries, the configuration sample detection unit selects the first to {K-N+
(n 1 *K)}th dictionary is n 1 (=|N/K
|) configuration samples as {K−N+(n 1 *K)
+1}th to Kth dictionaries are (n 1 +
1) A plurality of dictionary creation device according to claim 1, wherein each of the configuration samples is selected.
JP56047069A 1981-03-30 1981-03-30 Forming device for a plurality of dictionaries Granted JPS57161987A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56047069A JPS57161987A (en) 1981-03-30 1981-03-30 Forming device for a plurality of dictionaries

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56047069A JPS57161987A (en) 1981-03-30 1981-03-30 Forming device for a plurality of dictionaries

Publications (2)

Publication Number Publication Date
JPS57161987A JPS57161987A (en) 1982-10-05
JPH0221032B2 true JPH0221032B2 (en) 1990-05-11

Family

ID=12764868

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56047069A Granted JPS57161987A (en) 1981-03-30 1981-03-30 Forming device for a plurality of dictionaries

Country Status (1)

Country Link
JP (1) JPS57161987A (en)

Also Published As

Publication number Publication date
JPS57161987A (en) 1982-10-05

Similar Documents

Publication Publication Date Title
Methani et al. Plotqa: Reasoning over scientific plots
Feyerabend On the" meaning" of scientific terms
CN105046279B (en) A kind of analog circuit fault method for classifying modes
CN109508717A (en) A kind of licence plate recognition method, identification device, identification equipment and readable storage medium storing program for executing
CN110084124A (en) Feature based on feature pyramid network enhances object detection method
CN110532859A (en) Remote Sensing Target detection method based on depth evolution beta pruning convolution net
US4977603A (en) Method and apparatus for a pattern recognition
US5519811A (en) Neural network, processor, and pattern recognition apparatus
CN109858486B (en) Deep learning-based data center cloud target identification method
EP0328861A3 (en) A parallel, multi-unit, adaptive pattern classification system using inter-unit correlations and an intra-unit class separator methodology
CN110245754A (en) A kind of knowledge distillating method based on position sensing figure
CN110287806A (en) A kind of traffic sign recognition method based on improvement SSD network
CN108229300A (en) Video classification methods, device, computer readable storage medium and electronic equipment
CN109766429A (en) A kind of sentence retrieval method and device
CN111966812A (en) Automatic question answering method based on dynamic word vector and storage medium
CN109284700A (en) The method of multiple Face datections, storage medium, equipment and system in image
CN116740344A (en) Knowledge distillation-based lightweight remote sensing image semantic segmentation method and device
CN106156846A (en) The treating method and apparatus of convolutional neural networks feature
CN110210371A (en) A kind of aerial hand-written inertia sensing signal creating method based on depth confrontation study
Shet et al. Use of neural networks in automatic caricature generation: an approach based on drawing style capture
JPH0221032B2 (en)
KR20100084538A (en) Data processing device
CN109472289A (en) Critical point detection method and apparatus
CN110458203A (en) A kind of advertising image material detection method
Erlandson et al. Word-level recognition of multifont Arabic text using a feature vector matching approach