JP2000293725A - 投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体 - Google Patents
投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体Info
- Publication number
- JP2000293725A JP2000293725A JP10268499A JP10268499A JP2000293725A JP 2000293725 A JP2000293725 A JP 2000293725A JP 10268499 A JP10268499 A JP 10268499A JP 10268499 A JP10268499 A JP 10268499A JP 2000293725 A JP2000293725 A JP 2000293725A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- voting
- character
- character string
- counting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 34
- 238000004088 simulation Methods 0.000 claims description 40
- 230000002194 synthesizing effect Effects 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000007599 discharging Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 239000002131 composite material Substances 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 239000004575 stone Substances 0.000 description 4
- 239000011435 rock Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 235000017399 Caesalpinia tinctoria Nutrition 0.000 description 1
- 241000388430 Tara Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Landscapes
- Time Recorders, Dirve Recorders, Access Control (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
もに、誤分類率を0に近くすることのできる投票用紙計
数仕分け装置および投票用紙計数仕分け装置のプリセッ
ト装置およびその方法並びに投票用紙計数仕分け装置の
プリセットプログラムを記録した媒体を提供する。 【構成】候補者名の記名パターン毎にリジェクトフラグ
を設定し、文字認識部54で認識された文字列がリジェ
クトフラグがONに設定されているものであれば当該投
票用紙を無条件でリジェクトし、リジェクトフラグがO
FFに設定されているものであれば知識処理部55と詳
細判定処理部56で文字認識部54よりも精度の高い認
識処理を施す。
Description
選挙等の開票作業時の記名式投票用紙の計数および仕分
けを行う投票用紙計数仕分け装置および投票用紙計数仕
分け装置のプリセット装置およびその方法並びに投票用
紙計数仕分け装置のプリセットプログラムを記録した媒
体に関する。
用紙を1枚1枚読み取って候補者毎或いは政党毎に分類
し、分類された投票用紙をそれぞれ計数することが行わ
れる。これらの作業を人手のみで行う場合には、多くの
集計人を要することになる。
紙の仕分けや計数を効率的に行う投票用紙計数仕分け装
置等が提案されている(特開平10−198762号公
報等)。この投票用紙計数仕分け装置では、投票用紙を
読み取り、読み取りによって得た画像データから文字認
識により候補者名等を識別している。
文字認識処理では、処理に要する時間を長くすることが
できないといった制約がある。これは、文字認識処理に
要する時間が長くなると、装置を使用しても人手による
投票用紙の仕分けより効率が悪くなってしまうからであ
る。そのため、投票用紙計数仕分け装置は、文字認識処
理に要する時間を短くし、効率よく開票作業が行えると
いった目標を達成するようにしなければならない。
定時間内に抑えた場合、当然のことながら文字認識の精
度は低下し、投票用紙を誤分類してしまう可能性があ
る。特に、類似した名前の候補者が存在する場合には、
誤分類の確率は高いものとなってしまう。
紙計数仕分け装置では、処理時間を一定時間内に抑えた
場合には、投票用紙の誤分類率が高いものとなってしま
う。しかし、投票用紙計数仕分け装置の誤分類率は、ほ
ぼ0(理想的には0)である必要がある。
を一定時間内に抑えるとともに、誤分類率を0に近くす
ることのできる投票用紙計数仕分け装置および投票用紙
計数仕分け装置のプリセット装置およびその方法並びに
投票用紙計数仕分け装置のプリセットプログラムを記録
した媒体を提供することを目的とする。
ため、請求項1の発明では、投票用紙に記入された手書
き文字を認識し、該認識した投票用紙を複数のスタッカ
のうち該認識結果に基づいて選択される1つのスタッカ
に排出するとともに、該排出された各スタッカの投票用
紙の枚数を各スタッカ別に計数する投票用紙計数仕分け
装置において、有効票として識別されるべき複数の文字
列を記憶するとともに、該複数の文字列のうち誤認識率
の高い文字列に対して強制排出情報が設定される記憶手
段と、投票用紙に記入された手書き文字を読み取る文字
読取手段と、前記文字読取手段が読み取った手書き文字
を前記記憶手段に設定されている文字列を構成する文字
と比較して認識する第1の認識手段と、前記文字読取手
段が読み取った手書き文字を全ての文字と比較して認識
する第2の認識手段と、前記第1の認識手段によって認
識された文字列が前記強制排出情報が設定されていない
文字列である場合にのみ前記第2の認識手段での認識を
行う制御手段とを具備することを特徴とする。
入された手書き文字を認識し、該認識した投票用紙を複
数のスタッカのうち該認識結果に基づいて選択される1
つのスタッカに排出するとともに、該排出された各スタ
ッカの投票用紙の枚数を各スタッカ別に計数する投票用
紙計数仕分け装置のプリセット装置において、入力され
た候補者名に基づいて各候補者名を表記する全ての文字
列を生成する表記パターン生成手段と、前記表記パター
ン生成手段が生成した文字列のうち誤認識率の高い文字
列を検出する誤認識文字列検出手段と、前記誤認識文字
列検出手段が検出した文字列に対して強制排出情報を設
定する強制排出情報設定手段とを具備することを特徴と
する。
明において、サンプル文字を合成して疑似投票用紙画像
を生成する画像合成手段と、前記画像合成手段が合成し
た疑似投票用紙画像に対して前記投票用紙計数仕分け装
置の認識アルゴリズムにより認識シミュレーションを行
うシミュレート手段とをさらに具備し、前記強制排出情
報設定手段は、前記シミュレート手段による認識シミュ
レーションの結果に基づき誤認識率の高い文字列に対し
て強制排出情報を設定することを特徴とする。
明において、前記誤認識文字列検出手段と前記シミュレ
ート手段は、予め設定された複数のしきい値のそれぞれ
に対して誤認識率の高い文字列を検出し、前記シミュレ
ート手段による認識シミュレーション結果に基づき、前
記複数のしきい値のうち投票用紙の強制排出率が最小の
しきい値と該しきい値に対する強制排出情報を前記投票
用紙計数仕分け装置に設定することを特徴とする。
入された手書き文字を認識し、該認識した投票用紙を複
数のスタッカのうち該認識結果に基づいて選択される1
つのスタッカに排出するとともに、該排出された各スタ
ッカの投票用紙の枚数を各スタッカ別に計数する投票用
紙計数仕分け装置のプリセット方法において、投票対象
となる候補者名に基づいて各候補者名を表記する全ての
文字列を生成するとともに、該生成した文字列とサンプ
ル文字とのマッチング処理により前記文字列から誤認識
率の高い文字列を検出し、該検出した文字列に対して強
制排出情報を設定することを特徴とする。
明において、サンプル文字を合成して疑似投票用紙画像
を生成し、該生成した疑似投票用紙画像に対して前記投
票用紙計数仕分け装置の認識アルゴリズムによる認識シ
ミュレーションを行い、該認識シミュレーションの結果
に基づいて誤認識率の高い文字列に対して強制排出情報
を設定することを特徴とする。
明において、前記誤認識率の高い文字列の検出は、予め
設定された複数のしきい値のそれぞれに基づいて行い、
前記認識シミュレーション結果に基づいて、前記複数の
しきい値のうち投票用紙の強制排出率が最小のしきい値
と該しきい値に対する強制排出情報を前記投票用紙計数
仕分け装置に設定することを特徴とする。
入された手書き文字を認識し、該認識した投票用紙を複
数のスタッカのうち該認識結果に基づいて選択される1
つのスタッカに排出するとともに、該排出された各スタ
ッカの投票用紙の枚数を各スタッカ別に計数する投票用
紙計数仕分け装置のプリセットプログラムを記録した媒
体において、投票対象となる候補者名に基づいて各候補
者名を表記する全ての文字列を生成するとともに、該生
成した文字列とサンプル文字とのマッチング処理により
前記文字列から誤認識率の高い文字列を検出し、該検出
した文字列に対して強制排出情報を設定するプログラム
を記録したことを特徴とする。
明において、サンプル文字を合成して疑似投票用紙画像
を生成し、該生成した疑似投票用紙画像に対して前記投
票用紙計数仕分け装置の認識アルゴリズムによる認識シ
ミュレーションを行い、該認識シミュレーションの結果
に基づいて誤認識率の高い文字列に対して強制排出情報
を設定するプログラムを記録したことを特徴とする。
数仕分け装置および投票用紙計数仕分け装置のプリセッ
ト装置およびその方法並びに投票用紙計数仕分け装置の
プリセットプログラムを記録した媒体の一実施例につい
て添付図面を参照して詳細に説明する。
け装置の構成を示すブロック図である。同図に示すよう
に、投票用紙計数仕分け装置は、制御部1と操作パネル
2、繰出部3、読取部4、認識部5、分類部6、スタッ
カ7を具備して構成される。
3が載置された投票用紙を1枚ずつ繰り出し、読取部4
が投票用紙を読み取り、この読み取りで得た画像データ
を認識部5へ送る。読取部4で読み取られた投票用紙
は、分類部6に送られ、分類部6で認識部5の認識結果
に基づいてスタッカ7のうちのスタッカ71乃至74の
いずれかに分類される。また、各部の動作は制御部1に
よって制御され、ユーザからの指示は操作パネル2から
入力される。なお、ここでは、投票用紙の計数のための
構成は従来のものと同様であるので省略している。
部5は、認識制御部51と画像入力部52、切出処理部
53、文字認識部54、知識処理部55、詳細判定処理
部56、個別文字認識辞書57、知識辞書58、認識パ
ラメータ59を具備して構成される。
各部を制御し、読取部4が読み取った投票用紙の画像デ
ータから候補者名等を出力する。読取部4から渡される
画像データは、画像入力部52が受け、この画像データ
から切出処理部53が記名部分(投票用紙の記名枠の画
像データであり、この領域は投票用紙に合わせて予め設
定されている)を切り出し、その後、図2(a)に示す
ような文字基本セグメントBS_1乃至BS_6を抽出
する。また、抽出した文字基本セグメントBS_1乃至
BS_6を必要に応じて合成して、図2(b)に示すよ
うな文字候補セグメントCS_1乃至CS_7を生成す
る。
トCS_1乃至CS_7に対して個別文字認識処理を施
す。個別文字認識処理は、文字候補セグメントCS_1
乃至CS_7のそれぞれを、個別文字認識辞書57に格
納されている文字のうち知識辞書58で指定されている
文字と比較して、文字として認識する処理である。
いる文字とは、例えば、候補者に「山石もとろう(山石
本郎)」という人物がいる場合には、「山石もとろう」
として識別される表記である「山石本郎」や「やまいし
もとろう」、「山石」、「ヤマイシモトロウ」等(選挙
規約により有効票として認められる範囲内)を構成する
各文字「山、石、本、郎、や、ま、い、し、も、と、
ろ、う、ヤ、マ、イ、シ、モ、ト、ロ、ウ」である。
での個別認識処理結果により認識された文字(文字列)
に対して知識処理を施す。知識処理とは、文字認識部5
4で認識された文字、つまり、投票用紙に記された文字
がどの候補者を表しているかを判定する処理であり知識
辞書58に基づいて行われるものである。
知識辞書58は、表1に示すように候補者(分類名)毎
に読み取り対象文字列を設定し、各読み取り対象文字列
に対してリジェクトフラグと投票用紙の出力先のスタッ
カを設定しているものである。読み取り対象文字列と
は、各候補者毎に有効票として認められる文字列、例え
ば、候補者「山石もとろう」に対しては「やまいしもと
ろう」等の文字列であり、ここで設定されている読み取
り対象文字列に使用されている文字が上述した個別認識
処理で使用される。また、リジェクトフラグは、後述す
る投票用紙の分類の際に該当する投票用紙を強制的にリ
ジェクトさせるか否かを設定しているもので、リジェク
トフラグがONの場合には、指定されたスタッカ(ここ
では、スタッカ4(図1のスタッカ74に該当))に強
制的にリジェクトする。このリジェクトフラグは、基本
的に誤分類が発生する確率の高い読み取り対象文字列、
例えば表1中の「岩木」と「岩本」に対して設定される
が、この設定は後述するプリセット装置により行われる
ので詳細は後述する。また、スタッカの設定は、リジェ
クトフラグがONに設定されている読み取り対象文字列
を除いて候補者毎に該当する投票用紙をいずれのスタッ
カへ出力するかを設定している。
判定処理部56で詳細判定処理が行われる。詳細判定処
理は、文字認識部54で行われる個別認識処理と同様に
文字候補セグメントCS_1乃至CS_7を個別認識辞
書に格納されている文字と比較して文字の認識を行う
が、個別認識処理とは異なり比較する個別認識辞書内の
文字を限定しない。これは、個別認識処理では比較する
文字を限定していたために、例えば「山右」と記述され
ていた文字列を「山石」として認識している場合もある
ため、このような投票用紙を無効票として排するために
行われる。
がONに設定されている読み取り対象文字列が記述され
ている投票用紙(の画像)に対しては行われない。
際には、認識パラメータ59に基づいて判定等が行われ
るが、認識パラメータ59は後述するプリセット装置に
より、リジェクトフラグとともに、ネットワーク若しく
はメモリカードやディスク等の記録媒体を介して設定さ
れるので、ここでの説明は省略する。
ト装置について説明する。図3は、プリセット装置の構
成を示すブロック図である。
は、入力部101と記入パターン作成部102、個別文
字認識結果ファイル103、類似文字列検出部104、
シミュレート部105、ファイル出力部106を具備し
て構成される。
選挙情報の入力を受け付け、記入パターン作成部102
は入力部101から入力された各候補者名の記入パター
ンを作成する。
(b)に示すよう文字DB107に格納されている多数
のサンプル文字(数百人以上の人による手書き文字を電
子化したもの)の全てと、多数(例えば、3000文字
程度)の文字の特徴量を格納した個別文字認識辞書10
8のマッチングを行い、類似する文字を格納したもので
ある。
照し、類似文字列検出部104が記入パターン作成部1
02で作成された全記入パターンから類似文字列を検出
する。
107に格納されているサンプル文字を合成し、これを
投票用紙の読取画像として、投票用紙計数仕分け装置
(図1参照)と同様のシミュレーションを行い、類似文
字列検出部104の検出結果と併せてリジェクトフラグ
や認識パラメータ等を設定し、設定結果をファイル出力
部106からファイル出力する。
動作の概略を説明する。図4は、プリセット装置の動作
の流れの概略を示すフローチャートである。
ず、入力部101から候補者名などの選挙情報を入力す
る(ステップ201)。続いて、記入パターン作成部1
02が入力部101から入力された選挙情報に基づい
て、候補者名の記入パターンを作成する(ステップ20
2)。
た全記入パターンに対して、類似文字列検出部104が
類似文字列の検出を行い、誤認識率が高くなる記入パタ
ーンのリジェクトフラグをONにし(ステップ20
3)、リジェクトフラグがONに設定された記入パター
ンを除く全記入パターンに対して、シミュレート部10
5が認識シミュレーションを行って、誤認識率の高い記
入パターンのリジェクトフラグをONにする(ステップ
204)。
て(ステップ205)、全ての認識パラメータ(認識パ
ラメータに関しては後述する)に対して同様の処理が終
了するまで(ステップ206でNO)、認識パラメータ
を変更して(ステップ207)、処理を繰り返し、全て
の認識パラメータに対して処理が終了すると(ステップ
206でYES)、最適な認識パラメータを選択して
(ステップ208)、ファイル出力部106から設定フ
ァイルを出力して(ステップ209)動作を終了する。
細に説明する。まず、入力部101から入力される選挙
情報について説明する。
2に示すように候補者の届け出名と漢字、よみの3種類
のほか、可能であるならば各候補者の予想得票率を入力
する。
記入パターン作成部102は、入力部101から入力さ
れた選挙情報に基づいて、各候補者の記入パターンを漢
字とひらがな、カタカナを組み合わせて作成する。この
組み合わせは、漢字一文字を単位として処理し、例え
ば、候補者「山石」に対して「山いシ」等のように漢字
の「石」に対してひらがなとカタカナを混在させるよう
にはしない。また、漢字一文字に対して読みが当てはま
らない名前、例えば「設楽(したら)」等は、分割でき
る最小の単位で組み合わせを行う。ただし、選挙の規約
などにより「山いし」のような表記や名字だけの表記が
無効票として規定されている場合には、予めリジェクト
フラグをONにする。
とろう」、「岩木 朗」、「岩本けんじ」の記入パター
ンを示したものであり、そのパターン数は、当然のこと
ながら候補者毎に異なるものとなる。
部101から入力された選挙情報に予想得票率が含まれ
ていた場合には、表3に示すように記入パターン毎に予
想票率を算出する。なお、予想票率は、各記入パターン
中の文字列のそれぞれに対して文字列出現頻度を設定
し、式1から算出する。文字列出現頻度は、経験値によ
り設定するが届け出名や漢字フルネーム(新聞等では漢
字フルネームで表記されることが多い)は、高めに設定
する。
る。類似文字列検出部104は、全記入パターンから類
似の文字列を検出するが、類似の文字列の検出に先立ち
文字間の類似性(誤読率)を調べる。
字認識ファイル103は、文字DB107に格納されて
いるサンプル文字がどのような文字として認識されるか
が複数候補記録されている。例えば、「本」という文字
に対しては、表4に示すように各サンプル1乃至N毎に
一位候補からi位候補までが記録されている。なお、表
4中の距離値とは、文字DB107内のサンプルと個別
文字認識辞書108の文字の特徴量をマッチングさせた
場合の結果(差)を数値化したものである。
した際に、認識パラメータにより決定されるしきい値
(順位)よりも上位の候補中に文字Bが存在する確率で
あり、例えば、「本」を「木」と誤読する「本」→
「木」の誤読率は、サンプル数Nが100で、認識パラ
メータにより決定されるしきい値よりも「木」が上位に
あるサンプルの数が10であるとすれば、10/100
=10%となる。
る。文字DB107内に格納されているサンプル文字の
個別文字認識を行った結果、各サンプル文字に対して認
識すべき文字の候補が決定されるが、その候補の文字か
ら認識すべき文字を決定する必要があるが、この決定
は、単に候補の順位から決定するわけにはいかない。例
えば、一位候補の文字の距離値が180で二位候補の文
字が181であったとすれば、両候補に大差はなく一位
候補の文字として認識するには問題がある。また、一位
候補の文字の距離値が180であるのに対して二位候補
の文字の距離値が350であるとすれば、両者の違いは
明らかでサンプル文字を一位候補の文字として認識して
も問題はない。
に候補順位や距離値のみから決定することはできず、両
者の兼ね合いにより決定する必要がある。
距離値で除した正規化距離値をxとした場合に、しきい
値yを式2により決定する。
(P3,Q3)の3点を通る曲線であり、(Q1,Q
2,Q3)を認識パラメータとする。ここで、(P1,
P2,P3)は固定値とし、例えば(P1,P2,P
3)=(1.0,1.2,1.3)とする。
(a)に示す斜線部分に該当する文字候補が認識される
文字となる。また、認識パラメータを変更すると、図8
(b)に示すように、しきい値は異なるものになる。
めた文字間の誤読率は、例えば表5のようになる。ただ
し、文字A=文字Bの場合は正読率となる(例えば、山
の正読率は100%)。また、表5に示したように
「木」→「本」の誤読率が5%で「本」→「木」の誤読
率が10%といったように「A」→「B」と「B」→
「A」の誤読率は同一になるとは限らない。
文字列間の誤読率を算出する。文字列間の誤読率は、例
えば、「山石もとろう」を「いわきあきら」と誤読する
誤読率Pe(山石もとろう→いわきあきら)を例に説明
すると、 「山」→「い」の誤読率をE1 「石」→「わ」の誤読率をE2 「も」→「き」の誤読率をE3 「と」→「あ」の誤読率をE4 「ろ」→「き」の誤読率をE5 「う」→「ら」の誤読率をE6 として、式3により算出される。
読率Pe(岩本→岩木)を算出すると、「岩」→「岩」
の誤読率(正読率)が1で「本」→「木」の誤読率が
0.1であるからPe(岩本→岩木)=0.1(10
%)となる。
算出した後に式4により全体の誤読率Pを求め、この誤
読率が所定の値以上であった場合には、式5で表される
評価式の評価値ΔSが最小の文字列のリジェクトフラグ
をONにし、この文字列の誤読率を0として再び全体の
誤読率Pを求める。ただし、Pv(α)は文字列αの予
想票率であり、Pc(α→α)は文字列αの正読率(算
出方法は誤読率Peと同じ)、ΔEに乗じているパラメ
ータK(例えば100)は重み係数である。また、ΔR
は、票全体に対する文字列αの予想通過率を示し、ΔE
は票全体に対する文字列αの予想誤読率を示す。
所定の値よりも小さくなるまで繰り返し行う。
の流れを説明する。図9は、類似文字列検出部104の
動作の流れを示すフローチャートであり、 図4のステ
ップ203に対応する処理の流れを示したものである。
ると、まず、文字間の誤読率に基づいて文字列間の誤読
率を算出する(ステップ301、式3参照)。次に、全
体の誤読率を算出し(ステップ302、式4参照)、算
出した誤読率が誤分類しきい値(あらかじめ設定された
値であり、例えば0.001%)以上であれば(ステッ
プ303でNO)、評価値ΔSが最小の文字列(記入パ
ターン)のリジェクトフラグをONに設定し(ステップ
304、式5参照)、リジェクトフラグをONに設定し
た文字列の誤読率を0として算出し(ステップ30
1)、再び全体の誤読率Pを算出して(ステップ30
2)、誤分類しきい値との比較を行う(ステップ30
3)。
Pが誤分類しきい値より小さくなると(ステップ303
でYES)、類似文字列検出部104での処理は終了し
てステップ204の処理に進む。
いて説明する。図10は、シミュレート部105の構成
を示すブロック図である。
は、制御部151と画像合成部152、切出処理部15
3、文字認識部154、知識処理部155、詳細判定処
理部156、個別文字認識辞書167、単語辞書15
8、認識パラメータ159を具備して構成される。な
お、同図中破線で囲んだ部分(符号153乃至159)
は、図1に示した投票用紙計数仕分け装置と同様の構成
である。
合成部152が文字DB107に格納されているサンプ
ル文字を合成して、投票用紙を読み取って得た画像デー
タと同様の模擬データを生成し、この模擬データを利用
して符号153乃至159に示す各部により投票用計数
仕分け装置と同様の処理を行って文字列の誤分類率を求
める。
うのは、類似文字列検出部104の処理では、検出する
ことのできない誤分類の発生しやすい文字列を検出する
ためである。例えば、「山石」(縦書き)と記述された
文字もその大きさや位置によっては「岩」と認識されて
しまうことがある。
いて説明する。画像合成部152は、図11に示すよう
に文字DB107からサンプル文字を取得するとともに
乱数を発生させ、この乱数を使用して取得したサンプル
文字に対して拡大や縮小、回転などの処理を施し、これ
らの貼り付け座標(x1,y2)や(x2,y2)も乱
数によって決定し、合成画像を生成する。
示すように合成画像から文字基本セグメントBS_1乃
至BS_6を抽出する。また、抽出した文字基本セグメ
ントBS_1乃至BS_6を必要に応じて合成し、文字
候補セグメントCS_1乃至CS_7を生成する。
メントCS_1乃至CS_7に対して個別文字認識処理
を施す。個別文字認識処理は、文字候補セグメントCS
_1乃至CS_7のそれぞれを、個別文字認識辞書15
7に格納されている文字のうち知識辞書158で指定さ
れている文字と比較して、文字として認識する処理であ
る。
は、例えば、候補者に「山石もとろう(山石本郎)」と
いう人物がいる場合には、「山石もとろう」として識別
される表記である「山石本郎」や「やまいしもとろ
う」、「山石」、「ヤマイシモトロウ」等(選挙規約に
より有効票として認められる範囲内)を構成する各文字
「山、石、本、郎、や、ま、い、し、も、と、ろ、う、
ヤ、マ、イ、シ、モ、ト、ロ、ウ」である。
54での個別認識処理結果により認識された文字(文字
列)に対して知識処理を施す。知識処理とは、文字認識
部154で認識された文字、つまり、合成画像に記され
た文字がどの文字列を表しているかを判定する処理であ
り知識辞書158に基づいて行われるものである。
うに各文字毎の距離値に基づいて文字列全体の判定値を
算出し、これを知識処理しきい値と比較することで、記
入パターンのうちのいずれの文字列であるかを判定す
る。文字列全体の判定値は、例えば、各文字の距離値の
平均を所定の値から減じることで算出したり、重み付け
などを行う所定の式により行う。この知識処理の結果、
図12(b)に示すように、文字列全体の判定値が知識
処理しきい値以上となった文字列候補に対して、詳細判
定処理部166で詳細判定処理を行う。
れる個別認識処理と同様に文字候補セグメントCS_1
乃至CS_7を個別認識辞書に格納されている文字と比
較して文字の認識を行うが、個別認識処理とは異なり比
較する個別認識辞書内の文字を限定しない。これは、個
別認識処理では比較する文字を限定していたために、例
えば「山右」と記述されていた文字列を「山石」として
認識している場合もあるため、このような投票用紙を無
効票として排するために行われる。
数仕分け装置)と同様にリジェクトフラグONに設定さ
れている文字列に対しては行わない。
実機(投票用紙計数仕分け装置)と同様のシミュレーシ
ョンを行い、そのシミュレーション結果に応じてリジェ
クトフラグの設定を行う。
シミュレート部105の処理の流れを説明する。図13
は、シミュレート部105の処理動作の流れを示すフロ
ーチャートであり、 図4のステップ204に対応する
処理の流れを示したものである。
と、まず、画像合成部152が投票用紙の記名部分の画
像を合成する(ステップ401)。次に、符号153乃
至159で示される各部が合成した画像の認識シミュレ
ーションを行い(ステップ402)、そのシミュレーシ
ョン結果から制御部151が文字列間の誤読率を算出す
る(ステップ403)。続いて、制御部151が式4に
より全体の誤読率を算出し(ステップ404)、算出し
た全体の誤読率が誤分類しきい値(類似文字列検出部1
04が使用したものと同じ値)以上であれば(ステップ
405でNO)、式5に基づいて算出された評価値ΔS
が最小の文字列(記入パターン)のリジェクトフラグを
ONに設定する(ステップ406)。
ラグをONに設定したら、ステップ402に戻り、再び
認識シミュレーションを行い、同様の処理を全体の誤読
率が誤分類しきい値より小さくなるまで繰り返す。
いては、式4の予想得票率Pv(β)をシミュレーショ
ンにおける得票率とし(シミュレーションに使用する画
像の種類(文字列)と数自体が予想得票率に基づいてい
る)、式5の予測認識率Pc(α→α)と予測誤読率P
e(β→α)には、シミュレーション結果の認識率と誤
読率を使用する。
タ部105の処理は、上述したように予め設定されてい
る複数の認識パラメータのそれぞれについて行われ(図
4参照)、最終的に最も通過率の高い(リジェクトされ
ずに分類される)認識パラメータとそのときのリジェク
トフラグの状態をファイル出力部106から出力する。
ファイル出力部106から出力された各設定は、ネット
ワークや記録媒体を介して投票用紙計数仕分け装置(図
1参照)に入力される。
ェクトフラグがONの場合と同じトレイに出力されるよ
うに設定されている候補者に対応した文字列に対しては
行わない。
タ部105を実際の投票用紙計数仕分け装置で代用する
ように構成してもよく、上述の処理を行わせるプログラ
ムによりコンピュータ上で構成するようにしてもよい。
ば、候補者名の記名パターン毎にリジェクトフラグを設
定し、リジェクトフラグがONに設定されている文字列
が記入されている投票用紙を無条件でリジェクトするよ
うに構成したので、精度の高くない高速な画像処理によ
り投票用紙の認識を行っても誤分類率を低く抑えること
ができる。
字の類似性のチェックと認識シミュレーションを行い、
その結果からリジェクトフラグをONにする文字列を決
定するとともに、最適な認識パラメータを決定するよう
に構成したため、選挙毎に最適な設定で仕分け作業を行
うことができる。
を示すブロック図。
した図。
ーチャート。
図。
ローチャート。
図。
すフローチャート。
Claims (9)
- 【請求項1】 投票用紙に記入された手書き文字を認識
し、該認識した投票用紙を複数のスタッカのうち該認識
結果に基づいて選択される1つのスタッカに排出すると
ともに、該排出された各スタッカの投票用紙の枚数を各
スタッカ別に計数する投票用紙計数仕分け装置におい
て、 有効票として識別されるべき複数の文字列を記憶すると
ともに、該複数の文字列のうち誤認識率の高い文字列に
対して強制排出情報が設定される記憶手段と、 投票用紙に記入された手書き文字を読み取る文字読取手
段と、 前記文字読取手段が読み取った手書き文字を前記記憶手
段に設定されている文字列を構成する文字と比較して認
識する第1の認識手段と、 前記文字読取手段が読み取った手書き文字を全ての文字
と比較して認識する第2の認識手段と、 前記第1の認識手段によって認識された文字列が前記強
制排出情報が設定されていない文字列である場合にのみ
前記第2の認識手段での認識を行う制御手段とを具備す
ることを特徴とする投票用紙計数仕分け装置。 - 【請求項2】 投票用紙に記入された手書き文字を認識
し、該認識した投票用紙を複数のスタッカのうち該認識
結果に基づいて選択される1つのスタッカに排出すると
ともに、該排出された各スタッカの投票用紙の枚数を各
スタッカ別に計数する投票用紙計数仕分け装置のプリセ
ット装置において、 入力された候補者名に基づいて各候補者名を表記する全
ての文字列を生成する表記パターン生成手段と、 前記表記パターン生成手段が生成した文字列のうち誤認
識率の高い文字列を検出する誤認識文字列検出手段と、 前記誤認識文字列検出手段が検出した文字列に対して強
制排出情報を設定する強制排出情報設定手段とを具備す
ることを特徴とする投票用紙計数仕分け装置のプリセッ
ト装置。 - 【請求項3】 サンプル文字を合成して疑似投票用紙画
像を生成する画像合成手段と、 前記画像合成手段が合成した疑似投票用紙画像に対して
前記投票用紙計数仕分け装置の認識アルゴリズムにより
認識シミュレーションを行うシミュレート手段とをさら
に具備し、 前記強制排出情報設定手段は、 前記シミュレート手段による認識シミュレーションの結
果に基づき誤認識率の高い文字列に対して強制排出情報
を設定することを特徴とする請求項2記載の投票用紙計
数仕分け装置のプリセット装置。 - 【請求項4】 前記誤認識文字列検出手段と前記シミュ
レート手段は、 予め設定された複数のしきい値のそれぞれに対して誤認
識率の高い文字列を検出し、 前記シミュレート手段による認識シミュレーション結果
に基づき、前記複数のしきい値のうち投票用紙の強制排
出率が最小のしきい値と該しきい値に対する強制排出情
報を前記投票用紙計数仕分け装置に設定することを特徴
とする請求項3記載の投票用紙計数仕分け装置のプリセ
ット装置。 - 【請求項5】 投票用紙に記入された手書き文字を認識
し、該認識した投票用紙を複数のスタッカのうち該認識
結果に基づいて選択される1つのスタッカに排出すると
ともに、該排出された各スタッカの投票用紙の枚数を各
スタッカ別に計数する投票用紙計数仕分け装置のプリセ
ット方法において、 投票対象となる候補者名に基づいて各候補者名を表記す
る全ての文字列を生成するとともに、該生成した文字列
とサンプル文字とのマッチング処理により前記文字列か
ら誤認識率の高い文字列を検出し、該検出した文字列に
対して強制排出情報を設定することを特徴とする投票用
紙計数仕分け装置のプリセット方法。 - 【請求項6】 サンプル文字を合成して疑似投票用紙画
像を生成し、 該生成した疑似投票用紙画像に対して前記投票用紙計数
仕分け装置の認識アルゴリズムによる認識シミュレーシ
ョンを行い、 該認識シミュレーションの結果に基づいて誤認識率の高
い文字列に対して強制排出情報を設定することを特徴と
する請求項5記載の投票用紙計数仕分け装置のプリセッ
ト方法。 - 【請求項7】 前記誤認識率の高い文字列の検出は、 予め設定された複数のしきい値のそれぞれに基づいて行
い、 前記認識シミュレーション結果に基づいて、前記複数の
しきい値のうち投票用紙の強制排出率が最小のしきい値
と該しきい値に対する強制排出情報を前記投票用紙計数
仕分け装置に設定することを特徴とする請求項6記載の
投票用紙計数仕分け装置のプリセット方法。 - 【請求項8】 投票用紙に記入された手書き文字を認識
し、該認識した投票用紙を複数のスタッカのうち該認識
結果に基づいて選択される1つのスタッカに排出すると
ともに、該排出された各スタッカの投票用紙の枚数を各
スタッカ別に計数する投票用紙計数仕分け装置のプリセ
ットプログラムを記録した媒体において、 投票対象となる候補者名に基づいて各候補者名を表記す
る全ての文字列を生成するとともに、該生成した文字列
とサンプル文字とのマッチング処理により前記文字列か
ら誤認識率の高い文字列を検出し、該検出した文字列に
対して強制排出情報を設定するプログラムを記録したこ
とを特徴とする投票用紙計数仕分け装置のプリセットプ
ログラムを記録した媒体。 - 【請求項9】 サンプル文字を合成して疑似投票用紙画
像を生成し、 該生成した疑似投票用紙画像に対して前記投票用紙計数
仕分け装置の認識アルゴリズムによる認識シミュレーシ
ョンを行い、 該認識シミュレーションの結果に基づいて誤認識率の高
い文字列に対して強制排出情報を設定するプログラムを
記録したことを特徴とする請求項8記載の投票用紙計数
仕分け装置のプリセットプログラムを記録した媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10268499A JP3788703B2 (ja) | 1999-04-09 | 1999-04-09 | 投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10268499A JP3788703B2 (ja) | 1999-04-09 | 1999-04-09 | 投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000293725A true JP2000293725A (ja) | 2000-10-20 |
JP3788703B2 JP3788703B2 (ja) | 2006-06-21 |
Family
ID=14334074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10268499A Expired - Fee Related JP3788703B2 (ja) | 1999-04-09 | 1999-04-09 | 投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3788703B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011165099A (ja) * | 2010-02-12 | 2011-08-25 | Oki Electric Industry Co Ltd | 帳票処理システム |
-
1999
- 1999-04-09 JP JP10268499A patent/JP3788703B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011165099A (ja) * | 2010-02-12 | 2011-08-25 | Oki Electric Industry Co Ltd | 帳票処理システム |
Also Published As
Publication number | Publication date |
---|---|
JP3788703B2 (ja) | 2006-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5917941A (en) | Character segmentation technique with integrated word search for handwriting recognition | |
Palacios et al. | A system for processing handwritten bank checks automatically | |
JPS60189082A (ja) | 金融書類上の金額位置検出装置及び検出方法 | |
IE56452B1 (en) | Image processors | |
Fazilov et al. | State of the art of writer identification | |
CN103914680A (zh) | 一种喷印字符图像识别与校验系统及方法 | |
US7480403B2 (en) | Apparatus, system, and method for fraud detection using multiple scan technologies | |
JP3078318B2 (ja) | 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置 | |
Sako et al. | Form reading based on form-type identification and form-data recognition | |
US8340428B2 (en) | Unsupervised writer style adaptation for handwritten word spotting | |
JP3788703B2 (ja) | 投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体 | |
JPH0957204A (ja) | 郵便物の宛先自動読取システム | |
JPH07160822A (ja) | パターン認識方法 | |
Madhvanath et al. | Reading handwritten US census forms | |
JPS592191A (ja) | 手書き日本語文の認識処理方式 | |
JP3162552B2 (ja) | 郵便物あて名認識装置及びあて名認識方法 | |
JP3243000B2 (ja) | 郵便物処理装置および郵便物処理方法 | |
JP3160347B2 (ja) | 郵便物の宛名読取装置 | |
JPH09114926A (ja) | オンライン文字認識における入力文字大分類方法および装置 | |
JP2011125860A (ja) | 宛先認識装置 | |
JP3105918B2 (ja) | 文字認識装置、および文字認識方法 | |
JPH10198762A (ja) | ニューロによるパターン認識/限定文字列認識システム及び文字パターン分類装置 | |
Palacios Hielscher et al. | Automatic Processing of Brazilian Bank Checks | |
Fujisawa | How to deal with uncertainty and variability: experience and solutions | |
Allgrove et al. | Optimisation issues in dynamic and static signature verification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060322 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060323 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3788703 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090407 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100407 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100407 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110407 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120407 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120407 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130407 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130407 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140407 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140407 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |