JP2000293725A - 投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体 - Google Patents

投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体

Info

Publication number
JP2000293725A
JP2000293725A JP10268499A JP10268499A JP2000293725A JP 2000293725 A JP2000293725 A JP 2000293725A JP 10268499 A JP10268499 A JP 10268499A JP 10268499 A JP10268499 A JP 10268499A JP 2000293725 A JP2000293725 A JP 2000293725A
Authority
JP
Japan
Prior art keywords
recognition
voting
character
character string
counting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10268499A
Other languages
English (en)
Other versions
JP3788703B2 (ja
Inventor
Masatoshi Onishi
昌利 大西
Masanori Yokota
政憲 横田
Hiroshi Kameyama
博史 亀山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP10268499A priority Critical patent/JP3788703B2/ja
Publication of JP2000293725A publication Critical patent/JP2000293725A/ja
Application granted granted Critical
Publication of JP3788703B2 publication Critical patent/JP3788703B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Time Recorders, Dirve Recorders, Access Control (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【目的】仕分け等の処理時間を一定時間内に抑えるとと
もに、誤分類率を0に近くすることのできる投票用紙計
数仕分け装置および投票用紙計数仕分け装置のプリセッ
ト装置およびその方法並びに投票用紙計数仕分け装置の
プリセットプログラムを記録した媒体を提供する。 【構成】候補者名の記名パターン毎にリジェクトフラグ
を設定し、文字認識部54で認識された文字列がリジェ
クトフラグがONに設定されているものであれば当該投
票用紙を無条件でリジェクトし、リジェクトフラグがO
FFに設定されているものであれば知識処理部55と詳
細判定処理部56で文字認識部54よりも精度の高い認
識処理を施す。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、国政選挙や地方
選挙等の開票作業時の記名式投票用紙の計数および仕分
けを行う投票用紙計数仕分け装置および投票用紙計数仕
分け装置のプリセット装置およびその方法並びに投票用
紙計数仕分け装置のプリセットプログラムを記録した媒
体に関する。
【0002】
【従来の技術】記名式選挙における開票作業では、投票
用紙を1枚1枚読み取って候補者毎或いは政党毎に分類
し、分類された投票用紙をそれぞれ計数することが行わ
れる。これらの作業を人手のみで行う場合には、多くの
集計人を要することになる。
【0003】このため、最近では、開票作業時の投票用
紙の仕分けや計数を効率的に行う投票用紙計数仕分け装
置等が提案されている(特開平10−198762号公
報等)。この投票用紙計数仕分け装置では、投票用紙を
読み取り、読み取りによって得た画像データから文字認
識により候補者名等を識別している。
【0004】ところで、投票用紙の仕分けを行うための
文字認識処理では、処理に要する時間を長くすることが
できないといった制約がある。これは、文字認識処理に
要する時間が長くなると、装置を使用しても人手による
投票用紙の仕分けより効率が悪くなってしまうからであ
る。そのため、投票用紙計数仕分け装置は、文字認識処
理に要する時間を短くし、効率よく開票作業が行えると
いった目標を達成するようにしなければならない。
【0005】このように文字認識処理に要する時間を一
定時間内に抑えた場合、当然のことながら文字認識の精
度は低下し、投票用紙を誤分類してしまう可能性があ
る。特に、類似した名前の候補者が存在する場合には、
誤分類の確率は高いものとなってしまう。
【0006】
【発明が解決しようとする課題】上述のように、投票用
紙計数仕分け装置では、処理時間を一定時間内に抑えた
場合には、投票用紙の誤分類率が高いものとなってしま
う。しかし、投票用紙計数仕分け装置の誤分類率は、ほ
ぼ0(理想的には0)である必要がある。
【0007】そこで、この発明は、仕分け等の処理時間
を一定時間内に抑えるとともに、誤分類率を0に近くす
ることのできる投票用紙計数仕分け装置および投票用紙
計数仕分け装置のプリセット装置およびその方法並びに
投票用紙計数仕分け装置のプリセットプログラムを記録
した媒体を提供することを目的とする。
【0008】
【課題を解決するための手段】上述した目的を達成する
ため、請求項1の発明では、投票用紙に記入された手書
き文字を認識し、該認識した投票用紙を複数のスタッカ
のうち該認識結果に基づいて選択される1つのスタッカ
に排出するとともに、該排出された各スタッカの投票用
紙の枚数を各スタッカ別に計数する投票用紙計数仕分け
装置において、有効票として識別されるべき複数の文字
列を記憶するとともに、該複数の文字列のうち誤認識率
の高い文字列に対して強制排出情報が設定される記憶手
段と、投票用紙に記入された手書き文字を読み取る文字
読取手段と、前記文字読取手段が読み取った手書き文字
を前記記憶手段に設定されている文字列を構成する文字
と比較して認識する第1の認識手段と、前記文字読取手
段が読み取った手書き文字を全ての文字と比較して認識
する第2の認識手段と、前記第1の認識手段によって認
識された文字列が前記強制排出情報が設定されていない
文字列である場合にのみ前記第2の認識手段での認識を
行う制御手段とを具備することを特徴とする。
【0009】また、請求項2の発明では、投票用紙に記
入された手書き文字を認識し、該認識した投票用紙を複
数のスタッカのうち該認識結果に基づいて選択される1
つのスタッカに排出するとともに、該排出された各スタ
ッカの投票用紙の枚数を各スタッカ別に計数する投票用
紙計数仕分け装置のプリセット装置において、入力され
た候補者名に基づいて各候補者名を表記する全ての文字
列を生成する表記パターン生成手段と、前記表記パター
ン生成手段が生成した文字列のうち誤認識率の高い文字
列を検出する誤認識文字列検出手段と、前記誤認識文字
列検出手段が検出した文字列に対して強制排出情報を設
定する強制排出情報設定手段とを具備することを特徴と
する。
【0010】また、請求項3の発明では、請求項2の発
明において、サンプル文字を合成して疑似投票用紙画像
を生成する画像合成手段と、前記画像合成手段が合成し
た疑似投票用紙画像に対して前記投票用紙計数仕分け装
置の認識アルゴリズムにより認識シミュレーションを行
うシミュレート手段とをさらに具備し、前記強制排出情
報設定手段は、前記シミュレート手段による認識シミュ
レーションの結果に基づき誤認識率の高い文字列に対し
て強制排出情報を設定することを特徴とする。
【0011】また、請求項4の発明では、請求項3の発
明において、前記誤認識文字列検出手段と前記シミュレ
ート手段は、予め設定された複数のしきい値のそれぞれ
に対して誤認識率の高い文字列を検出し、前記シミュレ
ート手段による認識シミュレーション結果に基づき、前
記複数のしきい値のうち投票用紙の強制排出率が最小の
しきい値と該しきい値に対する強制排出情報を前記投票
用紙計数仕分け装置に設定することを特徴とする。
【0012】また、請求項5の発明では、投票用紙に記
入された手書き文字を認識し、該認識した投票用紙を複
数のスタッカのうち該認識結果に基づいて選択される1
つのスタッカに排出するとともに、該排出された各スタ
ッカの投票用紙の枚数を各スタッカ別に計数する投票用
紙計数仕分け装置のプリセット方法において、投票対象
となる候補者名に基づいて各候補者名を表記する全ての
文字列を生成するとともに、該生成した文字列とサンプ
ル文字とのマッチング処理により前記文字列から誤認識
率の高い文字列を検出し、該検出した文字列に対して強
制排出情報を設定することを特徴とする。
【0013】また、請求項6の発明では、請求項5の発
明において、サンプル文字を合成して疑似投票用紙画像
を生成し、該生成した疑似投票用紙画像に対して前記投
票用紙計数仕分け装置の認識アルゴリズムによる認識シ
ミュレーションを行い、該認識シミュレーションの結果
に基づいて誤認識率の高い文字列に対して強制排出情報
を設定することを特徴とする。
【0014】また、請求項7の発明では、請求項6の発
明において、前記誤認識率の高い文字列の検出は、予め
設定された複数のしきい値のそれぞれに基づいて行い、
前記認識シミュレーション結果に基づいて、前記複数の
しきい値のうち投票用紙の強制排出率が最小のしきい値
と該しきい値に対する強制排出情報を前記投票用紙計数
仕分け装置に設定することを特徴とする。
【0015】また、請求項8の発明では、投票用紙に記
入された手書き文字を認識し、該認識した投票用紙を複
数のスタッカのうち該認識結果に基づいて選択される1
つのスタッカに排出するとともに、該排出された各スタ
ッカの投票用紙の枚数を各スタッカ別に計数する投票用
紙計数仕分け装置のプリセットプログラムを記録した媒
体において、投票対象となる候補者名に基づいて各候補
者名を表記する全ての文字列を生成するとともに、該生
成した文字列とサンプル文字とのマッチング処理により
前記文字列から誤認識率の高い文字列を検出し、該検出
した文字列に対して強制排出情報を設定するプログラム
を記録したことを特徴とする。
【0016】また、請求項9の発明では、請求項8の発
明において、サンプル文字を合成して疑似投票用紙画像
を生成し、該生成した疑似投票用紙画像に対して前記投
票用紙計数仕分け装置の認識アルゴリズムによる認識シ
ミュレーションを行い、該認識シミュレーションの結果
に基づいて誤認識率の高い文字列に対して強制排出情報
を設定するプログラムを記録したことを特徴とする。
【0017】
【発明の実施の形態】以下、この発明に係る投票用紙計
数仕分け装置および投票用紙計数仕分け装置のプリセッ
ト装置およびその方法並びに投票用紙計数仕分け装置の
プリセットプログラムを記録した媒体の一実施例につい
て添付図面を参照して詳細に説明する。
【0018】図1は、この発明に係る投票用紙計数仕分
け装置の構成を示すブロック図である。同図に示すよう
に、投票用紙計数仕分け装置は、制御部1と操作パネル
2、繰出部3、読取部4、認識部5、分類部6、スタッ
カ7を具備して構成される。
【0019】この投票用紙計数仕分け装置では、繰出部
3が載置された投票用紙を1枚ずつ繰り出し、読取部4
が投票用紙を読み取り、この読み取りで得た画像データ
を認識部5へ送る。読取部4で読み取られた投票用紙
は、分類部6に送られ、分類部6で認識部5の認識結果
に基づいてスタッカ7のうちのスタッカ71乃至74の
いずれかに分類される。また、各部の動作は制御部1に
よって制御され、ユーザからの指示は操作パネル2から
入力される。なお、ここでは、投票用紙の計数のための
構成は従来のものと同様であるので省略している。
【0020】ここで、認識部5について説明する。認識
部5は、認識制御部51と画像入力部52、切出処理部
53、文字認識部54、知識処理部55、詳細判定処理
部56、個別文字認識辞書57、知識辞書58、認識パ
ラメータ59を具備して構成される。
【0021】この認識部5では、認識制御部51が他の
各部を制御し、読取部4が読み取った投票用紙の画像デ
ータから候補者名等を出力する。読取部4から渡される
画像データは、画像入力部52が受け、この画像データ
から切出処理部53が記名部分(投票用紙の記名枠の画
像データであり、この領域は投票用紙に合わせて予め設
定されている)を切り出し、その後、図2(a)に示す
ような文字基本セグメントBS_1乃至BS_6を抽出
する。また、抽出した文字基本セグメントBS_1乃至
BS_6を必要に応じて合成して、図2(b)に示すよ
うな文字候補セグメントCS_1乃至CS_7を生成す
る。
【0022】次に、文字認識部54が文字候補セグメン
トCS_1乃至CS_7に対して個別文字認識処理を施
す。個別文字認識処理は、文字候補セグメントCS_1
乃至CS_7のそれぞれを、個別文字認識辞書57に格
納されている文字のうち知識辞書58で指定されている
文字と比較して、文字として認識する処理である。
【0023】知識辞書58(詳細は後述)で指定されて
いる文字とは、例えば、候補者に「山石もとろう(山石
本郎)」という人物がいる場合には、「山石もとろう」
として識別される表記である「山石本郎」や「やまいし
もとろう」、「山石」、「ヤマイシモトロウ」等(選挙
規約により有効票として認められる範囲内)を構成する
各文字「山、石、本、郎、や、ま、い、し、も、と、
ろ、う、ヤ、マ、イ、シ、モ、ト、ロ、ウ」である。
【0024】続いて、知識処理部55が文字認識部54
での個別認識処理結果により認識された文字(文字列)
に対して知識処理を施す。知識処理とは、文字認識部5
4で認識された文字、つまり、投票用紙に記された文字
がどの候補者を表しているかを判定する処理であり知識
辞書58に基づいて行われるものである。
【0025】ここで、知識辞書58について説明する。
知識辞書58は、表1に示すように候補者(分類名)毎
に読み取り対象文字列を設定し、各読み取り対象文字列
に対してリジェクトフラグと投票用紙の出力先のスタッ
カを設定しているものである。読み取り対象文字列と
は、各候補者毎に有効票として認められる文字列、例え
ば、候補者「山石もとろう」に対しては「やまいしもと
ろう」等の文字列であり、ここで設定されている読み取
り対象文字列に使用されている文字が上述した個別認識
処理で使用される。また、リジェクトフラグは、後述す
る投票用紙の分類の際に該当する投票用紙を強制的にリ
ジェクトさせるか否かを設定しているもので、リジェク
トフラグがONの場合には、指定されたスタッカ(ここ
では、スタッカ4(図1のスタッカ74に該当))に強
制的にリジェクトする。このリジェクトフラグは、基本
的に誤分類が発生する確率の高い読み取り対象文字列、
例えば表1中の「岩木」と「岩本」に対して設定される
が、この設定は後述するプリセット装置により行われる
ので詳細は後述する。また、スタッカの設定は、リジェ
クトフラグがONに設定されている読み取り対象文字列
を除いて候補者毎に該当する投票用紙をいずれのスタッ
カへ出力するかを設定している。
【0026】
【表1】 知識処理部55での知識処理が終了すると、続いて詳細
判定処理部56で詳細判定処理が行われる。詳細判定処
理は、文字認識部54で行われる個別認識処理と同様に
文字候補セグメントCS_1乃至CS_7を個別認識辞
書に格納されている文字と比較して文字の認識を行う
が、個別認識処理とは異なり比較する個別認識辞書内の
文字を限定しない。これは、個別認識処理では比較する
文字を限定していたために、例えば「山右」と記述され
ていた文字列を「山石」として認識している場合もある
ため、このような投票用紙を無効票として排するために
行われる。
【0027】また、詳細判定処理は、リジェクトフラグ
がONに設定されている読み取り対象文字列が記述され
ている投票用紙(の画像)に対しては行われない。
【0028】なお、個別文字認識処理や詳細判定処理の
際には、認識パラメータ59に基づいて判定等が行われ
るが、認識パラメータ59は後述するプリセット装置に
より、リジェクトフラグとともに、ネットワーク若しく
はメモリカードやディスク等の記録媒体を介して設定さ
れるので、ここでの説明は省略する。
【0029】次に、投票用紙計数仕分け装置のプリセッ
ト装置について説明する。図3は、プリセット装置の構
成を示すブロック図である。
【0030】同図(a)に示すようにプリセット装置
は、入力部101と記入パターン作成部102、個別文
字認識結果ファイル103、類似文字列検出部104、
シミュレート部105、ファイル出力部106を具備し
て構成される。
【0031】入力部101は、ユーザから候補者名等の
選挙情報の入力を受け付け、記入パターン作成部102
は入力部101から入力された各候補者名の記入パター
ンを作成する。
【0032】個別文字認識結果ファイル103は、図3
(b)に示すよう文字DB107に格納されている多数
のサンプル文字(数百人以上の人による手書き文字を電
子化したもの)の全てと、多数(例えば、3000文字
程度)の文字の特徴量を格納した個別文字認識辞書10
8のマッチングを行い、類似する文字を格納したもので
ある。
【0033】この個別文字認識結果ファイル103を参
照し、類似文字列検出部104が記入パターン作成部1
02で作成された全記入パターンから類似文字列を検出
する。
【0034】また、シミュレート部105は、文字DB
107に格納されているサンプル文字を合成し、これを
投票用紙の読取画像として、投票用紙計数仕分け装置
(図1参照)と同様のシミュレーションを行い、類似文
字列検出部104の検出結果と併せてリジェクトフラグ
や認識パラメータ等を設定し、設定結果をファイル出力
部106からファイル出力する。
【0035】ここで、図4を参照してプリセット装置の
動作の概略を説明する。図4は、プリセット装置の動作
の流れの概略を示すフローチャートである。
【0036】プリセット装置が動作を開始すると、ま
ず、入力部101から候補者名などの選挙情報を入力す
る(ステップ201)。続いて、記入パターン作成部1
02が入力部101から入力された選挙情報に基づい
て、候補者名の記入パターンを作成する(ステップ20
2)。
【0037】次に、記入パターン作成部102が作成し
た全記入パターンに対して、類似文字列検出部104が
類似文字列の検出を行い、誤認識率が高くなる記入パタ
ーンのリジェクトフラグをONにし(ステップ20
3)、リジェクトフラグがONに設定された記入パター
ンを除く全記入パターンに対して、シミュレート部10
5が認識シミュレーションを行って、誤認識率の高い記
入パターンのリジェクトフラグをONにする(ステップ
204)。
【0038】続いて、リジェクトフラグの状態を記憶し
て(ステップ205)、全ての認識パラメータ(認識パ
ラメータに関しては後述する)に対して同様の処理が終
了するまで(ステップ206でNO)、認識パラメータ
を変更して(ステップ207)、処理を繰り返し、全て
の認識パラメータに対して処理が終了すると(ステップ
206でYES)、最適な認識パラメータを選択して
(ステップ208)、ファイル出力部106から設定フ
ァイルを出力して(ステップ209)動作を終了する。
【0039】次に、プリセット装置を各部の動作毎に詳
細に説明する。まず、入力部101から入力される選挙
情報について説明する。
【0040】入力部101から入力する選挙情報は、表
2に示すように候補者の届け出名と漢字、よみの3種類
のほか、可能であるならば各候補者の予想得票率を入力
する。
【0041】
【表2】 続いて、記入パターン作成部102について説明する。
記入パターン作成部102は、入力部101から入力さ
れた選挙情報に基づいて、各候補者の記入パターンを漢
字とひらがな、カタカナを組み合わせて作成する。この
組み合わせは、漢字一文字を単位として処理し、例え
ば、候補者「山石」に対して「山いシ」等のように漢字
の「石」に対してひらがなとカタカナを混在させるよう
にはしない。また、漢字一文字に対して読みが当てはま
らない名前、例えば「設楽(したら)」等は、分割でき
る最小の単位で組み合わせを行う。ただし、選挙の規約
などにより「山いし」のような表記や名字だけの表記が
無効票として規定されている場合には、予めリジェクト
フラグをONにする。
【0042】図5乃至7は、それぞれ候補者「山石 も
とろう」、「岩木 朗」、「岩本けんじ」の記入パター
ンを示したものであり、そのパターン数は、当然のこと
ながら候補者毎に異なるものとなる。
【0043】また、記入パターン作成部102は、入力
部101から入力された選挙情報に予想得票率が含まれ
ていた場合には、表3に示すように記入パターン毎に予
想票率を算出する。なお、予想票率は、各記入パターン
中の文字列のそれぞれに対して文字列出現頻度を設定
し、式1から算出する。文字列出現頻度は、経験値によ
り設定するが届け出名や漢字フルネーム(新聞等では漢
字フルネームで表記されることが多い)は、高めに設定
する。
【0044】
【表3】
【式1】 次に、類似文字列検出部104の動作について説明す
る。類似文字列検出部104は、全記入パターンから類
似の文字列を検出するが、類似の文字列の検出に先立ち
文字間の類似性(誤読率)を調べる。
【0045】類似文字列検出部104が参照する個別文
字認識ファイル103は、文字DB107に格納されて
いるサンプル文字がどのような文字として認識されるか
が複数候補記録されている。例えば、「本」という文字
に対しては、表4に示すように各サンプル1乃至N毎に
一位候補からi位候補までが記録されている。なお、表
4中の距離値とは、文字DB107内のサンプルと個別
文字認識辞書108の文字の特徴量をマッチングさせた
場合の結果(差)を数値化したものである。
【0046】
【表4】 文字(A→B)間の誤読率とは、文字Aを個別文字認識
した際に、認識パラメータにより決定されるしきい値
(順位)よりも上位の候補中に文字Bが存在する確率で
あり、例えば、「本」を「木」と誤読する「本」→
「木」の誤読率は、サンプル数Nが100で、認識パラ
メータにより決定されるしきい値よりも「木」が上位に
あるサンプルの数が10であるとすれば、10/100
=10%となる。
【0047】ここで、認識パラメータについて説明す
る。文字DB107内に格納されているサンプル文字の
個別文字認識を行った結果、各サンプル文字に対して認
識すべき文字の候補が決定されるが、その候補の文字か
ら認識すべき文字を決定する必要があるが、この決定
は、単に候補の順位から決定するわけにはいかない。例
えば、一位候補の文字の距離値が180で二位候補の文
字が181であったとすれば、両候補に大差はなく一位
候補の文字として認識するには問題がある。また、一位
候補の文字の距離値が180であるのに対して二位候補
の文字の距離値が350であるとすれば、両者の違いは
明らかでサンプル文字を一位候補の文字として認識して
も問題はない。
【0048】つまり、文字認識のためのしきい値は、単
に候補順位や距離値のみから決定することはできず、両
者の兼ね合いにより決定する必要がある。
【0049】そのため、ここでは、距離値を一位候補の
距離値で除した正規化距離値をxとした場合に、しきい
値yを式2により決定する。
【0050】
【式2】 この式2は、点(P1,Q1)と点(P2,Q2)、点
(P3,Q3)の3点を通る曲線であり、(Q1,Q
2,Q3)を認識パラメータとする。ここで、(P1,
P2,P3)は固定値とし、例えば(P1,P2,P
3)=(1.0,1.2,1.3)とする。
【0051】このようにしきい値を決定すると、図8
(a)に示す斜線部分に該当する文字候補が認識される
文字となる。また、認識パラメータを変更すると、図8
(b)に示すように、しきい値は異なるものになる。
【0052】このようにして決定したしきい値により求
めた文字間の誤読率は、例えば表5のようになる。ただ
し、文字A=文字Bの場合は正読率となる(例えば、山
の正読率は100%)。また、表5に示したように
「木」→「本」の誤読率が5%で「本」→「木」の誤読
率が10%といったように「A」→「B」と「B」→
「A」の誤読率は同一になるとは限らない。
【0053】
【表5】 このようにして求めた文字間の誤読率に基づいて、次に
文字列間の誤読率を算出する。文字列間の誤読率は、例
えば、「山石もとろう」を「いわきあきら」と誤読する
誤読率Pe(山石もとろう→いわきあきら)を例に説明
すると、 「山」→「い」の誤読率をE1 「石」→「わ」の誤読率をE2 「も」→「き」の誤読率をE3 「と」→「あ」の誤読率をE4 「ろ」→「き」の誤読率をE5 「う」→「ら」の誤読率をE6 として、式3により算出される。
【0054】
【式3】 したがって、表5に示した文字間の誤読率に基づいて誤
読率Pe(岩本→岩木)を算出すると、「岩」→「岩」
の誤読率(正読率)が1で「本」→「木」の誤読率が
0.1であるからPe(岩本→岩木)=0.1(10
%)となる。
【0055】このようにして各文字列間の誤読率Peを
算出した後に式4により全体の誤読率Pを求め、この誤
読率が所定の値以上であった場合には、式5で表される
評価式の評価値ΔSが最小の文字列のリジェクトフラグ
をONにし、この文字列の誤読率を0として再び全体の
誤読率Pを求める。ただし、Pv(α)は文字列αの予
想票率であり、Pc(α→α)は文字列αの正読率(算
出方法は誤読率Peと同じ)、ΔEに乗じているパラメ
ータK(例えば100)は重み係数である。また、ΔR
は、票全体に対する文字列αの予想通過率を示し、ΔE
は票全体に対する文字列αの予想誤読率を示す。
【0056】このリジェクトフラグの設定は、誤読率が
所定の値よりも小さくなるまで繰り返し行う。
【0057】
【式4】
【式5】 ここで、図9を参照して類似文字列検出部104の動作
の流れを説明する。図9は、類似文字列検出部104の
動作の流れを示すフローチャートであり、 図4のステ
ップ203に対応する処理の流れを示したものである。
【0058】類似文字列検出部104は、動作を開始す
ると、まず、文字間の誤読率に基づいて文字列間の誤読
率を算出する(ステップ301、式3参照)。次に、全
体の誤読率を算出し(ステップ302、式4参照)、算
出した誤読率が誤分類しきい値(あらかじめ設定された
値であり、例えば0.001%)以上であれば(ステッ
プ303でNO)、評価値ΔSが最小の文字列(記入パ
ターン)のリジェクトフラグをONに設定し(ステップ
304、式5参照)、リジェクトフラグをONに設定し
た文字列の誤読率を0として算出し(ステップ30
1)、再び全体の誤読率Pを算出して(ステップ30
2)、誤分類しきい値との比較を行う(ステップ30
3)。
【0059】このような処理を繰り返し、全体の誤読率
Pが誤分類しきい値より小さくなると(ステップ303
でYES)、類似文字列検出部104での処理は終了し
てステップ204の処理に進む。
【0060】次に、シミュレート部105での処理につ
いて説明する。図10は、シミュレート部105の構成
を示すブロック図である。
【0061】同図に示すように、シミュレート部105
は、制御部151と画像合成部152、切出処理部15
3、文字認識部154、知識処理部155、詳細判定処
理部156、個別文字認識辞書167、単語辞書15
8、認識パラメータ159を具備して構成される。な
お、同図中破線で囲んだ部分(符号153乃至159)
は、図1に示した投票用紙計数仕分け装置と同様の構成
である。
【0062】L このシミュレート部105では、画像
合成部152が文字DB107に格納されているサンプ
ル文字を合成して、投票用紙を読み取って得た画像デー
タと同様の模擬データを生成し、この模擬データを利用
して符号153乃至159に示す各部により投票用計数
仕分け装置と同様の処理を行って文字列の誤分類率を求
める。
【0063】シミュレート部105でシミュレートを行
うのは、類似文字列検出部104の処理では、検出する
ことのできない誤分類の発生しやすい文字列を検出する
ためである。例えば、「山石」(縦書き)と記述された
文字もその大きさや位置によっては「岩」と認識されて
しまうことがある。
【0064】ここで、シミュレート部105の動作につ
いて説明する。画像合成部152は、図11に示すよう
に文字DB107からサンプル文字を取得するとともに
乱数を発生させ、この乱数を使用して取得したサンプル
文字に対して拡大や縮小、回転などの処理を施し、これ
らの貼り付け座標(x1,y2)や(x2,y2)も乱
数によって決定し、合成画像を生成する。
【0065】次に、切出処理部153が図12(a)に
示すように合成画像から文字基本セグメントBS_1乃
至BS_6を抽出する。また、抽出した文字基本セグメ
ントBS_1乃至BS_6を必要に応じて合成し、文字
候補セグメントCS_1乃至CS_7を生成する。
【0066】続いて、文字認識部154が文字候補セグ
メントCS_1乃至CS_7に対して個別文字認識処理
を施す。個別文字認識処理は、文字候補セグメントCS
_1乃至CS_7のそれぞれを、個別文字認識辞書15
7に格納されている文字のうち知識辞書158で指定さ
れている文字と比較して、文字として認識する処理であ
る。
【0067】知識辞書158で指定されている文字と
は、例えば、候補者に「山石もとろう(山石本郎)」と
いう人物がいる場合には、「山石もとろう」として識別
される表記である「山石本郎」や「やまいしもとろ
う」、「山石」、「ヤマイシモトロウ」等(選挙規約に
より有効票として認められる範囲内)を構成する各文字
「山、石、本、郎、や、ま、い、し、も、と、ろ、う、
ヤ、マ、イ、シ、モ、ト、ロ、ウ」である。
【0068】続いて、知識処理部155が文字認識部1
54での個別認識処理結果により認識された文字(文字
列)に対して知識処理を施す。知識処理とは、文字認識
部154で認識された文字、つまり、合成画像に記され
た文字がどの文字列を表しているかを判定する処理であ
り知識辞書158に基づいて行われるものである。
【0069】知識処理の際には、図12(a)に示すよ
うに各文字毎の距離値に基づいて文字列全体の判定値を
算出し、これを知識処理しきい値と比較することで、記
入パターンのうちのいずれの文字列であるかを判定す
る。文字列全体の判定値は、例えば、各文字の距離値の
平均を所定の値から減じることで算出したり、重み付け
などを行う所定の式により行う。この知識処理の結果、
図12(b)に示すように、文字列全体の判定値が知識
処理しきい値以上となった文字列候補に対して、詳細判
定処理部166で詳細判定処理を行う。
【0070】詳細判定処理は、文字認識部154で行わ
れる個別認識処理と同様に文字候補セグメントCS_1
乃至CS_7を個別認識辞書に格納されている文字と比
較して文字の認識を行うが、個別認識処理とは異なり比
較する個別認識辞書内の文字を限定しない。これは、個
別認識処理では比較する文字を限定していたために、例
えば「山右」と記述されていた文字列を「山石」として
認識している場合もあるため、このような投票用紙を無
効票として排するために行われる。
【0071】また、詳細判定処理も、実機(投票用紙計
数仕分け装置)と同様にリジェクトフラグONに設定さ
れている文字列に対しては行わない。
【0072】このように、シミュレート部105では、
実機(投票用紙計数仕分け装置)と同様のシミュレーシ
ョンを行い、そのシミュレーション結果に応じてリジェ
クトフラグの設定を行う。
【0073】ここで、リジェクトフラグの設定を含めた
シミュレート部105の処理の流れを説明する。図13
は、シミュレート部105の処理動作の流れを示すフロ
ーチャートであり、 図4のステップ204に対応する
処理の流れを示したものである。
【0074】シミュレート部105は、処理を開始する
と、まず、画像合成部152が投票用紙の記名部分の画
像を合成する(ステップ401)。次に、符号153乃
至159で示される各部が合成した画像の認識シミュレ
ーションを行い(ステップ402)、そのシミュレーシ
ョン結果から制御部151が文字列間の誤読率を算出す
る(ステップ403)。続いて、制御部151が式4に
より全体の誤読率を算出し(ステップ404)、算出し
た全体の誤読率が誤分類しきい値(類似文字列検出部1
04が使用したものと同じ値)以上であれば(ステップ
405でNO)、式5に基づいて算出された評価値ΔS
が最小の文字列(記入パターン)のリジェクトフラグを
ONに設定する(ステップ406)。
【0075】評価値ΔSが最小の文字列のリジェクトフ
ラグをONに設定したら、ステップ402に戻り、再び
認識シミュレーションを行い、同様の処理を全体の誤読
率が誤分類しきい値より小さくなるまで繰り返す。
【0076】ただし、シミュレート部105の処理にお
いては、式4の予想得票率Pv(β)をシミュレーショ
ンにおける得票率とし(シミュレーションに使用する画
像の種類(文字列)と数自体が予想得票率に基づいてい
る)、式5の予測認識率Pc(α→α)と予測誤読率P
e(β→α)には、シミュレーション結果の認識率と誤
読率を使用する。
【0077】この類似文字列検出部104とシミュレー
タ部105の処理は、上述したように予め設定されてい
る複数の認識パラメータのそれぞれについて行われ(図
4参照)、最終的に最も通過率の高い(リジェクトされ
ずに分類される)認識パラメータとそのときのリジェク
トフラグの状態をファイル出力部106から出力する。
ファイル出力部106から出力された各設定は、ネット
ワークや記録媒体を介して投票用紙計数仕分け装置(図
1参照)に入力される。
【0078】また、プリセット装置での各処理は、リジ
ェクトフラグがONの場合と同じトレイに出力されるよ
うに設定されている候補者に対応した文字列に対しては
行わない。
【0079】また、プリセット装置は、そのシミュレー
タ部105を実際の投票用紙計数仕分け装置で代用する
ように構成してもよく、上述の処理を行わせるプログラ
ムによりコンピュータ上で構成するようにしてもよい。
【0080】
【発明の効果】以上説明したように、この発明によれ
ば、候補者名の記名パターン毎にリジェクトフラグを設
定し、リジェクトフラグがONに設定されている文字列
が記入されている投票用紙を無条件でリジェクトするよ
うに構成したので、精度の高くない高速な画像処理によ
り投票用紙の認識を行っても誤分類率を低く抑えること
ができる。
【0081】また、候補者名等の選挙情報に基づいて文
字の類似性のチェックと認識シミュレーションを行い、
その結果からリジェクトフラグをONにする文字列を決
定するとともに、最適な認識パラメータを決定するよう
に構成したため、選挙毎に最適な設定で仕分け作業を行
うことができる。
【図面の簡単な説明】
【図1】この発明に係る投票用紙計数仕分け装置の構成
を示すブロック図。
【図2】文字基本セグメントと文字候補セグメントを示
した図。
【図3】プリセット装置の構成を示すブロック図。
【図4】プリセット装置の動作の流れの概略を示すフロ
ーチャート。
【図5】「山石 もとろう」の記入パターンを示した
図。
【図6】「岩木 朗」の記入パターンを示した図。
【図7】「岩本 けんじ」の記入パターンを示した図。
【図8】認識パラメータとしきい値の関係を示した図。
【図9】類似文字列検出部104の動作の流れを示すフ
ローチャート。
【図10】シミュレート部105の構成を示すブロック
図。
【図11】合成画像を説明するための図。
【図12】合成画像に対する処理を説明するための図。
【図13】シミュレート部105の処理動作の流れを示
すフローチャート。
【符号の説明】
1 制御部 2 操作パネル 3 繰出部 4 読取部 5 認識部 6 分類部 7 スタッカ 51 認識制御部 52 画像入力部 53 切出処理部 54 文字認識部 55 知識処理部 56 詳細判定処理部 57 個別文字認識辞書 58 知識辞書 59 認識パラメータ 71〜74 スタッカ 101 入力部 102 記入パターン作成部 103 個別文字認識結果ファイル 104 類似文字列検出部 105 シミュレート部 106 ファイル出力部 107 文字DB 108 個別文字認識辞書 151 制御部 152 画像合成部 153 切出処理部 154 文字認識部 155 知識処理部 156 詳細判定処理部 157 個別文字認識辞書 158 知識辞書 159 認識パラメータ
フロントページの続き (72)発明者 亀山 博史 兵庫県姫路市下手野一丁目3番1号 グロ ーリー工業株式会社内 Fターム(参考) 3E038 AA20 BA20 CA03 CB04 CC01 KA02 5B049 AA04 AA06 BB39 DD02 EE02 EE08 EE41 GG07 GG09

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 投票用紙に記入された手書き文字を認識
    し、該認識した投票用紙を複数のスタッカのうち該認識
    結果に基づいて選択される1つのスタッカに排出すると
    ともに、該排出された各スタッカの投票用紙の枚数を各
    スタッカ別に計数する投票用紙計数仕分け装置におい
    て、 有効票として識別されるべき複数の文字列を記憶すると
    ともに、該複数の文字列のうち誤認識率の高い文字列に
    対して強制排出情報が設定される記憶手段と、 投票用紙に記入された手書き文字を読み取る文字読取手
    段と、 前記文字読取手段が読み取った手書き文字を前記記憶手
    段に設定されている文字列を構成する文字と比較して認
    識する第1の認識手段と、 前記文字読取手段が読み取った手書き文字を全ての文字
    と比較して認識する第2の認識手段と、 前記第1の認識手段によって認識された文字列が前記強
    制排出情報が設定されていない文字列である場合にのみ
    前記第2の認識手段での認識を行う制御手段とを具備す
    ることを特徴とする投票用紙計数仕分け装置。
  2. 【請求項2】 投票用紙に記入された手書き文字を認識
    し、該認識した投票用紙を複数のスタッカのうち該認識
    結果に基づいて選択される1つのスタッカに排出すると
    ともに、該排出された各スタッカの投票用紙の枚数を各
    スタッカ別に計数する投票用紙計数仕分け装置のプリセ
    ット装置において、 入力された候補者名に基づいて各候補者名を表記する全
    ての文字列を生成する表記パターン生成手段と、 前記表記パターン生成手段が生成した文字列のうち誤認
    識率の高い文字列を検出する誤認識文字列検出手段と、 前記誤認識文字列検出手段が検出した文字列に対して強
    制排出情報を設定する強制排出情報設定手段とを具備す
    ることを特徴とする投票用紙計数仕分け装置のプリセッ
    ト装置。
  3. 【請求項3】 サンプル文字を合成して疑似投票用紙画
    像を生成する画像合成手段と、 前記画像合成手段が合成した疑似投票用紙画像に対して
    前記投票用紙計数仕分け装置の認識アルゴリズムにより
    認識シミュレーションを行うシミュレート手段とをさら
    に具備し、 前記強制排出情報設定手段は、 前記シミュレート手段による認識シミュレーションの結
    果に基づき誤認識率の高い文字列に対して強制排出情報
    を設定することを特徴とする請求項2記載の投票用紙計
    数仕分け装置のプリセット装置。
  4. 【請求項4】 前記誤認識文字列検出手段と前記シミュ
    レート手段は、 予め設定された複数のしきい値のそれぞれに対して誤認
    識率の高い文字列を検出し、 前記シミュレート手段による認識シミュレーション結果
    に基づき、前記複数のしきい値のうち投票用紙の強制排
    出率が最小のしきい値と該しきい値に対する強制排出情
    報を前記投票用紙計数仕分け装置に設定することを特徴
    とする請求項3記載の投票用紙計数仕分け装置のプリセ
    ット装置。
  5. 【請求項5】 投票用紙に記入された手書き文字を認識
    し、該認識した投票用紙を複数のスタッカのうち該認識
    結果に基づいて選択される1つのスタッカに排出すると
    ともに、該排出された各スタッカの投票用紙の枚数を各
    スタッカ別に計数する投票用紙計数仕分け装置のプリセ
    ット方法において、 投票対象となる候補者名に基づいて各候補者名を表記す
    る全ての文字列を生成するとともに、該生成した文字列
    とサンプル文字とのマッチング処理により前記文字列か
    ら誤認識率の高い文字列を検出し、該検出した文字列に
    対して強制排出情報を設定することを特徴とする投票用
    紙計数仕分け装置のプリセット方法。
  6. 【請求項6】 サンプル文字を合成して疑似投票用紙画
    像を生成し、 該生成した疑似投票用紙画像に対して前記投票用紙計数
    仕分け装置の認識アルゴリズムによる認識シミュレーシ
    ョンを行い、 該認識シミュレーションの結果に基づいて誤認識率の高
    い文字列に対して強制排出情報を設定することを特徴と
    する請求項5記載の投票用紙計数仕分け装置のプリセッ
    ト方法。
  7. 【請求項7】 前記誤認識率の高い文字列の検出は、 予め設定された複数のしきい値のそれぞれに基づいて行
    い、 前記認識シミュレーション結果に基づいて、前記複数の
    しきい値のうち投票用紙の強制排出率が最小のしきい値
    と該しきい値に対する強制排出情報を前記投票用紙計数
    仕分け装置に設定することを特徴とする請求項6記載の
    投票用紙計数仕分け装置のプリセット方法。
  8. 【請求項8】 投票用紙に記入された手書き文字を認識
    し、該認識した投票用紙を複数のスタッカのうち該認識
    結果に基づいて選択される1つのスタッカに排出すると
    ともに、該排出された各スタッカの投票用紙の枚数を各
    スタッカ別に計数する投票用紙計数仕分け装置のプリセ
    ットプログラムを記録した媒体において、 投票対象となる候補者名に基づいて各候補者名を表記す
    る全ての文字列を生成するとともに、該生成した文字列
    とサンプル文字とのマッチング処理により前記文字列か
    ら誤認識率の高い文字列を検出し、該検出した文字列に
    対して強制排出情報を設定するプログラムを記録したこ
    とを特徴とする投票用紙計数仕分け装置のプリセットプ
    ログラムを記録した媒体。
  9. 【請求項9】 サンプル文字を合成して疑似投票用紙画
    像を生成し、 該生成した疑似投票用紙画像に対して前記投票用紙計数
    仕分け装置の認識アルゴリズムによる認識シミュレーシ
    ョンを行い、 該認識シミュレーションの結果に基づいて誤認識率の高
    い文字列に対して強制排出情報を設定するプログラムを
    記録したことを特徴とする請求項8記載の投票用紙計数
    仕分け装置のプリセットプログラムを記録した媒体。
JP10268499A 1999-04-09 1999-04-09 投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体 Expired - Fee Related JP3788703B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10268499A JP3788703B2 (ja) 1999-04-09 1999-04-09 投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10268499A JP3788703B2 (ja) 1999-04-09 1999-04-09 投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体

Publications (2)

Publication Number Publication Date
JP2000293725A true JP2000293725A (ja) 2000-10-20
JP3788703B2 JP3788703B2 (ja) 2006-06-21

Family

ID=14334074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10268499A Expired - Fee Related JP3788703B2 (ja) 1999-04-09 1999-04-09 投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体

Country Status (1)

Country Link
JP (1) JP3788703B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011165099A (ja) * 2010-02-12 2011-08-25 Oki Electric Industry Co Ltd 帳票処理システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011165099A (ja) * 2010-02-12 2011-08-25 Oki Electric Industry Co Ltd 帳票処理システム

Also Published As

Publication number Publication date
JP3788703B2 (ja) 2006-06-21

Similar Documents

Publication Publication Date Title
US5917941A (en) Character segmentation technique with integrated word search for handwriting recognition
Palacios et al. A system for processing handwritten bank checks automatically
JPS60189082A (ja) 金融書類上の金額位置検出装置及び検出方法
IE56452B1 (en) Image processors
Fazilov et al. State of the art of writer identification
CN103914680A (zh) 一种喷印字符图像识别与校验系统及方法
US7480403B2 (en) Apparatus, system, and method for fraud detection using multiple scan technologies
JP3078318B2 (ja) 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置
Sako et al. Form reading based on form-type identification and form-data recognition
US8340428B2 (en) Unsupervised writer style adaptation for handwritten word spotting
JP3788703B2 (ja) 投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体
JPH0957204A (ja) 郵便物の宛先自動読取システム
JPH07160822A (ja) パターン認識方法
Madhvanath et al. Reading handwritten US census forms
JPS592191A (ja) 手書き日本語文の認識処理方式
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JP3243000B2 (ja) 郵便物処理装置および郵便物処理方法
JP3160347B2 (ja) 郵便物の宛名読取装置
JPH09114926A (ja) オンライン文字認識における入力文字大分類方法および装置
JP2011125860A (ja) 宛先認識装置
JP3105918B2 (ja) 文字認識装置、および文字認識方法
JPH10198762A (ja) ニューロによるパターン認識/限定文字列認識システム及び文字パターン分類装置
Palacios Hielscher et al. Automatic Processing of Brazilian Bank Checks
Fujisawa How to deal with uncertainty and variability: experience and solutions
Allgrove et al. Optimisation issues in dynamic and static signature verification

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060323

R150 Certificate of patent or registration of utility model

Ref document number: 3788703

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090407

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100407

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100407

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110407

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120407

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120407

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130407

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130407

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140407

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140407

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees