JP6600973B2 - 文字認識装置、文字認識処理システム、およびプログラム - Google Patents

文字認識装置、文字認識処理システム、およびプログラム Download PDF

Info

Publication number
JP6600973B2
JP6600973B2 JP2015081548A JP2015081548A JP6600973B2 JP 6600973 B2 JP6600973 B2 JP 6600973B2 JP 2015081548 A JP2015081548 A JP 2015081548A JP 2015081548 A JP2015081548 A JP 2015081548A JP 6600973 B2 JP6600973 B2 JP 6600973B2
Authority
JP
Japan
Prior art keywords
character
recognition
warning
candidate
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015081548A
Other languages
English (en)
Other versions
JP2016201013A (ja
Inventor
英人 織田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2015081548A priority Critical patent/JP6600973B2/ja
Publication of JP2016201013A publication Critical patent/JP2016201013A/ja
Application granted granted Critical
Publication of JP6600973B2 publication Critical patent/JP6600973B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は、文字認識装置、文字認識処理システム、およびプログラムに関する。
特許文献1では、文字認識処理後のべリファイ時にオペレータに促す確認や修正操作を必要最小限とするために、未知文字イメージ群の各候補文字コードを取得し、これら候補文字コードの信頼性を判定し、単語辞書を用いて単語照合を行ない近い文字コード群を選出し、再判定で信頼性が低い第1位候補文字コードと単語中の対応する文字コードとを比較し、一致する場合は信頼性を「低」から「高」に変更し、未知文字イメージの再判定が終わると、認識結果(単語)を表示すると共に再判定により信頼性が低いと判定された文字コードについてオペレータに対する警告目印を表示している。
また、特許文献2では、漢字1文字体言または前後の単語に接続可能な単語を照合できなかったリジェクト文字が2文字以上連続して現れかつ前記単語辞書にない部分を、誤読の可能性があるとして検出するステップを有している。
特開2003−281467号公報 特開平05−89281号公報
一般的に、文字に対する文字認識の認識率の値が予め決められた値に満たない場合に、この文字ごとに警告を発すると、警告の内容を確認する手間が発生してしまう場合がある。
本発明は、文字に対する文字認識の認識率の値が予め決められた値に満たない場合に当該文字ごとに警告を発するものに比べて、警告の回数を低減させることを目的とする。
請求項1に記載された発明は、認識対象から単文字を抽出する抽出手段と、前記認識対象の並び規則を用いた文脈処理により特定された認識候補の中で前記単文字の字形の崩れに関する指標により評価された評価値が予め定めた値より低いものを警告文字として出力するとともに、当該認識候補に対して当該認識候補を他の認識候補に入れ替えた文字列を生成し、当該文字列が当該認識対象の並び規則を用いた文脈再評価に合致しない場合に、単文字に対する複数の認識候補間に類似の文字が含まれる場合の警告の候補である警告文字候補の中から警告文字候補を減らし、残った警告文字候補を警告文字として出力する警告手段とを有する文字認識装置である。
請求項2に記載された発明は、前記警告手段は、前記認識対象の並び規則を用いた文脈処理により特定された認識候補の評価値が予め定めた値より低い場合の文字を、警告の候補である警告文字候補とすることを特徴とする請求項1記載の文字認識装置である。
請求項3に記載された発明は、認識対象から単文字を抽出する抽出手段と、前記認識対象の並び規則を用いた文脈処理により特定された認識候補の中で前記単文字の字形の崩れに関する指標により評価された評価値が予め定めた値より低いものを警告の候補である第1の警告文字候補とする第1の警告文字候補手段と、前記単文字の複数の認識候補の中から特定された認識候補に対し、類似の文字が含まれている場合の文字を、警告の候補である第2の警告文字候補とする第2の警告文字候補手段と、特定された前記認識候補による認識処理を行った後に、認識候補を入れ替えた文字列を生成し、生成した当該文字列が前記認識対象の並び規則を用いた文脈再評価に合致しない場合に、前記第2の警告文字候補手段による第2の警告文字候補を解除して除外する警告文字候補解除手段と、特定された認識候補の文字列の中から、前記第1の警告文字候補および前記警告文字候補解除手段において残った第2の警告文字候補を警告文字として識別できる状態で表示するように制御する警告手段とを有する文字認識装置である。
請求項4に記載された発明は、前記第2の警告文字候補手段は、複数の認識候補間の相対評価値を算出し、算出された相対評価値が予め定めた値よりも低い場合に前記類似の文字が含まれていると判断することを特徴とする請求項記載の文字認識装置である。
請求項に記載された発明は、認識対象から単文字を抽出する抽出手段と、前記単文字に対して複数の認識候補と評価値とを取得する取得手段と、前記認識対象が有する並び規則を用いた文脈処理により、前記複数の認識候補の中から認識候補を特定する文脈処理手段と、特定された前記認識候補の評価値が予め定めた値よりも低い場合に、低い評価値の単文字を警告文字とする警告手段とを有し、前記警告手段は、前記認識対象の並び規則を用いた文脈処理により特定された認識候補の中で前記単文字の字形の崩れに関する指標により評価された評価値が予め定めた値より低いものを警告文字とするとともに、当該認識候補に対して当該認識候補を他の認識候補に入れ替えた文字列を生成し、当該文字列が当該認識対象の並び規則を用いた文脈再評価に合致しない場合に、単文字に対する複数の認識候補間に類似の文字が含まれる場合の警告の候補である警告文字候補の中から警告文字候補を減らして、残った警告文字候補を警告文字とすることを特徴とする文字認識装置である。
請求項に記載された発明は、文字認識装置と、使用者記入情報取得装置とを含み、前記文字認識装置は、前記使用者記入情報取得装置から取得した認識対象から単文字を抽出する抽出手段と、前記認識対象の並び規則を用いた文脈処理により特定された認識候補の中で前記単文字の字形の崩れに関する指標により評価された評価値が予め定めた値より低いものを警告文字として出力するとともに、当該認識候補に対して当該認識候補を他の認識候補に入れ替えた文字列を生成し、当該文字列が当該認識対象の並び規則を用いた文脈再評価に合致しない場合に、単文字に対する複数の認識候補間に類似の文字が含まれる場合の警告の候補である警告文字候補の中から警告文字候補を減らし、残った警告文字候補を警告文字として出力する警告手段とを有することを特徴とする文字認識処理システムである。
請求項に記載された発明は、コンピュータに、認識対象から単文字を抽出する機能と、前記認識対象の並び規則を用いた文脈処理により特定された認識候補の中で前記単文字の字形の崩れに関する指標により評価された評価値が予め定めた値より低いものを警告文字として出力するとともに、当該認識候補に対して当該認識候補を他の認識候補に入れ替えた文字列を生成し、当該文字列が当該認識対象の並び規則を用いた文脈再評価に合致しない場合に、単文字に対する複数の認識候補間に類似の文字が含まれる場合の警告の候補である警告文字候補の中から警告文字候補を減らし、残った警告文字候補を警告文字として出力する機能とを実現させるプログラムである。
請求項1に記載された発明によれば、単に文字に対する文字認識の認識率の値が予め決められた値に満たない場合に当該文字ごとに警告を発するものに比べて、警告の回数を低減させることができる。
請求項2に記載された発明によれば、字形が崩れた認識候補に対しても、規則性を加味した評価によって警告を発することができる。
請求項3に記載された発明によれば、単に文字に対する文字認識の認識率の値が予め決められた値に満たない場合に当該文字ごとに警告を発するものに比べて、警告の回数を低減させることができる。また規則性を加味した評価によって警告の回数を低減できる。
請求項4に記載された発明によれば、認識候補間の類似性を良好に判定できる。
請求項に記載された発明によれば、単に文字に対する文字認識の認識率の値が予め決められた値に満たない場合に当該文字ごとに警告を発するものに比べて、警告の回数を低減させることができる。
請求項に記載された発明によれば、単に文字に対する文字認識の認識率の値が予め決められた値に満たない場合に当該文字ごとに警告を発するものに比べて、警告の回数を低減させることができる文字認識処理システムを提供できる。
請求項に記載された発明によれば、単に文字に対する文字認識の認識率の値が予め決められた値に満たない場合に当該文字ごとに警告を発するものに比べて、警告の回数を低減させることができる。
本実施の形態が適用される文字認識処理システムの全体構成を示す概略図である。 文字認識装置の機能構成を示すブロック図である。 文字認識装置によって行われるリジェクト処理の流れを示すフローチャートである。 (a)、(b)は、ステップ101〜ステップ103にて行われる文字分割、単文字認識の処理を説明するための図である。 ステップ104によって行われる文脈処理を説明するための図である。 ステップ105によって行われる第1のリジェクト処理を説明するための図である。 ステップ106における相対スコアの算出処理、および第2のリジェクト処理を説明するための図である。 ステップ108の入れ替え文字生成処理と、ステップ109〜ステップ112の文脈再評価処理を説明するための図である。
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
〔文字認識処理システム100の全体構成〕
図1は、本実施の形態が適用される文字認識処理システム100の全体構成を示す概略図である。文字認識処理システム100は、文字認識装置10と、この文字認識装置10に対して手書き文字等の情報を入力するペン型装置70と、文字認識装置10とLAN(Local Area Network)などのネットワーク90を介して接続され、画像の出力などを行う画像形成装置80とを含んでいる。
文字認識装置10は、オンライン手書き文字認識や、オフライン文字認識を行う。オンライン手書き文字認識は、タブレットや電子ペン(ペン型装置70)等で入力された文字の筆跡を電子テキストに変換する技術である。また、オフライン手書き文字認識は、例えば後述するスキャナ82等によってスキャンされた手書きや活字画像をテキストに変換する技術である。
この文字認識装置10は、例えばパーソナルコンピュータ(PC)により構成され、一般のパーソナルコンピュータが有する各種機能を備えている。より具体的には、OS(Operating System)やアプリケーション等の各種ソフトウェアを実行し後述する各種機能を実行するCPU11と、CPU11の作業用のメモリとして用いられるRAM12と、CPU11が実行する各種プログラムを記憶するメモリであるROM13とを備えている。RAM12は、ペン型装置70からの入力情報などの一次記憶領域として機能させることもできる。また、各種画像情報やリジェクト結果などを記憶する、磁気ディスク等で構成された記憶部14を備えている。更に、液晶ディスプレイなどのリジェクト出力手段であるディスプレイ15と、入力手段としてのキーボード16と、補助入力手段としてのポインティングデバイス17とを備えている。更に、ペン型装置70や画像形成装置80との間で各種情報の送受信を行うネットワークインタフェース18を備えている。このネットワークインタフェース18は、例えば無線通信によりペン型装置70から手書き文字等の情報を取得する。このペン型装置70からの情報の取得は、USB(Universal Serial Bus)の規格に準拠したコネクタを介して行われる構成でもよく、また、ネットワーク90を介して行われる構成を採用することも可能である。
使用者記入情報取得装置の一例として機能するペン型装置70は、例えば画像形成装置80により画像が形成された紙に、インク等によって文字や図などの記入を行うための書き込み装置である。このペン型装置70は電子ペンとしての機能を備えており、紙に記録された情報を読み取る読取部71、読み取った情報を記憶する記憶部72、記憶した情報を文字認識装置10へ送信するなど文字認識装置10と通信を行う通信部73を有している。尚、他の使用者記入情報取得装置としては、画像形成装置80に設けられたスキャナ82や、ネットワーク90に接続されるタブレット(図示せず)などの各種入力装置を採用することができる。
画像形成装置80は、紙などの記録媒体に画像を形成するとともに、ネットワーク90を介して文字認識装置10と通信を行い、文字認識装置10から送信される情報に基づいて紙に画像を形成する。また、画像を読み取って記憶するなどの機能を備えている。より具体的には、例えば手書き文字の記載用の帳票画像などを出力するプリンタ81、例えば手書き文字画像などを読み取るスキャナ82、各種画像情報を記憶する記憶部83、ネットワーク90を介して文字認識装置10などと情報の送受信を行う通信部84を備えている。プリンタ81は、例えば電子写真方式を用いることができるが、インクジェット方式など、他の画像形成方式を採用することもできる。
〔文字認識装置10の機能説明〕
図2は、文字認識装置10の機能構成を示すブロック図である。図2に示すように、文字認識装置10は、認識対象を取得する認識対象取得部21、取得された認識対象を個々の文字に切り出す、抽出手段の一つとして機能する文字切り出し部22、切り出された個々の単文字について認識候補を複数取得する単文字認識部23を有している。この単文字認識部23は、単文字に対して複数の認識候補と評価スコア(評価値)とを取得する取得手段の一つとして機能する。また、文字列としての認識候補を取得する文脈処理部24、および認識候補の評価スコアから文字をリジェクトする第1の警告文字候補手段の一つとして機能する第1のリジェクト出力部25を有する。また、他方の認識候補との差を見るための相対スコアを算出する相対スコア算出部26、相対スコア(相対評価値)を用いて文字をリジェクトする第2の警告文字候補手段の一つとして機能する第2のリジェクト出力部27を有する。また、第2のリジェクトによってリジェクトされた文字に対して他の候補と入れ替えた文字列を生成する入れ替え文字列生成部28、入れ替え文字列が文脈処理に合致するか否かを評価する文脈処理手段の一つとして機能する文脈再処理部29、合致するか否かによって、第2リジェクトによってリジェクトされた文字に対するリジェクトを解除するか否かを決定する警告文字候補解除手段の一つとして機能するリジェクト解除決定部30を有する。さらに、第1リジェクト出力部25およびリジェクト解除決定部30の内容からリジェクトを出力する警告手段の一つとして機能するリジェクト出力部31を有する。リジェクト出力部31からの出力は、ユーザに対して目視による確認を促す警告である。
認識対象取得部21は、例えば画像形成装置80が有するスキャナ82で読み込まれネットワーク90を介して認識対象を取得する。また、画像形成装置80の記憶部83に記憶されネットワーク90を介して取得する場合や、ネットワーク90に接続された他の読取装置から取得する場合もある。また、単に、文字認識装置10の記憶部14に記憶された手書き画像を読み出して取得する場合もある。取得する認識対象は、複数個の単文字の集まりからなり、特定の文字列を形成している。
また、リジェクト出力部31は、例えばディスプレイ15に、認識対象の文字列の中からリジェクトする文字を識別できる状態で表示するように制御する。例えば、リジェクトする文字を赤枠で強調表示する等である。
ここで、単文字認識部23における認識候補と評価スコア(評価値)との求め方は、文字認識の手法によって異なる。例えば、文字認識の手法としては、何れも公知の技術であるシティブロック距離、ユークリッド距離、線形識別関数、部分空間法、KNN法、ベイズ識別法、およびニューラルネットによる方法などが挙げられる。ここでは、詳細な説明は省略するが、何れの場合にも、以下のような手順をとって正解情報を推測する。
〈手順1〉文字の教師データを収集(正解情報のラベル付き)
〈手順2〉この〈手順1〉を用いて学習
〈手順3〉入力された文字データを〈手順2〉の学習結果を使って識別
このときの〈手順1〉の情報と〈手順3〉の情報とがどのくらい似ているのかを示す尺度が「評価スコア(評価値)」となる。この評価スコアを0から順に並べ、例えば評価スコアの高いものから「認識候補」とする。
また、「リジェクト」は、認識結果が正しいか疑わしい文字を検出する機能である。本実施の形態では、警告文字候補を得るにあたり第1リジェクトと第2リジェクトとを行っている。第1のリジェクトは、文字の単体の性質から警告文字候補を決定するものであり、例えば字形が崩れている場合に、確からしさが低いとみなしリジェクトする。より具体的には、字形の崩れに関する指標として予め定められた評価値(閾値)と、個々の認識候補が有する評価値とを比較し、評価値が閾値以下の文字をリジェクトする。また、第2のリジェクトでは、認識候補間の類似性により、認識結果が疑わしいものを警告文字候補とする。認識候補に類似の文字が含まれる場合、識別が困難なためにリジェクトする。例えば、“0”(数字のゼロ)と”O” (アルファベットのオー)、“エ”(カタカナのエ)と”I” (アルファベット大文字のアイ)、“1”(数字のイチ)と”l” (アルファベット小文字のエル)など、候補間の確からしさの差が小さい場合にリジェクトする。文字認識において、リジェクト誤りが多いとそれを修正するオペレータの手間が多くなる。一方、リジェクト漏れが多いと入力精度が低下する。これらは、トレードオフの関係にある。
また、「文脈処理」は文字列を認識する際に、どのような内容が筆記されているか、を定義する技術である。例えば、ある文字列の中でN個の文字列または単語の組み合わせがどの程度出現するかの確率であるN−gramによる確率や、いくつかの文字列を一つの形式で表現するための正規表現によるパターンなどが用いられる。この正規表現では、何文字目に出てくる文字がどのような種類の文字なのか、といった並び規則である文脈パターンが予め定義されている。正規表現を用いる処理は、例えば、工場の部品の型番など、文脈パターンが明らかなものには特に有効である。
〔リジェクト処理の流れ〕
図3は、文字認識装置10によって行われるリジェクト処理の流れを示すフローチャートである。
まず、認識対象取得部21は、所定の文字列を有する認識対象を取得する(ステップ101)。この取得は、ペン型装置70やタブレット(図示せず)等で入力された文字の筆跡情報や、スキャナ82等によってスキャンされた手書きや活字画像である。文字切り出し部22は、認識対象を1文字単位に切り出す(ステップ102)。そして、単文字認識部23は、切り出した個々の文字に対する単文字認識処理を行い、文字ごとに認識候補を複数、取得する(ステップ103)。
〔リジェクト処理の流れ〜文字分割と単文字認識処理〕
図4(a)、(b)は、ステップ101〜ステップ103にて行われる文字分割、単文字認識の処理を説明するための図である。図4(a)は、取得された認識対象200を示し、図4(b)は、認識対象200を201〜208の単文字に分割し、個々の認識候補が取得されている。認識候補として、各認識候補の文字と、各認識候補に対する評価スコア(評価値)が取得される。
図4(a)に示すように、認識対象200は、8つの単文字からなる文字列である。文字切り出し部22は、この認識対象を201〜208の単文字に分割している。単文字認識部23は、各単文字に対して認識候補の文字と評価スコアを与えている。単文字201に対しては、認識候補“D” に“0.87”の評価スコアと、認識候補“P”に“0.77”の評価スコアを与えている。同様に、単文字202に対して、数字の“1” に“0.95”、アルファベット小文字の“l”に“0.94”を与えている。単文字203に対して、数字の“3” に“0.99”、アルファベット小文字の“s”に“0.21”を与えている。単文字204では、アルファベット大文字の“Y” に“0.96”、アルファベット小文字の“y”に“0.31”を与えている。単文字205では、数字の“0” に“0.96”、アルファベット小文字の“o”に“0.94”を与えている。単文字206では、数字の“9” に“0.98”、数字の“4”に“0.23”を与えている。単文字207では、アルファベット小文字の“b” に“0.97”、数字の“6”に“0.96”を与えている。そして、単文字208では、アルファベット大文字 “Z” の認識候補に“0.91”の評価スコアを与え、数字の“2” の認識候補に“0.50” の評価スコアを与えている。
なお、漢字のように文字の分割位置があいまいな文字の場合には、仮分割を行い、後でつながりを評価する。例えば、“言語”では、“言”と“言”と“吾”といった3分割か、“言”と“語”といった2分割が行われ、後の文脈処理により、つながりを評価して分割が決定される。
〔リジェクト処理の流れ〜文脈処理〕
図3のステップ103の処理の後、文脈処理部24は、文脈処理によって文字列としての認識候補を得る(ステップ104)。
図5は、ステップ104によって行われる文脈処理を説明するための図である。ここでは、文脈処理の一例である正規表現301として、以下の並び規則が示されている。
[A−Za−z] [0−9]+ [A−Za−z] [0−9]+
ここで、最初の[A−Za−z]は、最初の単文字201に、このカギ括弧の中のいずれかが必ず来ることが示されている。これによると、単文字201には、“アルファベット大文字のA〜Zまたはアルファベット小文字のa〜z”が来る。同様に、次の単文字202には、“数字の0〜9”が来る。次の記号“+”は、1文字以上続く符号であり、次の単文字203には、“数字の0〜9”が来る。同様に、単文字204には、“アルファベット大文字のA〜Zまたはアルファベット小文字のa〜z”が来て、次の単文字205には、“数字の0〜9”が来る。次の記号“+”は、1文字以上続く符号であり、単文字206、207、208には、“数字の0〜9”が来ることが推定される。
図5に示す例で、単に評価スコアの1位候補だけを採択した場合には、
D13Y09bZ
が選択される。
一方、正規表現301に基づく文脈パターンが適応される場合には、
D13Y0962
が選択される。
〔リジェクト処理の流れ〜第1のリジェクト〕
図3のステップ104の処理の後、第1のリジェクト出力部25は、第1のリジェクトとして、認識候補の評価スコアが第1の閾値以下のものをリジェクトする(ステップ105)。第1のリジェクト出力部25は、第1の警告文字候補手段の一つとして機能する。
図6は、ステップ105によって行われる第1のリジェクト処理を説明するための図である。ここでは、ステップ105で判断する閾値(第1の閾値)を0.6とし、評価スコアが第1の閾値0.6以下の文字を第1のリジェクトとする。より具体的には、認識候補のうち、前述の文脈パターンに合致して、より評価スコアの高いものが選択され、閾値との比較がされる。
図6に示す例では、まず、単文字201は、パターンからは、“D”と“P”とが合致するが、この中で評価スコアの高い“D”が選択される。“D”の評価スコアが“0.87”で第1の閾値0.6より高く、リジェクトされない。また、単文字202は、パターンから“1”が選択され、評価スコアが“0.95”で第1の閾値0.6より高く、リジェクトされない。単文字203は、パターンから“3”が選択され、評価スコアが“0.99”で第1の閾値0.6より高く、リジェクトされない。単文字204は、パターンから“Y”が選択され、評価スコアが“0.96”で第1の閾値0.6より高く、リジェクトされない。単文字205は、パターンから数字の “0”が選択され、評価スコアが“0.96”で第1の閾値0.6より高く、リジェクトされない。単文字206は、パターンからは“9”か“4”が選択されるが、評価スコアの高い“9”が選択され、評価スコアの“0.98”が第1の閾値0.6より高く、リジェクトされない。単文字207は、“b”の評価スコアは高いものの、パターンから“6”が選択され、評価スコアが“0.96”で第1の閾値0.6より高く、リジェクトされない。
一方、単文字208は、“Z”の評価スコアは高いものの、パターンから“2”が選択される。この認識候補“2”の評価スコアは “0.50”であり、第1の閾値0.6より低い。この結果、図6に示す第1のリジェクトの例では、単文字208だけがリジェクトされる。この単文字208のリジェクトは、認識対象の並び規則(パターン)から特定された認識候補“2”に対して評価スコアが予め定めた値より低い場合の文字を、警告の候補である警告文字候補とする。
〔リジェクト処理の流れ〜第2のリジェクト〕
図3のステップ105による第1のリジェクトの後、相対スコア算出部26は、文字ごとに他の認識候補との間の相対スコアを算出する(ステップ106)。そして、第2の警告文字候補手段の一つとして機能する第2のリジェクト出力部27は、第2のリジェクトとして、認識候補の相対スコアが第2の閾値を下回る文字をリジェクトする(ステップ107)。この第2のリジェクトでは、各々の単文字にて、文脈処理を考慮し、文字認識率の高い一方の認識候補と、文字認識率の高い他方の認識候補との評価スコアの相対的な差を、予め定めた数値と比較し、リジェクトする。
図7は、ステップ106における相対スコアの算出処理、および第2のリジェクト処理を説明するための図である。
相対スコアは、他方の認識候補との関係を表現したものである。ここでは、
相対スコア = 評価スコア ÷ 全評価スコアの合計
で算出している。そして、単文字ごとの相対スコアの合計は1となる。
図7に示す例では、単文字201の相対スコアは、以下のようになる。
D : 0.87÷(0.87+0.77)≒0.53
P : 0.77÷(0.87+0.77)≒0.47
単文字202の相対スコアは、
1 : 0.95÷(0.95+0.94)≒0.50
l : 0.94÷(0.95+0.94)≒0.50
単文字203の相対スコアは、
3 : 0.99÷(0.99+0.21)≒0.83
s : 0.21÷(0.99+0.21)≒0.17
単文字204の相対スコアは、
Y : 0.96÷(0.96+0.31)≒0.76
y : 0.31÷(0.96+0.31)≒0.24
単文字205の相対スコアは、
0 : 0.96÷(0.96+0.94)≒0.51
o : 0.94÷(0.96+0.94)≒0.49
単文字206の相対スコアは、
9 : 0.98÷(0.98+0.23)≒0.81
4 : 0.23÷(0.98+0.23)≒0.19
単文字207の相対スコアは、
b : 0.97÷(0.97+0.96)≒0.50
6 : 0.96÷(0.97+0.96)≒0.50
単文字208の相対スコアは、
Z : 0.91÷(0.91+0.50)≒0.65
2 : 0.50÷(0.91+0.50)≒0.35
尚、図7に示す例では、各単文字について2つの認識候補から相対スコアを算出しているが、複数のスコアから相対スコアを算出してもよい。
第2のリジェクト出力部27は、以上のようにして算出された相対スコアが第2の閾値を下回るか否かを判断する。ここでは、予め定められた第2の閾値として、0.6を採用し、0.6を下回る文字をリジェクトする。単文字201は、“D”の相対スコアが“0.53”で第2の閾値0.6を下回っており、リジェクトされる。単文字202は、文脈処理で選ばれた “1”の相対スコアが“0.50”で第2の閾値0.6を下回っており、リジェクトされる。単文字203は、文脈処理で選ばれた “3”の相対スコアが“0.83”で第2の閾値0.6を下回ることはなく、リジェクトされない。単文字204は、“Y”の相対スコアが“0.76”で第2の閾値0.6を下回ることはなく、リジェクトされない。単文字205は、文脈処理で選ばれた “0”の相対スコアが“0.51”で第2の閾値0.6を下回っており、リジェクトされる。単文字206は、評価スコアの高い“9”の相対スコアが“0.81”で第2の閾値0.6を下回ることはなく、リジェクトされない。単文字207は、文脈処理で選ばれた “6”の相対スコアが“0.50”で第2の閾値0.6を下回っており、リジェクトされる。単文字208は、文脈処理で選ばれた “2”の相対スコアが“0.35”で第2の閾値0.6を下回っており、リジェクトされる。
なお、上述した第2のリジェクト処理について、本実施の形態では、ステップ104の文脈処理の結果を利用している。しかしながら、文脈処理を経由せずに個々の認識候補とその評価スコアを用いて認識候補間の類似性を判断し、リジェクトを行うように構成することもできる。
〔リジェクト処理の流れ〜入れ替え文字生成と文脈再評価〕
図3のステップ107による第2のリジェクトの後、入れ替え文字列生成部28は、リジェクトされた文字に対して、他の認識候補と入れ替えた文字列を生成する(ステップ108)。そして、文脈処理に合致するか否かを判断し(ステップ109)、合致しない場合には(ステップ109でNo)、第1のリジェクト処理でリジェクトされているか否かを判断する(ステップ110)。第1のリジェクト処理でリジェクトされていなければ(ステップ110でNo)、リジェクトを解除する(ステップ111)。一方、文脈処理に合致する場合には(ステップ109でYes)、および、第1のリジェクト処理でリジェクトされていれば(ステップ110でYes)、リジェクトを解除せず(ステップ112)、リジェクトを出力して(ステップ113)、リジェクト処理を終了する。このリジェクトの出力としては、例えばディスプレイ15に文字列を表示し、その文字列のリジェクトする文字を色枠や太枠などで強調表示して出力する等がある。
図8は、ステップ108の入れ替え文字生成処理と、ステップ109〜ステップ112の文脈再評価処理を説明するための図である。
文脈のパターンは、前述と同様に、正規表現301として以下に示す。
[A−Za−z] [0−9]+ [A−Za−z] [0−9]+
第2のリジェクト処理によりリジェクトされた単文字201、202、205、207、208を各々、入れ替え、以下のように入れ替え文字を生成する。
入れ替え文字401 … P13Y0962
入れ替え文字402 … Dl3Y0962
入れ替え文字403 … D13Yo962
入れ替え文字404 … D13Y09b2
入れ替え文字405 … D13Y096Z
入れ替え文字401は、単文字201の“D” を“P”に入れ替えたものであるが、正規表現301の文脈のパターンに合致することから、リジェクトを解除しない。すなわち、疑わしい認識候補が存在することから、警告文字候補としてリジェクト出力がなされるように制御する。
入れ替え文字402は、単文字202の数字“1” をアルファベット小文字(エル)“l”に入れ替えたものであるが、正規表現301の文脈のパターンに合致しない。そのために、リジェクトを解除する。
入れ替え文字403は、単文字205の数字“0” をアルファベット小文字 “o”に入れ替えたものであるが、正規表現301の文脈のパターンに合致せず、リジェクトを解除する。
入れ替え文字404は、単文字207の数字“6” をアルファベット小文字 “b”に入れ替えたものであるが、正規表現301の文脈のパターンに合致せず、リジェクトを解除する。
入れ替え文字405は、単文字208の数字“2” をアルファベット大文字 “Z”に入れ替えたものであり、パターンに合致しない。しかしながら、単文字208は、第1のリジェクト処理でリジェクトされていることから、リジェクトが解除されない。
なお、図8では、リジェクトが解除された単文字202、単文字205、および単文字207では、相対スコアが、“1.0”と “0”との値に変更されている。
このように、本実施の形態では、第1のリジェクト処理による“字形が崩れている文字”、および、入れ替え文字生成と文脈再評価による“他の候補が正しい可能性が高い文字”がリジェクトされる。リジェクト誤りが多いとそれを修正するオペレータの手間が多くなり、リジェクト漏れが多いと入力精度が低下する。本実施の形態では、これらのトレードオフの関係を良好に保つ文字認識装置10、文字認識処理システム100、およびコンピュータにて実行されるプログラムを提供している。
10…文字認識装置、15…ディスプレイ、16…キーボード、17…ポインティングデバイス、21…認識対象取得部、22…文字切り出し部、23…単文字認識部、24…文脈処理部、25…第1のリジェクト出力部、26…相対スコア算出部、27…第2のリジェクト出力部、28…入れ替え文字列生成部、29…文脈再処理部、30…リジェクト解除決定部、70…ペン型装置、82…スキャナ、100…文字認識処理システム

Claims (7)

  1. 認識対象から単文字を抽出する抽出手段と、
    前記認識対象の並び規則を用いた文脈処理により特定された認識候補の中で前記単文字の字形の崩れに関する指標により評価された評価値が予め定めた値より低いものを警告文字として出力するとともに、当該認識候補に対して当該認識候補を他の認識候補に入れ替えた文字列を生成し、当該文字列が当該認識対象の並び規則を用いた文脈再評価に合致しない場合に、単文字に対する複数の認識候補間に類似の文字が含まれる場合の警告の候補である警告文字候補の中から警告文字候補を減らし、残った警告文字候補を警告文字として出力する警告手段とを有する文字認識装置。
  2. 前記警告手段は、前記認識対象の並び規則を用いた文脈処理により特定された認識候補の評価値が予め定めた値より低い場合の文字を、警告の候補である警告文字候補とすることを特徴とする請求項1記載の文字認識装置。
  3. 認識対象から単文字を抽出する抽出手段と、
    前記認識対象の並び規則を用いた文脈処理により特定された認識候補の中で前記単文字の字形の崩れに関する指標により評価された評価値が予め定めた値より低いものを警告の候補である第1の警告文字候補とする第1の警告文字候補手段と、
    前記単文字の複数の認識候補の中から特定された認識候補に対し、類似の文字が含まれている場合の文字を、警告の候補である第2の警告文字候補とする第2の警告文字候補手段と、
    特定された前記認識候補による認識処理を行った後に、認識候補を入れ替えた文字列を生成し、生成した当該文字列が前記認識対象の並び規則を用いた文脈再評価に合致しない場合に、前記第2の警告文字候補手段による第2の警告文字候補を解除して除外する警告文字候補解除手段と、
    特定された認識候補の文字列の中から、前記第1の警告文字候補および前記警告文字候補解除手段において残った第2の警告文字候補を警告文字として識別できる状態で表示するように制御する警告手段と
    を有する文字認識装置。
  4. 前記第2の警告文字候補手段は、複数の認識候補間の相対評価値を算出し、算出された相対評価値が予め定めた値よりも低い場合に前記類似の文字が含まれていると判断することを特徴とする請求項記載の文字認識装置。
  5. 認識対象から単文字を抽出する抽出手段と、
    前記単文字に対して複数の認識候補と評価値とを取得する取得手段と、
    前記認識対象が有する並び規則を用いた文脈処理により、前記複数の認識候補の中から認識候補を特定する文脈処理手段と、
    特定された前記認識候補の評価値が予め定めた値よりも低い場合に、低い評価値の単文字を警告文字とする警告手段と
    を有し、
    前記警告手段は、前記認識対象の並び規則を用いた文脈処理により特定された認識候補の中で前記単文字の字形の崩れに関する指標により評価された評価値が予め定めた値より低いものを警告文字とするとともに、当該認識候補に対して当該認識候補を他の認識候補に入れ替えた文字列を生成し、当該文字列が当該認識対象の並び規則を用いた文脈再評価に合致しない場合に、単文字に対する複数の認識候補間に類似の文字が含まれる場合の警告の候補である警告文字候補の中から警告文字候補を減らして、残った警告文字候補を警告文字とすることを特徴とする文字認識装置。
  6. 文字認識装置と、使用者記入情報取得装置とを含み、
    前記文字認識装置は、
    前記使用者記入情報取得装置から取得した認識対象から単文字を抽出する抽出手段と、
    前記認識対象の並び規則を用いた文脈処理により特定された認識候補の中で前記単文字の字形の崩れに関する指標により評価された評価値が予め定めた値より低いものを警告文字として出力するとともに、当該認識候補に対して当該認識候補を他の認識候補に入れ替えた文字列を生成し、当該文字列が当該認識対象の並び規則を用いた文脈再評価に合致しない場合に、単文字に対する複数の認識候補間に類似の文字が含まれる場合の警告の候補である警告文字候補の中から警告文字候補を減らし、残った警告文字候補を警告文字として出力する警告手段と
    を有することを特徴とする文字認識処理システム。
  7. コンピュータに、
    認識対象から単文字を抽出する機能と、
    前記認識対象の並び規則を用いた文脈処理により特定された認識候補の中で前記単文字の字形の崩れに関する指標により評価された評価値が予め定めた値より低いものを警告文字として出力するとともに、当該認識候補に対して当該認識候補を他の認識候補に入れ替えた文字列を生成し、当該文字列が当該認識対象の並び規則を用いた文脈再評価に合致しない場合に、単文字に対する複数の認識候補間に類似の文字が含まれる場合の警告の候補である警告文字候補の中から警告文字候補を減らし、残った警告文字候補を警告文字として出力する機能と
    を実現させるプログラム。
JP2015081548A 2015-04-13 2015-04-13 文字認識装置、文字認識処理システム、およびプログラム Active JP6600973B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015081548A JP6600973B2 (ja) 2015-04-13 2015-04-13 文字認識装置、文字認識処理システム、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015081548A JP6600973B2 (ja) 2015-04-13 2015-04-13 文字認識装置、文字認識処理システム、およびプログラム

Publications (2)

Publication Number Publication Date
JP2016201013A JP2016201013A (ja) 2016-12-01
JP6600973B2 true JP6600973B2 (ja) 2019-11-06

Family

ID=57424411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015081548A Active JP6600973B2 (ja) 2015-04-13 2015-04-13 文字認識装置、文字認識処理システム、およびプログラム

Country Status (1)

Country Link
JP (1) JP6600973B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6872123B2 (ja) * 2017-03-24 2021-05-19 富士フイルムビジネスイノベーション株式会社 画像処理装置、及びプログラム
JP6490852B1 (ja) * 2018-03-09 2019-03-27 株式会社東芝 不読判定閾値設定方法及び不読判定閾値設定装置
KR20200010777A (ko) * 2018-07-23 2020-01-31 휴렛-팩커드 디벨롭먼트 컴퍼니, 엘.피. 유사 문자의 과거 인식 결과를 이용하는 문자 인식
JP7317612B2 (ja) 2019-07-18 2023-07-31 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
WO2023204265A1 (ja) * 2022-04-20 2023-10-26 京セラ株式会社 信号処理システムおよび信号処理方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60156190A (ja) * 1984-01-13 1985-08-16 Mitsubishi Electric Corp 複合語の読取方法
JPS62251989A (ja) * 1986-04-25 1987-11-02 Mitsubishi Electric Corp 日本文読取装置
JPH0272495A (ja) * 1988-09-08 1990-03-12 Toshiba Corp 文字読取システム
JPH02135588A (ja) * 1988-11-16 1990-05-24 Mitsubishi Electric Corp 読取装置
JPH09185674A (ja) * 1995-12-28 1997-07-15 Omron Corp 誤認識文字検出装置、誤認識文字訂正装置、誤認識文字検出方法、および、誤認識文字訂正方法
JP2012093968A (ja) * 2010-10-27 2012-05-17 Panasonic Corp 文字認識装置及び文字認識方法、認識文字修正装置及び認識文字修正方法、並びにプログラム

Also Published As

Publication number Publication date
JP2016201013A (ja) 2016-12-01

Similar Documents

Publication Publication Date Title
JP6600973B2 (ja) 文字認識装置、文字認識処理システム、およびプログラム
US7428516B2 (en) Handwriting recognition using neural networks
EP1564675B1 (en) Apparatus and method for searching for digital ink query
US20100246964A1 (en) Recognizing handwritten words
US10963717B1 (en) Auto-correction of pattern defined strings
JP6055297B2 (ja) 文字認識装置及び方法、文字認識プログラム
CN114730241B (zh) 触摸式用户界面输入中的手势笔画识别
Hakro et al. Issues and challenges in Sindhi OCR
WO2007094078A1 (ja) 文字列検索方法およびその装置
Kompalli et al. Devanagari OCR using a recognition driven segmentation framework and stochastic language models
EP2138959B1 (en) Word recognizing method and word recognizing program
US11593591B2 (en) Optical character recognition systems and methods
JP7021496B2 (ja) 情報処理装置及びプログラム
Premaratne et al. Lexicon and hidden Markov model-based optimisation of the recognised Sinhala script
US9342739B2 (en) Character recognition apparatus, non-transitory computer readable medium, and character recognition method
Kasem et al. Advancements and Challenges in Arabic Optical Character Recognition: A Comprehensive Survey
US10657404B2 (en) Character recognition device, character recognition method, and character recognition program
Sampath et al. Online handwritten character recognition for malayalam
JP5712415B2 (ja) 帳票処理システム及び帳票処理方法
JP6575116B2 (ja) 文字認識装置、文字認識処理システム、およびプログラム
JP7410532B2 (ja) 文字判定装置及び文字判定プログラム
JP5845726B2 (ja) 文字認識装置、文字認識結果処理システム及びプログラム
JP7095450B2 (ja) 情報処理装置、文字認識方法、および文字認識プログラム
JP2013200796A (ja) 文字認識学習装置、文字認識装置、およびプログラム
Satter et al. Open Vocabulary Word Recognition From Transcribed Bangla Texts

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190923

R150 Certificate of patent or registration of utility model

Ref document number: 6600973

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350