JP6102374B2 - 読取文字訂正用のプログラムおよび文字読取装置 - Google Patents

読取文字訂正用のプログラムおよび文字読取装置 Download PDF

Info

Publication number
JP6102374B2
JP6102374B2 JP2013053274A JP2013053274A JP6102374B2 JP 6102374 B2 JP6102374 B2 JP 6102374B2 JP 2013053274 A JP2013053274 A JP 2013053274A JP 2013053274 A JP2013053274 A JP 2013053274A JP 6102374 B2 JP6102374 B2 JP 6102374B2
Authority
JP
Japan
Prior art keywords
character
correction
engine
characters
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013053274A
Other languages
English (en)
Other versions
JP2014178954A (ja
Inventor
泰正 笹野
泰正 笹野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2013053274A priority Critical patent/JP6102374B2/ja
Publication of JP2014178954A publication Critical patent/JP2014178954A/ja
Application granted granted Critical
Publication of JP6102374B2 publication Critical patent/JP6102374B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は、タッチパネルディスプレイを備えた情報処理装置における文字の読取処理に関するもので、特に本発明は、タッチパネルディスプレイに対するユーザの操作に応じて読取結果に生じている誤りを訂正するための技術に関する。
近年の携帯電話などの情報端末装置には、カメラが標準装備されると共に、このカメラでの撮影により生成された文字列の画像を処理するOCRアプリケーションを具備するものが多く出回っている。さらに、このOCRアプリケーションと連動して、OCRにより読み取られた名刺などの情報をデータベースとして管理するアプリケーションが組み込まれる場合もある(たとえば特許文献1を参照。)。
また、情報端末装置における文字読取処理に関しては、読取精度を向上することを目的とした種々の技術が開発されている(たとえば特許文献2,3を参照。)。
特開2010−217962号公報 特開2003−216893号公報 特開2008−250818号公報
上記特許文献2,3に代表されるような技術開発によって文字の読み取り精度はかなり向上しているが、どのようなシーンでも100%の確率で文字を認識できるとは限らず、読取結果に誤りが生じることもある。この誤りはユーザの手で訂正するしかなく、その作業を行うには文字入力機能(IME)を呼び出さなければならないため、訂正作業にかなりの労力がかかる。
本発明は、上記の問題に着目すると共に、近年、スマートフォンなどのタッチパネルディスプレイを備えた情報端末装置の利用が急増していることをふまえて、読取結果を表示するタッチパネルディスプレイに対して簡単な操作を行うことによって、誤認識された文字を正しい文字に訂正できるようにすることを課題とする。
本発明によるプログラムは、カメラとタッチパネルディスプレイとに接続され、カメラでの撮影により生成された文字列の画像から当該文字列中の各文字を読み取る文字読取手段の機能が設定されたコンピュータに、文字読取手段によって読み取られた読取文字列を訂正する訂正処理手段の機能を付与するものである。この訂正処理手段には、それぞれ異なるアルゴリズムに基づき訂正対象の文字に対する置き換え用の候補文字を導出する複数種の訂正用エンジンが含まれると共に、以下に示す対応付けテーブル、判別手段、エンジン選択手段、制御手段が設けられる。
対応付けテーブルは、上記した複数種の訂正用エンジンをそれぞれタッチパネルディスプレイにおける特有の操作パターンに対応付けたものである。
判別手段は、文字読取手段により導出された読取文字列がタッチパネルディスプレイに表示されている状態下で、当該読取文字列の表示範囲に対して実施される操作を受け付けて、その操作の対象となった位置により読取文字列中の訂正対象の文字を判別する。
エンジン選択手段は、読取文字列の表示範囲に対して実施された操作のパターンにより対応付けテーブルを検索して当該操作パターンに対応する訂正用エンジンを選択する。
制御手段は、エンジン選択手段により選択された訂正用エンジンを起動して読取文字列中の訂正対象の文字を処理させ、この訂正用エンジンが前記訂正対象の文字に対して導出した候補文字をタッチパネルディスプレイに表示すると共に、表示された候補文字を承認するタッチパネルディスプレイ上での操作を受け付けて、読取文字列内の前記訂正対象の文字を承認された候補文字に置き換える。
上記の構成によれば、タッチパネルディスプレイに表示された読取文字列の中に誤りがある場合には、ユーザは、その誤認識されている文字が表示されている位置に対し、あらかじめ知らされていた情報に基づき対応付けテーブルに登録されている操作パターンの中の1つによる操作を実施する。この操作により訂正対象の文字が判別されると共に、実施された操作パターンに対応する訂正用エンジンが呼び出されて訂正対象の文字に対する置き換え用の候補文字が導出され、タッチパネルディスプレイに表示される。さらに、ユーザが表示された候補文字を承認する操作をタッチパネルディスプレイ上で行うと、読取文字列内の訂正対象の文字が選択された候補文字に置き換えられる。
このように、ユーザは、読取文字列を表示中のタッチパネルディスプレイに対して簡単な操作を行うことによって、誤認識された文字を選択してその文字を正しい文字に訂正することができるので、文字入力機能を使用する方法よりも容易に訂正を完了することができる。
一実施形態においては、対応付けテーブルには、読取文字列の少なくとも一文字を指定する操作と、この操作により指定された文字を処理させる訂正用エンジンを指定する操作との組み合わせによる操作パターンが登録される。すなわち、訂正対象の文字を指定する操作を行った後に、訂正用エンジンを指定する操作を行うことによって、特定の訂正用エンジンを起動させることができる。
ただし、対応付けテーブルに登録される操作パターンは上記の形態に限らず、訂正対象の文字と訂正用エンジンとを1つの操作により指定するようにした操作パターンを登録することもできる。
訂正用エンジンとしては、様々な機能を有するものを導入することができるが、ここで3種類のエンジンを対応づける操作パターンの例と共にあげる。
まず第1の訂正用エンジンは、読取文字列内の訂正対象の文字に対して文字読取手段が導出した他の文字を文字読取手段より取得して、取得した文字を候補文字として制御手段に渡すものである。この訂正用エンジンを指定する操作としては、「誤って認識された文字を他の文字に変更する」という観念を想起させるフリック操作またはタップ操作を設定することができる。
第2の訂正用エンジンは、隣り合う一対の文字とこれらの文字を結合した構成の単独の文字とを対応付けた辞書から前記読取文字列内の訂正対象の文字に対応する一対の文字を導出して、導出された文字の組み合わせを候補文字として制御手段に渡すものである。この第2の訂正用エンジンを指定する操作としては、「誤って結合された文字を分割する」という観念を想起させるピンチアウト操作を設定することができる。
第3の訂正用エンジンは、操作により読取文字列内で隣り合う一対の文字が訂正対象として指定されたことを条件に、単独の文字と当該文字を2つに分割して得られる一対の文字とを対応付けた辞書から前記指定された一対の文字に対応する単独の文字を導出して、導出された文字を候補文字として制御手段に渡すものである。この第3の訂正用エンジンを指定する操作としては、「誤って2つに分離された文字を結合する」という観念を想起させるピンチイン操作を設定することができる。
上記の訂正処理システム用のプログラムは、たとえば、文字読取手段を含むOCRアプリケーション全体のプログラムに含めて提供することができるが、既存のOCRアプリケーションに新機能を追加するためのバージョンアップ用のプログラムとして提供することもできる。
本発明による文字入力装置は、カメラおよびタッチパネルディスプレイが配備された筐体の内部に、上記の文字読取手段や訂正処理手段が組み込まれた制御部を配備した構成のものである。この文字入力装置は、スマートフォンやタブレット型の端末装置に設けられて、カメラによる撮影で生成された文字列の画像から当該文字列の各構成文字を読み取って、その読取結果である読取文字列をタッチパネルディスプレイに表示すると共に、表示された読取文字列の表示範囲に対して実施される特有のパターンによる操作を受け付けて、その操作の対象となった位置に表示されている文字への置き換え用の候補文字を導出してタッチパネルディスプレイに表示し、ユーザが候補文字を承認したことに応じてその承認された候補文字により読み取り文字列を訂正する。
上記の構成によれば、読取結果に誤りがあった場合でも、タッチパネル上での簡単な操作により誤りを訂正することができるので、利便性が大幅に高められる。
本発明によれば、タッチパネルディスプレイ上に表示された読取文字列内の誤りが生じている箇所に対して簡単な操作を行うことにより、読取文字列内の誤りを訂正することが可能であるので、文字読取処理の利便性が高められ、様々な目的に応用する上での不便を解消することができる。
本発明が適用された文字読取装置の機能ブロック図である。 対応付けテーブルのデータ構成例を示す図である。 図2のテーブル中のエンジンAによる訂正処理が行われる場合の例を示す図である。 図2のテーブル中のエンジンAによる訂正処理が行われる場合の他の例を示す図である。 図2のテーブル中のエンジンBによる訂正処理が行われる場合の例を示す図である。 図2のテーブル中のエンジンCによる訂正処理が行われる場合の例を示す図である。 欧文の読取文字列に対する訂正処理が行われる場合の具体例を2例並べて示した図である。 数字が訂正対象として指定された場合の訂正処理の例を示す図である。 OCRアプリケーションにおける一連の処理手順を示すフローチャートである。
図1は、本発明が適用された文字読取装置の構成を示す。
この実施例の文字読取装置100はスマートフォンに組み込まれるもので、スマートフォンの筐体4(図3〜図8を参照。)に取り付けられたカメラ1およびタッチパネルディスプレイ2と、筐体4内の図示しない制御部に導入されたOCRアプリケーション3とにより構成される。
OCRアプリケーション3には、文字読取処理部31,GUI制御部32,エンジン選択部33などの処理部のほか、各種文字のモデル画像が登録された文字辞書34,読取結果記憶部35,対応付けテーブル36,複数種の訂正処理用エンジン30を含むエンジンデータベース300(以下、個々の訂正処理用エンジン30の名称を「エンジンA」「エンジンB」「エンジンC」・・・とする。)などが含まれる。
なお、文字読取処理部31やGUI制御部32は、図示しないオペレーティングシステムを介してカメラ1やタッチパネルディスプレイ2と情報をやりとりする。
文字読取処理部31は、オペレーティングシステムからの起動命令に応じてカメラ1と共に起動し、カメラ1により生成された文字列の画像を取り込んで、その画像から文字列を含む領域を抽出する。さらに文字読取処理部31は、抽出された領域内の画像を文字毎に切り分け、この切り分けにより設定された個々の文字画像を文字辞書34内の各モデル画像と照合し、所定値以上の一致度が得られたモデル画像に対応する文字を一致度が高いものから順に抽出する。さらに、文字読取処理部31は、各文字画像にそれぞれ最も高い一致度が得られた文字をあてはめることによって読取結果を示す読取文字列を生成する。
生成された読取文字列は、GUI制御部32に渡されるほか、読取結果記憶部35に保存される。また、文字画像に対する一致度が2番目以下となった各文字も、それぞれ対応する文字画像の語順に紐付けられて一致度と共に読取結果記憶部35に保存される。
GUI制御部32は、文字読取処理部31から提供された読取文字列をタッチパネルディスプレイ2に表示する。
ここまでに記載した機能は一般的なものであるが、さらにこの実施例のOCRアプリケーション3には、タッチパネル2に表示された読取文字列中の誤りを、ユーザの操作に応じて訂正する機能が設けられている。この訂正処理は、GUI制御部32がエンジン選択部33およびエンジンデータベース300と協働して実施するものである。
エンジンデータベース300には、それぞれ異なるアルゴリズムに基づき訂正対象の文字に対する置き換え用の候補文字を導出する複数種の訂正用エンジン30が含まれる。図面および以下の説明では、これら個々の訂正用エンジン30の名称を「エンジンA」「エンジンB」「エンジンC」・・・とする。この実施例では、各訂正用エンジン30にそれぞれ特有のパターンによる指定操作を対応づけ、対応付けの関係を対応付けテーブル36に登録している。
図2は、対応付けテーブル36のデータ構成例を示す。この実施例の対応付けテーブル36では、各種操作パターンの名称と各訂正用エンジン30の名称とが一意的に対応づけられると共に、各エンジン30で実施される処理の内容を簡単に示す用語が登録されている。
図1に参照を戻す。GUI制御部32は、読取文字列を表示中のタッチパネルディスプレイ2において、訂正対象箇所を指定する操作とその箇所の訂正を指示する操作とを受け付ける。なお、後記するように、訂正を指定する操作は、実質的には、使用する訂正用エンジン30を指定する操作となる。図2に示すように、この2つの操作は個別に実施される場合が多いが、1つの操作として統合される場合もある。エンジン選択部33は、GUI制御部32が受け付けた操作パターンにより対応付けテーブル36を検索して、操作パターンに対応する訂正用エンジン30を選択し、その選択結果をGUI制御部32に通知する。
この通知を受けたGUI制御部32は、選択された訂正用エンジン30を起動して訂正対象の文字を供給し、その訂正用エンジン30から当該エンジン30が導出した候補文字を取得してタッチパネルディスプレイ2に表示する。表示された候補文字を選択する操作がタッチパネルディスプレイ2上で行われると、GUI制御部32は、選択された候補文字により読取文字列中の訂正対象の文字を置き換えることにより読取文字列を訂正する。訂正された読取文字列は文字読取処理部31にフィードバックされ、文字読取処理部31により読取結果記憶部35に保存されていた読取文字列が訂正される。
この実施例でのタッチパネルディスプレイ2における候補文字の表示は、読取文字列中で選択された訂正対象の文字を未確定表示の候補文字により置き換える方法や、候補文字のリストを表示する方法により行われる。
以下、読取文字列に生じた誤りを訂正するために実施される操作や、その操作に伴いタッチパネルディスプレイ2上に生じる表示の変遷について、具体的に説明する。
まず、図3の例では、文字読取処理部31により「株式会社」という文字列を対象にした読取処理が行われたが、末尾の「社(しゃ)」が「杜(もり)」という文字であると誤認識されたものとしている。
この例では、読取文字列が表示されたタッチパネルディスプレイ2に対し、その読取文字列内の誤り部分をタップする操作により、訂正対象の文字を指定する。図3(1)に示すように、タップされた文字「杜」には、訂正対象の文字であることを示すカーソル20が設定される。
図3(1)は、タップ操作後に、カーソル20の位置を上から下に向かってはじく操作(フリック操作)が行われた例を示す。図2に示した対応付けテーブル36によれば、タップ操作とフリック操作との組み合わせは訂正用エンジンAに対応する。よって、この例ではエンジンAが起動して候補文字が導出される。
この実施例のエンジンAは、図1に一点鎖線で示すように、読取結果記憶部35にアクセスする権限を持っている。具体的に、エンジンAは、GUI制御部32から訂正対象の文字や読取文字列における訂正対象の文字の位置を取得して、それらの情報により読取結果記憶部35を検索して、訂正対象の文字に対応する文字画像につき、当該文字画像に対する候補として抽出されたが読取文字列に採用されなかった文字(一致度が2番目以下となった文字)を読み出す。読み出された各文字は、候補文字として一致度が高いものから順に並べられ、GUI制御部32に渡される。
GUI制御部32では、エンジンAから候補文字の提供を受けると、その中の第1の候補文字により読取文字列内のカーソル20内の文字を更新する。図3(2)は、この更新後の画面の例を示すもので、カーソル20内の文字が「杜」から「社」に変更されると共に、画面の右下にOKボタン21が設定されている。
この画面表示に対し、ユーザが置き換えられた候補文字が正しいと判断してOKボタン21をタップすると、図3(3)に示すように、カーソル20が消失して、誤認識された「杜」が選択された候補文字「社」に訂正された読取文字列が確定表示される。
上記図3の例では、訂正対象の文字を指定するためのタップ操作に続くフリック操作によってエンジンAが起動し、導出された候補文字が直ちに表示されている。ユーザは意識していないが、タップ操作に続くフリック操作によってエンジンAが指定され、タップ操作により指定された文字に対する置き換え用の候補文字が導出されたことにより、上記の候補文字の表示が実現したのである。
したがって、ユーザは、誤認識された文字に対してタップ操作とフリック操作とを続けて行った後、正しい文字に訂正されたことを確認してOKボタン21を操作することによって、認識の誤りを訂正することができる。文字入力機能を用いて同様の訂正を行う場合と比較すると、訂正作業の効率は格段に向上する。
状況によっては、最初のフリック操作で呼び出された候補文字も誤っていることがあるが、その場合には、さらにフリック操作を行うことによって、2番目以降の候補文字が順に呼び出されてカーソル20の位置の文字が更新される。したがって、ユーザは、訂正対象の文字を選択した後は、正しい文字が表示されるまでフリック操作を続けて確定操作を行うことにより、読取文字列内の誤りを訂正することができる。
また、フリック操作を続けている間に正しい文字を逃してしまった場合には、ユーザはフリック操作の方向を下から上に向かう方向に変更することにより、候補文字の呼び出し順序を反転させて、前に表示された文字を呼び戻すことができる。
エンジンAを起動させるための操作や候補文字の表示は、図3の例に限定されるものではない。たとえば2番目のフリック操作をタップ操作に代えて、1番目のフリック操作によりカーソル20が設定された後の再度のフリック操作に応じてエンジンAを起動させてもよい。また、他の例として、図4では、誤った文字を少し長めにタップする操作(ロングタップ)によって、訂正対象の文字の指定と共に訂正指示を行っている。
図4の例においても、図3の例と同様に、指定された文字にはカーソル20が設定される(図4(1))。この例では、タッチパネルディスプレイ2に対する指の接触時間が所定時間を超えたことに応じてエンジンAが起動し、候補文字の導出に応じて、図4(2)に示すように画面の下部にメニューバー22が表示される。このメニューバー22には、エンジンAにより導出された候補文字が上位3位まで表示されている。
上記のメニューバー22に対し、候補文字の1つを選択する操作が行われると、カーソル20は消失して、訂正対象の文字が選択された候補文字に置き換えられた構成の読取文字列が確定する(図4(3))。これにより読取文字列の訂正は完了する。
なお、メニューバー22に示される3つの候補文字の中に正しい文字がない場合には、メニューバー22内の矢印キーや+、−のキーの操作により、他の候補文字を呼び出すことができる。メニューバー22の表示後に所定時間が経過しても候補文字が選択されない場合には、メニューバー22やカーソル20は消失し、エンジンAによる訂正モードもキャンセルされる。
つぎに、図5に示す例では、「イニシャル」という文字列に対する読取処理が行われたが、先頭の2文字「イニ」が漢字の「仁」であると誤認識されたものとしている。
図5(1)は、この認識結果に対し、ユーザが誤認識による文字「仁」をタップした時点の画面であって、図3や図4の例と同様に、タップされた文字にカーソル20が設定されている。
つぎにこの実施例では、カーソル20の近傍位置でピンチアウト操作が行われている(図5(2))。図2に示した対応付けテーブル36によれば、タップ操作とピンチアウト操作との組み合わせはエンジンBに対応する。よって、ピンチアウト操作に応じてエンジンBが起動して、「仁」に対する置き換え用の候補文字が導出される。
エンジンBには、この事例の「イニ」と「仁」のように、隣り合う関係にあって1つの文字として誤認識されやすい一対の文字とその誤認識を示す文字とが対応づけられて登録された辞書が含まれている。エンジンBは、GUI制御部32から供給された訂正対象の文字によりこの辞書を検索して、訂正対象の文字に対応する一対の文字を候補文字として導出する。
図5(3)は、上記の処理により「イニ」という候補文字が導出され、誤認識による「仁」が「イニ」に置き換えられた画面を示す。この画面では、置き換えられた2つの候補文字に対応する範囲に拡張されたカーソル20が設定されると共に、画面の右下にOKボタン21が登場している。ユーザがOKボタン21をタップすると、図5(4)に示すように、カーソル20が消失して、置き換えられた文字による訂正が確定する。
次に、図6に示す例では「読書」という文字列に対する読取処理を行ったが、先頭の「読」が「言」と「売」という2つの文字に分離されて誤認識されたものとする。
この事例のように誤りの範囲が複数の文字に及ぶ場合には、その訂正箇所の指定はスワイプ操作(始端位置をタッチした後に終端位置まで指をスライドさせる操作)により行われる。図6(1)は、このスワイプ操作により誤認識された「言」および「売」を含む範囲にカーソル20が設定された画面を示す。
つぎに図6の例では、カーソル20の近傍位置でピンチイン操作が行われている(図6(2))。図2に示した対応付けテーブル36によれば、スワイプ操作とピンチイン操作との組み合わせはエンジンCに対応する。よって、ピンチイン操作に応じてエンジンCが起動して、「言」と「売」との組み合わせに対する置き換え用の候補文字が導出される。
エンジンCには、この事例の「読」と「言」および「売」とのように、隣り合う関係にある一対の文字であると誤認識されやすい文字がその一対の文字と対応づけられて登録された辞書が含まれている。エンジンCは、GUI制御部32から供給された訂正対象の2文字によりこの辞書を検索することにより、訂正対象の2文字に対応する文字を候補文字として導出する。
図6(3)は、上記の導出によって、「言」と「売」とに分離して認識された文字が正しい「読」に置き換えられた画面を示す。置き換えられた候補文字にはまだカーソル20が設定されており、画面の右下にはOKボタン21が登場している。ユーザがOKボタン21をタップすると、図6(4)に示すように、置き換えられた文字による訂正が確定する。
図5に示したように、隣り合う関係にある一対の文字が1つの文字として結合されて認識された場合の訂正に適したエンジンBには、結合を解除して各文字を分離する、という観念を想起させるピンチアウト操作が対応付けられる。また図6に示したように、1つの文字が2文字に分離されて認識された場合の訂正に適したエンジンCには、分離された2つの文字を引き寄せて結合する、という観念を想起させるピンチイン操作が対応付けられる。このように、各種訂正用エンジンにそれぞれそのエンジンの機能を想起させるパターンの操作を対応づけることにより、ユーザは訂正用エンジン30の種別を意識しなくとも、読取文字列に生じた誤りの訂正に適した訂正用エンジン30を指定して正しい文字を呼び出すことができる。よって、読取文字列を正確に訂正する作業を容易に行うことが可能になる。
なお、上記では、エンジンBおよびエンジンCには、それぞれ候補文字の導出に必要な辞書が含まれるとしたが、これら2種類の訂正用エンジンにおいて共通の辞書を使用するようにしてもよい。
また、図3,図5,図6の例の画面では、呼び出された候補文字を承認する操作のためにOKボタン21を設定したが、承認操作の方法はこれに限らず、たとえば、候補文字が表示された画面内の空白部分(読取文字列の背景部分)をタップする操作を承認操作として受け付けてもよい。
候補文字を導出するための訂正用エンジン30は、上記の3種類に限らず、種々のアルゴリズムによるエンジンを設定することができる。
たとえば、図2に示したエンジンDは、読取文字列内で隣り合う文字の間に空白を設定する処理を行うものであり、反対に、エンジンEは文字間の設定された空白を削除するものである。これらのエンジンD,Eについては、読取文字列内の隣り合う2つの文字を同時にタップする操作(2本指タップ)によって訂正対象箇所が指定され、その後にピンチアウト操作が行われた場合にはエンジンDが選択され、ピンチイン操作が行われた場合にはエンジンEが選択される。
図2に示したエンジンFは、各種漢字が部首に対応づけて登録された辞書を具備しており、漢字が訂正対象に選択されたことを条件として、その訂正対象の文字の部首により辞書を検索して候補文字を導出する。このエンジンFについては、読取文字列内の1文字を2回続けて早くタップする操作(ダブルタップ操作)によって、訂正対象の文字の指定と共にエンジンFが指定される。
エンジンデータベース300には、日本語の読取文字列を訂正するための訂正用エンジン30に限らず、他の言語による読取文字列や数字に対する訂正用エンジン30を含めることもできる。その訂正の方法および実施される操作のパターンの具体例を、以下に簡単に説明する。
図7(A)は、「MUNCHEN」という読取文字列の表示に対し、2番目の文字「U」をダブルタップする操作により、訂正対象の文字の選択と、選択された文字を記号(ウムラウト)付きの文字に訂正したものである。この場合の候補文字の導出は、たとえば、記号なし文字と記号付き文字との組み合わせが格納された辞書を有する訂正用エンジン30によって実施される。この場合にも、最初に表示された候補文字が正しくない場合には、フリック操作またはタップ操作によって他の候補文字を呼び出すことができる。
図7(B)は、「WORD」という読取文字列の先頭の「W」が「V」を2つ連ねたものであると誤認識された場合に、スワイプ操作などで「VV」を指定してからピンチイン操作を行うことにより、正しい文字である「W」を呼び出したものである。この場合の候補文字の導出は、英語バージョンのエンジンCにより実施される。
図8は、「3月8日」という読取文字列中の「8」が「3」であると誤認識された場合に、ユーザの操作により展開される表示の変遷例を示す。
この例では、図3の例と同様に、誤認識された「3」をタップして選択した後に下フリック操作が行われる(図8(1))。この場合、フリックの勢いに応じて、カーソル20の位置で誤認識された数字の「3」が4,5,6,・・・と順に変更されてゆく変動表示が展開される(図8(2))。この変動表示において正しい文字の「8」が表示されたときにカーソル20の位置でタップ操作が行われると、変動表示が停止し(図8(3))、タップの指が離れると、「8」による訂正が確定する(図8(4))。
また、もし、変動表示中に目的の「8」を通り過ぎてしまった場合には、フリック操作の方向を下から上に向かう方向に変更することによって変動表示の方向を反転させることもできる。
図8の事例における候補文字の導出は、数字を訂正するためのアルゴリズムが組み込まれたエンジンにより実施される。
なお、この数字訂正用のエンジンに対応する操作のパターン(タップ→フリック)は図2に示したエンジンAにも対応づけられており、先の図7(A)に示した操作パターン(ダブルタップ)は図2に示したエンジンFにも対応づけられている。このように、訂正用エンジン30の数を増やすと、複数の訂正用エンジン30に共通の操作パターンが対応づけられる可能性があるが、その場合には、エンジン選択部33では、訂正対象として指定された文字の種別と操作のパターンとの組み合わせに基づいて最適な訂正用エンジン30を選択する。
つぎに図9を参照して、上記のOCRアプリケーション3における一連の処理の流れを説明する。
まず、カメラ1からの画像に対する文字読取処理を実施し(ステップS1)、その処理により導出された読取文字列を読取結果記憶部35に保存する(ステップS2)。
つぎに、上記の読取処理により導出された読取文字列をタッチパネルディスプレイ2に表示する(ステップS3)。この表示に対して読取結果を承認する操作が行われると、ステップS4が「YES」となって処理を終了する。
一方、表示された読取文字列に対し、訂正対象の文字を指定するタップ操作か範囲を指定するスワイプ操作が行われると、ステップS4が「NO」、ステップS5が「YES」となってステップS6に進み、指定された文字または範囲にカーソル20を設定することにより、その文字または範囲を選択状態にする。つぎにステップS7で訂正を指定する操作を確認するとステップS8に進み、実施された操作のパターンを判別する。さらにステップS9では、エンジン選択部33の機能により対応付けテーブル36を検索して、操作パターンに対応する訂正用エンジン30を特定し、その訂正用エンジン30を起動する。
ステップS10では、起動した訂正用エンジン30より当該エンジン30が導出した候補文字を取得して、その候補文字をタッチパネルディスプレイ2に表示する。なお、候補文字は、カーソル20が設定された範囲に対して導出され、図5に示したように一文字に対して複数の文字が導出されたり、図6に示したように複数の文字に対して一文字が導出される場合がある。また、図2に示したエンジンDが起動した場合には、カーソル20内の2つの文字およびそれらの間の空白が候補文字として導出され、エンジンEが動作した場合には、カーソル20内の2つの文字が空白が削除された形態に訂正された候補文字が導出される。
候補文字の表示に対して、ユーザによる確定操作(OKボタン21へのタップ操作)が行われると、ステップS11が「YES」となってステップS13に進み、候補文字による訂正を確定する。さらにステップS14では、確定した訂正内容に基づき、読取処理部31が読取結果記憶部35内に保存されている読取文字列を訂正する。
なお、ステップS10での候補文字の表示に対して他の候補文字を要求する操作が行われた場合には、ステップS11が「NO」、ステップS12が「YES」となってステップS10に戻り、表示可能な他の候補文字を表示する。ただし、表示可能な候補文字がない場合には、訂正処理を中止する。また、図8に示した事例の訂正用エンジン30が動く場合には、このエンジン30により導出された複数の候補による変動表示が続く間、ステップS10〜S12のループが繰り返され、変動表示を停止する操作が行われたときにステップS11が「YES」となるものとする。
図2のエンジンFやロングタップ操作に対応付けされた場合のエンジンA(図4を参照。)のように、訂正対象の箇所を指定する操作と訂正を指示する操作とが一括して実施された場合には、まずステップS5で訂正対象の選択が行われたことが判別されて訂正対象が選択され、ステップS6において訂正指示操作が完了していることが確認される。また訂正対象の箇所を指定する操作と訂正を指示する操作とが別々に実施されたが、最初の操作から所定時間が経過しても次の指定操作が行われなかった場合や、2番目の操作が最初の操作に適合していない場合には、ステップS7が「NO」となってステップS15に進み、訂正対象の選択を解除する。
また、図9では、文字読取処理が終了した直後に訂正処理を行う場合の手順を示したが、文字読取処理の直後に限らず、適宜、読取結果記憶部35に保存されている読取文字列を読み出してタッチパネルディスプレイ2に表示して、ステップS5以下と同様の処理を実施してもよい。
上記実施例のOCRアプリケーション3は、スマートフォンのほか、タブレット端末装置に組み込むことも可能である。また、訂正機能を持たない従来のOCRアプリケーションが組み込まれたスマートフォンやタブレット端末装置にも、上記した訂正機能に関わるプログラムやデータファイルを導入することによって、図1に示した構成のアプリケーションへのバージョンアップすることができる。
1 カメラ
2 タッチパネルディスプレイ
3 OCRアプリケーション
30 訂正用エンジン
31 文字読取処理部
32 GUI制御部
33 エンジン選択部
34 文字辞書
35 読取結果記憶部
36 対応付けテーブル
100 文字読取装置
300 エンジンデータベース

Claims (4)

  1. カメラとタッチパネルディスプレイとに接続され、前記カメラでの撮影により生成された文字列の画像から当該文字列中の各文字を読み取る文字読取手段の機能が設定されたコンピュータに、前記文字読取手段によって読み取られた読取文字列を訂正する訂正処理手段の機能を付与するためのプログラムであって、
    前記訂正処理手段は、
    それぞれ異なるアルゴリズムに基づき訂正対象の文字に対する置き換え用の候補文字を導出する複数種の訂正用エンジンと、
    前記複数種の訂正用エンジンをそれぞれ前記タッチパネルディスプレイにおける特有の操作パターンに対応付けた対応付けテーブルと、
    前記文字読取手段により導出された読取文字列が前記タッチパネルディスプレイに表示されている状態下で、当該読取文字列の表示範囲に対して実施される操作を受け付けて、その操作の対象となった位置により前記読取文字列中の訂正対象の文字を判別する判別手段と、
    前記読取文字列の表示範囲に対して実施された操作のパターンにより前記対応付けテーブルを検索して当該操作パターンに対応する訂正用エンジンを選択するエンジン選択手段と、
    前記エンジン選択手段により選択された訂正用エンジンを起動して前記読取文字列中の前記訂正対象の文字を処理させ、この訂正用エンジンが前記訂正対象の文字に対して導出した候補文字を前記タッチパネルディスプレイに表示すると共に、表示された候補文字を承認する前記タッチパネルディスプレイ上での操作を受け付けて、前記読取文字列内の前記訂正対象の文字を承認された候補文字に置き換える制御手段とを具備し、
    前記対応付けテーブルには、前記読取文字列の少なくとも一文字を指定する操作と、この操作により指定された文字を処理させる訂正用エンジンを指定する操作との組み合わせによる操作パターンが登録され、
    前記複数種の訂正用エンジンのうちの1つは、隣り合う一対の文字とこれらの文字を結合した構成の単独の文字とを対応付けた辞書から前記読取文字列内の訂正対象の文字に対応する一対の文字を導出して、導出された文字の組み合わせを候補文字として前記制御手段に渡すものであり、前記対応付けテーブルでは、この訂正用エンジンを指定する操作としてピンチアウト操作が設定されている
    ことを特徴とする読取文字訂正用のプログラム。
  2. 前記複数種の訂正用エンジンのうちの1つは、前記読取文字列内の訂正対象の文字に対して前記文字読取手段が導出した他の文字を文字読取手段より取得して、取得した文字を候補文字として前記制御手段に渡すものであり、前記対応付けテーブルでは、この訂正用エンジンを指定する操作としてフリック操作またはタップ操作が設定されている、請求項に記載された読取文字訂正用のプログラム。
  3. 前記複数種の訂正用エンジンのうちの1つは、前記操作により読取文字列内で隣り合う一対の文字が訂正対象として指定されたことを条件に、単独の文字と当該文字を2つに分割して得られる一対の文字とを対応付けた辞書から前記指定された一対の文字に対応する単独の文字を導出して、導出された文字を候補文字として前記制御手段に渡すものであり、前記対応付けテーブルでは、この訂正用エンジンを指定する操作としてピンチイン操作が対応付けされている、請求項に記載された読取文字訂正用のプログラム。
  4. カメラおよびタッチパネルディスプレイが配備された筐体の内部に、前記カメラでの撮影により生成された文字列の画像から当該文字列中の各文字を読み取る文字読取手段を具備する制御部が配備された構成の装置であって、
    前記制御部には、
    それぞれ異なるアルゴリズムに基づき訂正対象の文字に対する置き換え用の候補文字を導出する複数種の訂正用エンジンと、
    前記複数種の訂正用エンジンをそれぞれ前記タッチパネルディスプレイにおける特有の操作パターンに対応付けた対応付けテーブルと、
    前記文字読取手段により導出された読取文字列が前記タッチパネルディスプレイに表示されている状態下で、当該読取文字列の表示範囲に対して実施される操作を受け付けて、その操作の対象となった位置により前記読取文字列中の訂正対象の文字を判別する判別手段と、
    前記読取文字列の表示範囲に対して実施された操作のパターンにより前記対応付けテーブルを検索して当該操作パターンに対応する訂正用エンジンを選択するエンジン選択手段と、
    前記エンジン選択手段により選択された訂正用エンジンを起動して前記読取文字列中の前記訂正対象の文字を処理させ、この訂正用エンジンが前記訂正対象の文字に対して導出した候補文字を前記タッチパネルディスプレイに表示すると共に、表示された候補文字を承認する前記タッチパネルディスプレイ上での操作を受け付けて、前記読取文字列内の前記訂正対象の文字を承認された候補文字に置き換える制御手段とを具備し、
    前記対応付けテーブルには、前記読取文字列の少なくとも一文字を指定する操作と、この操作により指定された文字を処理させる訂正用エンジンを指定する操作との組み合わせによる操作パターンが登録され、
    前記複数種の訂正用エンジンのうちの1つは、隣り合う一対の文字とこれらの文字を結合した構成の単独の文字とを対応付けた辞書から前記読取文字列内の訂正対象の文字に対応する一対の文字を導出して、導出された文字の組み合わせを候補文字として前記制御手段に渡すものであり、前記対応付けテーブルでは、この訂正用エンジンを指定する操作としてピンチアウト操作が設定されている
    文字読取装置。
JP2013053274A 2013-03-15 2013-03-15 読取文字訂正用のプログラムおよび文字読取装置 Expired - Fee Related JP6102374B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013053274A JP6102374B2 (ja) 2013-03-15 2013-03-15 読取文字訂正用のプログラムおよび文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013053274A JP6102374B2 (ja) 2013-03-15 2013-03-15 読取文字訂正用のプログラムおよび文字読取装置

Publications (2)

Publication Number Publication Date
JP2014178954A JP2014178954A (ja) 2014-09-25
JP6102374B2 true JP6102374B2 (ja) 2017-03-29

Family

ID=51698819

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013053274A Expired - Fee Related JP6102374B2 (ja) 2013-03-15 2013-03-15 読取文字訂正用のプログラムおよび文字読取装置

Country Status (1)

Country Link
JP (1) JP6102374B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9465985B2 (en) 2013-06-09 2016-10-11 Apple Inc. Managing real-time handwriting recognition
CN105247540B (zh) * 2013-06-09 2018-10-16 苹果公司 管理实时手写识别
US9495620B2 (en) 2013-06-09 2016-11-15 Apple Inc. Multi-script handwriting recognition using a universal recognizer
JP6614914B2 (ja) * 2015-10-27 2019-12-04 株式会社東芝 画像処理装置、画像処理方法及び画像処理プログラム
DK179329B1 (en) 2016-06-12 2018-05-07 Apple Inc Handwriting keyboard for monitors
JP6780129B1 (ja) * 2019-03-27 2020-11-04 三菱電機ビルテクノサービス株式会社 設備機器情報収集システム
US11194467B2 (en) 2019-06-01 2021-12-07 Apple Inc. Keyboard management user interfaces

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3954247B2 (ja) * 1999-08-11 2007-08-08 独立行政法人科学技術振興機構 文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置
WO2011118096A1 (ja) * 2010-03-23 2011-09-29 シャープ株式会社 情報表示装置及び文書データ編集方法
JP2012108871A (ja) * 2010-10-26 2012-06-07 Nec Corp 情報処理装置およびその手書き入力処理方法

Also Published As

Publication number Publication date
JP2014178954A (ja) 2014-09-25

Similar Documents

Publication Publication Date Title
JP6102374B2 (ja) 読取文字訂正用のプログラムおよび文字読取装置
US20160124926A1 (en) Advanced methods and systems for text input error correction
US9916082B2 (en) Display input apparatus and computer-readable non-transitory recording medium with display input control program recorded thereon
JP5947887B2 (ja) 表示制御装置、制御プログラム、および表示装置の制御方法
US10198179B2 (en) Program for character input system, character input device, and information processing device
WO2012132767A1 (ja) 携帯端末
JP6679350B2 (ja) 情報処理装置、プログラム及び情報処理方法
US10706581B2 (en) Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor
EP2631816A1 (en) Non-temporary computer-readable medium in which data processing terminal, data search method and control program are stored
TW201305925A (zh) 手寫文字輸入裝置及手寫文字輸入方法
US20190196712A1 (en) Systems and Methods for Facilitating Data Entry into Small Screen Electronic Devices
US10656831B2 (en) Display input device and method for controlling display input device
JP6014170B2 (ja) 情報処理装置及び情報更新プログラム
JP6575329B2 (ja) 電子アルバム作成装置
JP2013088833A (ja) 情報処理装置
JP2013003801A (ja) 文字入力装置、文字入力装置の制御方法、制御プログラム、及び記録媒体
JP6555206B2 (ja) 表示装置、および表示制御プログラム
JP2014195202A (ja) シンボル入力装置及びプログラム
JP2013003802A (ja) 文字入力装置、文字入力装置の制御方法、制御プログラム、及び記録媒体
US20210349602A1 (en) User input mechanism for reordering graphical elements
JP2014160437A (ja) 情報処理装置、プレゼンテーション資料最適化方法及びプログラム
US20200019307A1 (en) Symbol input device and symbol input control method
JP6814676B2 (ja) 電子機器および電子機器の制御方法
JP6940625B2 (ja) 入力情報修正方法及び情報端末
JP2010267014A (ja) 情報処理装置及び情報処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151106

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20160603

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170213

R150 Certificate of patent or registration of utility model

Ref document number: 6102374

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees