JP6679350B2 - 情報処理装置、プログラム及び情報処理方法 - Google Patents

情報処理装置、プログラム及び情報処理方法 Download PDF

Info

Publication number
JP6679350B2
JP6679350B2 JP2016045468A JP2016045468A JP6679350B2 JP 6679350 B2 JP6679350 B2 JP 6679350B2 JP 2016045468 A JP2016045468 A JP 2016045468A JP 2016045468 A JP2016045468 A JP 2016045468A JP 6679350 B2 JP6679350 B2 JP 6679350B2
Authority
JP
Japan
Prior art keywords
character
characters
information processing
character recognition
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016045468A
Other languages
English (en)
Other versions
JP2017162147A (ja
Inventor
嘉仁 七海
嘉仁 七海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2016045468A priority Critical patent/JP6679350B2/ja
Priority to US15/448,199 priority patent/US11113556B2/en
Publication of JP2017162147A publication Critical patent/JP2017162147A/ja
Application granted granted Critical
Publication of JP6679350B2 publication Critical patent/JP6679350B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04886Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures by partitioning the display area of the touch-screen or the surface of the digitising tablet into independently controllable areas, e.g. virtual keyboards or menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1456Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、情報処理装置、プログラム及び情報処理方法に関する。
近年、スマートフォンやデジタルカメラなどの普及により、文字情報を含む画像情報が手軽に取れるようになってきた。これによって、より多種多様な観測環境から、文字認識処理を行って文字情報を取り込む大きな市場が開けつつある。例えば、鉱山などの採石現場では、ダンプトラックに使用されているタイヤを管理するために、タイヤに刻印されたシリアルナンバーを用いるというユースケースがある。そこで、タイヤに刻印されたシリアルナンバーをスマートフォンやデジタルカメラなどで撮影し、撮影した画像に対して文字認識処理を行い、その文字認識結果を用いて管理することが考えられる。一方、タイヤメーカーのマスターデータベースには該メーカーで製造されたタイヤのシリアルナンバーが管理されているので、該データベースと照合することにより、文字認識結果を該データベース内に存在するデータに限定して出力することで認識精度を向上させることが考えられる。
特許文献1には、画像に対する文字認識結果の候補として、番号データベースや型番データベース内に存在する文字列に限定して出力する技術が開示されている。
特開2014−078203号公報
しかしながら、特許文献1のように、文字認識結果をデータベース内の文字列に限定したとしても、ノイズの多い文字列画像を認識した場合などは、データベース内に格納されている別の類似文字列を認識結果として出力してしまう場合も多い。
本発明は、簡単に文字認識結果を修正できるようにすることを目的とする。
上記課題を解決するために、本発明の情報処理装置は、複数の文字を含む文字列画像に対して文字認識処理を実行する文字認識手段と、前記文字列画像に対する前記文字認識手段での文字認識結果の文字列を表示する第1の表示手段と、前記第1の表示手段により表示された前記文字認識結果の文字列の中のいずれかの文字がユーザーにより選択された場合、データベースで管理されているマスターデータのうち、当該選択された文字が少なくとも異なる所定の文字数違いのマスターデータに基づいて、当該選択された文字に対する修正候補文字を表示する第2の表示手段と、前記第2の表示手段により表示された修正候補文字がユーザーにより選択された場合、当該選択された修正候補文字を用いて前記文字認識結果の文字列を修正する修正手段と、を有することを特徴とする。
本発明によれば、データベースに存在する文字列を用いて、文字認識結果の修正を簡単に行うことができる。
モバイル端末の外観と被写体の例 モバイル端末のハードウェア構成例 モバイル端末のソフトウェア構成例 モバイルアプリのUI画面例 シリアルテーブルの例 モバイル端末の基本処理フロー OCR結果表示処理フロー OCR結果表示画面の例 修正候補表示フロー 修正候補文字を表示した画面の例 修正結果表示処理フロー 文字修正後の強調表示の例 修正した文字はデータベースにないことを通知する例
(第1実施形態)
本実施形態に係る情報処理装置の一例として、モバイル端末(携帯端末)を例に説明する。モバイル端末は、無線通信機能などを用いて外部と通信可能な端末である。
図1は、モバイル端末100(モバイル端末の前面101と背面103)の外観と、被写体105となるタイヤを示す図である。モバイル端末前面部101には、タッチパネルディスプレイ102が備えられ、表示とタッチ操作入力との2つの機能を有する。モバイル端末背面部103には、被写体を撮影して画像を取り込むためのカメラユニット104が備えられる。本実施形態では、モバイル端末100のユーザーは、モバイル端末のCPUにより動作するモバイルアプリ(詳細は後述)を利用して、被写体105を撮影し、文字認識処理を実行させることができる。被写体105は、タイヤの例である。タイヤのシリアルID(シリアルナンバーもしくはセリアルナンバーともいう)が記載されている部分を、モバイル端末のカメラユニットを用いて撮影することにより、撮影画像106を取得することができる。シリアルID107はタイヤに刻印されたシリアルナンバーを示しており、タイヤを一意に識別するためのIDである。
なお、本実施形態では、被写体105としてタイヤを例にして説明するが、被写体はタイヤに限るものではない。後述のモバイルアプリは、被写体105の画像を取り込み、タッチパネル102にその画像を出力することができる。
図2は、モバイル端末100のハードウェアの構成の一例を示す図である。CPU(Central Processing Unit)201は、各種のプログラムを実行することによって様々な機能を実現する処理ユニットである。RAM(Random Access Memory)202は、各種の情報の記憶や、CPU201の一時的な作業記憶領域として利用されるユニットである。不揮発性メモリ(例えばROM)203は、各種のプログラムやデータ等を記憶するユニットである。CPU201は、不揮発性メモリ203に記憶されているプログラムをRAM202にロードしてプログラムを実行する。すなわち、モバイル端末のCPU(コンピュータ)は、該プログラムを実行することにより、図3で説明するような各処理部として機能し、後述するシーケンスの各ステップを実行する。なお、不揮発性メモリ203は、フラッシュメモリ、HDD(Hard Disk Drive)又はSSD(Solid State Disk)などであってもよい。なお、モバイル端末100の各機能ならびに後述するシーケンスに係る処理の全部又は一部については専用のハードウェアを用いて実現してもよい。Input/Outputインターフェース204は、タッチパネル102とデータを送受信する。NIC(Network Interface Card)205は、モバイル端末100をネットワーク(不図示)に接続するためのユニットである。カメラインターフェース206は、カメラユニット104と接続し、被写体105の画像をモバイル端末100に取り込む。上述したユニットは、バス207を介してデータの送受信を行うことができる。
次に、モバイル端末100におけるソフトウェア構成について説明する。図3は、モバイル端末100のソフトウェア構成の一例を示す概念図である。モバイル端末のCPUは、モバイルアプリ(モバイル端末用のアプリケーションプログラム)302を実行することにより、各処理部(各処理モジュール)303〜308として機能する。また、モバイル端末100のOS(Operating System)(不図示)は、データ管理部301として機能する。
データ管理部301は、画像やアプリケーションデータを管理する。OSは、データ管理部301を利用するための制御API(Application ProgrammingInterface)を提供している。各アプリケーションは、その制御APIを利用することでデータ管理部301に対し、画像やアプリケーションデータの取得処理や保存処理を行う。
モバイルアプリ302は、モバイル端末100のOSのインストール機能を利用して、ダウンロードしインストールすることにより実行可能なアプリケーションである。モバイルアプリ302は、カメラインターフェース206を介して取り込んだ被写体105の画像に対する各種のデータ処理を行う。
メイン制御部303は、後述する各モジュール部(303〜308)に対する指示及び管理を行う。
情報表示部304は、メイン制御部303からの指示に従い、図4に示すようなモバイルアプリ302のユーザインタフェース(UI)をタッチパネルに表示するように制御する。
図4は、モバイルアプリ302のUI(携帯端末用のUI)の画面(モバイル端末画面400)の一例を示す図である。モバイル端末画面400は、モバイル端末100のタッチパネル102に表示される。モバイル端末画面400は、領域401にカメラ104を用いて取り込んだ画像を表示し、また、画像やUI等に対するユーザーによる操作(ユーザ操作)を受け付ける。シャッターボタン402は、カメラユニットから入力された画像を、RAM202やデータ管理部301に保存するためのボタンであり、以下では、保存された画像を撮影画像と呼ぶこととする。ズームボタン403は、表示画像の拡縮を行うためのボタンである。DB照合ボタン404は、撮影画像からシリアルIDを認識する後述のOCR処理において、DB(データベース)照合を利用するか否かを設定するボタンである。
なお、モバイルアプリ302のUIの形態(位置、大きさ、範囲、配置、表示内容など)は、図に示す形態に限定されるものではなく、モバイル端末100の機能を実現することができる適宜の構成を採用することができる。
操作情報取得部305は、モバイルアプリのUI上で為されたユーザー操作に関する情報を取得し、当該取得した情報をメイン制御部303に通知する。例えば、領域401をユーザーが手で触れると、操作情報取得部305は、触れられた画面上の位置の情報を感知し、感知した位置の情報をメイン制御部303に送信する。
画像解析部306は、撮影画像を解析して、シリアルID107が記載されていると判定した矩形領域を抽出する。OCR部307は、画像解析部306で抽出した矩形領域から文字画像を切り出し、各文字画像に対して、OCR(光学文字認識)処理を行う。DB部308はデータベース機能を有し、あるメーカーで製造され且つ当該現場に納入されているタイヤのシリアルIDをマスターデータとしてテーブルで管理する。
当該あるメーカーのタイヤのシリアルIDには以下の構成ルール(記載ルール)があるものとする。
(1)シリアルIDの文字列は、9桁の英数字で構成される。
(2)1、3、5文字目は英字で記載され、2、4、6〜9文字目は数字で記載される。
上記ルールに当てはまらないシリアルIDが記載されている場合は、別のメーカーのタイヤである。またDB部308で管理されるシリアルIDのマスターデータは、上記ルールに当てはまるメーカーのタイヤであり、他社製タイヤのシリアルIDはDB部308で管理されていないものとする。
DB部308で管理するシリアルIDのマスターデータについて説明する。図5は、本実施形態におけるシリアルIDのマスターデータを管理するシリアルテーブルのデータ構造と、該テーブルに保持するシリアルIDの一例を示す図である。シリアルテーブル500は、idカラムとserialIDカラムで構成される。idカラムは、シリアルテーブル500にレコードが追加されるたびに1インクリメンタルされる値で、テーブルのPrimary keyである。serialIDカラムは、各タイヤのシリアルIDを格納する。シリアルIDの例を501から504に示し、以下では、シリアルID例1(501)、シリアルID例2(502)、シリアルID例3(503)、シリアルID例4(504)と呼ぶ。
なお、現場では、様々なメーカーのタイヤが使用されている場合があり、これら全てのタイヤを一括して管理することが望まれている。特許文献1のように、文字認識結果をデータベース内の文字列に限定すると、データベースに無い文字列を読み取った場合に誤った認識結果が出力されてしまう。例えば、あるタイヤメーカーのデータベースと照合して文字認識結果を出力するようにしている場合に、他のメーカーのタイヤを読み取ると誤った認識結果が出力されてしまう。そこで、以下で説明するように、本実施形態では、データベースに存在する文字列とデータベースに存在しない文字列とのどちらも読み取る可能性があるような混在環境においても、簡単に文字認識結果を修正できるような構成とする。
<基本フロー>
図6を用いて、モバイル端末100における基本的な処理フローについて説明する。図6のフローは、ユーザーによりモバイル端末100におけるモバイルアプリ302を起動させ、カメラ104を用いて被写体105の画像を取得することをトリガーに開始する。
S601で、モバイル端末のCPUは、モバイルアプリ302を用いて、後述のS701〜S712で説明するOCR結果表示処理を行うことにより、シリアルIDの文字認識・照合・表示の処理を実行する。
S602で、モバイル端末のCPUは、モバイルアプリ302を用いて、後述のS901〜S913で説明する修正候補表示処理を行い、認識結果のシリアルIDの中から選択された文字に対して修正候補を表示する。
S603で、モバイル端末のCPUは、モバイルアプリ302を用いて、後述のS1101〜S1108で説明する修正結果表示処理を行い、シリアルIDの文字列に対して修正結果を表示する。
<OCR結果表示処理フロー>
図7は、S601のOCR結果表示処理フローの詳細を説明するためのフローチャートである。以下では、シリアルIDの文字列画像「B5L9A0001」に対して、一文字毎に文字認識処理して各文字の候補文字を取得し、さらに、DB部で管理されているマスターデータと照合して、データベースに格納されているデータに限定して文字認識結果を出力した場合が「B5L0Z0061」であった場合を例に以下フローを説明する。
S701で、画像解析部306は、カメラユニット104およびカメラインターフェース206を介して取得した撮影画像(複数の文字画像を含む文字列画像)に対して画像解析部306で解析処理を行うことにより、シリアルID107が記載されている矩形領域を認識する。
S702で、画像解析部306は、当該認識されたシリアルID107の矩形領域から各文字画像を切り出す処理(文字切り処理)を実行し、1文字毎の矩形領域を認識する。
S703で、メイン制御部303は、DB部にマスターデータが存在するメーカー製のタイヤか否かを判断する。具体的には、切り出した文字画像の数が9文字の場合は、該メーカー製のタイヤである可能性が高いと判断してS704に遷移し、それ以外の場合はS705へ遷移する。S705で、モバイルアプリ302のメイン制御部303は、DB照合ボタン404を自動的にオフにして、S710に遷移する。
S704で、メイン制御部303は、DB照合ボタン404がオンに設定されているかどうかを判断し、オンに設定されていればS706に進み、オフに設定されていればS710に進む。
S706で、OCR部307は、予め登録されているシリアルIDの構成ルールを読み込む。
S707で、OCR部307は、当該読み込んだ構成ルールの制約情報に基づいてOCR処理を行い、各文字の文字認識を行う。OCR処理結果は、認識結果文字と、各認識結果文字の確からしさを定量的に表す確信度との対で表現され、確信度の一番高いものが認識結果となる。
S708で、OCR部307は、切り出された全ての文字画像に対して文字認識処理が終わったか判断し、文字認識処理が終わったと判断した場合はS709に遷移し、終わっていなければS707に戻って次の文字画像に対して文字認識処理を実行する。
S709で、OCR部307は、S707でOCR処理した結果に基づき、DB部308のシリアルテーブル500のマスターデータと照合する。ここでは、まず、各文字に対する第1位の認識結果候補文字を組み合わせてシリアルIDの認識結果文字列を求め、当該文字列がシリアルテーブル500に含まれているか照合する。そして、その認識結果の組み合わせの文字列がシリアルテーブル500にあればS712に進む。一方、その認識結果の組み合わせの文字列がシリアルテーブル500に無ければ、S707で求めた各文字に対する第2位以下の認識結果候補文字も用いて、別の組み合わせの文字列を生成し、再度シリアルテーブル500と照合を行う。シリアルテーブル500内のマスターデータのいずれかに一致する文字列が見つかるまでこの処理を繰り返す。
S710で、OCR部307は、各文字の文字認識処理を行う。S711で、OCR部307は、切り出された全ての文字画像に対して文字認識処理が終わったか判断し、文字認識処理が終わったと判断した場合はS712に遷移し、終わっていなければS707に戻って次の文字画像に対して文字認識処理を実行する。全ての文字画像に対して文字認識処理が終わればS712に遷移し、終わっていなければS710に遷移する。
S712で、情報表示部304は、当該文字認識結果の文字列の表示を行う。図8は、モバイル端末画面400に文字認識結果をUI表示した一例である。シリアルID矩形801は、S701で画像解析部306が認識したシリアルID107の矩形領域をUI表示した例である。文字矩形領域802は、S702で切りだした文字画像の各矩形領域をUI表示した例である。認識結果803は、S712でUI表示した認識結果文字列の例である。図8の例では、シリアルIDの画像801「B5L9A0001」に対して、認識結果文字列803が「B5L0Z0061」であった場合の例である。認識結果文字列が間違っている場合は、認識結果文字列内の間違っている文字をユーザーがタップして選択し、当該文字を別の文字に修正することが可能である。文字の修正処理の詳細については後述する。戻るボタン804は、撮影をやり直す場合に図4のタイヤ撮影画面に戻るためのボタンである。完了ボタン805は、認識結果803が正しい場合に押すボタンであり、当該認識結果の文字列をタイヤ管理用のデータベースに保存する。なお、完了ボタンが押下され、認識結果文字列をデータベースに保存した後、タイヤ撮影画面に戻ってもよい。
以上のように、タイヤの撮影画像にOCR結果表示処理フローを行うことで、シリアルIDを文字認識し、データベースと照合し、認識結果を表示することが出来る。
<修正候補表示処理フロー>
次に、図9を用いて、モバイル端末100におけるS602の修正候補表示処理フローの詳細について説明する。本フローは、ユーザーが認識結果文字列803の中のいずれかの文字を修正対象文字としてタップ選択するのをトリガーにして開始する。
S901で、モバイルアプリ302のメイン制御部303は、DB照合ボタン404がオンであるか判定し、オンであると判定した場合はS902に遷移し、オフであると判定した場合はS912に遷移する。
S902で、メイン制御部303は、操作情報取得部305を介して取得したユーザーにより選択された1文字以外の文字が一致するシリアルIDがDB部308のシリアルテーブル500にあるか判断し、あればS905に遷移し、無ければS903に遷移する。すなわち、認識結果に対してユーザーが選択した1文字が異なるシリアルIDがDB部308のシリアルテーブル500にあるか判断する。例えば、図8の認識結果の文字列803のうち左から4番目の文字がユーザーにより選択されたとする。当該選択された文字を「*」で表現すると、認識結果の文字列は「B4L*Z061」となり、該「*」以外の文字が一致するシリアルIDがDB部308のシリアルテーブル500にあるか判断する。
S903で、メイン制御部303は、ユーザーが選択した1文字と別の1文字との合計2文字以外の文字が一致するシリアルIDがDB部308のシリアルテーブル500にあるか判断し、あればS905に遷移し、なければS904に遷移する。すなわち、認識結果に対してユーザーが選択した1文字を含む合計2文字違いのシリアルIDがDB部308のシリアルテーブル500にあるか判断する。
S904で、モバイルアプリ302は、ユーザーが選択した1文字と別の2文字との合計3文字以外の文字が一致するシリアルIDがDB部308のシリアルテーブル500にあるか判断し、あればS905に遷移し、なければS907に遷移する。すなわち、認識結果に対してユーザーが選択した1文字を含む合計3文字違いのシリアルIDがDB部308のシリアルテーブル500にあるか判断する。
なお、本実施例ではS902〜S904の処理により3文字違いまでチェックする構成としているが、これに限るものではなく、所定の文字数違いのものまでをチェックする構成(例えば、2文字違いまで、もしくは4文字違いまでチェックする構成)としてもよい。
S905で、メイン制御部303は、S902〜S904で見つけ出した1〜3文字違いのシリアルIDを表示項目リストに追加する。
S906で、メイン制御部303は、表示項目リストの上限に達していればS907へ遷移し、上限に達していなければS902に戻って他の1〜3文字違いの候補があるかチェックする。本実施例では、表示項目リストの上限は3つとする。なお、S902〜S904のうち、S902での判定を最初に行うようにしているので、1文字違いのものから順に表示項目リストに追加されていくことになる。
S907で、メイン制御部303は、表示項目リストに1項目以上追加されているか判断し、1項目以上あればS908に遷移し、0項目ならばS911に遷移する。S911で、メイン制御部303は、DB照合ボタン404をオフにしてS912に遷移する。
S908で、メイン制御部303は、表示項目リストに基づいて、当該ユーザーにより選択された1文字に対する修正候補文字を表示する。図10(a)が修正候補文字を表示するUI例である。選択領域1001は、ユーザーが認識結果803に対して左から4番目の文字認識結果「0」を修正対象として選択した場合に、当該文字が選択されたことを強調表示していることを示している。認識領域1002は、選択領域1001の文字「0」に対応する認識対象となった文字画像領域を強調表示した結果を示している。図5のシリアルテーブルを参照し、S902でユーザーにより選択された1文字が異なるシリアルID503が表示項目リストに追加され、その後、S903で2文字違いのシリアルID504が追加され、さらに、その後、S904で3文字違いのシリアルID501が追加される。そして、各シリアルIDの左から4番目の文字を修正候補文字として、表示項目リストに追加された順にしたがって、修正候補文字1003に「1」、修正候補文字1004に「8」、修正候補文字1005に「9」を選択可能な状態で表示する。また、キーボードボタン1006は、キーボード画面への遷移ボタンを選択可能に表示する。
S909で、メイン制御部303は、修正候補文字1003〜1005およびキーボードボタン1006のいずれかに対するユーザーの操作を、操作情報取得部305を介して受け付ける。
S910で、メイン制御部303は、S909で受け付けた選択操作がキーボードボタン1006に対する操作であるか判断し、キーボードボタン1006に対する操作である場合はS912に遷移し、修正候補文字1003〜1005のいずれかに対する操作である場合にはS914に遷移する。
S912で、メイン制御部303は、図10(b)のようなキーボード1007を表示し、ユーザーによる入力を受け付ける。キーボードは、OS標準のキーボードを利用するようにしてよい。
S913で、メイン制御部303は、S912でキーボードを用いて入力された文字を用いて、修正対象文字1001を置換して表示する。
S914で、メイン制御部303は、ユーザーにより選択された修正候補文字1003〜1005のいずれかを用いて、修正対象文字1001を置換して表示する。
以上のように、上述の修正候補表示処理フローを行うことで、認識結果の文字列の中から修正対象として選択された文字に対して、データベースを参照して修正候補文字を表示することができる。したがって、データベースで管理されているマスターデータを利用して、ユーザーは誤認識した文字の修正を簡単に行うことができる。また、候補文字とともにキーボードボタンも表示するようにしたので、マスターデータで管理されていない文字列を読み取った場合も、キーボードを用いた修正処理にすぐに移行することが可能になる。
<修正結果表示処理フロー>
次に、図11を用いて、S603の修正結果表示処理フローの詳細について説明する。図11のフローは、図9の修正候補表示フローでユーザーにより修正対象として選択された1文字が修正された後に実行される表示処理である。
S1001で、モバイルアプリ302のメイン制御部303は、DB照合ボタン404がオンであるか判定し、オンの場合はS1102に遷移し、オフの場合は処理を終了する。
S1102で、メイン制御部303は、修正結果の文字列と一致するシリアルIDがシリアルテーブル500内にあるか判定し、ある場合は処理を終了し、無い場合はS1103に遷移する。
S1103で、メイン制御部303は、図9の処理で修正した文字以外で、シリアルテーブルに1文字違いのシリアルIDがあるか判断し、ある場合はS1104に遷移し、無い場合はS1105に遷移する。
S1104で、メイン制御部303は、当該1文字違いと判定されたシリアルIDに基づいて、当該異なると判定された1文字を強調表示する。
S1105で、メイン制御部303は、図9の処理で修正した文字以外で、シリアルテーブルに複数文字違いのシリアルIDがあるか判断し、ある場合はS1106に遷移し、ない場合はS1107に遷移する。
S1106で、メイン制御部303は、当該複数文字違いと判定されたシリアルIDに基づいて、当該異なると判定された複数文字を強調表示する。例えば、図9の処理により、図10(a)において修正候補文字1005が選択され、その結果「B5L9Z0061」に修正された場合、S1106の処理により図12のように複数の文字が強調表示される。すなわち、「B5L9Z0061」をシリアルID501の「B5L9A0001」と比較すると、左から5番目の文字と8番目の文字が未だに異なっている。したがって、図12の強調表示例1201、1202のように、「A」と「0」を強調表示することで、それらの文字が間違っている可能性があるとして、ユーザーに注意を促すことができる。
S1107で、メイン制御部303は、ダイアログを表示し、図9の処理で修正した文字はシリアルテーブルに無い文字であったことを通知する。図13(a)に、ダイアログ1301を用いて通知を行っている例を示す。
S1108で、メイン制御部303は、DB照合ボタンを自動的にオフにする。図13(b)は、DB照合ボタン404がオフに変更された例を示している。
以上のように、上述の修正結果表示処理フローを行うことで、図9の処理により1文字の修正を行った後に、他に間違っている可能性がある箇所を注意喚起することができる。ユーザーは、その強調表示を確認し、必要に応じて修正することができる。また、撮影した番号がデータベースに無い番号であった場合(他のメーカー製のタイヤなどの場合)も強調表示される可能性は残るが、その場合は、修正を行わずにユーザーが完了ボタン805を押すことで、そのままの状態で認識結果の文字列をデータベースに保存することができる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以上、本発明の好ましい実施形態について説明したが、本発明は、これらの実施形態に限定されず、その要旨の範囲内で種々の変形および変更が可能である。

Claims (9)

  1. 複数の文字を含む文字列画像に対して文字認識処理を実行する文字認識手段と、
    前記文字列画像に対する前記文字認識手段での文字認識結果の文字列を表示する第1の表示手段と、
    前記第1の表示手段により表示された前記文字認識結果の文字列の中のいずれかの文字がユーザーにより選択された場合、データベースで管理されているマスターデータのうち、当該選択された文字が少なくとも異なる所定の文字数違いのマスターデータに基づいて、当該選択された文字に対する修正候補文字を表示する第2の表示手段と、
    前記第2の表示手段により表示された修正候補文字がユーザーにより選択された場合、当該選択された修正候補文字を用いて前記文字認識結果の文字列を修正する修正手段と、
    を有することを特徴とする情報処理装置。
  2. 前記第2の表示手段は、前記修正候補文字とともに、前記修正候補文字と異なる文字を入力するためのキーボードを表示させるためのキーボードボタンを表示し、
    前記修正手段は、前記第2の表示手段により表示されたキーボードボタンがユーザーにより選択された場合、キーボードを表示し、当該表示したキーボードを用いて入力された文字を用いて前記文字認識結果の文字列を修正することを特徴とする請求項1に記載の情報処理装置。
  3. 前記修正手段により前記選択された修正候補文字を用いて修正した文字列が前記マスターデータに無い場合、当該修正した文字以外で当該修正した後の文字列と所定の文字数違いのマスターデータに基づいて、当該修正した文字以外で間違っている可能性がある文字を強調表示する強調表示手段を更に有することを特徴とする請求項1に記載の情報処理装置。
  4. 前記文字認識手段は、前記複数の文字を含む文字列画像に対して文字認識処理を実行し、さらに、前記データベースのマスターデータと照合することにより、前記マスターデータにある文字列を前記文字認識結果として出力することを特徴とする請求項1に記載の情報処理装置。
  5. 前記データベースのマスターデータと照合するか否かを示す照合ボタンを表示する第3の表示手段を更に備え、
    前記照合ボタンで照合すると設定されている場合に、前記文字認識手段は、前記複数の文字を含む文字列画像に対して文字認識処理を実行し、さらに、前記データベースのマスターデータと照合することにより、前記マスターデータにある文字列を前記文字認識結果として出力することを特徴とする請求項4に記載の情報処理装置。
  6. 前記文字認識手段は、前記複数の文字を含む文字列画像に対して文字認識処理を実行した際に、認識された文字数が所定の文字数でないと判断した場合は、自動的に前記照合ボタンを照合しない設定に変更し、前記データベースのマスターデータと照合せずに前記文字認識結果を出力することを特徴とする請求項5に記載の情報処理装置。
  7. 前記照合ボタンで照合すると設定され、かつ、前記第1の表示手段により表示された前記文字認識結果の文字列の中のいずれかの文字がユーザーにより選択された場合、前記第2の表示手段は、前記データベースで管理されているマスターデータのうち、当該選択された文字が少なくとも異なる所定の文字数違いのマスターデータに基づいて、当該選択された文字に対する修正候補文字を表示することを特徴とする請求項5に記載の情報処理装置。
  8. コンピュータを、請求項1乃至7のいずれか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
  9. 情報処理装置の文字認識手段が、複数の文字を含む文字列画像に対して文字認識処理を実行する文字認識ステップと、
    前記情報処理装置の第1の表示手段が、前記文字列画像に対する前記文字認識ステップでの文字認識結果の文字列を表示する第1の表示ステップと、
    前記情報処理装置の第2の表示手段が、前記第1の表示ステップで表示された前記文字認識結果の文字列の中のいずれかの文字がユーザーにより選択された場合、データベースで管理されているマスターデータのうち、当該選択された文字が少なくとも異なる所定の文字数違いのマスターデータに基づいて、当該選択された文字に対する修正候補文字を表示する第2の表示ステップと、
    前記情報処理装置の修正手段が、前記第2の表示ステップで表示された修正候補文字がユーザーにより選択された場合、当該選択された修正候補文字を用いて前記文字認識結果の文字列を修正する修正ステップと、
    を有することを特徴とする情報処理方法。
JP2016045468A 2016-03-09 2016-03-09 情報処理装置、プログラム及び情報処理方法 Active JP6679350B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016045468A JP6679350B2 (ja) 2016-03-09 2016-03-09 情報処理装置、プログラム及び情報処理方法
US15/448,199 US11113556B2 (en) 2016-03-09 2017-03-02 Information processing apparatus, program, and method that display correction candidate character for selected character based on found character string from master data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016045468A JP6679350B2 (ja) 2016-03-09 2016-03-09 情報処理装置、プログラム及び情報処理方法

Publications (2)

Publication Number Publication Date
JP2017162147A JP2017162147A (ja) 2017-09-14
JP6679350B2 true JP6679350B2 (ja) 2020-04-15

Family

ID=59786710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016045468A Active JP6679350B2 (ja) 2016-03-09 2016-03-09 情報処理装置、プログラム及び情報処理方法

Country Status (2)

Country Link
US (1) US11113556B2 (ja)
JP (1) JP6679350B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019130538A1 (ja) * 2017-12-28 2019-07-04 マクセル株式会社 入力情報修正方法及び情報端末
JP2018152111A (ja) * 2018-05-14 2018-09-27 株式会社ニチリョー ピペット個体管理のためのシステム、方法及びプログラム
US20200004815A1 (en) * 2018-06-29 2020-01-02 Microsoft Technology Licensing, Llc Text entity detection and recognition from images
CN109063614A (zh) * 2018-07-19 2018-12-21 江苏省计量科学研究院 一种液晶屏数字识别方法
JP7268316B2 (ja) * 2018-09-20 2023-05-08 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP7172351B2 (ja) * 2018-09-21 2022-11-16 富士フイルムビジネスイノベーション株式会社 文字列認識装置及び文字列認識プログラム
JP7268389B2 (ja) * 2019-02-15 2023-05-08 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2021114211A (ja) * 2020-01-21 2021-08-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5390005A (en) * 1992-07-13 1995-02-14 Konica Corporation Operation-panel-indicating method for a copying machine
US6167411A (en) * 1998-06-22 2000-12-26 Lucent Technologies Inc. User interface for entering and editing data in data entry fields
WO2002080520A2 (en) * 2001-03-30 2002-10-10 Siemens Dematic Postal Automation, L.P. Method and system for image processing
US8944234B1 (en) * 2001-09-27 2015-02-03 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US6986106B2 (en) * 2002-05-13 2006-01-10 Microsoft Corporation Correction widget
EP1630722A4 (en) * 2003-06-02 2007-08-15 Sharp Kk PORTABLE INFORMATION TERMINAL
US20060219773A1 (en) * 2004-06-18 2006-10-05 Richardson Joseph L System and method for correcting data in financial documents
US7175074B2 (en) * 2004-08-25 2007-02-13 Checkfree Services Corporation Methods and apparatus for processing electronic checks
US7539326B2 (en) * 2005-12-23 2009-05-26 Pitney Bowes Inc. Method for verifying an intended address by OCR percentage address matching
JP4744317B2 (ja) * 2006-02-16 2011-08-10 富士通株式会社 単語検索装置、単語検索方法、及びコンピュータプログラム
JP4582810B2 (ja) * 2006-12-25 2010-11-17 カシオ計算機株式会社 電子辞書装置
JP4875117B2 (ja) * 2009-03-13 2012-02-15 株式会社東芝 画像処理装置
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备
JP5762830B2 (ja) * 2011-06-07 2015-08-12 グローリー株式会社 紙葉類処理装置及び方法
JP5982844B2 (ja) * 2012-02-06 2016-08-31 オムロン株式会社 文字読取用のプログラムおよび文字読取装置
JP5752073B2 (ja) * 2012-03-16 2015-07-22 三菱電機株式会社 データ修正装置
JP6221220B2 (ja) 2012-10-12 2017-11-01 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US9147275B1 (en) * 2012-11-19 2015-09-29 A9.Com, Inc. Approaches to text editing
US9405988B2 (en) * 2013-08-13 2016-08-02 James Alves License plate recognition
JP6304979B2 (ja) * 2013-09-06 2018-04-04 株式会社東芝 知識処理装置、方法およびプログラム
JP6348787B2 (ja) * 2014-07-02 2018-06-27 株式会社日立ソリューションズ東日本 データ処理装置およびデータ処理方法

Also Published As

Publication number Publication date
JP2017162147A (ja) 2017-09-14
US11113556B2 (en) 2021-09-07
US20170262722A1 (en) 2017-09-14

Similar Documents

Publication Publication Date Title
JP6679350B2 (ja) 情報処理装置、プログラム及び情報処理方法
KR102147935B1 (ko) 데이터 처리 방법 및 그 전자 장치
US20090247219A1 (en) Method of generating a function output from a photographed image and related mobile computing device
EP2894607B1 (en) Electronic device and display method thereof
US20230254422A1 (en) Image processing device, non-transitory computer readable medium, and image processing method
JP5823796B2 (ja) 工事写真連携補助装置、工事写真連携サーバ、工事写真連携補助プログラム、及び工事写真連携プログラム
US9767388B2 (en) Method and system for verification by reading
CN103049432A (zh) 用于受限显示设备的公式输入
EP3182651A1 (en) Method of controlling operation of cataloged smart devices
JP6102374B2 (ja) 読取文字訂正用のプログラムおよび文字読取装置
KR20130089407A (ko) 이동 단말기 및 그 제어방법
KR101465859B1 (ko) 촬상 장치, 촬상 방법, 및 기억 매체
JP2018088116A (ja) 情報処理装置、プログラム、情報処理方法
US20220197500A1 (en) Parsing Handwriting Into Online Events
JP6230878B2 (ja) 帳票読取装置、プログラムおよび帳票読取システム
JP5456944B1 (ja) 画像ファイルクラスタリングシステム及び画像ファイルクラスタリングプログラム
JP6014170B2 (ja) 情報処理装置及び情報更新プログラム
WO2019052143A1 (zh) Jsx文件生成方法、装置、存储介质和计算机设备
US10114518B2 (en) Information processing system, information processing device, and screen display method
JP6160115B2 (ja) 情報処理装置、プレゼンテーション資料最適化方法及びプログラム
JP7095346B2 (ja) 情報処理装置及びプログラム
JP2014085814A (ja) 情報処理装置及びその制御方法、プログラム
JP2017060154A (ja) デジタル証拠作成装置、デジタル証拠作成プログラム及びデジタル証拠作成方法
JP6655331B2 (ja) 電子機器及び方法
CN110942068B (zh) 信息处理装置、存储介质及信息处理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190307

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200318

R151 Written notification of patent or utility model registration

Ref document number: 6679350

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151