JP7581645B2 - 情報処理装置、文字認識システムおよびプログラム - Google Patents
情報処理装置、文字認識システムおよびプログラム Download PDFInfo
- Publication number
- JP7581645B2 JP7581645B2 JP2020069827A JP2020069827A JP7581645B2 JP 7581645 B2 JP7581645 B2 JP 7581645B2 JP 2020069827 A JP2020069827 A JP 2020069827A JP 2020069827 A JP2020069827 A JP 2020069827A JP 7581645 B2 JP7581645 B2 JP 7581645B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- symbol
- same
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/2445—Alphabet recognition, e.g. Latin, Kanji or Katakana
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/2455—Discrimination between machine-print, hand-print and cursive writing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/274—Syntactic or semantic context, e.g. balancing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
本発明は、既に記入した文字列と同じ文字列が入ることを意味する文字や記号が存在しても、文字認識の結果を確認するユーザの負担が増大しにくい情報処理装置等を提供することを目的とする。
請求項2に記載の発明は、前記プロセッサは、前記属性として、文字認識をしたときに使用した辞書が同じであるときに、内容の属性が同じであるとすることを特徴とする請求項1に記載の情報処理装置である。
請求項3に記載の発明は、前記プロセッサは、前記候補が複数になったときは、前記文字または記号から位置が最も近いものを選択することを特徴とする請求項1に記載の情報処理装置である。
請求項4に記載の発明は、前記プロセッサは、置換した文字列を、ユーザに対し確認させる確認画面を表示することを特徴とする請求項1に記載の情報処理装置である。
請求項5に記載の発明は、前記プロセッサは、前記確認画面として、前記文字または記号および当該文字または記号が指す文字列として手書きのもの、並びに当該文字または記号が指す文字列の文字認識の結果を並べて表示することを特徴とする請求項4に記載の情報処理装置である。
請求項6に記載の発明は、前記プロセッサは、前記確認画面に加え、手書きの文字列が記載された文書の画像をさらに表示し、前記文書の画像中で、前記文字または記号の箇所および当該文字または記号が指す文字列の箇所の位置を表示することを特徴とする請求項4に記載の情報処理装置である。
請求項7に記載の発明は、前記プロセッサは、ユーザが確認画面の中の何れかを選択したときに、前記文書の画像中で、前記文字または記号の箇所および当該文字または記号が指す文字列の箇所の位置を示すことを特徴とする請求項6に記載の情報処理装置である。
請求項8に記載の発明は、手書きの文字列が記載された文書を画像として読み取る読取装置と、手書きの文字列を文字認識する文字認識装置と、前記文字認識装置による文字認識の結果をユーザに確認させる確認画面を表示する表示装置と、前記確認画面の画像を作成する画像作成装置と、を備え、前記画像作成装置は、プロセッサを備え、前記プロセッサは、前記文字認識装置から文字認識の結果を取得し、文字認識をした文字列が、既に記入した文字列と同じ文字列が入ることを意味する文字または記号であるときに、当該文字または記号に応じて定まる方向の文字列を探索し、当該文字または記号が記載される枠の情報と、当該方向に存在する枠の情報とを比較し、枠内に記載される内容の属性が同じ場合に、当該文字または記号が指す文字列の候補とし、当該文字または記号を、探索により得られた文字列に置換する文字認識システムである。
請求項9に記載の発明は、コンピュータに、手書きの文書に対する文字認識の結果を取得する取得機能と、文字認識をした文字列が、既に記入した文字列と同じ文字列が入ることを意味する文字または記号であるときに、当該文字または記号に応じて定まる方向の文字列を探索し、当該文字または記号が記載される枠の情報と、当該方向に存在する枠の情報とを比較し、枠内に記載される内容の属性が同じ場合に、当該文字または記号が指す文字列の候補とし、当該文字または記号を、探索により得られた文字列に置換する置換機能と、を実現させるためのプログラムである。
請求項2の発明によれば、枠中に記入される文字列の内容を考慮して探索を行うことができる。
請求項3の発明によれば、既に記入した文字列と同じ文字列が入ることを意味する文字や記号が指す文字列として、最も的確なものを抽出できる。
請求項4の発明によれば、既に記入した文字列と同じ文字列が入ることを意味する文字や記号が指す文字列を、ユーザが確認することができる。
請求項5の発明によれば、既に記入した文字列と同じ文字列が入ることを意味する文字や記号とこれらが指す文字列とを、比較して確認することができる。
請求項6の発明によれば、既に記入した文字列と同じ文字列が入ることを意味する文字や記号およびこれらが指す文字列の、元の紙文書中での位置を確認することができる。
請求項7の発明によれば、確認したい文字列を、ユーザが選択することができる。
請求項8の発明によれば、既に記入した文字列と同じ文字列が入ることを意味する文字や記号が存在しても、文字認識の結果を確認するユーザの負担が増大しにくい情報処理システムを提供することができ、既に記入した文字列と同じ文字列が入ることを意味する文字や記号が指す文字列をより的確に探索でき、枠中に記入される文字列の属性を考慮して探索を行うことができる。
請求項9の発明によれば、既に記入した文字列と同じ文字列が入ることを意味する文字や記号が存在しても、文字認識の結果を確認するユーザの負担が増大しにくい機能をコンピュータにより実現でき、既に記入した文字列と同じ文字列が入ることを意味する文字や記号が指す文字列をより的確に探索でき、枠中に記入される文字列の属性を考慮して探索を行うことができる。
図1は、本実施の形態における文字認識システム1の構成例を示す図である。
図示するように本実施の形態の文字認識システム1は、画像形成装置10と、管理サーバ20と、端末装置30とが、ネットワーク70、ネットワーク80を介して接続されることにより構成されている。
なお、図1では、画像形成装置10および端末装置30は、それぞれ1つずつしか示していないが、それぞれを複数設けてもよい。
図2は、画像形成装置10のハードウェア構成例を示した図である。
図示するように、画像形成装置10は、CPU(Central Processing Unit)11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、HDD(Hard Disk Drive)14と、操作パネル15と、画像読み取り部16と、画像形成部17と、通信インタフェース(以下、「通信I/F」と表記する)18とを備える。そして、これらがバスBを介して必要なデータのやりとりを行う。
ROM13は、CPU11が実行する各種プログラム等を記憶するメモリである。
HDD14は、画像読み取り部16が読み取った画像情報や画像形成部17における画像形成にて用いる画像情報等を記憶する例えば磁気ディスク装置である。
操作パネル15は、各種情報の表示やユーザからの操作入力の受付を行う、例えばタッチパネルである。そのため表示機構は、予め定められた領域でコンテンツ(情報内容)を画像として表示する液晶パネル等の表示部を備えるとともに、液晶パネルに人の指、スタイラスペンに代表される接触物が接触したときに、接触物が液晶パネルに接触した位置を検知する機能を備えている。本実施の形態においてタッチパネルは、特に限定されるものではなく、抵抗膜方式や静電容量方式など種々の方式のものを使用することができる。
画像読み取り部16は、例えばスキャナであり、光源から原稿に照射した光に対する反射光をレンズで縮小してCCD(Charge Coupled Devices)で受光するCCD方式や、LED光源から原稿に順に照射した光に対する反射光をCIS(Contact Image Sensor)で受光するCIS方式のものを用いるとよい。
通信I/F18は、ネットワーク70、80を介して他の装置との間で各種情報の送受信を行う。
また、詳しくは後述するが、管理サーバ20は、文字認識装置の一例であり、画像形成装置10の画像読み取り部16で読み取られた手書きの文字列を文字認識する。
さらに、管理サーバ20は、外部との通信を行うための通信I/Fと、キーボード、マウス、タッチパネル、スタイラスペン等の入力デバイスとを備える。また、管理サーバ20は、液晶ディスプレイ等の表示デバイスを備えてもよい。
ネットワーク80も、ネットワーク70と同様に、画像形成装置10、管理サーバ20および端末装置30の間の情報通信に用いられる通信手段であり、例えば、LAN(Local Area Network)である。
図3は、文字認識システム1の概略動作について示した図である。
なお、この例では、画像形成装置10を操作するユーザは、ユーザAであり、端末装置30を操作するユーザは、ユーザBであるとする。また、ユーザAおよびユーザBは、予め管理サーバ20に対し、ユーザの認証を行っているものとする。
図示する紙文書Bkは、帳票であり、予め定められた書式で印刷された印刷文書Bpに、ユーザAが、手書きの文字列Mtとして記入した場合を示している。印刷文書Bpには、例えば、氏名、住所等の記入欄Raが予め印刷され、ユーザAが、この記入欄Raに、自己の氏名、住所を、手書きの文字列Mtとして記入した場合を示している。この記入欄Raは、ユーザAが記入する枠、あるいは文字認識を行う対象となる認識枠であると把握することもできる。
そして、管理サーバ20は、OCR結果を、端末装置30に送信する(1E)。
端末装置30では、詳しくは後述するが、ユーザBに対し、OCR結果が正しいか否かを確認させる確認画面Gaを表示する(1F)。即ち、この場合、ユーザBは、OCR結果が正しいか否かを確認する担当者や管理者である。
ユーザBは、確認画面Gaにより確認を行い、訂正がある場合は、ユーザは、OCR結果を訂正する(1G)。そして、ユーザBが確認後は、確認訂正結果として出力される(1H)。また、確認訂正結果は、管理サーバ20に送られ、保存される(1I)。
このうち、図5(a)は、図3の1Aでスキャンした紙文書Bkを示している。
この紙文書Bkは、伝票であり、送付先および送り主情報として、それぞれ住所の欄Ra1、Ra2が設けられる。そして、ユーザAが、この記入欄Ra1に、送付先の住所を、文字列Mt1として記入した場合を示している。また、送り主の住所を、手書きの文字列Mt2として記入した場合を示している。ただし、図示する例では、送付先の住所および送り主の住所が同じであったため、前者は、実際の住所を、文字列Mt1として記入しているが、後者は、文字列Mt2として、「同上」と記入し、既に記入した住所と同じであることを示している。
これは、図3の1Fで表示される確認画面Gaの一部である。図示するOCR結果は、送付先の住所について、ユーザAが記入した手書きの文字列Mt1が、文字列Mc1に文字認識されたことを示している。また、送り主の住所についても、ユーザAが記入した手書きの文字列Mt2が、文字列Mc2に文字認識されたことを示している。
この例では、確認訂正結果は、CSV形式で出力される。そして、出力データが、「送付先_住所、送り主_住所、○○県△△市◇◇町1-2-34、同上」であることを示している。
そこで、本実施の形態では、文字認識システム1を、以下のような構成とし、ユーザBの負担の軽減を図っている。
図6は、本実施の形態における文字認識システム1の機能構成例を示したブロック図である。
なお、ここでは、文字認識システム1が有する種々の機能のうち本実施の形態に関係するものを選択して図示している。
送受信部110は、管理サーバ20との間で電子情報の送受信を行う。送受信部110は、スキャンした紙文書Bkの画像情報を管理サーバ20に送信する。送受信部110は、例えば、通信I/F18に対応する。
印刷部120は、印刷機構であり、用紙等の記録媒体に印刷を行う。印刷部120は、例えば、画像形成部17に対応する。
読取部130は、紙文書Bkをスキャンして読み取り、画像情報とする。読取部130は、例えば、画像読み取り部16に対応する。
制御部140は、画像形成装置10全体の制御を行う。制御部140は、例えば、CPU11、RAM12、およびROM13に対応する。
送受信部210は、画像形成装置10および端末装置30との間で電子情報の送受信を行う。送受信部210は、画像形成装置10でスキャンした紙文書Bkの画像情報を受け取る、また、紙文書BkのOCR結果を端末装置30に送る。
そして、文字認識部220は、定義情報に基づき、手書きの文字列Mtの文字認識を行う。
図7は、記憶部230で記憶される文字認識データのデータ構造を示した図である。
図示するデータ構造は、送受信部210が受け付けた紙文書Bkの画像情報と、文字認識した結果を格納するためのテーブルTとの組み合わせとして表すことができる。このテーブルTは、「認識枠名」、「OCR結果」、「辞書名」、「座標x」、「座標y」、「幅w」、「高さh」の各カラムに対するレコードからなる。
「認識枠名」は、各記入欄Raの名称である。また、認識枠名は、この記入欄Raに記入される文字列の内容を表す情報でもある。つまり、氏名、住所1、生年月日などの名称が付与され、それぞれ氏名、住所、生年月日が記入されることがわかる。また、「OCR結果」は、各記入欄Raに記入された文字列MtのOCR結果である。さらに、「辞書名」は、各記入欄Raで使用する辞書の名称である。この場合、辞書名は、文字列の内容を表す情報に対応して用意される辞書であり、文字認識の際に使用した辞書の名称であると言うこともできる。そして、「座標x」、「座標y」、「幅w」、「高さh」は、各記入欄Raの紙文書Bk中での座標情報であり、記入欄Raのx座標、y座標、幅、高さにそれぞれ対応する。つまり座標情報は、紙文書Bk中での記入欄Raの位置および記入欄Raの大きさを表す。なお、x座標およびy座標は、紙文書Bkの左上端を原点(0、0)とし、記入欄Raの左上角の位置を表したものである。
また、記憶部230は、文字認識の際に使用する辞書を記憶する。
受付部320は、ユーザの指示を受け付ける。ユーザの指示は、例えば、確認画面Gaで行われ、例えば、紙文書Bkの選択や、OCR結果の修正などである。
探索部340は、「同上」、「同左」、「〃」などの文字または記号が指す文字列を探索する。つまり、紙文書Bk中で、これらが指し示す文字列を探し出す。また、これは、「同上」、「同左」、「〃」などの文字または記号が引用する文字列を探索する、と言うこともできる。
ここで表示する画像は、上述した確認画面Gaである。
置換部370は、「同上」、「同左」、「〃」などの文字または記号を、これらの文字または記号が指す文字列に置換する。つまり、「同上」、「同左」、「〃」などの文字または記号は、これらが指し示す文字列に修正される。
次に、確認画面Gaについて詳細に説明を行う。
図8(a)~(b)は、確認画面Gaの第1の例について示した図である。
このうち、図8(a)は、確認画面Ga全体を示した図である。図示する確認画面Gaでは、図中左側に、紙文書Bkの画像情報によるイメージ画像Ga1を表示する。即ち、このイメージ画像Ga1は、画像形成装置10でスキャンした紙文書Bkの画像である。
また、図示する確認画面Gaでは、図中右側に、OCR結果を認識結果一覧Ga2として表示する。
これにより、OCR結果を確認するユーザBは、OCR結果が正しいか否かを判断するのが容易になる。
これにより、OCR結果を確認するユーザBは、紙文書Bk中での、文字列Mt31および文字列Mt32の位置を確認することができ、OCR結果が正しいか否かを判断するのがさらに容易になる。
このうち、図9(b)に示す例は、図8(b)に示した例に比較して、文字列Mt31が、「同上」から「同左」になったこと以外は、同様である。
また、図9(a)では、イメージ画像Ga1で、「同左」の文字列Mt31が記入された記入欄Raの位置Pj31と、この「同左」が指す文字列Mt32(図では「引用元」と記載)が記載された記入欄Raの位置Pj32とが、ハイライト表示される場合を示している。この場合、「同左」の文字列Mt31が指す文字列Mt32は、文字列Mt31に対し左方向に位置する。
次に、端末装置30の動作について詳細に説明する。
図10~図14は、端末装置30の動作について示したフローチャートである。
このうち、図10は、図9の確認画面の認識結果一覧Ga2を表示するための表示リストを作成する手順を示した図である。
まず、送受信部310が、管理サーバ20の記憶部230から文字認識データのテーブルTから1つ目のレコードを取得する(ステップ101)。これは、図7に示す例では、「氏名、てすと 太郎、名前、30、50、100、30」となる。
そして、OCR結果が、「同上」、「同左」、「〃」などの文字または記号であった場合(ステップ102でYes)、探索部340が、これらの文字または記号が指す文字列を紙文書Bkの中から検索し、表示制御部350が、表示リストを更新する。(ステップ103)。ステップ103の処理については、後で詳しく説明する。
対して、OCR結果が、「同上」、「同左」、「〃」などの文字または記号でなかった場合(ステップ102でNo)、表示制御部350が、これに基づき、表示リストを更新する。具体的には、表示リストに、手書きの文字列Mkと、この文字列MkのOCR結果を追加する(ステップ104)。即ち、図8(b)の認識結果Nk1や認識結果Nk2のような表示を行う設定が追加される。
その結果、次のレコードがある場合(ステップ105でYes)、送受信部310は、次のレコードを取得し(ステップ106)、ステップ102に戻る。
対して、次のレコードがない場合(ステップ105でNo)、一連の処理を終了する。
このうち、図11は、探索部340が、「同上」が指す文字列を紙文書Bkの中から検索する処理について示した図である。なお、「〃」が指す文字列を紙文書Bkの中から検索する処理についても同様となる。
まず、送受信部310が、管理サーバ20の記憶部230から文字認識データのテーブルTから1つ目のレコードを取得する(ステップ201)。
その結果、同じであった場合(ステップ202でYes)、探索部340は、ステップ201で取得したレコードの座標yが、「同上」が記入されたレコードの座標yより小さいか否かを判断する(ステップ203)。つまり、探索部340は、ステップ201で取得した記入欄Raが、「同上」が記入された記入欄Raよりも上側に位置するか否かを判断する。
そして、「同上」、「同左」、「〃」でない場合(ステップ205でYes)、ステップ201で取得したレコードを、表示候補リストに加える(ステップ206)。
その結果、次のレコードがある場合(ステップ207でYes)、送受信部310は、次のレコードを取得し(ステップ208)、ステップ202に戻る。
対して、次のレコードがない場合(ステップ207でNo)、表示制御部350は、表示候補リスト内に候補となるレコードが、1つ以上存在するか否かを判断する(ステップ209)。
対して、存在しない場合(ステップ209でNo)、即ち、「同上」が指す文字列Mtが記入された記入欄Raが発見できなかった場合、表示制御部350は、これに基づき、上記表示リストの設定を更新する。具体的には、表示リストに、手書きの文字列Mkと、この文字列MkのOCR結果を追加する(ステップ211)。即ち、図8(b)の認識結果Nk3で、文字列Mt32がない表示を行う設定が追加される。
図12で、ステップ301およびステップ304~ステップ311は、図11のステップ201およびステップ204~ステップ211と同様である。
よって、ここでは、図11とは異なるステップ302~ステップ303について主に説明を行なう。
ステップ302では、探索部340が、ステップ301で取得したレコードの座標yが、「同左」が記入されたレコードの座標yと同じであるか否かを判断する(ステップ302)。つまり、探索部340は、ステップ301で取得した記入欄Raのy座標と、「同左」が記入された記入欄Raのy座標とが同じであるか否かを判断する。
その結果、同じであった場合(ステップ302でYes)、探索部340は、ステップ301で取得したレコードの座標xが、「同左」が記入されたレコードの座標xより小さいか否かを判断する(ステップ303)。つまり、探索部340は、ステップ301で取得した記入欄Raが、「同左」が記入された記入欄Raよりも左側に位置するか否かを判断する。
ここでは、まず表示制御部350は、表示候補リスト内に存在するレコードについて、y座標降順に並び換える(ステップ401)。
次に、表示制御部350は、並び換えた後のレコードの中で、先頭のレコードを、表示リストに加える項目として設定する(ステップ402)。即ち、複数のレコードが、表示候補リスト内に存在した場合、「同上」が記入された記入欄Raから位置が最も近いものが選択される。
さらに、表示制御部350は、表示リストにレコード内の値を反映させ、更新する(ステップ403)。
そして、表示制御部350は、図8(b)で示した認識結果Nk3を表示する画像を表示するために、表示リストを基に、画像を合成する(ステップ404)。
また、表示制御部350は、合成した画像を認識結果一覧Ga2に加える(ステップ405)。
ここでは、表示制御部350は、表示候補リスト内に存在するレコードについて、x座標降順に並び換える(ステップ501)。
そして、以後のステップ502~ステップ505は、図13(a)のステップ402~ステップ405と同様である。よってここでも、複数のレコードが、表示候補リスト内に存在した場合、「同左」が記入された記入欄Raから位置が最も近いものが選択される。
まず、ユーザが選択した、認識結果一覧Ga2中の位置情報を取得する(ステップ601)。
そして、表示制御部350は、この箇所に、認識結果を表示しているか否かを判断する(ステップ602)。
そして、認識結果を表示している場合(ステップ602でYes)、イメージ画像Ga1で、「同上」、「同左」、「〃」などの文字や記号が記入された記入欄Raのハイライト表示を行う(ステップ603)。さらに、これらが指す記入欄Raのハイライト表示を行う(ステップ604)。
対して、認識結果を表示していない場合(ステップ602でNo)、一連の処理を終了する。
ユーザBが、確認画面Gaで、文字認識の結果を確認した後は、置換部370が、「同上」、「同左」、「〃」などの文字や記号は、これらの文字または記号が指す文字列に置換する。
このうち、図15(a)は、図3の1Aでスキャンした紙文書Bkを示している。
この紙文書Bkは、図5(a)で示した紙文書Bkと同様であり、送付先および送り主情報として、それぞれ住所の欄Ra1、Ra2が設けられる。そして、ユーザAが、この記入欄Ra1に、送付先の住所を、文字列Mt1として記入した場合を示している。
図示するOCR結果は、送付先の住所について、ユーザAが記入した手書きの文字列Mt1が、文字列Mc1に文字認識されたことを示している。また、送り主の住所についても、ユーザAが記入した手書きの文字列Mt2が、文字列Mc3に文字認識されたことを示している。ただし、文字列Mc3は、置換部370により、文字列Mc2から置換されている。つまり、図5(b)で示したように、文字列Mt2は、まず文字列Mc2である「同上」として文字認識されるが、置換部370により、「同上」が指す文字列Mc3に置換される。この場合、文字列Mc2である「同上」は、文字列Mc3である「○○県△△市◇◇町1-2-34」へ置換される。
この例では、確認訂正結果は、CSV形式で出力される。そして、出力データが、「送付先_住所、送り主_住所、○○県△△市◇◇町1-2-34、○○県△△市◇◇町1-2-34」であることを示している。
なお、本実施の形態における端末装置30が行う処理は、ソフトウェアとハードウェア資源とが協働することにより実現される。即ち、端末装置30の内部に設けられたCPUが、端末装置30の各機能を実現するプログラムを実行し、これらの各機能を実現させる。
Claims (9)
- プロセッサを備え、
前記プロセッサは、
手書きの文字列に対する文字認識の結果を取得し、
文字認識をした文字列が、既に記入した文字列と同じ文字列が入ることを意味する文字または記号であるときに、当該文字または記号に応じて定まる方向の文字列を探索し、当該文字または記号が記載される枠の情報と、当該方向に存在する枠の情報とを比較し、枠内に記載される内容の属性が同じ場合に、当該文字または記号が指す文字列の候補とし、当該文字または記号を、探索により得られた文字列に置換する
情報処理装置。 - 前記プロセッサは、前記属性として、文字認識をしたときに使用した辞書が同じであるときに、内容の属性が同じであるとすることを特徴とする請求項1に記載の情報処理装置。
- 前記プロセッサは、前記候補が複数になったときは、前記文字または記号から位置が最も近いものを選択することを特徴とする請求項1に記載の情報処理装置。
- 前記プロセッサは、置換した文字列を、ユーザに対し確認させる確認画面を表示することを特徴とする請求項1に記載の情報処理装置。
- 前記プロセッサは、前記確認画面として、前記文字または記号および当該文字または記号が指す文字列として手書きのもの、並びに当該文字または記号が指す文字列の文字認識の結果を並べて表示することを特徴とする請求項4に記載の情報処理装置。
- 前記プロセッサは、前記確認画面に加え、手書きの文字列が記載された文書の画像をさらに表示し、
前記文書の画像中で、前記文字または記号の箇所および当該文字または記号が指す文字列の箇所の位置を表示することを特徴とする請求項4に記載の情報処理装置。 - 前記プロセッサは、ユーザが確認画面の中の何れかを選択したときに、前記文書の画像中で、前記文字または記号の箇所および当該文字または記号が指す文字列の箇所の位置を示すことを特徴とする請求項6に記載の情報処理装置。
- 手書きの文字列が記載された文書を画像として読み取る読取装置と、
手書きの文字列を文字認識する文字認識装置と、
前記文字認識装置による文字認識の結果をユーザに確認させる確認画面を表示する表示装置と、
前記確認画面の画像を作成する画像作成装置と、
を備え、
前記画像作成装置は、プロセッサを備え、
前記プロセッサは、
前記文字認識装置から文字認識の結果を取得し、
文字認識をした文字列が、既に記入した文字列と同じ文字列が入ることを意味する文字または記号であるときに、当該文字または記号に応じて定まる方向の文字列を探索し、当該文字または記号が記載される枠の情報と、当該方向に存在する枠の情報とを比較し、枠内に記載される内容の属性が同じ場合に、当該文字または記号が指す文字列の候補とし、当該文字または記号を、探索により得られた文字列に置換する
文字認識システム。 - コンピュータに、
手書きの文書に対する文字認識の結果を取得する取得機能と、
文字認識をした文字列が、既に記入した文字列と同じ文字列が入ることを意味する文字または記号であるときに、当該文字または記号に応じて定まる方向の文字列を探索し、当該文字または記号が記載される枠の情報と、当該方向に存在する枠の情報とを比較し、枠内に記載される内容の属性が同じ場合に、当該文字または記号が指す文字列の候補とし、当該文字または記号を、探索により得られた文字列に置換する置換機能と、
を実現させるためのプログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020069827A JP7581645B2 (ja) | 2020-04-08 | 2020-04-08 | 情報処理装置、文字認識システムおよびプログラム |
| CN202011397775.9A CN113496224B (zh) | 2020-04-08 | 2020-12-03 | 信息处理装置与方法、数据结构、识别系统以及可读介质 |
| US17/123,046 US11659106B2 (en) | 2020-04-08 | 2020-12-15 | Information processing apparatus, non-transitory computer readable medium, and character recognition system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020069827A JP7581645B2 (ja) | 2020-04-08 | 2020-04-08 | 情報処理装置、文字認識システムおよびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021166000A JP2021166000A (ja) | 2021-10-14 |
| JP7581645B2 true JP7581645B2 (ja) | 2024-11-13 |
Family
ID=77995073
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020069827A Active JP7581645B2 (ja) | 2020-04-08 | 2020-04-08 | 情報処理装置、文字認識システムおよびプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US11659106B2 (ja) |
| JP (1) | JP7581645B2 (ja) |
| CN (1) | CN113496224B (ja) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002063197A (ja) | 2000-06-06 | 2002-02-28 | Matsushita Electric Ind Co Ltd | 検索装置、記録媒体およびプログラム |
| JP2007140632A (ja) | 2005-11-15 | 2007-06-07 | Tosho Inc | 処方箋受付装置 |
| JP2008225895A (ja) | 2007-03-13 | 2008-09-25 | Oki Electric Ind Co Ltd | Ocrシステム |
| JP2013109690A (ja) | 2011-11-24 | 2013-06-06 | Oki Electric Ind Co Ltd | 帳票データ入力装置及び帳票データ入力方法 |
Family Cites Families (31)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6275885A (ja) * | 1985-09-30 | 1987-04-07 | Toshiba Corp | 文字読取装置 |
| US5077811A (en) * | 1990-10-10 | 1991-12-31 | Fuji Xerox Co., Ltd. | Character and picture image data processing system |
| JPH05181837A (ja) * | 1991-11-01 | 1993-07-23 | Sony Corp | 文字変換装置 |
| JPH09134357A (ja) * | 1995-11-13 | 1997-05-20 | Sharp Corp | 文字処理装置 |
| CN1304988C (zh) * | 1996-10-16 | 2007-03-14 | 夏普公司 | 字符输入装置 |
| US6233545B1 (en) * | 1997-05-01 | 2001-05-15 | William E. Datig | Universal machine translator of arbitrary languages utilizing epistemic moments |
| JP4742404B2 (ja) * | 2000-05-17 | 2011-08-10 | コニカミノルタビジネステクノロジーズ株式会社 | 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 |
| JP4247138B2 (ja) * | 2004-02-25 | 2009-04-02 | 株式会社リコー | ネットワーク複合機 |
| WO2008083982A1 (en) * | 2007-01-10 | 2008-07-17 | Tomtom International B.V. | Address input function for portable navigation device |
| US7546955B2 (en) * | 2007-03-16 | 2009-06-16 | Intermec Ip Corp. | Systems, devices, and methods for reading machine-readable characters and human-readable characters |
| KR100878191B1 (ko) * | 2007-10-27 | 2009-01-13 | 주식회사 자코드 | 통신단말기의 문자/숫자 입력장치 및 입력방법 |
| US8996351B2 (en) * | 2011-08-24 | 2015-03-31 | Ricoh Company, Ltd. | Cloud-based translation service for multi-function peripheral |
| KR101613155B1 (ko) * | 2011-12-12 | 2016-04-18 | 엠파이어 테크놀로지 디벨롭먼트 엘엘씨 | 콘텐트에 기초한 자동 입력 프로토콜 선택 |
| DE102012020608B4 (de) * | 2012-10-19 | 2018-10-25 | Audi Ag | Kraftwagen mit einer Eingabevorrichtung zur Handschrifterkennung |
| US9037450B2 (en) * | 2012-12-14 | 2015-05-19 | Microsoft Technology Licensing, Llc | Text overlay techniques in realtime translation |
| JP6303622B2 (ja) * | 2014-03-06 | 2018-04-04 | ブラザー工業株式会社 | 画像処理装置 |
| US9589185B2 (en) * | 2014-12-10 | 2017-03-07 | Abbyy Development Llc | Symbol recognition using decision forests |
| US9557936B2 (en) * | 2014-12-31 | 2017-01-31 | Texas Instruments Incorporated | Protection of memories, datapath and pipeline registers, and other storage elements by distributed delayed detection and correction of soft errors |
| US9665786B2 (en) * | 2015-02-20 | 2017-05-30 | Conduent Business Services, Llc | Confirming automatically recognized handwritten answers |
| US10963651B2 (en) * | 2015-06-05 | 2021-03-30 | International Business Machines Corporation | Reformatting of context sensitive data |
| US10318613B2 (en) * | 2015-08-25 | 2019-06-11 | Myscript | System and method of digital note taking |
| CN107092902B (zh) * | 2016-02-18 | 2021-04-06 | 富士通株式会社 | 字符串的识别方法和系统 |
| US10248635B2 (en) * | 2016-02-29 | 2019-04-02 | Myscript | Method for inserting characters in a character string and the corresponding digital service |
| JP7000671B2 (ja) * | 2016-10-05 | 2022-01-19 | 株式会社リコー | 情報処理システム、情報処理装置、及び情報処理方法 |
| CN110799236A (zh) * | 2016-10-25 | 2020-02-14 | 玛芬股份有限公司 | 血管锚固引入器护套 |
| US10936862B2 (en) * | 2016-11-14 | 2021-03-02 | Kodak Alaris Inc. | System and method of character recognition using fully convolutional neural networks |
| JP6852666B2 (ja) * | 2017-12-26 | 2021-03-31 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
| CN110138992A (zh) * | 2018-02-08 | 2019-08-16 | 精工爱普生株式会社 | 收据处理装置、程序的存储介质以及报告的制作方法 |
| US10423852B1 (en) * | 2018-03-20 | 2019-09-24 | Konica Minolta Laboratory U.S.A., Inc. | Text image processing using word spacing equalization for ICR system employing artificial neural network |
| US10462326B2 (en) * | 2018-03-28 | 2019-10-29 | Xerox Corporation | Machine readable security mark and process for generating same |
| JP7277128B2 (ja) * | 2018-12-25 | 2023-05-18 | キヤノン株式会社 | 画像処理システム、画像処理方法、プログラム、画像処理装置、情報処理装置 |
-
2020
- 2020-04-08 JP JP2020069827A patent/JP7581645B2/ja active Active
- 2020-12-03 CN CN202011397775.9A patent/CN113496224B/zh active Active
- 2020-12-15 US US17/123,046 patent/US11659106B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002063197A (ja) | 2000-06-06 | 2002-02-28 | Matsushita Electric Ind Co Ltd | 検索装置、記録媒体およびプログラム |
| JP2007140632A (ja) | 2005-11-15 | 2007-06-07 | Tosho Inc | 処方箋受付装置 |
| JP2008225895A (ja) | 2007-03-13 | 2008-09-25 | Oki Electric Ind Co Ltd | Ocrシステム |
| JP2013109690A (ja) | 2011-11-24 | 2013-06-06 | Oki Electric Ind Co Ltd | 帳票データ入力装置及び帳票データ入力方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20210319273A1 (en) | 2021-10-14 |
| US11659106B2 (en) | 2023-05-23 |
| CN113496224A (zh) | 2021-10-12 |
| CN113496224B (zh) | 2025-07-25 |
| JP2021166000A (ja) | 2021-10-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5712487B2 (ja) | 画像処理装置、画像処理システム、画像処理方法、及びプログラム | |
| JP7608065B2 (ja) | 情報処理装置 | |
| US8675260B2 (en) | Image processing method and apparatus, and document management server, performing character recognition on a difference image | |
| US11620840B2 (en) | Image processing apparatus for extracting a desired character string from a scanned image | |
| US12022043B2 (en) | Image processing device and image forming apparatus capable of detecting and correcting mis-converted character in text extracted from document image | |
| JP7532085B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
| US20220201146A1 (en) | Information processing apparatus, information processing system, control method of the same, and storage medium | |
| CN120729996A (zh) | 信息处理系统、程序产品及信息处理方法 | |
| US20150261735A1 (en) | Document processing system, document processing apparatus, and document processing method | |
| US11887391B2 (en) | Information processing system, data output system, image processing method, and recording medium | |
| JP2014179831A (ja) | 情報表示装置及び情報編集方法並びに情報編集プログラム | |
| JP7581645B2 (ja) | 情報処理装置、文字認識システムおよびプログラム | |
| US11637937B2 (en) | Information processing apparatus, information processing method, and non-transitory storage medium | |
| JP2024003769A (ja) | 文字認識システム、コンピュータによる文字の認識方法、および文字検索システム | |
| JP6142769B2 (ja) | 情報処理装置及びプログラム | |
| JP2022111122A (ja) | サーバ、制御方法、プログラム | |
| JP2021114040A (ja) | 情報処理装置、情報処理システムおよびプログラム | |
| JP7124859B2 (ja) | データ出力システム、情報処理システム、データ出力方法、プログラム | |
| US20230325126A1 (en) | Information processing apparatus and method and non-transitory computer readable medium | |
| JP5935376B2 (ja) | 複写装置 | |
| JP2021018520A (ja) | 情報処理装置、情報処理方法及びプログラム | |
| JP5988149B2 (ja) | 項目記入装置、項目記入システム及びプログラム | |
| JP7484176B2 (ja) | 情報処理装置、情報処理システムおよびプログラム | |
| US10609246B1 (en) | System and method for ascertaining and printing supplemental forms identified from content of a scanned base form | |
| JP2022166166A (ja) | データ出力システム、情報処理システム、データ出力方法、プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230228 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231215 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240109 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240307 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240528 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240725 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241001 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241014 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7581645 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |