JP2021056750A - データ入力支援装置、データ入力支援方法及びプログラム - Google Patents
データ入力支援装置、データ入力支援方法及びプログラム Download PDFInfo
- Publication number
- JP2021056750A JP2021056750A JP2019178943A JP2019178943A JP2021056750A JP 2021056750 A JP2021056750 A JP 2021056750A JP 2019178943 A JP2019178943 A JP 2019178943A JP 2019178943 A JP2019178943 A JP 2019178943A JP 2021056750 A JP2021056750 A JP 2021056750A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- correct answer
- data input
- input support
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 77
- 238000012545 processing Methods 0.000 claims abstract description 28
- 230000008569 process Effects 0.000 claims description 60
- 238000012790 confirmation Methods 0.000 claims description 7
- 238000012937 correction Methods 0.000 description 44
- 230000010365 information processing Effects 0.000 description 20
- 238000012015 optical character recognition Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
- G06V30/133—Evaluation of quality of the acquired characters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04847—Interaction techniques to control parameter settings, e.g. interaction with sliders or dials
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
- G06V30/127—Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/268—Lexical context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Quality & Reliability (AREA)
- Character Discrimination (AREA)
Abstract
Description
OCR処理を行うことにより、一般的なオフィスで行われている経費精算作業に代表されるような、紙媒体の帳票からデジタルデータへの変換を伴う作業を自動化することが可能になり、データ入力作業における生産性の向上が期待できる。
OCR処理により取得された文字列の中に誤認識された文字が含まれる場合、誤認識された文字をユーザが直接に修正する必要がある。文字列の修正は、一般的に、PC(Personal Computer)や情報処理装置の表示部においてユーザにより行われる。しかし、文字列中の誤認識された文字の発見、指定、修正など作業は煩雑であるため、特に多くの文書を処理する場合、ユーザの作業負担が重くなるという課題がある。
また、特許文献2の文字認識装置では、処理対象の文字列内の、OCR結果の誤認識を含む単語をユーザに選択させる。そして、選択された単語について再度詳細なOCR処理を行うことで候補を生成し、その中から単語辞書に合致する組み合わせを検索することで、OCR結果を修正する作業の効率化を図っている。
後者の課題に対しては、誤認識された文字について、下位候補や、運用時の学習などによって取得されたOCR処理の誤認識パターンなどの置換候補を用いることで、正解候補文字列を生成することが考えられる。
しかし、修正対象の文字中の文字の組み合わせにより生成される正解候補文字列には、外観が類似するものが多数ある。このような類似する多数の正解候補文字列の中からユーザが正しい文字列を選択することは、作業の負担が重くなることは容易に想像される。
図1は、本発明の実施例1に係るデータ入力支援システム10のシステム構成を示す図である。
データ入力支援システム10は、読み取り装置100と、情報処理装置110と、を有する。読み取り装置100は、スキャナ101と、読み取り装置側の通信部102と、を有する。スキャナ101は、文書のスキャンを行い、スキャンした文書の画像(スキャン画像)を生成する。読み取り装置側の通信部102は、ネットワークを介して不図示の外部装置と通信を行う。
システム制御部111は、CPUなどを有し、ROM112に記憶された制御プログラムを読み出して各種処理を実行する。RAM113は、システム制御部111の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD114は、各種データや各種プログラム等を記憶する。なお、後述する情報処理装置110の機能や処理は、システム制御部111がROM112又はHDD114に格納されているプログラムを読み出し、これらのプログラムを実行することにより実現される。
また、データ入力支援システム10を構成する読み取り装置100と情報処理装置110とは1つの装置により構成されてもよい。
操作パネル201は、情報処理装置110の表示部115に設けられる。操作パネル201は、タッチパネル202及びテンキー203を備える。タッチパネル202には、ログイン中のユーザID、メインメニューなどが表示される。
データ入力支援システム10は、文字認識結果提供部301と、文字認識結果生成部302と、を有する。
文字認識結果提供部301は、文字認識結果提示部303、修正対象文字指定部304、正解候補文字列提示部305、正解文字列選択部306、正解文字列入力部307を備える。
修正対象文字指定部304は、文字認識結果提示部303が提示した文字列の中から、ユーザによる修正対象となる文字の指定を受け付ける。
正解候補文字列提示部305は、文字認識結果生成部302で生成された正解候補文字列をユーザに提示する。
正解文字列選択部306は、正解候補文字列提示部305により提示された正解候補文字列の中から、ユーザが最終的に確定した正解文字列を選択する。
正解文字列入力部307は、文字認識結果生成部302により認識された正解文字列に対して、正解文字列選択部306が選択した文字列を入力する。
文字認識結果生成部302は、画像処理部308、文字認識部309、項目値抽出部310、修正要否判断部311、正解候補文字列生成部312を備える。
文字認識部309は、スキャン画像中の文字列を文字コードに変換する文字認識処理を実行する。
項目値抽出部310は、文書について登録される項目値(後述)をスキャン画像から抽出する。
修正要否判断部311は、文字認識処理された文字列中の文字について修正が必要であるか否かを判断する。
正解候補文字列生成部312は、修正が必要であると修正要否判断部311が判断した文字について置換候補を用いることにより、正解候補文字列を生成する。
まず、S400において、読み取り装置100によって文書がスキャン画像に変換される。
次に、S401において、情報処理装置110のシステム制御部111は、変換されたスキャン画像に対して、スキャン画像内の文字列の記述方向を検知することによって、傾き補正処理を行う。
次に、S402において、システム制御部111は、グレースケールのスキャン画像に対して、所定の閾値を用いて二値化する二値化処理を行う。
次に、S403において、システム制御部111は、スキャン画像から文字認識処理に不要である罫線を除去する罫線除去処理を行う。
S401〜S403で行われる処理は、後述のS404の文字領域特定処理及びS405の文字認識処理を正確に実行するための前処理として位置づけられる。
次に、S405において、システム制御部111は、文字領域が特定されたスキャン画像に対して、文字認識処理を行う。これにより、スキャン画像内の文字領域ごとに、文字列を構成する各文字の文字コードが取得される。
次に、S406において、システム制御部111は、ユーザが必要とする項目値をスキャン画像から抽出する項目値抽出処理を行う。
図5は、読み取り装置100によってスキャンされた文書500の一例である。ここでは、図5に示されるように、文書500として請求書が用いた例について説明する。
ここで、項目値とは、例えば、後述するS409におけるデータ登録処理でシステムに登録される項目である「電話番号」や「合計金額」などの値(ここでは、「03−123−4567」や「¥11,286」など)を指す。
プレビュー画面601には、スキャンされた文書のプレビュー画像が表示される。項目の欄602は、スキャンされた文書の「種別」、「電話番号」、「合計金額」などの項目名が表示される。項目値の欄603には、スキャン画像から抽出された、各項目の欄602に対応する項目値が表示される。
しかし、スキャン画像の品質によってはOCR処理により取得された文字列には誤認識された文字が含まれることがあるため、抽出された項目値のままシステムに登録すると、誤ったデータを登録してしまうリスクがある。そのため、文字認識処理により取得された文字列について、ユーザが、誤認識された文字がないかを確認して、必要な場合、誤認識された文字を修正する必要がある。そのために、本実施例では、S407において、項目値を修正する項目値修正処理を行う。
まず、S700において、システム制御部111は、文字認識処理により取得された文字列中の誤認識された文字を指定する修正箇所の指定をユーザに促すために、文字列を操作パネル201に拡大表示する。
次に、S701において、システム制御部111は、表示された文字列において修正箇所の指定がユーザにより指示されたか否かを検知する。
例えば、項目名「合計金額」の項目値である「¥11,286」が、誤認識された文字を含む形で、「判1,2B6」として認識されたとする。このままでは正しくシステムに登録することはできないので、誤認識された文字の修正が必要である。
そこで、修正箇所指定画面800において、欄801に示されるように、文字認識処理により取得された文字列を拡大表示し、ユーザに対して文字列の中で、修正が必要な箇所の指定を促す。
図9は、この例における修正対象の文字列である「判1,2B6」に対応した正解候補文字列を生成するために用いられるラティスである。
ラティスは、指定された修正箇所についての置換候補を用いて構成される。本実施例では、置換候補とは、文字認識処理により取得された文字の下位候補、又は、情報処理装置110に記憶された文字や文字列に対する誤認識パターンに基づいて定義される。
また、本実施例では、文字認識処理により取得された文字列についての、下位候補や誤認識パターンを用いて図9に示すようなノードを追加するラティス900を生成は、S701においてユーザによる指定がなされた文字に限定して行われる。これは、誤認識でないとユーザが判断した文字については、修正をする必要がないからである。例えば、図8に示した例では、ユーザにより指定された文字は「判」と「B」のみであるため、文字901の「判」と文字902の「B」のノードに限定して、下位候補及び誤認識パターンを追加したラティス900を生成する。
「判1,2B6」、 「判1,286」、 「判1,2136」、
「刊1,2B6」、 「刊1,286」、 「刊1,2136」、
「¥リ1,2B6」、 「¥リ1,286」、 「¥リ1,2136」、
「¥11,2B6」、 「¥11,286」、 「¥11,2136」、
「¥71,2B6」、 「¥71,286」、 「¥71,2136」
の15パターンである。
「¥11,286」、 「¥11,2136」、 「¥71,286」、
「¥71,2136」
の4パターンに絞られる。
「¥11,286」、 「¥71,286」
の2パターンに絞られる。
図10は、生成された正解候補文字列を利用してユーザに正解文字列を選択させるための正解文字列選択画面1000の例を示したものある。
図10に示すように、複数の正解候補文字列の中から正解文字列をユーザに選択させるために、正解文字列選択画面1000において、例えばスクロール可能なドロップダウンリスト1002として正解候補文字列をユーザインターフェースに表示する。
ここで、正解文字列選択画面1000において、ドロップダウンリスト1002として表示された文字列の中から1つの文字列が選択され、確定ボタン1003を押下することにより、複数の正解候補文字列の中から1つの正解文字列が選択されたと判断される。
次に、S706において、システム制御部111は、S405で文字認識処理により取得された文字列と、S705で確定した正解文字列が同じである否かを判断する。
同じである場合、すなわち、文字列の修正が行われなかった場合は、そのまま処理を終了する。一方、異なる場合、すなわち、文字列の修正が行われた場合は、S707において、システム制御部111は、文字認識処理により取得された文字列とユーザの指示により確定した正解文字列とを比較する。これにより、誤認識パターンを取得して登録する、誤認識パターン登録処理を行う。
まず、S1100において、システム制御部111は、文字認識処理により取得された文字列とユーザの指示により確定した正解文字列と比較し、一致する文字を検索する。例えば、文字認識処理の結果が「判1,2B6」であり、正解文字列が「¥11,286」である場合、一致する文字は、前から順に、「1」、「,」、「2」、「6」である。なお、一致する文字は、例えば、2つの文字列間の編集距離計算で得られるグラフから求めることができる。
最後に、S1102において、システム制御部111は、誤認識された文字ごとに、誤認識パターンを誤認識パターン登録部(不図示)に登録する。図11の例の場合、「判」→「¥1」、「B」→「8」という誤認識パターンが登録される。
そして、S408において、システム制御部111は、すべての項目値が確定したか否かを判断する。
ユーザが項目値表示画面600(図6)において「次へ」ボタン604を押下すると、すべての項目値が確定したと判断される。
そして、S409において、システム制御部111は、項目値表示画面600に表示されている項目値603に基づいて、システムへのデータ登録をするデータ登録処理を行う。これにより、すべての処理が終了する。
これにより、正解候補文字列を絞り込むことができるため、正解候補文字列の中から正解文字列を選択し、データ入力作業を行うユーザの負担を軽減することができる。また、正解候補文字列を生成する際に、辞書を必要としないため、未知語も含めたあらゆる文字列にも対応することができる。
次に、本発明の実施例2について説明する。
前述のように、実施例1では、文字認識処理により取得された文字列について、修正が必要な文字をユーザの指示に基づいて指定した。
これに対して、本実施例では、文字認識処理において取得された文字ごとの信頼度に基づいて、ユーザによる指示を介することなく、修正が必要である文字を指定する。
本実施例では、処理の全体の流れを示すフローチャートは、実施例1で説明した図4と同様である。また、図4のS407における項目値修正処理についてのフローチャートは、実施例1で説明した図7と基本的には同様である。ただし、S701の修正箇所を検知する工程において、実施例1のようにユーザによる指示を介することなく、文字認識処理において取得された信頼度を用いる。
実施例1におけるソフトウェア構成(図3)との相違は、文字認識結果提供部301が修正対象文字指定部(図3の304)を備えておらず、代わりに、文字認識結果生成部302が文字信頼度推定部1201を備えている点である。
この例では、「判」と「B」については信頼度が低く、その他の文字については信頼度が高いことが分かる。図中の破線は、文字認識処理の結果が信頼できるか否かを判断するために予め設定された閾値を示している。
次に、本発明の実施例3について説明する。
本実施例では、文字認識処理により取得された文字列中において修正を必要とする文字を、情報処理装置110が予め備える、図示しない修正文字指定用のデータベース(辞書)を用いて選択する。
修正文字指定用の辞書には、修正を必要とする文字が予め登録されている。修正を必要とする文字とは、文字認識部309が誤認識しやすい文字である。なお、文字認識処理における誤認識には、「¥1」が「判」と誤認識されるような複数文字の組み合わせも含まれるため、修正文字指定用の辞書には、文字単位のみではなく、文字の組み合わせでも登録されている。
なお、本実施例では、修正要否判断部311は、修正が必要な文字について、判断はできるが、確定することまではしない。このため、修正が必要な文字を修正要否判断部311が選択したら、それを修正箇所確認画面1400(図14)に提示し、修正が必要であるか否かをユーザの指示に基づいて確定する。ただし、修正要否判断部311において修正が必要な文字の確定までするように構成してもよい。
これにより、ユーザは、修正文字指定用の辞書に基づいて選択された文字について修正が必要であるか否かを確定するだけでよいため、データ入力作業のさらなる効率化を図ることができる。
本発明は、上述の実施例の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。
本発明は上述の実施例に限定されるものではなく、本発明の趣旨に基づき種々の変形が可能であり、それらを本発明の範囲から除外するものではない。すなわち、上述した各実施例及びその変形例を組み合わせた構成もすべて本発明に含まれるものである。
100 読み取り装置
110 情報処理装置
201 操作パネル
Claims (14)
- 文書をスキャンすることにより生成された画像に対して文字認識処理を行う認識手段と、
前記文字認識処理により取得された文字列における修正が必要な文字を指定する指定手段と、
前記文字列における指定された前記文字についての置換候補を用いるとともに、前記文字列における指定された前記文字以外の文字についての置換候補を用いることなく、前記文字列に対応する複数の正解候補文字列を生成する生成手段と、
生成された前記複数の正解候補文字列を利用して1つの正解文字列を確定する確定手段と、を有する
ことを特徴とするデータ入力支援装置。 - 前記文字認識処理により取得された前記文字列を提示する第1の提示手段をさらに有し、
前記指定手段は、ユーザによる第1の指示に基づいて、前記第1の提示手段により提示された前記文字列における修正が必要な文字を指定する
ことを特徴とする請求項1に記載のデータ入力支援装置。 - 前記指定手段は、前記文字認識処理により取得された前記文字列を構成する文字ごとに、前記文字認識処理の信頼度に基づいて、前記文字列における修正が必要な文字を指定する
ことを特徴とする請求項1に記載のデータ入力支援装置。 - 前記指定手段は、前記信頼度と、予め定められた閾値とに基づいて、修正が必要な文字として指定する
ことを特徴とする請求項3に記載のデータ入力支援装置。 - 前記閾値は、文字ごとに予め定められている
ことを特徴とする請求項4に記載のデータ入力支援装置。 - 前記指定手段は、修正が必要な文字を指定するための予め備えられたデータベースに基づいて、前記文字列における修正が必要な文字を指定する
ことを特徴とする請求項1に記載のデータ入力支援装置。 - 前記置換候補は、指定された文字についての下位候補及び/又は誤認識パターンから構成される
ことを特徴とする請求項1乃至6のいずれか1項に記載のデータ入力支援装置。 - 前記下位候補は、予め登録されている
ことを特徴とする請求項7に記載のデータ入力支援装置。 - 前記複数の正解候補文字列を提示する第2の提示手段を有し、
前記確定手段は、ユーザによる第2の指示に基づいて、前記複数の正解候補文字列の中から前記1つの正解文字列を確定する
ことを特徴とする請求項1乃至8のいずれか1項に記載のデータ入力支援装置。 - 前記確定手段が前記複数の正解候補文字列の中から前記1つの正解文字列を確定する前に、前記生成手段は、文字列の表記に関するルールに基づいて、生成された前記複数の正解候補文字列を絞り込む
ことを特徴とする請求項9に記載のデータ入力支援装置。 - 前記第2の指示に基づいて、指定された前記文字についての誤認識パターンを登録する登録手段を有する
ことを特徴とする請求項9又は10に記載のデータ入力支援装置。 - 前記複数の正解候補文字列の中に正解文字列がないと判断された場合に、ユーザによる前記正解文字列の入力を受け付ける入力手段を有する
ことを特徴とする請求項1乃至8のいずれか1項に記載のデータ入力支援装置。 - 文書をスキャンすることにより生成された画像に対して文字認識処理を行う認識ステップと、
前記文字認識処理により取得された文字列における修正が必要な文字を指定する指定ステップと、
前記文字列における指定された前記文字についての置換候補を用いるとともに、前記文字列における指定された前記文字以外の文字についての置換候補を用いることなく、前記文字列に対応する複数の正解候補文字列を生成する生成ステップと、
生成された前記複数の正解候補文字列を利用して1つの正解文字列を確定する確定ステップと、を有する
ことを特徴とするデータ入力支援方法。 - 請求項13に記載のデータ入力支援方法をコンピュータにより実行させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019178943A JP7387363B2 (ja) | 2019-09-30 | 2019-09-30 | データ入力支援装置、データ入力支援方法及びプログラム |
US17/029,145 US11438467B2 (en) | 2019-09-30 | 2020-09-23 | Apparatus, method, and storage medium for supporting data entry by correcting erroneously recoginized characters |
KR1020200126682A KR20210038384A (ko) | 2019-09-30 | 2020-09-29 | 데이터 입력을 지원하기 위한 장치, 방법, 및 기억 매체 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019178943A JP7387363B2 (ja) | 2019-09-30 | 2019-09-30 | データ入力支援装置、データ入力支援方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021056750A true JP2021056750A (ja) | 2021-04-08 |
JP7387363B2 JP7387363B2 (ja) | 2023-11-28 |
Family
ID=75162590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019178943A Active JP7387363B2 (ja) | 2019-09-30 | 2019-09-30 | データ入力支援装置、データ入力支援方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11438467B2 (ja) |
JP (1) | JP7387363B2 (ja) |
KR (1) | KR20210038384A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023016031A (ja) * | 2021-07-20 | 2023-02-01 | ネイバー コーポレーション | テーブルに含まれる情報を認識する文字認識方法及び文字認識システム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7468057B2 (ja) * | 2020-03-26 | 2024-04-16 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、情報処理システム、及び情報処理プログラム |
JP2022116983A (ja) * | 2021-01-29 | 2022-08-10 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP2023141193A (ja) * | 2022-03-23 | 2023-10-05 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置およびプログラム |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004046388A (ja) * | 2002-07-10 | 2004-02-12 | Hitachi Ltd | 情報処理システムおよび文字修正方法 |
JP2005275996A (ja) * | 2004-03-26 | 2005-10-06 | Canon Inc | 文書管理装置、文書管理方法、プログラム及び記憶媒体 |
JP2011107966A (ja) * | 2009-11-17 | 2011-06-02 | Hitachi Solutions Ltd | 文書処理装置 |
JP2011150436A (ja) * | 2010-01-20 | 2011-08-04 | National Printing Bureau | 文字データを置換する方法 |
JP2011237905A (ja) * | 2010-05-07 | 2011-11-24 | Toshiba Corp | データエントリシステムおよびデータエントリ方法 |
JP2012043385A (ja) * | 2010-08-23 | 2012-03-01 | Toshiba Corp | 文字認識装置および文字認識方法 |
JP2014157409A (ja) * | 2013-02-14 | 2014-08-28 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
JP2014194694A (ja) * | 2013-03-29 | 2014-10-09 | Fujitsu Ltd | 文字入力支援プログラムおよび文字入力支援装置 |
JP2015118488A (ja) * | 2013-12-17 | 2015-06-25 | 株式会社日本デジタル研究所 | 会計データ入力システム、方法、およびプログラム |
JP2015166940A (ja) * | 2014-03-04 | 2015-09-24 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6249582A (ja) | 1985-08-29 | 1987-03-04 | Toshiba Corp | 光学文字読取り装置 |
JPH04138583A (ja) | 1990-09-28 | 1992-05-13 | Sanyo Electric Co Ltd | 文字認識装置 |
JP4006239B2 (ja) * | 2002-02-21 | 2007-11-14 | 株式会社日立製作所 | 文書の検索方法および検索システム |
WO2006105108A2 (en) * | 2005-03-28 | 2006-10-05 | United States Postal Service | Multigraph optical character reader enhancement systems and methods |
-
2019
- 2019-09-30 JP JP2019178943A patent/JP7387363B2/ja active Active
-
2020
- 2020-09-23 US US17/029,145 patent/US11438467B2/en active Active
- 2020-09-29 KR KR1020200126682A patent/KR20210038384A/ko active Search and Examination
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004046388A (ja) * | 2002-07-10 | 2004-02-12 | Hitachi Ltd | 情報処理システムおよび文字修正方法 |
JP2005275996A (ja) * | 2004-03-26 | 2005-10-06 | Canon Inc | 文書管理装置、文書管理方法、プログラム及び記憶媒体 |
JP2011107966A (ja) * | 2009-11-17 | 2011-06-02 | Hitachi Solutions Ltd | 文書処理装置 |
JP2011150436A (ja) * | 2010-01-20 | 2011-08-04 | National Printing Bureau | 文字データを置換する方法 |
JP2011237905A (ja) * | 2010-05-07 | 2011-11-24 | Toshiba Corp | データエントリシステムおよびデータエントリ方法 |
JP2012043385A (ja) * | 2010-08-23 | 2012-03-01 | Toshiba Corp | 文字認識装置および文字認識方法 |
JP2014157409A (ja) * | 2013-02-14 | 2014-08-28 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
JP2014194694A (ja) * | 2013-03-29 | 2014-10-09 | Fujitsu Ltd | 文字入力支援プログラムおよび文字入力支援装置 |
JP2015118488A (ja) * | 2013-12-17 | 2015-06-25 | 株式会社日本デジタル研究所 | 会計データ入力システム、方法、およびプログラム |
JP2015166940A (ja) * | 2014-03-04 | 2015-09-24 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023016031A (ja) * | 2021-07-20 | 2023-02-01 | ネイバー コーポレーション | テーブルに含まれる情報を認識する文字認識方法及び文字認識システム |
JP7398526B2 (ja) | 2021-07-20 | 2023-12-14 | ネイバー コーポレーション | テーブルに含まれる情報を認識する文字認識方法及び文字認識システム |
Also Published As
Publication number | Publication date |
---|---|
US20210099586A1 (en) | 2021-04-01 |
JP7387363B2 (ja) | 2023-11-28 |
KR20210038384A (ko) | 2021-04-07 |
US11438467B2 (en) | 2022-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7387363B2 (ja) | データ入力支援装置、データ入力支援方法及びプログラム | |
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US11836442B2 (en) | Information processing apparatus, method, and storage medium for associating metadata with image data | |
JP2018205910A (ja) | 計算機、文書識別方法、及びシステム | |
JP2018128996A (ja) | 情報処理装置、制御方法、およびプログラム | |
JP2021043478A (ja) | 情報処理装置、その制御方法及びプログラム | |
JP2021043775A (ja) | 情報処理装置及びプログラム | |
US11710329B2 (en) | Image processing apparatus with automated registration of previously encountered business forms, image processing method and storage medium therefor | |
US11647139B2 (en) | Image processing apparatus, image processing system, control method thereof, and storage medium | |
JP2010061471A (ja) | 文字認識装置およびプログラム | |
JP6680052B2 (ja) | 表データ変換方法、プログラム、画像読取装置 | |
JP2021077332A (ja) | 情報処理装置、サーバ、システム、情報処理方法、およびプログラム | |
US11151373B2 (en) | Information processing apparatus and information processing method | |
US20220292857A1 (en) | Information processing apparatus, information processing method, and recording medium | |
JP7021496B2 (ja) | 情報処理装置及びプログラム | |
US11887390B2 (en) | Information processing apparatus, information processing system, information processing method, and non-transitory recording medium | |
JP6700705B2 (ja) | 振り分けシステム、情報処理方法、及びプログラム | |
JP2013061886A (ja) | 化学構造図認識システム及び化学構造図認識システム用のコンピュータプログラム | |
JP7035474B2 (ja) | 文書処理装置およびプログラム | |
JP2021064122A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム | |
US11588945B2 (en) | Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area | |
JP2020047138A (ja) | 情報処理装置 | |
US11763582B2 (en) | Information processing apparatus, control method of information processing apparatus, and non-transitory storage medium | |
JP7492404B2 (ja) | 情報処理装置、入力データ誤り推定方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220922 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231017 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231115 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7387363 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |