JP2022090443A - OCR processing device, OCR processing method, and program - Google Patents
OCR processing device, OCR processing method, and program Download PDFInfo
- Publication number
- JP2022090443A JP2022090443A JP2020202849A JP2020202849A JP2022090443A JP 2022090443 A JP2022090443 A JP 2022090443A JP 2020202849 A JP2020202849 A JP 2020202849A JP 2020202849 A JP2020202849 A JP 2020202849A JP 2022090443 A JP2022090443 A JP 2022090443A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- ocr processing
- character strings
- group
- grouping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、OCR処理装置、OCR処理方法、及びプログラムに関する。 The present invention relates to an OCR processing apparatus, an OCR processing method, and a program.
例えば、特許文献1には、点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更する画像処理方法点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更する(点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更する点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更する点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更するが開示されている。
For example, in
また、特許文献2には、OCR認識結果の文字列が同じ画像の分類を行い、文字列に対応する画像の領域を重ね合わせて合成を行い、分類軸の文字列と合成画像の文字列の比較を行い、合成した画像すべてに対して一括で修正処理を行う文書処理装置OCR認識結果の文字列が同じ画像の分類を行い、文字列に対応する画像の領域を重ね合わせて合成を行い、分類軸の文字列と合成画像の文字列の比較を行い、合成した画像すべてに対して一括で修正処理を行うが開示されている。
Further, in
OCR処理結果の確認又は修正を効率化するOCR処理装置を提供することを目的とする。 It is an object of the present invention to provide an OCR processing apparatus for efficiently confirming or correcting OCR processing results.
本発明に係るOCR処理装置は、入力項目に入力された文字列を特定するOCR処理部と、前記OCR処理部により特定された複数の文字列を、複数のグループに分類するグループ化部と、前記グループ化部により分類された複数の文字列を、グループ毎に区別して表示する表示部とを有する。 The OCR processing apparatus according to the present invention includes an OCR processing unit that specifies a character string input to an input item, a grouping unit that classifies a plurality of character strings specified by the OCR processing unit into a plurality of groups, and a grouping unit. It has a display unit for displaying a plurality of character strings classified by the grouping unit separately for each group.
好適には、前記グループ化部は、同一の入力項目に関して、前記OCR処理部により特定された文字列を、文字列の類似度に基づいてグループ化する。 Preferably, the grouping unit groups the character strings specified by the OCR processing unit with respect to the same input item based on the similarity of the character strings.
好適には、ユーザの操作に応じて、前記グループ化部により分類された複数の文字列に対して、確定した文字列を指定する文字列確定部をさらに有する。 Preferably, it further has a character string fixing unit for designating a fixed character string for a plurality of character strings classified by the grouping unit according to a user operation.
好適には、前記表示部は、前記グループ化部により同一グループに分類された複数の文字列について、同じ文字列の数に応じて、表示態様を変える。 Preferably, the display unit changes the display mode of a plurality of character strings classified into the same group by the grouping unit according to the number of the same character strings.
好適には、前記表示部は、前記グループ化部により同一グループに分類された複数の文字列について、最多の同一文字列を、他の文字列よりも強調して表示する。 Preferably, the display unit displays the largest number of the same character strings emphasized more than other character strings for a plurality of character strings classified into the same group by the grouping unit.
好適には、前記グループ化部は、予め登録された登録文字列と一致する文字列を、グループに分類する辞書グループ化部と、前記辞書グループ化部によりいずれの登録文字列とも不一致であると判定された文字列について、互いの類似度に基づいて分類する類似グループ化部とを含み、前記表示部は、前記辞書グループ化部により分類された文字列、又は、前記類似グループ化部により分類された文字列を、グループ毎に区別して表示する。 Preferably, the grouping unit does not match any of the registered character strings by the dictionary grouping unit that classifies the character strings that match the pre-registered registered character strings into groups and the dictionary grouping unit. The determined character string includes a similarity grouping unit that classifies the determined character strings based on their similarity to each other, and the display unit is classified by the character string classified by the dictionary grouping unit or the similarity grouping unit. The displayed character strings are displayed separately for each group.
好適には、前記グループ化部は、未記入であると判定された入力項目をグループ化する未記入グループ化部と、前記未記入グループ化部により未記入であると判定されなかった入力項目について、予め登録された登録文字列と一致する文字列を、グループに分類する辞書グループ化部と、前記辞書グループ化部によりいずれの登録文字列とも不一致であると判定された文字列について、互いの類似度に基づいて分類する類似グループ化部とを含み、前記表示部は、前記辞書グループ化部により分類された文字列、又は、前記類似グループ化部により分類された文字列を、グループ毎に区別して表示する。 Preferably, the grouping unit includes a blank grouping unit that groups input items that are determined to be blank, and an input item that is not determined to be blank by the blank grouping unit. , The dictionary grouping unit that classifies the character strings that match the pre-registered registered character strings into groups, and the character strings that are determined by the dictionary grouping unit to be inconsistent with any of the registered character strings. The display unit includes a similarity grouping unit that classifies based on the degree of similarity, and the display unit displays a character string classified by the dictionary grouping unit or a character string classified by the similarity grouping unit for each group. Display separately.
好適には、前記グループ化部により分類されたグループ間で、文字列を移動させる操作を受け付けるグループ移動部と、前記グループ移動部により移動させた文字列について、移動先のグループに関して前記文字列確定部により確定された確定文字列を適用する移動確定部とをさらに有する。 Preferably, the group moving unit that accepts the operation of moving the character string between the groups classified by the grouping unit and the character string moved by the group moving unit are determined with respect to the destination group. It further has a movement confirmation unit to which a confirmation character string determined by the unit is applied.
好適には、前記グループ化部により分類されたグループを一覧表示し、各グループに対する確認作業が完了したか否かを示す表示を付すグループ表示部をさらに有する。 Preferably, it further has a group display unit that displays a list of the groups classified by the grouping unit and adds a display indicating whether or not the confirmation work for each group is completed.
また、本発明に係るOCR処理方法は、コンピュータが、入力項目に入力された文字列を特定するOCR処理ステップと、コンピュータが、前記OCR処理ステップにより特定された複数の文字列を、複数のグループに分類するグループ化ステップと、コンピュータが、前記グループ化ステップにより分類された複数の文字列を、グループ毎に区別して表示する表示ステップとを有する。 Further, in the OCR processing method according to the present invention, an OCR processing step in which a computer specifies a character string input in an input item and a plurality of character strings specified by the computer in the OCR processing step are grouped in a plurality of groups. It has a grouping step for classifying into groups, and a display step in which a computer displays a plurality of character strings classified by the grouping step separately for each group.
また、本発明に係るプログラムは、入力項目に入力された文字列を特定するOCR処理ステップと、前記OCR処理ステップにより特定された複数の文字列を、複数のグループに分類するグループ化ステップと、前記グループ化ステップにより分類された複数の文字列を、グループ毎に区別して表示する表示ステップとをコンピュータに実行させる。 Further, the program according to the present invention includes an OCR processing step for specifying a character string input to an input item, a grouping step for classifying a plurality of character strings specified by the OCR processing step into a plurality of groups, and a grouping step. A computer is made to execute a display step of displaying a plurality of character strings classified by the grouping step separately for each group.
OCR処理結果の確認又は修正を効率化できる。 Confirmation or correction of OCR processing results can be made more efficient.
本発明の実施形態を、図面を参照して説明する。
図1は、OCR処理システム1の全体構成を例示する図である。
図1に例示するように、OCR処理システム1は、OCR処理装置2と、スキャナ装置4とを含み、ネットワーク7を介して互いに接続している。複数のスキャナ装置4A及びスキャナ装置4Bを併せてスキャナ装置4と称する。なお、OCR処理装置2は、USBケーブルなどを介して直接スキャナ装置4と有線接続してもよい。
OCR処理装置2は、コンピュータ端末であり、スキャナ装置4から受信した画像データに対し、OCR処理を行い、OCR処理結果をユーザに確認又は修正させる。本例のOCR処理装置2は、スキャナ装置4から受信した帳票の画像データに対し、OCR処理を行い、帳票の各入力項目について文字列を特定し、ユーザに確認作業及び修正作業を行わせる。
Embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a diagram illustrating the overall configuration of the
As illustrated in FIG. 1, the
The
スキャナ装置4は、光学式の読取装置であり、原稿から取得した画像データをOCR処理装置2に送信する。本例において、スキャナ装置4は、帳票をスキャンするものとする。
The
図2は、OCR処理システム1における確認修正作業を説明する図である。
図2(A)に例示するように、スキャンされた帳票毎に、OCR処理結果を確認する方法がある(比較例)。この場合、帳票全体の入力項目の整合性を確認しやすい。
また、図2(B)に例示するように、入力項目(本例では「会社名」)毎に、OCR処理結果を集約し、まとめて確認する方法がある(比較例)。この場合、同一の入力項目に関してまとめて確認できるため、OCR処理結果の誤りに気付きやすい。
しかしながら、上記比較例では、いずれもOCR処理結果を全て確認する必要があり、作業効率が悪い。
FIG. 2 is a diagram illustrating confirmation and correction work in the
As illustrated in FIG. 2A, there is a method of confirming the OCR processing result for each scanned form (comparative example). In this case, it is easy to check the consistency of the input items of the entire form.
Further, as illustrated in FIG. 2B, there is a method of collecting OCR processing results for each input item (“company name” in this example) and checking them collectively (comparative example). In this case, since the same input items can be confirmed collectively, it is easy to notice an error in the OCR processing result.
However, in each of the above comparative examples, it is necessary to confirm all the OCR processing results, and the work efficiency is poor.
そこで、本例のOCR処理システム1では、図2(C)に例示するように、入力項目毎のOCR処理結果(文字列)を複数のグループに分類し、分類されたグループ毎にOCR処理結果(文字列)を一覧表示し確認する。グループへの分類は、OCR処理結果の類似度(一致及び類似)に基づいている。そのため、グループ内の複数の文字列(互いに類似する文字列)を一括で確認でき、確認作業に要する時間を短縮できる。
また、本例のOCR処理システム1では、図2(C)に例示するように、グループ内のいずれかの文字列(OCR処理結果)を正解として選択すると、グループ内のOCR処理結果が、選択された文字列に一括修正される。これにより、修正作業に要する時間を短縮できる。なお、本願における「文字列」とは、1文字のみである場合や、0文字である場合(未記入)も含む概念である。
Therefore, in the
Further, in the
図3は、OCR処理装置2のハードウェア構成を例示する図である。
図3に例示するように、OCR処理装置2は、CPU200、メモリ202、HDD204、ネットワークインタフェース206(ネットワークIF206)、表示装置208、及び、入力装置210を有し、これらの構成はバス212を介して互いに接続している。
CPU200は、例えば、中央演算装置である。
メモリ202は、例えば、揮発性メモリであり、主記憶装置として機能する。
HDD204は、例えば、ハードディスクドライブ装置であり、不揮発性の記録装置としてコンピュータプログラム(例えば、図4のOCR処理プログラム3)やその他のデータファイルを格納する。
ネットワークIF206は、有線又は無線で通信するためのインタフェースであり、例えば、スキャナ装置4との通信を実現する。
表示装置208は、例えば、液晶ディスプレイである。
入力装置210は、例えば、キーボード及びマウスである。
FIG. 3 is a diagram illustrating a hardware configuration of the
As illustrated in FIG. 3, the
The
The
The
The network IF 206 is an interface for communicating by wire or wirelessly, and realizes communication with, for example, the
The
The
図4は、OCR処理装置2の機能構成を例示する図である。
図4に例示するように、本例のOCR処理装置2には、OCR処理プログラム3がインストールされる。
OCR処理プログラム3は、OCR処理部300、グループ化部310、文字列表示部320、グループ表示部330、文字列確定部340、グループ移動部350、及び移動確定部360を有する。また、グループ化部310は、未記入グループ化部312、辞書グループ化部314、及び類似グループ化部316を含む。
なお、OCR処理プログラム3の一部又は全部は、ASICなどのハードウェアにより実現されてもよく、また、OS(Operating System)の機能を一部借用して実現されてもよい。
FIG. 4 is a diagram illustrating the functional configuration of the
As illustrated in FIG. 4, the
The
A part or all of the
OCR処理プログラム3において、OCR処理部300は、スキャナ装置4により読み取られた画像データに対して、OCR処理を行い、画像データに含まれている文字列を特定する。本例のOCR処理部300は、帳票のOCR定義情報に従って、帳票の画像データに対してOCR処理を行い、帳票の各入力項目の文字列を特定する。
In the
グループ化部310は、OCR処理部300により特定された複数の文字列を、複数のグループに分類する。より具体的には、グループ化部310は、同一の入力項目に関して、OCR処理部300により特定された複数の文字列を、文字列の類似度に基づいて複数のグループに分類する。本例のグループ化部310は、複数段のグループ化処理で、互いに異なるロジックにより文字列をグループ化する。すなわち、本例のグループ化部310は、未記入グループ化部312、辞書グループ化部314、及び類似グループ化部316を含む。
The
未記入グループ化部312は、同一の入力項目に関して、未記入であるものをグループ化する。ここで、未記入であると判定されるものは、例えば、OCR処理部300により文字列が特定できなかった入力項目に加えて、OCR処理部300により特定された文字列の文字数が基準未満であった入力項目も含む。
The
辞書グループ化部314は、未記入グループ化部312により未記入であると判定されなかった入力項目について、予め登録された登録文字列と一致する文字列を、グループに分類する。例えば、辞書グループ化部314は、辞書に予め登録された登録文字列と一致する文字列を、登録文字列それぞれに対応するグループに分類する。
The
類似グループ化部316は、辞書グループ化部314によりいずれの登録文字列とも不一致であると判定された文字列について、互いの類似度に基づいて分類する。例えば、類似グループ化部316は、辞書グループ化部314によりいずれの登録文字列とも不一致であると判定された文字列について、レーベンシュタイン距離を算出し、レーベンシュタイン距離が一定距離以内である複数の文字列を、同一のグループに分類する。本例の類似グループ化部316は、レーベンシュタイン距離が一定距離以内である文字列が既定数以上(例えば、30%以上)存在する場合に、これら複数の文字列を、同一のグループに分類する。
The
文字列表示部320は、本発明に係る表示部の一例であり、グループ化部310により分類された複数の文字列を、グループ毎に区別して表示する。本例の文字列表示部320は、図7に例示するように、ユーザが選択したグループに分類された文字列を文字列一覧表示領域920に一覧表示する。一覧表示される文字列(OCR処理結果)の近傍には、帳票から切り出した入力項目画像が表示される。
また、文字列表示部320は、グループ化部310により同一グループに分類された複数の文字列について、同じ文字列の数に応じて、表示態様を変える。本例の文字列表示部320は、図2(C)に例示するように、グループ化部310により同一グループに分類された複数の文字列について、最多の同一文字列を青枠で囲み、他の文字列よりも強調して表示する。
The character
Further, the character
グループ表示部330は、グループ化部310により分類されたグループを一覧表示し、各グループに対するユーザの確認作業が完了したか否かを示す表示を付す。本例のグループ表示部330は、図7に例示するように、グループ化部310により分類されたグループ名をグループ一覧表示領域900に一覧表示し、グループ名に関連付けて、各グループに対する確認作業が完了したことを示す確認済みアイコン、又は、各グループに対する確認作業が完了していないことを示す未確定アイコンを配置する。
The
文字列確定部340は、ユーザの操作に応じて、グループ化部310により分類された複数の文字列に対して、確定した文字列を一括指定する。本例の文字列確定部340は、図7の文字列一覧表示領域920において、ユーザがいずれかの文字列(OCR処理結果)をクリックすると、クリックされた文字列を、このグループに属する全ての文字列に適用する。これにより、グループに対する修正作業が一括で完了する。
The character
グループ移動部350は、グループ化部310により分類されたグループ間で、文字列(OCR処理結果)を移動させる操作を受け付ける。本例のグループ移動部350は、図8に例示するように、移動させたい文字列(OCR処理結果)を文字列一覧表示領域920で選択し、グループ一覧表示領域900に表示されたグループ名にドラッグすると、ドラッグ先のグループ名に対応するグループに、選択された文字列を移動させる。
The
移動確定部360は、グループ移動部350により移動させた文字列について、移動先のグループに関して文字列確定部340により確定された確定文字列を適用する。本例の移動確定部360は、図9に例示するように、文字列一覧表示領域920の文字列を、確定済みアイコンが付されたグループにドラッグ&ドロップすると、このグループで確定された文字列(値)が、ドラッグされた文字列(OCR処理結果)に適用される。
The
図5は、OCR処理装置2によるOCR処理(S10)を説明するフローチャートである。なお、本例では、複数の帳票がスキャナ装置4によりスキャンされ、これらの画像データがOCR処理装置2に送信されていることを前提とする。
図5に例示するように、ステップ100(S100)において、OCR処理装置2のOCR処理部300(図4)は、スキャナ装置4から受信した複数の帳票画像データに対して、OCR定義情報に従ってOCR処理を行い、各入力項目の文字列を特定する。
FIG. 5 is a flowchart illustrating OCR processing (S10) by the
As illustrated in FIG. 5, in step 100 (S100), the OCR processing unit 300 (FIG. 4) of the
ステップ105(S105)において、グループ化部310の未記入グループ化部312は、処理対象の入力項目に関して、未記入であるものをグループ化する。
ステップ110(S110)において、辞書グループ化部314は、処理対象の入力項目の未分類文字列に関して、辞書に予め登録された登録文字列と一致する文字列を、登録文字列それぞれに対応するグループに分類する。なお、S110は、S105でグループ化されなかったものだけを処理対象とする。
ステップ115(S115)において、類似グループ化部316は、処理対象の入力項目の未分類文字列に関して、レーベンシュタイン距離を算出し、算出されたレーベンシュタイン距離が一定距離以内である複数の文字列を、同一のグループに分類する。なお、S115は、S105及びS110でグループ化されなかったものだけを処理対象とする。また、類似グループ化部316でも分類されなかった文字列は、最終的に、未分類グループに分類される。
In step 105 (S105), the
In step 110 (S110), the
In step 115 (S115), the
ステップ120(S120)において、グループ化部310は、全ての入力項目についてグループ化処理を完了したか否かを判定し、完了していない入力項目が存在する場合には、次の入力項目を処理対象としてS105の処理に戻り、全ての入力項目が完了した場合に、S125の処理に移行する。
In step 120 (S120), the
ステップ125(S125)において、グループ表示部330は、図7に例示するように、グループ一覧表示領域900に、グループ化部310により分類されたグループのグループ名を一覧表示し、ユーザによる選択操作を促す。
文字列表示部320は、図7に例示するように、グループ一覧表示領域900においてユーザがいずれかのグループ名を選択すると、選択されたグループに分類された文字列(OCR処理結果)と、帳票画像から切り出された文字列画像とを文字列一覧表示領域920に一覧表示する。
In step 125 (S125), as illustrated in FIG. 7, the
As illustrated in FIG. 7, when the user selects any group name in the group
ステップ130(S130)において、文字列表示部320は、文字列一覧表示領域920に表示された文字列のうち、最多の文字列(OCR処理結果)を最多文字列として強調表示する。
In step 130 (S130), the character
ステップ135(S135)において、文字列確定部340は、図7に例示するように、文字列一覧表示領域920において、表示されたいずれかの文字列(OCR処理結果)がクリックされると、このグループに分類された全ての文字列を、クリックされた文字列に変更し、確定させる。
ステップ140(S140)において、グループ表示部330は、文字列確定部340により文字列(OCR処理結果)の確定処理が行われると、図7のグループ一覧表示領域900において、このグループのアイコンを未確定アイコンから確定済みアイコンに変更する。
In step 135 (S135), the character
In step 140 (S140), when the character
ステップ145(S145)において、OCR処理プログラム3は、未確定のグループが存在する場合に、S125の処理に戻り、全てのグループが確定した場合に、OCR処理結果の確認作業を完了し、OCR処理(S10)を終了させる。
In step 145 (S145), the
図6は、OCR処理装置2による文字列移動処理(S20)を説明するフローチャートである。なお、文字列移動処理(S20)は、図5のS125~S140の処理と並行して実施される。
ステップ200(S200)において、グループ移動部350は、図8に例示するように、文字列一覧表示領域920に表示された文字列のいずれかが、グループ一覧表示領域900の他のグループのグループ名にドラッグ&ドロップされるまで待機し(S200:No)、いずれかの文字列が他のグループのグループ名にドラッグ&ドロップされると、S205の処理に移行する(S200:Yes)。
FIG. 6 is a flowchart illustrating the character string movement process (S20) by the
In step 200 (S200), as illustrated in FIG. 8, one of the character strings displayed in the character string
ステップ205(S205)において、グループ移動部350は、図8に例示するように、ドラッグ&ドロップされた文字列を、ドロップされたグループ名のグループに移動させる。つまり、グループ化部310による分類がユーザにより修正される。
In step 205 (S205), the
ステップ210(S210)において、移動確定部360は、グループ移動部350により移動した文字列の移動先が、文字列確定部340により文字列が確定されたグループであるか未確定のグループであるかを判定し、確定済みのグループである場合に、S215の処理に移行し、未確定のグループである場合に、S220の処理に移行する。
ステップ215(S215)において、移動確定部360は、文字列の移動先が確定済みグループである場合、図9に例示するように、移動させた文字列に対して、移動先のグループで確定された文字列を自動的に適用する。
ステップ220(S220)において、移動確定部360は、文字列の移動先が未確定グループである場合、図8に例示するように、移動させた文字列を確定させず、そのまま文字列一覧表示領域920に表示する。
In step 210 (S210), in the
In step 215 (S215), when the movement destination of the character string is the confirmed group, the
In step 220 (S220), when the movement destination of the character string is an undetermined group, the
図10(A)は、辞書グループ化部314によるグループ化処理をより詳細に説明し、(B)は、類似グループ化部316によるグループ化処理をより詳細に説明する図である。
図10(A)に例示するように、OCR処理結果は、一般的に、1文字ごとに複数の候補を持ち、それぞれが信頼度を持つような構造となっている(図中のOCR処理結果 1位~3位を参照)。そこで、辞書グループ化部314は、図10(A)に示すように、OCR処理結果(全候補の組み合わせ)を、辞書に登録されている単語と比較し、該当する単語があれば、対象の単語と同一の値としてグループ化する。すべての単語と比較した上で、複数該当する場合は、各文字の順位を点数にし、点数が一番小さいものを採用する。
FIG. 10A is a diagram for explaining the grouping process by the
As illustrated in FIG. 10A, the OCR processing result generally has a structure in which each character has a plurality of candidates and each has a reliability (OCR processing result in the figure). See 1st to 3rd place). Therefore, as shown in FIG. 10A, the
図10(B)に例示するように、類似グループ化部316は、OCR処理結果(文字列)の全通りの組合せについて、レーベンシュタイン距離を測定し、一定以下の値となったものをグループとして扱う。レーベンシュタイン距離とは、2つの文字列がどの程度異なるかを示す距離であり、値が小さい程似ているものとなる。ただし、全通り(順列)でのグループ化であるため、複数グループに所属する可能性がある。複数グループに所属する場合、一番距離が小さいグループに所属するものとする。最終的に一つでもグループに属しているものを、グループ化の結果とする。図10(B)の例では、レーベンシュタイン距離が最小値1となったものが採用される(背景がグレーのセル)。最小値が複数出現する場合、並び順(No.1の昇順)でどちらかに絞られる。最終的に、最小値1の出現回数が多いもの(太枠で囲ったNo.1とNo.4)がグループとなる。
As illustrated in FIG. 10B, the
以上説明したように、本実施形態のOCR処理システム1によれば、OCR処理結果を類似度に基づいてグループ化し、グループ単位で確認作業及び修正作業を行うことができるため、確認作業及び修正作業に要する時間や労力を抑制できる。
As described above, according to the
1…OCR処理システム
2…OCR処理装置
3…OCR処理プログラム
300…OCR処理部
310…グループ化部
320…文字列表示部
330…グループ表示部
340…文字列確定部
350…グループ移動部
360…移動確定部
1 ...
Claims (11)
前記OCR処理部により特定された複数の文字列を、複数のグループに分類するグループ化部と、
前記グループ化部により分類された複数の文字列を、グループ毎に区別して表示する表示部と
を有するOCR処理装置。 OCR processing unit that specifies the character string entered in the input item,
A grouping unit that classifies a plurality of character strings specified by the OCR processing unit into a plurality of groups, and a grouping unit.
An OCR processing apparatus having a display unit for displaying a plurality of character strings classified by the grouping unit separately for each group.
請求項1に記載のOCR処理装置。 The OCR processing apparatus according to claim 1, wherein the grouping unit groups character strings specified by the OCR processing unit with respect to the same input item based on the similarity of the character strings.
をさらに有する
請求項2に記載のOCR処理装置。 The OCR processing apparatus according to claim 2, further comprising a character string confirmation unit that specifies a confirmed character string for a plurality of character strings classified by the grouping unit according to a user operation.
請求項3に記載のOCR処理装置。 The OCR processing device according to claim 3, wherein the display unit changes the display mode of a plurality of character strings classified into the same group by the grouping unit according to the number of the same character strings.
請求項4に記載のOCR処理装置。 The OCR processing apparatus according to claim 4, wherein the display unit displays the largest number of the same character strings in a plurality of character strings classified into the same group by the grouping unit with emphasis over other character strings.
予め登録された登録文字列と一致する文字列を、グループに分類する辞書グループ化部と、
前記辞書グループ化部によりいずれの登録文字列とも不一致であると判定された文字列について、互いの類似度に基づいて分類する類似グループ化部と
を含み、
前記表示部は、前記辞書グループ化部により分類された文字列、又は、前記類似グループ化部により分類された文字列を、グループ毎に区別して表示する
請求項5に記載のOCR処理装置。 The grouping unit
A dictionary grouping unit that classifies character strings that match pre-registered registered character strings into groups,
The dictionary grouping unit includes a similar grouping unit that classifies character strings that are determined to be inconsistent with any of the registered character strings based on their similarity to each other.
The OCR processing apparatus according to claim 5, wherein the display unit displays a character string classified by the dictionary grouping unit or a character string classified by the similar grouping unit separately for each group.
未記入であると判定された入力項目をグループ化する未記入グループ化部と、
前記未記入グループ化部により未記入であると判定されなかった入力項目について、予め登録された登録文字列と一致する文字列を、グループに分類する辞書グループ化部と、
前記辞書グループ化部によりいずれの登録文字列とも不一致であると判定された文字列について、互いの類似度に基づいて分類する類似グループ化部と
を含み、
前記表示部は、前記辞書グループ化部により分類された文字列、又は、前記類似グループ化部により分類された文字列を、グループ毎に区別して表示する
請求項5に記載のOCR処理装置。 The grouping unit
An unfilled grouping unit that groups input items that are determined to be blank, and
A dictionary grouping unit that classifies character strings that match pre-registered registered character strings into groups for input items that are not determined to be blank by the blank grouping unit.
The dictionary grouping unit includes a similar grouping unit that classifies character strings that are determined to be inconsistent with any of the registered character strings based on their similarity to each other.
The OCR processing apparatus according to claim 5, wherein the display unit displays a character string classified by the dictionary grouping unit or a character string classified by the similar grouping unit separately for each group.
前記グループ移動部により移動させた文字列について、移動先のグループに関して前記文字列確定部により確定された確定文字列を適用する移動確定部と
をさらに有する請求項3に記載のOCR処理装置。 A group moving unit that accepts an operation for moving a character string between groups classified by the grouping unit, and a group moving unit.
The OCR processing apparatus according to claim 3, further comprising a movement confirmation unit that applies a confirmation character string confirmed by the character string confirmation unit to the movement destination group for the character string moved by the group movement unit.
をさらに有する請求項3に記載のOCR処理装置。 The OCR processing apparatus according to claim 3, further comprising a group display unit that displays a list of groups classified by the grouping unit and indicates whether or not the confirmation work for each group has been completed.
コンピュータが、前記OCR処理ステップにより特定された複数の文字列を、複数のグループに分類するグループ化ステップと、
コンピュータが、前記グループ化ステップにより分類された複数の文字列を、グループ毎に区別して表示する表示ステップと
を有するOCR処理方法。 An OCR processing step in which the computer identifies the character string entered in the input item,
A grouping step in which the computer classifies the plurality of character strings identified by the OCR processing step into a plurality of groups,
An OCR processing method in which a computer has a display step for displaying a plurality of character strings classified by the grouping step separately for each group.
前記OCR処理ステップにより特定された複数の文字列を、複数のグループに分類するグループ化ステップと、
前記グループ化ステップにより分類された複数の文字列を、グループ毎に区別して表示する表示ステップと
をコンピュータに実行させるプログラム。 An OCR processing step that identifies the character string entered in the input item,
A grouping step for classifying a plurality of character strings specified by the OCR processing step into a plurality of groups, and a grouping step.
A program that causes a computer to execute a display step that displays a plurality of character strings classified by the grouping step separately for each group.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020202849A JP2022090443A (en) | 2020-12-07 | 2020-12-07 | OCR processing device, OCR processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020202849A JP2022090443A (en) | 2020-12-07 | 2020-12-07 | OCR processing device, OCR processing method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022090443A true JP2022090443A (en) | 2022-06-17 |
Family
ID=81992640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020202849A Pending JP2022090443A (en) | 2020-12-07 | 2020-12-07 | OCR processing device, OCR processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022090443A (en) |
-
2020
- 2020-12-07 JP JP2020202849A patent/JP2022090443A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11106716B2 (en) | Automatic hierarchical classification and metadata identification of document using machine learning and fuzzy matching | |
CN110942074B (en) | Character segmentation recognition method and device, electronic equipment and storage medium | |
US20210209359A1 (en) | Image processing apparatus, control method for image processing apparatus, and non-transitory storage medium | |
EP3881234A1 (en) | Automatically predicting text in images | |
US8577826B2 (en) | Automated document separation | |
CN111291742B (en) | Object recognition method and device, electronic equipment and storage medium | |
US11270143B2 (en) | Computer implemented method and system for optical character recognition | |
JP2008310772A (en) | Information processing device, control program thereof, computer readable recording medium in which control program is recorded, and control method | |
US10097724B2 (en) | System, control method, and recording medium | |
JP2022090443A (en) | OCR processing device, OCR processing method, and program | |
JP2017111500A (en) | Character recognizing apparatus, and program | |
JP2021060801A (en) | Information processing system, information processing device, method, and program | |
US9378466B2 (en) | Data reduction in nearest neighbor classification | |
US11972208B2 (en) | Information processing device and information processing method | |
JP2020087112A (en) | Document processing apparatus and document processing method | |
US20220156490A1 (en) | Method and system for extracting information from a document image | |
JPWO2020044537A1 (en) | Image matching device, image matching method, and program | |
EP4231171A1 (en) | Information processing apparatus and method and program | |
JP7463675B2 (en) | Information processing device and information processing program | |
JP2012146147A (en) | Document processing device and document processing program | |
US11574490B2 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
US20220179524A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP7338265B2 (en) | Information processing device and program | |
US11410408B2 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
TW202349270A (en) | Intelligent identification system and intelligent identification method wherein the system includes a database server and an intelligent identification server |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD07 | Notification of extinguishment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7427 Effective date: 20221118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221227 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230920 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20231010 |