JP7450131B2 - 画像処理システム、画像処理方法、及びプログラム - Google Patents
画像処理システム、画像処理方法、及びプログラム Download PDFInfo
- Publication number
- JP7450131B2 JP7450131B2 JP2023564176A JP2023564176A JP7450131B2 JP 7450131 B2 JP7450131 B2 JP 7450131B2 JP 2023564176 A JP2023564176 A JP 2023564176A JP 2023564176 A JP2023564176 A JP 2023564176A JP 7450131 B2 JP7450131 B2 JP 7450131B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- area
- character
- regular
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 132
- 238000003672 processing method Methods 0.000 title claims description 3
- 238000007493 shaping process Methods 0.000 claims description 51
- 238000001514 detection method Methods 0.000 claims description 46
- 238000006243 chemical reaction Methods 0.000 claims description 34
- 230000000873 masking effect Effects 0.000 claims description 23
- 238000013500 data storage Methods 0.000 claims description 19
- 238000012795 verification Methods 0.000 claims description 15
- 230000004048 modification Effects 0.000 description 68
- 238000012986 modification Methods 0.000 description 68
- 238000000034 method Methods 0.000 description 46
- 238000010586 diagram Methods 0.000 description 26
- 230000008569 process Effects 0.000 description 13
- 238000010801 machine learning Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000002040 relaxant effect Effects 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical class N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 1
- DEXFNLNNUZKHNO-UHFFFAOYSA-N 6-[3-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperidin-1-yl]-3-oxopropyl]-3H-1,3-benzoxazol-2-one Chemical class C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1CCN(CC1)C(CCC1=CC2=C(NC(O2)=O)C=C1)=O DEXFNLNNUZKHNO-UHFFFAOYSA-N 0.000 description 1
- NIPNSKYNPDTRPC-UHFFFAOYSA-N N-[2-oxo-2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethyl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical class O=C(CNC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 NIPNSKYNPDTRPC-UHFFFAOYSA-N 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Description
本開示に係る画像処理システムの実施形態の一例を説明する。図1は、画像処理システムの全体構成の一例を示す図である。例えば、画像処理システム1は、ユーザ端末10及びサーバ20を含む。ユーザ端末10及びサーバ20は、インターネット又はLAN等のネットワークNに接続可能である。画像処理システム1は、少なくとも1つのコンピュータを含めばよく、図1の例に限られない。
本実施形態では、eKYC(electronic Know Your Customer)に画像処理システム1を適用する場合を例に挙げる。eKYCは、オンラインで行われる本人確認である。eKYCは、任意のサービスで利用可能である。例えば、通信サービス、金融サービス、電子決済サービス、電子商取引サービス、保険サービス、又は行政サービスで、eKYCを利用可能である。
図3は、画像処理システム1で実現される機能の一例を示す機能ブロック図である。本実施形態では、主な画像処理がユーザ端末10で実行される場合を例に挙げる。
データ記憶部100は、記憶部12を主として実現される。画像取得部101、検出部102、文字認識部103、定型領域判定部104、非定型領域特定部105、マスキング実行部106、送信部107、及び保険証判定部108は、制御部11を主として実現される。主に、検出部102、文字認識部103、及び定型領域判定部104が第1の構成に関係する。主に、検出部102、定型領域判定部104、及び非定型領域特定部105が第2の構成に関係する。
データ記憶部100は、本実施形態の画像処理に必要なデータを記憶する。例えば、データ記憶部100は、先述したサービスを利用するためのアプリを記憶する。本実施形態では、このアプリの処理として、画像処理が実行される場合を説明するが、画像処理は、任意のプログラムの処理として実行されてよい。例えば、ブラウザから実行されるスクリプト又は他のプログラムの処理として、画像処理が実行されてもよい。データ記憶部100は、保険証画像Iを記憶してもよい。例えば、データ記憶部100は、後述の定型文字列を示す情報を記憶してもよい。
画像取得部101は、保険証画像Iを取得する。本実施形態では、保険証画像Iは、保険証Cが撮影されることによって生成された画像である。このため、画像取得部101が、撮影部16により生成された保険証画像Iを取得する場合を説明する。撮影部16は、画像生成手段の一例である。画像取得部101は、スキャナ、コピー機、又は複合機といった他の画像生成手段から、保険証画像Iを取得してもよい。画像取得部101は、データ記憶部100に予め記憶された保険証画像Iを取得してもよいし、ユーザ端末10以外の他のコンピュータ又は他の情報記憶媒体から保険証画像Iを取得してもよい。
検出部102は、保険証画像Iから、任意の文字列を含む文字列領域を検出する。文字列領域は、保険証画像Iのうち、何らかの文字列を含む領域である。文字列は、複数の文字の連なりである。本実施形態では、文字列領域が四角形であるものとするが、文字列領域は、任意の形状であってよい。例えば、文字列形状は、四角形以外の多角形、円形、又は楕円形であってもよい。文字列領域は、バウンディングポリゴン又はバウンディングボックスと呼ばれることもある。文字列領域に含まれる文字列は、単語であってもよいし、単語以外の文字列であってもよい。
文字認識部103は、文字列領域Rに対して文字認識を行い、文字列領域Rに含まれる1文字ごとに、文字認識の結果に関するスコアを計算する。文字認識は、光学文字認識(OCR)と呼ばれることもある。文字認識は、インテリジェント文字認識(ICR)又はインテリジェント単語認識(IWR)といったように、光学文字認識以外の他の名前で呼ばれることもある。文字認識自体は、種々の手法を利用可能である。例えば、機械学習モデルを利用した手法(いわゆるAI OCRと呼ばれる手法)、テンプレート画像を利用した手法、又は線の形状的な特徴を利用した手法を利用可能である。
定型領域判定部104は、1文字ごとに計算されたスコアに基づいて、文字列領域Rが定型文字列を含む定型領域であるか否かを判定する。本実施形態では、複数の定型文字列が特定対象となるので、定型領域判定部104は、定型文字列ごとに、文字列領域Rが当該定型文字列を含む定型領域であるか否かを判定する。例えば、定型文字列として「SB」及び「NB」があるので、定型領域判定部104は、文字列領域Rが「SB」の定型領域であるか否かと、文字列領域Rが「NB」の定型領域であるか否かと、を判定する。
非定型領域特定部105は、定型領域があると判定された場合に、定型領域と所定の位置関係にある文字列領域Rを、非定型文字列を含む非定型領域として特定する。所定の位置関係は、保険証Cにおける定型文字列と非定型文字列との位置関係である。所定の位置関係は、定型文字列の位置を基準とした場合に非定型文字列が配置された位置である。位置関係は、相対的な位置ということもできる。
図9は、非定型領域に対してマスキングが実行された後の保険証画像Iの一例を示す図である。マスキング実行部106は、非定型領域に対してマスキングを実行する。マスキングは、非定型領域を見えなくする画像処理である。例えば、所定の色で塗りつぶす処理、何らかの画像若しくはパターンをマッピングする処理、非定型領域を切り取る処理、又はモザイクをかける処理である。図9のように、保険証画像Iのうち、非定型領域である文字列領域R10,R12の部分がマスキングされたので、第三者に「538712110」及び「123」の文字列が知られない状態になっている。
送信部107は、サーバ20に、マスキングが実行された保険証画像Iを送信する。例えば、送信部107は、非定型領域である文字列領域R10,R12がマスキングされて、第三者に「538712110」及び「123」の文字列が知られない状態の保険証画像Iを、サーバ20に送信する。本実施形態では、後述の保険証判定部108により保険証画像Iに保険証Cが含まれると判定された場合に、保険証画像Iに対するマスキングが実行されて、送信部107は、保険証画像Iを送信する。保険証判定部108により保険証画像Iに保険証Cが含まれると判定されない場合には、保険証Cの撮影が再度要求されてもよい。
保険証判定部108は、複数の定型文字列の中に、定型領域が特定されなかった定型文字列が存在する場合には、保険証画像Iに保険証Cが含まれていないと判定する。本実施形態では、保険証判定部108は、1つ以上の定型文字列の定型領域が特定されなかった場合に、保険証画像Iに保険証Cが含まれていないと判定する。このため、保険証判定部108は、全ての定型文字列の定型領域が特定された場合に、保険証画像Iに保険証Cが含まれていると判定する。
データ記憶部200は、記憶部22を主として実現される。受信部201は、制御部21を主として実現される。
本実施形態のデータ記憶部200は、eKYCに必要なデータを記憶する。例えば、データ記憶部200は、ユーザ端末10から受信した保険証画像Iを記憶する。本実施形態では、マスキングが実行された保険証画像Iが送信されるので、データ記憶部200は、マスキングが実行された保険証画像Iを記憶する。
受信部201は、ユーザ端末10から、マスキングが実行された保険証画像Iを受信する。受信部201は、受信した保険証画像Iをデータ記憶部200に記録する。
図10は、画像処理システム1で実行される処理の一例を示すフロー図である。図10のように、ユーザ端末10は、撮影部16による撮影結果に基づいて、保険証Cを含む保険証画像Iを取得する(S1)。ユーザ端末10は、Scene Text Detectionの手法を利用して、保険証画像Iから、複数の文字列領域Rを検出する(S2)。S2において検出された文字列領域Rは、図4のような状態になる。ユーザ端末10は、S2で検出された複数の文字列領域Rの中から、定型文字列と同じ文字数の文字列領域Rを特定する(S3)。S3において特定された文字列領域Rは、図5のような状態になる。
以上のように、画像処理システム1は、保険証画像Iの中から「SB」及び「NB」の領域を精度よく特定するための第1の構成を含む。画像処理システム1は、保険証画像Iから検出された文字列領域Rに対して文字認識を行う。画像処理システム1は、文字列領域Rに含まれる1文字ごとに計算されたスコアに基づいて、文字列領域Rが定型領域であるか否かを判定する。これにより、文字認識だけでは定型文字列を特定できないような保険証画像Iだったとしても、保険証画像Iから定型領域を確実に特定できる。例えば、保険証画像Iにおける保険証Cが曲がったり歪んだりしていたりした場合、具体的にどの文字が含まれているかを特定することは難しいが、何らかの文字が含まれているかを特定することはできる。例えば、他の文字と似た文字が定型文字列に含まれる場合、文字認識では誤認識が発生しやすいが、何らかの文字が含まれているかを特定することはできる。これらの場合のように、文字認識を精度良く行うことが難しい場合だったとしても、ひとまずは精度良く検出できる文字列領域Rを検出する。その後に行われる文字認識は、あまり精度良く行うことはできないが、文字列全体のスコアではなく、1文字ごとの個別のスコアを利用することによって、高スコア文字の組み合わせの中に定型文字列が含まれていればよいといった判定が可能になるので、定型領域を特定しやすくなる。
以上のように、画像処理システム1は、「SB」及び「NB」の領域から事業所整理番号及び個人番号の領域を精度よく特定するための第2の構成を含む。画像処理システム1は、保険証画像Iから検出した複数の文字列領域Rの中に定型領域があるか否かを判定する。画像処理システム1は、定型領域があると判定された場合に、定型領域と所定の位置関係にある文字列領域Rを、非定型領域として特定する。これにより、比較的特定しやすい定型領域を手掛かりにして非定型領域を特定できるので、保険証画像Iから非定型領域を確実に特定できる。即ち、非定型文字列は、何の文字が含まれているか事前に分からないので非定型領域を特定することは難しいが、定型文字列は、何の文字が含まれているか事前に分かっているので、定型領域は、比較的特定しやすい。定型文字列と非定型文字列の位置関係は事前に分かっているので、定型領域を手掛かりにすれば、非定型領域を精度良く特定できる。
なお、本開示は、以上に説明した実施形態に限定されるものではない。本開示の趣旨を逸脱しない範囲で、適宜変更可能である。
図11は、第1の構成に関する変形例における機能ブロック図である。第1の構成に関する変形例では、該当基準決定部109及び基準数決定部110が実現される。該当基準決定部109及び基準数決定部110は、制御部11を主として実現される。
例えば、定型領域判定部104は、1文字ごとに、当該1文字の中でスコアが基準スコア以上の認識可能文字を、高スコア文字として特定してもよい。即ち、実施形態の図6の例では、上位5位の認識可能文字が高スコア文字として特定されたが、上位何位までを高スコア文字とするかは定めずに、基準スコア以上の認識可能文字であれば、何文字でも高スコア文字としてもよい。基準スコアは、高スコア文字を特定するための基準となるスコアである。基準スコアは、任意の値であってよい。基準スコアは、固定値であってもよいし、可変値であってもよい。
例えば、定型文字列に含まれる個々の文字によっては、他の文字との誤認識が発生しやすい文字も存在する。このため、高スコア文字に該当するための該当基準は、全ての文字で同じにするのではなく、文字に応じて異ならせてもよい。該当基準は、高スコア文字に分類されるためにスコアが満たすべき条件である。実施形態の例であれば、上位5位に入ることが該当基準に相当する。変形例1-1の例であれば、基準スコア以上であることが該当基準に相当する。
例えば、実施形態では、ある文字列領域Rから特定された高スコア文字の組み合わせの中に、定型文字列に含まれる全ての文字が存在することを、定型領域を特定するための条件とする場合を説明した。このような条件を設定すると、定型文字列の文字数が多い場合に、条件が厳しすぎてしまい、定型領域を特定できなくなる可能性もある。例えば、定型文字列が10文字だったとすると、10文字全てが高スコア文字の組み合わせに存在しなくても、10文字のうちの8文字以上が高スコア文字の組み合わせに存在すれば、文字列領域Rが定型領域であると思われる。
例えば、変形例1-3の基準数は、定型文字列に応じた数であってもよい。変形例1-4の画像処理システム1は、基準数決定部110を含む。基準数決定部110は、定型文字列に基づいて、基準数を決定する。定型文字列と基準数の関係は、予め定められているものとする。例えば、基準数決定部110は、定型文字列の誤認識のしやすさに基づいて、基準数を決定する。基準数決定部110は、定型文字列が誤認識される確率が高いほど、基準数が少なくなるように基準数を決定する。逆にいえば、基準数決定部110は、定型文字列が誤認識される確率が低いほど、基準数が多くなるように基準数を決定する。
例えば、実施形態では、認識可能文字ごとにスコアが計算される場合を説明したが、定型文字列は予め分かっているので、文字認識部103は、文字列領域Rに対し、定型文字列に含まれる複数の定型文字の各々に関する文字認識を行い、定型文字ごとに、スコアを計算してもよい。即ち、文字認識部103は、定型文字以外の他の文字についてもスコアを計算するのではなく、定型文字だけについて、スコアを計算してもよい。実施形態で説明した「SB」及び「NB」であれば、定型文字は、「S」、「B」、「N」の3種類となる。文字認識部103は、これら3種類の定型文字についてのみ、スコアを計算してもよい。
例えば、変形例1-5の基準合計値は、定型文字の形状に応じた値であってもよい。定型領域判定部104は、複数の定型文字の各々の形状に応じた基準合計値に基づいて、文字列領域Rが定型領域であるか否かを判定する。例えば、定型文字列が複雑であれば、形状が似た文字が少ないので、他の文字との誤認識が発生しにくいと考えられる。このため、定型領域判定部104は、基準合計値が高くなるように基準合計値を設定する。複雑な形状の文字は、そもそも認識されやすいので、基準合計値を高くしても、定型領域が特定されないといったことは発生しないと考えられる。
例えば、定型領域判定部104は、定型文字列に含まれる定型文字の文字数に応じた基準合計値に基づいて、文字列領域Rが定型領域であるか否かを判定してもよい。定型領域判定部104は、定型文字列に含まれる定型文字の文字数が多いほど、基準合計値が高くなるように、基準合計値を設定する。逆にいえば、定型領域判定部104は、定型文字列に含まれる定期文字の文字数が少ないほど、基準合計値が低くなるように、基準合計値を設定する。定型文字の文字数に応じた基準合計値が設定されるといった点で変形例1-5とは異なるが、定型領域を判定する処理自体は、変形例1-5と同様である。
例えば、実施形態で説明したように、複数の認識可能文字には、定型文字列に含まれる複数の定型文字が含まれている。文字認識部103は、文字列領域Rに対し、複数の定型文字の各々に関する文字認識を行い、定型文字ごとに、スコアを計算してもよい。定型領域判定部104は、定型文字ごとに計算されたスコアに基づいて、文字列領域Rが定型領域であるか否かを判定してもよい。この場合のスコアの計算は、変形例1-5と同様に、定型文字だけが対象になる。定型領域判定部104は、変形例1-5のようなスコアの合計値ではなく、スコアの平均値等の他の指標に基づいて、文字列領域Rが定型領域であるか否かを判定してもよい。
例えば、実施形態では、定型文字列の文字数に応じた文字列領域Rが検出される場合を説明したが、検出部102は、定型文字列に応じたサイズの文字列領域Rを検出してもよい。定型領域判定部104は、定型文字列に応じたサイズの文字列領域Rが定型領域であるか否かを判定してもよい。定型文字列に応じたサイズは、データ記憶部100に予め定められているものとする。
図12は、第2の構成に関する変形例における機能ブロック図である。第2の構成に関する変形例では、実施形態及び変形例1-1~1-9における文字認識部103を、第1文字認識部103という。第2の構成に関する変形例では、整形部111及び第2文字認識部112が実現される。整形部111及び第2文字認識部112は、制御部11を主として実現される。
例えば、実施形態では、非定型領域に対し、マスキングが実行される場合を説明した。非定型領域には、マスキング以外の他の画像処理が実行されてもよい。変形例2-1では、非定型領域に対し、文字認識が実行される場合を説明する。実施形態のeKYCでは、非定型文字列は利用されなかったが、変形例2-1のeKYCでは、非定型文字列が利用される場合を例に挙げる。例えば、保険証Cの事業所整理番号及び個人番号がeKYCで利用される。
例えば、保険証画像Iにおける保険証Cが曲がっていたり歪んでいたりすると、非定型領域内の個々の文字も曲がっていたり歪んでいたりすることがある。この場合、変形例2-1のように、非定型領域に対して文字認識を実行しようとしても、非定型文字列を正確に認識できない可能性がある。このため、文字認識がしやすい形状になるように、非定型領域を整形することが考えられる。
例えば、変形例2-2のように文字列領域R10の変換係数を流用するのではなく、文字列領域R12についても、変換係数が計算されてもよい。以降、文字列領域R10の変換係数を第1変換係数という。文字列領域R12の変換係数を第2変換係数という。第2変換係数の計算方法は、文字列領域R11が定型領域に相当し、この定型領域の見本画像が利用されるという点で第1変換係数の計算方法とは異なるが、計算方法自体は同様である。このため、第2変換係数も図13と同様の流れによって計算される。
例えば、非定型文字列は、何文字程度であるかは事前に分かることがある。このため、非定型文字列としてあまりにも文字数が多い又は少ない文字列領域Rについては、非定型領域の判定から除外してもよい。例えば、保険証Cの事業所整理番号であれば、5文字~10文字程度であることが多い。保険証Cの個人番号であれば、1文字~5文字程度であることが多い。このため、10文字よりも多い文字列領域Rが検出された場合には、非定型領域である確率が低いので、非定型領域の判定対象にならないようにしてもよい。
例えば、非定型領域特定部105は、複数の文字列領域Rの中から、非定型文字列に応じたサイズの文字列領域Rを特定し、当該特定された文字列領域Rが定型領域と位置関係にある場合に、非定型領域として特定してもよい。例えば、変形例2-4で説明したような文字数ではなく、明らかに10文字よりも多い文字列のサイズである文字列領域Rは、非定型領域の判定対象にならないようにしてもよい。
例えば、上記変形例を組み合わせてもよい。
Claims (16)
- 定型文字列及び非定型文字列を含む対象物に関する対象物画像から、任意の文字列を含む複数の文字列領域を検出する検出部と、
前記複数の文字列領域の各々に対して文字認識を行う文字認識部と、
前記文字認識部による認識結果に基づいて、前記複数の文字列領域の中に、前記定型文字列を含む四角形の定型領域があるか否かを判定する定型領域判定部と、
前記定型領域があると判定された場合に、前記定型領域と、前記対象物における前記定型文字列及び前記非定型文字列の実際の位置関係に応じて定められた所定の位置関係にある前記文字列領域を、前記非定型文字列を含む非定型領域とみなす前記文字列領域として特定する非定型領域特定部と、
を含み、
前記非定型領域特定部は、前記定型領域の互いに対向する2本の辺を所定の方向に所定の距離だけ伸ばした2本の線上又はその付近に前記文字列領域がある場合に、当該文字列領域が前記定型領域と前記位置関係にあると判定する、
画像処理システム。 - 定型文字列及び非定型文字列を含む対象物に関する対象物画像から、任意の文字列を含む複数の文字列領域を検出する検出部と、
前記複数の文字列領域の各々に対して文字認識を行う文字認識部と、
前記文字認識部による認識結果に基づいて、前記複数の文字列領域の中に、前記定型文字列を含む定型領域があるか否かを判定する定型領域判定部と、
前記定型領域があると判定された場合に、前記定型領域と、前記対象物における前記定型文字列及び前記非定型文字列の実際の位置関係に応じて定められた所定の位置関係にある前記文字列領域を、前記非定型文字列を含む非定型領域とみなす前記文字列領域として特定する非定型領域特定部と、
を含み、
前記非定型領域特定部は、
前記複数の文字列領域のうち、前記定型領域と所定の第1位置関係にある前記文字列領域が1つしか存在しない場合には、当該文字列領域を前記非定型領域とみなし、
前記定型領域と前記第1位置関係にある前記文字列領域が複数存在する場合には、当該複数の文字列領域のうち、前記定型領域と第2位置関係にある前記文字列領域を、前記非定型領域とみなす、
画像処理システム。 - 定型文字列及び非定型文字列を含む対象物に関する対象物画像から、任意の文字列を含む複数の文字列領域を検出する検出部と、
前記複数の文字列領域の各々に対して文字認識を行う文字認識部と、
前記文字認識部による認識結果に基づいて、前記複数の文字列領域の中に、前記定型文字列を含む定型領域があるか否かを判定する定型領域判定部と、
前記定型領域があると判定された場合に、前記定型領域と、前記対象物における前記定型文字列及び前記非定型文字列の実際の位置関係に応じて定められた所定の位置関係にある前記文字列領域を、前記非定型文字列を含む非定型領域とみなす前記文字列領域として特定する非定型領域特定部と、
前記定型領域と、前記定型領域の見本に関する見本領域と、に基づいて、前記非定型領域を整形する整形部と、
を含む画像処理システム。 - 定型文字列及び非定型文字列を含む対象物に関する対象物画像から、任意の文字列を含む複数の文字列領域を検出する検出部と、
前記複数の文字列領域の各々に対して文字認識を行う文字認識部と、
前記文字認識部による認識結果に基づいて、前記複数の文字列領域の中に、前記定型文字列を含む定型領域があるか否かを判定する定型領域判定部と、
前記定型領域があると判定された場合に、前記定型領域と、前記対象物における前記定型文字列及び前記非定型文字列の実際の位置関係に応じて定められた所定の位置関係にある前記文字列領域を、前記非定型文字列を含む非定型領域とみなす前記文字列領域として特定する非定型領域特定部と、
を含み、
前記非定型領域特定部は、
前記複数の文字列領域の中から、前記非定型文字列に応じた文字数の前記文字列領域を特定し、
当該特定された文字列領域が前記定型領域と前記位置関係にある場合に、当該特定された文字列領域を前記非定型領域とみなす、
画像処理システム。 - 定型文字列及び非定型文字列を含む対象物に関する対象物画像から、任意の文字列を含む複数の文字列領域を検出する検出部と、
前記複数の文字列領域の各々に対して文字認識を行う文字認識部と、
前記文字認識部による認識結果に基づいて、前記複数の文字列領域の中に、前記定型文字列を含む定型領域があるか否かを判定する定型領域判定部と、
前記定型領域があると判定された場合に、前記定型領域と、前記対象物における前記定型文字列及び前記非定型文字列の実際の位置関係に応じて定められた所定の位置関係にある前記文字列領域を、前記非定型文字列を含む非定型領域とみなす前記文字列領域として特定する非定型領域特定部と、
を含み、
前記非定型領域特定部は、
前記複数の文字列領域の中から、前記非定型文字列に応じたサイズとしてデータ記憶部に予め記憶されたサイズの前記文字列領域を特定し、
当該特定された文字列領域が前記定型領域と前記位置関係にある場合に、当該特定された文字列領域を前記非定型領域とみなす、
画像処理システム。 - 定型文字列及び非定型文字列を含む対象物であって、複数の前記非定型文字列が含まれている前記対象物に関する対象物画像から、任意の文字列を含む複数の文字列領域を検出する検出部と、
前記複数の文字列領域の各々に対して文字認識を行う文字認識部と、
前記文字認識部による認識結果に基づいて、前記複数の文字列領域の中に、前記定型文字列を含む定型領域があるか否かを判定する定型領域判定部と、
前記定型領域があると判定された場合に、前記定型領域と、前記対象物における前記定型文字列及び前記非定型文字列の実際の位置関係に応じて定められた所定の位置関係にある前記文字列領域を、前記非定型文字列を含む非定型領域とみなす前記文字列領域として特定する非定型領域特定部と、
前記複数の非定型文字列の中に、前記非定型領域とみなす前記文字列領域が特定されなかった前記非定型文字列が存在する場合には、前記対象物画像に前記対象物が含まれていないと判定する対象物判定部と、
を含む画像処理システム。 - 前記非定型領域特定部は、前記線上又はその付近に複数の前記文字列領域がある場合に、当該複数の文字列領域のうち、前記定型領域から最も近い前記文字列領域を、前記非定型領域とみなす、
請求項1に記載の画像処理システム。 - 前記非定型領域特定部は、前記定型領域と前記第1位置関係にある前記文字列領域が複数存在する場合に、当該複数の文字列領域のうち、前記定型領域に最も近い前記文字列領域を、前記定型領域と前記第2位置関係にある前記文字列領域として特定する、
請求項2に記載の画像処理システム。 - 前記定型領域及び前記見本領域は、四角形であり、
前記整形部は、前記定型領域の幅と、前記見本領域の幅と、に基づいて、前記非定型領域を整形する、
請求項3に記載の画像処理システム。 - 前記対象物は、第1定型文字列、第2定型文字列、第1非定型文字列、及び第2非定型文字列を含み、
前記定型領域判定部は、前記複数の文字列領域の中に、前記第1定型文字列を含む第1定型領域と、前記第2定型文字列を含む第2定型領域と、があるか否かを判定し、
前記非定型領域特定部は、
前記第1定型領域及び前記第2定型領域があると判定された場合に、前記第1定型領域と所定の位置関係にある前記文字列領域を、前記第1非定型文字列を含む第1非定型領域とみなし、
前記第2定型領域と所定の位置関係にある前記文字列領域を、前記第2非定型文字列を含む第2非定型領域とみなし、
前記整形部は、
前記第1定型領域と、前記第1定型領域の見本に関する第1見本領域と、に基づいて、前記第1非定型領域の整形に関する変換係数を決定し、
当該決定された変換係数に基づいて、前記第1非定型領域を整形し、
当該決定された変換係数に基づいて、前記第2非定型領域も整形する、
請求項3又は9に記載の画像処理システム。 - 前記対象物は、第1定型文字列、第2定型文字列、第1非定型文字列、及び第2非定型文字列を含み、
前記定型領域判定部は、前記複数の文字列領域の中に、前記第1定型文字列を含む第1定型領域と、前記第2定型文字列を含む第2定型領域と、があるか否かを判定し、
前記非定型領域特定部は、
前記第1定型領域及び前記第2定型領域があると判定された場合に、前記第1定型領域と所定の位置関係にある前記文字列領域を、前記第1非定型文字列を含む第1非定型領域とみなし、
前記第2定型領域と所定の位置関係にある前記文字列領域を、前記第2非定型文字列を含む第2非定型領域とみなし、
前記整形部は、
前記第1定型領域と、前記第1定型領域の見本に関する第1見本領域と、に基づいて、前記第1非定型領域の整形に関する第1変換係数を決定し、
当該決定された第1変換係数に基づいて、前記第1非定型領域を整形し、
前記第2定型領域と、前記第2定型領域の見本に関する第2見本領域と、に基づいて、前記第2非定型領域の整形に関する第2変換係数を決定し、
当該決定された第2変換係数に基づいて、前記第2非定型領域を整形する、
請求項3又は9に記載の画像処理システム。 - 前記画像処理システムは、前記非定型領域に対してマスキングを実行するマスキング実行部を更に含む、
請求項1~11の何れかに記載の画像処理システム。 - 前記画像処理システムは、前記非定型領域に対して文字認識を実行する文字認識部を更に含む、
請求項1~12に記載の画像処理システム。 - 前記対象物は、本人確認書類であり、
前記定型文字列及び前記非定型文字列は、本人確認のために必要な情報に関する文字列であり、
前記対象物画像は、前記本人確認書類が撮影されることによって生成された画像である、
請求項1~13の何れかに記載の画像処理システム。 - 定型文字列及び非定型文字列を含む対象物に関する対象物画像から、任意の文字列を含む複数の文字列領域を検出する検出ステップと、
前記複数の文字列領域の各々に対して文字認識を行う文字認識ステップと、
前記文字認識ステップによる認識結果に基づいて、前記複数の文字列領域の中に、前記定型文字列を含む四角形の定型領域があるか否かを判定する定型領域判定ステップと、
前記定型領域があると判定された場合に、前記定型領域と、前記対象物における前記定型文字列及び前記非定型文字列の実際の位置関係に応じて定められた所定の位置関係にある前記文字列領域を、前記非定型文字列を含む非定型領域とみなす前記文字列領域として特定する非定型領域特定ステップと、
を含み、
前記非定型領域特定ステップは、前記定型領域の互いに対向する2本の辺を所定の方向に所定の距離だけ伸ばした2本の線上又はその付近に前記文字列領域がある場合に、当該文字列領域が前記定型領域と前記位置関係にあると判定する、
画像処理方法。 - 定型文字列及び非定型文字列を含む対象物に関する対象物画像から、任意の文字列を含む複数の文字列領域を検出する検出部、
前記複数の文字列領域の各々に対して文字認識を行う文字認識部、
前記文字認識部による認識結果に基づいて、前記複数の文字列領域の中に、前記定型文字列を含む四角形の定型領域があるか否かを判定する定型領域判定部、
前記定型領域があると判定された場合に、前記定型領域と、前記対象物における前記定型文字列及び前記非定型文字列の実際の位置関係に応じて定められた所定の位置関係にある前記文字列領域を、前記非定型文字列を含む非定型領域とみなす前記文字列領域として特定する非定型領域特定部、
としてコンピュータを機能させ、
前記非定型領域特定部は、前記定型領域の互いに対向する2本の辺を所定の方向に所定の距離だけ伸ばした2本の線上又はその付近に前記文字列領域がある場合に、当該文字列領域が前記定型領域と前記位置関係にあると判定する、
プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2022/013065 WO2023181103A1 (ja) | 2022-03-22 | 2022-03-22 | 画像処理システム、画像処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2023181103A1 JPWO2023181103A1 (ja) | 2023-09-28 |
JP7450131B2 true JP7450131B2 (ja) | 2024-03-14 |
Family
ID=88100200
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023564176A Active JP7450131B2 (ja) | 2022-03-22 | 2022-03-22 | 画像処理システム、画像処理方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4379678A1 (ja) |
JP (1) | JP7450131B2 (ja) |
WO (1) | WO2023181103A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007233913A (ja) | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
JP2007241442A (ja) | 2006-03-06 | 2007-09-20 | Oki Electric Ind Co Ltd | 個人情報読取記憶装置及び個人情報読取記憶システム |
-
2022
- 2022-03-22 JP JP2023564176A patent/JP7450131B2/ja active Active
- 2022-03-22 WO PCT/JP2022/013065 patent/WO2023181103A1/ja active Application Filing
- 2022-03-22 EP EP22933252.3A patent/EP4379678A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007233913A (ja) | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
JP2007241442A (ja) | 2006-03-06 | 2007-09-20 | Oki Electric Ind Co Ltd | 個人情報読取記憶装置及び個人情報読取記憶システム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2023181103A1 (ja) | 2023-09-28 |
WO2023181103A1 (ja) | 2023-09-28 |
EP4379678A1 (en) | 2024-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11755867B2 (en) | Composite code pattern, generating device, reading device, method, and program | |
US8958644B2 (en) | Creating tables with handwriting images, symbolic representations and media images from forms | |
US8392975B1 (en) | Method and system for image-based user authentication | |
CN110442744A (zh) | 提取图像中目标信息的方法、装置、电子设备及可读介质 | |
US20140036099A1 (en) | Automated Scanning | |
JPWO2015064107A1 (ja) | 管理システム、リスト作成装置、データ構造および印刷ラベル | |
CN112508011A (zh) | 一种基于神经网络的ocr识别方法及设备 | |
JP2016048444A (ja) | 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法 | |
US9298685B2 (en) | Automatic creation of multiple rows in a table | |
CN110909740A (zh) | 信息处理装置以及存储介质 | |
WO2024088291A1 (zh) | 表单填充方法、装置、电子设备及介质 | |
TW202006597A (zh) | 影像處理系統、影像處理方法及程式產品 | |
RU2603495C1 (ru) | Классификация изображений документов на основе параметров цветовых слоев | |
CN114283273A (zh) | 对照系统、对照方法和信息存储介质 | |
JP7450131B2 (ja) | 画像処理システム、画像処理方法、及びプログラム | |
KR102328034B1 (ko) | 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법 | |
WO2023181102A1 (ja) | 画像処理システム、画像処理方法、及びプログラム | |
US11715318B2 (en) | Systems and methods for spatial-aware information extraction from electronic source documents | |
CN116030469A (zh) | 一种处理方法、装置、设备和计算机可读存储介质 | |
JP5998090B2 (ja) | 画像照合装置、画像照合方法、画像照合プログラム | |
JP4474231B2 (ja) | 文書リンク情報取得システム | |
CN114730499A (zh) | 图像识别方法及装置、训练方法、电子设备和存储介质 | |
CN112633279A (zh) | 文本识别方法、装置和系统 | |
JP7231529B2 (ja) | 情報端末装置、サーバ及びプログラム | |
JP7456580B2 (ja) | 情報処理装置、情報処理システム及び情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231019 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20231019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240304 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7450131 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |