JP7282257B2 - Image processing device, control method and control program - Google Patents

Image processing device, control method and control program Download PDF

Info

Publication number
JP7282257B2
JP7282257B2 JP2022505727A JP2022505727A JP7282257B2 JP 7282257 B2 JP7282257 B2 JP 7282257B2 JP 2022505727 A JP2022505727 A JP 2022505727A JP 2022505727 A JP2022505727 A JP 2022505727A JP 7282257 B2 JP7282257 B2 JP 7282257B2
Authority
JP
Japan
Prior art keywords
area
candidate
image
detected
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022505727A
Other languages
Japanese (ja)
Other versions
JPWO2021181704A1 (en
Inventor
孝憲 國友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Publication of JPWO2021181704A1 publication Critical patent/JPWO2021181704A1/ja
Application granted granted Critical
Publication of JP7282257B2 publication Critical patent/JP7282257B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition

Description

本開示は、画像処理装置、制御方法及び制御プログラムに関し、特に、印鑑又はロゴが含まれる画像を処理する画像処理装置、制御方法及び制御プログラムに関する。 The present disclosure relates to an image processing device, control method and control program, and more particularly to an image processing device, control method and control program for processing an image including a seal or logo.

請求書等の帳票を担当者が手作業によりデータ化している会社では、膨大な数の帳票のデータ化が必要である場合に担当者の業務負担が大きくなるため、帳票のデータ化作業の効率化に対する要望が高まっている。一般に、担当者は、各帳票に記載された取引先に対して所定の業務を行う必要があるため、帳票のデータ化を行う画像処理装置には、担当者が取引先の名称をより精度良く特定できることが望まれている。 In a company where the person in charge manually converts forms such as invoices into data, the work burden on the person in charge becomes large when it is necessary to convert a huge number of forms into data. There is a growing demand for In general, the person in charge needs to perform a predetermined task for the business partner described in each form. Identifiable is desired.

印影の近傍に存在する文字列をデータベースと照合することにより、印影と重なった文字列を推定する業務文書処理装置が開示されている(特許文献1)。この業務文書処理装置は、印影領域の近傍に存在し且つ一部の文字が印影領域によって不明確となっている文字情報を印影関連情報として抽出する。業務文書処理装置は、印影関連情報の属性を特定し、文字列候補を格納する取引先の情報を格納する取引先データベースを参照して、属性毎に分類された印影関連情報を基に、印影領域と重複して不明確となっている文字列を推定する。 A business document processing device is disclosed that estimates a character string that overlaps a seal impression by collating character strings that exist in the vicinity of the seal impression with a database (Patent Document 1). This business document processing apparatus extracts character information that exists in the vicinity of the seal imprint area and part of the characters are unclear due to the seal imprint area as the seal imprint related information. The business document processing device identifies the attribute of the imprint-related information, refers to a customer database that stores information on the customer who stores the character string candidate, and based on the imprint-related information classified by attribute, Estimate the string that overlaps with the region and is ambiguous.

特開2010-157107号公報JP 2010-157107 A

画像処理装置では、入力画像から取引先の名称が含まれる領域をより精度良く特定することが求められている。 Image processing apparatuses are required to more accurately identify an area containing the name of a business partner from an input image.

画像処理装置、制御方法及び制御プログラムの目的は、入力画像から取引先の名称が含まれる領域をより精度良く特定することを可能とすることにある。 An object of the image processing device, the control method, and the control program is to make it possible to more accurately identify an area containing the name of a supplier from an input image.

実施形態の一側面に係る画像処理装置は、取引先の名称に関するキーワードを記憶する記憶部と、入力画像を取得する取得部と、入力画像内で印鑑又はロゴが含まれる画像領域を検出する画像領域検出部と、入力画像から文字列領域を検出する文字列領域検出部と、キーワードに基づいて、文字列領域の中から、取引先の名称が含まれる候補領域を検出する候補領域検出部と、候補領域検出部により複数の候補領域が検出された場合に、画像領域からの距離に基づいて、複数の候補領域の中から一つの取引先領域を特定する取引先領域特定部と、取引先領域に関する情報を出力する出力制御部と、を有する。 An image processing apparatus according to an aspect of an embodiment includes a storage unit that stores a keyword related to the name of a business partner, an acquisition unit that acquires an input image, and an image that detects an image area including a seal or a logo in the input image. an area detection unit, a character string area detection unit that detects a character string area from an input image, and a candidate area detection unit that detects a candidate area containing a client name from the character string area based on a keyword; a customer area identification unit that identifies one customer area from among the plurality of candidate areas based on the distance from the image area when a plurality of candidate areas are detected by the candidate area detection unit; and an output control unit that outputs information about the area.

また、実施形態の一側面に係る制御方法は、記憶部を有する画像処理装置の制御方法であって、画像処理装置が、取引先の名称に関するキーワードを記憶部に記憶し、入力画像を取得し、入力画像内で印鑑又はロゴが含まれる画像領域を検出し、入力画像から文字列領域を検出し、キーワードに基づいて、文字列領域の中から、取引先の名称が含まれる候補領域を検出し、複数の候補領域が検出された場合に、画像領域からの距離に基づいて、複数の候補領域の中から一つの取引先領域を特定し、取引先領域に関する情報を出力する。 A control method according to an aspect of the embodiment is a control method for an image processing apparatus having a storage unit, in which the image processing apparatus stores a keyword related to the name of a business partner in the storage unit and acquires an input image. , Detect image areas that contain a seal or logo in the input image, detect character string areas from the input image, and detect candidate areas that include the name of the client from the character string areas based on the keyword. Then, when a plurality of candidate areas are detected, one supplier area is specified from among the plurality of candidate areas based on the distance from the image area, and information regarding the supplier area is output.

また、実施形態の一側面に係る制御プログラムは、記憶部を有するコンピュータの制御プログラムであって、取引先の名称に関するキーワードを記憶部に記憶し、入力画像を取得し、入力画像内で印鑑又はロゴが含まれる画像領域を検出し、入力画像から文字列領域を検出し、キーワードに基づいて、文字列領域の中から、取引先の名称が含まれる候補領域を検出し、複数の候補領域が検出された場合に、画像領域からの距離に基づいて、複数の候補領域の中から一つの取引先領域を特定し、取引先領域に関する情報を出力することをコンピュータに実行させる。 Further, a control program according to one aspect of the embodiment is a control program for a computer having a storage unit, stores a keyword related to the name of a business partner in the storage unit, acquires an input image, and uses a seal or Detect image regions that include logos, detect character string regions from the input image, detect candidate regions that include customer names from among the character string regions based on keywords, and detect multiple candidate regions. If detected, cause the computer to identify one customer area from among the plurality of candidate areas based on the distance from the image area, and output information about the customer area.

本実施形態によれば、画像処理装置、制御方法及び制御プログラムは、入力画像から取引先の名称が含まれる領域をより精度良く特定することが可能となる。 According to the present embodiment, the image processing apparatus, control method, and control program can more accurately identify an area containing the name of a business partner from an input image.

本発明の目的及び効果は、特に請求項において指摘される構成要素及び組み合わせを用いることによって認識され且つ得られるだろう。前述の一般的な説明及び後述の詳細な説明の両方は、例示的及び説明的なものであり、特許請求の範囲に記載されている本発明を制限するものではない。 The objects and advantages of the invention may be realized and obtained by means of the elements and combinations particularly pointed out in the claims. Both the foregoing general description and the following detailed description are exemplary and explanatory, and are not limiting of the invention as claimed.

実施形態に従った画像処理システム1の概略構成を示す図である。1 is a diagram showing a schematic configuration of an image processing system 1 according to an embodiment; FIG. 項目テーブルのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of an item table. 第2記憶装置210及び第2処理回路220の概略構成を示す図である。2 is a diagram showing a schematic configuration of a second storage device 210 and a second processing circuit 220; FIG. 画像読取処理の動作を示すフローチャートである。4 is a flowchart showing the operation of image reading processing; 認識処理の動作を示すフローチャートである。4 is a flowchart showing the operation of recognition processing; 入力画像600の一例を示す模式図である。6 is a schematic diagram showing an example of an input image 600; FIG. 領域特定処理の動作の例を示すフローチャートである。9 is a flowchart showing an example of operation of area specifying processing; 入力画像800の一例を示す模式図である。FIG. 8 is a schematic diagram showing an example of an input image 800; 入力画像900の一例を示す模式図である。9 is a schematic diagram showing an example of an input image 900; FIG. 第1特定処理の動作の例を示すフローチャートである。9 is a flow chart showing an example of the operation of a first specifying process; 第2特定処理の動作の例を示すフローチャートである。9 is a flow chart showing an example of the operation of a second specifying process; 入力画像1200の一例を示す模式図である。12 is a schematic diagram showing an example of an input image 1200; FIG. 入力画像1300の他の例を示す模式図である。FIG. 13 is a schematic diagram showing another example of the input image 1300; FIG. 他の第2処理回路230の概略構成を示すブロック図である。3 is a block diagram showing a schematic configuration of another second processing circuit 230; FIG.

以下、本開示の一側面に係る画像処理装置、制御方法及び制御プログラムについて図を参照しつつ説明する。但し、本発明の技術的範囲はそれらの実施の形態に限定されず、特許請求の範囲に記載された発明とその均等物に及ぶ点に留意されたい。 An image processing apparatus, a control method, and a control program according to one aspect of the present disclosure will be described below with reference to the drawings. However, it should be noted that the technical scope of the present invention is not limited to those embodiments, but extends to the invention described in the claims and equivalents thereof.

図1は、実施形態に従った画像処理システム1の概略構成を示す図である。図1に示すように、画像処理システム1は、画像読取装置100と、情報処理装置200とを有する。 FIG. 1 is a diagram showing a schematic configuration of an image processing system 1 according to an embodiment. As shown in FIG. 1, the image processing system 1 has an image reading device 100 and an information processing device 200 .

画像読取装置100は、例えばスキャナ装置等である。画像読取装置100は、情報処理装置200に接続されている。情報処理装置200は、画像処理装置の一例であり、例えばパーソナルコンピュータ等である。 The image reading device 100 is, for example, a scanner device. The image reading device 100 is connected to the information processing device 200 . The information processing device 200 is an example of an image processing device, such as a personal computer.

画像読取装置100は、第1インタフェース装置101と、撮像装置102と、第1記憶装置110と、第1処理回路120とを有する。 The image reading device 100 has a first interface device 101 , an imaging device 102 , a first storage device 110 and a first processing circuit 120 .

第1インタフェース装置101は、USB(Universal Serial Bus)等のシリアルバスに準じるインタフェース回路を有し、情報処理装置200と電気的に接続して画像データ及び各種の情報を送受信する。また、第1インタフェース装置101の代わりに、無線信号を送受信するアンテナと、所定の通信プロトコルに従って、無線通信回線を通じて信号の送受信を行うための無線通信インタフェース回路とを有する通信装置が用いられてもよい。所定の通信プロトコルは、例えば無線LAN(Local Area Network)である。 The first interface device 101 has an interface circuit conforming to a serial bus such as USB (Universal Serial Bus), and is electrically connected to the information processing device 200 to transmit and receive image data and various information. Also, instead of the first interface device 101, a communication device having an antenna for transmitting and receiving wireless signals and a wireless communication interface circuit for transmitting and receiving signals through a wireless communication line according to a predetermined communication protocol may be used. good. The predetermined communication protocol is, for example, a wireless LAN (Local Area Network).

撮像装置102は、主走査方向に直線状に配列されたCCD(Charge Coupled Device)による撮像素子を備える縮小光学系タイプの撮像センサを有する。さらに、撮像装置102は、光を照射する光源と、撮像素子上に像を結ぶレンズと、撮像素子から出力された電気信号を増幅してアナログ/デジタル(A/D)変換するA/D変換器とを有する。撮像装置102において、撮像センサは、搬送される媒体を撮像してアナログの画像信号を生成して出力し、A/D変換器は、このアナログの画像信号をA/D変換してデジタルの入力画像を生成して出力する。入力画像は、各画素データが、例えばRGB各色毎に8bitで表される計24bitのR(赤色)値、G(緑色)値、B(青色)値からなるカラー多値画像である。なお、CCDの代わりにCMOS(Complementary Metal Oxide Semiconductor)による撮像素子を備える等倍光学系タイプのCIS(Contact Image Sensor)が用いられてもよい。 The imaging device 102 has a reduction optical system type imaging sensor that includes imaging elements that are CCDs (Charge Coupled Devices) linearly arranged in the main scanning direction. Further, the imaging device 102 includes a light source for irradiating light, a lens for forming an image on an imaging element, and an A/D converter for amplifying and analog/digital (A/D)-converting an electric signal output from the imaging element. have a vessel. In the imaging device 102, the imaging sensor images a conveyed medium to generate and output an analog image signal, and the A/D converter A/D converts the analog image signal to digital input. Generate and output an image. The input image is a color multivalued image in which each pixel data is composed of a total of 24 bits of R (red) value, G (green) value, and B (blue) value represented by 8 bits for each color of RGB, for example. Incidentally, instead of the CCD, a CIS (Contact Image Sensor) of an equal-magnification optical system type having an imaging element of CMOS (Complementary Metal Oxide Semiconductor) may be used.

第1記憶装置110は、RAM(Random Access Memory)、ROM(Read Only Memory)等のメモリ装置、ハードディスク等の固定ディスク装置、又はフレキシブルディスク、光ディスク等の可搬用の記憶装置等を有する。また、第1記憶装置110には、画像読取装置100の各種処理に用いられるコンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、コンピュータ読み取り可能な可搬型記録媒体から公知のセットアッププログラム等を用いて第1記憶装置110にインストールされてもよい。可搬型記録媒体は、例えばCD-ROM(compact disk read only memory)、DVD-ROM(digital versatile disk read only memory)等である。また、第1記憶装置110は、撮像装置102により生成された入力画像等を記憶する。 The first storage device 110 includes memory devices such as RAM (Random Access Memory) and ROM (Read Only Memory), fixed disk devices such as hard disks, or portable storage devices such as flexible disks and optical disks. The first storage device 110 also stores computer programs, databases, tables, etc. used for various processes of the image reading apparatus 100 . The computer program may be installed in the first storage device 110 from a computer-readable portable recording medium using a known setup program or the like. Examples of portable recording media include CD-ROMs (compact disk read only memory) and DVD-ROMs (digital versatile disk read only memory). Also, the first storage device 110 stores an input image and the like generated by the imaging device 102 .

第1処理回路120は、予め第1記憶装置110に記憶されているプログラムに基づいて動作する。第1処理回路120は、例えばCPU(Control Processing Unit)である。なお、第1処理回路120として、DSP(digital signal processor)、LSI(large scale integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programming Gate Array)等が用いられてもよい。 The first processing circuit 120 operates based on a program stored in advance in the first storage device 110 . The first processing circuit 120 is, for example, a CPU (Control Processing Unit). As the first processing circuit 120, a DSP (digital signal processor), LSI (large scale integration), ASIC (Application Specific Integrated Circuit), FPGA (Field-Programming Gate Array), or the like may be used.

第1処理回路120は、第1インタフェース装置101、撮像装置102及び第1記憶装置110等と接続され、これらの各部を制御する。第1処理回路120は、撮像装置102の媒体読取制御、第1インタフェース装置101を介した情報処理装置200とのデータ送受信制御等を行う。 The first processing circuit 120 is connected to the first interface device 101, the imaging device 102, the first storage device 110, etc., and controls these units. The first processing circuit 120 performs medium reading control of the imaging device 102, data transmission/reception control with the information processing device 200 via the first interface device 101, and the like.

情報処理装置200は、第2インタフェース装置201と、入力装置202と、表示装置203と、第2記憶装置210と、第2処理回路220とを有する。以下、情報処理装置200の各部について詳細に説明する。 The information processing device 200 has a second interface device 201 , an input device 202 , a display device 203 , a second storage device 210 and a second processing circuit 220 . Each unit of the information processing apparatus 200 will be described in detail below.

第2インタフェース装置201は、画像読取装置100の第1インタフェース装置101と同様のインタフェース回路を有し、情報処理装置200と画像読取装置100とを接続する。また、第2インタフェース装置201の代わりに、無線信号を送受信するアンテナと、無線LAN等の所定の通信プロトコルに従って、無線通信回線を通じて信号の送受信を行うための無線通信インタフェース回路とを有する通信装置が用いられてもよい。 The second interface device 201 has an interface circuit similar to that of the first interface device 101 of the image reading device 100 and connects the information processing device 200 and the image reading device 100 . Further, instead of the second interface device 201, a communication device having an antenna for transmitting and receiving wireless signals and a wireless communication interface circuit for transmitting and receiving signals through a wireless communication line according to a predetermined communication protocol such as a wireless LAN is provided. may be used.

入力装置202は、キーボード、マウス等の入力装置及び入力装置から信号を取得するインタフェース回路を有し、利用者の操作に応じた信号を第2処理回路220に出力する。 The input device 202 has an input device such as a keyboard and a mouse, and an interface circuit for acquiring signals from the input device, and outputs a signal corresponding to a user's operation to the second processing circuit 220 .

表示装置203は、出力部の一例である。表示装置203は、液晶、有機EL(Electro-Luminescence)等から構成されるディスプレイ及びディスプレイに画像データを出力するインタフェース回路を有する。表示装置203は、第2処理回路220からの指示に従って、各種の情報をディスプレイに表示する。 The display device 203 is an example of an output unit. The display device 203 has a display made up of a liquid crystal, an organic EL (Electro-Luminescence), or the like, and an interface circuit that outputs image data to the display. The display device 203 displays various information on the display according to instructions from the second processing circuit 220 .

第2記憶装置210は、記憶部の一例であり、画像読取装置100の第1記憶装置110と同様のメモリ装置、固定ディスク装置、可搬用の記憶装置等を有する。第2記憶装置210には、情報処理装置200の各種処理に用いられるコンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、例えばCD-ROM、DVD-ROM等のコンピュータ読み取り可能な可搬型記録媒体から、公知のセットアッププログラム等を用いて第2記憶装置210にインストールされてもよい。 The second storage device 210 is an example of a storage unit, and includes a memory device similar to the first storage device 110 of the image reading device 100, a fixed disk device, a portable storage device, and the like. The second storage device 210 stores computer programs, databases, tables, etc. used for various processes of the information processing device 200 . The computer program may be installed in the second storage device 210 from a computer-readable portable recording medium such as CD-ROM, DVD-ROM, etc. using a known setup program or the like.

また、第2記憶装置210には、データとして、取引先の名称に関するキーワード、及び、項目テーブル等が予め記憶される。取引先の名称に関するキーワードは、取引先の名称に含まれ得る文字であり、例えば株式会社、有限会社等である。項目テーブルの詳細については後述する。 Further, in the second storage device 210, keywords related to names of business partners, item tables, etc. are stored in advance as data. The keywords related to the name of the business partner are characters that can be included in the name of the business partner, such as a corporation, a limited company, and the like. Details of the item table will be described later.

第2処理回路220は、予め第2記憶装置210に記憶されているプログラムに基づいて動作する。第2処理回路220は、例えばCPUである。なお、第2処理回路220として、DSP、LSI、ASIC、FPGA等が用いられてもよい。 The second processing circuit 220 operates based on a program stored in advance in the second storage device 210 . The second processing circuit 220 is, for example, a CPU. A DSP, LSI, ASIC, FPGA, or the like may be used as the second processing circuit 220 .

第2処理回路220は、第2インタフェース装置201、入力装置202、表示装置203及び第2記憶装置210等と接続され、これらの各部を制御する。第2処理回路220は、第2インタフェース装置201を介した画像読取装置100とのデータ送受信制御、入力装置202の入力制御、表示装置203の表示制御等を行う。 The second processing circuit 220 is connected to the second interface device 201, the input device 202, the display device 203, the second storage device 210, etc., and controls these units. The second processing circuit 220 performs data transmission/reception control with the image reading device 100 via the second interface device 201, input control of the input device 202, display control of the display device 203, and the like.

図2は、項目テーブルのデータ構造の一例を示す図である。 FIG. 2 is a diagram showing an example of the data structure of an item table.

項目テーブルには、帳票に含まれる複数の項目毎に、各項目に関するキーワード及び/又はフォーマット等が関連付けて記憶される。複数の項目には、郵便番号、住所、電話番号、担当者、メールアドレス、銀行口座、日付及び文書番号等の、取引先の名称以外の項目が含まれる。キーワードは、各項目を示す文字列に含まれ得る文字である。各項目に関するキーワードは、第2キーワードの一例である。フォーマットは、各項目を示す文字列の書式である。例えば、項目が郵便番号である場合、フォーマットとして「〒」、「数字3桁」、「-」、「数字4桁」の組合せが設定され、項目が電話番号である場合、フォーマットとして「数字2桁」、「-」、「数字4桁」、「-」、「数字4桁」の組合せ等が設定される。 The item table stores a keyword and/or format related to each item in association with each item included in the form. The multiple items include items other than the name of the business partner, such as zip code, address, phone number, contact person, email address, bank account, date and document number. A keyword is a character that can be included in a character string indicating each item. A keyword for each item is an example of a second keyword. The format is a character string format that indicates each item. For example, if the item is a postal code, the format is set to "〒", "three digits", "-", and "four digits", and if the item is a phone number, the format is "2 A combination of "digit", "-", "four-digit number", "-", and "four-digit number" is set.

図3は、第2記憶装置210及び第2処理回路220の概略構成を示す図である。 FIG. 3 is a diagram showing a schematic configuration of the second storage device 210 and the second processing circuit 220. As shown in FIG.

図3に示すように第2記憶装置210には、取得プログラム211、画像領域検出プログラム212、文字列領域検出プログラム213、候補領域検出プログラム214、第1領域検出プログラム215、第2領域特定プログラム216、取引先領域特定プログラム217及び出力制御プログラム218等の各プログラムが記憶される。これらの各プログラムは、プロセッサ上で動作するソフトウェアにより実装される機能モジュールである。第2処理回路220は、第2記憶装置210に記憶された各プログラムを読み取り、読み取った各プログラムに従って動作する。これにより、第2処理回路220は、取得部221、画像領域検出部222、文字列領域検出部223、候補領域検出部224、第1領域検出部225、第2領域特定部226、取引先領域特定部227及び出力制御部228として機能する。 As shown in FIG. 3, the second storage device 210 stores an acquisition program 211, an image area detection program 212, a character string area detection program 213, a candidate area detection program 214, a first area detection program 215, and a second area identification program 216. , a customer area identification program 217 and an output control program 218 are stored. Each of these programs is a functional module implemented by software running on a processor. The second processing circuit 220 reads each program stored in the second storage device 210 and operates according to each read program. As a result, the second processing circuit 220 includes an acquisition unit 221, an image area detection unit 222, a character string area detection unit 223, a candidate area detection unit 224, a first area detection unit 225, a second area identification unit 226, a customer area It functions as a specifying unit 227 and an output control unit 228 .

図4は、画像読取装置100による画像読取処理の動作を示すフローチャートである。以下、図4に示したフローチャートを参照しつつ、画像読取処理の動作を説明する。なお、以下に説明する動作のフローは、予め第1記憶装置110に記憶されているプログラムに基づき主に第1処理回路120により画像読取装置100の各要素と協働して実行される。 FIG. 4 is a flow chart showing the operation of image reading processing by the image reading apparatus 100 . The operation of the image reading process will be described below with reference to the flowchart shown in FIG. The operation flow described below is executed mainly by the first processing circuit 120 in cooperation with each element of the image reading apparatus 100 based on a program stored in the first storage device 110 in advance.

最初に、撮像装置102は、原稿として、印鑑又はロゴが含まれる請求書、通知書又は証明書等の帳票を撮像して入力画像を生成し、第1記憶装置110に保存する(ステップS101)。 First, the image capturing device 102 captures a form such as a bill, notification, or certificate containing a seal or logo as a document, generates an input image, and stores the input image in the first storage device 110 (step S101). .

次に、第1処理回路120は、第1記憶装置110に保存された入力画像を、第1インタフェース装置101を介して情報処理装置200に送信し(ステップS102)、一連のステップを終了する。 Next, the first processing circuit 120 transmits the input image saved in the first storage device 110 to the information processing device 200 via the first interface device 101 (step S102), and ends the series of steps.

図5は、情報処理装置200による認識処理の動作を示すフローチャートである。以下、図5に示したフローチャートを参照しつつ、認識処理の動作を説明する。なお、以下に説明する動作のフローは、予め第2記憶装置210に記憶されているプログラムに基づき主に第2処理回路220により情報処理装置200の各要素と協同して実行される。 FIG. 5 is a flow chart showing the operation of recognition processing by the information processing apparatus 200 . The operation of the recognition process will be described below with reference to the flowchart shown in FIG. The operation flow described below is executed mainly by the second processing circuit 220 in cooperation with each element of the information processing device 200 based on a program stored in the second storage device 210 in advance.

最初に、取得部221は、入力画像を、第2インタフェース装置201を介して画像読取装置100から取得し、第2記憶装置210に保存する(ステップS201)。 First, the acquisition unit 221 acquires an input image from the image reading device 100 via the second interface device 201, and stores it in the second storage device 210 (step S201).

図6は、入力画像600の一例を示す模式図である。 FIG. 6 is a schematic diagram showing an example of an input image 600. As shown in FIG.

図6に示すように、入力画像600には、印鑑605、郵便番号606、住所607、自社の名称608、電話番号609、取引先の名称610、住所611、銀行口座612及び銀行口座613等が含まれている。 As shown in FIG. 6, an input image 600 includes a seal 605, a postal code 606, an address 607, a company name 608, a telephone number 609, a business partner name 610, an address 611, a bank account 612, a bank account 613, and the like. include.

次に、画像領域検出部222は、入力画像を複数の部分領域に分割する(ステップS202)。画像領域検出部222は、例えば入力画像を垂直方向及び/又は水平方向にそれぞれ所定数ずつに分割し、複数の部分領域に分割する。 Next, the image area detection unit 222 divides the input image into a plurality of partial areas (step S202). The image region detection unit 222 divides the input image into a plurality of partial regions, for example, by dividing the input image into a predetermined number each in the vertical direction and/or the horizontal direction.

図6に示す例では、入力画像600は、垂直方向及び水平方向にそれぞれ二つずつに分割され、四つの部分領域601~604に分割されている。情報処理装置200は、帳票が撮像された入力画像内で印鑑又はロゴが含まれる画像領域との位置関係に基づいて、取引先の名称を検出する。一般的な帳票において、取引先の名称は、左上部、右上部、左下部又は右下部の何れかに記載され、その近傍には、印鑑又はロゴが記載されている。したがって、情報処理装置200は、入力画像を垂直方向及び水平方向に二つずつに分割することにより、取引先の名称と印鑑又はロゴとが同一の部分領域に含まれるように、入力画像を分割することができる。 In the example shown in FIG. 6, an input image 600 is divided into two each in the vertical direction and the horizontal direction into four partial regions 601-604. The information processing apparatus 200 detects the name of the business partner based on the positional relationship with the image area containing the seal or logo in the input image in which the form is captured. In a general form, the name of the customer is written in the upper left, upper right, lower left, or lower right part, and a seal or logo is written in the vicinity thereof. Therefore, the information processing apparatus 200 divides the input image into two in the vertical direction and the horizontal direction so that the name of the business partner and the seal or logo are included in the same partial area. can do.

次に、画像領域検出部222は、入力画像内で、印鑑が含まれる印鑑領域、又は、ロゴが含まれるロゴ領域を検出する(ステップS203)。以下では、印鑑領域及びロゴ領域を総じて図形領域と称する場合がある。図形領域は、印鑑又はロゴが含まれる画像領域の一例である。画像領域検出部222は、入力画像内の複数の部分領域毎に、所定図形領域を検出する。印鑑領域には、赤色の印鑑が含まれる赤色印鑑領域、及び/又は、黒色の印鑑が含まれる黒色印鑑領域が含まれる。 Next, the image area detection unit 222 detects a seal area containing a seal or a logo area containing a logo in the input image (step S203). Hereinafter, the seal area and the logo area may be collectively referred to as graphic areas. A graphic area is an example of an image area that contains a stamp or logo. The image area detection unit 222 detects a predetermined figure area for each of a plurality of partial areas within the input image. The seal stamp area includes a red seal stamp area including a red stamp and/or a black seal stamp area including a black stamp.

画像領域検出部222は、赤色印鑑領域を検出するために、まず、入力画像内の各画素のRGB(赤色、緑色、青色)値をHSL(色相、彩度、輝度)値に変換する。次に、画像領域検出部222は、色相値が第1閾値(例えば30)未満である画素と、色相値が第2閾値(例えば330)より大きい画素(即ち、オレンジ色から赤紫色を有する画素)を抽出する。次に、画像領域検出部222は、抽出した各画素について、R値からG値を減算した値と、R値からB値を減算した値との合計値を赤色強度として算出する。なお、画像領域検出部222は、抽出した各画素について、各画素のS(彩度)値を赤色強度として使用してもよい。 To detect the red stamp area, the image area detection unit 222 first converts the RGB (red, green, blue) values of each pixel in the input image into HSL (hue, saturation, luminance) values. Next, the image region detection unit 222 detects pixels whose hue value is less than a first threshold value (eg, 30) and pixels whose hue value is greater than a second threshold value (eg, 330) (that is, pixels having colors ranging from orange to reddish purple). ). Next, the image region detection unit 222 calculates the sum of the value obtained by subtracting the G value from the R value and the value obtained by subtracting the B value from the R value as the red intensity for each extracted pixel. Note that the image region detection unit 222 may use the S (saturation) value of each extracted pixel as the red intensity.

次に、画像領域検出部222は、算出した赤色強度が第3閾値(例えば32)以上である画素を印鑑画素に決定する。次に、入力画像内で、抽出した印鑑画素が連結する領域を含む領域を、印鑑が写っている赤色印鑑領域として検出する。画像領域検出部222は、相互に隣接する印鑑画素で囲まれる領域をラベリングにより一つのグループとしてまとめて印鑑が写っている赤色印鑑領域とする。なお、画像領域検出部222は、各グループの内、サイズ(面積)が所定範囲内であるグループのみを赤色印鑑領域として検出してもよい。所定範囲は、一般的な印鑑が取り得る範囲に予め設定される。また、画像領域検出部222は、各グループの内、所定形状を有するグループのみを赤色印鑑領域として検出してもよい。所定形状は、丸、四角等、一般的な印鑑が取り得る形状に予め設定される。例えば、画像領域検出部222は、各グループと所定形状との正規化相互相関値を算出し、算出した正規化相互相関値が所定値以上である場合に限り、そのグループを赤色印鑑領域として検出する。また、画像領域検出部222は、各グループの外接矩形を赤色印鑑領域として検出してもよい。 Next, the image area detection unit 222 determines pixels whose calculated red intensity is equal to or greater than a third threshold value (for example, 32) to be stamp pixels. Next, in the input image, an area including an area where the extracted seal stamp pixels are connected is detected as a red seal stamp area in which the seal is shown. The image area detection unit 222 labels the areas surrounded by the seal stamp pixels that are adjacent to each other as one group and defines them as a red seal stamp area in which the seal is captured. Note that the image area detection section 222 may detect only groups whose size (area) is within a predetermined range as red seal stamp areas. The predetermined range is set in advance to a range that can be taken by a general seal. Further, the image area detection section 222 may detect only groups having a predetermined shape among the groups as red seal stamp areas. The predetermined shape is set in advance to a shape that can be taken by a general stamp, such as a circle or a square. For example, the image region detection unit 222 calculates a normalized cross-correlation value between each group and a predetermined shape, and only when the calculated normalized cross-correlation value is equal to or greater than a predetermined value, detects that group as a red seal region. do. Also, the image area detection section 222 may detect the circumscribed rectangle of each group as the red seal stamp area.

また、画像領域検出部222は、ロゴ領域、又は、文字列と重なっていない黒色印鑑領域を検出するために、まず、入力画像内の各画素のRGB値をYUV(輝度、色差)値に変換する。次に、画像領域検出部222は、輝度値が第4閾値(例えば128)未満である画素を黒色画素として抽出する。次に、画像領域検出部222は、相互に隣接する黒色画素で囲まれる領域をラベリングにより一つのグループとしてまとめ、各グループの内、所定形状を有するグループをロゴ領域又は黒色印鑑領域として検出する。なお、画像領域検出部222は、各グループの内、サイズが所定範囲内であるグループのみをロゴ領域又は黒色印鑑領域として検出してもよい。また、画像領域検出部222は、各グループの外接矩形をロゴ領域又は黒色印鑑領域として検出してもよい。 In addition, the image area detection unit 222 first converts the RGB values of each pixel in the input image into YUV (luminance, color difference) values in order to detect the logo area or the black seal area that does not overlap with the character string. do. Next, the image region detection unit 222 extracts pixels whose luminance values are less than a fourth threshold value (for example, 128) as black pixels. Next, the image area detection unit 222 puts together areas surrounded by black pixels that are adjacent to each other as one group by labeling, and detects a group having a predetermined shape from among each group as a logo area or a black seal area. Note that the image area detection section 222 may detect only groups whose size is within a predetermined range as the logo area or the black seal area. Also, the image area detection section 222 may detect the circumscribed rectangle of each group as a logo area or a black seal area.

また、画像領域検出部222は、文字列と重なっている黒色印鑑領域を検出するために、入力画像内の垂直方向の画素位置を階級とし、垂直方向の各画素位置における黒色画素の画素数を度数とするヒストグラムを生成する。画像領域検出部222は、度数が第5閾値(例えば10)以上である階級が連続する連続数が所定範囲内(例えば15mmに相当する画素数以上であり且つ30mmに相当する画素数以下)である垂直方向の領域を印鑑候補行として検出する。一般に、横書きの帳票では、文字は横方向に並ぶため、文字が記載されている行間には余白が存在する。しかしながら、印鑑が押下された領域では、行間に印鑑が存在するため、余白が除去される。したがって、ヒストグラム内で度数がある程度の大きさを有する階級がある程度連続している領域には印鑑が存在する可能性が高い。 In addition, in order to detect a black stamp area that overlaps the character string, the image area detection unit 222 uses the vertical pixel position in the input image as a class, and calculates the number of black pixels at each pixel position in the vertical direction. Generate a histogram of frequencies. The image area detection unit 222 determines that the number of consecutive classes whose frequencies are equal to or greater than a fifth threshold (e.g., 10) is within a predetermined range (e.g., equal to or greater than the number of pixels corresponding to 15 mm and equal to or less than the number of pixels corresponding to 30 mm). A certain vertical region is detected as a seal candidate line. Generally, in a horizontally written form, characters are arranged in the horizontal direction, so there is a blank space between lines in which the characters are written. However, in the area where the seal is pressed, the blank is removed because the seal exists between the lines. Therefore, there is a high possibility that a seal exists in an area where classes having a certain size of frequency are continuous to some extent in the histogram.

次に、画像領域検出部222は、印鑑候補行内で、相互に隣接する黒色画素で囲まれる領域をラベリングにより一つのグループとしてまとめる。画像領域検出部222は、各グループの内、サイズが所定範囲内であり且つアスペクト比が所定のアスペクト比範囲内であるグループを黒色印鑑領域として検出する。所定範囲は、例えば15mmに相当する画素数以上であり且つ30mmに相当する画素数以下の範囲に設定される。アスペクト比範囲は、例えば2/3以上且つ3/2以下に設定される。また、画像領域検出部222は、各グループの外接矩形を黒色印鑑領域として検出してもよい。 Next, the image area detection unit 222 puts together areas surrounded by mutually adjacent black pixels in the seal candidate line into one group by labeling. The image area detection unit 222 detects a group whose size is within a predetermined range and whose aspect ratio is within a predetermined aspect ratio range as a black seal stamp area. The predetermined range is set, for example, to a range equal to or greater than the number of pixels corresponding to 15 mm and equal to or less than the number of pixels corresponding to 30 mm. The aspect ratio range is set to, for example, 2/3 or more and 3/2 or less. In addition, the image area detection section 222 may detect the circumscribing rectangle of each group as the black seal stamp area.

図6に示す例では、部分領域601内で印鑑605を含む領域が図形領域として検出される。 In the example shown in FIG. 6, the area including the stamp 605 within the partial area 601 is detected as the figure area.

次に、画像領域検出部222は、入力画像内で図形領域が検出されたか否かを判定する(ステップS204)。 Next, the image area detection unit 222 determines whether or not a graphic area has been detected in the input image (step S204).

入力画像内で図形領域が検出されなかった場合、取引先領域特定部227は、入力画像に含まれる、取引先の名称に対応する項目名及びその項目名に対する位置関係に基づいて、入力画像から取引先領域を検出する(ステップS205)。取引先領域は、入力画像内で取引先の名称を示す文字列が含まれる領域である。取引先領域特定部227は、公知のOCR(Optical Character Recognition)技術を利用して、入力画像から文字を検出し、第1位置関係を有する複数の文字を文字列として検出する。第1位置関係を有する複数の文字は、例えば垂直方向において相互に重複し、且つ、水平方向において一定範囲内で隣り合いつつ連続する文字である。一定範囲は、例えば余白に相当する画素数に設定される。取引先領域特定部227は、検出した文字列の内、取引先の名称に対応する項目名を含む文字列を抽出する。取引先の名称に対応する項目名は、例えば「会社名」等である。 If no graphic area is detected in the input image, the supplier area identification unit 227 extracts from the input image based on the item name corresponding to the supplier name and the positional relationship with respect to the item name included in the input image. A supplier area is detected (step S205). The customer area is an area that contains a character string indicating the name of the customer in the input image. The customer area identification unit 227 uses a known OCR (Optical Character Recognition) technique to detect characters from the input image, and detects a plurality of characters having the first positional relationship as a character string. A plurality of characters having the first positional relationship are, for example, characters that overlap each other in the vertical direction and that are consecutive while being adjacent to each other within a certain range in the horizontal direction. The certain range is set to, for example, the number of pixels corresponding to the margin. The supplier area identification unit 227 extracts a character string including an item name corresponding to the supplier name from among the detected character strings. The item name corresponding to the name of the business partner is, for example, "company name".

取引先領域特定部227は、抽出した文字列に対して第2位置関係を有する文字列を、取引先の名称を示す文字列として検出する。第2位置関係は、方向(例えば右側、下側、右下側)及び距離(例えば30mmに相当する画素内)を含み、事前に設定される。取引先領域特定部227は、検出した文字列を含む領域を取引先領域として検出する。取引先領域特定部227は、例えば検出した文字列の外接矩形を取引先領域として検出する。次に、取引先領域特定部227は、処理をステップS208に移行する。 The supplier area identification unit 227 detects a character string having the second positional relationship with respect to the extracted character string as a character string indicating the name of the supplier. The second positional relationship is preset, including direction (eg, right side, bottom side, bottom right side) and distance (eg, within pixels corresponding to 30 mm). The supplier area identification unit 227 detects an area including the detected character string as a supplier area. The supplier area identification unit 227 detects, for example, the circumscribed rectangle of the detected character string as the supplier area. Next, the supplier area identification unit 227 shifts the process to step S208.

一方、入力画像内で図形領域が検出された場合、文字列領域検出部223は、入力画像から印鑑成分又はロゴ成分を除去する(ステップS206)。 On the other hand, if a figure area is detected in the input image, the character string area detection unit 223 removes the stamp component or the logo component from the input image (step S206).

入力画像内で赤色印鑑領域が検出された場合、文字列領域検出部223は、まず、入力画像に対して白色成分を膨張させた膨張画像を生成し、膨張画像内の各画素の画素値(R値、G値、B値)を、対応する入力画像内の各画素の背景情報として決定する。即ち、入力画像内の注目画素に対応する背景情報は、注目画素の周辺画素の中で輝度が最も高い画素の画素値に設定される。次に、文字列領域検出部223は、赤色印鑑領域内の各画素のR値Sr、G値Sg、B値Sbを、それぞれ以下の式(1)~(3)に従って算出されるDr、Dg、Dbに変換する。
r=(Br-Sr)×(赤色割合)+Sr (1)
g=(Bg-Sg)×(赤色割合)+Sg (2)
b=(Bb-Sb)×(赤色割合)+Sb (3)
When a red seal stamp area is detected in the input image, the character string area detection unit 223 first generates an expanded image by expanding the white component of the input image, and calculates the pixel value of each pixel in the expanded image ( R value, G value, B value) are determined as background information for each pixel in the corresponding input image. That is, the background information corresponding to the pixel of interest in the input image is set to the pixel value of the pixel with the highest luminance among the surrounding pixels of the pixel of interest. Next, the character string region detection unit 223 calculates the R value S r , G value S g , and B value S b of each pixel in the red stamp region according to the following equations (1) to (3). Convert to D r , D g , D b .
D r = (B r - S r ) x (percentage of red) + S r (1)
D g = (B g - S g ) x (percentage of red) + S g (2)
D b = (B b - S b ) x (percentage of red) + S b (3)

赤色割合は、例えば以下の式(4)により算出される。
(赤色割合)={(注目画素の赤色強度)-β}/α (4)
ここで、αは係数(例えば96)であり、赤色強度の値域幅に基づいて、予め設定される。また、βはオフセット値(例えば32)であり、赤色強度の値域に基づいて、予め設定される。赤色割合は、0以上であり且つ1以下である範囲内に設定される。即ち、式(4)により算出された値が0以下である場合、赤色割合は0に補正され、式(4)により算出された値が1以上である場合、赤色割合は1に補正される。
The red ratio is calculated, for example, by the following formula (4).
(red ratio)={(red intensity of pixel of interest)−β}/α (4)
where α is a factor (eg, 96) and is preset based on the red intensity bin width. Also, β is an offset value (eg, 32), which is preset based on the range of red intensities. The red ratio is set within a range of 0 or more and 1 or less. That is, when the value calculated by Equation (4) is 0 or less, the red color ratio is corrected to 0, and when the value calculated by Equation (4) is 1 or more, the red color ratio is corrected to 1. .

文字列領域検出部223は、赤色印鑑領域内の各画素の画素値を、各画素の赤色割合に応じて各画素の背景情報と合成させることにより、赤色印鑑領域において、文字の成分を残しつつ赤色印鑑の成分のみを良好に除去することができる。 The character string area detection unit 223 synthesizes the pixel value of each pixel in the red stamp area with the background information of each pixel according to the red ratio of each pixel, thereby leaving the character component in the red stamp area. Only the components of the red stamp can be removed satisfactorily.

入力画像内でロゴ領域、又は、文字列と重なっていない黒色印鑑領域が検出された場合、文字列領域検出部223は、まず、そのロゴ領域又は黒色印鑑領域の周辺に存在し且つ白色に近い画素を特定する。文字列領域検出部223は、そのロゴ領域又は黒色印鑑領域から一定範囲内であり且つ画素値(R値、G値、B値)が閾値(例えば200)以上である画素を特定する。文字列領域検出部223は、そのロゴ領域又は黒色印鑑領域内の各画素の画素値を特定した画素の画素値に置換することにより、印鑑成分又はロゴ成分を除去する。 When a logo area or a black seal stamp area that does not overlap with a character string is detected in the input image, the character string area detection unit 223 first detects an area that exists around the logo area or the black seal area and is close to white. Identify a pixel. The character string area detection unit 223 identifies pixels that are within a certain range from the logo area or the black seal area and whose pixel values (R value, G value, B value) are equal to or greater than a threshold value (eg, 200). The character string area detection unit 223 replaces the pixel value of each pixel in the logo area or black seal area with the pixel value of the specified pixel, thereby removing the stamp component or the logo component.

また、文字列領域検出部223は、入力画像内で文字列と重なっている黒色印鑑領域については黒色印鑑の成分を除去しない。 Further, the character string area detection unit 223 does not remove the black seal component from the black seal stamp area that overlaps the character string in the input image.

次に、第2処理回路220は、領域特定処理を実行する(ステップS207)。領域特定処理において、第2処理回路220は、図形領域との位置関係に基づいて、入力画像から取引先領域を特定する。領域特定処理の詳細については後述する。 Next, the second processing circuit 220 executes region identification processing (step S207). In the region identifying process, the second processing circuit 220 identifies the client region from the input image based on the positional relationship with the graphic region. The details of the area specifying process will be described later.

次に、出力制御部228は、ステップS205で検出された取引先領域、又は、ステップS207の領域特定処理で特定された取引先領域に関する情報を出力し(ステップS208)、一連のステップを終了する。出力制御部228は、取引先領域に関する情報を表示装置203に表示することにより出力する。なお、出力制御部228は、取引先領域に関する情報を、第2インタフェース装置201を介して他の情報処理装置に送信することにより出力してもよい。出力制御部228は、取引先領域に関する情報として、例えば取引先領域に含まれる、入力画像内で取引先の名称を示す文字列を出力する。なお、出力制御部228は、取引先領域に関する情報として、入力画像及び入力画像内の取引先領域の座標を示す位置情報を出力してもよい。また、出力制御部228は、取引先領域に関する情報として、取引先領域を切り出した画像等を出力してもよい。 Next, the output control unit 228 outputs information about the supplier area detected in step S205 or the supplier area specified in the area specifying process in step S207 (step S208), and ends the series of steps. . The output control unit 228 outputs information on the customer area by displaying it on the display device 203 . Note that the output control unit 228 may output the information on the supplier area by transmitting it to another information processing device via the second interface device 201 . The output control unit 228 outputs a character string indicating the name of the supplier in the input image, which is included in the supplier area, for example, as information about the supplier area. Note that the output control unit 228 may output the input image and the position information indicating the coordinates of the supplier area in the input image as the information about the supplier area. Further, the output control unit 228 may output an image or the like obtained by cutting out the customer area as the information about the customer area.

なお、ステップS206の処理が省略され、第2処理回路220は、入力画像から印鑑成分又はロゴ成分を除去せずに、取引先領域を特定してもよい。 It should be noted that the process of step S206 may be omitted, and the second processing circuit 220 may specify the supplier area without removing the stamp component or the logo component from the input image.

図7は、領域特定処理の動作の例を示すフローチャートである。図7に示す動作のフローは、図5に示すフローチャートのステップS207において実行される。 FIG. 7 is a flow chart showing an example of the operation of area specifying processing. The operation flow shown in FIG. 7 is executed in step S207 of the flowchart shown in FIG.

図7のフローチャートに示すステップS301~S310の処理は、複数の部分領域の内、図形領域が検出された部分領域毎に実行される。 The processing of steps S301 to S310 shown in the flowchart of FIG. 7 is executed for each partial area in which a graphic area is detected among the plurality of partial areas.

図6に示す例では、印鑑605を含む図形領域が検出された部分領域601に対してのみ、ステップS301~S310の処理が実行される。 In the example shown in FIG. 6, the processing of steps S301 to S310 is performed only for the partial area 601 in which the figure area including the stamp 605 is detected.

最初に、文字列領域検出部223は、入力画像の処理対象の部分領域から文字列領域を検出する(ステップS301)。文字列領域検出部223は、公知のOCR技術を利用して、入力画像から文字を検出し、第1位置関係を有する複数の文字を文字列として検出する。文字列領域検出部223は、検出した文字列を含む領域を文字列領域として検出する。文字列領域検出部223は、例えば検出した文字列の外接矩形を文字列領域として検出する。 First, the character string area detection unit 223 detects a character string area from a partial area to be processed of the input image (step S301). The character string area detection unit 223 uses a known OCR technique to detect characters from the input image, and detects a plurality of characters having the first positional relationship as character strings. The character string area detection unit 223 detects an area including the detected character string as a character string area. The character string region detection unit 223 detects, for example, a circumscribing rectangle of the detected character string as a character string region.

図6に示す例では、部分領域601内で郵便番号606、住所607、自社の名称608、電話番号609、取引先の名称610、住所611、銀行口座612及び銀行口座613をそれぞれ含む領域が文字列領域として検出される。 In the example shown in FIG. 6, in the partial area 601, the area containing the postal code 606, address 607, company name 608, telephone number 609, business partner name 610, address 611, bank account 612, and bank account 613 are characters. Detected as a column region.

次に、候補領域検出部224は、第2記憶装置210に記憶された取引先の名称に関するキーワードに基づいて、文字列領域検出部223により検出された文字列領域の中から、取引先の名称が含まれる候補領域を検出する(ステップS302)。候補領域検出部224は、検出された文字列領域の内、取引先の名称に関するキーワードが含まれる文字列領域を候補領域として検出する。 Next, the candidate area detection unit 224 selects the name of the customer from the character string area detected by the character string area detection unit 223 based on the keyword related to the name of the customer stored in the second storage device 210 . is detected (step S302). The candidate area detection unit 224 detects, as a candidate area, a character string area including a keyword related to the name of the business partner among the detected character string areas.

図6に示す例では、自社の名称608及び取引先の名称610にキーワード「株式会社」が含まれており、自社の名称608及び取引先の名称610をそれぞれ含む文字列領域が候補領域として検出される。 In the example shown in FIG. 6, the company's name 608 and the business partner's name 610 include the keyword "corporation", and character string areas containing the company's name 608 and the business partner's name 610 are detected as candidate areas. be done.

次に、第1領域検出部225は、項目テーブルに記憶された各項目に関するキーワード又はフォーマットに基づいて、文字列領域検出部223により検出された文字列領域の中から第1領域を検出する(ステップS303)。第1領域は、項目テーブルに記憶された複数の項目の内の何れかの項目が含まれる領域である。第1領域検出部225は、検出された文字列領域の内、何れかの項目に関するキーワードが含まれる文字列領域、又は、何れかの項目に関するフォーマットを満たす文字列領域を第1領域として検出する。 Next, the first area detection unit 225 detects the first area from among the character string areas detected by the character string area detection unit 223 based on the keyword or format for each item stored in the item table ( step S303). The first area is an area containing any one of the items stored in the item table. The first area detection unit 225 detects, as a first area, a character string area that includes a keyword related to any item or a character string area that satisfies a format related to any item from among the detected character string areas. .

図6に示す例では、郵便番号606、住所607、電話番号609、住所611、銀行口座612及び銀行口座613をそれぞれ含む文字列領域が第1領域として検出される。 In the example shown in FIG. 6, character string areas including postal code 606, address 607, telephone number 609, address 611, bank account 612 and bank account 613 are detected as the first area.

次に、第2領域特定部226は、文字列領域検出部223により検出された文字列領域の中から、候補領域又は第1領域として検出されなかった第2領域を特定する(ステップS304)。第2領域特定部226は、検出された文字列領域の内、候補領域として検出されず且つ第1領域として検出されなかった文字列領域を第2領域として特定する。 Next, the second area identification unit 226 identifies second areas that have not been detected as candidate areas or first areas from among the character string areas detected by the character string area detection unit 223 (step S304). The second area specifying unit 226 specifies, as a second area, a character string area that is not detected as a candidate area and not detected as a first area, among the detected character string areas.

図6に示す例では、全ての文字列領域が候補領域又は第1領域として検出されており、第2領域は特定されない。 In the example shown in FIG. 6, all character string areas are detected as candidate areas or first areas, and second areas are not specified.

図8は、第2領域が含まれる入力画像800の一例を示す模式図である。 FIG. 8 is a schematic diagram showing an example of an input image 800 including the second area.

図8に示すように、入力画像800には、印鑑805、日付806、文書番号807、取引先の名称808、担当者809、メールアドレス810、郵便番号811、住所812及び電話番号813等が含まれている。入力画像800は四つの部分領域801~804に分割され、部分領域802内で印鑑805を含む領域が図形領域として検出される。また、部分領域802内で日付806、文書番号807、取引先の名称808、担当者809、メールアドレス810、郵便番号811、住所812及び電話番号813をそれぞれ含む領域が文字列領域として検出される。取引先の名称808にはキーワード「株式会社」が含まれておらず、部分領域801から候補領域は検出されない。また、部分領域801内で日付806、文書番号807、担当者809、メールアドレス810、郵便番号811、住所812及び電話番号813それぞれ含む文字列領域が第1領域として検出される。したがって、候補領域として検出されず且つ第1領域として検出されなかった取引先の名称808を含む文字列領域が、第2領域として特定される。 As shown in FIG. 8, an input image 800 includes a seal 805, a date 806, a document number 807, a supplier name 808, a person in charge 809, an e-mail address 810, a postal code 811, an address 812, a telephone number 813, and the like. is An input image 800 is divided into four partial areas 801 to 804, and an area including a stamp 805 in the partial area 802 is detected as a graphic area. Also, areas containing the date 806, document number 807, supplier name 808, person in charge 809, mail address 810, postal code 811, address 812, and telephone number 813 are detected as character string areas in the partial area 802. . The supplier name 808 does not include the keyword “corporation”, and no candidate area is detected from the partial area 801 . Also, a character string area including date 806, document number 807, person in charge 809, mail address 810, zip code 811, address 812, and telephone number 813 is detected as the first area in partial area 801. FIG. Therefore, the character string area containing the name 808 of the business partner that was not detected as the candidate area and was not detected as the first area is specified as the second area.

次に、取引先領域特定部227は、候補領域検出部224により候補領域が検出されたか否かを判定する(ステップS305)。 Next, the supplier area identification unit 227 determines whether or not the candidate area is detected by the candidate area detection unit 224 (step S305).

候補領域検出部224により候補領域が検出されなかった場合、取引先領域特定部227は、第1特定処理を実行する(ステップS306)。第1特定処理において、取引先領域特定部227は、第2領域に基づいて、部分領域内で最も有力な候補領域である最有力候補領域を特定する。第1特定処理の詳細については後述する。 If no candidate area is detected by the candidate area detection unit 224, the supplier area identification unit 227 executes first identification processing (step S306). In the first identification process, the supplier area identification unit 227 identifies the most promising candidate area, which is the most promising candidate area within the partial area, based on the second area. Details of the first identification process will be described later.

一方、候補領域が検出された場合、取引先領域特定部227は、候補領域検出部224により複数の候補領域が検出されたか否かを判定する(ステップS307)。 On the other hand, if a candidate area is detected, the client area identification unit 227 determines whether a plurality of candidate areas have been detected by the candidate area detection unit 224 (step S307).

複数の候補領域が検出されなかった場合、即ち検出された候補領域の数が一つである場合、取引先領域特定部227は、第2特定処理を実行する(ステップS308)。第2特定処理において、取引先領域特定部227は、候補領域と第2領域の位置関係に基づいて最有力候補領域を特定する。第2特定処理の詳細については後述する。 If a plurality of candidate areas are not detected, that is, if the number of detected candidate areas is one, the supplier area identification unit 227 executes second identification processing (step S308). In the second identification process, the supplier area identification unit 227 identifies the most likely candidate area based on the positional relationship between the candidate area and the second area. Details of the second specifying process will be described later.

一方、複数の候補領域が検出された場合、即ち検出された候補領域の数が複数である場合、取引先領域特定部227は、図形領域からの距離に基づいて、複数の候補領域の中から一つの最有力候補領域を特定する(ステップS309)。 On the other hand, when a plurality of candidate areas are detected, that is, when a plurality of candidate areas are detected, the supplier area identification unit 227 selects a candidate area from among the plurality of candidate areas based on the distance from the graphic area. One most promising candidate area is identified (step S309).

取引先領域特定部227は、複数の候補領域毎に、部分領域内の全ての図形領域のそれぞれとの間の距離を算出する。取引先領域特定部227は、候補領域と図形領域において、入力画像内で相互に最も近くに位置する端部位置(左上、左下、右上又は右下)の組合せを特定し、特定した端部位置間のユークリッド距離(直線距離に相当する画素数)を領域間の距離として算出する。なお、取引先領域特定部227は、領域間の距離として、特定した端部位置間のマンハッタン距離(水平方向の座標の差の絶対値と垂直方向の座標の差の絶対値の合計)を算出してもよい。また、取引先領域特定部227は、領域間の距離として、各領域の重心位置間のユークリッド距離又はマンハッタン距離を算出してもよい。また、取引先領域特定部227は、候補領域と図形領域が重複している場合(重複する画素数が所定数以上である場合)、領域間の距離を0としてもよい。 The supplier area identification unit 227 calculates the distance between each of the plurality of candidate areas and all the graphic areas in the partial area. The customer area identification unit 227 identifies a combination of edge positions (upper left, lower left, upper right, or lower right) located closest to each other in the input image in the candidate area and the graphic area, and determines the identified edge position. The Euclidean distance (the number of pixels corresponding to the linear distance) between the regions is calculated as the distance between the regions. Note that the client region identification unit 227 calculates the Manhattan distance between the identified end positions (the sum of the absolute value of the horizontal coordinate difference and the absolute value of the vertical coordinate difference) as the distance between the regions. You may Further, the supplier area identification unit 227 may calculate the Euclidean distance or the Manhattan distance between the centroid positions of the areas as the distance between the areas. Further, when the candidate area and the graphic area overlap (when the number of overlapping pixels is equal to or greater than a predetermined number), the supplier area identification unit 227 may set the distance between the areas to zero.

取引先領域特定部227は、複数の候補領域毎に、距離が最も小さい図形領域を各候補領域の最も近くに位置する図形領域として特定し、その領域間の距離を特定する。取引先領域特定部227は、特定した候補領域と図形領域の組合せの内、領域間の距離が最も小さい候補領域と図形領域の組合せを特定し、特定した組合せに係る候補領域を最有力候補領域として特定する。 The customer area identification unit 227 identifies the graphic area with the shortest distance as the graphic area located closest to each candidate area for each of the plurality of candidate areas, and identifies the distance between the areas. The supplier area identification unit 227 identifies the combination of the candidate area and the graphic area having the smallest distance between the areas from among the combinations of the identified candidate area and the graphic area, and identifies the candidate area associated with the identified combination as the most promising candidate area. Identify as

図6に示す例では、自社の名称608を含む候補領域と取引先の名称610を含む候補領域とが検出されており、印鑑605を含む図形領域からの距離が小さい取引先の名称610を含む候補領域が最有力候補領域として特定される。 In the example shown in FIG. 6, a candidate area including the company's name 608 and a candidate area including the supplier's name 610 are detected, and the supplier's name 610 is included at a short distance from the graphic area including the stamp 605. A candidate region is identified as the most likely candidate region.

画像処理システム1が、取引先から受け取った請求書等の帳票をデータ化する企業で利用される場合、画像処理システム1は、その取引先の名称を特定して管理する必要がある。そのような請求書には、会社名として、自社の名称と、取引先の名称とが含まれる可能性が高い。但し、帳票の発行元である取引先の名称の近傍には、取引先の印鑑又はロゴが含まれ、帳票の送信先である自社の名称の近傍には、印鑑又はロゴが含まれていない可能性が高い。したがって、画像処理システム1は、複数の候補領域が検出された場合、図形領域に近い方の候補領域を最有力候補領域として特定することにより、取引先の名称が含まれる領域を精度良く検出することができる。これにより、画像処理システム1は、取引先以外の名称を取引先の名称として誤って検出することを抑制できる。 When the image processing system 1 is used by a company that digitizes forms such as invoices received from business partners, the image processing system 1 needs to identify and manage the name of the business partner. Such invoices are likely to include the name of the company and the name of the business partner as the company name. However, it is possible that the seal or logo of the supplier is included near the name of the business partner who issued the form, and the seal or logo is not included near the name of the company to which the form is sent. highly sexual. Therefore, when a plurality of candidate areas are detected, the image processing system 1 accurately detects the area containing the customer name by specifying the candidate area closer to the graphic area as the most likely candidate area. be able to. Thereby, the image processing system 1 can suppress erroneous detection of a name other than the name of the business partner as the name of the business partner.

次に、取引先領域特定部227は、図形領域が検出された全ての部分領域についてステップS301~S309の処理が完了したか否かを判定する(ステップS310)。図形領域が検出され且つまだ処理されていない部分領域が残っている場合、取引先領域特定部227は、処理をステップS301に戻し、ステップS301~S309の処理を繰り返す。 Next, the supplier area identification unit 227 determines whether or not the processing of steps S301 to S309 has been completed for all partial areas in which graphic areas have been detected (step S310). If the graphic area has been detected and partial areas that have not yet been processed remain, the customer area identification unit 227 returns the process to step S301 and repeats the processes of steps S301 to S309.

一方、全ての部分領域について処理が完了した場合、取引先領域特定部227は、何れかの部分領域から最有力候補領域が特定されたか否かを判定する(ステップS311)。 On the other hand, when the processing has been completed for all partial areas, the supplier area identification unit 227 determines whether or not the most promising candidate area has been identified from any partial area (step S311).

何れの部分領域からも最有力候補領域が特定されなかった場合、取引先領域特定部227は、取引先の名称に対応する項目名及びその項目名からの位置関係に基づいて、入力画像から取引先領域を検出し(ステップS312)、一連のステップを終了する。取引先領域特定部227は、図5のステップS205の処理と同様にして、入力画像から取引先領域を検出する。 If the most promising candidate area is not identified from any of the partial areas, the supplier area identification unit 227 identifies the transaction from the input image based on the item name corresponding to the supplier name and the positional relationship from the item name. The destination area is detected (step S312), and the series of steps ends. The supplier area identification unit 227 detects the supplier area from the input image in the same manner as in step S205 of FIG.

一方、何れかの部分領域から最有力候補領域が特定された場合、取引先領域特定部227は、特定した最有力候補領域の中から、取引先領域を特定し(ステップS313)、一連のステップを終了する。取引先領域特定部227は、図形領域が検出された部分領域毎に特定した各最有力候補領域と、各最有力候補領域に対応する図形領域との間の距離に基づいて、取引先領域を特定する。各最有力候補領域に対応する図形領域は、各最有力候補領域が含まれる部分領域に含まれ、且つ、その部分領域内で各最有力候補領域の最も近くに位置する図形領域である。取引先領域特定部227は、ステップS309の処理と同様にして、最有力候補領域毎に、部分領域内の全ての図形領域のそれぞれとの間の距離を算出する。取引先領域特定部227は、最有力候補領域毎に、距離が最も小さい図形領域を各最有力候補領域の最も近くに位置する図形領域として特定し、その領域間の距離を特定する。取引先領域特定部227は、特定した最有力候補領域と図形領域の組合せの内、領域間の距離が最も小さい最有力候補領域と図形領域の組合せを特定し、特定した組合せに係る最有力候補領域を取引先領域として特定する。 On the other hand, if the most likely candidate area is identified from any of the partial areas, the customer area identification unit 227 identifies the customer area from the identified most likely candidate areas (step S313), and then performs a series of steps. exit. The customer area identification unit 227 identifies the customer area based on the distance between each most likely candidate area identified for each partial area in which the figure area is detected and the figure area corresponding to each most likely candidate area. Identify. A graphical area corresponding to each most likely candidate area is a graphical area that is included in the partial area that includes each most likely candidate area and that is positioned closest to each most likely candidate area within that partial area. The supplier area identification unit 227 calculates the distance between each most likely candidate area and each of all graphic areas in the partial area in the same manner as in step S309. The customer area identification unit 227 identifies the graphic area with the shortest distance for each most likely candidate area as the most likely graphical area positioned closest to each most likely candidate area, and identifies the distance between the areas. The customer area identification unit 227 identifies the combination of the most promising candidate area and the graphic area having the smallest distance between the areas among the identified combinations of the most likely candidate area and the graphic area, and identifies the most likely candidate for the identified combination. Identifies a region as a trading partner region.

このように、取引先領域特定部227は、図形領域が検出された部分領域毎に特定した最有力候補領域の内、対応する図形領域からの距離が最も小さい最有力候補領域を取引先領域として特定する。 In this way, the customer area specifying unit 227 selects the most likely candidate area that is the shortest from the corresponding figure area among the most likely candidate areas specified for each partial area in which the graphic area is detected as the customer area. Identify.

図6に示す例では、部分領域601内で取引先の名称610を含む最有力候補領域が検出されており、他の部分領域602~604では最有力候補領域が検出されていない。したがって、取引先の名称610を含む最有力候補領域が取引先領域として特定される。 In the example shown in FIG. 6, the most likely candidate area including the supplier name 610 is detected in the partial area 601, and the most likely candidate area is not detected in the other partial areas 602-604. Therefore, the most likely candidate area containing the customer name 610 is identified as the customer area.

図9は、複数の最有力候補領域が含まれる入力画像900の一例を示す模式図である。 FIG. 9 is a schematic diagram showing an example of an input image 900 including a plurality of most likely candidate regions.

図9に示すように、入力画像900には、取引先のロゴ905、自社の名称906、取引先の印鑑907及び取引先の名称908等が含まれている。入力画像900は四つの部分領域901~904に分割される。そして、部分領域901内で、取引先のロゴ905を含む領域が図形領域として検出され、自社の名称906を含む領域が最有力候補領域として検出される。また、部分領域902内で、取引先の印鑑907を含む領域が図形領域として検出される。取引先の名称908を含む領域が最有力候補領域として検出される。取引先の名称908を含む最有力候補領域と取引先の印鑑907を含む図形領域との間の距離は、自社の名称906を含む最有力候補領域と取引先のロゴ905を含む図形領域との間の距離より小さい。そのため、取引先の名称908を含む最有力候補領域が取引先領域として特定される。 As shown in FIG. 9, an input image 900 includes a supplier's logo 905, company's name 906, supplier's seal stamp 907, supplier's name 908, and the like. An input image 900 is divided into four sub-regions 901-904. Then, in the partial area 901, an area containing the client's logo 905 is detected as a graphic area, and an area containing the company's name 906 is detected as the most probable candidate area. Also, in the partial area 902, an area including the customer's seal 907 is detected as a graphic area. Regions containing the business partner's name 908 are detected as the most likely candidate regions. The distance between the most likely candidate area containing the supplier's name 908 and the graphical area containing the supplier's seal 907 is the distance between the most likely candidate area including the company's name 906 and the graphical area including the supplier's logo 905. less than the distance between Therefore, the most likely candidate area containing the supplier name 908 is identified as the supplier area.

帳票によっては、取引先のロゴ又は取引先の担当者の印鑑等が、自社の名称と同じ部分領域に含まれる場合がある。そのような場合でも、取引先の印鑑は取引先の名称の近傍に押印される可能性が高く、取引先の名称と取引先の印鑑との間の距離は、自社の名称と取引先のロゴ又は取引先の担当者の印鑑との間の距離より小さい可能性が高い。画像処理システム1は、二以上の部分領域で最有力候補領域が検出された場合、対応する図形領域に近い最有力候補領域を取引先領域として特定することにより、取引先の名称が含まれる領域を精度良く検出することができる。これにより、画像処理システム1は、取引先以外の名称を取引先の名称として誤って検出することを抑制できる。 Depending on the form, the logo of the customer, the seal of the person in charge of the customer, or the like may be included in the same partial area as the name of the company. Even in such cases, there is a high possibility that the seal of the business partner is stamped near the name of the business partner, and the distance between the name of the business partner and the seal of the business partner is the same as the name of the company and the logo of the business partner. Or there is a high possibility that it is smaller than the distance between the seal of the person in charge of the business partner. When the most likely candidate area is detected in two or more partial areas, the image processing system 1 identifies the most likely candidate area that is close to the corresponding graphic area as the customer area, thereby identifying the area containing the name of the customer. can be detected with high accuracy. Thereby, the image processing system 1 can suppress erroneous detection of a name other than the name of the business partner as the name of the business partner.

図10は、第1特定処理の動作の例を示すフローチャートである。図10に示す動作のフローは、図7に示すフローチャートのステップS306において実行される。 FIG. 10 is a flow chart showing an example of the operation of the first specifying process. The flow of operations shown in FIG. 10 is executed in step S306 of the flowchart shown in FIG.

最初に、取引先領域特定部227は、第2領域特定部226により第2領域が特定されたか否かを判定する(ステップS401)。 First, the customer area identification unit 227 determines whether the second area has been identified by the second area identification unit 226 (step S401).

第2領域が特定されなかった場合、取引先領域特定部227は、その部分領域から最有力候補領域を特定せず(ステップS402)、一連のステップを終了する。 If the second area is not specified, the customer area specifying unit 227 does not specify the most promising candidate area from the partial area (step S402), and ends the series of steps.

一方、第2領域が特定された場合、取引先領域特定部227は、第2領域特定部226により複数の第2領域が特定されたか否かを判定する(ステップS403)。 On the other hand, when the second area has been identified, the supplier area identification unit 227 determines whether or not a plurality of second areas have been identified by the second area identification unit 226 (step S403).

複数の第2領域が特定されなかった場合、即ち特定された第2領域の数が一つである場合、取引先領域特定部227は、その第2領域を最有力候補領域として特定し(ステップS404)、一連のステップを終了する。 If a plurality of second areas are not specified, that is, if the number of specified second areas is one, the supplier area specifying unit 227 specifies the second area as the most likely candidate area (step S404), the series of steps ends.

図8に示す例では、候補領域が検出されず、且つ、取引先の名称808を含む第2領域が特定されており、この第2領域が最有力候補領域として特定される。 In the example shown in FIG. 8, no candidate area is detected, and a second area containing the supplier name 808 is identified, and this second area is identified as the most likely candidate area.

一般に、「株式会社」、「有限会社」等の一般的なキーワードが含まれない会社の名称が存在するため、キーワードのみに基づいて取引先の名称を完全に検出することは困難である。情報処理装置200は、キーワードに基づいて取引先の名称を検出できなかった場合に、一般的な帳票に含まれる住所、電話番号等の項目に対応しない文字列を、取引先の名称と推定する。これにより、情報処理装置200は、キーワードを含まない取引先の名称を精度良く特定することができる。 In general, there are company names that do not contain general keywords such as "stock company" and "limited company", so it is difficult to completely detect the name of the customer based on only the keywords. When the information processing apparatus 200 fails to detect the name of the customer based on the keyword, the information processing apparatus 200 presumes that the name of the customer is a character string that does not correspond to items such as an address and a telephone number included in a general form. . As a result, the information processing apparatus 200 can accurately identify the name of the business partner that does not include the keyword.

一方、複数の第2領域が特定された場合、即ち特定された第2領域の数が複数である場合、取引先領域特定部227は、図形領域からの距離に基づいて、複数の第2領域の中から一つの最有力候補領域を特定し(ステップS405)、一連のステップを終了する。取引先領域特定部227は、図7のステップS309の処理と同様にして、複数の第2領域毎に、部分領域内の全ての図形領域のそれぞれとの間の距離を算出する。取引先領域特定部227は、複数の第2領域毎に、距離が最も小さい図形領域を各第2領域の最も近くに位置する図形領域として特定し、その領域間の距離を特定する。取引先領域特定部227は、特定した第2領域と図形領域の組合せの内、領域間の距離が最も小さい第2領域と図形領域の組合せを特定し、特定した組合せに係る第2領域を最有力候補領域として特定する。 On the other hand, when a plurality of second areas are identified, that is, when the number of identified second areas is plural, the customer area identification unit 227 determines the plurality of second areas based on the distance from the graphic area. (step S405), and the series of steps ends. The supplier area identification unit 227 calculates the distance between each of the plurality of second areas and all the graphic areas in the partial area in the same manner as in the process of step S309 in FIG. The customer area identification unit 227 identifies the graphic area with the shortest distance as the graphic area positioned closest to each second area for each of the plurality of second areas, and identifies the distance between the areas. The supplier area identification unit 227 identifies the combination of the second area and the graphic area having the smallest distance between the areas among the identified combinations of the second area and the graphic area, and determines the second area associated with the identified combination as the largest. Identify as a strong candidate region.

上記したように、取引先から受け取った請求書に自社の名称と取引先の名称とが含まれている場合、取引先の名称の近傍には取引先の印鑑又はロゴが含まれ、自社の名称の近傍には印鑑又はロゴが含まれていない可能性が高い。したがって、画像処理システム1は、複数の第2領域が特定された場合、図形領域に近い方の第2領域を最有力候補領域として特定することにより、取引先の名称が含まれる領域を精度良く検出することができる。これにより、画像処理システム1は、取引先以外の名称を取引先の名称として誤って検出することを抑制できる。 As mentioned above, when the invoice received from a business partner contains the name of the company and the name of the business partner, the business partner's seal or logo is included near the name of the business partner, and the name of the company It is highly probable that no seal or logo is included in the vicinity of . Therefore, when a plurality of second areas are identified, the image processing system 1 identifies the second area closer to the graphic area as the most likely candidate area, thereby accurately identifying the area containing the name of the customer. can be detected. Thereby, the image processing system 1 can suppress erroneous detection of a name other than the name of the business partner as the name of the business partner.

なお、全ての部分領域において候補領域検出部224により候補領域が検出されなかった場合、第2領域特定部226によって特定された第2領域のみが最有力候補領域として特定される。したがって、図7のステップS313において、取引先領域特定部227は、第2領域特定部226によって特定された第2領域の中から取引先領域を特定する。特に、第2領域特定部226により、画像領域が検出された部分領域毎に複数の第2領域が特定された場合、取引先領域特定部227は、特定された第2領域の内、対応する図形領域からの距離が最も小さい第2領域を取引先領域として特定する。 Note that if the candidate area detection unit 224 does not detect a candidate area in any of the partial areas, only the second area identified by the second area identification unit 226 is identified as the most probable candidate area. Therefore, in step S313 of FIG. 7, the customer area identifying section 227 identifies the customer area from the second areas identified by the second area identifying section 226. FIG. In particular, when the second area specifying unit 226 specifies a plurality of second areas for each partial area in which the image area is detected, the supplier area specifying unit 227 selects the corresponding A second area having the smallest distance from the graphic area is identified as the supplier area.

上記したように、帳票によっては、取引先のロゴ又は取引先の担当者の印鑑等が、自社の名称と同じ部分領域に含まれる場合がある。画像処理システム1は、二以上の部分領域において複数の第2領域が最有力候補領域として特定された場合、対応する図形領域に近い第2領域を取引先領域として特定することにより、取引先の名称が含まれる領域を精度良く検出することができる。これにより、画像処理システム1は、取引先以外の名称を取引先の名称として誤って検出することを抑制できる。 As described above, depending on the form, the logo of the customer, the seal of the person in charge of the customer, or the like may be included in the same partial area as the name of the company. When a plurality of second areas are identified as the most promising candidate areas in two or more partial areas, the image processing system 1 identifies a second area close to the corresponding graphic area as a customer area, thereby identifying the customer's A region containing a name can be detected with high accuracy. Thereby, the image processing system 1 can suppress erroneous detection of a name other than the name of the business partner as the name of the business partner.

図11は、第2特定処理の動作の例を示すフローチャートである。図11に示す動作のフローは、図7に示すフローチャートのステップS308において実行される。 FIG. 11 is a flow chart showing an example of the operation of the second specifying process. The flow of operations shown in FIG. 11 is executed in step S308 of the flowchart shown in FIG.

最初に、取引先領域特定部227は、候補領域検出部224によって検出された候補領域と、その候補領域の最も近くに位置する図形領域との間の距離が距離閾値以下であるか否かを判定する(ステップS501)。取引先領域特定部227は、図7のステップS309の処理と同様にして、候補領域と、部分領域内の全ての図形領域のそれぞれとの間の距離を算出する。取引先領域特定部227は、距離が最も小さい図形領域を候補領域の最も近くに位置する図形領域として特定し、その領域間の距離を特定する。距離閾値は、例えば所定行数(例えば5行)に相当する画素数に設定される。 First, the supplier area identification unit 227 determines whether the distance between the candidate area detected by the candidate area detection unit 224 and the graphic area located closest to the candidate area is equal to or less than the distance threshold. Determine (step S501). The supplier area identification unit 227 calculates the distance between the candidate area and each of the graphic areas in the partial area in the same manner as in step S309 of FIG. The customer area identification unit 227 identifies the graphic area with the shortest distance as the graphic area positioned closest to the candidate area, and identifies the distance between the areas. The distance threshold is set, for example, to the number of pixels corresponding to a predetermined number of lines (eg, 5 lines).

候補領域と、対応する図形領域との間の距離が距離閾値以下である場合、取引先領域特定部227は、その候補領域を最有力候補領域として特定し(ステップS502)、一連のステップを終了する。即ち、帳票内で、キーワードが含まれる取引先の名称の近傍に印鑑又はロゴが存在する場合、その取引先の名称を含む領域が最有力候補領域として特定される。 If the distance between the candidate area and the corresponding graphic area is equal to or less than the distance threshold, the customer area identification unit 227 identifies the candidate area as the most likely candidate area (step S502), and terminates the series of steps. do. That is, if there is a seal or logo in the vicinity of the name of the supplier that includes the keyword in the form, the area containing the name of the supplier is specified as the most likely candidate area.

一方、候補領域と、対応する図形領域との間の距離が距離閾値より大きい場合、取引先領域特定部227は、その候補領域より図形領域からの距離が小さい第2領域が存在するか否かを判定する(ステップS503)。取引先領域特定部227は、図10のステップS405の処理と同様にして、第2領域特定部226によって特定された第2領域毎に、各第2領域の最も近くに位置する図形領域、及び、各第2領域と各図形領域の間の距離を特定する。取引先領域特定部227は、ステップS501で候補領域について算出した距離より、何れかの第2領域について算出した距離が小さい場合、その候補領域より図形領域からの距離が小さい第2領域が存在すると判定する。一方、取引先領域特定部227は、ステップS501で候補領域について算出した距離が、全ての第2領域について算出した距離以下である場合、その候補領域より図形領域からの距離が小さい第2領域が存在しないと判定する。 On the other hand, if the distance between the candidate area and the corresponding graphic area is greater than the distance threshold, the supplier area identification unit 227 determines whether there is a second area whose distance from the graphic area is smaller than that of the candidate area. is determined (step S503). 10, for each second area identified by the second area identifying unit 226, the supplier area identifying unit 227 identifies the graphic area closest to each second area, and , the distance between each second region and each graphic region. If the distance calculated for any of the second regions is smaller than the distance calculated for the candidate regions in step S501, the supplier region identification unit 227 determines that there is a second region whose distance from the graphic region is smaller than that of the candidate region. judge. On the other hand, if the distance calculated for the candidate area in step S501 is equal to or less than the distance calculated for all the second areas, the supplier area identification unit 227 determines that the second area whose distance from the graphic area is smaller than that of the candidate area is Determine that it does not exist.

候補領域より図形領域からの距離が小さい第2領域が存在しない場合、取引先領域特定部227は、その候補領域を最有力候補領域として特定し(ステップS502)、一連のステップを終了する。 If there is no second area whose distance from the graphic area is smaller than that of the candidate area, the supplier area identifying unit 227 identifies that candidate area as the most likely candidate area (step S502), and terminates the series of steps.

図12は、候補領域が図形領域から離れている入力画像1200の一例を示す模式図である。 FIG. 12 is a schematic diagram showing an example of an input image 1200 in which candidate areas are separated from graphic areas.

図12に示すように、入力画像1200には、取引先の印鑑1205及び取引先の名称1206等が含まれている。入力画像1200は四つの部分領域1201~1204に分割され、部分領域1202内で取引先の印鑑1205を含む領域が図形領域として検出され、取引先の名称1206を含む領域が候補領域として検出される。但し、部分領域1202には、項目テーブルに記憶された項目以外の項目は含まれておらず、部分領域1202内で第2領域は特定されていない。取引先の名称1206を含む候補領域と取引先の印鑑1205を含む図形領域との間の距離は距離閾値より大きい。しかしながら、部分領域1202内で第2領域は特定されないため、取引先の名称1206を含む候補領域が最有力候補領域として特定される。 As shown in FIG. 12, an input image 1200 includes a customer seal 1205, a customer name 1206, and the like. An input image 1200 is divided into four partial areas 1201 to 1204. In the partial area 1202, an area containing the customer's seal stamp 1205 is detected as a graphic area, and an area containing the customer's name 1206 is detected as a candidate area. . However, the partial area 1202 does not contain items other than the items stored in the item table, and the second area is not specified within the partial area 1202 . The distance between the candidate area containing the business partner's name 1206 and the graphic area containing the business partner's stamp 1205 is greater than the distance threshold. However, since the second area is not identified within the partial area 1202, the candidate area containing the customer name 1206 is identified as the most likely candidate area.

このように、帳票内で、印鑑又はロゴと会社名とが離れている場合でも、印鑑又はロゴの最も近くに位置する会社名にキーワードが含まれる場合には、その会社名を含む領域が最有力候補領域として特定される。 In this way, even if the seal or logo is far from the company name in the form, if the company name located closest to the seal or logo contains the keyword, the region containing the company name is the most suitable. It is identified as a strong candidate region.

一方、候補領域より図形領域からの距離が小さい第2領域が存在する場合、取引先領域特定部227は、第2領域と図形領域の間の距離が所定距離以下であるか否かを判定する(ステップS504)。取引先領域特定部227は、部分領域内の第2領域の中で、最も近くに位置する図形領域からの距離が最も小さい第2領域、及び、その第2領域とその第2領域の最も近くに位置する図形領域との間の距離を特定する。取引先領域特定部227は、特定した距離が所定距離以下である場合、第2領域と図形領域の間の距離が所定距離以下であると判定し、特定した距離が所定距離より大きい場合、第2領域と図形領域の間の距離が所定距離より大きいと判定する。 On the other hand, if there is a second area whose distance from the graphic area is smaller than that of the candidate area, the supplier area identification unit 227 determines whether the distance between the second area and the graphic area is equal to or less than a predetermined distance. (Step S504). Among the second areas in the partial area, the supplier area identification unit 227 determines the second area that is the closest to the closest graphic area, and the second area and the second area that are closest to the second area. Determine the distance between the graphic regions located at . If the identified distance is less than or equal to the predetermined distance, supplier area identification unit 227 determines that the distance between the second area and the graphic area is less than or equal to the predetermined distance. It is determined that the distance between the two areas and the graphic area is greater than a predetermined distance.

第2領域と図形領域の間の距離が所定距離より大きい場合、取引先領域特定部227は、候補領域を最有力候補領域として特定し(ステップS502)、一連のステップを終了する。即ち、帳票内で、キーワードを含まない会社名が、キーワードを含む会社名よりも印鑑又はロゴの近くに存在する場合でも、キーワードを含まない会社名が印鑑又はロゴから離れている場合は、キーワードを含む会社名を含む領域が最有力候補領域として特定される。 If the distance between the second area and the graphic area is greater than the predetermined distance, the supplier area identification unit 227 identifies the candidate area as the most likely candidate area (step S502), and terminates the series of steps. That is, even if a company name that does not contain a keyword exists closer to the seal or logo than the company name that contains the keyword in the form, if the company name that does not contain the keyword is farther from the seal or logo than the company name that contains the keyword, the keyword are identified as the most likely candidate regions.

一方、第2領域と図形領域の間の距離が所定距離以下である場合、取引先領域特定部227は、第2領域を最有力候補領域として特定し(ステップS505)、一連のステップを終了する。取引先領域特定部227は、部分領域内の第2領域の中で、最も近くに位置する図形領域からの距離が最も小さい第2領域を最有力候補領域として特定する。 On the other hand, if the distance between the second area and the graphic area is equal to or less than the predetermined distance, the supplier area identification unit 227 identifies the second area as the most promising candidate area (step S505), and terminates the series of steps. . The supplier area identification unit 227 identifies, among the second areas in the partial area, the second area having the shortest distance from the closest graphic area as the most likely candidate area.

図13は、候補領域が図形領域から離れている入力画像1300の一例を示す模式図である。 FIG. 13 is a schematic diagram showing an example of an input image 1300 in which candidate areas are separated from graphic areas.

図13に示すように、入力画像1300には、取引先の印鑑1305、自社の名称1306及び取引先の名称1307等が含まれている。入力画像1300は四つの部分領域1301~1304に分割される。そして、部分領域1301内で取引先の印鑑1305を含む領域が図形領域として検出され、自社の名称1306を含む領域が候補領域として特定され、取引先の名称1307を含む領域が第2領域として検出される。自社の名称1306を含む候補領域と取引先の印鑑1305を含む図形領域との間の距離は距離閾値より大きい。一方、取引先の名称1307を含む第2領域と印鑑1305を含む図形領域との間の距離は、自社の名称1306を含む候補領域と印鑑1305を含む図形領域との間の距離より小さく、且つ、所定距離以下である。そのため、取引先の名称1307を含む第2領域が最有力候補領域として特定される。 As shown in FIG. 13, the input image 1300 includes the seal 1305 of the client, the name of the company 1306, the name 1307 of the client, and the like. An input image 1300 is divided into four sub-regions 1301-1304. Then, in the partial area 1301, an area containing the customer's seal 1305 is detected as a graphic area, an area including the company's name 1306 is specified as a candidate area, and an area including the customer's name 1307 is detected as a second area. be done. The distance between the candidate area containing the company's name 1306 and the graphic area containing the client's seal 1305 is greater than the distance threshold. On the other hand, the distance between the second area containing the supplier's name 1307 and the graphic area containing the seal 1305 is smaller than the distance between the candidate area containing the company's name 1306 and the graphic area containing the seal 1305, and , is less than or equal to a predetermined distance. Therefore, the second area including the customer name 1307 is identified as the most likely candidate area.

このように、帳票内で、印鑑又はロゴと、キーワードを含む会社名とが離れており、その会社名より印鑑又はロゴからの距離が小さい、キーワードを含まない会社名が存在する場合、キーワードを含まない会社名を含む領域が最有力候補領域として特定される。したがって、画像処理システム1は、取引先の名称にキーワードが含まれず、且つ、自社の名称にキーワードが含まれている場合でも、取引先の名称が含まれる領域を精度良く検出することができる。これにより、画像処理システム1は、取引先以外の名称を取引先の名称として誤って検出することを抑制できる。 In this way, if the seal or logo is far from the company name that includes the keyword in the form, and if there is a company name that is closer to the seal or logo than the company name and does not include the keyword, the keyword is Regions containing non-containing company names are identified as the most likely candidate regions. Therefore, the image processing system 1 can accurately detect an area including the name of the supplier even if the name of the supplier does not include the keyword and the name of the company includes the keyword. Thereby, the image processing system 1 can suppress erroneous detection of a name other than the name of the business partner as the name of the business partner.

なお、ステップS501の処理は省略されてもよい。その場合、取引先領域特定部227は、候補領域と図形領域の間の距離にかかわらず、図形領域からの距離が候補領域と図形領域の間の距離より小さく且つ所定距離以下である第2領域を取引先領域として特定する。 Note that the process of step S501 may be omitted. In that case, regardless of the distance between the candidate area and the graphic area, the customer area identification unit 227 determines the second area whose distance from the graphic area is smaller than the distance between the candidate area and the graphic area and is equal to or less than a predetermined distance. as a trading partner area.

また、第2特定処理と同様に、図7のステップS309においても、取引先領域特定部227は、図形領域からの距離が候補領域と図形領域との間の距離より小さく且つ所定距離以下である第2領域を最有力候補領域として特定してもよい。取引先領域特定部227は、複数の候補領域が検出された場合、複数の候補領域の中で、最も近くに位置する図形領域からの距離が最も小さい候補領域を特定する。取引先領域特定部227は、特定した候補領域より図形領域からの距離が小さい第2領域が存在し、且つ、その第2領域と図形領域の間の距離が所定距離以下である場合、その第2領域を最有力候補として特定する。なお、図形領域からの距離が、特定した候補領域と図形領域との間の距離より小さく且つ所定距離以下である第2領域が複数存在する場合、取引先領域特定部227は、その距離が最も小さい第2領域を最有力候補領域として特定する。 Also in step S309 of FIG. 7, as in the second identification process, the supplier area identification unit 227 determines that the distance from the graphic area is smaller than the distance between the candidate area and the graphic area and is equal to or less than the predetermined distance. A second region may be identified as the most likely candidate region. If a plurality of candidate areas are detected, the client area identification unit 227 identifies a candidate area having the shortest distance from the nearest graphic area among the plurality of candidate areas. If there is a second area whose distance from the graphic area is smaller than the identified candidate area, and the distance between the second area and the graphic area is equal to or less than a predetermined distance, the supplier area identification unit 227 identifies the second area. Two regions are identified as the most likely candidates. Note that if there are a plurality of second areas whose distance from the graphic area is smaller than the distance between the identified candidate area and the graphic area and is equal to or less than a predetermined distance, the customer area identification unit 227 determines that the distance is the shortest. A second smaller region is identified as the most likely candidate region.

なお、情報処理装置200は、入力画像を複数の部分領域に分割せずに、まとめて認識処理及び領域特定処理を実行してもよい。その場合、図5の認識処理において、ステップS202の処理が省略され、ステップS203において、画像領域検出部222は、入力画像全体から図形領域を検出する。また、図7の領域特定処理において、ステップS301~S309の処理は入力画像全体に対して実行され、ステップS310の処理は省略される。図7のステップS313において、取引先領域特定部227は、図7のステップS309、図10のステップS404、S405、又は、図11のステップS502、S505で特定した最有力候補領域を取引先領域として特定する。 Note that the information processing apparatus 200 may perform the recognition processing and the region specifying processing collectively without dividing the input image into a plurality of partial regions. In that case, the process of step S202 is omitted in the recognition process of FIG. 5, and in step S203, the image area detection unit 222 detects a graphic area from the entire input image. Also, in the area specifying process of FIG. 7, the processes of steps S301 to S309 are performed on the entire input image, and the process of step S310 is omitted. In step S313 of FIG. 7, the customer area identification unit 227 selects the most promising candidate area identified in step S309 of FIG. 7, steps S404 and S405 of FIG. 10, or steps S502 and S505 of FIG. Identify.

また、情報処理装置200は、第1領域の検出及び第2領域の特定を実行することなく取引先領域を特定してもよい。その場合、図7のステップS303~S304の処理が省略される。ステップS305において、候補領域が検出されなかった場合、取引先領域特定部227は、処理をステップS312へ移行し、取引先の名称に対応する項目名及びその項目名からの位置関係に基づいて、入力画像から取引先領域を検出する。ステップS307において、検出された候補領域の数が一つである場合、取引先領域特定部227は、その検出された候補領域を最有力候補領域として特定する。この場合、ステップS313において、取引先領域特定部227は、図形領域が検出された部分領域毎に特定した候補領域の内、対応する図形領域からの距離が最も小さい候補領域を取引先領域として特定する。 Further, the information processing apparatus 200 may specify the supplier area without detecting the first area and specifying the second area. In that case, the processing of steps S303 and S304 in FIG. 7 is omitted. If no candidate area is detected in step S305, the supplier area identification unit 227 shifts the process to step S312, and based on the item name corresponding to the supplier name and the positional relationship from the item name, Detect supplier regions from the input image. In step S307, if the number of candidate areas detected is one, the supplier area identification unit 227 identifies the detected candidate area as the most likely candidate area. In this case, in step S313, the supplier area identification unit 227 identifies, as the supplier area, the candidate area with the shortest distance from the corresponding graphic area among the candidate areas identified for each partial area in which the graphic area is detected. do.

また、ステップS313において、取引先領域特定部227は、候補領域として検出された最有力候補領域を優先して、取引先領域として特定してもよい。その場合、取引先領域特定部227は、候補領域として検出された最有力候補領域が存在するか否かを判定する。候補領域として検出された最有力候補領域が存在する場合、取引先領域特定部227は、候補領域として検出された最有力候補領域の内、対応する図形領域からの距離が最も小さい最有力候補領域を取引先領域として特定する。一方、候補領域として検出された最有力候補領域が存在しない場合、取引先領域特定部227は、第2領域として特定された最有力候補領域の内、対応する図形領域からの距離が最も小さい最有力候補領域を取引先領域として特定する。 Further, in step S313, the supplier area identification unit 227 may preferentially identify the most promising candidate area detected as the candidate area as the supplier area. In that case, the supplier area identification unit 227 determines whether or not there is a most likely candidate area detected as a candidate area. If there is a most likely candidate area detected as a candidate area, the supplier area identifying unit 227 selects the most likely candidate area that is the shortest from the corresponding graphic area, among the most likely candidate areas detected as candidate areas. as a trading partner area. On the other hand, if there is no most likely candidate area detected as a candidate area, the supplier area identifying unit 227 selects the most likely candidate area identified as the second area, which has the smallest distance from the corresponding graphic area. Identify a strong candidate area as a trading partner area.

以上の通り、取引先領域特定部227は、複数の図形領域が検出され且つ各図形領域に対応する複数の候補領域が検出された場合、複数の候補領域の内、対応する図形領域からの距離が最も小さい候補領域を取引先領域として特定する。また、取引先領域特定部227は、複数の図形領域が検出され、各図形領域に対応する候補領域が検出されず且つ何れかの図形領域に対応する第2領域が特定された場合、その特定された第2領域を取引先領域として特定する。特に、取引先領域特定部227は、各図形領域に対応する複数の第2領域が特定された場合、複数の第2領域の内、対応する図形領域からの距離が最も小さい第2領域を取引先領域として特定する。 As described above, when a plurality of graphic regions are detected and a plurality of candidate regions corresponding to each graphic region are detected, the customer region identification unit 227 determines the distance from the corresponding graphic region among the plurality of candidate regions. The candidate region with the smallest is specified as the trading partner region. Further, when a plurality of graphic regions are detected, the candidate region corresponding to each graphic region is not detected, and the second region corresponding to any of the graphic regions is identified, the supplier region identification unit 227 The specified second area is specified as a supplier area. In particular, when a plurality of second regions corresponding to each graphic region are identified, the supplier region identification unit 227 selects the second region having the smallest distance from the corresponding graphic region among the plurality of second regions. identified as the destination region.

以上詳述したように、情報処理装置200は、キーワードに基づいて取引先の名称の候補領域が複数検出された場合に、印鑑又はロゴが含まれる図形領域からの距離に基づいて一つの取引先領域を特定する。これにより、情報処理装置200は、入力画像から取引先の名称が含まれる領域をより精度良く特定することが可能となった。 As described in detail above, the information processing apparatus 200, when a plurality of candidate areas for the name of the customer is detected based on the keyword, selects one customer based on the distance from the graphic area containing the seal or logo. Identify areas. As a result, the information processing apparatus 200 can more accurately identify the region containing the name of the business partner from the input image.

その結果、情報処理装置200は、入力装置202を用いて利用者から取引先の名称の修正を受け付けることがなくなり、入力画像を扱う処理におけるプロセッサの処理負荷を低減させることが可能となった。また、情報処理装置200は、他の情報処理装置に取引先の名称に関する情報を送信する場合、他の情報処理装置から取引先の名称の修正要求を受信することがなくなり、情報処理装置200と他の情報処理装置の間の通信量を低減させることが可能となった。 As a result, the information processing apparatus 200 no longer accepts correction of the supplier's name from the user using the input device 202, making it possible to reduce the processing load of the processor in the process of handling the input image. Further, when the information processing device 200 transmits information about the name of the client to another information processing device, the information processing device 200 does not receive a request to correct the name of the client from the other information processing device. It has become possible to reduce the amount of communication between other information processing apparatuses.

画像処理システム1は、OCR及びRPA(Robotic Process Automation)技術を利用して帳票入力業務を自動化する企業において、担当者の業務負担を軽減させることが可能となった。特に、画像処理システム1は、請求書等の帳票を電子化して支払い依頼等の業務を自動化する際に、取引先の名称を精度良く特定することが可能となり、利用者の利便性を向上させることが可能となった。 The image processing system 1 has made it possible to reduce the work load of the person in charge in a company that automates the form input work using OCR and RPA (Robotic Process Automation) technology. In particular, the image processing system 1 makes it possible to specify the names of business partners with high accuracy when digitizing forms such as invoices and automating operations such as payment requests, thereby improving user convenience. became possible.

図14は、他の実施形態に係る情報処理装置における第2処理回路230の概略構成を示すブロック図である。 FIG. 14 is a block diagram showing a schematic configuration of a second processing circuit 230 in an information processing apparatus according to another embodiment.

第2処理回路230は、第2処理回路220の代わりに、認識処理を実行する。第2処理回路230は、取得回路231、画像領域検出回路232、文字列領域検出回路233、候補領域検出回路234、第1領域検出回路235、第2領域特定回路236、取引先領域特定回路237及び出力制御回路238等を有する。 The second processing circuit 230 executes recognition processing instead of the second processing circuit 220 . The second processing circuit 230 includes an acquisition circuit 231, an image area detection circuit 232, a character string area detection circuit 233, a candidate area detection circuit 234, a first area detection circuit 235, a second area identification circuit 236, and a supplier area identification circuit 237. and an output control circuit 238 and the like.

取得回路231は、取得部の一例であり、取得部221と同様の機能を有する。取得回路231は、入力画像を、第2インタフェース装置201を介して画像読取装置100から取得し、第2記憶装置210に保存する。 The acquisition circuit 231 is an example of an acquisition section and has the same function as the acquisition section 221 . The acquisition circuit 231 acquires an input image from the image reading device 100 via the second interface device 201 and stores it in the second storage device 210 .

画像領域検出回路232は、画像領域検出部の一例であり、画像領域検出部222と同様の機能を有する。画像領域検出回路232は、第2記憶装置210から入力画像を読み出し、入力画像内で図形領域を検出し、検出結果を第2記憶装置210に保存する。 The image area detection circuit 232 is an example of an image area detection section and has the same function as the image area detection section 222 . The image area detection circuit 232 reads the input image from the second storage device 210 , detects graphic areas in the input image, and stores the detection result in the second storage device 210 .

文字列領域検出回路233は、文字列領域検出部の一例であり、文字列領域検出部223と同様の機能を有する。文字列領域検出回路233は、第2記憶装置210から入力画像を読み出し、入力画像から文字列領域を検出し、検出結果を第2記憶装置210に保存する。 The character string area detection circuit 233 is an example of a character string area detection section and has the same function as the character string area detection section 223 . The character string area detection circuit 233 reads the input image from the second storage device 210 , detects character string areas from the input image, and saves the detection result in the second storage device 210 .

候補領域検出回路234は、候補領域検出部の一例であり、候補領域検出部224と同様の機能を有する。候補領域検出回路234は、第2記憶装置210から文字列領域の検出結果及び取引先の名称に関するキーワードを読み出し、文字列領域の中から候補領域を検出し、検出結果を第2記憶装置210に保存する。 The candidate area detection circuit 234 is an example of a candidate area detection section and has the same function as the candidate area detection section 224 . The candidate area detection circuit 234 reads out the detection result of the character string area and the keyword related to the name of the customer from the second storage device 210, detects the candidate area from the character string area, and stores the detection result in the second storage device 210. save.

第1領域検出回路235は、第1領域検出部の一例であり、第1領域検出部225と同様の機能を有する。第1領域検出回路235は、第2記憶装置210から文字列領域の検出結果及び項目テーブルを読み出し、文字列領域の中から第1領域を検出し、検出結果を第2記憶装置210に保存する。 The first area detection circuit 235 is an example of a first area detection section and has the same function as the first area detection section 225 . The first area detection circuit 235 reads the detection result of the character string area and the item table from the second storage device 210, detects the first area from the character string area, and saves the detection result in the second storage device 210. .

第2領域特定回路236は、第2領域特定部の一例であり、第2領域特定部226と同様の機能を有する。第2領域特定回路236は、第2記憶装置210から文字列領域の検出結果及び第1領域の検出結果を読み出し、文字列領域の中から第2領域を特定し、特定結果を第2記憶装置210に保存する。 The second area identifying circuit 236 is an example of a second area identifying section and has the same function as the second area identifying section 226 . The second area identification circuit 236 reads the detection result of the character string area and the detection result of the first area from the second storage device 210, identifies the second area from the character string area, and stores the identification result in the second storage device. 210.

取引先領域特定回路237は、取引先領域特定部の一例であり、取引先領域特定部227と同様の機能を有する。取引先領域特定回路237は、第2記憶装置210から候補領域の検出結果、第1領域の検出結果、及び、第2領域の特定結果を読み出し、取引先領域を特定し、特定結果を第2記憶装置210に保存する。 The supplier area identification circuit 237 is an example of a supplier area identification unit and has the same function as the supplier area identification unit 227 . The supplier area identification circuit 237 reads the detection result of the candidate area, the detection result of the first area, and the identification result of the second area from the second storage device 210, identifies the supplier area, and stores the identification result as the second area. Store in storage device 210 .

出力制御回路238は、出力制御部の一例であり、出力制御部228と同様の機能を有する。出力制御回路238は、第2記憶装置210から取引先領域の特定結果を読み出し、取引先領域に関する情報を表示装置203に出力する。 The output control circuit 238 is an example of an output control section and has the same function as the output control section 228 . The output control circuit 238 reads out the specified result of the customer area from the second storage device 210 and outputs information about the customer area to the display device 203 .

以上詳述したように、情報処理装置は、第2処理回路230を用いる場合も、入力画像から取引先の名称が含まれる領域をより精度良く特定することが可能となった。 As described in detail above, the information processing apparatus, even when using the second processing circuit 230, can more accurately identify an area containing the name of the customer from the input image.

以上、好適な実施形態について説明してきたが、実施形態はこれらに限定されない。例えば、画像読取装置100と情報処理装置200の機能分担は、図1に示す画像処理システム1の例に限られず、画像読取装置100及び情報処理装置200の各部を画像読取装置100と情報処理装置200の何れに配置するかは適宜変更可能である。または、画像読取装置100と情報処理装置200を一つの装置で構成してもよい。 Although the preferred embodiments have been described above, the embodiments are not limited to these. For example, the division of functions between the image reading device 100 and the information processing device 200 is not limited to the example of the image processing system 1 shown in FIG. 200 can be changed as appropriate. Alternatively, the image reading device 100 and the information processing device 200 may be configured as one device.

例えば、画像読取装置100の第1記憶装置110が、情報処理装置200の第2記憶装置210に記憶された各プログラム及び各データを記憶してもよい。また、画像読取装置100の第1処理回路120が、情報処理装置200の第2処理回路220により実現される各部として動作してもよい。また、画像読取装置100が、情報処理装置200の第2処理回路230と同様の処理回路を有してもよい。 For example, the first storage device 110 of the image reading device 100 may store each program and each data stored in the second storage device 210 of the information processing device 200 . Also, the first processing circuit 120 of the image reading device 100 may operate as each unit realized by the second processing circuit 220 of the information processing device 200 . Also, the image reading device 100 may have a processing circuit similar to the second processing circuit 230 of the information processing device 200 .

その場合、画像読取装置100は表示装置203と同様の表示装置を有する。認識処理は画像読取装置100で実行されるため、ステップS102、S201の入力画像の送受信処理は省略される。ステップS202~S208の各処理は、画像読取装置100の第1処理回路120によって実行される。これらの処理の動作は、情報処理装置200の第2処理回路220又は第2処理回路230によって実行される場合と同様である。この場合、画像読取装置100が画像処理装置として動作する。 In that case, the image reading device 100 has a display device similar to the display device 203 . Since the recognition process is executed by the image reading apparatus 100, the transmission/reception process of the input image in steps S102 and S201 is omitted. Each process of steps S202 to S208 is executed by the first processing circuit 120 of the image reading apparatus 100. FIG. These processing operations are the same as those executed by the second processing circuit 220 or the second processing circuit 230 of the information processing device 200 . In this case, the image reading device 100 operates as an image processing device.

また、画像処理システム1において、第1インタフェース装置101と第2インタフェース装置201は、インターネット、電話回線網(携帯端末回線網、一般電話回線網を含む)、イントラネット等のネットワークを介して接続してもよい。その場合、第1インタフェース装置101及び第2インタフェース装置201に、接続するネットワークの通信インタフェース回路を備える。また、その場合、クラウドコンピューティングの形態で画像処理のサービスを提供できるように、ネットワーク上に複数の情報処理装置を分散して配置し、各情報処理装置が協働して、認識処理等を分担するようにしてもよい。これにより、画像処理システム1は、複数の画像読取装置が読み取った入力画像について、効率よく認識処理を実行できる。 In the image processing system 1, the first interface device 101 and the second interface device 201 are connected via a network such as the Internet, a telephone line network (including a mobile terminal line network and a general telephone line network), an intranet, or the like. good too. In that case, the first interface device 101 and the second interface device 201 are provided with a communication interface circuit of the network to be connected. In that case, multiple information processing devices are distributed over a network so that image processing services can be provided in the form of cloud computing, and each information processing device cooperates to perform recognition processing, etc. You may make it share. As a result, the image processing system 1 can efficiently perform recognition processing on input images read by a plurality of image reading devices.

200 情報処理装置
210 第2記憶装置
221 取得部
222 画像領域検出部
223 文字列領域検出部
224 候補領域検出部
225 第1領域検出部
226 第2領域特定部
227 取引先領域特定部
228 出力制御部
200 information processing device 210 second storage device 221 acquisition unit 222 image area detection unit 223 character string area detection unit 224 candidate area detection unit 225 first area detection unit 226 second area identification unit 227 customer area identification unit 228 output control unit

Claims (9)

取引先の名称に関するキーワードを記憶するとともに、帳票に含まれる複数の項目毎に、各項目に関する第2キーワード又はフォーマットを記憶する記憶部と、
入力画像を取得する取得部と、
前記入力画像内で印鑑又はロゴが含まれる画像領域を検出する画像領域検出部と、
前記入力画像から文字列領域を検出する文字列領域検出部と、
前記キーワードに基づいて、前記文字列領域の中から、取引先の名称が含まれる候補領域を検出する候補領域検出部と、
前記第2キーワード又は前記フォーマットに基づいて、前記文字列領域の中から、前記複数の項目の内の何れかの項目が含まれる第1領域を検出する第1領域検出部と、
前記文字列領域の中から、前記候補領域又は前記第1領域として検出されなかった第2領域を特定する第2領域特定部と、
前記候補領域検出部により複数の候補領域が検出された場合に、前記画像領域からの距離に基づいて、前記複数の候補領域の中から一つの取引先領域を特定し、前記候補領域検出部により候補領域が検出されなかった場合、前記第2領域特定部により特定された第2領域を前記取引先領域として特定する取引先領域特定部と、
前記取引先領域に関する情報を出力する出力制御部と、
を有することを特徴とする画像処理装置。
a storage unit that stores a keyword related to the name of a business partner and stores a second keyword or format related to each item for each of a plurality of items included in a form;
an acquisition unit that acquires an input image;
an image area detection unit that detects an image area containing a seal or a logo in the input image;
a character string area detection unit that detects a character string area from the input image;
a candidate area detection unit that detects a candidate area including a client name from the character string area based on the keyword;
a first area detection unit that detects a first area including any one of the plurality of items from the character string area based on the second keyword or the format;
a second region identifying unit that identifies a second region that has not been detected as the candidate region or the first region from the character string region;
When a plurality of candidate areas are detected by the candidate area detection unit, one client area is specified from among the plurality of candidate areas based on the distance from the image area , and the candidate area detection unit a customer area identifying unit that identifies the second area identified by the second area identifying unit as the customer area when no candidate area is detected;
an output control unit that outputs information about the trading partner area;
An image processing device comprising:
前記取引先領域特定部は、前記候補領域検出部により検出された候補領域より前記画像領域からの距離が小さい第2領域が存在し、且つ、当該第2領域と前記画像領域の間の距離が所定距離以下である場合、当該第2領域を前記取引先領域として特定する、請求項に記載の画像処理装置。 The customer area identification unit includes a second area having a smaller distance from the image area than the candidate area detected by the candidate area detection unit, and a distance between the second area and the image area. 2. The image processing apparatus according to claim 1 , wherein said second area is specified as said customer area when the distance is equal to or less than a predetermined distance. 前記取引先領域特定部は、前記第2領域特定部により複数の第2領域が特定された場合に、前記画像領域からの距離に基づいて、前記複数の第2領域の中から一つの取引先領域を特定する、請求項1または2に記載の画像処理装置。 When the second area identifying unit identifies a plurality of second areas, the customer area identifying unit selects one customer from among the plurality of second areas based on the distance from the image area. 3. The image processing apparatus according to claim 1 , wherein the area is specified. 取引先の名称に関するキーワードを記憶する記憶部と、a storage unit that stores keywords related to names of business partners;
入力画像を取得する取得部と、an acquisition unit that acquires an input image;
前記入力画像内の複数の部分領域毎に、印鑑又はロゴが含まれる画像領域を検出する画像領域検出部と、an image area detection unit that detects an image area including a seal or a logo for each of a plurality of partial areas in the input image;
前記画像領域が検出された部分領域毎に、文字列領域を検出する文字列領域検出部と、a character string area detection unit that detects a character string area for each partial area in which the image area is detected;
前記画像領域が検出された部分領域毎に、前記キーワードに基づいて、前記文字列領域の中から、取引先の名称が含まれる候補領域を検出する候補領域検出部と、a candidate area detection unit for detecting a candidate area including a client name from the character string area based on the keyword for each partial area where the image area is detected;
前記候補領域検出部により複数の候補領域が検出された場合に、前記画像領域が検出された部分領域毎に検出された候補領域の内、対応する画像領域からの距離が最も小さい候補領域を取引先領域として特定する取引先領域特定部と、When a plurality of candidate areas are detected by the candidate area detection unit, among the candidate areas detected for each of the partial areas in which the image areas are detected, a candidate area having the shortest distance from the corresponding image area is traded. a customer area identification part for identifying a customer area;
前記取引先領域に関する情報を出力する出力制御部と、an output control unit that outputs information about the trading partner area;
を有することを特徴とする画像処理装置。An image processing device comprising:
前記記憶部は、帳票に含まれる複数の項目毎に、各項目に関する第2キーワード又はフォーマットをさらに記憶し、
前記画像領域が検出された部分領域毎に、前記第2キーワード又は前記フォーマットに基づいて、前記文字列領域の中から、前記複数の項目の内の何れかの項目が含まれる第1領域を検出する第1領域検出部と、
前記画像領域が検出された部分領域毎に、前記文字列領域の中から、前記候補領域又は前記第1領域として検出されなかった第2領域を特定する第2領域特定部と、を有し、
前記取引先領域特定部は、前記候補領域検出部により候補領域が検出されなかった場合、前記第2領域特定部により前記画像領域が検出された部分領域毎に特定された第2領域の内、対応する画像領域からの距離が最も小さい第2領域を前記取引先領域として特定する、請求項に記載の画像処理装置。
The storage unit further stores a second keyword or format for each item for each of a plurality of items included in the form,
A first area including any one of the plurality of items is detected from the character string area based on the second keyword or the format for each partial area where the image area is detected. a first area detection unit for
a second area identifying unit that identifies a second area that was not detected as the candidate area or the first area from the character string area for each partial area where the image area was detected;
When the candidate area detection unit does not detect a candidate area, the supplier area identification unit is configured to: 5. The image processing apparatus according to claim 4 , wherein a second area having the smallest distance from the corresponding image area is specified as the client area.
記憶部を有する画像処理装置の制御方法であって、前記画像処理装置が、
取引先の名称に関するキーワードを前記記憶部に記憶するとともに、帳票に含まれる複数の項目毎に、各項目に関する第2キーワード又はフォーマットを前記記憶部に記憶し、
入力画像を取得し、
前記入力画像内で印鑑又はロゴが含まれる画像領域を検出し、
前記入力画像から文字列領域を検出し、
前記キーワードに基づいて、前記文字列領域の中から、取引先の名称が含まれる候補領域を検出し、
前記第2キーワード又は前記フォーマットに基づいて、前記文字列領域の中から、前記複数の項目の内の何れかの項目が含まれる第1領域を検出し、
前記文字列領域の中から、前記候補領域又は前記第1領域として検出されなかった第2領域を特定し、
複数の候補領域が検出された場合に、前記画像領域からの距離に基づいて、前記複数の候補領域の中から一つの取引先領域を特定し、候補領域が検出されなかった場合、前記特定された第2領域を前記取引先領域として特定し、
前記取引先領域に関する情報を出力する、
ことを特徴とする制御方法。
A control method for an image processing device having a storage unit, the image processing device comprising:
storing a keyword related to the name of a business partner in the storage unit, and storing a second keyword or format related to each item in the storage unit for each of a plurality of items included in a form;
get the input image,
detecting an image area containing a seal or logo in the input image;
detecting a character string region from the input image;
Detecting a candidate area containing a customer name from the character string area based on the keyword,
based on the second keyword or the format, detecting a first area containing any one of the plurality of items from the character string area;
identifying a second region that was not detected as the candidate region or the first region from the character string region;
If a plurality of candidate areas are detected, one customer area is specified from among the plurality of candidate areas based on the distance from the image area, and if no candidate area is detected, the specified specifying the second area as the trading partner area;
outputting information about the trading partner area;
A control method characterized by:
記憶部を有する画像処理装置の制御方法であって、前記画像処理装置が、A control method for an image processing device having a storage unit, the image processing device comprising:
取引先の名称に関するキーワードを前記記憶部に記憶し、storing a keyword related to the name of the business partner in the storage unit;
入力画像を取得し、get the input image,
前記入力画像内の複数の部分領域毎に、印鑑又はロゴが含まれる画像領域を検出し、detecting an image region containing a seal or a logo for each of a plurality of partial regions in the input image;
前記画像領域が検出された部分領域毎に、文字列領域を検出し、detecting a character string region for each partial region where the image region is detected;
前記画像領域が検出された部分領域毎に、前記キーワードに基づいて、前記文字列領域の中から、取引先の名称が含まれる候補領域を検出し、detecting a candidate area containing a client name from the character string area based on the keyword for each partial area where the image area is detected;
複数の候補領域が検出された場合に、前記画像領域が検出された部分領域毎に検出された候補領域の内、対応する画像領域からの距離が最も小さい候補領域を取引先領域として特定し、when a plurality of candidate areas are detected, among the candidate areas detected for each partial area in which the image area is detected, a candidate area having the smallest distance from the corresponding image area is specified as a customer area;
前記取引先領域に関する情報を出力する、outputting information about the trading partner area;
ことを特徴とする制御方法。A control method characterized by:
記憶部を有するコンピュータの制御プログラムであって、
取引先の名称に関するキーワードを前記記憶部に記憶するとともに、帳票に含まれる複数の項目毎に、各項目に関する第2キーワード又はフォーマットを前記記憶部に記憶し、
入力画像を取得し、
前記入力画像内で印鑑又はロゴが含まれる画像領域を検出し、
前記入力画像から文字列領域を検出し、
前記キーワードに基づいて、前記文字列領域の中から、取引先の名称が含まれる候補領域を検出し、
前記第2キーワード又は前記フォーマットに基づいて、前記文字列領域の中から、前記複数の項目の内の何れかの項目が含まれる第1領域を検出し、
前記文字列領域の中から、前記候補領域又は前記第1領域として検出されなかった第2領域を特定し、
複数の候補領域が検出された場合に、前記画像領域からの距離に基づいて、前記複数の候補領域の中から一つの取引先領域を特定し、候補領域が検出されなかった場合、前記特定された第2領域を前記取引先領域として特定し、
前記取引先領域に関する情報を出力する、
ことを前記コンピュータに実行させることを特徴とする制御プログラム。
A control program for a computer having a storage unit,
storing a keyword related to the name of a business partner in the storage unit, and storing a second keyword or format related to each item in the storage unit for each of a plurality of items included in a form;
get the input image,
detecting an image area containing a seal or logo in the input image;
detecting a character string region from the input image;
Detecting a candidate area containing a customer name from the character string area based on the keyword,
based on the second keyword or the format, detecting a first area containing any one of the plurality of items from the character string area;
identifying a second region that was not detected as the candidate region or the first region from the character string region;
If a plurality of candidate areas are detected, one customer area is specified from among the plurality of candidate areas based on the distance from the image area, and if no candidate area is detected, the specified specifying the second area as the trading partner area;
outputting information about the trading partner area;
A control program characterized by causing the computer to execute:
記憶部を有するコンピュータの制御プログラムであって、A control program for a computer having a storage unit,
取引先の名称に関するキーワードを前記記憶部に記憶し、storing a keyword related to the name of the business partner in the storage unit;
入力画像を取得し、get the input image,
前記入力画像内の複数の部分領域毎に、印鑑又はロゴが含まれる画像領域を検出し、detecting an image region containing a seal or a logo for each of a plurality of partial regions in the input image;
前記画像領域が検出された部分領域毎に、文字列領域を検出し、detecting a character string region for each partial region where the image region is detected;
前記画像領域が検出された部分領域毎に、前記キーワードに基づいて、前記文字列領域の中から、取引先の名称が含まれる候補領域を検出し、detecting a candidate area containing a client name from the character string area based on the keyword for each partial area where the image area is detected;
複数の候補領域が検出された場合に、前記画像領域が検出された部分領域毎に検出された候補領域の内、対応する画像領域からの距離が最も小さい候補領域を取引先領域として特定し、when a plurality of candidate areas are detected, among the candidate areas detected for each partial area in which the image area is detected, a candidate area having the smallest distance from the corresponding image area is specified as a customer area;
前記取引先領域に関する情報を出力する、outputting information about the trading partner area;
ことを前記コンピュータに実行させることを特徴とする制御プログラム。A control program characterized by causing the computer to execute:
JP2022505727A 2020-03-13 2020-03-13 Image processing device, control method and control program Active JP7282257B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/011276 WO2021181704A1 (en) 2020-03-13 2020-03-13 Image processing device, control method, and control program

Publications (2)

Publication Number Publication Date
JPWO2021181704A1 JPWO2021181704A1 (en) 2021-09-16
JP7282257B2 true JP7282257B2 (en) 2023-05-26

Family

ID=77671489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022505727A Active JP7282257B2 (en) 2020-03-13 2020-03-13 Image processing device, control method and control program

Country Status (2)

Country Link
JP (1) JP7282257B2 (en)
WO (1) WO2021181704A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233913A (en) 2006-03-03 2007-09-13 Fuji Xerox Co Ltd Image processor and program
JP2010157107A (en) 2008-12-26 2010-07-15 Hitachi Software Eng Co Ltd Business document processor
JP6646308B1 (en) 2019-03-07 2020-02-14 ファーストアカウンティング株式会社 Voucher analysis device, accounting processing system, voucher analysis method, voucher analysis program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233913A (en) 2006-03-03 2007-09-13 Fuji Xerox Co Ltd Image processor and program
JP2010157107A (en) 2008-12-26 2010-07-15 Hitachi Software Eng Co Ltd Business document processor
JP6646308B1 (en) 2019-03-07 2020-02-14 ファーストアカウンティング株式会社 Voucher analysis device, accounting processing system, voucher analysis method, voucher analysis program

Also Published As

Publication number Publication date
JPWO2021181704A1 (en) 2021-09-16
WO2021181704A1 (en) 2021-09-16

Similar Documents

Publication Publication Date Title
US10127441B2 (en) Systems and methods for classifying objects in digital images captured using mobile devices
US9311531B2 (en) Systems and methods for classifying objects in digital images captured using mobile devices
WO2019169772A1 (en) Picture processing method, electronic apparatus, and storage medium
JP6970835B2 (en) Image processing device, control method and control program
JP5387193B2 (en) Image processing system, image processing apparatus, and program
US20220374664A1 (en) Method for generating a quick response code and printing apparatus
CN110197238B (en) Font type identification method, system and terminal equipment
US10970579B2 (en) Image processing apparatus for placing a character recognition target region at a position of a predetermined region in an image conforming to a predetermined format
US20100158375A1 (en) Signal processing apparatus, signal processing method, computer-readable medium and computer data signal
CN105701489B (en) Novel digital extraction and identification method and system
JP5701181B2 (en) Image processing apparatus, image processing method, and computer program
JP2007241356A (en) Image processor and image processing program
US20180217973A1 (en) Systems and methods for creating multi-layered optical character recognition (ocr) documents
JP2010056827A (en) Apparatus and program for processing image
JP4582200B2 (en) Image processing apparatus, image conversion method, and computer program
CN108090728B (en) Express information input method and system based on intelligent terminal
JP2021149452A (en) Image processing device, control method and control program
JP7282257B2 (en) Image processing device, control method and control program
JP5929282B2 (en) Image processing apparatus and image processing program
CN107861931B (en) Template file processing method and device, computer equipment and storage medium
JP4208520B2 (en) Image processing apparatus, image processing method, program, and storage medium
JP5278093B2 (en) Article related information providing method, apparatus, program, and recording medium
JP5314521B2 (en) Image processing system and image processing method
WO2020089984A1 (en) Image processing device, control method, and control program
JP4648073B2 (en) Image processing apparatus, image reading apparatus including the same, and image processing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230418

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230516

R150 Certificate of patent or registration of utility model

Ref document number: 7282257

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150