JP2023016031A - Character recognition method for recognizing information contained in table and character recognition system - Google Patents
Character recognition method for recognizing information contained in table and character recognition system Download PDFInfo
- Publication number
- JP2023016031A JP2023016031A JP2022115078A JP2022115078A JP2023016031A JP 2023016031 A JP2023016031 A JP 2023016031A JP 2022115078 A JP2022115078 A JP 2022115078A JP 2022115078 A JP2022115078 A JP 2022115078A JP 2023016031 A JP2023016031 A JP 2023016031A
- Authority
- JP
- Japan
- Prior art keywords
- correction target
- cell
- target cell
- text
- cells
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 239000013598 vector Substances 0.000 claims abstract description 41
- 238000012937 correction Methods 0.000 claims description 158
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012015 optical character recognition Methods 0.000 description 22
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000013473 artificial intelligence Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000013135 deep learning Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 239000003814 drug Substances 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
Description
本発明は、テーブルに含まれる情報を認識する文字認識方法及び文字認識システムに関する。 The present invention relates to a character recognition method and system for recognizing information contained in a table.
人工知能の辞書的意味は、人間の学習能力、推論能力、知覚能力、自然言語理解能力などをコンピュータプログラムで実現した技術である。このような人工知能は、マシンラーニングに人間の脳を模倣したニューラルネットワークを加えたディープラーニングにより飛躍的に発展してきた。 The dictionary meaning of artificial intelligence is technology that realizes human learning ability, reasoning ability, perceptual ability, natural language understanding ability, etc. by computer program. Such artificial intelligence has made dramatic progress through deep learning, which is a combination of machine learning and a neural network that mimics the human brain.
ディープラーニング(deep learning)とは、コンピュータが人間のように判断及び学習できるようにし、それにより事物やデータを群集化又は分類する技術をいい、近年、テキストデータだけでなく画像データまで分析できるようになり、非常に多様な産業分野に積極的に活用されている。 Deep learning is a technology that allows computers to make judgments and learn like humans, thereby grouping or classifying objects and data.In recent years, not only text data but also image data can be analyzed. and is actively used in a wide variety of industrial fields.
このような人工知能の発達により、オフィス・オートメーション(office automation)分野においても様々な自動化が行われている。特に、オフィス・オートメーション分野においては、人工知能を活用した画像データ分析技術に基づいて、紙(ペーパ)に印刷されたコンテンツをデータ化するのに多くの努力をしている。その一環として、オフィス・オートメーション分野においては、紙文書をイメージ化し、イメージに含まれるコンテンツを分析するイメージ分析技術(又は画像データ分析技術)により、文書に含まれるコンテンツをデータ化しており、その場合、文書に含まれるコンテンツの特性によってイメージを分析する技術が必要である。 With the development of such artificial intelligence, various automations are being carried out in the field of office automation. In particular, in the field of office automation, much effort is being made to digitize content printed on paper based on image data analysis technology that utilizes artificial intelligence. As part of this, in the field of office automation, the content contained in the document is converted into data using image analysis technology (or image data analysis technology) that converts paper documents into images and analyzes the content contained in the images. Therefore, there is a need for techniques for analyzing images according to the characteristics of the content contained in the document.
例えば、テーブル(表)を含む文書をデータ化する場合、テーブルの形式、テーブルに含まれるテキストの内容、及びテーブルに含まれるテキストの位置などのように、テーブルに関連する様々な要素についての正確な分析が必要である。 For example, when digitizing a document that contains a table, the accuracy of various elements related to the table, such as the format of the table, the content of the text contained in the table, and the position of the text contained in the table. Further analysis is required.
そこで、特許文献1(書式自動化のためのテーブル生成装置及び方法)においては、イメージからテーブルを認識し、認識されたテーブルを再現する方法について開示しているが、それは、テーブルに含まれる線分(ライン)を基準にテーブルを再現するものであるので、テーブルに含まれる内容まで正確に分析するのに限界があった。 Therefore, Patent Document 1 (table generation device and method for form automation) discloses a method of recognizing a table from an image and reproducing the recognized table. Since the table is reproduced on the basis of (line), there was a limit in accurately analyzing the contents included in the table.
よって、テーブルに含まれる内容まで正確に生成できる文字認識方法が求められている。 Therefore, there is a need for a character recognition method that can accurately generate even the contents contained in the table.
本発明は、テーブルに含まれる内容(又はコンテンツ、情報)をデータ化することができる、文字認識のエラーに対してロバストな文字認識方法及び文字認識システムを提供するためのものである。 An object of the present invention is to provide a character recognition method and a character recognition system that are robust against character recognition errors and that can convert the contents (or contents, information) contained in a table into data.
また、本発明は、テーブルに含まれる内容をデータ化する場合、テーブルに含まれる内容を正確にデータとして確保することができる、文字認識のエラーに対してロバストな文字認識方法及び文字認識システムを提供するためのものである。 Further, the present invention provides a character recognition method and a character recognition system that are robust against character recognition errors and that can ensure the contents contained in the table as data when converting the contents contained in the table into data. It is for providing.
さらに、本発明は、テーブルに含まれる内容間の有機的な関係を考慮してテーブルに含まれる内容をデータ化することができる、文字認識のエラーに対してロバストな文字認識方法及び文字認識システムを提供するためのものである。 Furthermore, the present invention provides a character recognition method and a character recognition system that are robust against character recognition errors, which can convert the contents contained in the table into data in consideration of the organic relationship between the contents contained in the table. It is intended to provide
さらに、本発明は、データ処理量を最小限に抑えたうえでテーブルに含まれる内容をデータ化することができる、文字認識のエラーに対してロバストな文字認識方法及び文字認識システムを提供するためのものである。 Furthermore, the present invention is intended to provide a character recognition method and a character recognition system that are robust against character recognition errors and can convert the contents contained in a table into data while minimizing the amount of data processing. belongs to.
本発明による文字認識方法は、テーブルを含むイメージを受信するステップと、前記テーブルを構成する複数のセルに含まれるテキストを認識するステップと、予め設定された基準に基づいて、前記複数のセルから補正対象セルを特定するステップと、前記複数のセルから前記補正対象セルに関連する少なくとも1つの関連セルを特定するステップと、前記補正対象セル及び前記関連セルに含まれるテキストを用いて算出された前記補正対象セルのベクトルを用いて、前記補正対象セルに含まれるテキストの補正を行うステップとを含むようにしてもよい。 A character recognition method according to the present invention includes the steps of receiving an image containing a table, recognizing text contained in a plurality of cells constituting the table, and recognizing text contained in the plurality of cells based on preset criteria. identifying a correction target cell; identifying at least one related cell related to the correction target cell from the plurality of cells; and calculating using the text included in the correction target cell and the related cell and a step of correcting the text included in the correction target cell using the vector of the correction target cell.
また、本発明による文字認識システムは、保存部と、テーブルを含むイメージを受信する受信部と、前記イメージに含まれる前記テーブルを構成する複数のセルに含まれるテキストを認識する制御部とを含み、前記制御部は、予め設定された基準に基づいて、前記複数のセルから補正対象セルを特定し、前記複数のセルから前記補正対象セルに関連する少なくとも1つの関連セルを特定し、前記補正対象セル及び前記関連セルに含まれるテキストを用いて算出された前記補正対象セルのベクトルを用いて、前記補正対象セルに含まれるテキストの補正を行うようにしてもよい。 A character recognition system according to the present invention includes a storage unit, a reception unit for receiving an image including a table, and a control unit for recognizing text included in a plurality of cells forming the table included in the image. , the control unit specifies a correction target cell from the plurality of cells based on a preset standard; specifies at least one related cell related to the correction target cell from the plurality of cells; The text included in the correction target cell may be corrected using the vector of the correction target cell calculated using the text included in the target cell and the related cell.
さらに、本発明による複数の命令を含むコンピュータプログラムは、命令が実行されると、テーブルを含むイメージを受信するステップと、前記テーブルを構成する複数のセルに含まれるテキストを認識するステップと、予め設定された基準に基づいて、前記複数のセルから補正対象セルを特定するステップと、前記複数のセルから前記補正対象セルに関連する少なくとも1つの関連セルを特定するステップと、前記補正対象セル及び前記関連セルに含まれるテキストを用いて算出された前記補正対象セルのベクトルを用いて、前記補正対象セルに含まれるテキストの補正を行うステップと、をコンピュータで実行するようにしてもよい。 Further, a computer program comprising a plurality of instructions according to the present invention, upon execution of the instructions, comprises the steps of: receiving an image containing a table; recognizing text contained in a plurality of cells comprising said table; identifying a correction target cell from the plurality of cells based on set criteria; identifying at least one related cell related to the correction target cell from the plurality of cells; and the step of correcting the text included in the correction target cell using the vector of the correction target cell calculated using the text included in the related cell.
前述したように、本発明による文字認識方法及び文字認識システムは、イメージに含まれるテーブルからテキストを認識し、認識されたテキストの検証を行うことにより、イメージに含まれるテーブルの内容をより正確にデータ化することができる。 As described above, the character recognition method and character recognition system according to the present invention recognizes text from a table included in an image and verifies the recognized text to more accurately identify the contents of the table included in the image. It can be converted into data.
より具体的には、本発明による文字認識方法及び文字認識システムは、イメージに含まれるテーブルから、テーブルに含まれるテキストが誤って認識された場合、それを補正することにより、イメージに含まれるテーブルの内容をより正確にデータ化することができる。 More specifically, the character recognition method and the character recognition system according to the present invention correct the text contained in the table contained in the image when the text contained in the table is erroneously recognized from the table contained in the image. can be converted into data more accurately.
以下、添付図面を参照して本発明の実施形態について詳細に説明するが、図面番号に関係なく同一又は類似の構成要素には同一の符号を付し、それについての重複する説明は省略する。以下の説明で用いられる構成要素の接尾辞である「モジュール」や「部」は、明細書の作成を容易にするために付与又は混用されるものであり、それ自体が有意性や有用性を有するものではない。また、本発明の実施形態について説明するにあたり、関連する公知技術についての具体的な説明が本発明の実施形態の要旨を不明にすると判断される場合は、その詳細な説明を省略する。さらに、添付図面は本発明の実施形態の理解を助けるためのものにすぎず、添付図面により本発明の技術的思想が限定されるものではなく、本発明の思想及び技術範囲に含まれるあらゆる変更、均等物乃至代替物を含むものと理解すべきである。 Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. The same or similar components are denoted by the same reference numerals regardless of the drawing numbers, and duplicate descriptions thereof will be omitted. The suffixes “module” and “part” used in the following explanation are given or used together to facilitate the preparation of the specification, and themselves have significance and usefulness. does not have In addition, in describing the embodiments of the present invention, detailed descriptions of related known techniques will be omitted if it is determined that they may obscure the gist of the embodiments of the present invention. Furthermore, the accompanying drawings are only for helping understanding of the embodiments of the present invention, and the technical ideas of the present invention are not limited by the accompanying drawings. , equivalents or alternatives.
「第1」、「第2」などのように序数を含む用語は様々な構成要素を説明するために用いられるが、上記構成要素は上記用語により限定されるものではない。上記用語は1つの構成要素を他の構成要素と区別する目的でのみ用いられる。 Terms including ordinal numbers such as "first", "second", etc. are used to describe various components, but the components are not limited by the above terms. The above terms are only used to distinguish one component from another.
ある構成要素が他の構成要素に「連結」又は「接続」されていると言及された場合は、他の構成要素に直接連結又は接続されていてもよく、中間にさらに他の構成要素が存在してもよいものと解すべきである。それに対して、ある構成要素が他の構成要素に「直接連結」又は「直接接続」されていると言及された場合は、中間にさらに他の構成要素が存在しないものと解すべきである。 When a component is referred to as being "coupled" or "connected" to another component, it may be directly coupled or connected to the other component, with additional components in between. It should be interpreted as something that can be done. In contrast, when a component is referred to as being "directly coupled" or "directly connected" to another component, it should be understood that there are no additional components in between.
単数の表現には、特に断らない限り複数の表現が含まれる。 References to the singular include the plural unless specifically stated otherwise.
本明細書において、「含む」や「有する」などの用語は、本明細書に記載された特徴、数字、段階、動作、構成要素、部品又はそれらの組み合わせが存在することを指定しようとするもので、1つ又はそれ以上の他の特徴、数字、段階、動作、構成要素、部品又はそれらの組み合わせの存在や付加可能性を予め排除するものではないと理解すべきである。 As used herein, terms such as "including" and "having" are intended to specify the presence of features, numbers, steps, acts, components, parts, or combinations thereof described herein. and does not preclude the presence or possibility of adding one or more other features, figures, steps, acts, components, parts or combinations thereof.
前述したように、人工知能が発達するにつれて様々な形態でオフィス・オートメーション(office automation)が行われており、業務効率のために、紙文書に含まれるテーブル(表)を、紙文書に含まれるテーブルの形式のままデジタル化(データ化)するニーズがますます高まっている。 As mentioned above, with the development of artificial intelligence, office automation is being carried out in various forms. There is a growing need to digitize (data) data in a table format.
例えば、様々な種類の領収証(レシート)などの文書はテーブルを含み、保険会社や病院などでは、大量の紙文書に含まれるテーブルをデジタル化されたデータとして処理して電算化する必要がある。 For example, various types of documents such as receipts contain tables, and in insurance companies and hospitals, it is necessary to process and computerize the tables contained in large amounts of paper documents as digitized data.
このようなニーズに伴い、イメージに含まれるテーブルと同じ構成を有するテーブルを生成又は再現する技術の開発が活発に行われている。 In response to such needs, techniques for generating or reproducing a table having the same configuration as the table included in the image are being actively developed.
一方、イメージに含まれるテーブルに含まれる内容(又はコンテンツ、情報)を認識し、認識された内容をデータ化する技術においては、テーブルに関連する様々な要素(例えば、テキスト、テキストの位置、セルの構成、セルの位置、セル間の関連関係など)を正確に認識することが非常に重要である。 On the other hand, in the technology of recognizing the content (or content, information) included in the table included in the image and converting the recognized content into data, various elements related to the table (for example, text, text position, cell configuration, cell locations, relationships between cells, etc.) is very important.
そのために、テーブルを構成する様々な構成要素を正確に認識し、誤って認識された要素に対しては補正を行うことにより、イメージに含まれるテーブルを正確に認識するための様々な努力がなされている。 For this reason, various efforts have been made to accurately recognize the table contained in the image by accurately recognizing the various components that make up the table and correcting the erroneously recognized elements. ing.
以下、イメージに含まれるテーブルの内容とは異なる内容(又はコンテンツ、情報)が抽出された場合にそれを補正する方法について、添付図面と共により具体的に説明する。図1は本発明による文字認識システムを説明するための概念図であり、図2はテーブルの構成要素を説明するための概念図である。また、図3は本発明による文字認識方法を説明するためのフローチャートであり、図4、図5、図6A、図6B、図6C、図7及び図8は文字認識システムによりテーブルに含まれる情報を認識する方法を説明するための概念図である。 Hereinafter, a method for correcting extracted content (or content, information) different from the content of the table included in the image will be described in more detail with reference to the accompanying drawings. FIG. 1 is a conceptual diagram for explaining a character recognition system according to the present invention, and FIG. 2 is a conceptual diagram for explaining constituent elements of a table. 3 is a flow chart for explaining the character recognition method according to the present invention, and FIGS. 4, 5, 6A, 6B, 6C, 7 and 8 show information contained in a table by the character recognition system. is a conceptual diagram for explaining a method of recognizing the .
本発明による文字認識システム100は、イメージ1000に含まれるテーブル1100から、テーブル1100に含まれる内容及びテーブル1100を構成する構成成分を認識し、認識された内容及び構成成分間の関係に基づいて、テーブル1100に含まれる内容を正確にデータ化することができる。
The
ここで、テーブル1100に含まれる内容とは、文字、数字、記号、演算子などの意味のある全ての符号体系を意味する。本発明においては、説明の便宜上、「文字、数字、記号、演算子などの意味のある全ての符号体系」をまとめて「テキスト」と命名する。 Here, the content included in the table 1100 means all meaningful code systems such as letters, numerals, symbols, operators, and the like. In the present invention, for convenience of explanation, "all meaningful code systems such as letters, numerals, symbols, operators, etc." are collectively named "text".
例えば、図示のように、テーブル1100には、「患者氏名」、「住民登録番号」、「診療費(薬剤費)内訳」などのテキストが含まれる。 For example, as shown, table 1100 includes text such as "Patient Name", "Resident Registration Number", and "Breakdown of Medical Expenses (Drug Expenses)".
また、テーブル1100を構成する構成成分は、テキストが含まれるセル、セルを区画するライン又は線などの構成要素で構成される。これらの構成要素は、互いに位置的及び/又は意味的関係性を有する。 Also, the components that make up the table 1100 are composed of components such as cells containing text, lines that partition the cells, and the like. These components have a positional and/or semantic relationship with each other.
ここで、位置的関係性とは、テーブル1100に含まれるセル間の相互位置関係を示すものであって、それぞれのセルに対して、周辺又は隣りにどのセルが位置し、どのセルと同じ又は隣接する行、列に位置するかなどに関する位置関係(又は配置関係)を意味する。 Here, the positional relationship indicates the mutual positional relationship between the cells included in the table 1100. For each cell, which cell is located in the vicinity or next to it, which cell is the same or It means a positional relationship (or positional relationship) regarding whether or not they are located in adjacent rows or columns.
また、意味的関係性とは、テーブル1100に含まれるセルの少なくとも一部と他の一部とが互いに関連する内容を含むことを意味する。このような意味的関係性とは、それぞれのセルに含まれる内容(テキスト)に基づく連結情報を意味する。例えば、ある1つのセルに含まれる内容と他の1つのセルに含まれる内容とは、i)同一又は類似の概念であるか、ii)同一のカテゴリー又は同一のグループに属するか、iii)互いに対して上位概念又は下位概念に該当する内容であることがあり、この場合、これらのセルが連結されていると表現できる。 In addition, the semantic relationship means that at least some of the cells included in the table 1100 and some of the other cells include contents related to each other. Such semantic relationship means connection information based on the content (text) contained in each cell. For example, the content contained in one cell and the content contained in another cell are i) the same or similar concepts, ii) belong to the same category or the same group, iii) each other On the other hand, the content may correspond to a higher concept or a lower concept, and in this case, it can be expressed that these cells are connected.
なお、イメージ1000には1つ又はそれ以上のテーブルが含まれることがあり、本発明においては、イメージ1000に含まれるテーブルの数に関係なく、イメージ1000に含まれる全てのテーブルを認識することができる。
Note that
本発明において、イメージ1000は、紙文書のスキャンにより取得されたイメージ、写真撮影により取得されたイメージ、又はその他の様々な方法により取得されたイメージである。
In the present invention, the
一方、本発明による文字認識システム100は、図1に示すように、受信部110、保存部120、OCR(Optical Character Reader)部130及び制御部140の少なくとも1つを含む。
Meanwhile, the
まず、受信部110は、テーブル1100を含むイメージ1000を受信する手段であって、通信部、スキャン部及び入力部の少なくとも1つを含むようにしてもよく、その他のイメージ1000を受信する手段からなるようにしてもよい。
First, the receiving
文字認識システム100は、受信部110を介して受信したイメージ1000に含まれるテーブル1100を認識し、イメージ1000に含まれるテーブル1100に含まれる内容をデータ化するすることができる。その認識の結果、文字認識システム100は、テーブル1100に含まれる内容と一致するデータを確保することができる。
The
本発明においては、文字認識システム100により、イメージ1000に含まれるテーブル1100の内容(又はコンテンツ、情報)を認識し、認識された内容にエラーが存在するとそれを補正することにより、テーブル1100に含まれる内容を正確にデータ化する方法を提供することができる。
In the present invention, the
なお、本発明によりイメージ1000に含まれるテーブル1100から認識された内容は、イメージ1000に含まれるテーブル1100と同一又は類似の構造を有するテーブルデータを生成するのに活用することができる。
In addition, the contents recognized from the table 1100 included in the
テーブルデータは、イメージ1000に含まれるテーブル1100を構成するセルの構造及びセルの関係性(カテゴリーセルとデータセルの関係など)の少なくとも一方に基づいて整形化又は構造化されたデータからなるようにしてもよい。
The table data should consist of data formatted or structured based on at least one of the cell structure and cell relationship (relationship between category cells and data cells, etc.) forming the table 1100 included in the
テーブルデータには、本発明による文字認識システム100により認識された内容に該当するデータが含まれる。
The table data includes data corresponding to the contents recognized by the
本発明において、構成要素の位置的関係には、特にテーブルに含まれるセルの配置関係、行又は列の関係に応じた位置関係が含まれ、構成要素の意味的関係には、それぞれのセルに含まれるテキストが示す意味間に形成される関係が含まれる。 In the present invention, the positional relationship of the components particularly includes the positional relationship of the cells included in the table, the positional relationship according to the row or column relationship, and the semantic relationship of the components includes It contains the relationships formed between the meanings implied by the contained text.
次に、保存部120は、本発明による様々な情報を保存するようにしてもよい。保存部120は、その種類が非常に多様であり、少なくとも一部は外部サーバ150(クラウドサバー151及びデータベース(DB)152の少なくとも一方)を意味する。すなわち、保存部120は、本発明に関連する情報が保存される空間であればよく、物理的な空間の制約はない。
Next, the
保存部120には、テーブルを構成する様々な構成要素に関する情報が含まれる。保存部120には、i)テーブル1100を含むイメージ1000及びそれに関連するデータ、ii)イメージ1000から認識されたテーブル1100のセル情報、構成成分(例えば、ライン、コーナーなど)及びそれに関連するデータ、iii)テーブル1100に含まれるコンテンツ(例えば、テキスト、イメージなど)データ、iv)テーブル1100に含まれるコンテンツに関連するデータセットの少なくとも1つが保存される。ここで、データセットは、テーブル1100に含まれるコンテンツを検証又は補正するのに活用されるデータであってもよい。
The
次に、OCR部130は、イメージ1000に含まれるコンテンツ(又は情報)を認識する手段であって、様々なコンテンツ認識アルゴリズムの少なくとも1つによりイメージ1000に含まれるコンテンツを認識することができる。OCR部130は、人工知能に基づくアルゴリズム(又はディープラーニングアルゴリズム)を用いて、コンテンツを認識することができる。ここで、コンテンツは、テキスト(文字)を含んでもよい。OCR部は、「OCR API」とも命名できる。
Next, the
OCR部130は、イメージ1000に含まれるテキスト及びテキストの位置情報を認識することができる。ここで、テキストの位置情報には、受信部110を介して入力されたイメージ1000内でのテキストの位置に関する情報、及びテーブル1100内でのテキストの位置に関する情報の少なくとも一方が含まれる。
The
OCR部130は、イメージ1000に含まれるテキストに基づいて、それぞれのセルに含まれるテキストを認識することができる。
テーブル1100は、複数のセルで構成され、OCR部130は、それぞれのセルに含まれるテキストを認識することができる。
The table 1100 is composed of a plurality of cells, and the
例えば、図1に示すように、テーブル1100の1番目のセル1101から「患者氏名」というテキストが認識された場合、1番目のセル1101の識別情報と「患者氏名」というテキストとがマッチングされ、このようなマッチング情報は保存部120に保存される。
For example, as shown in FIG. 1, when the text "patient name" is recognized from the
本発明においては、OCR部130により、それぞれのセルに含まれるテキストを区分して認識することができる。よって、本発明においては、どのセルにどのテキストが含まれるか、セルの識別情報とそれに対応するテキストとがマッチングされて存在する。このようなマッチング情報は保存部120に保存される。
In the present invention, the
このように、それぞれのセルから認識されたテキストは、それぞれのセルの識別情報とマッチングされて保存され、このようなセルの識別情報には、イメージ1000及びテーブル1100の少なくとも一方に関するセルの位置情報が含まれる。
In this way, the text recognized from each cell is matched with the identification information of each cell and stored, and the identification information of the cell includes position information of the cell with respect to at least one of the
このようなマッチング情報は、OCR部130により、イメージ1000からテキストが認識される過程で生成されるか、又は制御部140の制御の下で生成される。
Such matching information is generated by the
次に、制御部140は、本発明に関連する文字認識システム100の全般的な動作を制御する。制御部140は、人工知能アルゴリズム(又はディープラーニングアルゴリズム)を処理するプロセッサ(又は人工知能プロセッサ、ディープラーニングプロセッサ)を含んでもよい。制御部140は、人工知能アルゴリズムに基づいて、イメージ1000からテーブル1100を認識し、テーブル1100を構成する少なくとも1つのセルを認識することができる。
Next, the
また、制御部140は、人工知能アルゴリズムに基づいて、セルの関係及びセルに含まれるテキストの意味を分析することができる。
In addition, the
さらに、制御部140は、セルの関係及びセルに含まれるテキストの意味に基づいて、OCR部130により認識されたテキストの少なくとも一部を補正することができる。
Additionally, the
ここで、制御部140は、保存部120に保存されたデータセットに基づいて、OCR部130により認識されたテキストを補正することができる。
Here, the
なお、本発明におけるセルとは、テーブルを構成する複数のラインにより規定される長方形(rectangle)のボックスをいう。 A cell in the present invention means a rectangular box defined by a plurality of lines forming a table.
本発明についての説明に先立って、テーブルの構成要素について説明する。本発明における「テーブル」とは、ある内容を所定の形式又は手順で示したものを意味し、表とも命名される。図2を参照してテーブルの構成要素について説明すると、テーブル200は、少なくとも1つのセル(又は空間、領域)210を含む。すなわち、テーブル200は、少なくとも1つのセル210を含み、セル210内に情報を含むように構成される。
Before describing the present invention, the constituent elements of the table will be described. A "table" in the present invention means a representation of certain contents in a predetermined format or procedure, and is also called a table. Referring to FIG. 2 to describe the components of the table, table 200 includes at least one cell (or space, area) 210 . That is, table 200 includes at least one
テーブル200に含まれるセル210は、少なくとも4つの線分(line segment)により規定されるものであってもよい。テーブル200及びテーブル200内に備えられたセルは、長方形状からなる。
すなわち、テーブルに含まれるセルは、4つの線分で囲まれた四角形からなるものであってもよい。本発明における「線分(line segment)」は、ライン(line)又は線の少なくとも一部をいう。各セルを構成する線分は、延びてライン又は線となる。 That is, a cell included in the table may consist of a rectangle surrounded by four line segments. A "line segment" in the present invention refers to a line or at least part of a line. A line segment forming each cell extends to form a line or a line.
このように、1つの四角形状のセルを形成するためには、少なくとも4つの線分a、b、c、dが必要であり、これは、テーブルを構成する2つの水平ライン(horizontal line)(又は行方向のライン、エッジ)201、202及び2つの垂直ライン(vertical line)(又は列方向のライン、エッジ)203、204の少なくとも一部からなるようにしてもよい。より具体的には、長方形状のセルは、2つの水平ライン201、202及び2つの垂直ライン203、204の少なくとも一部が互いに交差して形成されてもよい。
Thus, at least four line segments a, b, c, and d are required to form one square-shaped cell, which is equivalent to the two horizontal lines ( 201 , 202 in the row direction, and at least part of two vertical lines (or lines, edges in the column direction) 203 , 204 . More specifically, a rectangular cell may be formed by at least a portion of two
よって、テーブル200は、少なくとも4つのラインを含み、水平ラインの数、垂直ラインの数、ライン間の間隔、ラインの配列位置によって、セルの数、セルの大きさ、セルの位置などが定義される。 Therefore, the table 200 includes at least four lines, and the number of cells, the size of cells, the positions of cells, etc. are defined by the number of horizontal lines, the number of vertical lines, the spacing between lines, and the arrangement position of the lines. be.
一方、テーブル200を構成する複数のラインは、異なる第1タイプ及び第2タイプのいずれかのタイプに分けられ、これは当該ラインがどの方向に延びたかによって特定される。 On the other hand, the plurality of lines forming the table 200 are classified into either a first type or a second type, which are specified by the direction in which the lines extend.
図示のように、水平方向に延びるライン201、202は第1タイプに定義され、垂直方向に延びるライン203、204は第2タイプに定義される。
As shown, horizontally extending
第1タイプのラインは、水平ライン、横ライン、行ライン、横方向のラインなど、その意味が同一又は類似の用語で多様に命名される。 Lines of the first type are variously named with terms that have the same or similar meanings, such as horizontal lines, horizontal lines, row lines, and horizontal lines.
また、第2タイプのラインは、垂直ライン、縦ライン、列ライン、縦方向のラインなど、その意味が同一又は類似の用語で多様に命名される。 In addition, the second type lines are variously named with terms having the same or similar meanings, such as vertical line, vertical line, column line, and vertical line.
一方、テーブル200に含まれるセルの数、セルの大きさ又はセルの位置などは、横ライン及び縦ラインの数や配置関係などに基づいて様々に変形することができ、セルの結合によっても様々に変形することができる。 Meanwhile, the number of cells included in the table 200, the size of the cells, the positions of the cells, etc., can be variously modified based on the number of horizontal lines and vertical lines, the arrangement relationship, etc., and can be variously changed by combining the cells. can be transformed into
また、本発明におけるテーブルを構成する構成成分は、テーブルを構成するライン(横ライン及び縦ライン)と、テーブルを構成するラインが交差して形成されるコーナー(又は角、頂点)(符号「e、f、g、h」参照)とを含んでもよい。 In addition, the components that make up the table in the present invention are the lines that make up the table (horizontal lines and vertical lines) and the corners (or corners, vertices) formed by the intersection of the lines that make up the table (symbol "e , f, g, h”).
全てのテーブルが少なくとも4つのコーナーを有し、それはテーブルの最外枠に含まれるコーナーであり得る。また、テーブルに含まれるコーナーの数は、テーブルに含まれるセルの数に応じて異なる。 All tables have at least four corners, which may be the corners included in the outermost frame of the table. Also, the number of corners included in the table depends on the number of cells included in the table.
以下、前述した本発明による文字認識システムの構成に基づいて、テーブルを生成する方法についてより具体的に説明する。 Hereinafter, a method for generating a table based on the configuration of the character recognition system according to the present invention will be described in more detail.
図3に示すように、本発明による文字認識方法においては、まず、テーブル1100を含むイメージ1000(図1参照)を受信する過程が行われる(S310)。 As shown in FIG. 3, in the character recognition method according to the present invention, first, a process of receiving an image 1000 (see FIG. 1) including a table 1100 is performed (S310).
前述したように、テーブル1100を含むイメージ1000は、様々なルートで受信することができる。例えば、イメージ1000は、通信部により伝送される方式、スキャン部によりスキャンされる方式、入力部により入力される方式などで受信することができる。
As mentioned above, the
イメージ1000が受信されると、イメージ1000に含まれるテーブル1100からテキストを認識する過程が行われる。
When the
より具体的には、本発明においては、テーブル1100を構成する複数のセルに含まれるテキストを認識する過程が行われる(S320)。このような認識はOCR部130で行われ、OCR部130により、テーブル1100に含まれる情報又は内容が認識される。ここで、テーブル1100に含まれる情報又は内容が認識されるとは、テーブル1100に含まれるテキストが認識されることを意味する。
More specifically, in the present invention, a process of recognizing texts included in a plurality of cells forming the table 1100 is performed (S320). Such recognition is performed by the
OCR部130による認識の結果、テーブル1100に含まれる内容に該当するデータを確保することができる。例えば、OCR部130は、テーブル1100に含まれるテキストを認識し、テーブル1100に含まれる内容に該当するテキスト、例えば「患者氏名」、「住民登録番号」、「診療費(薬剤費)内訳」などのテキストをデータとして確保することができる。OCR部130は、イメージ1000に含まれる各テキスト(又は文字)及びテキストの位置を認識するために訓練されたテキスト認識モデルにより、イメージ1000からテキストを認識することができる。このようなテキスト認識モデルは、人工知能に基づくアルゴリズム(例えば、ディープラーニングアルゴリズム)を含んでもよい。
As a result of recognition by the
図4の(a)に示すように、OCR部130は、テーブル1100からテキストを認識し、図4の(b)に示すように、認識されたテキストは、テキストが含まれるそれぞれのセルの識別情報KEY1、KEY2、KEY3...と共にマッチングされて保存部120に保存される。
As shown in FIG. 4(a),
このように、テーブル1100を構成するセルに対してテキストが認識されると、認識されたテキストの検証を行う過程が行われてもよい。ここで、「検証」とは、それぞれのセルに含まれるテキストが正確に認識されたか否かを確認する過程を意味する。例えば、図4の(a)に示すように、テーブル1100の特定のセル401には「組合負担額」というテキストが含まれるが、図4の(b)に示すように、OCR部130により「粗合負担額」402というテキストが認識されることがある。
As such, when the text is recognized for the cells forming the table 1100, a process of verifying the recognized text may be performed. Here, 'verification' means a process of checking whether the text included in each cell has been correctly recognized. For example, as shown in (a) of FIG. 4, a
この場合、原本資料とは異なる内容が認識(誤認識)されることにより、認識されるデータの信頼度及び正確度の問題が生じる。 In this case, the recognition (erroneous recognition) of the content different from the original document causes problems of the reliability and accuracy of the recognized data.
よって、制御部140は、テーブル1100から認識されたテキストの検証を行うようにしてもよい。この場合、本発明においては、それぞれのセル間の相互位置関係及び意味関係(又は連結関係)に基づいて、検証過程で補正が必要なセルに含まれるテキストの補正を行うようにしてもよい。
Therefore, the
そのために、本発明においては、複数のセルから補正対象セルを特定する過程が行われる(S330)。制御部140は、予め設定された基準に基づいて、複数のセルから少なくとも1つの補正対象セルを特定するようにしてもよい。ここで、予め設定された基準は非常に多様に設定することができ、よって、本発明において、補正対象セルが特定される過程は非常に多様である。
Therefore, in the present invention, a process of identifying a correction target cell from a plurality of cells is performed (S330). The
例えば、制御部140は、テーブル1100を構成する複数のセルに対してテキストが認識されると、テキストの認識が行われた全てのセルの検証を行うようにしてもよい。
For example, when text is recognized in a plurality of cells forming the table 1100, the
この場合、テキストの認識が行われた全てのセルが補正対象セルとしてそれぞれ特定される。 In this case, all cells in which text recognition has been performed are specified as correction target cells.
それとは異なり、制御部140は、テーブル1100を構成する複数のセルのうち、カテゴリーセルに含まれるテキストに対して検証を行うようにしてもよい。
Alternatively, the
この場合、制御部140は、テーブル1100を構成する複数のセルのうち、カテゴリーセルに含まれるテキストのそれぞれを補正対象セルとして特定する。
In this case,
ここで、カテゴリーセルは、キーセルとも命名され、データセル(又はバリューセル)とは区分されるものである。 Here, category cells are also called key cells and are distinguished from data cells (or value cells).
カテゴリーセルは、タイトルセルとも命名され、データセルに含まれるデータ(テキスト)のカテゴリー、種類、所属、特徴などを定義する意味のテキストが含まれるセルとして理解される。 A category cell is also called a title cell, and is understood as a cell containing text that defines the category, type, affiliation, characteristics, etc. of the data (text) contained in the data cell.
カテゴリーは、同一又は類似の性質や意味を基準に分けられるものであり、範疇とも命名される。同一のカテゴリーに属するデータは、同一の意味、同一の種類、又は同一の所属に該当するデータであり得る。 Categories are divided based on the same or similar properties and meanings, and are also called categories. Data belonging to the same category may be data corresponding to the same meaning, the same type, or the same affiliation.
カテゴリーセルには、カテゴリー名又はカテゴリー名に関連するデータが含まれ、データセルには、カテゴリーセルに含まれるカテゴリー名に属するデータが含まれる。ここで、カテゴリー名は範疇名とも命名される。 A category cell contains a category name or data related to the category name, and a data cell contains data belonging to the category name contained in the category cell. Here, the category name is also named category name.
一例として、図4の(a)に示すように、テーブル1100において、「診療,調剤日付(診療期間)」というテキストが含まれる特定のセル412は、カテゴリーセルであり、特定のセル412と同じ列に位置し、日付情報がそれぞれ含まれるセル403は、特定のセル412に関連するデータセルである。
As an example, as shown in FIG. 4A, in the table 1100, a
他の例として、テーブル1100において、「患者氏名」というテキストが含まれる特定のセル411は、カテゴリーセルであり、特定のセル411と同じ行に位置し、名前情報「ホン・ギルドン」が含まれるセル405は、特定のセル411に関連するデータセルである。
As another example, in the table 1100, a
図4に示すように、テーブル1100には、1つ又はそれ以上のカテゴリーセル411、412、413、414、415、416が含まれる。
As shown in FIG. 4, table 1100 includes one or
制御部140は、テーブル1100の構造及びセルに含まれるテキストの意味に基づいて、テーブル1100を構成する複数のセルのタイプを第1タイプ(カテゴリーセルタイプ)及び第2タイプ(データセルタイプ)のいずれかに特定することができる。
Based on the structure of the table 1100 and the meaning of the text contained in the cells, the
また、制御部140は、テーブル1100を構成する複数のセルのうち、カテゴリーセルに含まれるテキストのそれぞれを、補正対象セルとして特定することができる。
Further, the
他の例として、制御部140は、テーブル1100を構成する複数のセルのうち、カテゴリーセルの少なくとも一部を、補正対象セルとして特定することができる。ここで、補正対象セルを特定するための予め設定された基準は、前記複数のセルに含まれるテキストに対する認識率に関連するものであってもよい。制御部140は、カテゴリーセルから抽出されたテキストのうち、テキストの認識及び抽出当時にテキスト認識率が低い特定のセルを、補正対象セルとして特定することができる。
As another example, the
図5に示すように、OCR部130によりそれぞれのセルに対してテキストを認識する場合、それぞれのテキストの認識の信頼度を特定することができる。
As shown in FIG. 5, when text is recognized for each cell by the
このような信頼度は、信頼度スコア(confidence score)又は信頼スコアとも命名される。 Such confidence is also named confidence score or confidence score.
図5に示すように、このような信頼度スコアは、テーブル1100を構成するそれぞれのセル及びセルから認識されたテキストの少なくとも一方とマッチングされて保存部120に保存されてもよい。
As shown in FIG. 5 , such reliability scores may be matched with at least one of each cell constituting the table 1100 and the text recognized from the cell, and stored in the
制御部140は、図5に示すように、テキストの信頼度が予め設定された基準条件を満たすカテゴリーセル(例えば、テキストの信頼度が基準スコア(基準確率など)未満であるセル)を補正対象セルとして特定することができる。図5によれば、信頼スコアが1に近いほど、認識されたテキストが正確に認識された確率が高く、信頼スコアが0に近いほど、認識されたテキストが正確に認識された確率が低いことを意味する。
As shown in FIG. 5, the
本発明において、制御部140は、テキストが正確に認識された確率が低いセルに含まれるテキストの補正を行うことにより、データ処理の演算量を低減し、テーブル1100に含まれる情報を正確に抽出することができる。このように、制御部140は、認識された全てのテキストを補正対象テキストとして特定するのではなく、信頼度に基づいてテキストが正確に認識された確率が低いテキストを補正対象テキストとして特定する。よって、制御部140は、補正対象テキストとして特定されたテキストに対してのみ本発明による補正を行うので、全てのテキストに対して補正を行う場合より、データ処理の演算量を低減することができる。
In the present invention, the
例えば、予め設定された基準条件が、テキストの信頼スコアが0.5未満であるセルを補正するように設定された場合、制御部140は、図5において、「KEY7」に該当するセルを補正対象セルとして特定する。この場合、セル「KEY7」に含まれる「(1)粗合負担額」に該当するテキストの補正を行う。
For example, when the preset reference condition is set to correct a cell whose text confidence score is less than 0.5, the
このように、様々な方法又は基準に基づいて補正対象セルが特定されると、制御部140は、テーブル1100に含まれる複数のセルのうち補正対象セルに関連する少なくとも1つの関連セル及びそれに含まれるコンテンツ(テキスト)を用いて、補正対象セルに含まれるテキストの補正を行うことができる。
In this way, when the correction target cell is specified based on various methods or criteria, the
そのために、本発明においては、テーブル1100に含まれる複数のセルから補正対象セルに関連する関連セルを特定する過程が行われる(S340)。 To this end, in the present invention, a process of identifying related cells related to the correction target cell from a plurality of cells included in the table 1100 is performed (S340).
以下、説明の便宜上、補正対象セルが図6Aに示す「(1)組合負担額」というテキストが含まれる特定のカテゴリーセル601であると仮定して説明する。以下の説明は、全てのカテゴリーセルに対して共通に適用することができる。
For convenience of explanation, the following description assumes that the cell to be corrected is the
図4、図6A及び図6Bに示すように、イメージ1000において、特定のカテゴリーセル601に「(1)組合負担額」に該当するテキストが含まれるが、図5において説明したように、OCR認識エラーにより「(1)粗合負担額」というテキストが認識されることがある。よって、制御部140は、誤って認識されたテキストが含まれる特定のカテゴリーセル601及び特定のカテゴリーセル601に関連する少なくとも1つの関連セルを用いて、誤って認識されたテキスト(例えば、(1)粗合負担額)の補正を行うことができる。
As shown in FIGS. 4, 6A, and 6B, in the
制御部140は、補正対象セル601を基準として、少なくとも1つの関連セルを特定することができる。
The
制御部140は、補正対象セル601に含まれるテキストの意味及び補正対象セル601の位置の少なくとも一方に基づいて、関連セルを特定することができる。
The
ここで、補正対象セル601の関連セルは、カテゴリーセルであってもよい。制御部140は、テーブル1100に含まれるカテゴリーセル及びデータセルのうち、カテゴリーセルのみを補正対象セル601の関連セルとして特定することができる。
Here, the related cell of the
また、制御部140は、カテゴリーセルのうち、意味的に補正対象セル601に関連するテキストが含まれるカテゴリーセルを関連セルとして特定するか、又は位置的に補正対象セル601に隣接するカテゴリーセルを関連セルとして特定することができる。
In addition, the
制御部140は、補正対象セル601に関連するセルを特定する際に、以下のケースのいずれかに基づいて関連セルを特定することができる。
When identifying a cell related to the
第1ケースとして、制御部140は、意味的に補正対象セル601に関連するテキストが含まれるカテゴリーセルを関連セルとして特定することができる。
As a first case, the
また、第2ケースとして、制御部140は、位置的に補正対象セル601に関連するカテゴリーセルを関連セルとして特定することができる。
Also, as a second case, the
さらに、第3ケースとして、制御部140は、第1ケースと第2ケースとを組み合わせ、意味的に補正対象セル601に関連するテキストが含まれるカテゴリーセルを関連セルとして特定し、かつ位置的に補正対象セル601に関連するカテゴリーセルを関連セルとして特定することができる。第3ケース、第1ケース及び第2ケースにおいて関連セルとして特定されたセルの全てを補正対象セル601の関連セルとして特定することができる。
Furthermore, as a third case, the
以下、第1ケースの具体的な例として、補正対象セル601に含まれるテキストの意味に基づいて関連セルを特定する方法について説明する。
Hereinafter, as a specific example of the first case, a method of specifying related cells based on the meaning of the text included in the
まず、補正対象セル601に含まれるテキストの意味に基づいて関連セルを特定する方法について説明すると、制御部140は、補正対象セル601に含まれるテキストに関連する意味に該当するテキストが含まれる少なくとも1つのカテゴリーセルを関連セルとして特定することができる。
First, the method of identifying related cells based on the meaning of the text included in the
制御部140は、人工知能アルゴリズムに基づいて、補正対象セル601に含まれるテキストの意味及び他のカテゴリーセルに含まれるテキストの意味を分析し、互いに関連する意味を有するテキストが含まれる少なくとも1つのカテゴリーセルを関連セルとして特定することができる。
The
補正対象セル601に関連する意味を有するテキストは、補正対象セル601に含まれるテキストの上位概念又は下位概念の意味を有するテキストであってもよい。
The text having a meaning related to the
制御部140は、カテゴリーセルに対して補正対象セル601及び関連セルを特定するので、カテゴリーセルの特性上、補正対象セル601は、関連セルに対して上位概念又は下位概念に該当する意味を有するテキストを含む。例えば、補正対象セル601と関連セルとは、同一又は関連するカテゴリー(種類)に該当する意味を有するテキストで構成される。
Since the
例えば、図6Aに示すように、第1カテゴリーセル611に含まれるテキスト(「診療費(薬剤費)内訳」)は、第2カテゴリーセル612(「総額(1)+(2)+(3)」)、第3カテゴリーセル613(「給与」)、第4カテゴリーセル615(「(2)患者負担額」)、第5カテゴリーセル618(「患者負担総額(2)+(3)」)、第6カテゴリーセル601(補正対象セル、「(1)組合負担額」、OCR認識時には「(1)粗合負担額」として認識される)、第7カテゴリーセル617(「(3)患者負担額」)、第8カテゴリーセル616(「非給与」)に含まれるテキストに対する上位概念の意味を有する。 For example, as shown in FIG. 6A, the text contained in the first category cell 611 (“Medical Expenses (Drug Expenses) Details”) is the text in the second category cell 612 (“Total (1)+(2)+(3) ”), third category cell 613 (“salary”), fourth category cell 615 (“(2) patient burden”), fifth category cell 618 (“total patient burden (2) + (3)”), Sixth category cell 601 (correction target cell, ``(1) Association burden'', recognized as ``(1) Total burden'' at the time of OCR recognition), Seventh category cell 617 (``(3) Patient burden ”), which has a broader meaning for the text contained in the eighth category cell 616 (“Non-Salary”).
また、第1カテゴリーセル611に対して下位概念のカテゴリーセルは、他のカテゴリーセルに対しては上位概念のカテゴリーセルでもある。例えば、第3カテゴリーセル613に含まれるテキスト「給与」は、第1カテゴリーセル611に含まれるテキスト「診療費(薬剤費)内訳」に対しては下位概念であり、第4カテゴリーセル615に含まれるテキスト「(2)患者負担額」及び第6カテゴリーセル601(補正対象セル)に含まれるテキスト「(1)組合負担額」(OCR認識時には「(1)粗合負担額」として認識される)に対しては上位概念である。
Also, the category cells of the lower concept with respect to the
一方、制御部140は、カテゴリーセルのうち、意味的に補正対象セル601に関連するテキストが含まれるカテゴリーセルを関連セルとして特定することができ、より具体的には、補正対象セル601に含まれるテキストの上位概念又は下位概念の意味を有するテキストが含まれるカテゴリーセルを関連セルとして特定することができる。
On the other hand, the
第1ケースにおいて、補正対象セル601の関連セルは、補正対象セル601の上位概念のテキストが含まれる第1カテゴリーセル611(「診療費(薬剤費)内訳」)及び第3カテゴリーセル613(「給与」)に決定される。
In the first case, the related cells of the
以下、第2ケースの具体的な例として、位置的に補正対象セル601に関連するカテゴリーセルを関連セルとして特定する方法について説明する。より具体的には、制御部140は、テーブル1100の特性を考慮して、補正対象セル601と予め設定された位置関係(又は配列関係)を有するカテゴリーセルを、補正対象セル601に含まれるテキストの意味に関連するカテゴリーセル、すなわち関連セルとして判断することができる。
Hereinafter, as a specific example of the second case, a method of specifying category cells that are positionally related to the
ここで、予め設定された位置関係は、補正対象セル601に隣接して位置することを意味するものであってもよい。例えば、第2カテゴリーセル612(「総額(1)+(2)+(3)」)、第3カテゴリーセル613(「給与」)、第4カテゴリーセル615(「(2)患者負担額」)及び特定のデータセル622は、補正対象セル601に隣接して位置するものであり、補正対象セル601と予め設定された位置関係を有するといえる。
Here, the preset positional relationship may mean being positioned adjacent to the
このように、補正対象セル601と予め設定された位置関係を有するセルは、補正対象セル601を基準にして補正対象セル601と列方向a又は行方向bに並んで位置し、補正対象セル601に隣接して位置するセルに該当するものである。
In this way, the cells having a preset positional relationship with the
ここで、補正対象セル601の列方向aに並んで位置するセルは、図6Aの符号621、611、613、601、622に該当するセルであり、補正対象セル601の行方向bに並んで位置するセルは、図6Aの符号641、642、612、601、615、617、618、643、644、645に該当するセルである。
Here, the cells aligned in the column direction a of the
一方、制御部140は、カテゴリーセルのみを補正対象セル601の関連セルとして特定するので、前述した予め設定された位置関係を有するセル(第2カテゴリーセル612(「総額(1)+(2)+(3)」)、第3カテゴリーセル613(「給与」)、第4カテゴリーセル615(「(2)患者負担額」)及び特定のデータセル622)のうち特定のデータセル622は関連セルから除外される。
On the other hand, since the
その結果、制御部140は、図6Bに示すように、予め設定された位置関係を有するセルから、カテゴリーセルに該当する第2カテゴリーセル612(「総額(1)+(2)+(3)」)、第3カテゴリーセル613(「給与」)、第4カテゴリーセル615(「(2)患者負担額」)を関連セルとして特定することができる。
As a result, as shown in FIG. 6B, the
第2ケースによれば、補正対象セル601の関連セルとして、第2カテゴリーセル612(「総額(1)+(2)+(3)」)、第3カテゴリーセル613(「給与」)、第4カテゴリーセル615(「(2)患者負担額」)が特定される。
According to the second case, as related cells of the
一方、制御部140は、補正対象セル601と位置的関係性を有する関連セルを特定するために、補正対象セル601のコーナー(頂点)の中央値をテーブル1100又はイメージ1000上での補正対象セル601の位置として特定し、当該位置を基準として、予め設定された距離以内に位置する中央値を有するカテゴリーセル612、613、615を関連セル612、613、615として特定することができる。
On the other hand, in order to specify related cells having a positional relationship with the
ここで、予め設定された距離は、L2距離情報に基づくものであってもよく、L2距離情報は、ユークリッド距離(Euclidean distance)情報ともいえる。 Here, the preset distance may be based on L2 distance information, and the L2 distance information can also be said to be Euclidean distance information.
このように、制御部140は、テーブル1100において、左、右、上、下方向毎に、補正対象セル601のコーナー(頂点)の中央値からそれぞれ予め設定された距離以内に位置する中央値を有するカテゴリーセルが存在するか否かを確認することができる。また、確認の結果、予め設定された距離以内に位置する中央値を有するカテゴリーセルが存在する場合、それを関連セルとして特定することができる。
In this way, the
前述したように、制御部140は、第1ケース又は第2ケースによって、補正対象セル601に関連する関連セルを特定することができる。
As described above, the
また、制御部140は、第1ケースにより特定された関連セル及び第2ケースにより特定された関連セルの全てを、補正対象セル601の関連セルとして特定することができる。この場合は前述した第3ケースに該当する。
Also, the
前述したように、制御部140は、テーブル1100に含まれるカテゴリーセルのうち、第1ケースにより、意味的に補正対象セル601に関連するテキストが含まれるカテゴリーセルを関連セルとして特定し、また、第2ケースにより、位置的に補正対象セル601に隣接するカテゴリーセルを関連セルとして特定することができる。その結果、補正対象セル601の関連セルは、図6A及び図6Bに示すように、第1カテゴリーセル611(「診療費(薬剤費)内訳」)、第2カテゴリーセル612(「総額(1)+(2)+(3)」)、第3カテゴリーセル613(「給与」)、第4カテゴリーセル615(「(2)患者負担額」)となる。
As described above, the
ここで、少なくとも1つのカテゴリーセル(例えば、第3カテゴリーセル613(「給与」)は、意味的及び位置的に重複して関連セルとして特定される。 Here, at least one category cell (eg, the third category cell 613 ("salary") is semantically and positionally redundant and identified as a related cell.
補正対象セル601の関連セルとして特定されたカテゴリーセル611、612、613、615は、「関連セル」とも命名されてもよいことは言うまでもなく、同一の符号を用いる。
The
以下では、第3ケースの例示として、意味的関係及び位置的関係の両方を考慮して特定された関連セルを用いて補正対象セル601に含まれるテキストの補正を行う方法を例に挙げて説明する。
In the following, as an example of the third case, a method of correcting the text contained in the
前述したように、第3ケースにより、補正対象セル601及び少なくとも1つの関連セルが特定された場合、制御部140は、図6Cに示すように、補正対象セル601及び関連セル611、612、613、615に含まれるテキストを用いて補正対象セル601の埋め込み(embedding)を行って計算(又は算出、導出)された密ベクトル(dense vector)を、補正対象セル601の補正に活用することができる。本発明においては、補正対象セル及び関連セルに含まれるテキスト間の関係性を示すために、補正対象セル及び関連セルに含まれるテキストの埋め込みを行い、補正対象セル及び関連セルに含まれるテキストをベクトルで示すことができる。
As described above, when the
ここで、埋め込みは、埋め込みの対象となる情報をベクトルで表現する方法であり、本発明において、制御部140は、埋め込みにより、補正対象セル601及び関連セル611、612、613、615の情報を密ベクトルの形で表現することができる。 Here, embedding is a method of expressing information to be embedded using a vector. It can be expressed in the form of a dense vector.
より具体的には、制御部140は、補正対象セル601及び関連セル611、612、613、615のそれぞれに含まれるテキストを用いて、補正対象セル601を示す密ベクトルを計算することができる。
More specifically, the
また、制御部140は、補正対象セル601及び関連セル611、612、613、615を用いて計算された密ベクトルを、補正対象セル601の補正に用いることができる。
Also, the
本発明において、埋め込みを行うアルゴリズムは特に限定されず、テキストを密ベクトルで表現できるアルゴリズムであれば本発明に活用することができる。例えば、制御部140は、FastText、BERTなどのアルゴリズムに基づいて、補正対象セル601及び関連セル611、612、613、615に含まれるテキストを基に補正対象セル601を示す密ベクトルを計算することができる。
In the present invention, the embedding algorithm is not particularly limited, and any algorithm that can express text as a dense vector can be used in the present invention. For example, the
一方、制御部140は、埋め込みを行うために、図6Cに示すように、補正対象セル601及び関連セル611、612、613、615に含まれるテキスト631、632、633、634、635を並べることができる。ここで、制御部140は、補正対象セル601及び関連セル611、612、613、615に含まれるテキスト631、632、633、634、635の並び順序を、予め設定された基準に基づいて決定することができる。
On the other hand, the
例えば、制御部140は、意味的関連性のある関連セル611、613に含まれるテキスト632、634を補正対象セル601に含まれるテキスト631にさらに近い位置に配置することもでき、逆に、位置的関連性のある関連セル612、613、615に含まれるテキスト633、634、635を補正対象セル601に含まれるテキスト631にさらに近い位置に配置することもできる。
For example, the
また、制御部140は、意味的関連性及び位置的関連性の両方を有する関連セル613に含まれるテキスト634を補正対象セル601に含まれるテキスト631に最も近い位置に配置することもできる。
The
このように、制御部140は、埋め込みにより、補正対象セル601及び関連セル611、612、613、615に含まれるテキストを基に補正対象セル601をベクトルで示すことができる。このように、補正対象セル601及び関連セル611、612、613、615に含まれるテキスト631、632、633、634、635を基に補正対象セル601に対して埋め込みが完了すると、本発明においては、補正対象セルの補正を行う過程が行われる(S350)。
In this manner, the
制御部140は、補正対象セル601及び関連セルに含まれるテキスト631、632、633、634、635を用いて算出された補正対象セルのベクトルを用いて、補正対象セル601に含まれるテキストの補正を行うことができる。ここで、補正対象セル601のベクトルは、前述した密ベクトルに該当するものであり得る。
The
より具体的には、制御部140は、予め特定されたデータセットから、補正対象セル601のベクトルに最も類似したベクトル表現を有する単語(例えば、補正対象ベクトルに最も近い距離に位置する特定のベクトルに対応する単語)を、補正対象テキストとして抽出することができる。
More specifically, the
制御部140は、補正対象セル601及び関連セル611、612、613、615を用いて計算された補正対象セルのベクトルと予め特定されたデータセットに含まれるベクトル間の距離に基づいて、予め特定されたデータセットから補正対象テキストを抽出することができる。ここで、予め特定されたデータセットは、テーブル1100に含まれる複数のセル、特にカテゴリーセルに含まれ得る候補テキスト及びそれに対応するベクトルを含んでもよい。このようなデータセットは、事前に構築されたものであってもよく、データセットに含まれ得る候補テキストは、データセットが構築された後も、さらにデータセットに含まれるか、又はデータセットから除去されることが可能である。
Based on the distance between the vector of the correction target cell calculated using the
また、このようなデータセットには、テーブル1100を構成する複数のセルの位置関係及びそれぞれのセルに含まれる候補テキスト間の意味関係の少なくとも一方に基づいて埋め込みが行われた結果が含まれてもよい。すなわち、データセットには、候補テキストのそれぞれに関するベクトル情報が含まれてもよい。 In addition, such a data set includes the result of embedding based on at least one of the positional relationship of a plurality of cells forming the table 1100 and the semantic relationship between candidate texts contained in each cell. good too. That is, the dataset may include vector information for each of the candidate texts.
制御部140は、データセットから、補正対象セル601のベクトルに最も近い特定のベクトルに対応するテキスト806(図7参照)を、補正対象テキストとして抽出することができる。
The
また、制御部140は、補正対象セル601に含まれるテキストを、補正対象セル601のベクトルに最も近い特定のベクトルに対応するテキスト806(図7参照)に変更することができる。
Also, the
このように、制御部140は、補正対象セル601及び関連セル611、612、613、615に含まれるテキスト801~805を用いて導出された補正対象セル601のベクトルを用いて、データセットから、補正対象テキスト806を抽出することができる。
In this way, the
その結果、補正対象セル601に対して誤って認識されたテキスト「(1)粗合負担額」が「(1)組合負担額」に補正される。
As a result, the erroneously recognized text "(1) Co-payment amount" for the
このように、データセットから補正対象テキスト806が抽出されると、制御部140は、補正対象セル601に含まれるテキスト801を補正対象テキスト806に変更することができる。
When the
一方、前述したように、補正対象テキスト806が抽出されると、制御部140は、抽出された補正対象テキスト806を、イメージ1000に含まれるテーブル1100をデータ化するのに活用することができる。制御部140は、イメージ1000に含まれるテーブル1100のデータ化の結果として得られたデータ上に、補正対象テキスト806を含めることができる。
Meanwhile, as described above, when the
また、制御部140は、テーブル1100をデータ化するだけでなく、データ化の結果として得られたデータを用いて、イメージ1000に含まれるテーブル1100に対応する構造を有するテーブルを生成することができる。
Moreover, the
例えば、制御部140は、図8の(a)に示すように、スキャンされたイメージに含まれるテーブル910から抽出されたデータの少なくとも一部に該当するテキスト930(「撰沢診療科以外」)にエラーがある場合、前述した方法で補正を行うことにより、図8の(b)に示すように、補正されたテキスト940(「選択診療料以外」)が含まれるデータを確保することができる。また、必要に応じて、補正されたテキスト940が含まれるテーブル920を生成することができ、このようなテーブル920は、スキャンの対象となったテーブル910と同じ内容で構成される。
For example, as shown in (a) of FIG. 8, the
前述したように、本発明による文字認識方法及び文字認識システムは、イメージに含まれるテーブルからテキストを認識し、認識されたテキストの検証を行うことにより、イメージに含まれるテーブルの内容をより正確にデータ化することができる。 As described above, the character recognition method and character recognition system according to the present invention recognizes text from a table included in an image and verifies the recognized text to more accurately identify the contents of the table included in the image. It can be converted into data.
より具体的には、本発明による文字認識方法及び文字認識システムは、イメージに含まれるテーブルから、テーブルに含まれるテキストが誤って認識された場合、それを補正することにより、イメージに含まれるテーブルの内容をより正確にデータ化することができる。そのために、本発明においては、テーブルを構成するセルの配置関係、セルに含まれるテキストの意味関係を考慮して、補正の対象となったセルに含まれるテキストを補正することにより、イメージに含まれるテーブルの内容をそのままデータ化することのできる、正確度の高い文字認識方法及びシステムを提供することができる。その結果、本発明による文字認識方法及びシステムは、イメージに含まれるテーブルと同じ内容を含むテーブルを生成することができる。 More specifically, the character recognition method and the character recognition system according to the present invention correct the text contained in the table contained in the image when the text contained in the table is erroneously recognized from the table contained in the image. can be converted into data more accurately. For this purpose, in the present invention, the arrangement of cells constituting a table and the semantic relation of text contained in the cells are taken into consideration, and the text contained in the cells to be corrected is corrected so that the text contained in the image is corrected. It is possible to provide a highly accurate character recognition method and system that can convert the contents of a table stored in the table into data as they are. As a result, the character recognition method and system according to the present invention can generate a table containing the same content as the table contained in the image.
また、本発明による文字認識方法及び文字認識システムは、テキスト認識率が低い特定のセルに対してのみ補正を行うことにより、イメージに含まれるテーブルの内容を正確にデータ化しながらも、データ処理量を最小限に抑えることができる。 In addition, the character recognition method and character recognition system according to the present invention can reduce the amount of data processing while accurately converting the contents of a table included in an image into data by correcting only specific cells with a low text recognition rate. can be minimized.
一方、前述した本発明は、コンピュータで1つ以上のプロセスにより実行され、コンピュータ可読媒体(又は記録媒体)に格納可能なプログラムとして実現することができる。 On the other hand, the present invention described above can be implemented as a program that is executed by one or more processes on a computer and can be stored in a computer-readable medium (or recording medium).
また、前述した本発明は、プログラム記録媒体にコンピュータ可読コード又はコマンドとして実現することができる。すなわち、本発明は、プログラムの形態で提供することができる。 Also, the present invention described above can be implemented as computer readable codes or commands on a program recording medium. That is, the present invention can be provided in the form of a program.
一方、コンピュータ可読媒体は、コンピュータシステムにより読み取り可能なデータが記録されるあらゆる種類の記録装置を含む。コンピュータ可読媒体の例としては、HDD(Hard Disk Drive)、SSD(Solid State Disk)、SDD(Silicon Disk Drive)、ROM、RAM、CD-ROM、磁気テープ、フロッピーディスク、光データ記憶装置などが挙げられる。 A computer-readable medium, on the other hand, includes any type of recording device on which data readable by a computer system is recorded. Examples of computer-readable media include HDDs (Hard Disk Drives), SSDs (Solid State Disks), SDDs (Silicon Disk Drives), ROMs, RAMs, CD-ROMs, magnetic tapes, floppy disks, optical data storage devices, and the like. be done.
また、コンピュータ可読媒体は、ストレージを含み、電子機器が通信によりアクセスできるサーバ又はクラウドストレージであり得る。この場合、コンピュータは、有線又は無線通信により、サーバ又はクラウドストレージから本発明によるプログラムをダウンロードすることができる。 Computer-readable media also includes storage, which may be a server or cloud storage communicatively accessible by the electronic device. In this case, the computer can download the program according to the present invention from a server or cloud storage via wired or wireless communication.
さらに、本発明において、前述したコンピュータは、プロセッサ、すなわち中央処理装置(Central Processing Unit,CPU)が搭載された電子機器であり、その種類は特に限定されない。 Furthermore, in the present invention, the aforementioned computer is an electronic device equipped with a processor, that is, a central processing unit (CPU), and its type is not particularly limited.
一方、本発明の詳細な説明は例示的なものであり、あらゆる面で制限的に解釈されてはならない。本発明の範囲は添付の特許請求の範囲の合理的解釈により定められるべきであり、本発明の等価的範囲内でのあらゆる変更が本発明の範囲に含まれる。 On the other hand, the detailed description of the present invention is illustrative and should not be construed as restrictive in any aspect. The scope of the invention should be determined by reasonable interpretation of the appended claims, and all changes that come within the equivalent scope of the invention are included in the scope of the invention.
100 文字認識システム
110 受信部
120 保存部
130 OCR部
140 制御部
150 外部サーバ
151 クラウドサバー
152 データベース(DB)
200 テーブル
201、202 水平ライン
203、204 垂直ライン
210 セル
1000 イメージ
1100 テーブル
100
200 table 201, 202
Claims (14)
前記テーブルを構成する複数のセルに含まれるテキストを認識するステップと、
予め設定された基準に基づいて、前記複数のセルから補正対象セルを特定するステップと、
前記複数のセルから前記補正対象セルに関連する少なくとも1つの関連セルを特定するステップと、
前記補正対象セル及び前記関連セルに含まれるテキストを用いて算出された前記補正対象セルのベクトルを用いて、前記補正対象セルに含まれるテキストの補正を行うステップと、を含むことを特徴とする文字認識方法。 receiving an image containing a table;
recognizing text contained in a plurality of cells forming the table;
identifying a correction target cell from the plurality of cells based on preset criteria;
identifying at least one related cell related to the correction target cell from the plurality of cells;
and a step of correcting the text contained in the correction target cell using the vector of the correction target cell calculated using the text contained in the correction target cell and the related cell. character recognition method.
前記補正対象セルに含まれるテキストの意味及び前記補正対象セルの位置の少なくとも一方に基づいて、前記関連セルを特定することを特徴とする請求項1に記載の文字認識方法。 In the step of identifying related cells,
2. The character recognition method according to claim 1, wherein the related cell is specified based on at least one of the meaning of the text included in the correction target cell and the position of the correction target cell.
前記関連セルを特定するステップにおいては、
前記カテゴリーセルのうち、前記補正対象セルに含まれるテキストの意味及び前記補正対象セルの位置の少なくとも一方に関連する特定のカテゴリーセルを、前記関連セルとして特定することを特徴とする請求項2に記載の文字認識方法。 at least a portion of the plurality of cells are identified as category cells and another portion are identified as data cells containing data corresponding to at least one of the category cells;
In the step of identifying related cells,
3. The method according to claim 2, wherein, among the category cells, a specific category cell related to at least one of the meaning of the text included in the correction target cell and the position of the correction target cell is specified as the related cell. Described character recognition method.
前記補正対象セルに含まれるテキストの上位概念又は下位概念の意味を有するテキストが含まれることを特徴とする請求項3に記載の文字認識方法。 In a specific category cell related to the meaning of the text contained in the correction target cell,
4. The character recognition method according to claim 3, wherein text having a meaning of a higher concept or a lower concept of the text included in the correction target cell is included.
前記補正対象セルを基準にして、前記補正対象セルと列方向又は行方向に並んで位置することを特徴とする請求項4に記載の文字認識方法。 A specific category cell related to the meaning of the text contained in the correction target cell is
5. The character recognition method according to claim 4, wherein the correction target cell is aligned with the correction target cell in a column direction or a row direction with the correction target cell as a reference.
前記補正対象セルのベクトルと予め特定されたデータセットに含まれるベクトル間の距離に基づいて、前記補正対象セルに含まれるテキストの補正を行うことを特徴とする請求項1に記載の文字認識方法。 In the correcting step,
2. The character recognition method according to claim 1, wherein the text included in the correction target cell is corrected based on the distance between the vector of the correction target cell and the vector included in a data set specified in advance. .
前記補正対象セルのベクトルと予め特定されたデータセットに含まれるベクトル間の距離に基づいて、前記データセットから補正対象テキストを抽出するステップと、
前記補正対象セルに含まれるテキストを前記補正対象テキストに変更するステップと、を含むことを特徴とする請求項7に記載の文字認識方法。 The correcting step includes:
extracting text to be corrected from the data set based on the distance between the vector of the cell to be corrected and a vector included in a previously specified data set;
8. The character recognition method according to claim 7, further comprising the step of changing the text included in the correction target cell to the correction target text.
前記テーブルを構成する前記複数のセルに含まれ得る候補テキスト、並びに、
前記複数のセルの位置関係及び前記候補テキスト間の意味関係の少なくとも一方に基づいて埋め込みが行われた結果に該当する、前記候補テキストのそれぞれに関するベクトル情報が含まれることを特徴とする請求項8に記載の文字認識方法。 Said data set includes:
Candidate texts that can be included in the plurality of cells constituting the table; and
8. Vector information about each of said candidate texts corresponding to a result of embedding based on at least one of a positional relationship of said plurality of cells and a semantic relationship between said candidate texts is included. The character recognition method described in .
前記データセットから、前記補正対象セルのベクトルに最も近いベクトルを特定し、
前記最も近いベクトルに対応するテキストを前記補正対象テキストとして抽出することを特徴とする請求項9に記載の文字認識方法。 In the correcting step,
Identifying the vector closest to the vector of the correction target cell from the data set,
10. The character recognition method according to claim 9, wherein the text corresponding to said closest vector is extracted as said text to be corrected.
テーブルを含むイメージを受信する受信部と、
前記イメージに含まれる前記テーブルを構成する複数のセルに含まれるテキストを認識する制御部と、を含み、
前記制御部は、
予め設定された基準に基づいて、前記複数のセルから補正対象セルを特定し、
前記複数のセルから前記補正対象セルに関連する少なくとも1つの関連セルを特定し、
前記補正対象セル及び前記関連セルに含まれるテキストを用いて算出された前記補正対象セルのベクトルを用いて、前記補正対象セルに含まれるテキストの補正を行うことを特徴とする文字認識システム。 a storage unit;
a receiver for receiving an image containing a table;
a control unit for recognizing text contained in a plurality of cells forming the table contained in the image;
The control unit
Identifying a correction target cell from the plurality of cells based on preset criteria;
identifying at least one related cell related to the correction target cell from the plurality of cells;
A character recognition system, wherein the text included in the correction target cell is corrected using a vector of the correction target cell calculated using the text included in the correction target cell and the related cell.
命令が実行されると、
テーブルを含むイメージを受信するステップと、
前記テーブルを構成する複数のセルに含まれるテキストを認識するステップと、
予め設定された基準に基づいて、前記複数のセルから補正対象セルを特定するステップと、
前記複数のセルから前記補正対象セルに関連する少なくとも1つの関連セルを特定するステップと、
前記補正対象セル及び前記関連セルに含まれるテキストを用いて算出された前記補正対象セルのベクトルを用いて、前記補正対象セルに含まれるテキストの補正を行うステップと、をコンピュータで実行することを特徴とするコンピュータプログラム。 A computer program comprising a plurality of instructions,
When the instruction is executed
receiving an image containing a table;
recognizing text contained in a plurality of cells forming the table;
identifying a correction target cell from the plurality of cells based on preset criteria;
identifying at least one related cell related to the correction target cell from the plurality of cells;
and a computer executing a step of correcting the text contained in the correction target cell using the vector of the correction target cell calculated using the text contained in the correction target cell and the related cell. A computer program characterized by:
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2021-0094843 | 2021-07-20 | ||
KR1020210094843A KR20230013849A (en) | 2021-07-20 | 2021-07-20 | Character recognition method and system robust to errors of character recognition that recognize information included in tables |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023016031A true JP2023016031A (en) | 2023-02-01 |
JP7398526B2 JP7398526B2 (en) | 2023-12-14 |
Family
ID=85101725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022115078A Active JP7398526B2 (en) | 2021-07-20 | 2022-07-19 | Character recognition method and character recognition system for recognizing information contained in a table |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7398526B2 (en) |
KR (1) | KR20230013849A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117523590A (en) * | 2023-11-10 | 2024-02-06 | 广州方舟信息科技有限公司 | Method, device, equipment and storage medium for checking manufacturer name |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010003155A (en) * | 2008-06-20 | 2010-01-07 | Fujitsu Frontech Ltd | Form recognition apparatus, method, database generation apparatus, method, and program |
JP2018042067A (en) * | 2016-09-06 | 2018-03-15 | 株式会社リコー | Image processing system, image processing method, and information processing device |
JP2021056750A (en) * | 2019-09-30 | 2021-04-08 | キヤノン株式会社 | Data input support device, data input support method and program |
-
2021
- 2021-07-20 KR KR1020210094843A patent/KR20230013849A/en not_active Application Discontinuation
-
2022
- 2022-07-19 JP JP2022115078A patent/JP7398526B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010003155A (en) * | 2008-06-20 | 2010-01-07 | Fujitsu Frontech Ltd | Form recognition apparatus, method, database generation apparatus, method, and program |
JP2018042067A (en) * | 2016-09-06 | 2018-03-15 | 株式会社リコー | Image processing system, image processing method, and information processing device |
JP2021056750A (en) * | 2019-09-30 | 2021-04-08 | キヤノン株式会社 | Data input support device, data input support method and program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117523590A (en) * | 2023-11-10 | 2024-02-06 | 广州方舟信息科技有限公司 | Method, device, equipment and storage medium for checking manufacturer name |
Also Published As
Publication number | Publication date |
---|---|
KR20230013849A (en) | 2023-01-27 |
JP7398526B2 (en) | 2023-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5710624B2 (en) | Method and system for extraction | |
JP4750802B2 (en) | Form processing program and form processing apparatus | |
JP2004139484A (en) | Form processing device, program for implementing it, and program for creating form format | |
EP4026047A1 (en) | Automated information extraction and enrichment in pathology report using natural language processing | |
WO2021125206A1 (en) | Image analysis device, image analysis method, and program | |
CN112509661B (en) | Methods, computing devices, and media for identifying physical examination reports | |
CN114912887B (en) | Clinical data input method and device based on electronic medical record | |
JP2023016031A (en) | Character recognition method for recognizing information contained in table and character recognition system | |
Wick et al. | Staff, symbol and melody detection of medieval manuscripts written in square notation using deep fully convolutional networks | |
EP4323976A2 (en) | Inferring structure information from table images | |
KR20220133434A (en) | Method and system for recognizing tables | |
WO2021131324A1 (en) | Information processing device, information processing method, and program | |
Tomovic et al. | Aligning document layouts extracted with different OCR engines with clustering approach | |
AU2015204339A1 (en) | Information processing apparatus and information processing program | |
KR102502422B1 (en) | Method and apparatus for extracting information via artificail intelligence from electronic documents | |
CN113283231B (en) | Method for acquiring signature bit, setting system, signature system and storage medium | |
CN115294593A (en) | Image information extraction method and device, computer equipment and storage medium | |
JP7453731B2 (en) | Method and system for extracting information from semi-structured documents | |
KR20220120222A (en) | Table gnerating method and system | |
CN116502625B (en) | Resume analysis method and system | |
JP7420578B2 (en) | Form sorting system, form sorting method, and program | |
US20230053464A1 (en) | Systems, Methods, and Devices for Automatically Converting Explanation of Benefits (EOB) Printable Documents into Electronic Format using Artificial Intelligence Techniques | |
KR20220120221A (en) | Table gnerating method and system | |
KR20220132213A (en) | Methods and systems for recognizing tables | |
KR20220142901A (en) | Method and system for extracting information from semi-structured documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230606 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20230817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230906 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231204 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7398526 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |