JP7279381B2 - Information processing device and information processing program - Google Patents
Information processing device and information processing program Download PDFInfo
- Publication number
- JP7279381B2 JP7279381B2 JP2019016251A JP2019016251A JP7279381B2 JP 7279381 B2 JP7279381 B2 JP 7279381B2 JP 2019016251 A JP2019016251 A JP 2019016251A JP 2019016251 A JP2019016251 A JP 2019016251A JP 7279381 B2 JP7279381 B2 JP 7279381B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- unit
- candidates
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
本発明は、情報処理装置及び情報処理プログラムに関する。 The present invention relates to an information processing device and an information processing program.
特許文献1には、情報を複数保持する情報保持手段中から所定の情報を検索する情報検索装置において、文書画像入力手段と、文字認識手段と、文字認識の確信度から正規化レベルを決定する手段と、前記正規化レベルに基づき代表文字に置き換える正規化手段と、前記情報保持手段中から類似したテキストを含む情報を検索する検索手段と、前記検索結果を出力する検索結果出力手段とを備えたことを特徴とする情報検索装置が開示されている。 In Patent Document 1, in an information retrieval device for retrieving predetermined information from information holding means holding a plurality of information, a document image input means, a character recognition means, and a normalization level is determined from the certainty of character recognition. normalization means for replacing representative characters based on the normalization level; search means for searching information containing similar text from the information holding means; and search result output means for outputting the search results. An information retrieval device characterized by the following is disclosed.
特許文献2には、文字列から所与の辞書に含まれる特定用語を検索する情報処理装置であって、n-gram方式を利用して前記所与の辞書に対して前記文字列の部分文字列の検索を行い、前記所与の辞書から該文字列に含まれる1以上の特定用語候補を抽出する抽出手段と、前記1以上の特定用語候補の各々に対して、DPマッチング方式を利用して特定用語候補と該特定用語候補に対応する前記文字列内の部分文字列との編集距離を導出する導出手段と、前記編集距離が所定の閾値より短い前記1以上の特定用語候補に対応する前記文字列内の部分文字列を出力する出力手段と、を有することを特徴とする情報処理装置が開示されている。
本発明は、予め定めた参照リストを用いずに、文字認識処理によって画像から認識された文字列から画像に含まれる文字列を特定する場合と比較して、精度良く画像に含まれる文字列を特定することができる情報処理装置及び情報処理プログラムを提供することを目的とする。 According to the present invention, a character string included in an image can be identified with high accuracy as compared with the case of identifying the character string included in the image from the character string recognized from the image by character recognition processing without using a predetermined reference list. An object of the present invention is to provide an information processing device and an information processing program that can be specified.
第1態様に係る情報処理装置は、文字認識処理によって画像から認識された文字列を取得する取得部と、前記取得部で取得された文字列から、正規表現で表された抽出パターンを用いて文字列候補を抽出する抽出部と、前記文字認識処理が誤認識する誤認識パターンを用いて前記文字列候補を修正する修正部と、予め定めた参照リストを用いて、前記修正部で修正された文字列候補の中から特定した文字列候補を出力する出力部と、を備える。 An information processing apparatus according to a first aspect includes an acquisition unit that acquires a character string recognized from an image by character recognition processing; An extraction unit for extracting a character string candidate, a correction unit for correcting the character string candidate using an erroneous recognition pattern recognized by the character recognition process, and a predetermined reference list that is corrected by the correction unit. an output unit for outputting a character string candidate specified from among the character string candidates obtained.
第2態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記抽出部は、前記誤認識パターンを用いて前記正規表現を修正した修正正規表現で表された修正抽出パターンを用いて前記文字列候補を抽出する。 An information processing apparatus according to a second aspect is the information processing apparatus according to the first aspect, wherein the extraction unit uses a modified extraction pattern represented by a modified regular expression obtained by modifying the regular expression using the misrecognition pattern. to extract the character string candidate.
第3態様に係る情報処理装置は、第1態様又は第2態様に係る情報処理装置において、前記取得部は前記画像を取得し、前記修正部は、特定の文字を対象として前記画像の文字認識処理を行う文字認識処理部と、前記文字認識処理部により認識された文字列と同型の文字列候補である誤認識文字列候補を生成する生成部と、を含み、前記出力部は、前記誤認識文字列候補の中から特定した文字列候補を出力する。 An information processing apparatus according to a third aspect is the information processing apparatus according to the first aspect or the second aspect, wherein the acquisition unit acquires the image, and the correction unit performs character recognition of the image on a specific character. a character recognition processing unit that performs processing; and a generation unit that generates misrecognized character string candidates that are character string candidates of the same type as the character string recognized by the character recognition processing unit. Output the character string candidates specified from among the recognized character string candidates.
第4態様に係る情報処理装置は、第3態様に係る情報処理装置において、前記生成部は、ユーザーによって指定された誤認識パターンを用いて生成した文字列を前記誤認識文字列候補に追加する。 An information processing apparatus according to a fourth aspect is the information processing apparatus according to the third aspect, wherein the generation unit adds a character string generated using an erroneous recognition pattern specified by a user to the erroneously recognized character string candidates. .
第5態様に係る情報処理装置は、第3態様又は第4態様に係る情報処理装置において、前記生成部は、前記抽出パターンで表される文字列候補を除いて前記誤認識文字列候補を生成する。 An information processing apparatus according to a fifth aspect is the information processing apparatus according to the third aspect or the fourth aspect, wherein the generating unit generates the misrecognized character string candidates by excluding the character string candidates represented by the extraction patterns. do.
第6態様に係る情報処理装置は、第3~第5態様の何れかの態様に係る情報処理装置において、前記文字認識処理部は、文字認識の精度を表すスコアを算出し、前記出力部は、前記スコアが予め定めた閾値以上の場合に、前記特定した文字列候補を出力する。 An information processing device according to a sixth aspect is the information processing device according to any one of the third to fifth aspects, wherein the character recognition processing unit calculates a score representing accuracy of character recognition, and the output unit and outputting the identified character string candidate when the score is equal to or greater than a predetermined threshold.
第7態様に係る情報処理装置は、第3~第5態様の何れかの態様に係る情報処理装置において、前記文字認識処理部は、文字認識の精度を表すスコアを算出し、前記出力部は、前記スコアが予め定めた閾値未満の場合に、前記特定した文字列候補を推定文字列候補として出力する。 An information processing device according to a seventh aspect is the information processing device according to any one of the third to fifth aspects, wherein the character recognition processing unit calculates a score representing accuracy of character recognition, and the output unit and outputting the specified character string candidate as an estimated character string candidate when the score is less than a predetermined threshold.
第8態様に係る情報処理装置は、第3~第5態様の何れかの態様に係る情報処理装置において、前記文字認識処理部は、文字認識の精度を表すスコアを算出し、前記出力部は、前記スコアが予め定めた閾値以上で且つ前記特定した文字列候補が複数の場合に、複数の前記特定した文字列候補を推定文字列候補として出力する。 An information processing device according to an eighth aspect is the information processing device according to any one of the third to fifth aspects, wherein the character recognition processing unit calculates a score representing accuracy of character recognition, and the output unit and outputting the plurality of specified character string candidates as estimated character string candidates when the score is equal to or greater than a predetermined threshold value and the number of the specified character string candidates is plural.
第9態様に係る情報処理装置は、第3~第5態様の何れかの態様に係る情報処理装置において、前記文字認識処理部により文字認識された文字列から必要な文字列である必要文字列を抽出する必要文字列抽出部を更に備え、前記生成部は、前記必要文字列抽出部により抽出された前記必要文字列と同型の文字列候補である誤認識文字列候補を生成する。 An information processing device according to a ninth aspect is the information processing device according to any one of the third to fifth aspects, wherein a required character string is a necessary character string from character strings recognized by the character recognition processing unit. and the generation unit generates a misrecognized character string candidate, which is a character string candidate of the same type as the necessary character string extracted by the necessary character string extraction unit.
第10態様に係る情報処理装置は、第1~第5態様の何れかの態様に係る情報処理装置において、前記出力部は、前記参照リストに前記修正部で修正された文字列候補が存在しない場合、前記参照リストに含まれる文字列のうち、前記修正部で修正された文字列候補に近い文字列を推定文字列候補として出力する。 The information processing apparatus according to a tenth aspect is the information processing apparatus according to any one of the first to fifth aspects, wherein the output unit includes a character string candidate corrected by the correction unit that does not exist in the reference list. In this case, out of the character strings included in the reference list, character strings close to the character string candidates corrected by the correction unit are output as estimated character string candidates.
第11態様に係る情報処理装置は、第10態様に係る情報処理装置において、前記出力部は、前記参照リストに含まれる文字列のうち、前記修正部で修正された文字列候補と異なる文字の数が最も少ない文字列を推定文字列候補として出力する。 An information processing apparatus according to an eleventh aspect is the information processing apparatus according to the tenth aspect, wherein the output unit generates a character string that is different from the character string candidate corrected by the correction unit, out of the character strings included in the reference list. Output the character string with the smallest number as the estimated character string candidate.
第12態様に係る情報処理プログラムは、コンピュータを、第1~第11態様の何れか1つの態様に記載の情報処理装置の各部として機能させるための情報処理プログラムである。 An information processing program according to a twelfth aspect is an information processing program for causing a computer to function as each part of the information processing apparatus according to any one of the first to eleventh aspects.
第1及び第12態様によれば、予め定めた参照リストを用いずに、文字認識処理によって画像から認識された文字列から画像に含まれる文字列を特定する場合と比較して、精度良く画像に含まれる文字列を特定することができる、という効果を有する。 According to the first and twelfth aspects, compared to the case of specifying a character string included in an image from a character string recognized from the image by character recognition processing without using a predetermined reference list, the image can be obtained with high accuracy. has the effect of being able to identify the character string contained in .
第2態様によれば、誤認識パターンを用いて正規表現を修正した修正正規表現で表された修正抽出パターンを用いずに文字列候補を抽出する場合と比較して、本来抽出すべき文字列の一部の文字が誤認識された文字列も抽出することができる、という効果を有する。 According to the second aspect, compared to the case of extracting a character string candidate without using a modified extraction pattern represented by a modified regular expression obtained by modifying a regular expression using an erroneously recognized pattern, the character string that should be extracted It is possible to extract a character string in which some of the characters are erroneously recognized.
第3態様によれば、誤認識文字列候補を生成しない場合と比較して、精度良く画像に含まれる文字列を特定することができる、という効果を有する。 According to the third aspect, there is an effect that a character string included in an image can be specified with high accuracy as compared with the case where no erroneously recognized character string candidate is generated.
第4態様によれば、ユーザーによって指定された誤認識パターンを用いずに誤認識文字列候補を生成する場合と比較して、精度良く画像に含まれる文字列を特定することができる、という効果を有する。 According to the fourth aspect, it is possible to specify a character string included in an image with high accuracy as compared with the case of generating incorrectly recognized character string candidates without using an incorrectly recognized pattern specified by the user. have
第5態様によれば、抽出パターンで表される文字列候補を除かずに誤認識文字列候補を生成する場合と比較して、画像に含まれる文字列を特定するまでの時間を短縮することができる、という効果を有する。 According to the fifth aspect, it is possible to shorten the time required to specify a character string included in an image, compared to the case where misrecognized character string candidates are generated without excluding character string candidates represented by extraction patterns. has the effect of being able to
第6態様によれば、文字認識の精度を表すスコアに関係なく特定した文字列候補を出力する場合と比較して、特定した文字列候補が出力されたことについての信頼性が高まる、という効果を有する。 According to the sixth aspect, there is an effect that the reliability of output of the specified character string candidate is increased compared to the case where the specified character string candidate is output regardless of the score representing the accuracy of character recognition. have
第7態様によれば、文字認識の精度を表すスコアに関係なく特定した文字列候補を推定文字列候補として出力する場合と比較して、推定文字列候補として出力されたことについての信頼性が高まる、という効果を有する。 According to the seventh aspect, the reliability of being output as an estimated character string candidate is higher than when the specified character string candidate is output as an estimated character string candidate regardless of the score representing the character recognition accuracy. It has the effect of increasing
第8態様によれば、文字認識の精度を表すスコアに関係なく複数の特定した文字列候補を推定文字列候補として出力する場合と比較して、複数の推定文字列候補として出力されたことについての信頼性が高まる、という効果を有する。 According to the eighth aspect, output as a plurality of estimated character string candidates compared to outputting a plurality of specified character string candidates as estimated character string candidates irrespective of the score representing character recognition accuracy has the effect of increasing the reliability of
第9態様によれば、文字認識された文字列から必要文字列を抽出せずに誤認識文字列候補を生成する場合と比較して、適切に誤認識文字列候補を生成することができる、という効果を有する。 According to the ninth aspect, it is possible to appropriately generate misrecognized character string candidates compared to generating misrecognized character string candidates without extracting necessary character strings from character-recognized character strings. has the effect of
第10態様によれば、参照リストに文字列候補が存在しない場合に何も出力しない場合と比較して、画像に含まれる可能性のある文字列を把握することができる、という効果を有する。 According to the tenth aspect, there is an effect that it is possible to grasp the character strings that may be included in the image, compared to the case where nothing is output when no character string candidate exists in the reference list.
第11態様によれば、参照リストに含まれる文字列と文字列候補との異なる文字の数に関係なく推定文字列候補を特定する場合と比較して、推定文字列候補の信頼性が高まる、という効果を有する。 According to the eleventh aspect, the reliability of the estimated character string candidate is increased compared to the case of specifying the estimated character string candidate regardless of the number of different characters between the character string and the character string candidate included in the reference list. has the effect of
以下、図面を参照して、本発明を実施するための形態例を詳細に説明する。 Embodiments for carrying out the present invention will be described in detail below with reference to the drawings.
(第1実施形態) (First embodiment)
図1は、本実施形態に係る画像形成装置1の構成図である。図1に示すように、画像形成装置1は、スキャナ部2、画像形成部3、操作部4、表示部5、通信部6、記憶部7、及び情報処理装置10を備える。なお、図1では、用紙等の記録媒体を供給する供給機構、記録媒体を搬送する搬送機構、記録媒体を排出する排出機構等の図示を省略している。
FIG. 1 is a configuration diagram of an image forming apparatus 1 according to this embodiment. As shown in FIG. 1, the image forming apparatus 1 includes a
画像形成装置1は、原稿を読み取るスキャン機能、原稿を複写するコピー機能、印刷データを印刷する印刷機能、原稿をファクシミリ送信するファクシミリ送信機能等の複数の機能を有する複合機として機能する。 The image forming apparatus 1 functions as a multifunction device having multiple functions such as a scanning function for reading an original, a copying function for copying an original, a printing function for printing print data, and a facsimile transmission function for facsimile transmission of an original.
スキャナ部2は、画像が形成された紙等の記録媒体を光学的に読み取って読み取り画像を生成し、情報処理装置10に出力する。
The
画像形成部3は、例えば電子写真方式又はインクジェット記録方式等により紙等の記録媒体に画像を形成する機能を有し、情報処理装置10からの指示により画像を記録媒体に形成する。
The
操作部4は、各種操作を受け付ける操作キーを含んで構成される。 The operation unit 4 includes operation keys for receiving various operations.
表示部5は、液晶ディスプレイ等で構成され、例えば画面に指等で触れることで各種操作を受け付けるタッチパネルで構成される。
The
通信部6は、外部装置等とデータ通信を行うためのインターフェースである。
The
記憶部7は、ハードディスク等の不揮発性の記憶装置で構成され、後述する情報処理プログラム等を記憶する。
The
情報処理装置10は、CPU(Central Processing Unit)10A、ROM(Read Only Memory)10B、RAM(Random Access Memory)10C、不揮発性メモリ10D、及び入出力インターフェース(I/O)10Eを備える。そして、CPU10A、ROM10B、RAM10C、不揮発性メモリ10D、及びI/O10Eがバス10Fを介して各々接続されている。I/O10Eには、スキャナ部2、画像形成部3、操作部4、表示部5、通信部6、記憶部7が接続されている。CPU10Aは、記憶部7に記憶された情報処理プログラムを読み込んで実行する。
The
画像形成装置1は、前述したコピー機能等の複合機の基本機能の他に、図面情報抽出機能を有する。図面情報抽出機能は、製造業及び設備・建設業等で使用する図面を読み取り、読み取った図面の画像から、図面に記載されている指定の文字列を図面情報として抽出する機能である。図面に記載されている指定の文字列には、例えば品番、品名、及び版等を含む基本属性、図面に表された製品のスペックを表すスペック情報、材料情報、設計標準書番号等の各種情報を表す文字列が含まれる。図面から抽出した図面情報は、紙等の記録媒体に印刷したり、データファイルとして記憶部7に記憶したり、通信部6を介して外部装置に送信したり、表示部5に表示したりする。
The image forming apparatus 1 has a drawing information extracting function in addition to the basic functions of a multifunction machine such as the above-described copying function. The drawing information extraction function is a function that reads drawings used in the manufacturing industry, equipment/construction industry, etc., and extracts specified character strings described in the drawings from the read drawing images as drawing information. Designated character strings described in drawings include basic attributes including product number, product name, plate, etc., various information such as specification information representing specifications of the product shown in the drawing, material information, design standard number, etc. Contains a string representing The drawing information extracted from the drawing is printed on a recording medium such as paper, stored as a data file in the
図面情報抽出機能が利用されるケースとしては以下のようなケースが挙げられる。例えば図面に記載された文字列が或る技術標準に基づいて記載されている場合において、技術標準が更新されて図面に記載された文字列を修正する必要がある場合に、旧技術標準で記載された文字列を含む図面を探す場合等である。 Examples of cases where the drawing information extraction function is used include the following cases. For example, if the character strings described in the drawings are based on a certain technical standard, and the technical standards are updated and it is necessary to correct the character strings described in the drawings, it is described in the old technical standard For example, when searching for a drawing containing a specified character string.
以下、画像形成装置1が図面情報抽出機能を実行する場合におけるCPU10Aの機能構成について説明する。
The functional configuration of the
図2に示すように、CPU10Aは、機能的には、OCR処理部20、取得部22、抽出部24、修正部26、及び出力部28を備える。
As shown in FIG. 2, the
OCR処理部20は、スキャナ部2が原稿から読み取った画像に対して文字認識処理、すなわちOCR(Optical Character Recognition)処理を実行し、読み取った画像に含まれる文字列を取得部22に出力する。なお、OCR処理部20が実行するOCR処理は、一例としてルールベースのOCR処理である。すなわち、予め定めた規則に基づいて、読み取った画像に含まれる文字列を全て抽出する。
The
取得部22は、OCR処理部20のOCR処理によって画像から認識された文字列を取得する。取得部22は、取得した文字列を修正部26へ出力する。
The
抽出部24は、取得部22で取得された文字列から、正規表現で表された抽出パターンを用いて文字列候補を抽出する。なお、OCR処理部20によるOCR処理によって認識された文字列には、誤認識された文字が含まれる場合が多い。このため、抽出部24は、OCR処理部20のOCR処理で誤認識する誤認識パターンを用いて修正された修正正規表現で表された抽出パターンを用いて文字列候補を抽出する。
The
修正部26は、OCR処理が誤認識する誤認識パターンを用いて、抽出部24が抽出した文字列候補を修正する。
The correcting
具体的には、修正部26は、再認識処理部30及び生成部32を備える。
Specifically, the
再認識処理部30は、特定の文字を対象として画像のOCR処理を再度行う。再認識処理部30は、例えばニューラルネットワーク等の機械学習を用いて画像のOCR処理を実行する。なお、再認識処理部30は、文字認識処理部の一例である。
The
生成部32は、再認識処理部30により認識された文字列候補と同型の文字列候補である誤認識文字列候補を生成する。
The
ここで、誤認識文字列候補とは、再認識処理部30により認識された文字列候補であって、認識された文字と同型であり認識が難しい文字列候補、又は、再認識処理部30により認識された文字列であって、認識された文字が誤っている可能性の高い文字列候補である。なお、以下では、再認識処理部30により認識された文字列も誤認識文字列候補に含まれるものとする。
Here, the erroneously recognized character string candidate is a character string candidate recognized by the
出力部28は、予め定めた参照リストを用いて、修正部26で修正された文字列候補、すなわち生成部32で生成された誤認識文字列候補の中から特定した文字列候補を出力する。
The
次に、図3を参照して、本実施の形態に係る情報処理装置10の作用を説明する。図2に示すように、情報処理プログラム40は記憶部7に記憶されている。CPU10Aが情報処理プログラム40を読み出して実行することにより、図3に示す情報処理が実行される。なお、図3に示す情報処理は、例えば、ユーザーがスキャナ部2に図面をセットし、操作部4を操作して図面情報抽出処理の実行を指示した場合に実行される。
Next, operation of the
ステップS100では、CPU10Aが、スキャナ部2に図面の読み取りを指示し、スキャナ部2が読み取った図面の画像を取得する。
In step S100, the
ステップS102では、CPU10Aが、ステップS100で取得した画像に対してルールベースのOCR処理を実行する。これにより、読み取った画像に含まれる全ての文字列が取得される。また、読み取った画像に含まれる全ての文字列の位置、すなわち画像の中の座標も取得される。OCR処理により認識された文字列は、例えばXML形式の文字列として得られるが、文字列の形式はXML形式に限られるものではない。
In step S102,
ステップS104では、CPU10Aが、ステップS102のOCR処理によって得られた文字列から、ステップS100で取得した画像に含まれる文字列候補を抽出する。具体的には、正規表現で表された抽出パターンを用いて画像に含まれる文字列候補を抽出する。本実施形態では、例えば図2に示すように、正規表現が定義された正規表現情報42が予め記憶部7に記憶されており、この正規表現情報42で定義された正規表現で表される抽出パターンを用いて文字列候補を抽出する。なお、正規表現情報42を予め記憶部7に記憶しておく場合に限らず、通信部6を介して外部装置から正規表現情報42を取得してもよい。
In step S104,
ここで、正規表現とは、文字列の集合を一つの文字列で表現する方法である。そして、正規表現は、図面情報の抽出対象となる図面に含まれ得る文字列に対応したものである。すなわち、記憶部7に予め記憶された正規表現情報42には、図面情報の抽出対象となる図面に含まれ得る文字列に対応した正規表現が定義されている。
Here, a regular expression is a method of expressing a set of character strings with one character string. A regular expression corresponds to a character string that can be included in a drawing from which drawing information is to be extracted. That is, the
例えば、図面情報の抽出対象となる図面に含まれ得る文字列が4個の文字から構成され、先頭の文字が“A”、2番目の文字が“B”、3番目の文字が“C”、4番目の文字が“0”~“9”の10種類の数字の何れかの文字である文字列であるとする。この場合、図面情報の抽出対象となる図面に含まれ得る文字列の正規表現は、“[A][B][C][0-9]”という一つの文字列で表される。この場合、正規表現情報42には、正規表現として“[A][B][C][0-9]”が定義される。なお、正規表現“[A][B][C][0-9]”で表された抽出パターンの文字列は、“ABC0”~“ABC9”までの10パターンとなる。
For example, a character string that can be included in a drawing from which drawing information is to be extracted consists of four characters: the first character is "A", the second character is "B", and the third character is "C". , the fourth character is a character string of any one of 10 types of numerals "0" to "9". In this case, a regular expression of character strings that can be included in a drawing from which drawing information is to be extracted is represented by a single character string “[A][B][C][0-9]”. In this case, the
ところで、ステップS102のOCR処理によって認識された文字列には、誤認識された文字が含まれる場合が多い。このため、上記の例において、正規表現“[A][B][C][0-9]”で表される抽出パターンを用いて文字列候補を抽出したのでは、本来抽出すべき文字列の一部の文字が誤認識された文字列が抽出されなくなってしまう。このため、ステップS104では、OCR処理で誤認識する誤認識パターンを用いて修正された修正正規表現で表された抽出パターンを用いて文字列候補を抽出する。すなわち、正規表現情報42には、OCR処理で誤認識する誤認識パターンを用いて修正された修正正規表現を定義しておく。
By the way, the character string recognized by the OCR processing in step S102 often includes erroneously recognized characters. Therefore, in the above example, if the character string candidate is extracted using the extraction pattern represented by the regular expression "[A][B][C][0-9]", the character string that should be extracted A character string in which some characters are incorrectly recognized will not be extracted. Therefore, in step S104, a character string candidate is extracted using an extraction pattern represented by a modified regular expression corrected using an erroneous recognition pattern that is erroneously recognized in OCR processing. That is, in the
例えば、上記の例の場合において、“A”は、例えば“H”と誤認識されやすい。また、“B”は、例えば“8”又は“日”と誤認識されやすい。また、“C”は、“[”又は“(”と誤認識されやすい。また、“0”は、“o”又は“O”と誤認識されやすい。この場合、OCR処理で誤認識する誤認識パターンを用いて修正された修正正規表現は、“[AH][B8日][C[(][0oO-9]”となる。このような修正正規表現で表される抽出パターンを用いて文字列候補を抽出することにより、本来抽出すべき文字列の一部の文字が誤認識された文字列も抽出される。 For example, in the case of the above example, "A" is likely to be erroneously recognized as "H", for example. Also, "B" is likely to be erroneously recognized as, for example, "8" or "day". "C" is likely to be erroneously recognized as "[" or "(". Also, "0" is likely to be erroneously recognized as "o" or "O." A modified regular expression modified using the recognition pattern is "[AH] [B8 days] [C [(] [0oO-9]". By extracting the character string candidates, a character string in which some of the characters of the character string that should be extracted is erroneously recognized is also extracted.
例えばステップS100で得られた画像が図4に示す画像50であったとする。画像50には、文字列“ABC0”を表す画像、文字列“ABC8”を表す画像、文字列“XYZ1”を表す画像が含まれている。
For example, assume that the image obtained in step S100 is the
この場合、ステップS102のOCR処理では、画像50に含まれる全ての文字列が認識されるので、文字列“ABC0”、文字列“ABC8”、文字列“XYZ1”の全てが何らかの文字列として全て認識される。そして、ステップS102のOCR処理では少なくとも一部の文字が誤認識される場合があるので、全ての文字列を正しく認識するとは限らない。例えば、文字列“ABC0”については、例えば“ABCo”又は“ABCO”と誤認識される場合がある。また、文字列“ABC8”については、“ABCB”と誤認識される場合がある。これに対して、ステップS104では、修正正規表現で表された抽出パターンを用いて文字列候補を抽出するので、例えば“ABCo”又は“ABCO”と誤認識されても文字列候補として抽出される。
In this case, in the OCR processing in step S102, all character strings included in the
ステップS106では、CPU10Aが、ステップS104で抽出された文字列候補について学習モデルを用いたOCR処理(以下、再認識処理と称する)を実行する。すなわち、ステップS100で取得した画像全体について再認識処理を実行するのではなく、ステップS104で抽出された文字列候補についてのみ再認識処理を実行する。なお、再認識処理を実行する対象の領域は、ステップS102のルールベースのOCR処理で得られた文字列候補の位置に基づいて設定すればよい。
In step S106,
例えば図5に示すように、画像50全体について再認識処理を実行するのではなく、文字列候補“ABC0”を含む領域R1と、文字列候補“ABC8”を含む領域R2と、について再認識処理を実行する。
For example, as shown in FIG. 5, the re-recognition process is not performed on the
なお、学習モデルを用いたOCR処理としては、本実施形態では一例として畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)等の機械学習を用いたOCR処理が挙げられるが、これに限られるものではない。 In this embodiment, an example of OCR processing using a learning model is OCR processing using machine learning such as a convolutional neural network (CNN), but is not limited to this.
学習モデルは、特定の文字について学習されている。ここで、特定の文字とは、図面情報抽出機能を実行する対象の図面に含まれ得る文字であり、例えば、アルファベット、数字、及び記号等である。 The learning model is trained on specific characters. Here, the specific characters are characters that can be included in the target drawing for which the drawing information extraction function is to be executed, such as alphabets, numbers, and symbols.
このように、特定の文字について学習された学習モデルを用いたOCR処理は、ステップS102で実行されるルールベースのOCR処理と比較して文字列の認識率は高くなる。 Thus, OCR processing using a learning model trained on specific characters has a higher character string recognition rate than rule-based OCR processing executed in step S102.
例えば画像50に含まれる文字列“ABC0”が、ステップS102のOCR処理で“ABCo”と誤認識され、文字列“ABC8”が“ABCB”と誤認識されたとする。このような場合でも、ステップS106の再認識処理で図5に示す領域R1、R2について再認識処理を実行した結果、“ABC0”、“ABC8”とそれぞれ正しく認識される場合があり得る。
For example, assume that the character string "ABC0" included in the
なお、ステップS106で実行される再認識処理では、文字認識の精度を表すスコアが算出される。スコアが高いほど文字認識の精度が高く、スコアが低いほど文字認識の精度が低い。例えばスコアは0~1の範囲の値であり、数値が高いほど文字認識の精度が高い。 In the re-recognition process executed in step S106, a score representing the accuracy of character recognition is calculated. The higher the score, the higher the accuracy of character recognition, and the lower the score, the lower the accuracy of character recognition. For example, the score is a value in the range of 0 to 1, and the higher the value, the higher the accuracy of character recognition.
以下のステップS108以降の処理は、再認識処理で認識された文字列毎に実行される。 The processing after step S108 below is executed for each character string recognized in the re-recognition processing.
ステップS108では、CPU10Aが、ステップS106の再認識処理により認識された文字列と同型の文字列候補である誤認識文字列候補を生成する。
In step S108,
具体的には、例えば図6に示すように、誤認識文字が定義された誤認識文字情報44が記憶部7に予め記憶されており、この誤認識文字情報44を用いて誤認識文字列候補を生成する。誤認識文字情報44は、ステップS102のOCR処理で誤認識する誤認識パターンを定義したものである。図6の例では、“A”に対して誤認識されやすい“H”が定義されている。また、“B”に対して誤認識されやすい“8”が定義されている。また、“0”に対して誤認識されやすい“o”及び“O”が定義されている。
Specifically, as shown in FIG. 6,
これにより、例えばステップS106の再認識処理により認識された文字列が“ABC0”であった場合、“HBC0”、“A8C0”、“ABCo”、“ABCO”、“H8C0”、“H8Co”、“H8CO”等が誤認識文字列候補として生成される。 As a result, for example, when the character string recognized by the re-recognition process in step S106 is "ABC0", "HBC0", "A8C0", "ABCo", "ABCO", "H8C0", "H8Co", " H8CO” and the like are generated as erroneously recognized character string candidates.
ステップS110では、CPU10Aが、ユーザーによって指定された誤認識パターンを用いて生成した文字列を誤認識文字列候補に追加する。ここで、ユーザーによって指定された誤認識パターンとは、例えば図面に含まれる文字のフォントに応じて設定された誤認識パターンである。例えば“0”に対して誤認識されやすい文字の代表的な例は“o”及び“O”であるが、図面で使用されている文字のフォントによっては、“o”及び“O”以外の他の文字と誤認識されやすい場合もある。この場合、例えば図7に示すように、ユーザー指定の誤認識パターンを定義した誤認識パターン情報46を記憶部7に予め記憶しておき、この誤認識パターン情報46を用いて生成した文字列を誤認識文字列候補に追加する。
In step S110,
図7の誤認識パターン情報46の例では、“B”に対して誤認識されやすい文字として“日”が、“0”に対して誤認識されやすい文字として“D”が設定されている。例えばステップS106の再認識処理により認識された文字列が“ABC0”であった場合、“A日C0”、“ABCD”が誤認識文字列候補として追加される。
In the example of the erroneous
なお、ステップS108及びステップS110で生成した誤認識文字列候補のうち、正規表現で表される文字列以外の誤認識文字列候補については、画像に含まれる文字列候補を特定する上で不要である。 Of the erroneously recognized character string candidates generated in steps S108 and S110, the erroneously recognized character string candidates other than character strings represented by regular expressions are unnecessary for specifying character string candidates included in the image. be.
そこで、ステップS112では、CPU10Aが、ステップS108及びステップS110で生成した誤認識文字列候補のうち、正規表現で表される抽出パターンの文字列以外の誤認識文字列候補を除外する。
Therefore, in step S112, the
例えば、上記の例で正規表現が“[A][B][C][0-9]”の場合において、ステップS108及びステップS110で生成した誤認識文字列候補として“HBC0”、“A8C0”、“ABCo”、“ABCO”、“H8C0”、“H8Co”、“H8CO”、“A日C0”、“ABCD”が含まれていたとする。正規表現で表される文字列は先頭から3文字目まではアルファベット、先頭から4文字目は数字なので、上記の誤認識文字列候補のうち、先頭から4文字目がアルファベットである“ABCo”、“ABCO”、“H8Co”、“H8CO”、“ABCD”、先頭から2文字目が漢字である“A日C0”は誤認識文字列候補から除外される。 For example, when the regular expression is "[A][B][C][0-9]" in the above example, the misrecognized character string candidates generated in steps S108 and S110 are "HBC0" and "A8C0". , "ABCo", "ABCO", "H8C0", "H8Co", "H8CO", "A day C0", and "ABCD". Since the first three characters of a character string represented by a regular expression are alphabetic characters, and the fourth character is a number, among the above misrecognized character string candidates, "ABCo" whose fourth character is an alphabetic character, "ABCO", "H8Co", "H8CO", "ABCD", and "A day C0" whose second character is a Chinese character are excluded from the erroneously recognized character string candidates.
ステップS114では、CPU10Aが、誤認識文字列候補の中から文字列候補を特定する。例えば図8に示すように、記憶部7に予め記憶された参照リスト48を用いて文字列候補を特定する。参照リスト48は、図面情報を抽出する対象の図面に含まれ得る文字列のリストである。図8に示すように、参照リスト48は、一例として5個の文字列“ABC0”、“ABC1”、“ABC2”、“ABC5”、“ABC8”を含んでいる。
In step S114,
ここで、誤認識文字列候補のうち、参照リストに含まれる文字列を文字列候補として特定する。一方、参照リストに何れの誤認識文字列候補も含まれていない場合は、文字列候補は特定されない。 Here, among the erroneously recognized character string candidates, character strings included in the reference list are specified as character string candidates. On the other hand, if the reference list does not contain any misrecognized character string candidates, no character string candidates are identified.
ステップS116では、CPU10Aが、ステップS114で文字列候補が特定されたか否かを判定する。そして、文字列候補が特定された場合、すなわち参照リストに誤認識文字列候補が存在する場合はステップS118へ移行する。一方、文字列候補が特定されなかった場合、すなわち参照リストに誤認識文字列候補が存在しなかった場合はステップS124へ移行する。
In step S116,
ステップS118では、CPU10Aが、ステップS106の再認識処理において算出されたスコアが予め定めた閾値以上であるか否かを判定する。なお、閾値は、スコアが閾値以上であれば、OCR処理の認識結果の信頼性が許容レベル以上とされる値に設定される。例えば、スコアが取り得る値の最大値の9割以上の値に設定される。具体的には、スコアが取り得る値の範囲が0~1の場合、閾値は一例として0.95に設定される。
In step S118,
そして、ステップS106の再認識処理において算出されたスコアが予め定めた閾値以上である場合、すなわちステップS106の再認識処理の認識結果の信頼性が許容レベル以上である場合はステップS119へ移行する。一方、ステップS106の再認識処理において算出されたスコアが予め定めた閾値未満である場合、すなわちステップS106の再認識処理の認識結果の信頼性が許容レベル未満である場合はステップS122へ移行する。 Then, when the score calculated in the re-recognition process of step S106 is equal to or higher than a predetermined threshold value, that is, when the reliability of the recognition result of the re-recognition process of step S106 is equal to or higher than the allowable level, the process proceeds to step S119. On the other hand, if the score calculated in the re-recognition process of step S106 is less than the predetermined threshold, that is, if the reliability of the recognition result of the re-recognition process of step S106 is less than the allowable level, the process proceeds to step S122.
ステップS119では、ステップS114で特定された文字列候補が1つであるか否かを判定する。そして、特定された文字列候補が1つの場合はステップS120へ移行し、特定された文字列候補が複数の場合はステップS122へ移行する。 In step S119, it is determined whether or not there is one character string candidate identified in step S114. If there is one specified character string candidate, the process proceeds to step S120, and if there are a plurality of specified character string candidates, the process proceeds to step S122.
ステップS120では、CPU10Aが、ステップS114で特定した1つの文字列候補を出力する。すなわち、特定した文字列候補を紙等の記録媒体に印刷したり、データファイルとして記憶部7に記憶したり、通信部6を介して外部装置に送信したり、表示部5に表示したりする。
In step S120,
一方、ステップS122が実行されるのは、ステップS118で再認識処理の認識結果の信頼性が許容レベル未満と判定された又はステップS119で複数の文字列候補が特定された場合である。このため、ステップS114で特定された文字列候補を、あくまで図面に含まれると推定される文字列候補である推定文字列候補として出力する。 On the other hand, step S122 is executed when it is determined in step S118 that the reliability of the recognition result of the re-recognition process is below the allowable level or when a plurality of character string candidates are identified in step S119. Therefore, the character string candidate specified in step S114 is output as an estimated character string candidate, which is a character string candidate that is estimated to be included in the drawing.
また、ステップS124が実行されるのは、参照リストに誤認識文字列候補が存在しない場合である。このため、誤認識文字列候補に近い文字列を参照リストから検索する。具体的には、誤認識文字列候補と異なる文字の数が最も少ない文字列を、誤認識文字列候補に近い文字列として参照リストから検索する。そして、検索した文字列を推定文字列候補として出力する。 Further, step S124 is executed when there is no erroneously recognized character string candidate in the reference list. Therefore, the reference list is searched for a character string close to the erroneously recognized character string candidate. Specifically, the reference list is searched for a character string having the smallest number of characters different from the misrecognized character string candidate as a character string close to the misrecognized character string candidate. Then, the retrieved character string is output as an estimated character string candidate.
ステップS126では、ステップS106で認識された全ての文字列についてステップS108~S124の処理を実行したか否かを判定する。そして、ステップS106で認識された全ての文字列についてステップS108~S124の処理を実行した場合は本ルーチンを終了する。一方、ステップS106で認識された全ての文字列についてステップS108~S124の処理を実行していない場合は、ステップS108へ移行し、全ての文字列の処理が終了するまでステップS108~S124の処理を繰り返す。 In step S126, it is determined whether or not the processing of steps S108 to S124 has been executed for all the character strings recognized in step S106. Then, when the processing of steps S108 to S124 has been executed for all the character strings recognized in step S106, this routine ends. On the other hand, if the processing of steps S108 to S124 has not been executed for all the character strings recognized in step S106, the process proceeds to step S108, and the processing of steps S108 to S124 is continued until the processing of all character strings is completed. repeat.
このように、本実施形態では、OCR処理によって画像から認識された文字列から、正規表現で表された抽出パターンを用いて文字列候補を抽出する。そして、OCR処理が誤認識する誤認識パターンを用いて文字列候補を修正し、予め定めた参照リストを用いて、修正された文字列候補の中から特定した文字列候補を出力する。 As described above, in the present embodiment, character string candidates are extracted from character strings recognized from an image by OCR processing using extraction patterns represented by regular expressions. Then, the character string candidate is corrected using the erroneously recognized pattern that is erroneously recognized by the OCR processing, and the character string candidate specified from the corrected character string candidates is output using a predetermined reference list.
なお、第1実施形態では、図3のステップS110において、ユーザー指定の誤認識パターンを定義した誤認識パターン情報46を用いて生成した文字列を誤認識文字列候補に追加しているが、ステップS110の処理を省略してもよい。
In the first embodiment, in step S110 of FIG. 3, the character string generated using the
次に、文字列候補を特定する場合の具体例について説明する。 Next, a specific example of identifying character string candidates will be described.
・具体例1 ・Specific example 1
具体例1では、正規表現が[F][X][1][0][A-Z][A-Z][0-9][0-9][0-9]、図面に含まれる実際の文字列が“FX10OG106”であり、参照リストには図9に示すように9個の文字列が含まれている。 In example 1, the regular expression is [F][X][1][0][A-Z][A-Z][0-9][0-9][0-9], and the actual character string contained in the drawing is "FX10OG106" and the reference list contains 9 strings as shown in FIG.
上記の条件でOCR処理を実行すると、認識した文字列候補は“FXIOO6IO6”であった。すなわち、3文字目の“1”が“I”に、4文字目の“0”が“O”に、6~8文字目の“G10”が“6IO”に誤認識されている。 When OCR processing was executed under the above conditions, the recognized character string candidate was "FXIOO6IO6". That is, the third character "1" is erroneously recognized as "I", the fourth character "0" as "O", and the sixth to eighth characters "G10" as "6IO".
次に、再認識処理の結果は、“FX100G106”となり、5文字目の“O”が“0”に誤認識されている。なお、再認識処理のスコアは閾値以上であった。また、誤認識文字列候補としては、“FX1o0G106”、“FX10OG106”、“FX10oG106”等が生成された。なお、具体例1では、ユーザー指定の誤認識パターン情報を用いて誤認識文字列候補を更に生成する処理は実行しなかった。 Next, the result of the re-recognition processing is "FX100G106", and the fifth character "O" is erroneously recognized as "0". Note that the score of the re-recognition process was equal to or higher than the threshold. In addition, "FX1o0G106", "FX10OG106", "FX10oG106", etc. were generated as misrecognized character string candidates. Note that in Specific Example 1, the process of further generating misrecognition character string candidates using user-specified misrecognition pattern information was not executed.
誤認識文字列候補のうち、正規表現を用いて不要な文字列候補を除外すると、“FX10OG106”のみが残る。この誤認識文字列候補は、図9の参照リストに含まれている。このため、図面に記載された文字列候補として“FX10OG106”が特定され、出力される。この文字列は、図面に含まれる実際の文字列と完全に一致している。 If unnecessary character string candidates are excluded from the incorrectly recognized character string candidates using regular expressions, only "FX10OG106" remains. This misrecognized character string candidate is included in the reference list in FIG. Therefore, "FX10OG106" is identified and output as a character string candidate described in the drawing. This string exactly matches the actual string contained in the drawing.
・具体例2 ・Specific example 2
具体例2では、正規表現、図面に実際に含まれる文字列、参照リスト、及びOCR処理の結果は具体例1と同じである。 In specific example 2, the regular expression, the character strings actually included in the drawing, the reference list, and the result of OCR processing are the same as in specific example 1. FIG.
再認識処理の結果は、“FX1006106”となり、5文字目の“O”が“0”に、6文字目の“G”が“6”に誤認識されている。なお、再認識処理のスコアは閾値以上であった。 The result of the re-recognition processing is "FX1006106", in which the fifth character "O" is erroneously recognized as "0" and the sixth character "G" is erroneously recognized as "6". Note that the score of the re-recognition process was equal to or higher than the threshold.
また、誤認識文字列候補としては、“FX1O06106”、“FX1oO6106”、“FX10O606”、 “FX10o6106”等が生成された。 In addition, "FX1O06106", "FX1oO6106", "FX10O606", "FX10o6106", etc. were generated as erroneously recognized character string candidates.
また、具体例2では、ユーザー指定の誤認識パターン情報を用いて生成した文字列を誤認識文字列候補に追加した。ユーザー指定の誤認識パターン情報は、誤認識パターンとして“6:G”が定義されている。このため、誤認識文字列候補として“FX10OG106”等を生成して追加した。 Further, in Specific Example 2, a character string generated using misrecognition pattern information specified by the user is added to the misrecognition character string candidates. In the user-specified recognition error pattern information, "6:G" is defined as the recognition error pattern. Therefore, "FX10OG106" etc. was generated and added as an erroneously recognized character string candidate.
再認識処理で認識された文字列及び誤認識文字列候補のうち、正規表現を用いて不要な誤認識文字列候補を除外すると、“FX10OG106”のみが残る。この誤認識文字列候補は、図9の参照リストに含まれている。このため、図面に記載された文字列候補として“FX10OG106”が特定され、出力される。この文字列は、図面に含まれる実際の文字列と完全に一致している。 Of the character strings recognized in the re-recognition process and the erroneously recognized character string candidates, if unnecessary erroneously recognized character string candidates are excluded using regular expressions, only "FX10OG106" remains. This misrecognized character string candidate is included in the reference list in FIG. Therefore, "FX10OG106" is identified and output as a character string candidate described in the drawing. This string exactly matches the actual string contained in the drawing.
・具体例3 ・Specific example 3
具体例3では、再認識処理のスコアが閾値未満であること以外は具体例2と同じである。 Specific example 3 is the same as specific example 2 except that the score of the re-recognition process is less than the threshold.
具体例3では、具体例2と同様に、図面に記載された文字列候補として、図面に含まれる実際の文字列と完全に一致する“FX10OG106”が特定されるが、再認識処理のスコアが閾値未満であるため信頼性が低い。従って、文字列候補“FX10OG106”は、あくまで図面に含まれると推定される文字列候補である推定文字列候補として出力される。 In Concrete Example 3, as in Concrete Example 2, "FX10OG106", which completely matches the actual character string included in the drawing, is specified as a character string candidate described in the drawing, but the re-recognition processing score is Reliability is low because it is below the threshold. Therefore, the character string candidate "FX10OG106" is output as an estimated character string candidate, which is a character string candidate presumed to be included in the drawing.
・具体例4 ・Specific example 4
具体例4では、図10に示すように、参照リストに10個の文字列が含まれている点以外は具体例1と同じである。 Specific example 4 is the same as specific example 1 except that the reference list includes 10 character strings, as shown in FIG.
具体例4では、具体例1と同様に文字列候補として“FX10OG106”が特定されるが、この文字列は図10の参照リストに含まれていない。このため、図10に参照リストに含まれる文字列のうち、“FX10OG106”と異なる文字の数が最も少ない文字列、すなわち“FX10OG106”と末尾の1文字が異なるだけの文字列である“FX10OG101”、“FX10OG102”、“FX10OG103”、“FX10OG104”、“FX10OG105”が推定文字列候補として出力される。 In Concrete Example 4, "FX10OG106" is specified as a character string candidate as in Concrete Example 1, but this character string is not included in the reference list of FIG. For this reason, among the character strings included in the reference list shown in FIG. , “FX10OG102”, “FX10OG103”, “FX10OG104”, and “FX10OG105” are output as estimated character string candidates.
・具体例5 ・Specific example 5
具体例5では、正規表現が[F][X][1][0][A-Z][0-9,A-Z][0-9][0-9][0-9]、図面に含まれる実際の文字列が“FX10OG104”であり、参照リストには図11に示すように8個の文字列が含まれている。 In example 5, the regular expression is [F][X][1][0][A-Z][0-9,A-Z][0-9][0-9][0-9], which is included in the drawing The actual string is "FX10OG104" and the reference list contains 8 strings as shown in FIG.
上記の条件でOCR処理を実行すると、認識した文字列は“FXIOO6IO4”であった。すなわち、3、4文字目の“10”が“IO”に、6~9文字目の“G104”が“6IO4”に誤認識されている。 When OCR processing was performed under the above conditions, the recognized character string was "FXIOO6IO4". That is, the 3rd and 4th characters "10" are erroneously recognized as "IO", and the 6th to 9th characters "G104" are erroneously recognized as "6IO4".
次に、再認識処理の結果は、“FX1006104”となり、5、6文字目の“OG”が“06”に誤認識されている。なお、再認識処理のスコアは閾値以上であった。また、誤認識文字列候補としては、“FX1O06104”、“FX1o06104”、“FX10O6104”、“FX10o6104”等が生成された。 Next, the result of the re-recognition processing is "FX1006104", and the 5th and 6th characters "OG" are erroneously recognized as "06". Note that the score of the re-recognition process was equal to or higher than the threshold. In addition, "FX1O06104", "FX1o06104", "FX10O6104", "FX10o6104", etc. were generated as misrecognized character string candidates.
また、ユーザー指定の誤認識パターン情報を用いて生成した文字列を誤認識文字列候補に追加した。ユーザー指定の誤認識パターン情報は、誤認識パターンとして“6:G”が定義されている。このため、誤認識文字列候補として“FX10OG104”等を生成して追加した。 In addition, character strings generated using misrecognition pattern information specified by the user are added to misrecognition character string candidates. In the user-specified recognition error pattern information, "6:G" is defined as the recognition error pattern. For this reason, "FX10OG104" etc. was generated and added as an erroneously recognized character string candidate.
誤認識文字列候補のうち、正規表現を用いて不要な誤認識文字列候補を除外すると、“FX10OG104”及び“FX10O6104”が残る。これらの文字列候補は、何れも図11に示す参照リストに含まれているため、1つの文字列候補に絞り込めない。従って、これら2つの文字列候補を推定文字列候補として出力する。 When unnecessary misrecognized character string candidates are excluded from the misrecognized character string candidates using regular expressions, "FX10OG104" and "FX10O6104" remain. Since these character string candidates are all included in the reference list shown in FIG. 11, they cannot be narrowed down to one character string candidate. Therefore, these two character string candidates are output as estimated character string candidates.
(第2実施形態) (Second embodiment)
次に、第2実施形態について説明する。なお、第1実施形態と同一部分には同一符号を付し、詳細な説明は省略する。第2実施形態では、図面から抽出したい情報がプラスチック部品の材質を表す文字列である場合について説明する。 Next, a second embodiment will be described. In addition, the same code|symbol is attached|subjected to the same part as 1st Embodiment, and detailed description is abbreviate|omitted. In the second embodiment, the case where the information to be extracted from the drawing is a character string representing the material of the plastic part will be described.
プラスチック部品の材質の表示方法は、JIS(日本工業規格)で規定されている。例えば、単一のポリマー等の部品の表示は、JIS K 6899-1で規定された材料の略語を境界文字“>”及び“<”で挟むことになっている。例えば、材料がアクリロニトリル-ブタジエン-スチレンであり、この略語がABSである場合は、“>ABS<”と表記される。 JIS (Japanese Industrial Standards) stipulates the method of indicating the material of plastic parts. For example, the designation of a part such as a single polymer is to enclose the abbreviation of the material specified in JIS K 6899-1 between the boundary characters ">" and "<". For example, if the material is acrylonitrile-butadiene-styrene and the abbreviation is ABS, it is written as ">ABS<".
また、プラスチック部品の材質の表示では、材料の略語の他に、“-”、“+”、“(”、“)”等が区切り文字として使用されたり、質量分率又は材料の含有率等を表す数字が使用されたりする。例えば“>PA66-(GF25+MD15)<”と表記されている場合、ガラス繊維(GF)25質量%と鉱物粉末(MD)15質量%の混合物を含むポリアミド66を表す。 In addition to the material abbreviations, "-", "+", "(", ")", etc. are used as delimiters, and mass fractions or material content rates are used to indicate the materials of plastic parts. A number representing is used. For example, the notation ">PA66-(GF25+MD15)<" denotes polyamide 66 containing a mixture of 25% by weight glass fiber (GF) and 15% by weight mineral powder (MD).
このように、境界文字で挟まれた文字列には、複数の材料の略語が含まれる場合があるが、必要とされるのは材料の略語であり、区切り文字は不要である。このため、第2実施形態では、境界文字で挟まれた文字列に区切り文字が含まれる場合は、文字列を区切り文字で分割し、材料の略語及び数字で構成される文字列を必要文字列として抽出する。 Thus, a string between boundary characters may contain multiple material abbreviations, but only the material abbreviations are required and no delimiters are required. For this reason, in the second embodiment, when a character string sandwiched between boundary characters includes a delimiter, the character string is divided by the delimiter, and a character string composed of material abbreviations and numbers is converted into a required character string. Extract as
図12には、第2実施形態に係るCPU10Aの機能ブロック図を示した。図12に示す機能ブロック図は、必要文字列抽出部31が設けられている点が図2に示す機能ブロック図と異なる。
FIG. 12 shows a functional block diagram of the
必要文字列抽出部31は、再認識処理部30による再認識処理により認識された文字列から必要文字列を抽出する。具体的には、再認識処理により認識された文字列に境界文字が含まれているか否かを判定する。そして、再認識処理により認識された文字列に境界文字が含まれている場合には、境界文字で挟まれた文字列を区切り文字で分割し、材料の略語及び数字で構成される文字列を必要文字列として抽出する。
The required character
次に、図13を参照して、本実施の形態に係る情報処理装置10の作用を説明する。図10に示す情報処理が図3に示す情報処理と異なるのは、ステップS107の処理が追加されている点及びステップS114の処理が若干異なる点である。
Next, operation of the
ステップS107では、ステップS106の再認識処理により認識された文字列の各々について、必要文字列を抽出する処理を行う。すなわち、再認識処理により認識された文字列のうち、境界文字“>”及び“<”で挟まれた文字列を抽出する。そして、境界文字“>”及び“<”で挟まれた文字列のうち、“-”、“+”、“(”、“)”等の区切り文字が含まれていない文字列については、境界文字を除いた文字列を必要文字列として抽出する。例えば再認識処理で認識された文字列が“>ABS<”の場合は、境界文字を除外した“ABS”を必要文字列として抽出する。 In step S107, processing for extracting necessary character strings is performed for each of the character strings recognized by the re-recognition processing in step S106. That is, the character strings sandwiched between the boundary characters “>” and “<” are extracted from the character strings recognized by the re-recognition process. Among the character strings sandwiched between boundary characters ">" and "<", character strings that do not contain delimiters such as "-", "+", "(", and ")" Extract the string excluding characters as the required string. For example, if the character string recognized in the re-recognition process is ">ABS<", then "ABS" excluding the boundary characters is extracted as the required character string.
一方、境界文字“>”及び“<”で挟まれた文字列のうち、“-”、“+”、“(”、“)”等の区切り文字が含まれている場合は、区切り文字で文字列を分割し、材料の略語及び数字で構成される文字列を必要文字列として抽出する。例えば再認識処理で認識された文字列が“>PA66-(GF25+MD15)<”の場合は、境界文字及び区切り文字を除外した“PA66”、“GF25”、及び“MD15”を必要文字列として抽出する。このため、ステップS108~S126の処理は、必要文字列毎に実行される。すなわち、ステップS108の誤認識文字列候補の生成も必要文字列毎に生成される。 On the other hand, if a character string sandwiched between boundary characters “>” and “<” contains delimiters such as “-”, “+”, “(”, “)”, The character string is divided and character strings composed of material abbreviations and numbers are extracted as required character strings. For example, if the character string recognized in the re-recognition process is ">PA66-(GF25+MD15)<", extract "PA66", "GF25", and "MD15" excluding boundary characters and delimiters as required character strings. do. Therefore, the processes of steps S108 to S126 are executed for each required character string. That is, generation of erroneously recognized character string candidates in step S108 is also generated for each required character string.
また、ステップS114では、例えば図14に示すような参照リスト48Aを用いて、必要文字列を含む誤認識文字列候補の中から文字列候補を特定する。図14に示すように、参照リスト48Aは、材料の略語のみが定義されたリストであるが、必要文字列を含む誤認識文字列候補は材料の略語及び数字を含む文字列となる。このため、必要文字列を含む誤認識文字列候補のうち、参照リスト48Aに定義された文字列と材料の略語が部分的に一致する文字列が存在する場合は、その文字列を画像に含まれる文字列候補として特定する。
Further, in step S114, for example, using a
例えば必要文字列が“PA66”の場合、参照リスト48Aに定義された“PA”と前方一致するので、“PA”が画像に含まれる文字列候補として特定される。
For example, if the required character string is "PA66", it matches "PA" defined in the
次に、文字列候補を特定する場合の具体例について説明する。 Next, a specific example of identifying character string candidates will be described.
・具体例1 ・Specific example 1
具体例1では、正規表現が[>][][][][][][][][][][][][][][][][][][][][][][][][<] 、図面に含まれる実際の文字列が“>PA66-(GF25+MD15)<”であり、図15に示すような参照リストに11個の文字列が含まれている。 In example 1, the regular expression is [>][][][][][][][][][][][][][][][][][][][][ ][][][][<] , the actual string contained in the drawing is ">PA66-(GF25+MD15)<" and the reference list contains 11 strings as shown in Figure 15 is
上記の条件でOCR処理を実行すると、認識した文字列候補は“>PAGG-(GF2S+MDI5)<”であった。すなわち、4、5文字目の“66”が“GG”に、10文字目の“5”が“S”に、14文字目の“1”が“I”に誤認識されている。 When OCR processing was performed under the above conditions, the recognized character string candidate was ">PAGG-(GF2S+MDI5)<". That is, the 4th and 5th characters "66" are erroneously recognized as "GG", the 10th character "5" as "S", and the 14th character "1" as "I".
次に、再認識処理の結果は、“>PA66-(GF25+MD15)<”となり、再認識処理のスコアは閾値以上であった。また、必要文字抽出処理により“PA66”、“GF25”、“MD15”が抽出された。これらの文字列は、材料の略語を表す文字列が図15に示す参照リストに含まれている。このため、図面に記載された文字列候補として“PA”、“GF”、“MD”が特定され、出力される。 Next, the result of the re-recognition process was ">PA66-(GF25+MD15)<", and the score of the re-recognition process was above the threshold. Also, "PA66", "GF25", and "MD15" were extracted by the necessary character extraction processing. These strings are included in the reference list shown in FIG. 15, which strings represent material abbreviations. Therefore, "PA", "GF", and "MD" are identified and output as character string candidates described in the drawing.
・具体例2 ・Specific example 2
具体例2は、再認識処理のスコアが閾値未満である点以外は具体例1と同じである。この場合、再認識処理の認識結果の信頼性が低いので、“PA”、“GF”、“MD”は推定文字列候補として出力される。 Specific example 2 is the same as specific example 1 except that the score of the re-recognition process is less than the threshold. In this case, since the reliability of the recognition result of the re-recognition process is low, "PA", "GF", and "MD" are output as estimated character string candidates.
以上、各実施形態を用いて本発明について説明したが、本発明は各実施形態に記載の範囲には限定されない。本発明の要旨を逸脱しない範囲で各実施形態に多様な変更または改良を加えることができ、当該変更または改良を加えた形態も本発明の技術的範囲に含まれる。 Although the present invention has been described above using each embodiment, the present invention is not limited to the scope described in each embodiment. Various changes or improvements can be made to each embodiment without departing from the gist of the present invention, and forms with such changes or improvements are also included in the technical scope of the present invention.
例えば上記各実施形態では、情報処理装置が複合機に適用される場合を例に説明したが、スマートフォン又はタブレット端末等に適用してもよい。この場合、スマートフォン又はタブレット端末に搭載されたカメラで図面を撮影し、撮影した画像に対して図3又は図10の処理を実行すればよい。 For example, in each of the above-described embodiments, the case where the information processing apparatus is applied to a multi-function peripheral has been described as an example, but it may be applied to a smart phone, a tablet terminal, or the like. In this case, the drawing may be photographed with a camera mounted on a smartphone or tablet terminal, and the processing of FIG. 3 or FIG. 10 may be performed on the photographed image.
また、例えば、図3、13に示した情報処理をASIC(Application Specific Integrated Circuit)等のハードウェアで実現するようにしてもよい。この場合、ソフトウエアで実現する場合に比べて、処理の高速化が図られる。 Further, for example, the information processing shown in FIGS. 3 and 13 may be realized by hardware such as ASIC (Application Specific Integrated Circuit). In this case, the speed of processing can be increased as compared with the case of realizing by software.
また、各実施形態では、情報処理プログラムが記憶部7にインストールされている形態を説明したが、これに限定されるものではない。本実施形態に係る情報処理プログラムを、コンピュータ読取可能な記憶媒体に記録した形態で提供してもよい。例えば、本実施形態に係る情報処理プログラムを、CD(Compact Disc)-ROM及びDVD(Digital Versatile Disc)-ROM等の光ディスクに記録した形態、若しくはUSB(Universal Serial Bus)メモリ及びメモリカード等の半導体メモリに記録した形態で提供してもよい。また、本実施形態に係る情報処理プログラムを、通信部6に接続された通信回線を介して外部装置から取得するようにしてもよい。
Further, in each embodiment, a form in which the information processing program is installed in the
1 画像形成装置
2 スキャナ部
3 画像形成部
4 操作部
5 表示部
6 通信部
7 記憶部
10 情報処理装置
20 OCR処理部
22 取得部
24 抽出部
26 修正部
28 出力部
30 再認識処理部
31 必要文字列抽出部
32 生成部
40 情報処理プログラム
42 正規表現情報
44 誤認識文字情報
46 誤認識パターン情報
48、48A 参照リスト
50 画像
1 Image forming
Claims (11)
前記取得部で取得された文字列から、正規表現で表された抽出パターンを用いて文字列候補を抽出する抽出部と、
前記文字認識処理が誤認識する誤認識パターンを用いて前記文字列候補を修正する修正部と、
予め定めた参照リストを用いて、前記修正部で修正された文字列候補の中から特定した文字列候補を出力する出力部と、
を備え、
前記取得部は前記画像を取得し、
前記修正部は、特定の文字について学習された学習モデルを用いて、前記抽出部により抽出された前記文字列候補の前記画像についてのみ文字認識処理を再度行う文字認識処理部と、
前記文字認識処理部により認識された文字列候補と同型の文字列候補である誤認識文字列候補を生成する生成部と、
を含み、
前記出力部は、前記誤認識文字列候補の中から特定した文字列候補を出力する
情報処理装置。 an acquisition unit that acquires a character string recognized from an image by character recognition processing;
an extraction unit that extracts a character string candidate from the character string acquired by the acquisition unit using an extraction pattern represented by a regular expression;
a correction unit that corrects the character string candidate using an erroneous recognition pattern that is erroneously recognized by the character recognition process;
an output unit configured to output character string candidates identified from the character string candidates corrected by the correction unit using a predetermined reference list;
with
The acquisition unit acquires the image,
a character recognition processing unit in which the correction unit performs character recognition processing again on only the image of the character string candidate extracted by the extraction unit using a learning model learned about a specific character;
a generating unit that generates misrecognized character string candidates that are character string candidates of the same type as the character string candidates recognized by the character recognition processing unit;
including
The output unit outputs a character string candidate identified from the misrecognized character string candidates.
Information processing equipment.
請求項1記載の情報処理装置。 The information processing apparatus according to claim 1, wherein the extraction unit extracts the character string candidate using a modified extraction pattern represented by a modified regular expression obtained by modifying the regular expression using the misrecognition pattern.
請求項1又は請求項2記載の情報処理装置。 3. The information processing apparatus according to claim 1 , wherein the generation unit adds a character string generated using an erroneous recognition pattern specified by a user to the erroneously recognized character string candidates.
請求項1~3の何れか1項に記載の情報処理装置。 The information processing apparatus according to any one of claims 1 to 3, wherein the generation unit generates the misrecognized character string candidates by excluding character string candidates represented by the extraction patterns.
前記出力部は、前記スコアが予め定めた閾値以上の場合に、前記特定した文字列候補を出力する
請求項1~4の何れか1項に記載の情報処理装置。 The character recognition processing unit calculates a score representing accuracy of character recognition,
The information processing apparatus according to any one of claims 1 to 4 , wherein the output unit outputs the identified character string candidate when the score is equal to or greater than a predetermined threshold.
前記出力部は、前記スコアが予め定めた閾値未満の場合に、前記特定した文字列候補を推定文字列候補として出力する
請求項1~4の何れか1項に記載の情報処理装置。 The character recognition processing unit calculates a score representing accuracy of character recognition,
The information processing apparatus according to any one of claims 1 to 4 , wherein the output unit outputs the specified character string candidate as an estimated character string candidate when the score is less than a predetermined threshold.
前記出力部は、前記スコアが予め定めた閾値以上で且つ前記特定した文字列候補が複数の場合に、複数の前記特定した文字列候補を推定文字列候補として出力する
請求項1~4の何れか1項に記載の情報処理装置。 The character recognition processing unit calculates a score representing accuracy of character recognition,
5. The output unit outputs a plurality of the specified character string candidates as estimated character string candidates when the score is equal to or greater than a predetermined threshold and the number of the specified character string candidates is plural . 1. The information processing apparatus according to 1.
前記取得部で取得された文字列から、正規表現で表された抽出パターンを用いて文字列候補を抽出する抽出部と、
前記文字認識処理が誤認識する誤認識パターンを用いて前記文字列候補を修正する修正部と、
予め定めた参照リストを用いて、前記修正部で修正された文字列候補の中から特定した文字列候補を出力する出力部と、
を備え、
前記取得部は前記画像を取得し、
前記修正部は、特定の文字を対象として前記画像の文字認識処理を行う文字認識処理部と、
前記文字認識処理部により文字認識された文字列から必要な文字列である必要文字列を抽出する必要文字列抽出部と、
前記必要文字列抽出部により抽出された前記必要文字列と同型の文字列候補である誤認識文字列候補を生成する生成部と、
を含み、
前記出力部は、前記誤認識文字列候補の中から特定した文字列候補を出力する
情報処理装置。 an acquisition unit that acquires a character string recognized from an image by character recognition processing;
an extraction unit that extracts a character string candidate from the character string acquired by the acquisition unit using an extraction pattern represented by a regular expression;
a correction unit that corrects the character string candidate using an erroneous recognition pattern that is erroneously recognized by the character recognition process;
an output unit configured to output character string candidates identified from the character string candidates corrected by the correction unit using a predetermined reference list;
with
The acquisition unit acquires the image,
The correction unit includes a character recognition processing unit that performs character recognition processing on the image with a specific character as a target;
a required character string extraction unit for extracting a required character string, which is a required character string, from the character string recognized by the character recognition processing unit;
a generating unit that generates misrecognized character string candidates that are character string candidates of the same type as the necessary character string extracted by the necessary character string extracting unit;
including
The output unit outputs a character string candidate identified from the misrecognized character string candidates.
Information processing equipment.
請求項1~4の何れか1項に記載の情報処理装置。 If the reference list does not contain the character string candidate corrected by the correction unit, the output unit selects a character string similar to the character string candidate corrected by the correction unit from among the character strings included in the reference list. The information processing apparatus according to any one of claims 1 to 4 , wherein the estimated character string candidate is output.
請求項9記載の情報処理装置。 10. The information according to claim 9 , wherein the output unit outputs, among the character strings included in the reference list, a character string having the smallest number of characters different from the character string candidates corrected by the correction unit as an estimated character string candidate. processing equipment.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019016251A JP7279381B2 (en) | 2019-01-31 | 2019-01-31 | Information processing device and information processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019016251A JP7279381B2 (en) | 2019-01-31 | 2019-01-31 | Information processing device and information processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020123272A JP2020123272A (en) | 2020-08-13 |
JP7279381B2 true JP7279381B2 (en) | 2023-05-23 |
Family
ID=71992824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019016251A Active JP7279381B2 (en) | 2019-01-31 | 2019-01-31 | Information processing device and information processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7279381B2 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000353215A (en) | 1999-06-11 | 2000-12-19 | Nec Corp | Character recognition device and recording medium where character recognizing program is recorded |
JP2017199288A (en) | 2016-04-28 | 2017-11-02 | キヤノン株式会社 | Image processing device, image processing method and program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2780654B2 (en) * | 1994-12-20 | 1998-07-30 | 日本電気株式会社 | Address reading device |
JPH09138836A (en) * | 1995-11-13 | 1997-05-27 | N T T Data Tsushin Kk | Correcting system of character recognizing result |
-
2019
- 2019-01-31 JP JP2019016251A patent/JP7279381B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000353215A (en) | 1999-06-11 | 2000-12-19 | Nec Corp | Character recognition device and recording medium where character recognizing program is recorded |
JP2017199288A (en) | 2016-04-28 | 2017-11-02 | キヤノン株式会社 | Image processing device, image processing method and program |
Also Published As
Publication number | Publication date |
---|---|
JP2020123272A (en) | 2020-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5372110B2 (en) | Information output device, information output method, and computer program | |
JP7149721B2 (en) | Information processing device, character recognition engine optimization method and program | |
US11438467B2 (en) | Apparatus, method, and storage medium for supporting data entry by correcting erroneously recoginized characters | |
JP7552263B2 (en) | Image processing apparatus and image forming apparatus | |
CN109214381B (en) | Numerical control program conversion device | |
EP3147818A1 (en) | Image processing apparatus, image processing method and program | |
JP2019169025A (en) | Information processing device, character recognition engine selection method, and program | |
JP7279381B2 (en) | Information processing device and information processing program | |
JP7279382B2 (en) | Information processing device and information processing program | |
JP4470913B2 (en) | Character string search device and program | |
CN102467664A (en) | Method and device for assisting with optical character recognition | |
JP2020184275A (en) | Image processing system, image processing method, and program | |
CN113723082B (en) | Method and device for detecting Chinese pinyin from text | |
Mohapatra et al. | Spell checker for OCR | |
JP7115162B2 (en) | ELECTRONIC DEVICE, IMAGE FORMING APPARATUS, E-MAIL CREATION SUPPORT METHOD AND E-MAIL CREATION SUPPORT PROGRAM | |
US20150043832A1 (en) | Information processing apparatus, information processing method, and computer readable medium | |
JP2021018520A (en) | Information processor, information processing method, and program | |
US20190318190A1 (en) | Information processing apparatus, and non-transitory computer readable medium | |
US9792495B2 (en) | Character recognition apparatus, character recognition processing system, and non-transitory computer readable medium | |
US11574490B2 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
JP7463675B2 (en) | Information processing device and information processing program | |
WO2023062799A1 (en) | Information processing system, manuscript type identification method, model generation method and program | |
US20230137350A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP6844574B2 (en) | Image processing device and image processing method | |
JP3310063B2 (en) | Document processing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230424 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7279381 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |