JP2020123273A - Information processing device and information processing program - Google Patents

Information processing device and information processing program Download PDF

Info

Publication number
JP2020123273A
JP2020123273A JP2019016252A JP2019016252A JP2020123273A JP 2020123273 A JP2020123273 A JP 2020123273A JP 2019016252 A JP2019016252 A JP 2019016252A JP 2019016252 A JP2019016252 A JP 2019016252A JP 2020123273 A JP2020123273 A JP 2020123273A
Authority
JP
Japan
Prior art keywords
character string
character
unit
information processing
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019016252A
Other languages
Japanese (ja)
Other versions
JP7279382B2 (en
Inventor
クリシュナン ラガワ
Krishnan Raghava
クリシュナン ラガワ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2019016252A priority Critical patent/JP7279382B2/en
Publication of JP2020123273A publication Critical patent/JP2020123273A/en
Application granted granted Critical
Publication of JP7279382B2 publication Critical patent/JP7279382B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

To allow for accurately identifying character strings contained in an image without referring to a predefined reference list.SOLUTION: An information processing device 10 is provided, comprising: an acquisition unit 22 configured to acquire character strings recognized from an image by OCR processing; an extraction unit 24 configured to extract character string candidates from the character strings acquired by the acquisition unit 22 using an extraction pattern expressed in regular expression; a correction unit 26 configured to correct the character string candidates using false recognition patterns in which the OCR processing tends to make false recognition; and an output unit 28 configured to output character string candidates identified from among the character string candidates corrected by the correction unit 26 using the regular expression.SELECTED DRAWING: Figure 2

Description

本発明は、情報処理装置及び情報処理プログラムに関する。 The present invention relates to an information processing device and an information processing program.

特許文献1には、情報を複数保持する情報保持手段中から所定の情報を検索する情報検索装置において、文書画像入力手段と、文字認識手段と、文字認識の確信度から正規化レベルを決定する手段と、前記正規化レベルに基づき代表文字に置き換える正規化手段と、前記情報保持手段中から類似したテキストを含む情報を検索する検索手段と、前記検索結果を出力する検索結果出力手段とを備えたことを特徴とする情報検索装置が開示されている。 In Patent Document 1, in an information retrieval device that retrieves predetermined information from information retention means that retains a plurality of information, a normalization level is determined from a document image input means, a character recognition means, and a certainty factor of character recognition. Means, a normalization means for replacing with a representative character based on the normalization level, a search means for searching the information holding means for information including similar texts, and a search result output means for outputting the search result. An information search device characterized by the above is disclosed.

特許文献2には、文字列から所与の辞書に含まれる特定用語を検索する情報処理装置であって、n−gram方式を利用して前記所与の辞書に対して前記文字列の部分文字列の検索を行い、前記所与の辞書から該文字列に含まれる1以上の特定用語候補を抽出する抽出手段と、前記1以上の特定用語候補の各々に対して、DPマッチング方式を利用して特定用語候補と該特定用語候補に対応する前記文字列内の部分文字列との編集距離を導出する導出手段と、前記編集距離が所定の閾値より短い前記1以上の特定用語候補に対応する前記文字列内の部分文字列を出力する出力手段と、を有することを特徴とする情報処理装置が開示されている。 Patent Document 2 is an information processing apparatus that searches a character string for a specific term included in a given dictionary, and uses an n-gram method to perform partial characters of the character string for the given dictionary. Extraction means for performing a column search and extracting one or more specific term candidates included in the character string from the given dictionary, and a DP matching method for each of the one or more specific term candidates are used. Deriving means for deriving an editing distance between a specific term candidate and a partial character string in the character string corresponding to the specific term candidate, and the one or more specific term candidates in which the editing distance is shorter than a predetermined threshold value. And an output unit that outputs a partial character string in the character string.

特開2007−323415号公報JP, 2007-323415, A 特開2018−81451号公報JP, 2008-81451, A

本発明は、予め定めた参照リストを用いなくても、精度良く画像に含まれる文字列を特定することができる情報処理装置及び情報処理プログラムを提供することを目的とする。 It is an object of the present invention to provide an information processing device and an information processing program capable of accurately specifying a character string included in an image without using a predetermined reference list.

第1態様に係る情報処理装置は、文字認識処理によって画像から認識された文字列を取得する取得部と、前記取得部で取得された文字列から、正規表現で表された抽出パターンを用いて文字列候補を抽出する抽出部と、前記文字認識処理が誤認識する誤認識パターンを用いて前記文字列候補を修正する修正部と、前記正規表現を用いて、前記修正部で修正された文字列候補の中から特定した文字列候補を出力する出力部と、を備える。 An information processing apparatus according to a first aspect uses an extraction unit that acquires a character string recognized from an image by a character recognition process and an extraction pattern represented by a regular expression from the character string acquired by the acquisition unit. An extraction unit that extracts a character string candidate, a correction unit that corrects the character string candidate using an erroneous recognition pattern that is erroneously recognized by the character recognition process, and a character that is corrected by the correction unit using the regular expression. An output unit that outputs the character string candidates specified from the column candidates.

第2態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記抽出部は、前記誤認識パターンを用いて前記正規表現を修正した修正正規表現で表された修正抽出パターンを用いて前記文字列候補を抽出する。 An information processing apparatus according to a second aspect is the information processing apparatus according to the first aspect, wherein the extraction unit uses a modified extraction pattern represented by a modified regular expression obtained by modifying the regular expression using the misrecognition pattern. To extract the character string candidates.

第3態様に係る情報処理装置は、第1態様又は第2態様に係る情報処理装置において、前記取得部は前記画像を取得し、前記修正部は、特定の文字を対象として前記画像の文字認識処理を行う文字認識処理部と、前記文字認識処理部により認識された文字列と同型の文字列候補である誤認識文字列候補を生成する生成部と、を含み、前記出力部は、前記誤認識文字列候補の中から特定した文字列候補を出力する。 An information processing apparatus according to a third aspect is the information processing apparatus according to the first or second aspect, wherein the acquisition unit acquires the image, and the correction unit performs character recognition of the image targeting a specific character. The output unit includes a character recognition processing unit that performs processing, and a generation unit that generates a misrecognized character string candidate that is a character string candidate of the same type as the character string recognized by the character recognition processing unit. The specified character string candidate is output from the recognized character string candidates.

第4態様に係る情報処理装置は、第3態様に係る情報処理装置において、前記生成部は、ユーザーによって指定された誤認識パターンを用いて生成した文字列を前記誤認識文字列候補に追加する。 An information processing apparatus according to a fourth aspect is the information processing apparatus according to the third aspect, wherein the generation unit adds a character string generated using an erroneous recognition pattern designated by a user to the erroneously recognized character string candidates. ..

第5態様に係る情報処理装置は、第3態様又は第4態様に係る情報処理装置において、前記生成部は、前記抽出パターンで表される文字列候補を除いて前記誤認識文字列候補を生成する。 An information processing apparatus according to a fifth aspect is the information processing apparatus according to the third aspect or the fourth aspect, wherein the generation unit generates the misrecognized character string candidates except for the character string candidates represented by the extraction pattern. To do.

第6態様に係る情報処理装置は、第3〜第5態様の何れかの態様に係る情報処理装置において、前記文字認識処理部は、文字認識の精度を表すスコアを算出し、前記出力部は、前記スコアが予め定めた閾値以上の場合に、前記特定した文字列候補を出力する。 An information processing apparatus according to a sixth aspect is the information processing apparatus according to any one of the third to fifth aspects, wherein the character recognition processing unit calculates a score indicating accuracy of character recognition, and the output unit is If the score is equal to or greater than a predetermined threshold value, the specified character string candidate is output.

第7態様に係る情報処理装置は、第3〜第5態様の何れかの態様に係る情報処理装置において、前記文字認識処理部は、文字認識の精度を表すスコアを算出し、前記出力部は、前記スコアが予め定めた閾値未満の場合に、前記特定した文字列候補を推定文字列候補として出力する。 An information processing apparatus according to a seventh aspect is the information processing apparatus according to any one of the third to fifth aspects, wherein the character recognition processing unit calculates a score indicating accuracy of character recognition, and the output unit is If the score is less than a predetermined threshold value, the specified character string candidate is output as an estimated character string candidate.

第8態様に係る情報処理装置は、第3〜第5態様の何れかの態様に係る情報処理装置において、前記文字認識処理部は、文字認識の精度を表すスコアを算出し、前記出力部は、前記スコアが予め定めた閾値以上で且つ前記特定した文字列候補が複数の場合に、複数の前記特定した文字列候補を推定文字列候補として出力する。 An information processing apparatus according to an eighth aspect is the information processing apparatus according to any one of the third to fifth aspects, wherein the character recognition processing unit calculates a score indicating accuracy of character recognition, and the output unit is When the score is equal to or higher than a predetermined threshold and the specified character string candidates are plural, the plural specified character string candidates are output as estimated character string candidates.

第9態様に係る情報処理装置は、第3〜第5態様の何れかの態様に係る情報処理装置において、前記文字認識処理部により文字認識された文字列から必要な文字列である必要文字列を抽出する必要文字列抽出部を更に備え、前記生成部は、前記必要文字列抽出部により抽出された前記必要文字列と同型の文字列候補である誤認識文字列候補を生成する。 An information processing apparatus according to a ninth aspect is the information processing apparatus according to any one of the third to fifth aspects, in which a necessary character string that is a necessary character string from a character string recognized by the character recognition processing unit. The generating unit further includes a necessary character string extracting unit that extracts a character string candidate that is a character string candidate of the same type as the necessary character string extracted by the necessary character string extracting unit.

第10態様に係る情報処理装置は、第1〜第5態様の何れかの態様に係る情報処理装置において、前記出力部は、前記正規表現で表される文字列に前記修正部で修正された文字列候補が存在しない場合、前記正規表現で表される文字列のうち、前記修正部で修正された文字列候補に近い文字列を推定文字列候補として出力する。 An information processing apparatus according to a tenth aspect is the information processing apparatus according to any one of the first to fifth aspects, wherein the output unit is corrected by the correction unit to a character string represented by the regular expression. When there is no character string candidate, a character string that is close to the character string candidate corrected by the correction unit among the character strings represented by the regular expression is output as an estimated character string candidate.

第11態様に係る情報処理装置は、第10態様に係る情報処理装置において、前記出力部は、前記正規表現で表される文字列のうち、前記修正部で修正された文字列候補と異なる文字の数が最も少ない文字列を推定文字列候補として出力する。 An information processing apparatus according to an eleventh aspect is the information processing apparatus according to the tenth aspect, wherein the output unit is a character string that is different from the character string candidate corrected by the correction unit in the character string represented by the regular expression. The character string with the smallest number of is output as an estimated character string candidate.

第12態様に係る情報処理プログラムは、コンピュータを、第1〜第11態様の何れか1つの態様に記載の情報処理装置の各部として機能させるための情報処理プログラムである。 The information processing program according to the twelfth aspect is an information processing program for causing a computer to function as each unit of the information processing apparatus according to any one of the first to eleventh aspects.

第1及び第12態様によれば、予め定めた参照リストを用いなくても、精度良く画像に含まれる文字列を特定することができる、という効果を有する。 According to the first and twelfth aspects, there is an effect that a character string included in an image can be accurately specified without using a predetermined reference list.

第2態様によれば、誤認識パターンを用いて正規表現を修正した修正正規表現で表された修正抽出パターンを用いずに文字列候補を抽出する場合と比較して、本来抽出すべき文字列の一部の文字が誤認識された文字列も抽出することができる、という効果を有する。 According to the second aspect, as compared with the case of extracting the character string candidates without using the modified extraction pattern represented by the modified regular expression in which the regular expression is modified by using the misrecognition pattern, the character string that should be originally extracted It is possible to extract a character string in which some of the characters are erroneously recognized.

第3態様によれば、誤認識文字列候補を生成しない場合と比較して、精度良く画像に含まれる文字列を特定することができる、という効果を有する。 According to the third aspect, there is an effect that the character string included in the image can be specified more accurately than in the case where the erroneously recognized character string candidate is not generated.

第4態様によれば、ユーザーによって指定された誤認識パターンを用いずに誤認識文字列候補を生成する場合と比較して、精度良く画像に含まれる文字列を特定することができる、という効果を有する。 According to the fourth aspect, it is possible to accurately specify the character string included in the image, as compared with the case where the misrecognized character string candidate is generated without using the misrecognized pattern specified by the user. Have.

第5態様によれば、抽出パターンで表される文字列候補を除かずに誤認識文字列候補を生成する場合と比較して、画像に含まれる文字列を特定するまでの時間を短縮することができる、という効果を有する。 According to the fifth aspect, it is possible to shorten the time until the character string included in the image is specified, as compared with the case where the misrecognized character string candidate is generated without removing the character string candidate represented by the extraction pattern. It has the effect that

第6態様によれば、文字認識の精度を表すスコアに関係なく特定した文字列候補を出力する場合と比較して、特定した文字列候補が出力されたことについての信頼性が高まる、という効果を有する。 According to the sixth aspect, the reliability that the specified character string candidate is output is increased as compared with the case where the specified character string candidate is output regardless of the score indicating the accuracy of character recognition. Have.

第7態様によれば、文字認識の精度を表すスコアに関係なく特定した文字列候補を推定文字列候補として出力する場合と比較して、推定文字列候補として出力されたことについての信頼性が高まる、という効果を有する。 According to the seventh aspect, the reliability of being output as the estimated character string candidate is higher than that in the case of outputting the identified character string candidate as the estimated character string candidate regardless of the score indicating the accuracy of character recognition. It has the effect of increasing.

第8態様によれば、文字認識の精度を表すスコアに関係なく複数の特定した文字列候補を推定文字列候補として出力する場合と比較して、複数の推定文字列候補として出力されたことについての信頼性が高まる、という効果を有する。 According to the eighth aspect, as compared with the case where a plurality of specified character string candidates are output as estimated character string candidates regardless of the score indicating the accuracy of character recognition, the output as a plurality of estimated character string candidates is performed. Has the effect of increasing the reliability of.

第9態様によれば、文字認識された文字列から必要文字列を抽出せずに誤認識文字列候補を生成する場合と比較して、適切に誤認識文字列候補を生成することができる、という効果を有する。 According to the ninth aspect, it is possible to appropriately generate the erroneously recognized character string candidate, as compared with the case where the erroneously recognized character string candidate is generated without extracting the necessary character string from the character string subjected to character recognition. Has the effect.

第10態様によれば、正規表現で表される文字列に文字列候補が存在しない場合に何も出力しない場合と比較して、画像に含まれる可能性のある文字列を把握することができる、という効果を有する。 According to the tenth aspect, when there is no character string candidate in the character string represented by the regular expression, as compared with the case where nothing is output, the character string that may be included in the image can be grasped. Has the effect of.

第11態様によれば、正規表現で表される文字列と文字列候補との異なる文字の数に関係なく推定文字列候補を特定する場合と比較して、推定文字列候補の信頼性が高まる、という効果を有する。 According to the eleventh aspect, the reliability of the estimated character string candidate is increased as compared with the case where the estimated character string candidate is specified regardless of the number of different characters in the character string represented by the regular expression and the character string candidate. Has the effect of.

画像形成装置の構成図である。It is a block diagram of an image forming apparatus. 第1実施形態に係るCPUの機能ブロック図である。FIG. 3 is a functional block diagram of a CPU according to the first embodiment. 第1実施形態に係る情報処理のフローチャートである。3 is a flowchart of information processing according to the first embodiment. 図面を読み取った画像の一例を示す図である。It is a figure which shows an example of the image which read the drawing. 再認識処理の対象となる領域について説明するための図である。It is a figure for demonstrating the area|region used as the object of a re-recognition process. 誤認識文字情報の一例を示す図である。It is a figure which shows an example of misrecognized character information. 誤認識パターン情報の一例を示す図である。It is a figure which shows an example of misrecognition pattern information. 第2実施形態に係るCPUの機能ブロック図である。It is a functional block diagram of CPU which concerns on 2nd Embodiment. 第2実施形態に係る情報処理のフローチャートである。It is a flow chart of information processing concerning a 2nd embodiment.

以下、図面を参照して、本発明を実施するための形態例を詳細に説明する。 Embodiments for carrying out the present invention will be described in detail below with reference to the drawings.

(第1実施形態) (First embodiment)

図1は、本実施形態に係る画像形成装置1の構成図である。図1に示すように、画像形成装置1は、スキャナ部2、画像形成部3、操作部4、表示部5、通信部6、記憶部7、及び情報処理装置10を備える。なお、図1では、用紙等の記録媒体を供給する供給機構、記録媒体を搬送する搬送機構、記録媒体を排出する排出機構等の図示を省略している。 FIG. 1 is a configuration diagram of an image forming apparatus 1 according to the present embodiment. As shown in FIG. 1, the image forming apparatus 1 includes a scanner unit 2, an image forming unit 3, an operation unit 4, a display unit 5, a communication unit 6, a storage unit 7, and an information processing device 10. Note that, in FIG. 1, a supply mechanism that supplies a recording medium such as paper, a transport mechanism that transports the recording medium, and a discharge mechanism that discharges the recording medium are not shown.

画像形成装置1は、原稿を読み取るスキャン機能、原稿を複写するコピー機能、印刷データを印刷する印刷機能、原稿をファクシミリ送信するファクシミリ送信機能等の複数の機能を有する複合機として機能する。 The image forming apparatus 1 functions as a multifunction peripheral having a plurality of functions such as a scan function of reading a document, a copy function of copying a document, a print function of printing print data, and a facsimile transmission function of facsimile transmission of a document.

スキャナ部2は、画像が形成された紙等の記録媒体を光学的に読み取って読み取り画像を生成し、情報処理装置10に出力する。 The scanner unit 2 optically reads a recording medium such as paper on which an image is formed, generates a read image, and outputs the read image to the information processing apparatus 10.

画像形成部3は、例えば電子写真方式又はインクジェット記録方式等により紙等の記録媒体に画像を形成する機能を有し、情報処理装置10からの指示により画像を記録媒体に形成する。 The image forming unit 3 has a function of forming an image on a recording medium such as paper by, for example, an electrophotographic system or an inkjet recording system, and forms an image on the recording medium according to an instruction from the information processing device 10.

操作部4は、各種操作を受け付ける操作キーを含んで構成される。 The operation unit 4 is configured to include operation keys that receive various operations.

表示部5は、液晶ディスプレイ等で構成され、例えば画面に指等で触れることで各種操作を受け付けるタッチパネルで構成される。 The display unit 5 is composed of a liquid crystal display or the like, and is composed of, for example, a touch panel that receives various operations by touching the screen with a finger or the like.

通信部6は、外部装置等とデータ通信を行うためのインターフェースである。 The communication unit 6 is an interface for performing data communication with an external device or the like.

記憶部7は、ハードディスク等の不揮発性の記憶装置で構成され、後述する情報処理プログラム等を記憶する。 The storage unit 7 is composed of a non-volatile storage device such as a hard disk, and stores an information processing program described later.

情報処理装置10は、CPU(Central Processing Unit)10A、ROM(Read Only Memory)10B、RAM(Random Access Memory)10C、不揮発性メモリ10D、及び入出力インターフェース(I/O)10Eを備える。そして、CPU10A、ROM10B、RAM10C、不揮発性メモリ10D、及びI/O10Eがバス10Fを介して各々接続されている。I/O10Eには、スキャナ部2、画像形成部3、操作部4、表示部5、通信部6、記憶部7が接続されている。CPU10Aは、記憶部7に記憶された情報処理プログラムを読み込んで実行する。 The information processing device 10 includes a CPU (Central Processing Unit) 10A, a ROM (Read Only Memory) 10B, a RAM (Random Access Memory) 10C, a nonvolatile memory 10D, and an input/output interface (I/O) 10E. The CPU 10A, the ROM 10B, the RAM 10C, the non-volatile memory 10D, and the I/O 10E are connected to each other via the bus 10F. The scanner unit 2, the image forming unit 3, the operation unit 4, the display unit 5, the communication unit 6, and the storage unit 7 are connected to the I/O 10E. The CPU 10A reads and executes the information processing program stored in the storage unit 7.

画像形成装置1は、前述したコピー機能等の複合機の基本機能の他に、図面情報抽出機能を有する。図面情報抽出機能は、製造業及び設備・建設業等で使用する図面を読み取り、読み取った図面の画像から、図面に記載されている指定の文字列を図面情報として抽出する機能である。図面に記載されている指定の文字列には、例えば品番、品名、及び版等を含む基本属性、図面に表された製品のスペックを表すスペック情報、材料情報、設計標準書番号等の各種情報を表す文字列が含まれる。図面から抽出した図面情報は、紙等の記録媒体に印刷したり、データファイルとして記憶部7に記憶したり、通信部6を介して外部装置に送信したり、表示部5に表示したりする。 The image forming apparatus 1 has a drawing information extraction function in addition to the basic functions of the multi-function peripheral such as the copy function described above. The drawing information extraction function is a function of reading a drawing used in the manufacturing industry, equipment/construction industry, and the like, and extracting a specified character string described in the drawing as drawing information from an image of the read drawing. In the specified character string shown in the drawing, for example, various information such as basic attributes including product number, product name, and version, specification information showing the specifications of the product shown in the drawing, material information, design standard document number, etc. Contains a string that represents. The drawing information extracted from the drawing is printed on a recording medium such as paper, stored in the storage unit 7 as a data file, transmitted to an external device via the communication unit 6, or displayed on the display unit 5. ..

図面情報抽出機能が利用されるケースとしては以下のようなケースが挙げられる。例えば図面に記載された文字列が或る技術標準に基づいて記載されている場合において、技術標準が更新されて図面に記載された文字列を修正する必要がある場合に、旧技術標準で記載された文字列を含む図面を探す場合等である。 Cases in which the drawing information extraction function is used include the following cases. For example, if a character string shown in the drawing is written based on a certain technical standard and the technical standard needs to be updated and the character string shown in the drawing needs to be corrected, the old technical standard should be used. This is the case, for example, when searching for a drawing that includes the specified character string.

以下、画像形成装置1が図面情報抽出機能を実行する場合におけるCPU10Aの機能構成について説明する。 The functional configuration of the CPU 10A when the image forming apparatus 1 executes the drawing information extraction function will be described below.

図2に示すように、CPU10Aは、機能的には、OCR処理部20、取得部22、抽出部24、修正部26、及び出力部28を備える。 As shown in FIG. 2, the CPU 10A functionally includes an OCR processing unit 20, an acquisition unit 22, an extraction unit 24, a correction unit 26, and an output unit 28.

OCR処理部20は、スキャナ部2が原稿から読み取った画像に対して文字認識処理、すなわちOCR(Optical Character Recognition)処理を実行し、読み取った画像に含まれる文字列を取得部22に出力する。なお、OCR処理部20が実行するOCR処理は、一例としてルールベースのOCR処理である。すなわち、予め定めた規則に基づいて、読み取った画像に含まれる文字列を全て抽出する。 The OCR processing unit 20 performs character recognition processing, that is, OCR (Optical Character Recognition) processing on the image read by the scanner unit 2 from the document, and outputs the character string included in the read image to the acquisition unit 22. The OCR processing executed by the OCR processing unit 20 is, for example, rule-based OCR processing. That is, all character strings included in the read image are extracted based on a predetermined rule.

取得部22は、OCR処理部20のOCR処理によって画像から認識された文字列を取得する。取得部22は、取得した文字列を修正部26へ出力する。 The acquisition unit 22 acquires the character string recognized from the image by the OCR processing of the OCR processing unit 20. The acquisition unit 22 outputs the acquired character string to the correction unit 26.

抽出部24は、取得部22で取得された文字列から、正規表現で表された抽出パターンを用いて文字列候補を抽出する。なお、OCR処理部20によるOCR処理によって認識された文字列には、誤認識された文字が含まれる場合が多い。このため、抽出部24は、OCR処理部20のOCR処理で誤認識する誤認識パターンを用いて修正された修正正規表現で表された抽出パターンを用いて文字列候補を抽出する。 The extraction unit 24 extracts character string candidates from the character string acquired by the acquisition unit 22, using an extraction pattern represented by a regular expression. It should be noted that the character string recognized by the OCR processing by the OCR processing unit 20 often includes a character that is erroneously recognized. Therefore, the extraction unit 24 extracts the character string candidates using the extraction pattern represented by the modified regular expression that is modified by using the misrecognized pattern that is misrecognized by the OCR processing of the OCR processing unit 20.

修正部26は、OCR処理が誤認識する誤認識パターンを用いて、抽出部24が抽出した文字列候補を修正する。 The correction unit 26 corrects the character string candidates extracted by the extraction unit 24 using the erroneous recognition pattern erroneously recognized by the OCR process.

具体的には、修正部26は、再認識処理部30及び生成部32を備える。 Specifically, the correction unit 26 includes a re-recognition processing unit 30 and a generation unit 32.

再認識処理部30は、特定の文字を対象として画像のOCR処理を再度行う。再認識処理部30は、例えばニューラルネットワーク等の機械学習を用いて画像のOCR処理を実行する。なお、再認識処理部30は、文字認識処理部の一例である。 The re-recognition processing unit 30 performs the OCR processing of the image again for the specific character. The re-recognition processing unit 30 executes the OCR processing of the image using machine learning such as a neural network. The re-recognition processing unit 30 is an example of a character recognition processing unit.

生成部32は、再認識処理部30により認識された文字列候補と同型の文字列候補である誤認識文字列候補を生成する。例えば、誤認識パターンを用いて正規表現を修正した修正正規表現で表された修正抽出パターンを用いて誤認識文字列候補を生成する。 The generation unit 32 generates a misrecognized character string candidate that is a character string candidate of the same type as the character string candidate recognized by the re-recognition processing unit 30. For example, the misrecognized character string candidate is generated using the modified extraction pattern represented by the modified regular expression in which the regular expression is modified using the misrecognized pattern.

ここで、誤認識文字列候補とは、再認識処理部30により認識された文字列候補であって、認識された文字と同型であり認識が難しい文字列候補、又は、再認識処理部30により認識された文字列であって、認識された文字が誤っている可能性の高い文字列候補である。なお、以下では、再認識処理部30により認識された文字列も誤認識文字列候補に含まれるものとする。 Here, the erroneously recognized character string candidate is a character string candidate recognized by the re-recognition processing unit 30 and is a character string candidate having the same type as the recognized character and difficult to recognize, or the re-recognition processing unit 30. The recognized character string is a character string candidate in which the recognized character is highly likely to be incorrect. In the following, it is assumed that the character string recognized by the re-recognition processing unit 30 is also included in the erroneously recognized character string candidates.

出力部28は、正規表現を用いて、修正部26で修正された文字列候補、すなわち生成部32で生成された誤認識文字列候補の中から特定した文字列候補を出力する。 The output unit 28 outputs the character string candidates corrected by the correction unit 26, that is, the character string candidates identified from the misrecognized character string candidates generated by the generation unit 32, using the regular expression.

次に、図3を参照して、本実施の形態に係る情報処理装置10の作用を説明する。図2に示すように、情報処理プログラム40は記憶部7に記憶されている。CPU10Aが情報処理プログラム40を読み出して実行することにより、図3に示す情報処理が実行される。なお、図3に示す情報処理は、例えば、ユーザーがスキャナ部2に図面をセットし、操作部4を操作して図面情報抽出処理の実行を指示した場合に実行される。 Next, the operation of the information processing device 10 according to the present embodiment will be described with reference to FIG. As shown in FIG. 2, the information processing program 40 is stored in the storage unit 7. The information processing shown in FIG. 3 is executed by the CPU 10A reading and executing the information processing program 40. The information processing illustrated in FIG. 3 is executed, for example, when the user sets a drawing on the scanner unit 2 and operates the operation unit 4 to instruct execution of the drawing information extraction process.

ステップS100では、CPU10Aが、スキャナ部2に図面の読み取りを指示し、スキャナ部2が読み取った図面の画像を取得する。 In step S100, the CPU 10A instructs the scanner unit 2 to read the drawing, and acquires the image of the drawing read by the scanner unit 2.

ステップS102では、CPU10Aが、ステップS100で取得した画像に対してルールベースのOCR処理を実行する。これにより、読み取った画像に含まれる全ての文字列が取得される。また、読み取った画像に含まれる全ての文字列の位置、すなわち画像の中の座標も取得される。OCR処理により認識された文字列は、例えばXML形式の文字列として得られるが、文字列の形式はXML形式に限られるものではない。 In step S102, the CPU 10A executes rule-based OCR processing on the image acquired in step S100. As a result, all the character strings included in the read image are acquired. Further, the positions of all the character strings included in the read image, that is, the coordinates in the image are also acquired. The character string recognized by the OCR process is obtained as a character string in the XML format, for example, but the format of the character string is not limited to the XML format.

ステップS104では、CPU10Aが、ステップS102のOCR処理によって得られた文字列から、ステップS100で取得した画像に含まれる文字列候補を抽出する。具体的には、正規表現で表された抽出パターンを用いて画像に含まれる文字列候補を抽出する。本実施形態では、例えば図2に示すように、正規表現が定義された正規表現情報42が予め記憶部7に記憶されており、この正規表現情報42で定義された正規表現で表される抽出パターンを用いて文字列候補を抽出する。なお、正規表現情報42を予め記憶部7に記憶しておく場合に限らず、通信部6を介して外部装置から正規表現情報42を取得してもよい。 In step S104, CPU 10A extracts a character string candidate included in the image acquired in step S100 from the character string obtained by the OCR processing in step S102. Specifically, the character string candidates included in the image are extracted using the extraction pattern represented by the regular expression. In the present embodiment, for example, as shown in FIG. 2, regular expression information 42 in which a regular expression is defined is stored in advance in the storage unit 7, and extraction represented by the regular expression defined in the regular expression information 42 is performed. Extract character string candidates using the pattern. The regular expression information 42 is not limited to being stored in the storage unit 7 in advance, and the regular expression information 42 may be acquired from an external device via the communication unit 6.

ここで、正規表現とは、文字列の集合を一つの文字列で表現する方法である。そして、正規表現は、図面情報の抽出対象となる図面に含まれ得る文字列に対応したものである。すなわち、記憶部7に予め記憶された正規表現情報42には、図面情報の抽出対象となる図面に含まれ得る文字列に対応した正規表現が定義されている。 Here, the regular expression is a method of expressing a set of character strings by one character string. The regular expression corresponds to the character string that can be included in the drawing from which the drawing information is extracted. That is, the regular expression information 42 stored in advance in the storage unit 7 defines the regular expressions corresponding to the character strings that can be included in the drawing from which the drawing information is extracted.

例えば、図面情報の抽出対象となる図面に含まれ得る文字列が4個の文字から構成され、先頭の文字が“A”、2番目の文字が“B”、3番目の文字が“C”、4番目の文字が“0”〜“9”の10種類の数字の何れかの文字である文字列であるとする。この場合、図面情報の抽出対象となる図面に含まれ得る文字列の正規表現は、“[A][B][C][0−9]”という一つの文字列で表される。この場合、正規表現情報42には、正規表現として“[A][B][C][0−9]”が定義される。なお、正規表現“[A][B][C][0−9]”で表された抽出パターンの文字列は、“ABC0”〜“ABC9”までの10パターンとなる。 For example, a character string that can be included in a drawing from which drawing information is extracted is composed of four characters, the first character is "A", the second character is "B", and the third character is "C". It is assumed that the fourth character is a character string in which any of the 10 types of numbers "0" to "9" is a character. In this case, the regular expression of the character string that can be included in the drawing from which the drawing information is extracted is represented by one character string “[A][B][C][0-9]”. In this case, the regular expression information 42 defines “[A][B][C][0-9]” as a regular expression. The character string of the extracted pattern represented by the regular expression “[A][B][C][0-9]” is 10 patterns from “ABC0” to “ABC9”.

ところで、ステップS102のOCR処理によって認識された文字列には、誤認識された文字が含まれる場合が多い。このため、上記の例において、正規表現“[A][B][C][0−9]”で表される抽出パターンを用いて文字列候補を抽出したのでは、本来抽出すべき文字列の一部の文字が誤認識された文字列が抽出されなくなってしまう。このため、ステップS104では、OCR処理で誤認識する誤認識パターンを用いて修正された修正正規表現で表された抽出パターンを用いて文字列候補を抽出する。すなわち、正規表現情報42には、OCR処理で誤認識する誤認識パターンを用いて修正された修正正規表現を定義しておく。 By the way, in many cases, the character string recognized by the OCR processing in step S102 includes a character that is erroneously recognized. Therefore, in the above example, if the character string candidates are extracted using the extraction pattern represented by the regular expression “[A][B][C][0-9]”, A character string in which some of the characters are erroneously recognized will not be extracted. Therefore, in step S104, the character string candidates are extracted using the extraction pattern represented by the corrected regular expression corrected using the erroneous recognition pattern that is erroneously recognized in the OCR process. That is, the regular expression information 42 defines a modified regular expression that is corrected by using an erroneous recognition pattern that is erroneously recognized by the OCR process.

例えば、上記の例の場合において、“A”は、例えば“H”と誤認識されやすい。また、“B”は、例えば“8”又は“日”と誤認識されやすい。また、“C”は、“[”又は“(”と誤認識されやすい。また、“0”は、“o”又は“O”と誤認識されやすい。この場合、OCR処理で誤認識する誤認識パターンを用いて修正された修正正規表現は、“[AH][B8日][C[(][0oO−9]”となる。このような修正正規表現で表される抽出パターンを用いて文字列候補を抽出することにより、本来抽出すべき文字列の一部の文字が誤認識された文字列も抽出される。 For example, in the case of the above example, “A” is likely to be erroneously recognized as “H”. Also, "B" is easily misrecognized as "8" or "day", for example. Further, "C" is apt to be erroneously recognized as "[" or "(", and "0" is apt to be erroneously recognized as "o" or "O". The modified regular expression modified using the recognition pattern is “[AH][B8 days][C[(][0oO-9]”. By using the extraction pattern represented by such modified regular expression By extracting the character string candidates, a character string in which some characters of the character string to be originally extracted are erroneously recognized is also extracted.

例えばステップS100で得られた画像が図4に示す画像50であったとする。画像50には、文字列“ABC0”を表す画像、文字列“ABC8”を表す画像、文字列“XYZ1”を表す画像が含まれている。 For example, assume that the image obtained in step S100 is the image 50 shown in FIG. The image 50 includes an image representing the character string “ABC0”, an image representing the character string “ABC8”, and an image representing the character string “XYZ1”.

この場合、ステップS102のOCR処理では、画像50に含まれる全ての文字列が認識されるので、文字列“ABC0”、文字列“ABC8”、文字列“XYZ1”の全てが何らかの文字列として全て認識される。そして、ステップS102のOCR処理では少なくとも一部の文字が誤認識される場合があるので、全ての文字列を正しく認識するとは限らない。例えば、文字列“ABC0”については、例えば“ABCo”又は“ABCO”と誤認識される場合がある。また、文字列“ABC8”については、“ABCB”と誤認識される場合がある。これに対して、ステップS104では、修正正規表現で表された抽出パターンを用いて文字列候補を抽出するので、例えば“ABCo”又は“ABCO”と誤認識されても文字列候補として抽出される。 In this case, since all the character strings included in the image 50 are recognized in the OCR processing of step S102, all of the character strings “ABC0”, the character string “ABC8”, and the character string “XYZ1” are all regarded as some character strings. Be recognized. Then, in the OCR processing of step S102, at least some characters may be erroneously recognized, so that not all character strings are recognized correctly. For example, the character string "ABC0" may be erroneously recognized as "ABCo" or "ABCO". Further, the character string "ABC8" may be erroneously recognized as "ABCB". On the other hand, in step S104, since the character string candidates are extracted using the extraction pattern represented by the modified regular expression, even if the character strings are erroneously recognized as "ABCo" or "ABCO", they are extracted as character string candidates. ..

ステップS106では、CPU10Aが、ステップS104で抽出された文字列候補について学習モデルを用いたOCR処理(以下、再認識処理と称する)を実行する。すなわち、ステップS100で取得した画像全体について再認識処理を実行するのではなく、ステップS104で抽出された文字列候補についてのみ再認識処理を実行する。なお、再認識処理を実行する対象の領域は、ステップS102のルールベースのOCR処理で得られた文字列候補の位置に基づいて設定すればよい。 In step S106, the CPU 10A executes an OCR process (hereinafter, referred to as a re-recognition process) using the learning model for the character string candidates extracted in step S104. That is, the re-recognition process is not executed for the entire image acquired in step S100, but the re-recognition process is executed only for the character string candidates extracted in step S104. Note that the target region for executing the re-recognition process may be set based on the position of the character string candidate obtained by the rule-based OCR process in step S102.

例えば図5に示すように、画像50全体について再認識処理を実行するのではなく、文字列候補“ABC0”を含む領域R1と、文字列候補“ABC8”を含む領域R2と、について再認識処理を実行する。 For example, as shown in FIG. 5, the re-recognition process is not performed on the entire image 50, but the re-recognition process is performed on the region R1 including the character string candidate “ABC0” and the region R2 including the character string candidate “ABC8”. To execute.

なお、学習モデルを用いたOCR処理としては、本実施形態では一例として畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)等の機械学習を用いたOCR処理が挙げられるが、これに限られるものではない。 As an example of the OCR process using the learning model, an OCR process using machine learning such as a convolutional neural network (CNN) is used in the present embodiment, but the present invention is not limited to this.

学習モデルは、特定の文字について学習されている。ここで、特定の文字とは、図面情報抽出機能を実行する対象の図面に含まれ得る文字であり、例えば、アルファベット、数字、及び記号等である。 The learning model has been learned for a particular character. Here, the specific character is a character that can be included in the drawing for which the drawing information extraction function is executed, and is, for example, an alphabet, a number, or a symbol.

このように、特定の文字について学習された学習モデルを用いたOCR処理は、ステップS102で実行されるルールベースのOCR処理と比較して文字列の認識率は高くなる。 As described above, the OCR processing using the learning model learned for a specific character has a higher character string recognition rate than the rule-based OCR processing executed in step S102.

例えば画像50に含まれる文字列“ABC0”が、ステップS102のOCR処理で“ABCo”と誤認識され、文字列“ABC8”が“ABCB”と誤認識されたとする。このような場合でも、ステップS106の再認識処理で図5に示す領域R1、R2について再認識処理を実行した結果、“ABC0”、“ABC8”とそれぞれ正しく認識される場合があり得る。 For example, it is assumed that the character string “ABC0” included in the image 50 is erroneously recognized as “ABCo” and the character string “ABC8” is erroneously recognized as “ABCB” in the OCR process of step S102. Even in such a case, as a result of performing the re-recognition process on the regions R1 and R2 shown in FIG. 5 in the re-recognition process of step S106, “ABC0” and “ABC8” may be correctly recognized, respectively.

なお、ステップS106で実行される再認識処理では、文字認識の精度を表すスコアが算出される。スコアが高いほど文字認識の精度が高く、スコアが低いほど文字認識の精度が低い。例えばスコアは0〜1の範囲の値であり、数値が高いほど文字認識の精度が高い。 In the re-recognition process executed in step S106, a score representing the accuracy of character recognition is calculated. The higher the score, the higher the accuracy of character recognition, and the lower the score, the lower the accuracy of character recognition. For example, the score is a value in the range of 0 to 1, and the higher the numerical value, the higher the accuracy of character recognition.

以下のステップS108以降の処理は、再認識処理で認識された文字列毎に実行される。 The processing from step S108 below is executed for each character string recognized in the re-recognition processing.

ステップS108では、CPU10Aが、ステップS106の再認識処理により認識された文字列と同型の文字列候補である誤認識文字列候補を生成する。 In step S108, the CPU 10A generates a misrecognized character string candidate that is a character string candidate of the same type as the character string recognized by the re-recognition process of step S106.

具体的には、例えば図6に示すように、誤認識文字が定義された誤認識文字情報44が記憶部7に予め記憶されており、この誤認識文字情報44を用いて誤認識文字列候補を生成する。誤認識文字情報44は、ステップS102のOCR処理で誤認識する誤認識パターンを定義したものである。図6の例では、“A”に対して誤認識されやすい“H”が定義されている。また、“B”に対して誤認識されやすい“8”が定義されている。また、“0”に対して誤認識されやすい“o”及び“O”が定義されている。 Specifically, for example, as shown in FIG. 6, misrecognized character information 44 in which misrecognized characters are defined is stored in advance in the storage unit 7, and the misrecognized character string candidate is used by using this misrecognized character information 44. To generate. The misrecognized character information 44 defines a misrecognized pattern that is misrecognized in the OCR process of step S102. In the example of FIG. 6, “H” that is easily misrecognized for “A” is defined. Further, “8” is defined which is easily misrecognized for “B”. Further, “o” and “O” that are easily misrecognized with respect to “0” are defined.

これにより、例えばステップS106の再認識処理により認識された文字列が“ABC0”であった場合、“HBC0”、“A8C0”、“ABCo”、“ABCO”、“H8C0”、“H8Co”、“H8CO”等が誤認識文字列候補として生成される。 Thereby, for example, when the character string recognized by the re-recognition process of step S106 is "ABC0", "HBC0", "A8C0", "ABCo", "ABCO", "H8C0", "H8Co", " H8CO" or the like is generated as a misrecognized character string candidate.

ステップS110では、CPU10Aが、ユーザーによって指定された誤認識パターンを用いて生成した文字列を誤認識文字列候補に追加する。ここで、ユーザーによって指定された誤認識パターンとは、例えば図面に含まれる文字のフォントに応じて設定された誤認識パターンである。例えば“0”に対して誤認識されやすい文字の代表的な例は“o”及び“O”であるが、図面で使用されている文字のフォントによっては、“o”及び“O”以外の他の文字と誤認識されやすい場合もある。この場合、例えば図7に示すように、ユーザー指定の誤認識パターンを定義した誤認識パターン情報46を記憶部7に予め記憶しておき、この誤認識パターン情報46を用いて生成した文字列を誤認識文字列候補に追加する。 In step S110, the CPU 10A adds the character string generated using the erroneous recognition pattern designated by the user to the erroneously recognized character string candidates. Here, the erroneous recognition pattern designated by the user is, for example, an erroneous recognition pattern set according to the font of characters included in the drawing. For example, typical examples of characters that are easily erroneously recognized as "0" are "o" and "O", but depending on the font of the characters used in the drawings, characters other than "o" and "O" may be used. It may be easily misrecognized as another character. In this case, for example, as shown in FIG. 7, misrecognition pattern information 46 defining a user-specified misrecognition pattern is stored in the storage unit 7 in advance, and a character string generated using this misrecognition pattern information 46 is stored. Add to the misrecognized character string candidates.

図7の誤認識パターン情報46の例では、“B”に対して誤認識されやすい文字として“日”が、“0”に対して誤認識されやすい文字として“D”が設定されている。例えばステップS106の再認識処理により認識された文字列が“ABC0”であった場合、“A日C0”、“ABCD”が誤認識文字列候補として追加される。 In the example of the misrecognized pattern information 46 of FIG. 7, "day" is set as a character that is easily misrecognized for "B", and "D" is set as a character that is easily misrecognized for "0". For example, when the character string recognized by the re-recognition process in step S106 is "ABC0", "A date C0" and "ABCD" are added as the misrecognized character string candidates.

なお、ステップS108及びステップS110で生成した誤認識文字列候補のうち、正規表現で表される文字列以外の誤認識文字列候補については、画像に含まれる文字列候補を特定する上で不要である。 Note that among the misrecognized character string candidates generated in step S108 and step S110, the misrecognized character string candidates other than the character string represented by the regular expression are not necessary for specifying the character string candidates included in the image. is there.

そこで、ステップS112では、CPU10Aが、ステップS108及びステップS110で生成した誤認識文字列候補のうち、正規表現で表される抽出パターンの文字列以外の誤認識文字列候補を除外する。 Therefore, in step S112, the CPU 10A excludes the misrecognized character string candidates other than the character string of the extraction pattern represented by the regular expression from the misrecognized character string candidates generated in step S108 and step S110.

例えば、上記の例で正規表現が“[A][B][C][0−9]”の場合において、ステップS108及びステップS110で生成した誤認識文字列候補として“HBC0”、“A8C0”、“ABCo”、“ABCO”、“H8C0”、“H8Co”、“H8CO”、“A日C0”、“ABCD”が含まれていたとする。正規表現で表される文字列は先頭から3文字目まではアルファベット、先頭から4文字目は数字なので、上記の誤認識文字列候補のうち、先頭から4文字目がアルファベットである“ABCo”、“ABCO”、“H8Co”、“H8CO”、“ABCD”、先頭から2文字目が漢字である“A日C0”は誤認識文字列候補から除外される。 For example, in the above example, when the regular expression is “[A][B][C][0-9]”, “HBC0” and “A8C0” are set as the misrecognized character string candidates generated in step S108 and step S110. , "ABCo", "ABCO", "H8C0", "H8Co", "H8CO", "A day C0", "ABCD" are included. Since the character string represented by the regular expression is the alphabet from the first to the third character, and the fourth character from the first is a number, "ABCo" in which the fourth character from the first is alphabet among the above misrecognized character string candidates, “ABCO”, “H8Co”, “H8CO”, “ABCD”, and “A day C0” in which the second character from the beginning is a Chinese character are excluded from the misrecognized character string candidates.

ステップS114では、CPU10Aが、正規表現を用いて、誤認識文字列候補の中から文字列候補を特定する。すなわち、誤認識文字列候補のうち、正規表現で表される文字列に含まれる誤認識文字列候補を文字列候補として特定する。例えば正規表現が“[A][B][C][0−9]”の場合、正規表現で表される文字列は“ABC0”〜“ABC9”までの10パターンである。従って、誤認識文字列候補のうち、“ABC0”〜“ABC9”の何れかの文字列と一致する誤認識文字列候補を文字列候補として特定する。一方、正規表現で表される文字列に何れの誤認識文字列候補も含まれていない場合は、文字列候補は特定されない。 In step S114, the CPU 10A identifies a character string candidate from the misrecognized character string candidates using the regular expression. That is, among the misrecognized character string candidates, the misrecognized character string candidates included in the character string represented by the regular expression are specified as the character string candidates. For example, when the regular expression is “[A][B][C][0-9]”, the character string represented by the regular expression is 10 patterns from “ABC0” to “ABC9”. Therefore, among the misrecognized character string candidates, the misrecognized character string candidates that match any of the character strings “ABC0” to “ABC9” are specified as the character string candidates. On the other hand, if the character string represented by the regular expression does not include any erroneously recognized character string candidates, the character string candidates are not specified.

ステップS116では、CPU10Aが、ステップS114で文字列候補が特定されたか否かを判定する。そして、文字列候補が特定された場合、すなわち正規表現で表される文字列の何れかと一致する誤認識文字列候補が存在する場合はステップS118へ移行する。一方、文字列候補が特定されなかった場合、すなわち正規表現で表される文字列と一致する誤認識文字列候補が存在しなかった場合はステップS124へ移行する。 In step S116, the CPU 10A determines whether the character string candidate is identified in step S114. Then, if the character string candidate is specified, that is, if there is a misrecognized character string candidate that matches any of the character strings represented by the regular expression, the process proceeds to step S118. On the other hand, if no character string candidate is specified, that is, if there is no misrecognized character string candidate that matches the character string represented by the regular expression, the process proceeds to step S124.

ステップS118では、CPU10Aが、ステップS106の再認識処理において算出されたスコアが予め定めた閾値以上であるか否かを判定する。なお、閾値は、スコアが閾値以上であれば、OCR処理の認識結果の信頼性が許容レベル以上とされる値に設定される。例えば、スコアが取り得る値の最大値の9割以上の値に設定される。具体的には、スコアが取り得る値の範囲が0〜1の場合、閾値は一例として0.95に設定される。 In step S118, the CPU 10A determines whether or not the score calculated in the re-recognition process of step S106 is equal to or higher than a predetermined threshold value. It should be noted that the threshold value is set to a value at which the reliability of the recognition result of the OCR process is equal to or higher than the allowable level if the score is equal to or higher than the threshold value. For example, the score is set to 90% or more of the maximum possible values. Specifically, when the range of values that the score can take is 0 to 1, the threshold is set to 0.95 as an example.

そして、ステップS106の再認識処理において算出されたスコアが予め定めた閾値以上である場合、すなわちステップS106の再認識処理の認識結果の信頼性が許容レベル以上である場合はステップS119へ移行する。一方、ステップS106の再認識処理において算出されたスコアが予め定めた閾値未満である場合、すなわちステップS106の再認識処理の認識結果の信頼性が許容レベル未満である場合はステップS122へ移行する。 Then, when the score calculated in the re-recognition process of step S106 is equal to or higher than a predetermined threshold, that is, when the reliability of the recognition result of the re-recognition process of step S106 is equal to or higher than the allowable level, the process proceeds to step S119. On the other hand, if the score calculated in the re-recognition process of step S106 is less than the predetermined threshold, that is, if the reliability of the recognition result of the re-recognition process of step S106 is less than the allowable level, the process proceeds to step S122.

ステップS119では、ステップS114で特定された文字列候補が1つであるか否かを判定する。そして、特定された文字列候補が1つの場合はステップS120へ移行し、特定された文字列候補が複数の場合はステップS122へ移行する。 In step S119, it is determined whether the number of character string candidates identified in step S114 is one. Then, if there is one identified character string candidate, the process proceeds to step S120, and if there are multiple identified character string candidates, the process proceeds to step S122.

ステップS120では、CPU10Aが、ステップS114で特定した1つの文字列候補を出力する。すなわち、特定した文字列候補を紙等の記録媒体に印刷したり、データファイルとして記憶部7に記憶したり、通信部6を介して外部装置に送信したり、表示部5に表示したりする。 In step S120, CPU 10A outputs the one character string candidate identified in step S114. That is, the specified character string candidates are printed on a recording medium such as paper, stored in the storage unit 7 as a data file, transmitted to an external device via the communication unit 6, or displayed on the display unit 5. ..

一方、ステップS122が実行されるのは、ステップS118で再認識処理の認識結果の信頼性が許容レベル未満と判定された又はステップS119で複数の文字列候補が特定された場合である。このため、ステップS114で特定された文字列候補を、あくまで図面に含まれると推定される文字列候補である推定文字列候補として出力する。 On the other hand, step S122 is executed when the reliability of the recognition result of the re-recognition processing is determined to be less than the allowable level in step S118 or when a plurality of character string candidates are specified in step S119. Therefore, the character string candidates identified in step S114 are output as estimated character string candidates that are character string candidates estimated to be included in the drawing.

また、ステップS124が実行されるのは、正規表現で表される文字列と一致する誤認識文字列候補が存在しない場合である。このため、誤認識文字列候補に近い文字列を正規表現で表される文字列から検索する。具体的には、正規表現で表される文字列の中から、誤認識文字列候補と異なる文字の数が最も少ない文字列を検索する。そして、検索した文字列を推定文字列候補として出力する。 Further, step S124 is executed when there is no erroneously recognized character string candidate that matches the character string represented by the regular expression. Therefore, a character string close to the erroneously recognized character string candidate is searched from the character string represented by the regular expression. Specifically, the character string represented by the regular expression is searched for the character string having the smallest number of characters different from the erroneously recognized character string candidate. Then, the retrieved character string is output as an estimated character string candidate.

ステップS126では、ステップS106で認識された全ての文字列についてステップS108〜S124の処理を実行したか否かを判定する。そして、ステップS106で認識された全ての文字列についてステップS108〜S124の処理を実行した場合は本ルーチンを終了する。一方、ステップS106で認識された全ての文字列についてステップS108〜S124の処理を実行していない場合は、ステップS108へ移行し、全ての文字列の処理が終了するまでステップS108〜S124の処理を繰り返す。 In step S126, it is determined whether or not the processes of steps S108 to S124 have been executed for all the character strings recognized in step S106. Then, when the processes of steps S108 to S124 have been executed for all the character strings recognized in step S106, this routine ends. On the other hand, if the processes of steps S108 to S124 have not been executed for all the character strings recognized in step S106, the process proceeds to step S108, and the processes of steps S108 to S124 are performed until the processing of all the character strings is completed. repeat.

このように、本実施形態では、OCR処理によって画像から認識された文字列から、正規表現で表された抽出パターンを用いて文字列候補を抽出する。そして、OCR処理が誤認識する誤認識パターンを用いて文字列候補を修正し、正規表現を用いて、修正された文字列候補の中から特定した文字列候補を出力する。 As described above, in this embodiment, character string candidates are extracted from the character string recognized from the image by the OCR process using the extraction pattern represented by the regular expression. Then, the OCR process corrects the character string candidates using the erroneous recognition pattern, and the regular expression is used to output the character string candidates identified from the corrected character string candidates.

なお、第1実施形態では、図3のステップS110において、ユーザー指定の誤認識パターンを定義した誤認識パターン情報46を用いて生成した文字列を誤認識文字列候補に追加しているが、ステップS110の処理を省略してもよい。 In the first embodiment, in step S110 of FIG. 3, the character string generated using the misrecognized pattern information 46 defining the user-specified misrecognized pattern is added to the misrecognized character string candidates. The process of S110 may be omitted.

次に、文字列候補を特定する場合の具体例について説明する。 Next, a specific example of specifying a character string candidate will be described.

・具体例1 ・Specific example 1

具体例1では、正規表現が[F][X][1][0][A-Z][A-Z][0-9][0-9][0-9]、図面に含まれる実際の文字列が“FX10AA106”である。 In Example 1, the regular expression is [F][X][1][0][AZ][AZ][0-9][0-9][0-9], the actual string included in the drawing. Is "FX10AA106".

上記の条件でOCR処理を実行すると、認識した文字列候補は“FXIOAAIO6”であった。すなわち、3、4文字目の“10”が“IO”に、7、8文字目の“10”が“IO”に誤認識されている。 When the OCR process was executed under the above conditions, the recognized character string candidate was "FXIOAAIO6". That is, the third and fourth characters "10" are mistakenly recognized as "IO", and the seventh and eighth characters "10" are mistakenly recognized as "IO".

次に、再認識処理の結果は、“FX10AA106”となり、図面に含まれる実際の文字列と完全に一致した。なお、再認識処理のスコアは閾値以上であった。また、誤認識文字列候補としては、再認識処理により認識された文字列も含めて、“FX10AA106”、“FX1OAA106”、“FX1oAA06”、“FX10AA1O6”、“FX10AA1o6”等が生成された。なお、具体例1では、ユーザー指定の誤認識パターン情報を用いて誤認識文字列候補を更に生成する処理は実行しなかった。 Next, the result of the re-recognition process was “FX10AA106”, which completely matched the actual character string included in the drawing. The score of the re-recognition process was equal to or higher than the threshold. In addition, as the erroneously recognized character string candidates, “FX10AA106”, “FX1OAA106”, “FX1oAA06”, “FX10AA1O6”, “FX10AA1o6”, etc. were generated including the character strings recognized by the re-recognition process. In addition, in the specific example 1, the process of further generating the misrecognized character string candidate by using the misrecognized pattern information designated by the user is not executed.

誤認識文字列候補のうち、正規表現を用いて不要な文字列候補を除外すると、“FX10AA106”のみが残る。この誤認識文字列候補は、正規表現で表される文字列である。このため、図面に記載された文字列候補として“FX10AA106”が特定され、出力される。この文字列は、図面に含まれる実際の文字列と完全に一致している。 If unnecessary character string candidates are excluded from the misrecognized character string candidates by using a regular expression, only "FX10AA106" remains. This erroneously recognized character string candidate is a character string represented by a regular expression. Therefore, “FX10AA106” is specified and output as the character string candidate described in the drawing. This string exactly matches the actual string contained in the drawing.

・具体例2 ・Specific example 2

具体例2では、再認識処理のスコアが閾値未満であること以外は具体例1と同じである。 The specific example 2 is the same as the specific example 1 except that the score of the re-recognition process is less than the threshold value.

具体例2では、具体例1と同様に、図面に記載された文字列候補として、図面に含まれる実際の文字列と完全に一致する“FX10AA106”が特定されるが、再認識処理のスコアが閾値未満であるため信頼性が低い。従って、文字列候補“FX10AA106”は、あくまで図面に含まれると推定される文字列候補である推定文字列候補として出力される。 In the second specific example, as in the first specific example, “FX10AA106” that exactly matches the actual character string included in the drawing is specified as the character string candidate described in the drawing, but the score of the re-recognition process is Since it is less than the threshold value, the reliability is low. Therefore, the character string candidate “FX10AA106” is output as an estimated character string candidate which is a character string candidate estimated to be included in the drawing.

・具体例3 ・Specific example 3

具体例3では、正規表現が[F][X][1][0][A-Z][A-Z][0-9][0-9][0-9,A-Z]、図面に含まれる実際の文字列が“FX10AA106”である。 In Example 3, the regular expression is [F][X][1][0][AZ][AZ][0-9][0-9][0-9,AZ] The character string is "FX10AA106".

上記の条件でOCR処理を実行すると、認識した文字列候補は“FXIOAAIOG”であった。すなわち、3、4文字目の“10”が“IO”に、7〜9文字目の“106”が“IOG”に誤認識されている。 When the OCR process was executed under the above conditions, the recognized character string candidate was "FXIOAAIOG". That is, the third and fourth characters “10” are erroneously recognized as “IO”, and the seventh to ninth characters “106” are erroneously recognized as “IOG”.

次に、再認識処理の結果は、“FX10AA10G”となり、9文字目の“6”が“G”に誤認識されている。なお、再認識処理のスコアは閾値以上であった。
また、誤認識文字列候補としては、再認識処理により認識された文字列も含めて、“FX10AA10G”、“FX1OAA10G”、“FX1oAA0G”、“FX10AA1OG”、“FX10AA1oG”等が生成された。
Next, the result of the re-recognition process is "FX10AA10G", and the ninth character "6" is erroneously recognized as "G". The score of the re-recognition process was equal to or higher than the threshold.
In addition, as the erroneously recognized character string candidates, "FX10AA10G", "FX1OAA10G", "FX1oAA0G", "FX10AA1OG", "FX10AA1oG", etc. were generated, including the character strings recognized by the re-recognition process.

また、具体例3では、ユーザー指定の誤認識パターン情報を用いて生成した文字列を誤認識文字列候補に追加した。ユーザー指定の誤認識パターン情報は、誤認識パターンとして“6:G”が定義されている。このため、誤認識文字列候補として“FX10AA106”、“FX10AA10G”を生成して追加した。 Moreover, in the specific example 3, the character string generated using the user-specified misrecognition pattern information is added to the misrecognized character string candidates. In the user-specified misrecognition pattern information, "6:G" is defined as the misrecognition pattern. Therefore, "FX10AA106" and "FX10AA10G" are generated and added as the misrecognized character string candidates.

誤認識文字列候補のうち、正規表現を用いて不要な文字列候補を除外すると、“FX10AA106”、“FX10AA10G”が残る。これらの誤認識文字列候補は、何れも正規表現で表される文字列であるため、推定文字列候補として出力される。 If unnecessary character string candidates are excluded from the misrecognized character string candidates using regular expressions, "FX10AA106" and "FX10AA10G" remain. Since all of these erroneously recognized character string candidates are character strings represented by regular expressions, they are output as estimated character string candidates.

(第2実施形態) (Second embodiment)

次に、第2実施形態について説明する。なお、第1実施形態と同一部分には同一符号を付し、詳細な説明は省略する。第2実施形態では、図面から抽出したい情報がプラスチック部品の材質を表す文字列である場合について説明する。 Next, a second embodiment will be described. The same parts as those in the first embodiment are designated by the same reference numerals, and detailed description thereof will be omitted. In the second embodiment, a case will be described in which the information to be extracted from the drawing is a character string representing the material of the plastic part.

プラスチック部品の材質の表示方法は、JIS(日本工業規格)で規定されている。例えば、単一のポリマー等の部品の表示は、JIS K 6899−1で規定された材料の略語を境界文字“>”及び“<”で挟むことになっている。例えば、材料がアクリロニトリル−ブタジエン−スチレンであり、この略語がABSである場合は、“>ABS<”と表記される。 The method of displaying the material of plastic parts is specified by JIS (Japanese Industrial Standard). For example, in the display of a single polymer or the like, an abbreviation of a material defined by JIS K 6899-1 is to be sandwiched by boundary characters ">" and "<". For example, when the material is acrylonitrile-butadiene-styrene and this abbreviation is ABS, it is written as ">ABS<".

また、プラスチック部品の材質の表示では、材料の略語の他に、“−”、“+”、“(”、“)”等が区切り文字として使用されたり、質量分率又は材料の含有率等を表す数字が使用されたりする。例えば“>PA66−(GF25+MD15)<”と表記されている場合、ガラス繊維(GF)25質量%と鉱物粉末(MD)15質量%の混合物を含むポリアミド66を表す。 In addition, in the display of the material of the plastic parts, in addition to the material abbreviation, "-", "+", "(", ")", etc. are used as delimiters, and the mass fraction or the content rate of the material, etc. A number that represents is used. For example, the expression ">PA66-(GF25+MD15)<" indicates polyamide 66 containing a mixture of 25% by mass of glass fiber (GF) and 15% by mass of mineral powder (MD).

必要とされるのは材料の略語を含む文字列であり、境界文字は不要である。このため、第2実施形態では、境界文字で挟まれた文字列については、境界文字を除外した文字列を必要文字列として抽出する。 All that is needed is a string containing the material abbreviations, and no delimiters. Therefore, in the second embodiment, for the character string sandwiched by the boundary characters, the character string excluding the boundary characters is extracted as the necessary character string.

図8には、第2実施形態に係るCPU10Aの機能ブロック図を示した。図8に示す機能ブロック図は、必要文字列抽出部31が設けられている点が図2に示す機能ブロック図と異なる。 FIG. 8 shows a functional block diagram of the CPU 10A according to the second embodiment. The functional block diagram shown in FIG. 8 is different from the functional block diagram shown in FIG. 2 in that a necessary character string extraction unit 31 is provided.

必要文字列抽出部31は、再認識処理部30による再認識処理により認識された文字列から必要文字列を抽出する。具体的には、再認識処理により認識された文字列に境界文字が含まれているか否かを判定する。そして、再認識処理により認識された文字列に境界文字が含まれている場合には、境界文字を除外した文字列を必要文字列として抽出する。 The required character string extraction unit 31 extracts a required character string from the character string recognized by the re-recognition processing by the re-recognition processing unit 30. Specifically, it is determined whether the character string recognized by the re-recognition process includes a boundary character. Then, when the character string recognized by the re-recognition processing includes a boundary character, the character string excluding the boundary character is extracted as a necessary character string.

次に、図9を参照して、本実施の形態に係る情報処理装置10の作用を説明する。図9に示す情報処理が図3に示す情報処理と異なるのは、ステップS107の処理が追加されている点である。 Next, the operation of the information processing device 10 according to the present embodiment will be described with reference to FIG. The information processing shown in FIG. 9 is different from the information processing shown in FIG. 3 in that the processing of step S107 is added.

ステップS107では、ステップS106の再認識処理により認識された文字列の各々について、必要文字列を抽出する処理を行う。すなわち、再認識処理により認識された文字列のうち、境界文字“>”及び“<”で挟まれた文字列を抽出する。そして、境界文字“>”及び“<”で挟まれた文字列については、境界文字を除いた文字列を必要文字列として抽出する。例えば再認識処理で認識された文字列が“>ABS<”の場合は、境界文字を除外した“ABS”を必要文字列として抽出する。また、再認識処理で認識された文字列が“>PA66−(GF25+MD15)<”の場合は、境界文字を除外した“PA66−(GF25+MD15)”を必要文字列として抽出する。 In step S107, a process of extracting a necessary character string is performed for each of the character strings recognized by the re-recognition process of step S106. That is, of the character strings recognized by the re-recognition process, the character string sandwiched between the boundary characters “>” and “<” is extracted. Then, for the character string sandwiched between the boundary characters “>” and “<”, the character string excluding the boundary character is extracted as a required character string. For example, when the character string recognized in the re-recognition process is “>ABS<”, “ABS” excluding the boundary character is extracted as the necessary character string. If the character string recognized in the re-recognition process is ">PA66-(GF25+MD15)<", "PA66-(GF25+MD15)" excluding the boundary character is extracted as the necessary character string.

次に、文字列候補を特定する場合の具体例について説明する。 Next, a specific example of specifying a character string candidate will be described.

・具体例1 ・Specific example 1

具体例1では、正規表現が[>][][][][][][][][][][][][][][][][][][][][][][][][<] 、図面に含まれる実際の文字列が“>PA66-(GF25+MD15)<”である。 In Specific Example 1, the regular expression is [>][][][][][][][][][][][][][][][][][][][][][ ][][][][<], the actual string contained in the drawing is “>PA66-(GF25+MD15)<”.

上記の条件でOCR処理を実行すると、認識した文字列候補は“>PAGG-(GF2S+MDI5)<”であった。すなわち、4、5文字目の“66”が“GG”に、10文字目の“5”が“S”に、14文字目の“1”が“I”に誤認識されている。 When the OCR process was executed under the above conditions, the recognized character string candidate was ">PAGG-(GF2S+MDI5)<". That is, the fourth and fifth characters "66" are mistakenly recognized as "GG", the tenth character "5" as "S", and the fourteenth character "1" as "I".

次に、再認識処理の結果は、“>PA66-(GF25+MD15)<”となり、再認識処理のスコアは閾値以上であった。この文字列は、正規表現で表される文字列と一致する。このため、図面に記載された文字列候補として“PA66-(GF25+MD15)”が特定され、出力される。 Next, the result of the re-recognition process was “>PA66-(GF25+MD15)<”, and the score of the re-recognition process was not less than the threshold. This string matches the string represented by the regular expression. Therefore, "PA66-(GF25+MD15)" is specified and output as the character string candidate described in the drawing.

・具体例2 ・Specific example 2

具体例2は、再認識処理のスコアが閾値未満である点以外は具体例1と同じである。この場合、再認識処理の認識結果の信頼性が低いので、“PA66-(GF25+MD15)”は推定文字列候補として出力される。 The specific example 2 is the same as the specific example 1 except that the score of the re-recognition process is less than the threshold value. In this case, since the reliability of the recognition result of the re-recognition process is low, "PA66-(GF25+MD15)" is output as the estimated character string candidate.

以上、各実施形態を用いて本発明について説明したが、本発明は各実施形態に記載の範囲には限定されない。本発明の要旨を逸脱しない範囲で各実施形態に多様な変更または改良を加えることができ、当該変更または改良を加えた形態も本発明の技術的範囲に含まれる。 Although the present invention has been described above using each embodiment, the present invention is not limited to the scope described in each embodiment. Various modifications and improvements can be added to each embodiment without departing from the gist of the present invention, and the modes to which the modifications or improvements are added are also included in the technical scope of the present invention.

例えば上記各実施形態では、情報処理装置が複合機に適用される場合を例に説明したが、スマートフォン又はタブレット端末等に適用してもよい。この場合、スマートフォン又はタブレット端末に搭載されたカメラで図面を撮影し、撮影した画像に対して図3又は図9の処理を実行すればよい。 For example, in each of the above-described embodiments, the case where the information processing apparatus is applied to the multifunction peripheral has been described as an example, but the information processing apparatus may be applied to a smartphone, a tablet terminal, or the like. In this case, a drawing may be taken with a camera mounted on a smartphone or a tablet terminal, and the process of FIG. 3 or 9 may be executed on the taken image.

また、例えば、図3、9に示した情報処理をASIC(Application Specific Integrated Circuit)等のハードウェアで実現するようにしてもよい。この場合、ソフトウエアで実現する場合に比べて、処理の高速化が図られる。 Further, for example, the information processing shown in FIGS. 3 and 9 may be realized by hardware such as an ASIC (Application Specific Integrated Circuit). In this case, the processing speed can be increased as compared with the case of being realized by software.

また、各実施形態では、情報処理プログラムが記憶部7にインストールされている形態を説明したが、これに限定されるものではない。本実施形態に係る情報処理プログラムを、コンピュータ読取可能な記憶媒体に記録した形態で提供してもよい。例えば、本実施形態に係る情報処理プログラムを、CD(Compact Disc)−ROM及びDVD(Digital Versatile Disc)−ROM等の光ディスクに記録した形態、若しくはUSB(Universal Serial Bus)メモリ及びメモリカード等の半導体メモリに記録した形態で提供してもよい。また、本実施形態に係る情報処理プログラムを、通信部6に接続された通信回線を介して外部装置から取得するようにしてもよい。 Further, in each of the embodiments, the mode in which the information processing program is installed in the storage unit 7 has been described, but the invention is not limited to this. The information processing program according to the present embodiment may be provided in a form recorded in a computer-readable storage medium. For example, the information processing program according to the present embodiment is recorded in an optical disc such as a CD (Compact Disc)-ROM and a DVD (Digital Versatile Disc)-ROM, or a semiconductor such as a USB (Universal Serial Bus) memory and a memory card. You may provide in the form recorded on memory. Further, the information processing program according to the present embodiment may be acquired from an external device via a communication line connected to the communication unit 6.

1 画像形成装置
2 スキャナ部
3 画像形成部
4 操作部
5 表示部
6 通信部
7 記憶部
10 情報処理装置
20 OCR処理部
22 取得部
24 抽出部
26 修正部
28 出力部
30 再認識処理部
31 必要文字列抽出部
32 生成部
40 情報処理プログラム
42 正規表現情報
44 誤認識文字情報
46 誤認識パターン情報
50 画像
1 image forming apparatus 2 scanner section 3 image forming section 4 operation section 5 display section 6 communication section 7 storage section 10 information processing apparatus 20 OCR processing section 22 acquisition section 24 extraction section 26 correction section 28 output section 30 re-recognition processing section 31 required Character string extraction unit 32 Generation unit 40 Information processing program 42 Regular expression information 44 False recognition character information 46 False recognition pattern information 50 Image

Claims (12)

文字認識処理によって画像から認識された文字列を取得する取得部と、
前記取得部で取得された文字列から、正規表現で表された抽出パターンを用いて文字列候補を抽出する抽出部と、
前記文字認識処理が誤認識する誤認識パターンを用いて前記文字列候補を修正する修正部と、
前記正規表現を用いて、前記修正部で修正された文字列候補の中から特定した文字列候補を出力する出力部と、
を備えた情報処理装置。
An acquisition unit that acquires a character string recognized from an image by character recognition processing,
From the character string acquired by the acquisition unit, an extraction unit that extracts character string candidates using an extraction pattern represented by a regular expression,
A correction unit that corrects the character string candidates using an erroneous recognition pattern that the character recognition process erroneously recognizes,
An output unit that outputs the character string candidates identified from the character string candidates corrected by the correction unit using the regular expression,
Information processing device equipped with.
前記抽出部は、前記誤認識パターンを用いて前記正規表現を修正した修正正規表現で表された修正抽出パターンを用いて前記文字列候補を抽出する
請求項1記載の情報処理装置。
The information processing apparatus according to claim 1, wherein the extraction unit extracts the character string candidates using a modified extraction pattern represented by a modified regular expression obtained by modifying the regular expression using the misrecognition pattern.
前記取得部は前記画像を取得し、
前記修正部は、特定の文字を対象として前記画像の文字認識処理を行う文字認識処理部と、
前記文字認識処理部により認識された文字列候補と同型の文字列候補である誤認識文字列候補を生成する生成部と、
を含み、
前記出力部は、前記誤認識文字列候補の中から特定した文字列候補を出力する
請求項1又は請求項2記載の情報処理装置。
The acquisition unit acquires the image,
The correction unit, a character recognition processing unit for performing character recognition processing of the image for a specific character,
A generation unit that generates a misrecognized character string candidate that is a character string candidate of the same type as the character string candidate recognized by the character recognition processing unit;
Including
The information processing apparatus according to claim 1, wherein the output unit outputs a character string candidate specified from the misrecognized character string candidates.
前記生成部は、ユーザーによって指定された誤認識パターンを用いて生成した文字列を前記誤認識文字列候補に追加する
請求項3記載の情報処理装置。
The information processing apparatus according to claim 3, wherein the generation unit adds a character string generated using an erroneous recognition pattern designated by a user to the erroneously recognized character string candidate.
前記生成部は、前記抽出パターンで表される文字列候補を除いて前記誤認識文字列候補を生成する
請求項3又は請求項4記載の情報処理装置。
The information processing apparatus according to claim 3, wherein the generation unit generates the misrecognized character string candidate by excluding the character string candidate represented by the extraction pattern.
前記文字認識処理部は、文字認識の精度を表すスコアを算出し、
前記出力部は、前記スコアが予め定めた閾値以上の場合に、前記特定した文字列候補を出力する
請求項3〜5の何れか1項に記載の情報処理装置。
The character recognition processing unit calculates a score representing the accuracy of character recognition,
The information processing apparatus according to claim 3, wherein the output unit outputs the specified character string candidate when the score is equal to or higher than a predetermined threshold value.
前記文字認識処理部は、文字認識の精度を表すスコアを算出し、
前記出力部は、前記スコアが予め定めた閾値未満の場合に、前記特定した文字列候補を推定文字列候補として出力する
請求項3〜5の何れか1項に記載の情報処理装置。
The character recognition processing unit calculates a score representing the accuracy of character recognition,
The information processing apparatus according to claim 3, wherein the output unit outputs the specified character string candidate as an estimated character string candidate when the score is less than a predetermined threshold value.
前記文字認識処理部は、文字認識の精度を表すスコアを算出し、
前記出力部は、前記スコアが予め定めた閾値以上で且つ前記特定した文字列候補が複数の場合に、複数の前記特定した文字列候補を推定文字列候補として出力する
請求項3〜5の何れか1項に記載の情報処理装置。
The character recognition processing unit calculates a score representing the accuracy of character recognition,
The output unit outputs a plurality of the specified character string candidates as an estimated character string candidate when the score is equal to or more than a predetermined threshold and the specified character string candidates are plural. The information processing apparatus according to item 1.
前記文字認識処理部により文字認識された文字列から必要な文字列である必要文字列を抽出する必要文字列抽出部を更に備え、
前記生成部は、前記必要文字列抽出部により抽出された前記必要文字列と同型の文字列候補である誤認識文字列候補を生成する
請求項3〜5の何れか1項に記載の情報処理装置。
Further comprising a necessary character string extraction unit for extracting a necessary character string that is a necessary character string from the character string recognized by the character recognition processing unit,
The information processing according to any one of claims 3 to 5, wherein the generation unit generates a misrecognized character string candidate that is a character string candidate having the same type as the necessary character string extracted by the necessary character string extraction unit. apparatus.
前記出力部は、前記正規表現で表される文字列に前記修正部で修正された文字列候補が存在しない場合、前記正規表現で表される文字列のうち、前記修正部で修正された文字列候補に近い文字列を推定文字列候補として出力する
請求項1〜5の何れか1項に記載の情報処理装置。
When the character string represented by the regular expression does not have a character string candidate modified by the modifying unit, the output unit includes a character string modified by the modifying unit among the character strings represented by the regular expression. The information processing apparatus according to claim 1, wherein a character string close to a column candidate is output as an estimated character string candidate.
前記出力部は、前記正規表現で表される文字列のうち、前記修正部で修正された文字列候補と異なる文字の数が最も少ない文字列を推定文字列候補として出力する
請求項10記載の情報処理装置。
The output unit outputs, as an estimated character string candidate, a character string having the smallest number of characters different from the character string candidate corrected by the correction unit among the character strings represented by the regular expression. Information processing device.
コンピュータを、請求項1〜11の何れか1項に記載の情報処理装置の各部として機能させるための情報処理プログラム。 An information processing program for causing a computer to function as each unit of the information processing apparatus according to claim 1.
JP2019016252A 2019-01-31 2019-01-31 Information processing device and information processing program Active JP7279382B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019016252A JP7279382B2 (en) 2019-01-31 2019-01-31 Information processing device and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019016252A JP7279382B2 (en) 2019-01-31 2019-01-31 Information processing device and information processing program

Publications (2)

Publication Number Publication Date
JP2020123273A true JP2020123273A (en) 2020-08-13
JP7279382B2 JP7279382B2 (en) 2023-05-23

Family

ID=71992810

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019016252A Active JP7279382B2 (en) 2019-01-31 2019-01-31 Information processing device and information processing program

Country Status (1)

Country Link
JP (1) JP7279382B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06223121A (en) * 1993-01-22 1994-08-12 Nec Corp Information retrieving device
JPH08171615A (en) * 1994-12-20 1996-07-02 Nec Corp Address reader
JPH09138836A (en) * 1995-11-13 1997-05-27 N T T Data Tsushin Kk Correcting system of character recognizing result
JP2000353215A (en) * 1999-06-11 2000-12-19 Nec Corp Character recognition device and recording medium where character recognizing program is recorded
JP2017199288A (en) * 2016-04-28 2017-11-02 キヤノン株式会社 Image processing device, image processing method and program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06223121A (en) * 1993-01-22 1994-08-12 Nec Corp Information retrieving device
JPH08171615A (en) * 1994-12-20 1996-07-02 Nec Corp Address reader
JPH09138836A (en) * 1995-11-13 1997-05-27 N T T Data Tsushin Kk Correcting system of character recognizing result
JP2000353215A (en) * 1999-06-11 2000-12-19 Nec Corp Character recognition device and recording medium where character recognizing program is recorded
JP2017199288A (en) * 2016-04-28 2017-11-02 キヤノン株式会社 Image processing device, image processing method and program

Also Published As

Publication number Publication date
JP7279382B2 (en) 2023-05-23

Similar Documents

Publication Publication Date Title
JP5372110B2 (en) Information output device, information output method, and computer program
US20140380169A1 (en) Language input method editor to disambiguate ambiguous phrases via diacriticization
JP2014182477A (en) Program and document processing device
US20060204094A1 (en) Translation device, translation program, and translation method
US20150261735A1 (en) Document processing system, document processing apparatus, and document processing method
JP4470913B2 (en) Character string search device and program
JP7279382B2 (en) Information processing device and information processing program
JP7279381B2 (en) Information processing device and information processing program
JP2020184275A (en) Image processing system, image processing method, and program
JP7021496B2 (en) Information processing equipment and programs
US11972208B2 (en) Information processing device and information processing method
US11508139B2 (en) Information processing apparatus and non-transitory computer readable medium
US20050251743A1 (en) Learning apparatus, program therefor and storage medium
Mohapatra et al. Spell checker for OCR
JP2008257543A (en) Image processing system and program
US11006015B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JP4517822B2 (en) Image processing apparatus and program
US20150043832A1 (en) Information processing apparatus, information processing method, and computer readable medium
US20140169676A1 (en) Information processing apparatus, information processing method, and computer-readable medium
JP5284342B2 (en) Character recognition system and character recognition program
US11574490B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
US20180307669A1 (en) Information processing apparatus
JP7463675B2 (en) Information processing device and information processing program
JP2020038576A (en) Electronic apparatus, image formation apparatus, electronic mail preparation support method and electronic mail preparation support program
WO2023062799A1 (en) Information processing system, manuscript type identification method, model generation method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230424

R150 Certificate of patent or registration of utility model

Ref document number: 7279382

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150