JP6300663B2 - Optical character recognition device and optical character recognition method - Google Patents

Optical character recognition device and optical character recognition method Download PDF

Info

Publication number
JP6300663B2
JP6300663B2 JP2014127811A JP2014127811A JP6300663B2 JP 6300663 B2 JP6300663 B2 JP 6300663B2 JP 2014127811 A JP2014127811 A JP 2014127811A JP 2014127811 A JP2014127811 A JP 2014127811A JP 6300663 B2 JP6300663 B2 JP 6300663B2
Authority
JP
Japan
Prior art keywords
character recognition
character
rate
reading
character line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014127811A
Other languages
Japanese (ja)
Other versions
JP2016009223A (en
Inventor
英靖 小玉
英靖 小玉
定裕 宮里
定裕 宮里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Information and Telecommunication Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information and Telecommunication Engineering Ltd filed Critical Hitachi Information and Telecommunication Engineering Ltd
Priority to JP2014127811A priority Critical patent/JP6300663B2/en
Priority to CN201410772788.8A priority patent/CN105320951B/en
Publication of JP2016009223A publication Critical patent/JP2016009223A/en
Application granted granted Critical
Publication of JP6300663B2 publication Critical patent/JP6300663B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

本発明は、読み取り対象の帳票等に文字の印字位置ずれや帳票カットずれが生じた場合であっても文字認識精度を確保することができる光学文字認識装置及び光学文字認識方法に関する。   The present invention relates to an optical character recognition device and an optical character recognition method capable of ensuring character recognition accuracy even when a character printing position deviation or a form cut deviation occurs in a form to be read.

一般に、所定レイアウトの帳票に記載又は印字された文字を光学的に認識する光学的文字認識装置は、帳票等の所定位置に印刷された文字を記入するための文字記入枠(読み取りフィールド)情報や印字文字フォント形式をフォーマット定義パラメータとして記憶しておき、この文字記入枠情報に従って帳票の定義位置の文字を認識するように構成されている。このフォーマット定義パラメータは、帳票寸法と、該帳票における読み取りフィールドの帳票内における垂直及び水平読み取りスタート位置並びにエンド位置の座標と、印字文字フォント形式と、読み取り対象文字種(英数字、仮名、片仮名、漢字、その他外国文字)が挙げられる。   In general, an optical character recognition device that optically recognizes a character written or printed on a form having a predetermined layout is a character entry frame (reading field) information for entering a character printed at a predetermined position of a form or the like. The print character font format is stored as a format definition parameter, and the character at the defined position of the form is recognized according to the character entry frame information. The format definition parameters include the form dimensions, the vertical and horizontal reading start position and end position coordinates in the form of the reading field of the form, the print character font format, and the character type to be read (alphanumeric, kana, katakana, kanji). , Other foreign characters).

しかしながら、この帳票は帳票印刷業者を変更した場合や自社内の汎用プリンタを用いて印刷されることがあり、この場合、帳票外形寸法の相違や用紙カットずれやプリンタによる印字精度によっては文字記入枠(読み取りフィールド)位置やバーコードが2次元バーコードに変更等の設定が予め設定した位置と異なる場合があり、この場合、帳票外形寸法、読み取りフィールド位置、読み取りフィールド内の字種、文字フォント形式、載桁数他の設定が予め定められたフォーマット定義パラメータの定義と異なり、読み取り精度が低下する課題があった。   However, this form may be printed when the form printing company is changed or by using a general-purpose printer in the company. In this case, depending on the difference in form external dimensions, paper cut deviation, and the printing accuracy by the printer, the character entry frame (Reading field) Settings such as changing the position and barcode to a two-dimensional barcode may differ from the preset position. In this case, form external dimensions, reading field position, character type in the reading field, character font format However, unlike the definition of the format definition parameter in which the setting of the number of digits and the like is set in advance, there is a problem that the reading accuracy is lowered.

読み取り精度の低下を防止する文字認識装置技術が記載された文献としては、下記の特許文献1が挙げられ、この特許文献1には、光学文字認識処理後の文字コードから適正な入力解像度で画像入力が行なわれたかを判定する適正解像度判定部及び入力画像に対して適正な入力解像度を決定する適正解像度決定部を設け、適正解像度判定部によって入力解像度の設定に問題があるとみなした場合、警報を出したり、前記適正入力解像度で再度画像入力を促したり、もしくは、画像処理部にて入力画像の解像度を適正入力解像度に変換することにより、適正な解像度の画像を効率的に得て画像入力の際に適正な入力解像度が設定されていない場合であっても、読み取り精度の低下を防止する技術が記載されている。   The following patent document 1 is cited as a document describing a character recognition device technique for preventing a decrease in reading accuracy. This patent document 1 describes an image with an appropriate input resolution from a character code after optical character recognition processing. When an appropriate resolution determining unit that determines whether input has been performed and an appropriate resolution determining unit that determines an appropriate input resolution for an input image are provided, and the appropriate resolution determining unit considers that there is a problem in setting the input resolution, An image with an appropriate resolution can be efficiently obtained by issuing an alarm, prompting image input again at the appropriate input resolution, or converting the resolution of the input image to an appropriate input resolution at the image processing unit. A technique for preventing a decrease in reading accuracy even when an appropriate input resolution is not set at the time of input is described.

特開2008−244545号公報JP 2008-244545 A

前記の特許文献に記載された技術は、入力画像に対して適正な入力解像度が設定されていない場合であっても読み取り精度の低下を防止することができるものの、前述の帳票外形寸法の相違や用紙カットずれやプリンタによる印字精度により文字記入枠(読み取りフィールド)位置が予め設定した位置と異なる場合、入力解像度の制御だけでは読み取り精度の低下を防止することができないという課題があった。   Although the technique described in the above patent document can prevent a decrease in reading accuracy even when an appropriate input resolution is not set for an input image, When the character entry frame (reading field) position is different from a preset position due to paper cut deviation or printing accuracy by the printer, there is a problem that the reading accuracy cannot be prevented from being lowered only by controlling the input resolution.

本発明の目的は、前述の従来技術による課題を解決しようとするものであり、フォーマット定義パラメータに定義された帳票外形寸法や読み取りフィールド位置他が異なる場合であっても文字認識精度を確保することができる光学文字認識装置及び光学文字認識方法を提供することである。   An object of the present invention is to solve the above-described problems caused by the prior art, and to ensure character recognition accuracy even when the form external dimensions and reading field positions defined in the format definition parameters are different. It is an object to provide an optical character recognition device and an optical character recognition method.

前記の目的を達成するために請求項1に記載の発明は、帳票外形寸法と文字行画像から文字行を切り出すための読み取りフィールド座標と認識フォント種とバーコード種と所定読取率の閾値とを含むフォーマット定義パラメータを用い、帳票の文字行成分画像を光学的に読み取り、読み取った文字行成分画像から文字行画像を抽出し、該抽出した文字行画像から文字を1文字ずつ切り出して文字認識を行って表示端末部に表示する中央演算部を備えた光学文字認識装置において、文字認識率が所定認識率の閾値を下回ると判定したとき、文字認識率の低下を警告するための警告表示画面を表示端末部に表示する第1工程と、該第1工程に続いて前記文字認識率の低下要因となる読み取りフィールド座標に基づく帳票寸法と切り出し位置と認識フォント種とバーコード種と読取率の各項目情報を表示する第2工程と、該第2工程により表示した帳票寸法と切り出し位置と認識フォント種とバーコード種と読取率の何れかが選択されたとき、該選択された前記各項目情報の何れかの項目と該項目に対するフォーマット定義パラメータの変更案を表示する第3工程と、該第3工程により表示した変更案を反映させると判定したとき、該変更案に基づいてフォーマット定義パラメータを変更する第4工程を実行することを特徴とし、請求項2に記載の発明は、前記中央演算部が、前記文字認識率の低下要因が読み取りフィールド座標の相違と判定したとき、前記フォーマット定義パラメータに定義された読み取りフィールド座標による切り出し領域位置を予め定められた単位で示す上下左右斜め上下左右に移動させ、移動させた切り出し領域位置で切り出した文字行画像に基づいて文字認識を行い、文字認識が可能か否かを判定し、文字認識が可能な切り出し領域を選定することを特徴とする。   In order to achieve the above-mentioned object, the invention described in claim 1 includes: a form outer dimension; a reading field coordinate for cutting out a character line from a character line image; a recognition font type; a bar code type; and a predetermined reading rate threshold. The format definition parameters included are used to optically read the character line component image of the form, extract the character line image from the read character line component image, and cut out characters one by one from the extracted character line image for character recognition In the optical character recognition device having a central processing unit that performs and displays on the display terminal unit, when it is determined that the character recognition rate is lower than the threshold of the predetermined recognition rate, a warning display screen for warning the decrease in the character recognition rate Recognizing the first step displayed on the display terminal unit and the form size and cutout position based on the read field coordinates that cause the reduction of the character recognition rate following the first step The second step of displaying each item information of the font type, the barcode type, and the reading rate, and any of the form size, the cutout position, the recognized font type, the barcode type, and the reading rate displayed by the second step are selected. When it is determined that any item of the selected item information and a change plan of the format definition parameter for the item are displayed, and the change plan displayed in the third step is reflected. A fourth step of changing the format definition parameter based on the proposed change is executed, and the central processing unit is characterized in that the reduction factor of the character recognition rate is read field coordinates. Up, down, left, right indicating the cutout region position in the read field coordinates defined in the format definition parameter in a predetermined unit Moving the image up / down / left / right, performing character recognition based on the character line image clipped at the moved clip region position, determining whether character recognition is possible, and selecting a clip region capable of character recognition. Features.

また、請求項3記載の発明は、帳票外形寸法と文字行画像から文字行を切り出すための読み取りフィールド座標と認識フォント種とバーコード種と所定読取率の閾値とを含むフォーマット定義パラメータを用い、帳票の文字行成分画像を光学的に読み取り、読み取った文字行成分画像から文字行画像を抽出し、該抽出した文字行画像から文字を1文字ずつ切り出して文字認識を行って表示端末部に表示する中央演算部を備えた光学文字認識装置の光学的文字認識方法において、中央演算部が、文字認識率が所定認識率の閾値を下回ると判定したとき、文字認識率の低下を警告するための警告表示画面を表示端末部に表示する第1工程と、該第1工程に続いて前記文字認識率の低下要因となる読み取りフィールド座標に基づく帳票寸法と切り出し位置と認識フォント種とバーコード種と読取率の各項目情報を表示する第2工程と、該第2工程により表示した帳票寸法と切り出し位置と認識フォント種とバーコード種と読取率の何れかが選択されたとき、該選択された前記各項目情報の何れかの項目と該項目に対するフォーマット定義パラメータの変更案を表示する第3工程と、該第3工程により表示した変更案を反映させると判定したとき、該変更案に基づいてフォーマット定義パラメータを変更することを特徴とし、請求項4に記載の発明は、前記中央演算部に、前記文字認識率の低下要因が読み取りフィールド座標の相違と判定したとき、前記フォーマット定義パラメータに定義された読み取りフィールド座標による切り出し領域位置を予め定められた単位で示す上下左右斜め上下左右に移動させ、移動させた切り出し領域位置で切り出した文字行画像に基づいて文字認識を行い、文字認識が可能か否かを判定させ、文字認識が可能な切り出し領域を選定させることを特徴とする。   The invention according to claim 3 uses a format definition parameter including a form external dimension, a reading field coordinate for cutting out a character line from a character line image, a recognition font type, a barcode type, and a threshold of a predetermined reading rate, Optically reads a character line component image of a form, extracts a character line image from the read character line component image, cuts out characters one by one from the extracted character line image, performs character recognition, and displays them on the display terminal unit In the optical character recognition method of the optical character recognition device provided with the central processing unit, when the central processing unit determines that the character recognition rate is lower than a predetermined recognition rate threshold, a warning for a decrease in the character recognition rate is issued. A first step of displaying a warning display screen on the display terminal unit, and a form size and a cutout based on the read field coordinates that cause a decrease in the character recognition rate following the first step. A second step of displaying each item information of position, recognized font type, barcode type, and reading rate, and any of the form size, cutout position, recognized font type, barcode type, and reading rate displayed in the second step Is selected, the third step of displaying any item of the selected item information and the format definition parameter change plan for the item, and the change plan displayed by the third step are reflected. When the determination is made, the format definition parameter is changed based on the proposed change, and the invention according to claim 4 is characterized in that the lowering factor of the character recognition rate is caused by the difference in the read field coordinates in the central processing unit. When determined, the upper, lower, left, and right sides of the cutout region position in the read field coordinates defined in the format definition parameter are shown in a predetermined unit. Characterized by moving to the left and right, performing character recognition based on the character line image clipped at the moved clip region position, determining whether character recognition is possible, and selecting a clip region capable of character recognition To do.

本発明による光学文字認識装置及び光学文字認識方法は、文字認識率が所定認識率の閾値を下回ると判定したとき、文字認識率の低下を警告するための警告表示画面を表示すると共に、文字認識率の低下要因となる読み取りフィールド座標に基づく帳票寸法と切り出し位置と認識フォント種とバーコード種と読取率の各項目情報を表示し、該表示した項目情報の何れかが選択されたとき、選択された前記各項目情報の何れかの項目と該項目に対するフォーマット定義パラメータの変更案を表示し、該表示した変更案を反映させると判定したとき、該変更案に基づいてフォーマット定義パラメータを変更することによって、フォーマット定義パラメータに定義された帳票外形寸法や読み取りフィールド位置他が異なる場合であっても文字認識精度を確保することができる。   The optical character recognition device and the optical character recognition method according to the present invention display a warning display screen for warning a decrease in the character recognition rate when the character recognition rate is determined to be lower than a predetermined recognition rate threshold, and character recognition. Displays item information such as form dimensions, cutout position, recognized font type, barcode type, and reading rate based on the reading field coordinates that cause the rate to decrease, and is selected when any of the displayed item information is selected. Display any item of the item information and the proposed change of the format definition parameter for the item, and when it is determined that the displayed change plan is reflected, change the format definition parameter based on the proposed change Therefore, even if the form external dimensions defined in the format definition parameter, the reading field position, etc. are different, It can be ensured.

本発明の実施形態による光学文字認識装置の基本構成を示す図。The figure which shows the basic composition of the optical character recognition apparatus by embodiment of this invention. 本実施形態による光学文字認識装置の基本動作フローを示す図。The figure which shows the basic operation | movement flow of the optical character recognition apparatus by this embodiment. 本実施形態による光学文字認識装置のスキュー処理フローを示す図。The figure which shows the skew processing flow of the optical character recognition apparatus by this embodiment. 本実施形態による光学文字認識装置のサジェスト処理フローを示す図。The figure which shows the suggestion processing flow of the optical character recognition apparatus by this embodiment. 本実施形態による読み取りフィールド及びサジェスト表示を示す図。The figure which shows the reading field and suggestion display by this embodiment. 本実施形態による複数のサジェスト表示例を示す図。The figure which shows the some suggestion display example by this embodiment. 本実施形態による読み取りフィールド位置の検索動作を示す図。FIG. 6 is a diagram showing a reading field position search operation according to the present embodiment.

以下、本発明による光学文字認識方法を実現する光学文字認識装置の一実施形態を図面を参照して詳細に説明する。
[構成]
本実施形態による光学的文字認識装置は、図1に示す如く、積層した帳票を1枚ずつ繰り出して搬送するソータ部13と、該ソータ部13により搬送される帳票の文字を光学的に読み取る画像撮像部10と、該画像撮像部10が読み取った帳票画像他を一時的に格納するメモリ15と、フォーマット定義パラメータと帳票画像と文字画像と認識文字等を格納する外部記憶部14と、文字画像の文字認識や本実施形態によるサジェスト機能を制御する中央演算部16と、文字画像・認識文字・画面他を表示する表示端末部12と、該表示端末部12に表示された画面をみて操作者により操作される操作端末部11と、認識文字等を他のコンピュータに送信する通信部17とを備え、該中央演算部16の制御によってソータ部13により搬送される帳票に印字された文字を画像撮像部10が読み取り、文字認識を行って外部記憶部14に格納するように構成されている。
Hereinafter, an embodiment of an optical character recognition apparatus for realizing an optical character recognition method according to the present invention will be described in detail with reference to the drawings.
[Constitution]
As shown in FIG. 1, the optical character recognition apparatus according to the present embodiment sorts a stacked form one by one and conveys it, and an image for optically reading the characters of the form conveyed by the sorter 13. An imaging unit 10, a memory 15 for temporarily storing a form image and the like read by the image imaging unit 10, an external storage unit 14 for storing a format definition parameter, a form image, a character image, a recognized character, and the like, a character image The central processing unit 16 for controlling the character recognition and the suggestion function according to the present embodiment, the display terminal unit 12 for displaying character images, recognized characters, screens, and the like, and the operator seeing the screen displayed on the display terminal unit 12 And a communication unit 17 that transmits recognized characters and the like to another computer, and is conveyed by the sorter unit 13 under control of the central processing unit Read the printed characters to form the image capturing unit 10 is configured to store by performing character recognition in the external storage unit 14.

前記フォーマット定義パラメータは、帳票外形寸法と、文字行画像から文字行を切り出すための読み取りフィールド座標(切り出し位置)と、認識フォント種と、バーコード種と、所定読取率の閾値とを含み、これら情報を用いて中央演算部16が文字行成分画像(複数の文字のみからなる文字行画像を含む広い範囲の画像)から文字行画像を切り出し、該切り出した文字行画像から文字を1文字ずつ切り出して文字認識を行うためのものである。   The format definition parameters include a form external dimension, a reading field coordinate (cutting position) for cutting out a character line from a character line image, a recognized font type, a barcode type, and a predetermined reading rate threshold. Using the information, the central processing unit 16 cuts out a character line image from a character line component image (a wide range of images including a character line image consisting of only a plurality of characters), and cuts out characters one by one from the cut out character line image. For character recognition.

このように構成された光学的文字認識装置の基本動作は、図2に示す如く、帳票1枚処理の開始により、中央演算部16が外部記憶部14に格納したフォーマット定義パラメータを受け取るステップS21と、ソータ部13により搬送された帳票の先端及び後端を図示しないセンサにより検出するステップS22と、帳票の左右端を検出し、文字が記載された文字領域画像を切り出すステップS23と、該ステップS23により切り出した文字領域画像から文字成分行画像を抽出するステップS24と、該ステップS24により抽出した文字成分行画像から文字行画像を切り出すために上下に行を振り分けるステップS25と、該ステップS25により上下に振り分けた文字行画像から文字毎に左右に振り分けるステップS26と、文字を1文字毎の文字画像として切り出すステップS27と、該ステップS27により切り出した文字画像を認識し、次の文字画像があると判定したときに前記ステップS24に戻るステップS28と、該ステップS28により認識した文字を転送し、1帳票の文字認識が終了したか否かを判定し、終了したと判定したときに処理を終了し、終了していないと判定したときに前記ステップS23に戻るステップS29とを実行することによって、搬送された帳票文字を認識するように動作する。   As shown in FIG. 2, the basic operation of the optical character recognition apparatus configured as described above is as follows. Step S21 receives the format definition parameter stored in the external storage unit 14 by the central processing unit 16 at the start of the one-sheet processing. Step S22 for detecting the leading and trailing ends of the form conveyed by the sorter unit 13 by a sensor (not shown), Step S23 for detecting the left and right ends of the form, and cutting out a character area image on which characters are described, and Step S23 Step S24 for extracting the character component line image from the character region image cut out by step S25, step S25 for distributing lines up and down to cut out the character line image from the character component line image extracted by step S24, and step S25 Step S26 for distributing characters to the left and right for each character from the character line image allocated to Step S27 for cutting out as a character image for each character, step S28 for recognizing the character image cut out at step S27 and returning to step S24 when it is determined that there is a next character image, and the character recognized at step S28 Is transferred, and it is determined whether or not the character recognition of one form has been completed, and when it is determined that the process has been completed, the process is terminated, and when it is determined that it has not been completed, step S29 is returned to step S23. By doing so, it operates to recognize the conveyed form characters.

この光学文字認識装置は、前記ステップS22により文字行成分画像を抽出するに際して搬送される帳票の搬送時や文字印字時のプリンタ搬送時の斜め搬送により文字行が帳票端に対して斜めにスキャンされた文字行画像のスキューを補正する機能を有し、このスキュー補正機能は、図3(a)に示す如く、幅W、高さLの帳票の左上端から座標(x,y)を起点として幅ω、高さtの読み取りフィールド(領域)が設定され、数字「5793」が印字され、図3(b)に示す文字行成分画像の如く、帳票の斜め搬送等によって読み取りフィールドが角度θだけ傾いてスキャンされた場合、文字行成分画像中の帳票の先端・後端・左端・右端を検出して規定の値との差異に基づいてスキュー量(角度θ)を検出する工程と、文字行画像を角度「−θ」だけ回転して図3(c)に示す文字行画像を抽出する工程と、図3(d)に示す如く、この文字行画像から規定の文字サイズに基づいて1文字を切りだす工程と、この切り出した1文字画像に基づいて図3(e)に示す数字「5」を認識するように動作する。   In this optical character recognition device, the character line is scanned obliquely with respect to the form edge by the oblique conveyance during the conveyance of the form conveyed when extracting the character line component image in the step S22 or the printer during the character printing. The skew correction function has a function for correcting the skew of the character line image. As shown in FIG. 3A, the skew correction function starts from the coordinates (x, y) from the upper left corner of the form having a width W and a height L. A reading field (area) having a width ω and a height t is set, a number “5793” is printed, and the reading field is set to an angle θ by oblique conveyance of a form or the like as in the character line component image shown in FIG. A step of detecting a skew amount (angle θ) based on a difference from a prescribed value by detecting the leading edge, trailing edge, left edge, and right edge of a form in a character line component image when scanned at an inclination; Angle the image a step of extracting the character line image shown in FIG. 3C by rotating by “θ”, and a step of cutting out one character from the character line image based on a prescribed character size as shown in FIG. The operation is performed so as to recognize the number “5” shown in FIG.

特に、本実施形態による光学文字認識装置は、1文字認識処理時に文字認識率の監視又は操作者からの指令によって、文字認識を支援するサジェスト機能(提案機能)を備え、このサジェスト機能は、図4に示す如く、中央演算部により、検定処理を開始するステップS41と、文字認識率の監視により認識率が所定認識率を下回る等に基づいて現在のフォーマット定義パラメータで問題がないか否かを判定し、問題ないと判定したときに処理を終了するステップS42と、該ステップS42におい問題あると判定したとき、操作者に対して警告内容(切り出し位置相違、フォント/バーコード相違、読取率、帳票定義内容の相違)に応じた後述する警告画面表示を行うステップS43と、該ステップS43に続いて詳細なサジェスト表示を行うステップS44と、該ステップS44により設定(切り出し位置、フォント/バーコード、帳票定義内容の相違)が変更されたときに当該設定内容の補正値を反映させるステップS45とを実行するように動作する。   In particular, the optical character recognition apparatus according to the present embodiment includes a suggestion function (proposed function) that supports character recognition by monitoring a character recognition rate or by an instruction from an operator during single character recognition processing. As shown in FIG. 4, whether or not there is no problem with the current format definition parameter based on step S41 in which the central processing unit starts the verification process and the recognition rate falls below a predetermined recognition rate by monitoring the character recognition rate. If it is determined that there is no problem, step S42 ends the process, and if it is determined that there is a problem in step S42, the warning content (cutout position difference, font / barcode difference, reading rate, Step S43 for displaying a warning screen (to be described later) according to the difference in form definition), and a detailed suggestion display following the step S43. Step S44 and step S45 for reflecting the correction value of the setting contents when the setting (difference in cutout position, font / barcode, form definition contents) is changed in step S44. .

前記ステップS43による警告画面表示は、例えば、警告内容が切り出し位置相違であり、図5(a)に示す如く、帳票幅がW、高さがL、読み取りフィールドの左上端座標が(Xs,Ys)、右下端座標が(Xe,Ye)の場合、図5(b)に示す如く、帳票スキャン結果である文字行画像51とフォーマット定義パラメータに設定された読み取りフィールド52とを表示することによって両者の位置の相違を図示すると共に定義値及び変更可能な補正値をドロップダウンメニュー(△▽)と共に表示し、該ドロップダウンメニューを操作することによって文字行画像51の位置にフォーマット定義パラメータによる読み取りフィールド52の位置を合わせることができる。   In the warning screen display in step S43, for example, the warning content is the cutout position difference, and as shown in FIG. 5A, the form width is W, the height is L, and the upper left coordinates of the reading field are (Xs, Ys). ), When the lower right coordinate is (Xe, Ye), as shown in FIG. 5B, the character line image 51 as the form scan result and the reading field 52 set in the format definition parameter are displayed. The definition value and the changeable correction value are displayed together with a drop-down menu (△ ▽), and the position of the character line image 51 is read at the position of the character line image 51 by operating the drop-down menu. 52 can be aligned.

この警告表示は、文字フォントに問題がある場合は図6(a)に示す如く定義フォントと近似フォント及び判定結果とを表示し、パラメータ反映により近似フォントに変更する画面と、認識率に問題がある場合は図6(b)に示す如くフィールド名と読取率と判定結果とを表示し、帳票サイズ等の帳票定義内容に問題がある場合は図6(c)に示す如く「帳票定義内容が帳票設計時と大きく異なると判定されました。」と所定時間表示し、この図6(c)の詳細ボタンの押下によって図6(d)に示す如く、「帳票寸法」「切り出し位置」「フェント/バーコード」「読取率」の各項目がメニュー表示し、例えば帳票寸法ポタンを押下したとき、図6(e)に示す如き帳票サイズの定義値と平均実測値と差異と判定結果を表示する。   When there is a problem with the character font, this warning display displays the definition font, the approximate font, and the determination result as shown in FIG. 6A, and there is a problem with the recognition rate and the screen for changing to the approximate font by reflecting the parameters. If there is a problem, the field name, the reading rate, and the determination result are displayed as shown in FIG. 6B. If there is a problem with the form definition content such as the form size, the “form definition content is displayed as shown in FIG. 6C”. “It was determined that it was significantly different from the time of form design.” Is displayed for a predetermined time, and when the detailed button in FIG. 6C is pressed, as shown in FIG. 6D, “form dimensions”, “cutting position”, “fent” Each item of “/ barcode” and “reading rate” is displayed as a menu, and when the form size button is pressed, for example, the definition value of the form size, the average measured value, the difference, and the determination result are displayed as shown in FIG. .

また、前記実施形態においては切り出し位置相違の警告表示画面が表示された場合、操作者が手動により切り出し領域の位置を調整する例を説明したが、本発明はこれに限られるものではなく、切り出し位置相違を検出したときに自動的に切り出し位置を調整しても良く、この実施形態は、図7(a)に示す如く、中央演算部がフォーマット定義パラメータの定義に従って従来同様に文字行画像を切り出しても認識精度が所定値に満たさないと判定した場合、図7(b)に示す如く、中央演算部が#形で示す中央の切り出し領域位置を予め定められた単位で矢印70から77に示す上下左右斜め上下左右に移動させ、移動させた切り出し領域位置で切り出した文字行画像に基づいて文字認識を行い、文字認識が可能か否かを判定し、文字認識が可能な切り出し領域を選定することによって、切り出し領域の位置を調整及び提案するように構成しても良い。   Further, in the embodiment, the example in which the operator manually adjusts the position of the cutout area when the warning display screen for the cutout position difference is displayed has been described, but the present invention is not limited to this, and the cutout is performed. When the position difference is detected, the cutout position may be automatically adjusted. In this embodiment, as shown in FIG. 7A, the central processing unit converts the character line image according to the definition of the format definition parameter as in the conventional case. If it is determined that the recognition accuracy does not satisfy the predetermined value even if the cutout is performed, as shown in FIG. The character is recognized based on the character line image cut out at the moved cutout region position, and it is determined whether character recognition is possible. By selecting the possible cut-out region may be configured to adjust and propose the position of the clip region.

このように本実施形態は、中央演算部16が、帳票外形寸法と文字行画像から文字行を切り出すための読み取りフィールド座標(切り出し位置)と認識フォント種とバーコード種と所定読取率の閾値とを含むフォーマット定義パラメータを用い、ソータ部13により搬送される帳票の文字行成分画像を画像撮像部10により光学的に読み取り、読み取った文字行成分画像から文字行画像を抽出し、該抽出した文字行画像から文字を1文字ずつ切り出して文字認識を行って表示端末部12に表示する光学文字認識装置及び光学文字認識において、前記中央演算部16が、文字認識率が所定認識率の閾値を下回ると判定したとき、文字認識率の低下を警告するための警告表示画面を表示端末部12に表示する第1工程と、該第1工程に続いて前記文字認識率の低下要因となる読み取りフィールド座標に基づく帳票寸法と切り出し位置と認識フォント種とバーコード種と読取率の各項目情報を表示する第2工程と、該第2工程により表示した帳票寸法と切り出し位置と認識フォント種とバーコード種と読取率の何れかが選択されたとき、該選択された前記各項目情報の何れかの項目と該項目に対するフォーマット定義パラメータの変更案を表示する第3工程と、該第3工程により表示した変更案を反映させると判定したとき、該変更案に基づいてフォーマット定義パラメータを変更することによって、フォーマット定義パラメータに定義された帳票外形寸法や読み取りフィールド位置他が異なる場合であっても文字認識精度を確保することができる。   As described above, according to the present embodiment, the central processing unit 16 reads the outline dimensions of the form, the reading field coordinates (cutting position) for cutting out the character line from the character line image, the recognized font type, the barcode type, and the predetermined reading rate threshold value. The character line component image of the form conveyed by the sorter unit 13 is optically read by the image capturing unit 10, the character line image is extracted from the read character line component image, and the extracted character In the optical character recognition apparatus and the optical character recognition that cut out characters one by one from the line image and perform character recognition and display them on the display terminal unit 12, the central processing unit 16 has a character recognition rate below a predetermined recognition rate threshold. A first step of displaying a warning display screen for warning of a decrease in the character recognition rate on the display terminal unit 12 when the determination is made; A second step of displaying item information such as a form size based on a reading field coordinate, a cutout position, a recognized font type, a barcode type, and a reading rate, which cause a reduction in the character recognition rate, and a form size displayed in the second step When any one of the cutout position, the recognized font type, the barcode type, and the reading rate is selected, any item of the selected item information and a format definition parameter change proposal for the item are displayed. When it is determined that the change plan displayed in the third step and the third step is reflected, the format definition parameter is changed based on the change plan, so that the form outer dimension and the reading field position defined in the format definition parameter are changed. Even if the others are different, the character recognition accuracy can be ensured.

10 画像撮像部、11 操作端末部、12 表示端末部、13 ソータ部、
14 外部記憶部、15 メモリ、16 中央演算部、17 通信部
10 image capturing unit, 11 operation terminal unit, 12 display terminal unit, 13 sorter unit,
14 external storage unit, 15 memory, 16 central processing unit, 17 communication unit

Claims (4)

帳票外形寸法と文字行画像から文字行を切り出すための読み取りフィールド座標と認識フォント種とバーコード種と所定読取率の閾値とを含むフォーマット定義パラメータを用い、帳票の文字行成分画像を光学的に読み取り、読み取った文字行成分画像から文字行画像を抽出し、該抽出した文字行画像から文字を1文字ずつ切り出して文字認識を行って表示端末部に表示する中央演算部を備えた光学文字認識装置において、文字認識率が所定認識率の閾値を下回ると判定したとき、文字認識率の低下を警告するための警告表示画面を表示端末部に表示する第1工程と、該第1工程に続いて前記文字認識率の低下要因となる読み取りフィールド座標に基づく帳票寸法と切り出し位置と認識フォント種とバーコード種と読取率の各項目情報を表示する第2工程と、該第2工程により表示した帳票寸法と切り出し位置と認識フォント種とバーコード種と読取率の何れかが選択されたとき、該選択された前記各項目情報の何れかの項目と該項目に対するフォーマット定義パラメータの変更案を表示する第3工程と、該第3工程により表示した変更案を反映させると判定したとき、該変更案に基づいてフォーマット定義パラメータを変更する第4工程を実行することを特徴とする光学文字認識装置。   Using format definition parameters that include form external dimensions, reading field coordinates for extracting a character line from a character line image, recognition font type, barcode type, and threshold for a predetermined reading rate, the character line component image of the form is optically generated. Optical character recognition having a central processing unit that reads and extracts a character line image from the read character line component image, cuts out characters one by one from the extracted character line image, performs character recognition, and displays them on the display terminal unit In the apparatus, when it is determined that the character recognition rate is lower than the threshold of the predetermined recognition rate, a first step of displaying a warning display screen for warning of a decrease in the character recognition rate on the display terminal unit, and subsequent to the first step Displays information on each item such as form dimensions, cutout position, recognized font type, barcode type, and reading rate based on the reading field coordinates that cause the character recognition rate to decrease. Any one of the selected item information is selected when any one of the second step, the form size, the cutout position, the recognized font type, the barcode type, and the reading rate displayed in the second step is selected. A third step of displaying an item and a proposed change of the format definition parameter for the item, and a fourth step of changing the format definition parameter based on the changed plan when determined to reflect the changed plan displayed in the third step. An optical character recognition apparatus characterized by executing a process. 前記中央演算部が、前記文字認識率の低下要因が読み取りフィールド座標の相違と判定したとき、前記フォーマット定義パラメータに定義された読み取りフィールド座標による切り出し領域位置を予め定められた単位で示す上下左右斜め上下左右に移動させ、移動させた切り出し領域位置で切り出した文字行画像に基づいて文字認識を行い、文字認識が可能か否かを判定し、文字認識が可能な切り出し領域を選定することを特徴とする請求項1記載の光学的文字認識装置。   When the central processing unit determines that the factor of lowering the character recognition rate is a difference in reading field coordinates, the upper and lower, right and left diagonals indicate the cutout region position by the reading field coordinates defined in the format definition parameter in a predetermined unit. Move vertically and horizontally, perform character recognition based on the character line image clipped at the moved clip region position, determine whether character recognition is possible, and select a clip region that allows character recognition The optical character recognition device according to claim 1. 帳票外形寸法と文字行画像から文字行を切り出すための読み取りフィールド座標と認識フォント種とバーコード種と所定読取率の閾値とを含むフォーマット定義パラメータを用い、帳票の文字行成分画像を光学的に読み取り、読み取った文字行成分画像から文字行画像を抽出し、該抽出した文字行画像から文字を1文字ずつ切り出して文字認識を行って表示端末部に表示する中央演算部を備えた光学文字認識装置の光学的文字認識方法において、中央演算部が、文字認識率が所定認識率の閾値を下回ると判定したとき、文字認識率の低下を警告するための警告表示画面を表示端末部に表示する第1工程と、該第1工程に続いて前記文字認識率の低下要因となる読み取りフィールド座標に基づく帳票寸法と切り出し位置と認識フォント種とバーコード種と読取率の各項目情報を表示する第2工程と、該第2工程により表示した帳票寸法と切り出し位置と認識フォント種とバーコード種と読取率の何れかが選択されたとき、該選択された前記各項目情報の何れかの項目と該項目に対するフォーマット定義パラメータの変更案を表示する第3工程と、該第3工程により表示した変更案を反映させると判定したとき、該変更案に基づいてフォーマット定義パラメータを変更することを特徴とする光学文字認識方法。   Using format definition parameters that include form external dimensions, reading field coordinates for extracting a character line from a character line image, recognition font type, barcode type, and threshold for a predetermined reading rate, the character line component image of the form is optically generated. Optical character recognition having a central processing unit that reads and extracts a character line image from the read character line component image, cuts out characters one by one from the extracted character line image, performs character recognition, and displays them on the display terminal unit In the optical character recognition method of the apparatus, when the central processing unit determines that the character recognition rate is below a predetermined recognition rate threshold value, a warning display screen for warning that the character recognition rate is reduced is displayed on the display terminal unit. Form size, cutout position, recognized font type, and bar based on the first step and the reading field coordinates that cause the reduction of the character recognition rate following the first step When the second step of displaying each item information of the code type and the reading rate, and any of the form size, the cutout position, the recognized font type, the barcode type, and the reading rate displayed by the second step are selected, The third step of displaying any item of the selected item information and the format definition parameter change proposal for the item, and the change when it is determined to reflect the change plan displayed in the third step An optical character recognition method characterized by changing a format definition parameter based on a plan. 前記中央演算部に、前記文字認識率の低下要因が読み取りフィールド座標の相違と判定したとき、前記フォーマット定義パラメータに定義された読み取りフィールド座標による切り出し領域位置を予め定められた単位で示す上下左右斜め上下左右に移動させ、移動させた切り出し領域位置で切り出した文字行画像に基づいて文字認識を行い、文字認識が可能か否かを判定させ、文字認識が可能な切り出し領域を選定させることを特徴とする請求項3記載の光学的文字認識方法。
When the central processing unit determines that the factor of lowering the character recognition rate is a difference in reading field coordinates, the upper and lower, right and left diagonals indicate the cutout region position by the reading field coordinates defined in the format definition parameter in a predetermined unit. Move vertically and horizontally, perform character recognition based on the character line image clipped at the moved clip region position, determine whether character recognition is possible, and select a clip region that can be recognized The optical character recognition method according to claim 3.
JP2014127811A 2014-06-23 2014-06-23 Optical character recognition device and optical character recognition method Active JP6300663B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014127811A JP6300663B2 (en) 2014-06-23 2014-06-23 Optical character recognition device and optical character recognition method
CN201410772788.8A CN105320951B (en) 2014-06-23 2014-12-12 Optical character recognition device and optical character recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014127811A JP6300663B2 (en) 2014-06-23 2014-06-23 Optical character recognition device and optical character recognition method

Publications (2)

Publication Number Publication Date
JP2016009223A JP2016009223A (en) 2016-01-18
JP6300663B2 true JP6300663B2 (en) 2018-03-28

Family

ID=55226760

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014127811A Active JP6300663B2 (en) 2014-06-23 2014-06-23 Optical character recognition device and optical character recognition method

Country Status (2)

Country Link
JP (1) JP6300663B2 (en)
CN (1) CN105320951B (en)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956590A (en) * 2016-04-27 2016-09-21 泰合鼎川物联科技(北京)股份有限公司 Character recognition method and character recognition system
CN106096601B (en) * 2016-06-06 2019-06-18 深圳辰通智能股份有限公司 The method and system of character types in a kind of automatic detection bill
JP6614186B2 (en) * 2017-03-21 2019-12-04 カシオ計算機株式会社 Book document processing apparatus, book document processing method, and program
CN107016363B (en) * 2017-03-30 2020-06-05 理光图像技术(上海)有限公司 Bill image management device, bill image management system, and bill image management method
CN109426815B (en) * 2017-08-22 2022-05-10 顺丰科技有限公司 Bill region rotating and splitting method, system and equipment
JP7147208B2 (en) * 2018-03-20 2022-10-05 富士フイルムビジネスイノベーション株式会社 Information processing device and program
CN108734089B (en) * 2018-04-02 2023-04-18 腾讯科技(深圳)有限公司 Method, device, equipment and storage medium for identifying table content in picture file
JP6711523B2 (en) * 2018-05-25 2020-06-17 株式会社ふくおかフィナンシャルグループ Form recognition system
CN112308056A (en) * 2019-07-26 2021-02-02 深圳怡化电脑股份有限公司 Method, device and equipment for acquiring note characteristic region and storage medium
JP7486954B2 (en) * 2020-01-08 2024-05-20 Tis株式会社 Form processing program, form processing device, and form processing method
CN111291741B (en) * 2020-05-13 2020-11-03 太平金融科技服务(上海)有限公司 Receipt identification method and device, computer equipment and storage medium

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222289A (en) * 2011-08-02 2011-10-19 浙江大学 Optical character recognition (OCR)-based mobile phone financial management method and system
EP2660692A1 (en) * 2012-04-30 2013-11-06 BlackBerry Limited Configurable touchscreen keyboard
CN202694374U (en) * 2012-05-15 2013-01-23 深圳长城开发科技股份有限公司 Portable device for invoice identification
CN202584267U (en) * 2012-06-12 2012-12-05 丰豪盈彩(北京)科技有限公司 Ticket automatic identification system applying to mobile terminal
JP5284523B1 (en) * 2012-09-05 2013-09-11 株式会社東芝 Information processing system, program, and processing method of information processing system
JP6102156B2 (en) * 2012-09-28 2017-03-29 オムロン株式会社 Image processing system and image processing method
CN103208004A (en) * 2013-03-15 2013-07-17 北京英迈杰科技有限公司 Automatic recognition and extraction method and device for bill information area
CN103440507A (en) * 2013-09-03 2013-12-11 北京中电普华信息技术有限公司 Bill information verifying device and method for verifying bill information

Also Published As

Publication number Publication date
JP2016009223A (en) 2016-01-18
CN105320951B (en) 2018-11-20
CN105320951A (en) 2016-02-10

Similar Documents

Publication Publication Date Title
JP6300663B2 (en) Optical character recognition device and optical character recognition method
CN110069767B (en) Typesetting method based on electronic book, electronic equipment and computer storage medium
EP1628240B1 (en) Outlier detection during scanning
JP6569532B2 (en) Management system, list creation device, list creation method, management method, and management program
JP5904149B2 (en) Image inspection system and program
JP6264965B2 (en) Image processing apparatus, image processing method, and image processing program
EP1703444A2 (en) Detecting an orientation of characters in a document image
JP6558435B2 (en) Color measuring device and color measuring method
WO2011129113A1 (en) Form processing device, form processing method, and recording medium
US10853010B2 (en) Image processing apparatus, image processing method, and storage medium
JP6921522B2 (en) Image processing device and its control method and program
KR20170140313A (en) Image reading apparatus, image reading method, and image reading program
JP2013171309A (en) Character segmentation method, and character recognition device and program using the same
JP5217872B2 (en) Symbol reader and program
JP7241506B2 (en) Correction support device and correction support program for optical character recognition results
US10706337B2 (en) Character recognition device, character recognition method, and recording medium
US10395133B1 (en) Image box filtering for optical character recognition
JP2009272962A (en) Image processor
JP4631384B2 (en) Printing state inspection method, character inspection method, and inspection apparatus using these methods
JP5844698B2 (en) Character recognition device
JP2010020809A (en) Magnetic ink character reading apparatus and reading processing method thereof
JP6743401B2 (en) Form design/read setting support device, form design/read setting support method, and optical character recognition system
JP6391745B1 (en) Printing character cutting method and printing inspection device
JP4922151B2 (en) Form reading system, form reading method, and program
JP4194301B2 (en) Character recognition system and character recognition program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180227

R150 Certificate of patent or registration of utility model

Ref document number: 6300663

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250