WO2020045039A1 - Ocrシステム - Google Patents

Ocrシステム Download PDF

Info

Publication number
WO2020045039A1
WO2020045039A1 PCT/JP2019/031435 JP2019031435W WO2020045039A1 WO 2020045039 A1 WO2020045039 A1 WO 2020045039A1 JP 2019031435 W JP2019031435 W JP 2019031435W WO 2020045039 A1 WO2020045039 A1 WO 2020045039A1
Authority
WO
WIPO (PCT)
Prior art keywords
ocr
document
issuer
information
mark
Prior art date
Application number
PCT/JP2019/031435
Other languages
English (en)
French (fr)
Inventor
智広 川▲崎▼
Original Assignee
京セラドキュメントソリューションズ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 京セラドキュメントソリューションズ株式会社 filed Critical 京セラドキュメントソリューションズ株式会社
Priority to CN201980055493.XA priority Critical patent/CN112639818B/zh
Priority to JP2020540225A priority patent/JP7176566B2/ja
Priority to US17/272,092 priority patent/US11972197B2/en
Publication of WO2020045039A1 publication Critical patent/WO2020045039A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/245Font recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Definitions

  • the present invention relates to an OCR system that acquires character data from a document by OCR processing.
  • the specific information mark when the specific information mark does not overlap with at least one character of the character string that the user desires to acquire as the specific information, the specific information mark does not overlap. Since characters are not acquired as a part of specific information, there is a problem that a character string desired by a user cannot be appropriately acquired.
  • an object of the present invention is to provide an OCR system that can improve the accuracy of character recognition in OCR processing.
  • Another object of the present invention is to provide an OCR system capable of reducing the burden of correcting character data obtained from a document by OCR processing.
  • Another object of the present invention is to provide an OCR system capable of improving the possibility of properly obtaining a character string desired by a user.
  • an OCR system is an OCR system for acquiring character data from a document by OCR processing, wherein the identification information of a publisher of the document, the type of font used in the OCR processing, An OCR information management unit that manages OCR information that associates the OCR information, and an OCR execution unit that performs OCR processing on the document.
  • the OCR execution unit performs OCR processing on a specific area in the document.
  • the OCR process is performed with the font of the type associated with the identification information of the issuer of the document in the OCR information.
  • an OCR system is an OCR system that obtains character data from a document by OCR processing, the identification information of an issuer of the document, and the document issued by the issuer.
  • An OCR information management unit that manages OCR information that associates the reliability of the OCR process with the OCR information, an OCR execution unit that executes the OCR process on the document, and a correction receiving unit that receives correction of the character data
  • the OCR execution unit executes the OCR process on a marked document, which is the document to which the reliability mark for indicating the reliability is attached, and
  • the OCR information management unit includes the reliability obtained by the OCR execution unit from the marked document in the OCR information,
  • the correct reception unit when correcting the character data of the document, executes a notification according to the reliability associated with the identification information of the issuer of the document in the OCR information. I do.
  • an OCR system is an OCR system for acquiring character data from a document by OCR processing, comprising an OCR execution unit for performing OCR processing on the document,
  • OCR processing on a marked document, which is the document with a specific information mark for obtaining specific information
  • a character string composed of at least a part of characters in a line and including a character overlapping with the specific information mark, wherein a distance between adjacent internal characters is equal to or less than a specific distance. The information is acquired as the specific information.
  • the OCR system of the present invention can improve the accuracy of character recognition in OCR processing.
  • the OCR system of the present invention can reduce the burden of correcting character data obtained from a document by OCR processing.
  • the OCR system of the present invention can improve the possibility that the user appropriately obtains a desired character string.
  • FIG. 1 is a block diagram of an OCR system according to a first embodiment of the present invention.
  • FIG. 2 is a diagram showing an example of a form corresponding to form data managed by the form data management system shown in FIG. 1.
  • FIG. 2 is a block diagram of the image forming apparatus shown in FIG. 1 in the case of an MFP.
  • FIG. 2 is a block diagram of the form data management system shown in FIG. 1 when configured by one computer.
  • FIG. 5 is a diagram illustrating an example of a form database illustrated in FIG. 4.
  • FIG. 5 is a diagram illustrating an example of an OCR information table illustrated in FIG. 4.
  • FIG. 5 is a diagram illustrating an example of a correction information database illustrated in FIG. 4. It is a block diagram of the user terminal shown in FIG.
  • FIG. 5 is a flowchart of the operation of the form data management system shown in FIG. 4 when updating the OCR information table.
  • FIG. 3 is a diagram showing an example of a form shown in FIG. 2 with a specific mark.
  • It is a flowchart of the issuer name acquisition process shown in FIG.
  • FIG. 12 is a diagram illustrating an example of an issuer name acquisition area extracted in an issuer name acquisition process illustrated in FIG. 11.
  • FIG. 12 is a diagram illustrating an example of a position detected in the issuer name acquisition process illustrated in FIG. 11.
  • 5 is a flowchart of a part of the operation of the form data management system shown in FIG. 4 when form data is stored in a form database by OCR processing using one type of font.
  • FIG. 14A It is a flowchart of operation
  • 15 is a flowchart illustrating an operation subsequent to the operation illustrated in FIG. It is a flowchart of a part of issuer name specification processing shown in FIG. 14A.
  • FIG. 16B is a flowchart illustrating an operation subsequent to the operation illustrated in FIG. 16A.
  • 5 is a flowchart of the operation of the form data management system shown in FIG. 4 when form data is confirmed. It is a figure showing an example of the modification information database memorized by the form data management system of the OCR system concerning a 2nd embodiment of the present invention.
  • FIG. 11 is a diagram showing an example of the form shown in FIG. 2 with a specific mark, which is different from the example shown in FIG. 10.
  • FIG. 1 is a block diagram of an OCR system 10 according to the present embodiment.
  • the OCR system 10 includes an image forming apparatus 20 as a reading device that reads an image from a document.
  • the image forming apparatus 20 is configured by, for example, an image forming apparatus such as an MFP (Multifunction Peripheral), a dedicated scanner, or the like.
  • the OCR system 10 can include at least one image forming apparatus having the same configuration as the image forming apparatus 20 in addition to the image forming apparatus 20.
  • the OCR system 10 includes a form data management system 30 that manages form data (hereinafter referred to as “form data”) as an electronic document.
  • the form data management system 30 may be configured by one computer, or may be configured by a plurality of computers.
  • the form data management system 30 may be a system that operates on a cloud.
  • FIG. 2 is a diagram showing an example of a form 50 corresponding to form data managed by the form data management system 30. As shown in FIG.
  • the form 50 shown in FIG. 2 includes an issuer name 51 as the identification information of the issuer, a logo image 52 of the issuer, and specific contents (hereinafter, referred to as “issuer description contents”) 53 described by the issuer. And In FIG. 2, the issuer name 51 is “ABC @ COMPANY”.
  • the OCR system 10 includes a user terminal 40 used by a user such as a data checker who checks form data.
  • the user terminal 40 is configured by a computer such as a PC (Personal Computer), for example.
  • the OCR system 10 can include at least one user terminal having the same configuration as the user terminal 40, in addition to the user terminal 40.
  • the image forming apparatus 20 included in the OCR system 10 and the form data management system 30 can communicate with each other via a network 11 such as a LAN (Local Area Network) or the Internet.
  • the form data management system 30 and the user terminal 40 included in the OCR system 10 can communicate with each other via the network 11.
  • FIG. 3 is a block diagram of the image forming apparatus 20 in the case of an MFP.
  • the image forming apparatus 20 shown in FIG. 3 includes an operation unit 21, a display unit 22, a printer 23, a scanner 24, a fax communication unit 25, a communication unit 26, a storage unit 27, and a control unit 28.
  • the operation unit 21 is an operation device to which various operations are input.
  • the operation device is, for example, a button.
  • the display unit 22 is a display device such as an LCD (Liquid Crystal Display) that displays various information.
  • the printer 23 is a printing device that prints an image on a recording medium such as paper.
  • the scanner 24 is a reading device that reads an image from a document.
  • the facsimile communication unit 25 is a facsimile device that performs facsimile communication with an external facsimile machine (not shown) via a communication line such as a public telephone line.
  • the communication unit 26 is a communication device that communicates with an external device via a network such as a LAN or the Internet, or directly via a wired or wireless connection without using a network.
  • the storage unit 27 is a non-volatile storage device that stores various types of information, such as a semiconductor memory and a hard disk drive (HDD).
  • the control unit 28 controls the entire image forming apparatus 20.
  • the control unit 28 includes, for example, a CPU (Central Processing Unit), a ROM (Read Only Memory) storing programs and various data, and a RAM (Random) as a memory used as a work area of the CPU of the control unit 28. Access @ Memory).
  • the CPU of the control unit 28 executes a program stored in the storage unit 27 or the ROM of the control unit 28.
  • FIG. 4 is a block diagram of the form data management system 30 when it is constituted by one computer.
  • the form data management system 30 shown in FIG. 4 includes an operation unit 31, a display unit 32, a communication unit 33, a storage unit 34, and a control unit 35.
  • the operation unit 31 is an operation device to which various operations are input.
  • the operation device is, for example, a keyboard, a mouse, or the like.
  • the display unit 32 is a display device that displays various information.
  • the display device is, for example, an LCD.
  • the communication unit 33 is a communication device that communicates with an external device via a network such as a LAN or the Internet, or directly via a wired or wireless connection without using a network.
  • the storage unit 34 is a nonvolatile storage device that stores various types of information.
  • the storage device is, for example, a semiconductor memory or an HDD.
  • the control unit 35 controls the entire form data management system 30.
  • the storage unit 34 stores a form OCR program 34a as a document OCR program, an OCR software 34b, and a font database 34c.
  • the document OCR program is a program for acquiring character data from a form by OCR processing.
  • the font database 34c stores fonts used by the OCR software 34b.
  • the form OCR program 34a, the OCR software 34b, and the font database 34c may be installed in the form data management system 30, for example, at the manufacturing stage of the form data management system 30, or may be a CD (Compact @ Disk), a DVD (Digital). It may be additionally installed in the form data management system 30 from an external storage medium such as a Versatile Disk or a USB (Universal Serial Bus) memory, or may be additionally installed in the form data management system 30 from a network.
  • the storage unit 34 stores a form database 34d for storing form data.
  • FIG. 5 is a diagram showing an example of the form database 34d.
  • the form database 34d shown in FIG. 5 includes a form data ID as identification information of form data and form data in association with each form data.
  • the form data includes image data of the form and character data of the form. For example, in FIG. 5, the form data ID “D001”, the image data “D001.JPG”, and the character data “D001.xlsx” are associated with each other.
  • the storage unit 34 stores an OCR information table 34e that stores OCR information as information for OCR processing.
  • FIG. 6 is a diagram showing an example of the OCR information table 34e.
  • the OCR information table 34e shown in FIG. 6 includes an issuer name read target area, an issuer name of a form issuer, a logo image, an issuer written content read target area, a font name, and reliability of OCR processing. And the degree are associated with each issuer and included.
  • the issuer name read target area is an area for reading the issuer name 51 in the form 50.
  • the logo image is an image of the publisher indicated by the publisher name.
  • the issuer description content read target area is an area for reading the issuer description content 53 in the form 50.
  • the font name indicates the type of the font of the character in the area to be read by the publisher in the form 50.
  • the reliability of the OCR process is a level of trust in the OCR process executed on the form 50 issued by the issuer indicated by the issuer name.
  • the read target area “(x3, y3) ⁇ (x4, y4)”, the font name “Calibri”, and the reliability of the OCR process “high” are associated with each other.
  • the issuer name read target area and the issuer written content read target area are represented by coordinates in the image data.
  • the logo image is registered in the OCR information table 34e by a person who causes the data checker to check the form data.
  • the storage unit 34 indicates, for each form data, the status of correction of the form data and the type of notification (hereinafter referred to as “notification type”) for calling attention when correcting the character data of the form.
  • the correction information database 34f is stored.
  • FIG. 7 is a diagram showing an example of the correction information database 34f.
  • the modification information database 34f shown in FIG. 7 includes a form data ID, a form data modification state, a notification type, a font name of a font used in the OCR process, and character data in association with each form data.
  • the character data is data generated by OCR processing using the font indicated by the font name.
  • the form data ID “D001”, the form data correction status “uncorrected”, the notification type “low reliability”, the font name “Arial” of the font used in the OCR process, and the font name Are associated with character data “D001a.xlsx” generated by the OCR process using the font indicated by.
  • Notification types include, for example, “high reliability”, “low reliability”, “non-optimal area”, “non-optimal font”, and “non-optimal area font”.
  • “High reliability” indicates a case where the OCR process is performed on the optimal area of the form with the optimal font and the reliability of the OCR process is high.
  • “Low reliability” indicates a case where the OCR processing has been performed on the optimal area of the form using the optimal font, but the reliability of the OCR processing is low.
  • “Non-optimal area” indicates a case where an OCR process has been performed with an optimal font on a non-optimal area of the form.
  • “Non-optimal font” indicates a case where an OCR process has been performed with a font that is not optimal for an optimal area of a form.
  • “Non-optimal area font” indicates a case where an OCR process is performed on a non-optimal area of a form using a non-optimal font.
  • the control unit 35 illustrated in FIG. 4 includes, for example, a CPU, a ROM storing programs and various data, and a RAM serving as a work area of the CPU of the control unit 35.
  • the CPU of the control unit 35 executes a program stored in the storage unit 34 or the ROM of the control unit 35.
  • the control unit 35 realizes an OCR execution unit 35a, an OCR information management unit 35b, and a correction receiving unit 35c by executing the form OCR program 34a.
  • the OCR execution unit 35a executes an OCR process on the form 50 by using the OCR software 34b.
  • the OCR information management unit 35b manages the OCR information table 34e.
  • the correction receiving unit 35c receives correction of the character data acquired from the form 50 by the OCR process.
  • FIG. 8 is a block diagram of the user terminal 40.
  • the user terminal 40 includes an operation unit 41, a display unit 42, a communication unit 43, a storage unit 44, and a control unit 45.
  • the operation unit 41 is an operation device to which various operations are input.
  • the operation device is, for example, a keyboard, a mouse, or the like.
  • the display unit 42 is a display device that displays various information.
  • the display device is, for example, an LCD.
  • the communication unit 43 is a communication device that communicates with an external device via a network such as a LAN or the Internet, or directly via a wired or wireless connection without using a network.
  • the storage unit 44 is a nonvolatile storage device that stores various types of information.
  • the nonvolatile storage device is, for example, a semiconductor memory, an HDD, or the like.
  • the control unit 45 controls the entire user terminal 40.
  • the control unit 45 includes, for example, a CPU, a ROM storing programs and various data, and a RAM serving as a memory used as a work area of the CPU of the control unit 45.
  • the CPU of the control unit 45 executes a program stored in the storage unit 44 or the ROM of the control unit 45.
  • FIG. 9 is a flowchart of the operation of the form data management system 30 when updating the OCR information table 34e.
  • the OCR execution unit 35a of the form data management system 30 receives the image data of the form 50 to which the issuer name mark (identification information mark) for specifying the issuer name is attached. Until it is determined, it is determined whether or not the image data of the form with the mark for the issuer name is received (S101). For example, the image data of the form 50 with the issuer name mark is attached to the paper form 50 with a specific mark by a writing instrument such as a highlighter by a person who causes a data checker to check the form data.
  • the form 50 with a specific mark may be generated as image data by being read by the scanner 24 of the image forming apparatus 20.
  • the generated image data of the form 50 may be transmitted from the image forming apparatus 20 to the form data management system 30.
  • the image data of the form 50 to which the mark for the issuer name is attached is obtained by adding a specific mark to the image data of the form 50 on the image data by the user terminal 40 and then transmitting the form data from the user terminal 40 to the form data. It may be transmitted to the management system 30.
  • FIG. 10 is a diagram showing an example of a form 50 with a specific mark.
  • the form 50 shown in FIG. 10 is a document with a mark including a mark 61 for the issuer name, a mark 62 for the content described by the issuer, and a mark 63 for the OCR reliability as specific marks.
  • the issuer name mark 61 is an identification information mark for acquiring the issuer name 51 from the form 50.
  • the issuer name mark 61 is a filling of at least a part of the issuer name 51 in the form 50 with a specific fluorescent color.
  • the issuer description content mark 62 is an area mark for specifying the issuer description content read target area in the form 50.
  • the issuer description content mark 62 is a fluorescent color box for the issuer description content read target area of the form 50.
  • the OCR reliability mark 63 is a reliability mark for indicating the reliability of OCR processing on a form issued by the issuer indicated by the issuer name 51.
  • the OCR reliability mark 63 is an X mark drawn in a fluorescent color on the form 50.
  • the issuer name mark 61, the issuer description mark 62, and the OCR reliability mark 63 are attached to the paper form 50 or the image data of the form 50 by, for example, a person who checks the form data with a data checker. You.
  • the OCR reliability mark 63 is attached based on, for example, the accuracy of character recognition in a past OCR process on a form issued by the issuer of the form 50.
  • the OCR reliability mark 63 is attached to, for example, a paper form 50 or image data of the form 50 by a responsible person.
  • the OCR execution unit 35a determines in S101 that the image data of the form 50 with the issuer name mark 61 is received, the OCR execution unit 35a executes an issuer name acquisition process for acquiring the issuer name. (S102).
  • FIG. 11 is a flowchart of the issuer name acquisition process.
  • target form image the direction of the character string of the issuer name in the image (hereinafter referred to as “target form image”) indicated by the image data of the form 50 determined to have been received in S101 of FIG.
  • target form image This is an example of the operation in the case where the horizontal direction in, and the height direction of the character of the issuer name in the target form image is the vertical direction in the target form image.
  • the OCR execution unit 35a extracts an image of a specific area (hereinafter, referred to as “issuer name acquisition area”) for acquiring the issuer name from the target form image (S131). ).
  • the issuer name acquisition area is a rectangular area having a pair of opposite sides extending in the vertical direction in the target form image and a pair of opposite sides extending in the horizontal direction in the target form image.
  • the position of the upper end side of the issuer name acquisition area may be the uppermost position of the issuer name mark in the target form image in the vertical direction, or the uppermost position of the issuer name mark in the target form image in the vertical direction. May be a position above the position by a specific distance.
  • the specific distance may be a distance corresponding to a distance from the uppermost position to the lowermost position of the issuer name mark in the target form image in the vertical direction (hereinafter, referred to as “marker vertical width”).
  • marker vertical width a distance corresponding to a distance from the uppermost position to the lowermost position of the issuer name mark in the target form image in the vertical direction
  • a fixed distance that does not depend on the mark vertical width may be used.
  • the position of the lower edge of the issuer name acquisition area may be the lowermost position of the issuer name mark in the target form image in the vertical direction, or the lowermost position of the issuer name mark in the target form image in the vertical direction.
  • the position may be lower by a specific distance from the position.
  • the specific distance may be a distance according to the mark vertical width or a fixed distance that does not depend on the mark vertical width.
  • the position of the left end side of the issuer name acquisition area may be the same as the position of the left end side in the target form image, or a specific position from the leftmost position in the horizontal direction of the issuer name mark in the target form image.
  • the position on the left side by the distance may be used.
  • the specific distance may be a distance corresponding to the distance from the leftmost position to the rightmost position of the issuer name mark in the target form image in the horizontal direction (hereinafter, referred to as “marker width”).
  • marker width a distance corresponding to the distance from the leftmost position to the rightmost position of the issuer name mark in the target form image in the horizontal direction
  • a fixed distance independent of the mark width may be used.
  • the position of the right end side of the issuer name acquisition area may be the same as the position of the right end side in the target form image or a specific position from the rightmost position in the horizontal direction of the issuer name mark in the target form image.
  • the position on the right side by the distance may be used.
  • the specific distance may be a distance according to the mark width, or a fixed distance independent of the mark width.
  • FIG. 12 is a diagram showing an example of the issuer name acquiring area 70 extracted in the issuer name acquiring process shown in FIG.
  • the OCR execution unit 35a determines the character in the image of the issuer name acquisition area 70 extracted in S131 that overlaps the issuer name mark 61 in the vertical direction.
  • the upper position, the lowermost position, and the center position are detected (S132).
  • FIG. 13 is a diagram showing an example of a position detected in the issuer name acquisition process shown in FIG.
  • the position 71a is the uppermost position in the vertical direction of the character “DE” overlapping the issuer name mark 61.
  • the position 71b is the lowermost position in the vertical direction of the character “DE”.
  • the position 71c is the position of the center of the character "DE” in the vertical direction.
  • the OCR execution unit 35a determines, for all the characters included in the image of the issuer name acquisition area 70 extracted in S131, the uppermost position and the lowermost position in the vertical direction. And the position of the center are detected (S133).
  • the OCR execution unit 35a outputs the issuer name mark 61 in the issuer name acquisition area 70 image extracted in S131 among all the characters included in the issuer name acquisition area 70 extracted in S131.
  • a character in the same line as the character overlapping with is extracted based on each position detected in S132 and each position detected in S133 (S134).
  • the process of S134 is to prevent a character not included in the same line as the character overlapping the issuer name mark 61 from being erroneously acquired as a part of the issuer name by the process of S136 described later. This is the process.
  • the OCR execution unit 35a is a character string composed of the characters extracted in S134, and the distance between adjacent characters in the character string is equal to or less than a specific distance, and S131 In step S135, a character string including characters overlapping the issuer name mark 61 is extracted from the image of the issuer name acquisition area 70 extracted in step S135.
  • the specific distance may be a distance in accordance with the width of the character, such as a distance of five characters of the characters overlapping the landmark 61 for the issuer name, or a fixed distance independent of the width of the character, for example, 1 cm. May be the distance.
  • the processing in S135 is a character included in the same line as the character overlapping with the issuer name mark 61, but a character apparently unrelated to the issuer name is replaced with a character in the issuer name by the processing in S136 described later. This is a process for preventing an erroneous acquisition as a part.
  • the OCR execution unit 35a acquires the character string extracted in S135 as the issuer name by the OCR software 34b (S136), and ends the issuer name acquisition process shown in FIG.
  • the OCR execution unit 35a can acquire "DEF @ COMPANY" as the issuer name from the issuer name acquisition area 70 shown in FIG. 12 by the issuer name acquisition processing shown in FIG.
  • the OCR execution unit 35a determines the issuer name read target area according to the position of the issuer name acquired in the issuer name acquisition process ( S103).
  • the OCR execution unit 35a determines whether or not the subject form image has the issuer description content mark 62 (S104).
  • the OCR execution unit 35a When the OCR executing unit 35a determines in S104 that the target form image has the issuer description content mark 62 attached thereto, the OCR execution unit 35a specifies the issuer description content read target area using the issuer description content mark 62 (S105).
  • the OCR execution unit 35a specifies the font name of the character in the issuer description content reading target area specified in S105 in the target form image (S106). In other words, the OCR execution unit 35a searches the font database 34c for the font name of the character included in the issuer content reading target area specified in S105 and specifies the target form image.
  • the OCR executing unit 35a determines in S104 that the target form image is not provided with the landmark 62 for the content written by the issuer, or upon completion of the processing in S106, whether the OCR reliability mark is provided on the target form image. It is determined whether or not it is (S107).
  • the OCR execution unit 35a determines in S107 that the target form image has the OCR reliability mark 63, it is issued by the issuer indicated by the issuer name acquired by the issuer name acquisition process in S102. “Low” is obtained as the reliability of the OCR process for the form 50 (S108).
  • the OCR information management unit 35b determines in S107 that the OCR reliability mark 63 is not attached to the target form image, or when the processing of S108 is completed, the execution result of the processing of S101 to S108 is stored in the OCR information table. 34e (S109). That is, if the issuer name acquired in the issuer name acquisition process of S102 is not included in the OCR information table 34e, the OCR information management unit 35b firstly acquires the issuer acquired in the issuer name acquisition process of S102. The name is registered in the OCR information table 34e.
  • the OCR information management unit 35b when registering the issuer name in the OCR information table 34e, registers “high” in the OCR information table 34e as the reliability of the OCR process associated with the issuer name. I do.
  • the OCR information management unit 35b sets the reliability of the OCR process associated with the issuer name acquired in the issuer name acquisition process in S102 to “low”. Is overwritten and registered in the OCR information table 34e. Further, the OCR information management unit 35b sets the issuer name read target area specified in S103 as the issuer name read target area associated with the issuer name acquired in the issuer name acquisition process in S102, in the OCR information table. 34e is overwritten and registered.
  • the OCR information management unit 35b When the OCR information management unit 35b has specified the issuer-reading content read target area in S105, the issuer-described content readout target area associated with the issuer name acquired in the issuer name acquisition process in S102. In step S105, the area to be read by the publisher specified in S105 is registered in the OCR information table 34e by overwriting.
  • the OCR information management unit 35b specifies the font name in S106
  • the OCR information management unit 35b uses the font name specified in S106 as the font name associated with the publisher name acquired in the publisher name acquisition process in S102. And overwrites it in the information table 34e.
  • FIGS. 14A, 14B, and 15 are flowcharts of the operation of the form data management system 30 when storing form data in the form database 34d by OCR processing using one type of font.
  • the OCR execution unit 35a of the form data management system 30 determines whether or not the image data of the form 50 has been received until it determines that the image data of the form 50 has been received. A determination is made (S151).
  • the image data of the form 50 may be generated as image data by reading the paper form 50 by the scanner 24 of the image forming apparatus 20, and transmitted from the image forming apparatus 20 to the form data management system 30.
  • the image data of the form 50 may be generated by a computer (not shown) and transmitted from the computer (not shown) to the form data management system 30.
  • the OCR execution unit 35a determines in S151 that the image data of the form 50 has been received, the OCR executing unit 35a specifies the issuer name of the form (hereinafter referred to as “target form”) indicated by the image data determined to be received in S151.
  • target form the issuer name of the form indicated by the image data determined to be received in S151.
  • the user name specifying process is executed (S152).
  • FIG. 16A is a flowchart of a part of the issuer name specifying process shown in FIG. 14A.
  • FIG. 16B is a flowchart of an operation subsequent to the operation shown in FIG. 16B.
  • the OCR execution unit 35a determines whether the issuer name read target area is registered in the OCR information table 34e (S191).
  • the OCR execution unit 35a determines in S191 that the issuer name read target area is registered in the OCR information table 34e, then one of the issuer name read targets registered in the OCR information table 34e that has not yet been set as the target is read. Only the area is targeted (S192).
  • the OCR execution unit 35a performs the OCR processing by the OCR software 34b on the image indicated by the image data determined to be received in S151, that is, the current target issuer name read target area in the target form image. Is executed (S193).
  • the OCR executing unit 35a includes the issuer name associated with the current target issuer name read target area in the OCR information table 34e in the character string acquired by the OCR processing executed in S193. It is determined whether or not there is (S194).
  • the OCR execution unit 35a includes the issuer name associated with the current target issuer name read target area in the OCR information table 34e in the character string acquired by the OCR process executed in S193. Is determined in S194, the issuer name associated with the current target issuer name read target area in the OCR information table 34e is specified as the issuer name of the target form (S195), and FIG. The specified issuer name specification processing ends.
  • the OCR execution unit 35a determines that the issuer name associated with the current target issuer name read target area in the OCR information table 34e is not included in the character string acquired by the OCR process executed in S193. Is determined in S194, as shown in FIG. 16B, it is determined whether or not there is an issuer name read target area registered in the OCR information table 34e that is not yet targeted (S196).
  • the OCR execution unit 35a determines in S196 that there is an issuer name read target area registered in the OCR information table 34e and not yet set as an object, the OCR execution unit 35a executes the process of S192.
  • the OCR execution unit 35a determines in S191 that the issuer name read target area is not registered in the OCR information table 34e, or determines whether the issuer name read target area registered in the OCR information table 34e is not set as the target yet. If it is determined in step S196 that no is present, it is determined by image matching processing whether or not the logo image registered in the OCR information table 34e is included in the target form image (S197).
  • the OCR execution unit 35a determines in step S197 that the logo image registered in the OCR information table 34e is included in the target form image, and adds the OCR information table 34e to the logo image determined in step S197 to be included in the target form image. Is specified as the issuer name of the target form (S198), and the issuer name identification processing shown in FIGS. 16A and 16B ends.
  • the OCR execution unit 35a determines in S197 that the logo image registered in the OCR information table 34e is not included in the target form image, the OCR execution unit 35a ends the issuer name specifying process illustrated in FIGS. 16A and 16B.
  • the OCR execution unit 35a determines whether or not the issuer name has been specified in the issuer name specifying process in S152 (S153).
  • the font name in the OCR information table 34e corresponds to the issuer name specified in the issuer name specifying process in S152. It is determined whether it is attached (S154).
  • the OCR execution unit 35a determines in S154 that the font name is associated with the issuer name identified in the issuer name identification process in S152 in the OCR information table 34e, the OCR execution unit 35a identifies the issuer name in the issuer name identification process in S152. It is determined whether or not the issuer name is associated with the issuer-described content read target area in the OCR information table 34e (S155).
  • the OCR execution unit 35a determines that the issuer description content read target area in the OCR information table 34e is associated with the issuer name specified in the issuer name specification processing of S152.
  • the determination is made in S155, the font name associated with the issuer name specified in the issuer name specification process in S152 in the OCR information table 34e for the area described in the issuer name specification in the target form image.
  • the OCR processing is executed by the OCR software 34b with the font indicated by (S156).
  • the OCR executing unit 35a determines that the character data including the issuer name specified in the issuer name specifying process in S152 and the character string obtained by the OCR process executed in S156, and that the character data is received in S151.
  • the form data including the obtained image data is stored in the form database 34d (S157).
  • the OCR execution unit 35a automatically assigns a form data ID to the form data stored in S157.
  • the OCR executing unit 35a determines whether or not “low” is associated as the reliability of the OCR process in the OCR information table 34e with the issuer name specified in the issuer name specifying process in S152 (S158). ).
  • the OCR execution unit 35a determines in S158 that the low reliability of the OCR process is not associated with the issuer name identified in the issuer name identification process in S152 in the OCR information table 34e, the OCR execution unit 35a determines the notification type as , "Uncorrected" as a form data correction state, the font name used in the OCR processing in S156, and the character data including the character string obtained by the OCR processing executed in S156. Then, in S157, the data is stored in the correction information database 34f in association with the form data ID of the form data stored in the form database 34d (S159), and the process of S151 is executed.
  • the OCR execution unit 35a determines in S158 that the reliability of the OCR process is “low” in the OCR information table 34e with the issuer name identified in the issuer name identification process in S152, the OCR execution unit 35a determines the notification type. , "Uncorrected" as the form data correction status, the font name used in the OCR processing in S156, and the character data including the character string acquired by the OCR processing executed in S156. Then, in S157, the form data is stored in the correction information database 34f in association with the form data ID of the form data stored in the form database 34d (S160), and the process of S151 is executed.
  • the OCR execution unit 35a determines in S155 that the issuer name specified in the issuer name identification process in S152 does not correspond to the issuer description content read target area in the OCR information table 34e, the OCR execution unit 35a Then, the OCR software 34b executes the OCR process with the font indicated by the font name associated with the issuer name specified in the issuer name specifying process in S152 in the OCR information table 34e (S161).
  • the OCR executing section 35a determines that the character data including the issuer name specified in the issuer name specifying process in S152 and the character string obtained by the OCR process executed in S161, and that the character data is received in S151.
  • the form data including the image data is stored in the form database 34d (S162).
  • the OCR execution unit 35a automatically assigns a form data ID to the form data stored in S162.
  • the OCR execution unit 35a determines “non-optimal area” as the notification type, “uncorrected” as the correction status of the form data, the font name used in the OCR processing in S161, and the OCR processing performed in S161.
  • the character data including the character string obtained in step S162 is stored in the correction information database 34f in association with the form data ID of the form data stored in the form database 34d in S162 (S163), and the process of S151 is executed.
  • the OCR execution unit 35a determines in S154 that the font name in the OCR information table 34e is not associated with the issuer name specified in the issuer name specification process in S152. It is determined whether or not the issuer name specified in the issuer name identification process in S152 is associated with the issuer read content read target area in the OCR information table 34e (S164).
  • the OCR execution unit 35a determines in S164 that the issuer name read processing area in the OCR information table 34e is associated with the issuer name specified in the issuer name specification processing in S152, the Then, the OCR software 34b executes the OCR process on the region to be read by the issuer by using the general-purpose font (S165).
  • the OCR execution unit 35a determines that the character data including the issuer name identified in the issuer name identification processing in S152 and the character string obtained by the OCR processing executed in S165, and that the character data is received in S151.
  • the form data including the image data is stored in the form database 34d (S166).
  • the OCR execution unit 35a automatically assigns a form data ID to the form data stored in S166.
  • the OCR execution unit 35a determines “non-optimal font” as the notification type, “uncorrected” as the correction status of the form data, the font name used in the OCR process in S165, and the OCR process executed in S165.
  • the character data including the character string obtained in step S166 is stored in the correction information database 34f in association with the form data ID of the form data stored in the form database 34d in step S166 (S167), and the process of S151 is executed.
  • the OCR execution unit 35a determines in S164 that the issuer name is not associated with the issuer name identified in the issuer name identification process in S152 in the OCR information table 34e. If the OCR execution unit 35a determines the target form image. Then, OCR processing is executed by the OCR software 34b using a general-purpose font (S168).
  • the OCR executing unit 35a determines that the issuer name specified in the issuer name specifying process in S152, the character data including the character string acquired by the OCR process executed in S168, and the character data received in S151.
  • the form data including the image data is stored in the form database 34d (S169).
  • the OCR execution unit 35a automatically assigns a form data ID to the form data stored in S169.
  • the OCR software 34b executes the OCR process on the target form image using a general-purpose font (S170). ).
  • the OCR execution unit 35a stores the form data including the character data including the character string acquired by the OCR processing executed in S170 and the image data determined to be received in S151 in the form database 34d (S171). ).
  • the OCR execution unit 35a automatically assigns a form data ID to the form data stored in S171.
  • the OCR execution unit 35a determines “not optimal area font” as the notification type, “uncorrected” as the correction status of the form data, and the name of the font used in the OCR processing in S168 or S170. And the character data including the character string obtained by the OCR processing executed in S168 or S170 are stored in the correction information database 34f in association with the form data ID of the form data stored in the form database 34d in S169 or S171. (S172), the process of S151 is executed.
  • FIG. 17 is a flowchart of the operation of the form data management system 30 when form data is confirmed.
  • the data confirmer can instruct the user terminal 40 to display a list of the form data managed by the form data management system 30 via the operation unit 41 of the user terminal 40.
  • the control unit 45 of the user terminal 40 changes the display of the list of the form data managed by the form data management system 30 to the form. Request to the data management system 30.
  • the correction receiving unit 35c transmits a list display screen showing a list of the form data included in the form database 34d to the user terminal 40 (S211).
  • the correction receiving unit 35c includes the correction status included in the correction information database 34f in the list display screen.
  • the control unit 45 of the user terminal 40 When the control unit 45 of the user terminal 40 receives the list display screen transmitted in S211, the control unit 45 displays the received list display screen on the display unit 42. Therefore, the data checker can select the form data that the data checker himself wants to check from the list display screen displayed on the display unit 42 via the operation unit 41. For example, the data checker may select any one of the form data whose correction status is “uncorrected” on the list display screen displayed on the display unit 42 as the form data that the data checker himself wants to check. You can choose. When the form data is selected from the list display screen, the control unit 45 of the user terminal 40 requests the form data management system 30 for the selected form data.
  • the correction receiving unit 35 c of the form data management system 30 determines whether the form data is requested from the user terminal 40 until it determines that the form data is requested from the user terminal 40 ( S212).
  • the correction receiving unit 35c Upon determining in S212 that the form data has been requested from the user terminal 40, the correction receiving unit 35c confirms the form data (hereinafter, referred to as “target form data”) determined in S212 that the form data has been requested from the user terminal 40. Is transmitted to the user terminal 40 (S213).
  • the correction receiving unit 35c includes an image represented by the image data of the target form data included in the form database 34d, a character string represented by the character data of the target form data included in the form database 34d, and a correction information database 34f. , The font name associated with the target form data, the character string indicated by the character data associated with the target form data in the correction information database 34f, and the font name associated with the target form data in the correction information database 34f.
  • the notification corresponding to the type of notification is included in the confirmation screen.
  • the notification according to the notification type is, for example, a message “Please confirm” when the notification type is “highly reliable”.
  • the notification according to the notification type is, for example, a message such as “If the notification type is“ low-reliability ”, this is a form with many correction errors in the past. Please check all the items sufficiently.”
  • the notification according to the notification type is, for example, when the notification type is “non-optimal area”, “OCR processing was executed for a non-optimal area. Please. "
  • the notification according to the notification type is, for example, when the notification type is "non-optimal font”, “OCR processing was executed with a non-optimal font. Please check all items carefully.
  • the notification according to the notification type is, for example, when the notification type is “non-optimal area font”, “OCR processing was performed on a non-optimal area with a non-optimal font. Please check the items carefully. "
  • the control unit 45 of the user terminal 40 When the control unit 45 of the user terminal 40 receives the confirmation screen transmitted in S213, the control unit 45 displays the received confirmation screen on the display unit 42. Therefore, on the confirmation screen displayed on the display unit 42, the data confirmer determines whether the character string represented by the character data of the form data matches the character string included in the image represented by the image data of the form data. Can be confirmed. Then, for example, when the character string represented by the character data of the form data does not match the character string included in the image represented by the image data of the form data, the data confirmer confirms the correction of the character data of the form data. An instruction can be given from the operation screen via the operation unit 41.
  • the control unit 45 of the user terminal 40 When an instruction to modify the character data of the form data is issued, the control unit 45 of the user terminal 40 notifies the form data management system 30 of the instructed correction contents.
  • the data confirmer can also instruct the end of the form data confirmation from the confirmation screen via the operation unit 41.
  • the control unit 45 of the user terminal 40 When the end of form data confirmation is instructed, the control unit 45 of the user terminal 40 notifies the form data management system 30 of the end of form data confirmation.
  • the correction receiving unit 35c of the form data management system 30 determines whether the correction of the character data of the form data has been instructed from the user terminal 40 (S214).
  • the correction receiving unit 35c determines in S214 that the correction of the character data of the form data has been instructed from the user terminal 40, the correction receiving unit 35c converts the character data of the target form data in the form database 34d according to the content of the instruction from the user terminal 40. After the correction (S215), the correction status associated with the target form data in the correction information database 34f is set to "corrected" (S216).
  • the correction receiving unit 35c determines in S214 that the correction of the character data of the form data has not been instructed from the user terminal 40, or instructs the end of the form data confirmation from the user terminal 40 when the processing of S216 ends. It is determined whether or not it has been performed (S217).
  • the correction receiving unit 35c determines in S217 that the end of the check of the form data has been instructed from the user terminal 40, the correction receiving unit 35c ends the operation illustrated in FIG.
  • the OCR system 10 uses the font of the font name associated with the issuer name of the issuer of the form 50 in the OCR information table 34e, Then, an OCR process is performed on (S156). Accordingly, the font name (font type) of the font in the issuer-described content read target area in the form 50 and the font name (font type) of the font used in the OCR processing on the issuer-described content read target area Can be improved. As a result, the accuracy of character recognition in OCR processing can be improved. When the accuracy of character recognition in the OCR process can be improved, the OCR system 10 can reduce the amount of correction of character data acquired from the form 50 by the OCR process by a data checker, The work time for correcting the data can be reduced.
  • the accuracy of character recognition in the OCR process is originally poor depending on the font, or the accuracy of character recognition by the OCR process is poor due to the printing performance of the image forming apparatus that has printed the form 50.
  • the font name of the font of the character in the issuer written content read target area in the form 50 is the same as the font name of the font used in the OCR process for the issuer written content read target area.
  • the accuracy of character recognition in the OCR process may be poor.
  • the OCR system 10 executes a notification according to the reliability of the OCR process, which is associated with the issuer name of the issuer of the form 50 in the OCR information table 34e when correcting the character data of the form 50 ( S213). Therefore, it is possible to reduce a mistake in correcting the character data by the data checker.
  • the OCR system 10 acquires the issuer name (identification information) of the issuer of the form 50 by performing OCR processing on the form 50 (S152). Then, an OCR process is performed on the region of the form 50 where the publisher is to be read, with the font having the font name associated with the acquired publisher name in the OCR information table 34e (S156). Therefore, convenience can be improved.
  • the OCR system 10 performs the OCR process on the marked document to thereby obtain the font name (font name) of the font of the character in the publisher-written content read target area specified by the publisher-written content mark in the marked document. (S106). Then, the OCR system 10 includes the specified font name (font type) in the OCR information table 34e (S109). Therefore, registration of the font name of the font in the OCR information table 34e can be facilitated.
  • the OCR system 10 executes the OCR process on the marked document to acquire the issuer name of the issuer specified by the issuer name mark in the marked document (S102). Then, the OCR system 10 includes the acquired issuer name in the OCR information table 34e (S109). Therefore, it is possible to easily register the issuer name of the issuer in the OCR information table 34e.
  • the OCR system 10 executes a notification corresponding to the reliability of the OCR process, which is associated with the issuer name of the issuer of the form 50 in the OCR information table 34e ( S213). Therefore, it is possible to reduce the burden of the work of correcting the character data acquired from the form 50 by the OCR process.
  • the OCR system 10 performs the OCR process on the marked document to obtain the reliability of the OCR process indicated by the OCR reliability mark in the marked document (S108). Then, the OCR system 10 includes the obtained reliability in the OCR information table 34e (S109). Therefore, it is possible to easily register the reliability of the OCR process in the OCR information table 34e.
  • the OCR system 10 acquires the issuer name of the issuer of the form 50 by performing the OCR process on the form 50 (S152). Then, the OCR system 10 executes a notification corresponding to the reliability of the OCR process, which is associated with the acquired issuer name in the OCR information table 34e, when correcting the character data of the form 50 (S213). . Therefore, convenience can be improved.
  • the OCR system 10 executes the OCR process on the marked document to acquire the issuer name of the issuer specified by the issuer name mark 61 (specific information mark) in the marked document (S102). ). Then, the OCR system 10 includes the acquired issuer name in the OCR information table 34e (S109). Therefore, it is possible to easily register the issuer name of the issuer in the OCR information table 34e.
  • the OCR system 10 When performing OCR processing on a document with a mark, the OCR system 10 is constituted by at least a part of characters on the same line as characters overlapping the mark 61 for the issuer name, and the mark 61 for the issuer name.
  • a character string that includes characters that overlap with, and in which the distance between adjacent characters inside is a specific distance or less is acquired as the issuer name (S134 to S136). Therefore, even if the character string desired by the user, that is, the issuer name mark 61 does not overlap with at least one character of the issuer name, the possibility of properly acquiring the issuer name is improved. be able to.
  • the OCR system 10 can improve the possibility of properly acquiring the issuer name even if the issuer name mark 61 is incompletely attached to the issuer name in the form 50. Therefore, the possibility of registering the wrong issuer name in the OCR information table 34e can be reduced. As a result, the OCR system 10 allows the user to appropriately re-attach the issuer name mark 61 to the form 50 and to re-attach the issuer name mark 61 to the form 50 of the image forming apparatus. The need to have the scanner read again can be reduced.
  • the OCR system 10 executes a notification according to the reliability of the OCR process, which is associated with the issuer name of the issuer of the form 50 in the OCR information table 34e when correcting the character data of the form 50 ( S213). Therefore, it is possible to reduce the burden of the work of correcting the character data acquired from the form 50 by the OCR process.
  • the configuration of the OCR system according to the present embodiment is the same as the configuration of the OCR system 10 (see FIG. 1) according to the first embodiment, except for the configuration described below.
  • the same components as those of the OCR system 10 are denoted by the same reference numerals as those of the OCR system 10, and the detailed description is omitted.
  • the form data management system 30 of the OCR system stores a correction information database 334f (see FIG. 18) in the storage unit 34 instead of the correction information database 34f (see FIG. 7).
  • FIG. 18 is a diagram showing an example of the correction information database 334f stored in the form data management system 30 of the OCR system according to the present embodiment.
  • the correction information database 334f shown in FIG. 18 replaces the font name of the font used in the OCR process and the character data generated by the OCR process with the font indicated by the font name, and replaces the first Font name of the font, character data generated by the OCR process using the first font, font name of the second font used in the OCR process, and character data generated by the OCR process using the second font Are associated with the form data ID, the modification state of the form data, and the notification type.
  • the form data ID “D001”, the form data correction status “uncorrected”, the notification type “low reliability”, and the font name “Arial” of the first font used in the OCR processing are shown in FIG.
  • the operation of the OCR system according to the present embodiment is the same as the operation of the OCR system 10 (see FIG. 1) according to the first embodiment, except for the operations described below.
  • the operations of the OCR system according to the present embodiment detailed description of the same operations as the operations of the OCR system 10 will be omitted.
  • FIGS. 19A, 19B, and 20 are flowcharts of the operation of the form data management system 30 when storing form data in the form database 34d by OCR processing using two types of fonts.
  • the OCR executing unit 35a of the form data management system 30 executes the processes of S451 to S455 similar to the processes of S151 to S155 (see FIG. 14A).
  • the first font which is the font indicated by the font name associated with the issuer name specified in the issuer name specification processing of S452 in the OCR information table 34e, with respect to this issuer description content read target area OCR processing is executed by the OCR software 34b for each of the second font and the general font different from the first font (S456).
  • the OCR executing unit 35a determines the issuer name specified in the issuer name specifying process in S452, the character data including the character string acquired by the OCR process using the first font executed in S456, and S451.
  • the form data including the image data determined to have been received in is stored in the form database 34d (S457).
  • the OCR execution unit 35a automatically assigns a form data ID to the form data stored in S457.
  • the OCR executing unit 35a executes the process of S458 similar to the process of S158 (see FIG. 14).
  • the OCR execution unit 35a determines in S458 that the reliability of the OCR process is not associated with “low” in the OCR information table 34e with the issuer name identified in the issuer name identification process in S452, the OCR execution unit 35a determines the notification type as "High reliability", "uncorrected” as a form data correction status, the font name used in the OCR process for the first font in S456, and the OCR process for the first font executed in S456 Character data including the character string obtained in step S456, the font name used in the OCR processing with the second font in step S456, and the character string obtained in the OCR processing with the second font executed in step S456.
  • the form data of the form data stored in the form database 34d in S457 Stored in the correction information database 334f in association with the ID (S459), it executes the processing of S451.
  • the OCR execution unit 35a determines in S458 that the reliability of the OCR process is “low” in the OCR information table 34e with the issuer name specified in the issuer name specification process in S452, , "Uncorrected" as a form data correction status, the font name used in the OCR process for the first font in S456, and the OCR process for the first font executed in S456 Character data including the character string obtained in step S456, the font name used in the OCR processing with the second font in step S456, and the character string obtained in the OCR processing with the second font executed in step S456.
  • the OCR execution unit 35a determines in S455 that the issuer name specified in the issuer name identification process in S452 does not correspond to the issuer read content read target area in the OCR information table 34e, the OCR execution unit 35a
  • the first font which is the font indicated by the font name associated with the issuer name specified in the issuer name specification process of S452 in the OCR information table 34e, and a general-purpose font different from the first font OCR processing is performed by the OCR software 34b with each of the second fonts (S461).
  • the OCR executing unit 35a determines the issuer name specified in the issuer name specifying process in S452, the character data including the character string acquired by the OCR process using the first font executed in S461, and S451.
  • the form data including the image data determined to have been received is stored in the form database 34d (S462).
  • the OCR execution unit 35a automatically assigns a form data ID to the form data stored in S462.
  • the OCR execution unit 35a determines “non-optimal area” as the notification type, “uncorrected” as the correction status of the form data, the font name used in the OCR processing for the first font in S461, and S461
  • the character data including the character string obtained by the OCR processing with the first font executed in step S461, the font name used in the OCR processing with the second font in step S461, and the second font executed in step S461 The character data including the character string acquired by the OCR process in step S462 is stored in the correction information database 334f in association with the form data ID of the form data stored in the form database 34d in S462 (S463), and the processing in S451 is performed. Execute.
  • the OCR executing unit 35a determines in S454 that the font name is not associated with the issuer name specified in the issuer name specifying process in S452 in the OCR information table 34e, the process in S164 (see FIG. 15) is performed. The same processing of S464 is executed.
  • the OCR software 34b uses the OCR software 34b to execute the OCR software 34b for each of the first and second general-purpose fonts different from the first font. The processing is executed (S465).
  • the OCR execution unit 35a determines the issuer name specified in the issuer name specification processing in S452, the character data including the character string obtained by the OCR processing using the first font performed in S465, and S451.
  • the form data including the image data determined to have been received is stored in the form database 34d (S466).
  • the OCR execution unit 35a automatically assigns a form data ID to the form data stored in S466.
  • the OCR execution unit 35a determines “non-optimal font” as the notification type, “uncorrected” as the correction status of the form data, the font name used in the OCR process for the first font in S465, and S465.
  • the character data including the character string obtained by the OCR process with the first font executed in step S465, the font name used in the OCR process with the second font in step S465, and the second font executed in step S465 The character data including the character string acquired by the OCR process in step S466 is stored in the correction information database 334f in association with the form data ID of the form data stored in the form database 34d in S466 (S467), and the processing of S451 is performed. Execute.
  • the OCR execution unit 35a determines in S464 that the issuer name is not associated with the issuer name identified in the issuer name identification process in S452 in the OCR information table 34e, the OCR execution unit 35a Then, OCR processing is executed by the OCR software 34b for each of the first font which is a general-purpose font and the second font which is a general-purpose font different from the first font (S468).
  • the OCR executing unit 35a determines the issuer name specified in the issuer name specifying process in S452, the character data including the character string acquired by the OCR process using the first font executed in S468, and S451.
  • the form data including the image data determined to have been received is stored in the form database 34d (S469).
  • the OCR execution unit 35a automatically assigns a form data ID to the form data stored in S469.
  • the OCR execution unit 35a determines in S453 that the issuer name has not been specified in the issuer name specification process in S452, the first font that is a general-purpose font and the first font are added to the target form image.
  • the OCR software 34b executes an OCR process with each of the second fonts, which are different general-purpose fonts (S470).
  • the OCR execution unit 35a converts the form data including the character data including the character string obtained by the OCR processing using the first font executed in S470 and the image data determined to be received in S451 into the form database. 34d (S471).
  • the OCR execution unit 35a automatically assigns a form data ID to the form data stored in S471.
  • the OCR execution unit 35a determines that the notification type is “non-optimal area font”, the correction status of the form data is “uncorrected”, and the OCR of the first font in S468 or S470.
  • the font name used in the processing, the character data including the character string obtained by the OCR processing with the first font executed in S468 or S470, and the character data used in the OCR processing with the second font in S468 or S470 are associated with the form data ID of the form data stored in the form database 34d in S469 or S471.
  • Stored in the modification information database 334f Te (S472) executes the process of S451.
  • FIG. 21 is a flowchart of the operation of the form data management system 30 when the form data is confirmed.
  • the correction receiving unit 35c of the form data management system 30 executes the operation shown in FIG.
  • the correction receiving unit 35c executes the processes of S511 to S512 similar to the processes of S211 to S212 (see FIG. 17).
  • the correction receiving unit 35c determines in S512 that the form data has been requested from the user terminal 40, the form data determined in S512 that the form data has been requested from the user terminal 40, that is, the confirmation screen of the target form data is displayed on the user terminal 40. 40 (S513).
  • the correction receiving unit 35c includes an image represented by the image data of the target form data included in the form database 34d, a character string represented by the character data of the target form data included in the form database 34d, and a correction information database 334f. And a character string indicated by the first font name associated with the target form data and the character data generated by the OCR process using the first font associated with the target form data in the correction information database 334f.
  • the correction accepting unit 35c calculates the difference between the character string represented by the character data generated by the OCR processing in the first font and the character string represented by the character data generated by the OCR processing in the second font. Include the display in the confirmation screen.
  • the notification according to the notification type is, for example, when the notification type is “highly reliable”, “only the difference between the character strings indicated by the character data generated by the OCR processing in each of the two fonts is confirmed. Please. " The notification according to the notification type is, for example, a message such as "If the notification type is” low reliability "," a form having many correction errors in the past. Please check all items sufficiently. " The notification according to the notification type is, for example, if the notification type is "non-optimal area”, “OCR processing was executed for a non-optimal area. Please check all items carefully. Message. The notification according to the notification type is, for example, when the notification type is “non-optimal font”, “OCR processing was executed with a non-optimal font.
  • the notification according to the notification type is, for example, when the notification type is “non-optimal area font”, “OCR processing was performed on a non-optimal area with a non-optimal font. Please check carefully. "
  • the correction receiving unit 35c of the form data management system 30 executes the processing of S514 to S517 similar to the processing of S214 to S217 (see FIG. 17), and ends the operation shown in FIG. .
  • the issuer name mark 61 for specifying the issuer name 51 is at least a part of the issuer name 51 in each of the above-described embodiments and is filled with a specific fluorescent color. At least a part other than filling with a specific fluorescent color may be used.
  • the issuer name mark 61 does not have to be at least partially filled in the issuer name 51 but may be at least partially surrounded by the issuer name 51.
  • the issuer name mark 61 may be drawn in a color other than the fluorescent color, such as red and blue.
  • the issuer name mark 61 may be drawn in a different color from the issuer description content mark 62, or may be drawn in a different color from the OCR reliability mark 63.
  • the issuer description content mark 62 is a fluorescent color box around the issuer description content read target area in each of the above-described embodiments, but is different from the issuer description content read target area other than the fluorescent color box. It may be something.
  • the issuer description mark 62 may be drawn in a color other than the fluorescent color, such as red or blue.
  • the issuer description content mark 62 may be drawn in a different color from the issuer name mark 61, or may be drawn in a different color from the OCR reliability mark 63.
  • the OCR reliability mark 63 is an X mark drawn with a fluorescent color in each of the above embodiments, but may be other than the X mark drawn with a fluorescent color.
  • the OCR reliability mark 63 may be a mark such as a star mark, a check mark, or the like drawn outside the range surrounded by the issuer description content mark 62.
  • the OCR reliability mark 63 may be drawn in a different color from the issuer name mark 61, or may be drawn in a different color from the issuer description contents mark 62.
  • the OCR reliability mark 63 may be represented by at least one color of the issuer name mark 61 and the issuer content mark 62.
  • the OCR reliability mark 63 is represented by the yellow fluorescent color of the issuer name mark 61 and the issuer description mark 62 when the OCR processing reliability is high, and the OCR processing reliability is low.
  • the issuer name mark 61 and the issuer description mark 62 may be represented by a pink fluorescent color.
  • the OCR reliability mark 63 is a mark indicating that the reliability of the OCR process is low in each of the above embodiments.
  • the OCR reliability mark 63 may be a mark indicating that the reliability of the OCR process is high, or a mark indicating that the reliability of the OCR process is high and low.
  • the OCR execution unit 35a of the form data management system 30 in the above-described embodiments overlaps the issuer name mark 61 in the image extracted in S131 among all the characters included in the image extracted in S131.
  • a character in the same line as the character is extracted based on each position detected in S132 and each position detected in S133 (S134).
  • the OCR execution unit 35a determines, among all the characters included in the image extracted in S131, the characters in the same line as the characters overlapping the issuer name mark 61 in the image extracted in S131, by using the method in S134. It may be extracted by other methods.
  • the OCR execution unit 35a of the form data management system 30 extracts the issuer name acquisition area in the issuer name acquisition processing in each of the above-described embodiments (S131), and thereby issues the issuer name in the issuer name acquisition processing. Only the acquisition area is processed. Therefore, the OCR execution unit 35a can suppress the size of the area to be processed in the issuer name acquisition process, as compared with the configuration in which the entire target form image is to be processed in the issuer name acquisition process. As a result, the size of the RAM of the control unit 35 used in the issuer name acquisition processing can be reduced. However, the OCR executing unit 35a may process the entire target form image without extracting the issuer name acquisition area in the issuer name acquisition process.
  • the OCR execution unit 35a of the form data management system 30 is a character string composed of the characters extracted in S134 in each of the above-described embodiments, and the distance between adjacent characters in this character string is A character string including a character that is equal to or less than a specific distance and overlaps with the issuer name mark 61 in the image extracted in S131 is extracted (S135), and the character string extracted in S135 is acquired as the issuer name ( S136).
  • the OCR execution unit 35a is a character string composed of the characters extracted in S134, and the total length of the character string is equal to or less than a specific distance, and overlaps with the issuer name mark 61 in the image extracted in S131.
  • a character string including the character may be extracted, and the extracted character string may be acquired as the issuer name in S136.
  • the specific distance may be a distance according to the width of the character, for example, a distance of 20 characters of the character overlapping the mark 61 for the issuer name, or a fixed distance independent of the width of the character, for example, 15 cm. May be the distance.
  • the OCR execution unit 35a may acquire the character string composed of all the characters extracted in S134 as the issuer name in S136. Therefore, even if the character string desired by the user, that is, the issuer name mark 61 does not overlap with at least one character of the issuer name, the character string desired by the user can be appropriately acquired. Performance can be improved.
  • the functions of at least a part of the form data management system 30 described in each of the above embodiments may be realized not in the form data management system 30 but in the image forming apparatus. Similarly, at least a part of the functions of the form data management system 30 described in each of the above embodiments may be implemented not in the form data management system 30 but in the user terminal 40.
  • the document of the present invention is a form in each of the above embodiments, but may be a document other than the form.
  • a document OCR program for obtaining character data from a document by OCR processing An OCR information management unit that manages OCR information that associates identification information of the document issuer with a font type used in the OCR process; And an OCR execution unit that executes an OCR process on the document.
  • the OCR execution unit when executing an OCR process on a specific area in the document, performs OCR processing using the type of font associated with the identification information of the issuer of the document in the OCR information.
  • An OCR method for obtaining character data from a document by OCR processing An OCR information management step of managing OCR information that associates the identification information of the document issuer with the type of font used in the OCR process; Performing an OCR process on the document.
  • the OCR execution step includes, when performing OCR processing on a specific area in the document, performing OCR processing using the type of font associated with the identification information of the issuer of the document in the OCR information.
  • An OCR method comprising the step of executing a process.
  • a document OCR program for obtaining character data from a document by OCR processing An OCR information management unit that manages OCR information that associates identification information of an issuer of the document with reliability of OCR processing on the document issued by the issuer; An OCR execution unit that performs an OCR process on the document; And a correction receiving unit that receives the correction of the character data, The OCR execution unit executes the OCR process on a marked document, which is the document with the reliability mark for indicating the reliability, when the OCR process is performed.
  • the OCR information management unit includes the reliability obtained by the OCR execution unit from the marked document in the OCR information,
  • the correction accepting unit when correcting the character data of the document, executes a notification according to the reliability associated with the identification information of the issuer of the document in the OCR information.
  • Document OCR program
  • An OCR method for obtaining character data from a document by OCR processing An OCR information management step of managing OCR information that associates identification information of an issuer of the document with reliability of OCR processing on the document issued by the issuer; An OCR execution step of performing an OCR process on the document; A correction receiving step of receiving a correction of the character data,
  • the OCR execution step includes executing the OCR process on a marked document, which is the document to which the reliability mark for indicating the reliability is attached, the reliability indicated by the reliability mark.
  • the OCR information management step is a step of including the reliability obtained in the OCR execution step from the mark-marked document in the OCR information
  • the correction receiving step is a step of, when correcting the character data of the document, executing a notification according to the reliability associated with the identification information of the issuer of the document in the OCR information.
  • An OCR method characterized in that: (Appendix 5) An OCR system for obtaining character data from a document by OCR processing, An OCR execution unit that performs an OCR process on the document; The OCR execution unit, when performing OCR processing on a marked document which is the document with a specific information mark for acquiring specific information, a character overlapping the specific information mark.
  • a character string composed of at least a part of characters in the same line as above and including a character overlapping with the specific information mark and having a total length equal to or less than a specific distance is acquired as the specific information.
  • An OCR system characterized in that: (Appendix 6) A document OCR program for obtaining character data from a document by OCR processing, Causing a computer to implement an OCR execution unit that performs OCR processing on the document; The OCR execution unit, when performing OCR processing on a marked document which is the document with a specific information mark for acquiring specific information, a character overlapping the specific information mark. And a character string including characters that overlap with the specific information mark, wherein a distance between adjacent characters inside is equal to or less than a specific distance.
  • a document OCR program for acquiring a character string as the specific information (Appendix 7) A document OCR program for obtaining character data from a document by OCR processing, Causing a computer to implement an OCR execution unit that performs OCR processing on the document; The OCR execution unit, when performing OCR processing on a marked document which is the document with a specific information mark for acquiring specific information, a character overlapping the specific information mark.
  • a character string composed of at least a part of characters in the same line as above and including a character overlapping with the specific information mark and having a total length equal to or less than a specific distance is acquired as the specific information.
  • a document OCR program characterized in that: (Appendix 8) An OCR method for obtaining character data from a document by OCR processing, An OCR execution step of performing an OCR process on the document;
  • the OCR execution step includes a step of, when performing an OCR process on a marked document which is the document with a specific information mark for acquiring specific information, a character overlapping the specific information mark. And a character string including characters that overlap with the specific information mark, wherein a distance between adjacent characters inside is equal to or less than a specific distance. Acquiring the character string as the specific information.
  • An OCR method for obtaining character data from a document by OCR processing An OCR execution step of performing an OCR process on the document;
  • the OCR execution step includes a step of, when performing an OCR process on a marked document which is the document with a specific information mark for acquiring specific information, a character overlapping the specific information mark.
  • a character string composed of at least a part of characters in the same line as above and including a character overlapping the specific information mark, and having a total length equal to or less than a specific distance is obtained as the specific information.
  • An OCR method characterized by being a step.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

OCR処理によって帳票(50)から文字データを取得するOCRシステムは、帳票(50)の発行者の発行者名と、OCR処理において使用するフォントのフォント名とを対応付けるOCR用情報テーブル(34e)を管理し、帳票(50)における発行者記載内容読取対象領域に対してOCR処理を実行する場合に、この帳票(50)の発行者の発行者名にOCR用情報テーブルにおいて対応付けられているフォント名で示されるフォントでOCR処理を実行する(S156)ことを特徴とする。

Description

OCRシステム
 本発明は、OCR処理によって文書から文字データを取得するOCRシステムに関する。
 従来、OCR処理によって文書における特定の領域から文字データを取得するOCRシステムが知られている(例えば、特許文献1参照。)。
特開2010-073201号公報
 しかしながら、従来のOCRシステムにおいては、文書における特定の領域内の文字のフォントの種類と、この領域に対するOCR処理において使用するフォントの種類とが異なる場合に、OCR処理における文字の認識の精度が低くなるときがあるという問題がある。
 また、従来のOCRシステムにおいては、OCR処理の信頼度が文書毎に異なっていたとしても、文書に対するOCR処理の信頼度を利用者に認識させることができないので、OCR処理によって文書から取得した文字データの修正を受け付ける場合に、文字データの修正作業の負担が大きいという問題がある。
 さらに、従来のOCRシステムにおいては、特定の情報として取得されることを利用者が希望する文字列の少なくとも1つの文字に特定情報用目印が重なっていない場合に、特定情報用目印が重なっていない文字を特定の情報の一部としては取得しないので、利用者が希望する文字列を適切に取得することができないという問題がある。
 そこで、本発明は、OCR処理における文字の認識の精度を向上することができるOCRシステムを提供することを目的とする。
 本発明の他の目的は、OCR処理によって文書から取得した文字データの修正作業の負担を軽減することができるOCRシステムを提供することである。
 本発明の更に他の目的は、利用者が希望する文字列を適切に取得する可能性を向上することができるOCRシステムを提供することである。
 本発明の第1の観点によれば、OCRシステムは、OCR処理によって文書から文字データを取得するOCRシステムであって、前記文書の発行者の識別情報と、OCR処理において使用するフォントの種類とを対応付けるOCR用情報を管理するOCR用情報管理部と、前記文書に対してOCR処理を実行するOCR実行部とを備え、前記OCR実行部は、前記文書における特定の領域に対してOCR処理を実行する場合に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントでOCR処理を実行することを特徴とする。
 本発明の第2の観点によれば、OCRシステムは、OCR処理によって文書から文字データを取得するOCRシステムであって、前記文書の発行者の識別情報と、この発行者によって発行される前記文書に対するOCR処理の信頼度とを対応付けるOCR用情報を管理するOCR用情報管理部と、前記文書に対してOCR処理を実行するOCR実行部と、前記文字データの修正を受け付ける修正受付部とを備え、前記OCR実行部は、前記信頼度を示すための信頼度用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記信頼度用目印によって示される前記信頼度を取得し、前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって取得された前記信頼度を前記OCR用情報に含め、前記修正受付部は、前記文書の前記文字データの修正時に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記信頼度に応じた通知を実行することを特徴とする。
 本発明の第3の観点によれば、OCRシステムは、OCR処理によって文書から文字データを取得するOCRシステムであって、前記文書に対してOCR処理を実行するOCR実行部を備え、前記OCR実行部は、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、内部の互いに隣接する文字同士の間の距離が特定の距離以下である文字列を前記特定の情報として取得することを特徴とする。
 本発明のOCRシステムは、OCR処理における文字の認識の精度を向上することができる。
 また、本発明のOCRシステムは、OCR処理によって文書から取得した文字データの修正作業の負担を軽減することができる。
 さらに、本発明のOCRシステムは、利用者が希望する文字列を適切に取得する可能性を向上することができる。
本発明の第1の実施の形態に係るOCRシステムのブロック図である。 図1に示す帳票データ管理システムによって管理される帳票データに対応する帳票の一例を示す図である。 MFPである場合の図1に示す画像形成装置のブロック図である。 1台のコンピューターによって構成される場合の図1に示す帳票データ管理システムのブロック図である。 図4に示す帳票データベースの一例を示す図である。 図4に示すOCR用情報テーブルの一例を示す図である。 図4に示す修正情報データベースの一例を示す図である。 図1に示す利用者端末のブロック図である。 OCR用情報テーブルを更新する場合の図4に示す帳票データ管理システムの動作のフローチャートである。 特定の目印が付された図2に示す帳票の一例を示す図である。 図9に示す発行者名取得処理のフローチャートである。 図11に示す発行者名取得処理において抽出される発行者名取得用領域の一例を示す図である。 図11に示す発行者名取得処理において検出される位置の一例を示す図である。 一種類のフォントでのOCR処理によって帳票データベースに帳票データを格納する場合の図4に示す帳票データ管理システムの動作の一部のフローチャートである。 図14Aに示す動作の続きの動作のフローチャートである。 図14に示す動作の続きの動作のフローチャートである。 図14Aに示す発行者名特定処理の一部のフローチャートである。 図16Aに示す動作の続きの動作のフローチャートである。 帳票データが確認される場合の図4に示す帳票データ管理システムの動作のフローチャートである。 本発明の第2の実施の形態に係るOCRシステムの帳票データ管理システムに記憶されている修正情報データベースの一例を示す図である。 二種類のフォントでのOCR処理によって帳票データベースに帳票データを格納する場合の、本発明の第2の実施の形態に係るOCRシステムの帳票データ管理システムの動作の一部のフローチャートである。 図19Aに示す動作の続きの動作のフローチャートである。 図19Bに示す動作の続きの動作のフローチャートである。 帳票データが確認される場合の、本発明の第2の実施の形態に係るOCRシステムの帳票データ管理システムの動作のフローチャートである。 特定の目印が付された図2に示す帳票の一例であって、図10に示す例とは異なる例を示す図である。
 以下、本発明の実施の形態について、図面を用いて説明する。
(第1の実施の形態)
 まず、本発明の第1の実施の形態に係るOCR(Optical Character Recognition)システムの構成について説明する。
 図1は、本実施の形態に係るOCRシステム10のブロック図である。
 図1に示すように、OCRシステム10は、原稿から画像を読み取る読取デバイスとしての画像形成装置20を備えている。画像形成装置20は、例えば、MFP(Multifunction Peripheral)、スキャナー専用機などの画像形成装置によって構成されている。OCRシステム10は、画像形成装置20以外にも、画像形成装置20と同様の構成の画像形成装置を少なくとも1つ備えることが可能である。
 OCRシステム10は、電子化された文書としての帳票のデータ(以下「帳票データ」という。)を管理する帳票データ管理システム30を備えている。帳票データ管理システム30は、1台のコンピューターによって構成されても良いし、複数台のコンピューターによって構成されても良い。帳票データ管理システム30は、クラウド上で動作するシステムでも良い。
 図2は、帳票データ管理システム30によって管理される帳票データに対応する帳票50の一例を示す図である。
 図2に示す帳票50は、発行者の識別情報としての発行者名51と、発行者のロゴ画像52と、発行者によって記載される特定の内容(以下「発行者記載内容」という。)53とを含んでいる。図2において、発行者名51は、「ABC COMPANY」である。
 図1に示すように、OCRシステム10は、帳票データを確認するデータ確認者などの利用者によって使用される利用者端末40を備えている。利用者端末40は、例えば、PC(Personal Computer)などのコンピューターよって構成されている。OCRシステム10は、利用者端末40以外にも、利用者端末40と同様の構成の利用者端末を少なくとも1つ備えることが可能である。
 OCRシステム10に含まれる画像形成装置20と、帳票データ管理システム30とは、LAN(Local Area Network)、又はインターネットなどのネットワーク11を介して通信可能である。帳票データ管理システム30と、OCRシステム10に含まれる利用者端末40とは、ネットワーク11を介して通信可能である。
 図3は、MFPである場合の画像形成装置20のブロック図である。
 図3に示す画像形成装置20は、操作部21と、表示部22と、プリンター23と、スキャナー24と、ファックス通信部25と、通信部26と、記憶部27と、制御部28とを備えている。操作部21は、種々の操作が入力される操作デバイスである。操作デバイスは、例えばボタンなどである。表示部22は、種々の情報を表示する例えばLCD(Liquid Crystal Display)などの表示デバイスである。プリンター23は、用紙などの記録媒体に画像を印刷する印刷デバイスである。スキャナー24は、原稿から画像を読み取る読取デバイスである。ファックス通信部25は、図示していない外部のファクシミリ装置と公衆電話回線などの通信回線経由でファックス通信を行うファックスデバイスである。通信部26は、LAN、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである。記憶部27は、各種の情報を記憶する例えば半導体メモリー、HDD(Hard Disk Drive)などの不揮発性の記憶デバイスである。制御部28は、画像形成装置20全体を制御する。
 制御部28は、例えば、CPU(Central Processing Unit)と、プログラムおよび各種のデータを記憶しているROM(Read Only Memory)と、制御部28のCPUの作業領域として用いられるメモリーとしてのRAM(Random Access Memory)とを備えている。制御部28のCPUは、記憶部27または制御部28のROMに記憶されているプログラムを実行する。
 図4は、1台のコンピューターによって構成される場合の帳票データ管理システム30のブロック図である。
 図4に示す帳票データ管理システム30は、操作部31と、表示部32と、通信部33と、記憶部34と、制御部35とを備えている。操作部31は、種々の操作が入力される操作デバイスである。操作デバイスは、例えば、キーボード、マウスなどである。表示部32は、種々の情報を表示する表示デバイスである。表示デバイスは、例えばLCDなどである。通信部33は、LAN、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである。記憶部34は、各種の情報を記憶する不揮発性の記憶デバイスである。記憶デバイスは、例えば半導体メモリー、又はHDDなどである。制御部35は、帳票データ管理システム30全体を制御する。
 記憶部34は、文書OCRプログラムとしての帳票OCRプログラム34aと、OCRソフト34bと、フォントデータベース34cとを記憶している。文書OCRプログラムは、OCR処理によって帳票から文字データを取得するプログラムである。フォントデータベース34cは、OCRソフト34bによって使用されるフォントを格納する。帳票OCRプログラム34a、OCRソフト34bおよびフォントデータベース34cは、それぞれ、例えば、帳票データ管理システム30の製造段階で帳票データ管理システム30にインストールされていても良いし、CD(Compact Disk)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリーなどの外部の記憶媒体から帳票データ管理システム30に追加でインストールされても良いし、ネットワーク上から帳票データ管理システム30に追加でインストールされても良い。
 記憶部34は、帳票データを格納する帳票データベース34dを記憶している。
 図5は、帳票データベース34dの一例を示す図である。
 図5に示す帳票データベース34dは、帳票データの識別情報としての帳票データIDと、帳票データと、を帳票データ毎に対応付けて含んでいる。帳票データは、帳票の画像データと、帳票の文字データとを含んでいる。例えば、図5においては、帳票データID「D001」と、画像データ「D001.JPG」と、文字データ「D001.xlsx」とが対応付けられている。
 図4に示すように、記憶部34は、OCR処理のための情報としてのOCR用情報を格納するOCR用情報テーブル34eを記憶している。
 図6は、OCR用情報テーブル34eの一例を示す図である。
 図6に示すOCR用情報テーブル34eは、発行者名読取対象領域と、帳票の発行者の発行者名と、ロゴ画像と、発行者記載内容読取対象領域と、フォント名と、OCR処理の信頼度とを発行者毎に対応付けて含んでいる。発行者名読取対象領域は、帳票50において発行者名51を読み取るための領域である。ロゴ画像は、発行者名によって示される発行者の画像である。発行者記載内容読取対象領域は、帳票50において発行者記載内容53を読み取るための領域である。フォント名は、帳票50における発行者記載内容読取対象領域内の文字のフォントの種類を示す。OCR処理の信頼度は、発行者名によって示される発行者によって発行される帳票50に対して実行されるOCR処理を信頼する度合いのことである。例えば、図6においては、発行者名読取対象領域「(x1,y1)-(x2,y2)」と、発行者名「ABC COMPAMY」と、ロゴ画像「LOGO1.JPG」と、発行者記載内容読取対象領域「(x3,y3)-(x4,y4)」と、フォント名「Calibri」と、OCR処理の信頼度「高」とが対応付けられている。
 発行者名読取対象領域および発行者記載内容読取対象領域は、画像データにおける座標によって表現されている。
 ロゴ画像は、データ確認者に帳票データを確認させる責任者によってOCR用情報テーブル34eに登録される。
 図4に示すように、記憶部34は、帳票データの修正状況と、帳票の文字データの修正時に注意喚起するための通知の種類(以下「通知種類」という。)とを帳票データ毎に示す修正情報データベース34fを記憶している。
 図7は、修正情報データベース34fの一例を示す図である。
 図7に示す修正情報データベース34fは、帳票データIDと、帳票データの修正状況と、通知種類と、OCR処理で使用したフォントのフォント名と、文字データとを帳票データ毎に対応付けて含んでいる。文字データは、フォント名で示されるフォントでのOCR処理によって生成されたデータである。例えば、図7においては、帳票データID「D001」と、帳票データの修正状況「未修正」と、通知種類「低信頼」と、OCR処理で使用したフォントのフォント名「Arial」と、フォント名で示されるフォントでのOCR処理によって生成された文字データ「D001a.xlsx」とが対応付けられている。
 帳票データの修正状況としては、例えば、「未修正」と、「修正済」とが存在する。
 通知種類としては、例えば、「高信頼」と、「低信頼」と、「非最適領域」と、「非最適フォント」と、「非最適領域フォント」とが存在する。「高信頼」は、帳票の最適な領域に対して最適なフォントでOCR処理がなされてOCR処理の信頼度が高い場合を示す。「低信頼」は、帳票の最適な領域に対して最適なフォントでOCR処理がなされたが、OCR処理の信頼度が低い場合を示す。「非最適領域」は、帳票の最適ではない領域に対して最適なフォントでOCR処理がなされた場合を示す。「非最適フォント」は、帳票の最適な領域に対して最適ではないフォントでOCR処理がなされた場合を示す。「非最適領域フォント」は、帳票の最適ではない領域に対して最適ではないフォントでOCR処理がなされた場合を示す。
 図4に示す制御部35は、例えば、CPUと、プログラムおよび各種のデータを記憶しているROMと、制御部35のCPUの作業領域として用いられるメモリーとしてのRAMとを備えている。制御部35のCPUは、記憶部34または制御部35のROMに記憶されているプログラムを実行する。
 制御部35は、帳票OCRプログラム34aを実行することによって、OCR実行部35aと、OCR用情報管理部35bと、修正受付部35cとを実現する。OCR実行部35aは、帳票50に対してOCRソフト34bによってOCR処理を実行する。OCR用情報管理部35bは、OCR用情報テーブル34eを管理する。修正受付部35cは、OCR処理によって帳票50から取得された文字データの修正を受け付ける。
 図8は、利用者端末40のブロック図である。
 図8に示すように、利用者端末40は、操作部41と、表示部42と、通信部43と、記憶部44と、制御部45とを備えている。操作部41は、種々の操作が入力される操作デバイスである。操作デバイスは、例えばキーボード、マウスなどである。表示部42は、種々の情報を表示する表示デバイスである。表示デバイスは、例えばLCDなどである。通信部43は、LAN、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである。記憶部44は、各種の情報を記憶する不揮発性の記憶デバイスである。不揮発性の記憶デバイスは、例えば半導体メモリー、HDDなどである。制御部45は、利用者端末40全体を制御する。
 制御部45は、例えば、CPUと、プログラムおよび各種のデータを記憶しているROMと、制御部45のCPUの作業領域として用いられるメモリーとしてのRAMとを備えている。制御部45のCPUは、記憶部44または制御部45のROMに記憶されているプログラムを実行する。
 次に、OCRシステム10の動作について説明する。
 まず、OCR用情報テーブル34eを更新する場合のOCRシステム10の動作について説明する。
 図9は、OCR用情報テーブル34eを更新する場合の帳票データ管理システム30の動作のフローチャートである。
 図9に示すように、帳票データ管理システム30のOCR実行部35aは、発行者名を特定するための発行者名用目印(識別情報用目印)が付された帳票50の画像データを受信したと判断するまで、発行者名用目印が付された帳票の画像データを受信したか否かを判断する(S101)。例えば、発行者名用目印が付された帳票50の画像データは、データ確認者に帳票データを確認させる責任者によって紙の帳票50に蛍光ペンなどの筆記具によって特定の目印が付された後、特定の目印が付された帳票50が画像形成装置20のスキャナー24によって読み取られることによって画像データとして生成されてもよい。そして、生成された帳票50の画像データは、画像形成装置20から帳票データ管理システム30に送信されても良い。また、発行者名用目印が付された帳票50の画像データは、帳票50の画像データに特定の目印が、利用者端末40によって画像データ上で付された後、利用者端末40から帳票データ管理システム30に送信されても良い。
 図10は、特定の目印が付された帳票50の一例を示す図である。
 図10に示す帳票50は、発行者名用目印61と、発行者記載内容用目印62と、OCR信頼度用目印63とを特定の目印として含む目印付文書である。発行者名用目印61は、帳票50のうちから発行者名51を取得するための識別情報用目印である。発行者名用目印61は、帳票50のうちの発行者名51の少なくとも一部に対する特定の蛍光色での塗り潰しである。発行者記載内容用目印62は、帳票50のうちから発行者記載内容読取対象領域を特定するための領域用目印である。発行者記載内容用目印62は、帳票50のうちの発行者記載内容読取対象領域に対する蛍光色での囲みである。OCR信頼度用目印63は、発行者名51で示す発行者によって発行される帳票に対するOCR処理の信頼度を示すための信頼度用目印である。OCR信頼度用目印63は、帳票50のうちの蛍光色で描いた×印である。
 発行者名用目印61、発行者記載内容用目印62およびOCR信頼度用目印63は、例えば、データ確認者に帳票データを確認させる責任者によって紙の帳票50又は帳票50の画像データに付される。OCR信頼度用目印63は、例えば、帳票50の発行者が発行した帳票に対する、過去のOCR処理における文字の認識の精度に基づいて付される。OCR信頼度用目印63は、例えば、責任者が紙の帳票50又は帳票50の画像データに付す。
 図9に示すように、OCR実行部35aは、発行者名用目印61が付された帳票50の画像データを受信したとS101において判断すると、発行者名を取得する発行者名取得処理を実行する(S102)。
 図11は、発行者名取得処理のフローチャートである。
 図11に示す動作は、図9のS101において受信したと判断した帳票50の画像データによって示される画像(以下「対象帳票画像」という。)における発行者名の文字列の方向が、対象帳票画像における横方向であって、対象帳票画像における発行者名の文字の高さ方向が、対象帳票画像における縦方向である場合の動作の例である。
 図11に示すように、OCR実行部35aは、対象帳票画像のうち、発行者名を取得するための特定の領域(以下「発行者名取得用領域」という。)の画像を抽出する(S131)。発行者名取得用領域は、対象帳票画像における縦方向に延在する一対の対辺と、対象帳票画像における横方向に延在する一対の対辺とを備える矩形の領域である。
 発行者名取得用領域の上端の辺の位置は、対象帳票画像における発行者名用目印の縦方向における最上部の位置でも良いし、対象帳票画像における発行者名用目印の縦方向における最上部の位置から特定の距離だけ上側の位置でも良い。ここで、特定の距離は、対象帳票画像における発行者名用目印の縦方向における最上部の位置から最下部の位置までの距離(以下「目印縦幅」という。)に応じた距離でも良いし、目印縦幅に依存しない固定の距離でも良い。
 発行者名取得用領域の下端の辺の位置は、対象帳票画像における発行者名用目印の縦方向における最下部の位置でも良いし、対象帳票画像における発行者名用目印の縦方向における最下部の位置から特定の距離だけ下側の位置でも良い。ここで、特定の距離は、目印縦幅に応じた距離でも良いし、目印縦幅に依存しない固定の距離でも良い。
 発行者名取得用領域の左端の辺の位置は、対象帳票画像における左端の辺の位置と同一でも良いし、対象帳票画像における発行者名用目印の横方向における最左部の位置から特定の距離だけ左側の位置でも良い。ここで、特定の距離は、対象帳票画像における発行者名用目印の横方向における最左部の位置から最右部の位置までの距離(以下「目印横幅」という。)に応じた距離でも良いし、目印横幅に依存しない固定の距離でも良い。
 発行者名取得用領域の右端の辺の位置は、対象帳票画像における右端の辺の位置と同一でも良いし、対象帳票画像における発行者名用目印の横方向における最右部の位置から特定の距離だけ右側の位置でも良い。ここで、特定の距離は、目印横幅に応じた距離でも良いし、目印横幅に依存しない固定の距離でも良い。
 図12は、図11に示す発行者名取得処理において抽出される発行者名取得用領域70の一例を示す図である。
 図12に示す発行者名取得用領域70において、発行者名51である「DEF COMPANY」のうち、発行者名用目印61と重なっている文字は、「DE」のみである。
 図11に示すように、OCR実行部35aは、S131の処理の後、S131において抽出した発行者名取得用領域70の画像において発行者名用目印61と重なっている文字に関して、縦方向における最上部の位置、最下部の位置および中心の位置を検出する(S132)。
 図13は、図11に示す発行者名取得処理において検出される位置の一例を示す図である。
 図13に示す発行者名取得用領域70において、位置71aは、発行者名用目印61と重なっている文字「DE」の縦方向における最上部の位置である。位置71bは、文字「DE」の縦方向における最下部の位置である。位置71cは、文字「DE」の縦方向における中心の位置である。
 図11に示すように、OCR実行部35aは、S132の処理の後、S131において抽出した発行者名取得用領域70の画像に含まれる全ての文字に関して、縦方向における最上部の位置、最下部の位置および中心の位置とを検出する(S133)。
 次いで、OCR実行部35aは、S131において抽出した発行者名取得用領域70の画像に含まれる全ての文字のうち、S131において抽出した発行者名取得用領域70の画像において発行者名用目印61と重なっている文字と同一の行の文字を、S132において検出した各位置と、S133において検出した各位置とに基づいて抽出する(S134)。S134の処理は、発行者名用目印61と重なっている文字と同一の行に含まれない文字が、後述のS136の処理によって発行者名の一部として誤って取得されることを防止するための処理である。
 OCR実行部35aは、S134の処理の後、S134において抽出した文字によって構成される文字列であって、この文字列内において互いに隣接する文字同士の間の距離が特定の距離以下であり、S131において抽出した発行者名取得用領域70の画像において発行者名用目印61と重なっている文字を含む文字列を抽出する(S135)。ここで、特定の距離は、例えば発行者名用目印61と重なっている文字の5文字分の距離など、文字の幅に応じた距離でも良いし、例えば1cmなど、文字の幅に依存しない固定の距離でも良い。S135の処理は、発行者名用目印61と重なっている文字と同一の行に含まれる文字であるが、明らかに発行者名とは関係ない文字が、後述のS136の処理によって発行者名の一部として誤って取得されることを防止するための処理である。
 OCR実行部35aは、S135の処理の後、S135において抽出された文字列をOCRソフト34bによって発行者名として取得して(S136)、図11に示す発行者名取得処理を終了する。
 例えば、OCR実行部35aは、図12に示す発行者名取得用領域70から、図11に示す発行者名取得処理によって発行者名として「DEF COMPANY」を取得することができる。
 図9に示すように、OCR実行部35aは、S102の発行者名取得処理の後、発行者名取得処理において取得された発行者名の位置に応じて発行者名読取対象領域を決定する(S103)。
 OCR実行部35aは、S103の処理の後、対象帳票画像に発行者記載内容用目印62が付されているか否かを判断する(S104)。
 OCR実行部35aは、対象帳票画像に発行者記載内容用目印62が付されているとS104において判断すると、発行者記載内容用目印62によって発行者記載内容読取対象領域を特定する(S105)。
 次いで、OCR実行部35aは、対象帳票画像のうちS105において特定した発行者記載内容読取対象領域内の文字のフォント名を特定する(S106)。すなわち、OCR実行部35aは、対象帳票画像のうちS105において特定した発行者記載内容読取対象領域に含まれる文字のフォント名を、フォントデータベース34cにおいて探索して特定する。
 OCR実行部35aは、対象帳票画像に発行者記載内容用目印62が付されていないとS104において判断するか、S106の処理が終了すると、対象帳票画像にOCR信頼度用目印が付されているか否かを判断する(S107)。
 OCR実行部35aは、対象帳票画像にOCR信頼度用目印63が付されているとS107において判断すると、S102の発行者名取得処理によって取得された発行者名によって示される発行者によって発行される帳票50に対するOCR処理の信頼度として「低」を取得する(S108)。
 OCR用情報管理部35bは、対象帳票画像にOCR信頼度用目印63が付されていないとS107において判断するか、S108の処理が終了すると、S101~S108の処理の実行結果をOCR用情報テーブル34eに反映する(S109)。すなわち、OCR用情報管理部35bは、まず、S102の発行者名取得処理において取得した発行者名がOCR用情報テーブル34eに含まれていない場合、S102の発行者名取得処理において取得した発行者名をOCR用情報テーブル34eに登録する。ここで、OCR用情報管理部35bは、発行者名をOCR用情報テーブル34eに登録する場合、この発行者名に対応付けられるOCR処理の信頼度として「高」をOCR用情報テーブル34eに登録する。次いで、OCR用情報管理部35bは、S108におけるOCR処理の信頼度の取得を実行した場合、S102の発行者名取得処理において取得した発行者名に対応付けられるOCR処理の信頼度として「低」をOCR用情報テーブル34eに上書きで登録する。また、OCR用情報管理部35bは、S102の発行者名取得処理において取得した発行者名に対応付けられる発行者名読取対象領域として、S103において特定した発行者名読取対象領域をOCR用情報テーブル34eに上書きで登録する。また、OCR用情報管理部35bは、S105における発行者記載内容読取対象領域の特定を実行した場合、S102の発行者名取得処理において取得した発行者名に対応付けられる発行者記載内容読取対象領域として、S105において特定した発行者記載内容読取対象領域をOCR用情報テーブル34eに上書きで登録する。また、OCR用情報管理部35bは、S106におけるフォント名の特定を実行した場合、S102の発行者名取得処理において取得した発行者名に対応付けられるフォント名として、S106において特定したフォント名をOCR用情報テーブル34eに上書きで登録する。
 OCR実行部35aは、S109の処理が終了すると、図9に示すS101の処理を実行する。
 次に、一種類のフォントでのOCR処理によって帳票データベース34dに帳票データを格納する場合のOCRシステム10の動作について説明する。
 図14A、図14Bおよび図15は、一種類のフォントでのOCR処理によって帳票データベース34dに帳票データを格納する場合の帳票データ管理システム30の動作のフローチャートである。
 図14A、図14Bおよび図15に示すように、帳票データ管理システム30のOCR実行部35aは、帳票50の画像データを受信したと判断するまで、帳票50の画像データを受信したか否かを判断する(S151)。例えば、帳票50の画像データは、紙の帳票50が画像形成装置20のスキャナー24によって読み取られることによって画像データとして生成されて、画像形成装置20から帳票データ管理システム30に送信されても良い。また、帳票50の画像データは、図示していないコンピューターにおいて生成されて、図示していないコンピューターから帳票データ管理システム30に送信されても良い。
 OCR実行部35aは、帳票50の画像データを受信したとS151において判断すると、S151において受信したと判断した画像データによって示される帳票(以下「対象帳票」という。)の発行者名を特定する発行者名特定処理を実行する(S152)。
 図16Aは、図14Aに示す発行者名特定処理の一部のフローチャートである。図16Bは、図16Bに示す動作の続きの動作のフローチャートである。
 図16Aに示すように、OCR実行部35aは、OCR用情報テーブル34eに発行者名読取対象領域が登録されているか否かを判断する(S191)。
 OCR実行部35aは、OCR用情報テーブル34eに発行者名読取対象領域が登録されているとS191において判断すると、OCR用情報テーブル34eに登録されている未だ対象としていない1つの発行者名読取対象領域のみを対象にする(S192)。
 次いで、OCR実行部35aは、S151において受信したと判断した画像データによって示される画像、すなわち、対象帳票画像のうち、現在の対象の発行者名読取対象領域に対して、OCRソフト34bによってOCR処理を実行する(S193)。
 次いで、OCR実行部35aは、OCR用情報テーブル34eにおいて現在の対象の発行者名読取対象領域に対応付けられている発行者名が、S193において実行したOCR処理によって取得された文字列に含まれているか否かを判断する(S194)。
 OCR実行部35aは、OCR用情報テーブル34eにおいて現在の対象の発行者名読取対象領域に対応付けられている発行者名が、S193において実行したOCR処理によって取得された文字列に含まれているとS194において判断すると、OCR用情報テーブル34eにおいて現在の対象の発行者名読取対象領域に対応付けられている発行者名を、対象帳票の発行者名として特定して(S195)、図16Aに示す発行者名特定処理を終了する。
 OCR実行部35aは、OCR用情報テーブル34eにおいて現在の対象の発行者名読取対象領域に対応付けられている発行者名が、S193において実行したOCR処理によって取得された文字列に含まれていないとS194において判断すると、図16Bに示すように、OCR用情報テーブル34eに登録されている未だ対象としていない発行者名読取対象領域が存在するか否かを判断する(S196)。
 OCR実行部35aは、OCR用情報テーブル34eに登録されている未だ対象としていない発行者名読取対象領域が存在するとS196において判断すると、S192の処理を実行する。
 OCR実行部35aは、OCR用情報テーブル34eに発行者名読取対象領域が登録されていないとS191において判断するか、OCR用情報テーブル34eに登録されている未だ対象としていない発行者名読取対象領域が存在しないとS196において判断すると、OCR用情報テーブル34eに登録されているロゴ画像が対象帳票画像に含まれるか否かを画像マッチング処理によって判断する(S197)。
 OCR実行部35aは、OCR用情報テーブル34eに登録されているロゴ画像が対象帳票画像に含まれるとS197において判断すると、対象帳票画像に含まれるとS197において判断したロゴ画像にOCR用情報テーブル34eにおいて対応付けられている発行者名を、対象帳票の発行者名として特定して(S198)、図16Aおよび図16Bに示す発行者名特定処理を終了する。
 OCR実行部35aは、OCR用情報テーブル34eに登録されているロゴ画像が対象帳票画像に含まれないとS197において判断すると、図16Aおよび図16Bに示す発行者名特定処理を終了する。
 図14Aに示すように、OCR実行部35aは、S152の発行者名特定処理が終了すると、S152の発行者名特定処理において発行者名を特定したか否かを判断する(S153)。
 OCR実行部35aは、S152の発行者名特定処理において発行者名を特定したとS153において判断すると、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてフォント名が対応付けられているか否かを判断する(S154)。
 OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてフォント名が対応付けられているとS154において判断すると、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられているか否かを判断する(S155)。
 図14A及び図14Bに示すように、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられているとS155において判断すると、対象帳票画像のうち、この発行者記載内容読取対象領域に対して、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて対応付けられているフォント名で示されるフォントで、OCRソフト34bによってOCR処理を実行する(S156)。
 次いで、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名と、S156において実行されたOCR処理によって取得された文字列とを含む文字データ、及び、S151において受信したと判断した画像データを含む帳票データを帳票データベース34dに格納する(S157)。ここで、OCR実行部35aは、S157において格納する帳票データに帳票データIDを自動で付与する。
 次いで、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてOCR処理の信頼度として「低」が対応付けられているか否かを判断する(S158)。
 OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてOCR処理の信頼度として「低」が対応付けられていないとS158において判断すると、通知種類としての「高信頼」と、帳票データの修正状況としての「未修正」と、S156におけるOCR処理で使用したフォント名と、S156において実行されたOCR処理によって取得された文字列を含む文字データとを、S157において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース34fに格納して(S159)、S151の処理を実行する。
 OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてOCR処理の信頼度として「低」が対応付けられているとS158において判断すると、通知種類としての「低信頼」と、帳票データの修正状況としての「未修正」と、S156におけるOCR処理で使用したフォント名と、S156において実行されたOCR処理によって取得された文字列を含む文字データとを、S157において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース34fに格納して(S160)、S151の処理を実行する。
 OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられていないとS155において判断すると、対象帳票画像に対して、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて対応付けられているフォント名で示されるフォントで、OCRソフト34bによってOCR処理を実行する(S161)。
 次いで、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名と、S161において実行されたOCR処理によって取得された文字列とを含む文字データ、及びS151において受信したと判断した画像データを含む帳票データを帳票データベース34dに格納する(S162)。ここで、OCR実行部35aは、S162において格納する帳票データに帳票データIDを自動で付与する。
 次いで、OCR実行部35aは、通知種類としての「非最適領域」と、帳票データの修正状況としての「未修正」と、S161におけるOCR処理で使用したフォント名と、S161において実行されたOCR処理によって取得された文字列を含む文字データとを、S162において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース34fに格納して(S163)、S151の処理を実行する。
 図14A及び図15に示すように、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてフォント名が対応付けられていないとS154において判断すると、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられているか否かを判断する(S164)。
 OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられているとS164において判断すると、対象帳票画像のうち、この発行者記載内容読取対象領域に対して、汎用のフォントで、OCRソフト34bによってOCR処理を実行する(S165)。
 次いで、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名と、S165において実行されたOCR処理によって取得された文字列とを含む文字データ、及びS151において受信したと判断した画像データを含む帳票データを帳票データベース34dに格納する(S166)。ここで、OCR実行部35aは、S166において格納する帳票データに帳票データIDを自動で付与する。
 次いで、OCR実行部35aは、通知種類としての「非最適フォント」と、帳票データの修正状況としての「未修正」と、S165におけるOCR処理で使用したフォント名と、S165において実行されたOCR処理によって取得された文字列を含む文字データとを、S166において帳票データベース34dに格納した帳票データの帳票データIDに関連付けて修正情報データベース34fに格納して(S167)、S151の処理を実行する。
 OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられていないとS164において判断すると、対象帳票画像に対して、汎用のフォントで、OCRソフト34bによってOCR処理を実行する(S168)。
 次いで、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名、および、S168において実行されたOCR処理によって取得された文字列を含む文字データと、S151において受信したと判断した画像データとを含む帳票データを帳票データベース34dに格納する(S169)。ここで、OCR実行部35aは、S169において格納する帳票データに帳票データIDを自動で付与する。
 OCR実行部35aは、S152の発行者名特定処理において発行者名を特定しなかったとS153において判断すると、対象帳票画像に対して、汎用のフォントで、OCRソフト34bによってOCR処理を実行する(S170)。
 次いで、OCR実行部35aは、S170において実行されたOCR処理によって取得された文字列を含む文字データと、S151において受信したと判断した画像データとを含む帳票データを帳票データベース34dに格納する(S171)。ここで、OCR実行部35aは、S171において格納する帳票データに帳票データIDを自動で付与する。
 OCR実行部35aは、S169またはS171の処理の後、通知種類としての「非最適領域フォント」と、帳票データの修正状況としての「未修正」と、S168またはS170におけるOCR処理で使用したフォント名と、S168またはS170において実行されたOCR処理によって取得された文字列を含む文字データとを、S169またはS171において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース34fに格納して(S172)、S151の処理を実行する。
 次に、帳票データが確認される場合のOCRシステム10の動作について説明する。
 図17は、帳票データが確認される場合の帳票データ管理システム30の動作のフローチャートである。
 データ確認者は、帳票データ管理システム30が管理している帳票データの一覧の表示を利用者端末40の操作部41を介して利用者端末40に指示することができる。利用者端末40の制御部45は、帳票データ管理システム30が管理している帳票データの一覧の表示を指示されると、帳票データ管理システム30が管理している帳票データの一覧の表示を帳票データ管理システム30に要求する。
 帳票データ管理システム30の修正受付部35cは、帳票データ管理システム30が管理している帳票データの一覧の表示が利用者端末40から要求されると、図17に示す動作を実行する。
 図17に示すように、修正受付部35cは、帳票データベース34dに含まれる帳票データの一覧を示す一覧表示画面を利用者端末40に送信する(S211)。ここで、修正受付部35cは、修正情報データベース34fに含まれる修正状況を一覧表示画面に含める。
 利用者端末40の制御部45は、S211において送信されてきた一覧表示画面を受信すると、受信した一覧表示画面を表示部42に表示する。したがって、データ確認者は、データ確認者自身が確認することを希望する帳票データを、表示部42に表示された一覧表示画面から操作部41を介して選択することができる。例えば、データ確認者は、表示部42に表示された一覧表示画面において修正状況が「未修正」である帳票データのいずれか1つを、データ確認者自身が確認することを希望する帳票データとして選択することができる。利用者端末40の制御部45は、一覧表示画面から帳票データが選択されると、選択された帳票データを帳票データ管理システム30に要求する。
 帳票データ管理システム30の修正受付部35cは、S211の処理の後、利用者端末40から帳票データが要求されたと判断するまで、利用者端末40から帳票データが要求されたか否かを判断する(S212)。
 修正受付部35cは、利用者端末40から帳票データが要求されたとS212において判断すると、利用者端末40から要求されたとS212において判断した帳票データ(以下「対象帳票データ」という。)の確認用画面を利用者端末40に送信する(S213)。ここで、修正受付部35cは、帳票データベース34dに含まれる対象帳票データの画像データによって示される画像と、帳票データベース34dに含まれる対象帳票データの文字データによって示される文字列と、修正情報データベース34fにおいて対象帳票データに対応付けられているフォント名と、修正情報データベース34fにおいて対象帳票データに対応付けられている文字データによって示される文字列と、修正情報データベース34fにおいて対象帳票データに対応付けられている通知種類に応じた通知とを確認用画面に含める。通知種類に応じた通知とは、例えば、通知種類が「高信頼」である場合には「確認してください。」というメッセージである。また、通知種類に応じた通知とは、例えば、通知種類が「低信頼」である場合には「過去に修正ミスの多い帳票です。全項目を十分に確認してください。」というメッセージである。また、通知種類に応じた通知とは、例えば、通知種類が「非最適領域」である場合には「最適ではない領域に対してOCR処理が実行されました。全項目を十分に確認してください。」というメッセージである。また、通知種類に応じた通知とは、例えば、通知種類が「非最適フォント」である場合には「最適ではないフォントでOCR処理が実行されました。全項目を十分に確認してください。」である。また、通知種類に応じた通知とは、例えば、通知種類が「非最適領域フォント」である場合には「最適ではない領域に対して、最適ではないフォントでOCR処理が実行されました。全項目を十分に確認してください。」というメッセージである。
 利用者端末40の制御部45は、S213において送信されてきた確認用画面を受信すると、受信した確認用画面を表示部42に表示する。したがって、データ確認者は、表示部42に表示された確認用画面において、帳票データの文字データによって示される文字列が、帳票データの画像データによって示される画像に含まれる文字列と一致するか否かを確認することができる。そして、データ確認者は、例えば、帳票データの文字データによって示される文字列が、帳票データの画像データによって示される画像に含まれる文字列と一致しない場合に、帳票データの文字データの修正を確認用画面から操作部41を介して指示することができる。利用者端末40の制御部45は、帳票データの文字データの修正が指示されると、指示された修正内容を帳票データ管理システム30に通知する。また、データ確認者は、帳票データの確認の終了を確認用画面から操作部41を介して指示することもできる。利用者端末40の制御部45は、帳票データの確認の終了が指示されると、帳票データの確認の終了を帳票データ管理システム30に通知する。
 帳票データ管理システム30の修正受付部35cは、S213の処理の後、帳票データの文字データの修正が利用者端末40から指示されたか否かを判断する(S214)。
 修正受付部35cは、帳票データの文字データの修正が利用者端末40から指示されたとS214において判断すると、帳票データベース34dにおける対象帳票データの文字データを利用者端末40からの指示の内容に応じて修正した後(S215)、修正情報データベース34fにおいて対象帳票データに対応付けられている修正状況を「修正済」に設定する(S216)。
 修正受付部35cは、帳票データの文字データの修正が利用者端末40から指示されていないとS214において判断するか、S216の処理が終了すると、帳票データの確認の終了が利用者端末40から指示されたか否かを判断する(S217)。
 修正受付部35cは、帳票データの確認の終了が利用者端末40から指示されていないとS217において判断すると、S214の処理を実行する。
 修正受付部35cは、帳票データの確認の終了が利用者端末40から指示されたとS217において判断すると、図17に示す動作を終了する。
 以上に説明したように、OCRシステム10は、帳票50の発行者の発行者名にOCR用情報テーブル34eにおいて対応付けられているフォント名のフォントで、この帳票50における発行者記載内容読取対象領域に対してOCR処理を実行する(S156)。従って、帳票50における発行者記載内容読取対象領域内の文字のフォントのフォント名(フォントの種類)と、この発行者記載内容読取対象領域に対するOCR処理において使用するフォントのフォント名(フォントの種類)とが同一である可能性を向上することができる。その結果、OCR処理における文字の認識の精度を向上することができる。OCRシステム10は、OCR処理における文字の認識の精度を向上することができる場合、OCR処理によって帳票50から取得した文字データに対するデータ確認者による修正量を低減することができ、データ確認者による文字データの修正の作業時間を短縮することができる。
 なお、例えば、フォントに応じてOCR処理における文字の認識の精度がそもそも悪いものである場合、又は、帳票50を印刷した画像形成装置の印刷性能の問題でOCR処理による文字の認識の精度が悪い場合には、帳票50における発行者記載内容読取対象領域内の文字のフォントのフォント名と、この発行者記載内容読取対象領域に対するOCR処理において使用するフォントのフォント名とが同一であったとしても、OCR処理における文字の認識の精度が悪い可能性がある。OCRシステム10は、帳票50の発行者の発行者名にOCR用情報テーブル34eにおいて対応付けられている、OCR処理の信頼度に応じた通知を、この帳票50の文字データの修正時に実行する(S213)。従って、データ確認者による文字データの修正ミスを低減することができる。
 OCRシステム10は、帳票50に対するOCR処理によって、この帳票50の発行者の発行者名(識別情報)を取得し(S152)する。そして、取得した発行者名にOCR用情報テーブル34eにおいて対応付けられているフォント名のフォントで、この帳票50の発行者記載内容読取対象領域に対してOCR処理を実行する(S156)。従って、利便性を向上することができる。
 OCRシステム10は、目印付文書に対してOCR処理を実行することによって、目印付文書において発行者記載内容用目印によって特定される発行者記載内容読取対象領域内の文字のフォントのフォント名(フォントの種類)を特定する(S106)。そして、OCRシステム10は、特定したフォント名(フォントの種類)をOCR用情報テーブル34eに含める(S109)。従って、OCR用情報テーブル34eへのフォントのフォント名の登録を容易化することができる。
 OCRシステム10は、目印付文書に対してOCR処理を実行することによって、目印付文書において発行者名用目印によって特定される発行者の発行者名を取得し(S102)する。そして、OCRシステム10は、取得した発行者名をOCR用情報テーブル34eに含める(S109)。従って、OCR用情報テーブル34eへの発行者の発行者名の登録を容易化することができる。
 OCRシステム10は、帳票50の文字データの修正時に、この帳票50の発行者の発行者名にOCR用情報テーブル34eにおいて対応付けられている、OCR処理の信頼度に応じた通知を実行する(S213)。従って、OCR処理によって帳票50から取得した文字データの修正作業の負担を軽減することができる。
 OCRシステム10は、目印付文書に対してOCR処理を実行することによって、目印付文書においてOCR信頼度用目印によって示される、OCR処理の信頼度を取得する(S108)。そして、OCRシステム10は、取得した信頼度をOCR用情報テーブル34eに含める(S109)。従って、OCR用情報テーブル34eへのOCR処理の信頼度の登録を容易化することができる。
 OCRシステム10は、帳票50に対するOCR処理によって、この帳票50の発行者の発行者名を取得し(S152)する。そして、OCRシステム10は、取得した発行者名にOCR用情報テーブル34eにおいて対応付けられている、OCR処理の信頼度に応じた通知を、この帳票50の文字データの修正時に実行する(S213)。従って、利便性を向上することができる。
 OCRシステム10は、目印付文書に対してOCR処理を実行することによって、目印付文書において発行者名用目印61(特定情報用目印)によって特定される発行者の発行者名を取得する(S102)。そして、OCRシステム10は、取得した発行者名をOCR用情報テーブル34eに含める(S109)。従って、OCR用情報テーブル34eへの発行者の発行者名の登録を容易化することができる。
 OCRシステム10は、目印付文書に対してOCR処理を実行する場合に、発行者名用目印61と重なっている文字と同一の行の少なくとも一部の文字によって構成され、発行者名用目印61と重なっている文字を含む文字列であって、内部の互いに隣接する文字同士の間の距離が特定の距離以下である文字列を発行者名として取得する(S134~S136)。従って、利用者が希望する文字列、すなわち、発行者名の少なくとも1つの文字に発行者名用目印61が重なっていない場合であっても、発行者名を適切に取得する可能性を向上することができる。
 OCRシステム10は、帳票50において発行者名に対する発行者名用目印61の付し方が不完全であっても、発行者名を適切に取得する可能性を向上することができる。従って、間違った発行者名をOCR用情報テーブル34eに登録する可能性を低減することができる。その結果、OCRシステム10は、利用者が帳票50に対して発行者名用目印61を適切に付し直して、発行者名用目印61を適切に付し直した帳票50を画像形成装置のスキャナーに再度読み取らせる必要性を低減することができる。
 OCRシステム10は、帳票50の発行者の発行者名にOCR用情報テーブル34eにおいて対応付けられている、OCR処理の信頼度に応じた通知を、この帳票50の文字データの修正時に実行する(S213)。従って、OCR処理によって帳票50から取得した文字データの修正作業の負担を軽減することができる。
(第2の実施の形態)
 まず、本発明の第2の実施の形態に係るOCRシステムの構成について説明する。
 本実施の形態に係るOCRシステムの構成は、以下に述べる構成を除いて、第1の実施の形態に係るOCRシステム10(図1参照。)の構成と同様である。本実施の形態に係るOCRシステムの構成のうち、OCRシステム10の構成と同様の構成については、OCRシステム10の構成と同一の符号を付して詳細な説明を省略する。
 本実施の形態に係るOCRシステムの帳票データ管理システム30は、修正情報データベース34f(図7参照。)に代えて、修正情報データベース334f(図18参照。)を記憶部34に記憶している。
 図18は、本実施の形態に係るOCRシステムの帳票データ管理システム30に記憶されている修正情報データベース334fの一例を示す図である。
 図18に示す修正情報データベース334fは、OCR処理で使用したフォントのフォント名と、フォント名で示されるフォントでのOCR処理によって生成された文字データとに代えて、OCR処理で使用した第1のフォントのフォント名と、第1のフォントでのOCR処理によって生成された文字データと、OCR処理で使用した第2のフォントのフォント名と、第2のフォントでのOCR処理によって生成された文字データとが、帳票データIDと、帳票データの修正状況と、通知種類とに対応付けられている。例えば、図18においては、帳票データID「D001」と、帳票データの修正状況「未修正」と、通知種類「低信頼」と、OCR処理で使用した第1のフォントのフォント名「Arial」と、第1のフォントでのOCR処理によって生成された文字データ「D001a.xlsx」と、OCR処理で使用した第2のフォントのフォント名「Calibri」と、第2のフォントでのOCR処理によって生成された文字データ「D001b.xlsx」とが対応付けられている。
 次に、本実施の形態に係るOCRシステムの動作について説明する。
 本実施の形態に係るOCRシステムの動作は、以下に述べる動作を除いて、第1の実施の形態に係るOCRシステム10(図1参照。)の動作と同様である。本実施の形態に係るOCRシステムの動作のうち、OCRシステム10の動作と同様の動作については、詳細な説明を省略する。
 まず、二種類のフォントでのOCR処理によって帳票データベース34dに帳票データを格納する場合の本実施の形態に係るOCRシステムの動作について説明する。
 図19A、図19Bおよび図20は、二種類のフォントでのOCR処理によって帳票データベース34dに帳票データを格納する場合の帳票データ管理システム30の動作のフローチャートである。
 図19A、図19Bおよび図20に示すように、帳票データ管理システム30のOCR実行部35aは、S151~S155(図14A参照。)の処理と同様のS451~S455の処理を実行する。
 OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられているとS455において判断すると、対象帳票画像のうち、この発行者記載内容読取対象領域に対して、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて対応付けられているフォント名で示されるフォントである第1のフォントと、第1のフォントとは異なる汎用のフォントである第2のフォントとのそれぞれで、OCRソフト34bによってOCR処理を実行する(S456)。
 次いで、OCR実行部35aは、S452の発行者名特定処理において特定した発行者名と、S456において実行された第1のフォントでのOCR処理によって取得された文字列とを含む文字データ、及びS451において受信したと判断した画像データを含む帳票データを帳票データベース34dに格納する(S457)。ここで、OCR実行部35aは、S457において格納する帳票データに帳票データIDを自動で付与する。
 次いで、OCR実行部35aは、S158(図14参照。)の処理と同様のS458の処理を実行する。
 OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてOCR処理の信頼度として「低」が対応付けられていないとS458において判断すると、通知種類としての「高信頼」と、帳票データの修正状況としての「未修正」と、S456における第1のフォントでのOCR処理で使用したフォント名と、S456において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S456における第2のフォントでのOCR処理で使用したフォント名と、S456において実行された第2のフォントでのOCR処理によって取得された文字列を含む文字データとを、S457において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース334fに格納して(S459)、S451の処理を実行する。
 OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてOCR処理の信頼度として「低」が対応付けられているとS458において判断すると、通知種類としての「低信頼」と、帳票データの修正状況としての「未修正」と、S456における第1のフォントでのOCR処理で使用したフォント名と、S456において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S456における第2のフォントでのOCR処理で使用したフォント名と、S456において実行された第2のフォントでのOCR処理によって取得された文字列を含む文字データとを、S457において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース334fに格納して(S460)、S451の処理を実行する。
 OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられていないとS455において判断すると、対象帳票画像に対して、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて対応付けられているフォント名で示されるフォントである第1のフォントと、第1のフォントとは異なる汎用のフォントである第2のフォントとのそれぞれで、OCRソフト34bによってOCR処理を実行する(S461)。
 次いで、OCR実行部35aは、S452の発行者名特定処理において特定した発行者名と、S461において実行された第1のフォントでのOCR処理によって取得された文字列とを含む文字データ、及びS451において受信したと判断した画像データを含む帳票データを帳票データベース34dに格納する(S462)。ここで、OCR実行部35aは、S462において格納する帳票データに帳票データIDを自動で付与する。
 次いで、OCR実行部35aは、通知種類としての「非最適領域」と、帳票データの修正状況としての「未修正」と、S461における第1のフォントでのOCR処理で使用したフォント名と、S461において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S461における第2のフォントでのOCR処理で使用したフォント名と、S461において実行された第2のフォントでのOCR処理によって取得された文字列を含む文字データとを、S462において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース334fに格納して(S463)、S451の処理を実行する。
 OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてフォント名が対応付けられていないとS454において判断すると、S164(図15参照。)の処理と同様のS464の処理を実行する。
 OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられているとS464において判断すると、対象帳票画像のうち、この発行者記載内容読取対象領域に対して、汎用のフォントである第1のフォントと、第1のフォントとは異なる汎用のフォントである第2のフォントとのそれぞれで、OCRソフト34bによってOCR処理を実行する(S465)。
 次いで、OCR実行部35aは、S452の発行者名特定処理において特定した発行者名、および、S465において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S451において受信したと判断した画像データとを含む帳票データを帳票データベース34dに格納する(S466)。ここで、OCR実行部35aは、S466において格納する帳票データに帳票データIDを自動で付与する。
 次いで、OCR実行部35aは、通知種類としての「非最適フォント」と、帳票データの修正状況としての「未修正」と、S465における第1のフォントでのOCR処理で使用したフォント名と、S465において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S465における第2のフォントでのOCR処理で使用したフォント名と、S465において実行された第2のフォントでのOCR処理によって取得された文字列を含む文字データとを、S466において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース334fに格納して(S467)、S451の処理を実行する。
 OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられていないとS464において判断すると、対象帳票画像に対して、汎用のフォントである第1のフォントと、第1のフォントとは異なる汎用のフォントである第2のフォントとのそれぞれで、OCRソフト34bによってOCR処理を実行する(S468)。
 次いで、OCR実行部35aは、S452の発行者名特定処理において特定した発行者名と、S468において実行された第1のフォントでのOCR処理によって取得された文字列とを含む文字データ、及びS451において受信したと判断した画像データを含む帳票データを帳票データベース34dに格納する(S469)。ここで、OCR実行部35aは、S469において格納する帳票データに帳票データIDを自動で付与する。
 OCR実行部35aは、S452の発行者名特定処理において発行者名を特定しなかったとS453において判断すると、対象帳票画像に対して、汎用のフォントである第1のフォントと、第1のフォントとは異なる汎用のフォントである第2のフォントとのそれぞれで、OCRソフト34bによってOCR処理を実行する(S470)。
 次いで、OCR実行部35aは、S470において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S451において受信したと判断した画像データとを含む帳票データを帳票データベース34dに格納する(S471)。ここで、OCR実行部35aは、S471において格納する帳票データに帳票データIDを自動で付与する。
 OCR実行部35aは、S469またはS471の処理の後、通知種類としての「非最適領域フォント」と、帳票データの修正状況としての「未修正」と、S468またはS470における第1のフォントでのOCR処理で使用したフォント名と、S468またはS470において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S468またはS470における第2のフォントでのOCR処理で使用したフォント名と、S468またはS470において実行された第2のフォントでのOCR処理によって取得された文字列を含む文字データとを、S469またはS471において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース334fに格納して(S472)、S451の処理を実行する。
 次に、帳票データが確認される場合の本実施の形態に係るOCRシステムの動作について説明する。
 図21は、帳票データが確認される場合の帳票データ管理システム30の動作のフローチャートである。
 帳票データ管理システム30の修正受付部35cは、帳票データ管理システム30が管理している帳票データの一覧の表示が利用者端末40から要求されると、図21に示す動作を実行する。
 図21に示すように、修正受付部35cは、S211~S212(図17参照。)の処理と同様のS511~S512の処理を実行する。
 修正受付部35cは、利用者端末40から帳票データが要求されたとS512において判断すると、利用者端末40から要求されたとS512において判断した帳票データ、すなわち、対象帳票データの確認用画面を利用者端末40に送信する(S513)。ここで、修正受付部35cは、帳票データベース34dに含まれる対象帳票データの画像データによって示される画像と、帳票データベース34dに含まれる対象帳票データの文字データによって示される文字列と、修正情報データベース334fにおいて対象帳票データに対応付けられている第1のフォント名と、修正情報データベース334fにおいて対象帳票データに対応付けられている第1のフォントでのOCR処理によって生成された文字データによって示される文字列と、修正情報データベース334fにおいて対象帳票データに対応付けられている第2のフォント名と、修正情報データベース334fにおいて対象帳票データに対応付けられている第2のフォントでのOCR処理によって生成された文字データによって示される文字列と、修正情報データベース334fにおいて対象帳票データに対応付けられている通知種類に応じた通知とを確認用画面に含める。修正受付部35cは、第1のフォントでのOCR処理によって生成された文字データによって示される文字列と、第2のフォントでのOCR処理によって生成された文字データによって示される文字列との差分の表示を確認用画面に含める。通知種類に応じた通知とは、例えば、通知種類が「高信頼」である場合には「2種類のフォントのそれぞれでのOCR処理によって生成された文字データによって示される文字列の差分のみ確認してください。」というメッセージである。通知種類に応じた通知とは、例えば、通知種類が「低信頼」である場合には「過去に修正ミスの多い帳票です。全項目を十分に確認してください。」というメッセージである。通知種類に応じた通知とは、例えば、通知種類が「非最適領域」である場合には「最適ではない領域に対してOCR処理が実行されました。全項目を十分に確認してください。」というメッセージである。通知種類に応じた通知とは、例えば、通知種類が「非最適フォント」である場合には「最適ではないフォントでOCR処理が実行されました。全項目を十分に確認してください。」というメッセージである。通知種類に応じた通知とは、例えば、通知種類が「非最適領域フォント」である場合には「最適ではない領域に対して、最適ではないフォントでOCR処理が実行されました。全項目を十分に確認してください。」というメッセージである。
 帳票データ管理システム30の修正受付部35cは、S513の処理の後、S214~S217(図17参照。)の処理と同様のS514~S517の処理を実行して、図21に示す動作を終了する。
 発行者名51を特定するための発行者名用目印61は、上述の各実施の形態において発行者名51の少なくとも一部の、特定の蛍光色での塗り潰しであるが、発行者名51の少なくとも一部の、特定の蛍光色での塗り潰し以外のものでも良い。例えば、発行者名用目印61は、発行者名51の少なくとも一部の塗り潰しではなく、発行者名51の少なくとも一部の囲みでも良い。また、発行者名用目印61は、赤、青など、蛍光色以外の色で描かれても良い。発行者名用目印61は、発行者記載内容用目印62と異なる色で描かれても良いし、OCR信頼度用目印63と異なる色で描かれても良い。
 発行者記載内容用目印62は、上述の各実施の形態において発行者記載内容読取対象領域の、蛍光色での囲みであるが、発行者記載内容読取対象領域の、蛍光色での囲み以外のものでも良い。例えば、発行者記載内容用目印62は、赤、青など、蛍光色以外の色で描かれても良い。発行者記載内容用目印62は、発行者名用目印61と異なる色で描かれても良いし、OCR信頼度用目印63と異なる色で描かれても良い。
 OCR信頼度用目印63は、上述の各実施の形態において蛍光色で描いた×印であるが、蛍光色で描いた×印以外のものでも良い。例えば、OCR信頼度用目印63は、発行者記載内容用目印62によって囲まれた範囲の外部に描かれた星印、チェックマークなどの印でも良いし、例えば、図22に示すように、発行者記載内容用目印62によって囲まれた範囲の内部に描かれた線などの印でも良い。OCR信頼度用目印63は、発行者名用目印61と異なる色で描かれても良いし、発行者記載内容用目印62と異なる色で描かれても良い。OCR信頼度用目印63は、発行者名用目印61および発行者記載内容用目印62の少なくとも一方の色で表されても良い。例えば、OCR信頼度用目印63は、OCR処理の信頼度が高い場合に発行者名用目印61および発行者記載内容用目印62の黄色の蛍光色で表され、OCR処理の信頼度が低い場合に発行者名用目印61および発行者記載内容用目印62のピンクの蛍光色で表されても良い。
 OCR信頼度用目印63は、上述の各実施の形態においてOCR処理の信頼度が低いことを示す目印である。しかしながら、OCR信頼度用目印63は、OCR処理の信頼度が高いことを示す目印でも良いし、OCR処理の信頼度が高いことと、低いこととを区別して示す目印でも良い。
 帳票データ管理システム30のOCR実行部35aは、上述の各実施の形態において、S131において抽出した画像に含まれる全ての文字のうち、S131において抽出した画像において発行者名用目印61と重なっている文字と同一の行の文字を、S132において検出した各位置と、S133において検出した各位置とに基づいて抽出する(S134)。しかしながら、OCR実行部35aは、S131において抽出した画像に含まれる全ての文字のうち、S131において抽出した画像において発行者名用目印61と重なっている文字と同一の行の文字を、S134における方法以外の方法によって抽出しても良い。
 帳票データ管理システム30のOCR実行部35aは、上述の各実施の形態において、発行者名取得処理において発行者名取得用領域を抽出する(S131)ことによって、発行者名取得処理において発行者名取得用領域のみを処理の対象にする。従って、OCR実行部35aは、発行者名取得処理において対象帳票画像全体を処理の対象にする構成と比較して、発行者名取得処理において処理の対象にする領域のサイズを抑えることができる。その結果、発行者名取得処理において使用する、制御部35のRAMのサイズを抑えることができる。しかしながら、OCR実行部35aは、発行者名取得処理において発行者名取得用領域を抽出せずに対象帳票画像全体を処理の対象にしても良い。
 帳票データ管理システム30のOCR実行部35aは、上述の各実施の形態において、S134において抽出した文字によって構成される文字列であって、この文字列内において互いに隣接する文字同士の間の距離が特定の距離以下であり、S131において抽出した画像において発行者名用目印61と重なっている文字を含む文字列を抽出し(S135)、S135において抽出された文字列を発行者名として取得する(S136)。しかしながら、OCR実行部35aは、S134において抽出した文字によって構成される文字列であって、この文字列の全長が特定の距離以下であり、S131において抽出した画像において発行者名用目印61と重なっている文字を含む文字列を抽出し、抽出した文字列をS136において発行者名として取得しても良い。ここで、特定の距離は、例えば発行者名用目印61と重なっている文字の20文字分の距離など、文字の幅に応じた距離でも良いし、例えば15cmなど、文字の幅に依存しない固定の距離でも良い。また、OCR実行部35aは、S134において抽出した全ての文字によって構成される文字列をS136において発行者名として取得しても良い。従って、利用者が希望する文字列、すなわち、発行者名の少なくとも1つの文字に発行者名用目印61が重なっていない場合であっても、利用者が希望する文字列を適切に取得する可能性を向上することができる。
 上述の各実施の形態において説明した帳票データ管理システム30の少なくとも一部の機能は、帳票データ管理システム30においてではなく、画像形成装置において実現されても良い。同様に、上述の各実施の形態において説明した帳票データ管理システム30の少なくとも一部の機能は、帳票データ管理システム30においてではなく、利用者端末40において実現されても良い。
 本発明の文書は、上述の各実施の形態において帳票であるが、帳票以外の文書でも良い。
 本願は、さらに以下の付記を開示する。なお、以下の付記は、本発明を限定するものではない。
(付記1)
 OCR処理によって文書から文字データを取得するための文書OCRプログラムであって、
 前記文書の発行者の識別情報と、OCR処理において使用するフォントの種類とを対応付けるOCR用情報を管理するOCR用情報管理部と、
 前記文書に対してOCR処理を実行するOCR実行部と
 をコンピューターに実現させ、
 前記OCR実行部は、前記文書における特定の領域に対してOCR処理を実行する場合に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントでOCR処理を実行することを特徴とする文書OCRプログラム。
(付記2)
 OCR処理によって文書から文字データを取得するOCR方法であって、
 前記文書の発行者の識別情報と、OCR処理において使用するフォントの種類とを対応付けるOCR用情報を管理するOCR用情報管理ステップと、
 前記文書に対してOCR処理を実行するOCR実行ステップと
 を備え、
 前記OCR実行ステップは、前記文書における特定の領域に対してOCR処理を実行する場合に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントでOCR処理を実行するステップであることを特徴とするOCR方法。
(付記3)
 OCR処理によって文書から文字データを取得するための文書OCRプログラムであって、
 前記文書の発行者の識別情報と、この発行者によって発行される前記文書に対するOCR処理の信頼度とを対応付けるOCR用情報を管理するOCR用情報管理部と、
 前記文書に対してOCR処理を実行するOCR実行部と、
 前記文字データの修正を受け付ける修正受付部と
 をコンピューターに実現させ、
 前記OCR実行部は、前記信頼度を示すための信頼度用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記信頼度用目印によって示される前記信頼度を取得し、
 前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって取得された前記信頼度を前記OCR用情報に含め、
 前記修正受付部は、前記文書の前記文字データの修正時に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記信頼度に応じた通知を実行することを特徴とする文書OCRプログラム。
(付記4)
 OCR処理によって文書から文字データを取得するOCR方法であって、
 前記文書の発行者の識別情報と、この発行者によって発行される前記文書に対するOCR処理の信頼度とを対応付けるOCR用情報を管理するOCR用情報管理ステップと、
 前記文書に対してOCR処理を実行するOCR実行ステップと、
 前記文字データの修正を受け付ける修正受付ステップと
 を備え、
 前記OCR実行ステップは、前記信頼度を示すための信頼度用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記信頼度用目印によって示される前記信頼度を取得するステップであり、
 前記OCR用情報管理ステップは、前記目印付文書から前記OCR実行ステップによって取得された前記信頼度を前記OCR用情報に含めるステップであり、
 前記修正受付ステップは、前記文書の前記文字データの修正時に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記信頼度に応じた通知を実行するステップであることを特徴とするOCR方法。
(付記5)
 OCR処理によって文書から文字データを取得するOCRシステムであって、
 前記文書に対してOCR処理を実行するOCR実行部を備え、
 前記OCR実行部は、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、全長が特定の距離以下である文字列を前記特定の情報として取得することを特徴とするOCRシステム。
(付記6)
 OCR処理によって文書から文字データを取得するための文書OCRプログラムであって、
 前記文書に対してOCR処理を実行するOCR実行部をコンピューターに実現させ、
 前記OCR実行部は、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、内部の互いに隣接する文字同士の間の距離が特定の距離以下である文字列を前記特定の情報として取得することを特徴とする文書OCRプログラム。
(付記7)
 OCR処理によって文書から文字データを取得するための文書OCRプログラムであって、
 前記文書に対してOCR処理を実行するOCR実行部をコンピューターに実現させ、
 前記OCR実行部は、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、全長が特定の距離以下である文字列を前記特定の情報として取得することを特徴とする文書OCRプログラム。
(付記8)
 OCR処理によって文書から文字データを取得するOCR方法であって、
 前記文書に対してOCR処理を実行するOCR実行ステップを備え、
 前記OCR実行ステップは、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、内部の互いに隣接する文字同士の間の距離が特定の距離以下である文字列を前記特定の情報として取得するステップであることを特徴とするOCR方法。
(付記9)
 OCR処理によって文書から文字データを取得するOCR方法であって、
 前記文書に対してOCR処理を実行するOCR実行ステップを備え、
 前記OCR実行ステップは、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、全長が特定の距離以下である文字列を前記特定の情報として取得するステップであることを特徴とするOCR方法。

Claims (15)

  1.  OCR処理によって文書から文字データを取得するOCRシステムであって、
     前記文書の発行者の識別情報と、OCR処理において使用するフォントの種類とを対応付けるOCR用情報を管理するOCR用情報管理部と、
     前記文書に対してOCR処理を実行するOCR実行部と
     を備え、
     前記OCR実行部は、前記文書における特定の領域に対してOCR処理を実行する場合に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントでOCR処理を実行することを特徴とするOCRシステム。
  2.  前記文書は、この文書の前記発行者の前記識別情報を含み、
     前記OCR実行部は、前記文書に対するOCR処理によって、この文書の前記発行者の前記識別情報を取得し、取得した前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントで、この文書の前記特定の領域に対してOCR処理を実行することを特徴とする請求項1に記載のOCRシステム。
  3.  前記OCR実行部は、前記特定の領域を特定するための領域用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記領域用目印によって特定される前記特定の領域内の文字のフォントの前記種類を特定し、
     前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって特定された前記種類を前記OCR用情報に含めることを特徴とする請求項1に記載のOCRシステム。
  4.  前記目印付文書は、前記目印付文書の前記発行者の前記識別情報を取得するための識別情報用目印が付され、
     前記OCR実行部は、前記目印付文書に対してOCR処理を実行する場合に、前記識別情報用目印によって特定される前記識別情報を取得し、
     前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって取得された前記識別情報を前記OCR用情報に含めることを特徴とする請求項3に記載のOCRシステム。
  5.  前記特定の領域の上端の辺の位置は、前記文書における前記識別情報用目印の縦方向における最上部の位置から特定の距離だけ上側の位置であり、
     前記特定の領域の下端の辺の位置は、前記文書における前記識別情報用目印の縦方向における最下部の位置から特定の距離だけ下側の位置であり、
     前記特定の領域の左端の辺の位置は、前記文書における前記識別情報用目印の横方向における最左部の位置から特定の距離だけ左側の位置であり、
     前記特定の領域の右端の辺の位置は、前記文書における前記識別情報用目印の横方向における最右部の位置から特定の距離だけ右側の位置である、請求項4に記載のOCRシステム。
  6.  OCR処理によって文書から文字データを取得するOCRシステムであって、
     前記文書の発行者の識別情報と、前記発行者によって発行される前記文書に対するOCR処理の信頼度とを対応付けるOCR用情報を管理するOCR用情報管理部と、
     前記文書に対してOCR処理を実行するOCR実行部と、
     前記文字データの修正を受け付ける修正受付部と
     を備え、
     前記OCR実行部は、前記信頼度を示すための信頼度用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記信頼度用目印によって示される前記信頼度を取得し、
     前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって取得された前記信頼度を前記OCR用情報に含め、
     前記修正受付部は、前記文書の前記文字データの修正時に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記信頼度に応じた通知を実行することを特徴とするOCRシステム。
  7.  前記文書は、この文書の前記発行者の前記識別情報が含まれ、
     前記OCR実行部は、前記文書に対するOCR処理によって、この文書の前記発行者の前記識別情報を取得し、
     前記修正受付部は、前記OCR実行部によって前記文書から取得された前記識別情報に前記OCR用情報において対応付けられている前記信頼度に応じた通知を、この文書の前記文字データの修正時に実行することを特徴とする請求項6に記載のOCRシステム。
  8.  前記目印付文書は、前記目印付文書の前記発行者の前記識別情報を取得するための識別情報用目印が付され、
     前記OCR実行部は、前記目印付文書に対してOCR処理を実行する場合に、前記識別情報用目印によって特定される前記識別情報を取得し、
     前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって取得された前記識別情報を前記OCR用情報に含めることを特徴とする請求項6に記載のOCRシステム。
  9.  前記OCR用情報は、OCR処理において使用するフォントの種類を、前記識別情報と対応付け、
     前記OCR実行部は、前記文書における特定の領域に対してOCR処理を実行する場合に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントでOCR処理を実行することを特徴とする請求項6に記載のOCRシステム。
  10.  前記目印付文書は、前記領域を特定するための領域用目印が付され、
     前記OCR実行部は、前記目印付文書に対してOCR処理を実行する場合に、前記領域用目印によって特定される前記領域内の文字のフォントの前記種類を特定し、
     前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって特定された前記種類を前記OCR用情報に含めることを特徴とする請求項9に記載のOCRシステム。
  11.  前記信頼度用目印は、前記信頼度が低いことを示す目印と、前記信頼度が高いことを示す目印と、前記信頼度が高いことと低いこととを区別して示す目印との少なくとも1つを含む、請求項6に記載のOCRシステム。
  12.  OCR処理によって文書から文字データを取得するOCRシステムであって、
     前記文書に対してOCR処理を実行するOCR実行部を備え、
     前記OCR実行部は、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、内部の互いに隣接する文字同士の間の距離が特定の距離以下である文字列を前記特定の情報として取得することを特徴とするOCRシステム。
  13.  前記特定の情報は、前記文書の発行者の識別情報であり、
     前記OCRシステムは、前記文書の前記発行者の前記識別情報と、OCR処理において使用するフォントの種類とを対応付けるOCR用情報を管理するOCR用情報管理部を備え、
     前記目印付文書は、この目印付文書における特定の領域を特定するための領域用目印が付され、
     前記OCR実行部は、前記目印付文書に対してOCR処理を実行する場合に、前記領域用目印によって特定される前記領域内の文字のフォントの前記種類を特定し、
     前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって特定された前記種類を前記OCR用情報に含め、
     前記OCR実行部は、前記文書における前記領域に対してOCR処理を実行する場合に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントでOCR処理を実行することを特徴とする請求項12に記載のOCRシステム。
  14.  前記特定の情報は、前記文書の発行者の識別情報であり、
     前記OCRシステムは、
      前記文書の前記発行者の前記識別情報と、この発行者によって発行される前記文書に対するOCR処理の信頼度とを対応付けるOCR用情報を管理するOCR用情報管理部と、
      前記文字データの修正を受け付ける修正受付部と
     を備え、
     前記目印付文書は、前記信頼度を示すための信頼度用目印が付され、
     前記OCR実行部は、前記目印付文書に対してOCR処理を実行する場合に、前記信頼度用目印によって示される前記信頼度を取得し、
     前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって取得された前記信頼度を前記OCR用情報に含め、
     前記修正受付部は、前記文書の前記文字データの修正時に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記信頼度に応じた通知を実行することを特徴とする請求項12に記載のOCRシステム。
  15.  前記OCR用情報管理部は、前記OCR用情報において、前記文書の前記発行者の前記識別情報と、OCR処理において使用するフォントの種類とを対応付け、
     前記OCR実行部は、前記種類のフォントと、前記種類のフォントと異なるフォントとのそれぞれでOCR処理を実行し、
     前記修正受付部は、前記種類のフォントでのOCR処理によって生成された前記文字データと、前記異なるフォントでのOCR処理によって生成された前記文字データとの差分を含む確認用画面を利用者端末に送信する、請求項14に記載のOCRシステム。
PCT/JP2019/031435 2018-08-27 2019-08-08 Ocrシステム WO2020045039A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201980055493.XA CN112639818B (zh) 2018-08-27 2019-08-08 Ocr系统
JP2020540225A JP7176566B2 (ja) 2018-08-27 2019-08-08 Ocrシステム
US17/272,092 US11972197B2 (en) 2018-08-27 2019-08-08 OCR system

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2018-158185 2018-08-27
JP2018158185 2018-08-27
JP2018158183 2018-08-27
JP2018-158183 2018-08-27
JP2018158182 2018-08-27
JP2018-158182 2018-08-27

Publications (1)

Publication Number Publication Date
WO2020045039A1 true WO2020045039A1 (ja) 2020-03-05

Family

ID=69644220

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/031435 WO2020045039A1 (ja) 2018-08-27 2019-08-08 Ocrシステム

Country Status (4)

Country Link
US (1) US11972197B2 (ja)
JP (1) JP7176566B2 (ja)
CN (1) CN112639818B (ja)
WO (1) WO2020045039A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115294588B (zh) * 2022-08-17 2024-04-19 湖北鑫英泰系统技术股份有限公司 一种基于rpa流程机器人的数据处理方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0298795A (ja) * 1988-10-06 1990-04-11 Canon Inc 文字認識装置
JPH11306279A (ja) * 1998-04-20 1999-11-05 Oki Electric Ind Co Ltd 文字認識装置および文字認識方法
JP2003303315A (ja) * 2002-04-12 2003-10-24 Hitachi Ltd 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム
JP2007233900A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2017091419A (ja) * 2015-11-16 2017-05-25 富士ゼロックス株式会社 情報処理装置、画像読み取り装置及びプログラム
JP2018124854A (ja) * 2017-02-02 2018-08-09 富士ゼロックス株式会社 画像処理装置および画像処理プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5805747A (en) * 1994-10-04 1998-09-08 Science Applications International Corporation Apparatus and method for OCR character and confidence determination using multiple OCR devices
JP3462970B2 (ja) 1997-04-28 2003-11-05 三菱電機株式会社 メッキ処理装置およびメッキ処理方法
KR100664421B1 (ko) * 2006-01-10 2007-01-03 주식회사 인지소프트 구비된 카메라를 이용한 명함 인식을 위한 휴대용 단말기및 명함 인식 방법
US8228522B2 (en) * 2007-01-29 2012-07-24 Kabushiki Kaisha Toshiba Document data management apparatus to manage document data read and digitized by an image reading apparatus and a technique to improve reliability of various processing using document data
US8014604B2 (en) * 2008-04-16 2011-09-06 International Business Machines Corporation OCR of books by word recognition
JP5464474B2 (ja) 2008-08-20 2014-04-09 株式会社 ハンモック Ocrシステム
CN102567725A (zh) * 2011-12-23 2012-07-11 国网电力科学研究院 一种金融ocr系统手写体数字串的软切分方法
JP6702629B2 (ja) * 2014-12-27 2020-06-03 株式会社 ハンモック 活字ocrシステム
JP6531738B2 (ja) 2016-08-08 2019-06-19 京セラドキュメントソリューションズ株式会社 画像処理装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0298795A (ja) * 1988-10-06 1990-04-11 Canon Inc 文字認識装置
JPH11306279A (ja) * 1998-04-20 1999-11-05 Oki Electric Ind Co Ltd 文字認識装置および文字認識方法
JP2003303315A (ja) * 2002-04-12 2003-10-24 Hitachi Ltd 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム
JP2007233900A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2017091419A (ja) * 2015-11-16 2017-05-25 富士ゼロックス株式会社 情報処理装置、画像読み取り装置及びプログラム
JP2018124854A (ja) * 2017-02-02 2018-08-09 富士ゼロックス株式会社 画像処理装置および画像処理プログラム

Also Published As

Publication number Publication date
CN112639818A (zh) 2021-04-09
CN112639818B (zh) 2024-06-04
JPWO2020045039A1 (ja) 2021-08-12
JP7176566B2 (ja) 2022-11-22
US11972197B2 (en) 2024-04-30
US20210319248A1 (en) 2021-10-14

Similar Documents

Publication Publication Date Title
JP5929210B2 (ja) 情報処理プログラム、情報処理装置および情報処理装置の制御方法
WO2018196661A1 (zh) 一种图像处理装置及其图像处理方法
US20160366234A1 (en) Data process system, data process apparatus, and data process method
US20130290840A1 (en) Document Management Apparatus for Managing a Document Image Including Handwritten Comment Areas
US9614984B2 (en) Electronic document generation system and recording medium
US20150381713A1 (en) Information Processing Apparatus, Cooperation System and Computer Readable Medium
JP6264949B2 (ja) 画像処理装置及びプログラム
JP2021043775A (ja) 情報処理装置及びプログラム
WO2020045039A1 (ja) Ocrシステム
US20190306362A1 (en) Information processing apparatus, information processing system, and method of updating file
JP2009140401A (ja) データ処理システム、データ処理装置、データ処理方法、及びデータ処理プログラム
US11301180B2 (en) Information processing apparatus registering redo or erroneous process request
US20140063511A1 (en) Image forming apparatus and image forming system
JP2008052439A (ja) 画像処理システムおよび画像処理プログラム
US20160055151A1 (en) Control device, non-transitory computer readable medium, and control method
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP2008059255A (ja) 情報入力装置、及びプログラム
JP2021100190A (ja) 情報処理装置、制御プログラムおよび制御方法
JP6536829B2 (ja) 画像形成装置および文字描画プログラム
JP6536828B2 (ja) 画像形成装置および文字描画プログラム
JP2020014086A (ja) データ送信システム、およびデータ送信装置
JP6478062B2 (ja) 通信装置および通信プログラム
JP6323009B2 (ja) 画像処理装置及び画像処理プログラム
US20230386234A1 (en) Image processing apparatus and image processing method
JP7467929B2 (ja) 装置のテスト自動化のための方法およびプログラムならびに装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19855980

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020540225

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19855980

Country of ref document: EP

Kind code of ref document: A1