WO2022270575A1 - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
WO2022270575A1
WO2022270575A1 PCT/JP2022/025072 JP2022025072W WO2022270575A1 WO 2022270575 A1 WO2022270575 A1 WO 2022270575A1 JP 2022025072 W JP2022025072 W JP 2022025072W WO 2022270575 A1 WO2022270575 A1 WO 2022270575A1
Authority
WO
WIPO (PCT)
Prior art keywords
character
characters
accuracy
information
image
Prior art date
Application number
PCT/JP2022/025072
Other languages
English (en)
French (fr)
Inventor
茂樹 小澤
Original Assignee
ローレルバンクマシン株式会社
ローレル機械株式会社
ローレル精機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ローレルバンクマシン株式会社, ローレル機械株式会社, ローレル精機株式会社 filed Critical ローレルバンクマシン株式会社
Publication of WO2022270575A1 publication Critical patent/WO2022270575A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern

Definitions

  • the present invention relates to an information processing device and a program.
  • OCR optical character recognition
  • a character recognition method that classifies the accuracy of character recognition results into a plurality of categories, and sets one of the plurality of categories to indicate the accuracy that the character recognition result is absolutely correct. ing. In this type of character recognition method, it is possible to omit confirmation work by the operator for characters belonging to a category indicating the degree of certainty that the result of character recognition is absolutely correct.
  • An information processing apparatus provides character information indicating a plurality of characters read from an image to be read by character recognition processing for recognizing characters contained in an image, and recognition results for each of the plurality of characters.
  • a display control unit for displaying on a display device the plurality of characters indicated by the character information; and based on the accuracy indicated by the accuracy information and a restriction unit that restricts an operation to a protected character among the plurality of characters that satisfies the condition regarding accuracy of the recognition result.
  • An information processing apparatus includes an image information acquisition unit that acquires image information representing an image; a character recognition unit that calculates the accuracy of a recognition result for each character; a display control unit that causes a display device to display the plurality of characters recognized by the character recognition unit; and a restricting unit that restricts an operation for a protected character satisfying the condition regarding the accuracy of the recognition result among the plurality of characters based on the above.
  • a program causes a processor to perform character information indicating a plurality of characters read from an image to be read by character recognition processing for recognizing characters contained in an image, and recognition of each of the plurality of characters.
  • an acquisition unit for acquiring recognition information including accuracy information indicating accuracy of a result;
  • a display control unit for displaying on a display device the plurality of characters indicated by the character information; and based on the accuracy indicated by the accuracy information.
  • a restriction unit that restricts an operation to a protected character among the plurality of characters that satisfies the condition regarding the accuracy of the recognition result.
  • a program comprises a processor, an image information obtaining unit that obtains image information indicating an image; a plurality of characters included in the image indicated by the image information; a character recognition unit that calculates the accuracy of a recognition result for each of the characters, a display control unit that displays the plurality of characters recognized by the character recognition unit on a display device, and the accuracy calculated by the character recognition unit and a restriction unit that restricts an operation to a protected character among the plurality of characters that satisfies the condition regarding the accuracy of the recognition result.
  • FIG. 1 is an explanatory diagram for explaining an outline of a character recognition system according to an embodiment
  • FIG. FIG. 4 is an explanatory diagram for explaining an example of an input image
  • FIG. 10 is an explanatory diagram for explaining an example of an overview of a confirmation screen for confirming the result of character recognition processing
  • 2 is a functional block diagram showing an example of the configuration of the character recognition device shown in FIG. 1
  • FIG. 5 is a diagram showing an example of the hardware configuration of the character recognition device shown in FIG. 4
  • FIG. 2 is a functional block diagram showing an example of the configuration of the terminal device shown in FIG. 1
  • FIG. 7 is a diagram illustrating an example of a hardware configuration of a terminal device illustrated in FIG. 6
  • FIG. 7 is an explanatory diagram showing an example of an edit table shown in FIG. 6;
  • FIG. 7 is an explanatory diagram showing another example of the edit table shown in FIG. 6;
  • FIG. 2 is an explanatory diagram for explaining an overview of the operation of the terminal device shown in FIG. 1;
  • 3 is a sequence chart showing an example of the operation of the character recognition system shown in FIG. 1;
  • FIG. 12 is an explanatory diagram for explaining an overview of the operation of the terminal device according to the first modified example;
  • FIG. 12 is an explanatory diagram for explaining an overview of the operation of the terminal device according to the second modified example;
  • FIG. 12 is a diagram showing an example of a confirmation screen according to a third modified example;
  • FIG. It is a figure which shows an example of the confirmation screen which concerns on a 4th modification.
  • FIG. 16 is a flow chart showing an example of the operation of the terminal device according to the fifth modified example;
  • FIG. 20 is an explanatory diagram for explaining an overview of a character recognition system according to a sixth modification;
  • FIG. 20 is a functional block diagram showing an example of the configuration of a character recognition device according to a seventh modified example;
  • 19 is a diagram showing an example of the hardware configuration of the character recognition device shown in FIG. 18;
  • FIG. 20 is an explanatory diagram for explaining an overview of a character recognition system according to a sixth modification;
  • FIG. 20 is a functional block diagram showing an example of the configuration of a character recognition device according to a seventh modified example;
  • 19 is a diagram showing an example of the hardware configuration of the character recognition device shown in FIG. 18;
  • FIG. 18 is a diagram showing an example of the hardware configuration of the character recognition device shown in FIG. 18;
  • FIG. 1 is an explanatory diagram for explaining the outline of the character recognition system 1 according to the embodiment.
  • the character recognition system 1 shown in FIG. 1 includes a character recognition device 10, a terminal device 20, and a display device 30 provided corresponding to the terminal device 20.
  • the terminal device 20 is an example of an “information processing device”.
  • the character recognition device 10 and the terminal device 20 are communicably connected to each other via a network NW, for example.
  • Network NW may include the Internet and local area networks.
  • the network NW includes one or both of a wired network and a wireless network.
  • the connection between the network NW and the character recognition device 10 may be, for example, a connection that enables mutual communication between a plurality of elements, and may be a wired or wireless connection. and wireless connection.
  • the character recognition device 10 performs character recognition processing for recognizing characters included in an image using, for example, optical character recognition (OCR) technology.
  • OCR optical character recognition
  • An example of the input image IIMG to be subjected to character recognition processing will be described later with reference to FIG. Also, the configuration of the character recognition device 10 will be described later with reference to FIGS. 4 and 5.
  • FIG. 1 An example of the input image IIMG to be subjected to character recognition processing will be described later with reference to FIG. Also, the configuration of the character recognition device 10 will be described later with reference to FIGS. 4 and 5.
  • the terminal device 20 may be, for example, a stationary information device such as a personal computer, or a portable information terminal such as a notebook personal computer and a tablet terminal.
  • the terminal device 20 is, for example, communicably connected to the display device 30 and can display an image or the like on a display section 310 provided in the display device 30 .
  • the connection between the terminal device 20 and the display device 30 may be a wired or wireless connection, or may be a wired and wireless connection.
  • the display device 30 may be included in the terminal device 20 .
  • the terminal device 20 causes the display device 30 to display, for example, a confirmation screen CHS for a user (for example, an operator) to confirm the result of character recognition processing by the character recognition device 10 .
  • a confirmation screen CHS for a user (for example, an operator) to confirm the result of character recognition processing by the character recognition device 10 .
  • An example of the confirmation screen CHS will be described later in FIG. Also, the configuration of the terminal device 20 will be described later with reference to FIGS. 6 and 7.
  • FIG. 2 is an explanatory diagram for explaining an example of the input image IIMG.
  • the input image IIMG to be subjected to character recognition processing is the image of the application form, but the input image IIMG is not limited to the image of the application form.
  • the input image IIMG may be an image such as a prescription or a form.
  • the input image IIMG is, for example, an image of an application form provided with a plurality of entry fields EC corresponding to a plurality of items.
  • the plurality of items to be entered in the application form are the application number, name (kana), name, zip code, address, E-mail, place of work, telephone number of work place and remarks.
  • the input image IIMG is converted into input image information, which is a digital signal, by optical means such as a camera and an image scanner. Then, the character recognition device 10 uses input image information indicating the input image IIMG to recognize characters included in the input image IIMG.
  • a character image portion (for example, each of a plurality of entry fields EC) to be subjected to character recognition processing by the character recognition device 10 in the input image IIMG may be set manually by the user, or may be set manually by the character recognition device 10. may be set automatically by
  • the character recognition apparatus 10 uses, as reference image information, image information of an application form in which no handwritten characters or the like are entered in the entry fields EC (blank application form), and the range to be subjected to character recognition processing is defined as the reference image. It may be specified in advance on the information and the specified range may be set as the character image portion.
  • the character image portion of the input image IIMG may be set by the user correcting the range automatically set by the character recognition device 10 .
  • the character recognition apparatus 10 determines the degree of matching with the application form of the input image information based on predetermined items and ruled line information from the form dictionary data stored in the storage unit. A form (in this embodiment, an application form) with a high value is acquired. Then, the character recognition apparatus 10 recognizes a range of XY coordinates of the input image information defined by the same XY coordinates as those of the preset character image portion in the obtained form as a character image portion.
  • the plurality of portions corresponding to the plurality of entry fields EC in the input image IIMG are the plurality of character image portions to be subjected to the character recognition processing by the character recognition device 10 .
  • the character image portion of the input image IIMG that is to be subjected to character recognition processing by the character recognition device 10 is also referred to as a character image CI.
  • each of the plurality of portions corresponding to the plurality of entry fields EC of the input image IIMG is the character image CI.
  • the portion surrounded by the dashed line in FIG. 2 indicates the character image CI corresponding to the remarks entry field EC.
  • the input image IIMG and the character image CI are examples of the "image to be read”. In the following, unless otherwise specified, it is assumed that the character image CI corresponds to the "image to be read”.
  • FIG. 3 is an explanatory diagram for explaining an example of an outline of a confirmation screen CHS for confirming the result of character recognition processing.
  • FIG. 3 shows an example of a confirmation screen CHS for confirming a plurality of characters CR read from the character images CI corresponding to the remarks entry column EC among the plurality of character images CI included in the input image IIMG.
  • the plurality of characters CR is an example of "a plurality of characters read from the reading target image”.
  • the result of the character recognition process is also referred to as the recognition result.
  • the confirmation screen CHS is displayed on the display unit 310 of the display device 30, for example.
  • the confirmation screen CHS displays a character string of “remarks” indicating an item to be confirmed, a character image area IW, an edit area EDW, an end button BT, and the like.
  • the end button BT is, for example, a GUI (Graphical User Interface) image for ending the display of the confirmation screen CHS.
  • a character image CI is displayed in the character image area IW.
  • part of the character image CI (the character string "Your mobile phone number is shown below.” shown in FIG. 2) is not displayed in the character image area IW. Therefore, a horizontal scroll bar HS for moving the character image CI in the horizontal direction (horizontal direction in the figure) in the character image area IW and a vertical scroll bar HS for moving the character image CI in the vertical direction (vertical direction in the figure) in the character image area IW.
  • a scroll bar VSi is displayed on the confirmation screen CHS. Note that the character recognition device 10 or the terminal device 20 may display the character image CI in a reduced size so that the entire character image CI fits within the character image area IW.
  • the character image CI is divided into, for example, a plurality of character parts (parts surrounded by dotted lines in the character image area IW shown in FIG. 3).
  • each of the plurality of character parts is a part of the character image CI that is separated as one character by character recognition processing.
  • FIG. 3 illustrates a case where each of a plurality of characters included in the character image CI is correctly delimited as one character by character recognition processing.
  • the character portions are indicated by dotted lines in the character image region IW for the sake of easy understanding, but the dotted lines indicating the character portions may or may not be displayed in the character image region IW. It doesn't have to be.
  • the character image area IW may not be displayed on the confirmation screen CHS.
  • a plurality of characters CR read from the character image CI are displayed in the editing area EDW.
  • some of the plurality of characters CR (the character string "Your mobile phone number is shown below.” shown in FIG. 2) are not displayed in the editing area EDW. Therefore, a vertical scroll bar VSe for moving a plurality of characters CR in the vertical direction (vertical direction in the drawing) in the editing area EDW is displayed on the confirmation screen CHS.
  • a cursor CS indicating a character input position is displayed in the editing area EDW. The display position of the cursor CS in the editing area EDW is moved by user operation, for example. Note that the character recognition device 10 or the terminal device 20 may reduce and display the characters CR so that all of the characters CR read from the character image CI are included in the editing area EDW.
  • the character CR surrounded by the dashed line is a character CR whose accuracy of the result (recognition result) of the character recognition processing by the character recognition device 10 is higher than a predetermined first accuracy.
  • the dashed line indicating the range of characters CR whose accuracy of the recognition result is higher than the first accuracy may or may not be displayed in the editing area EDW.
  • the recognition result accuracy indicates the certainty of the recognition result.
  • a character CR with a high recognition result accuracy has a higher probability of being correctly recognized than a character CR with a low recognition result accuracy.
  • the first degree of accuracy may be determined by, for example, the administrator of the character recognition device 10 and the user of the terminal device 20 based on trial results of character recognition processing.
  • the first degree of accuracy may be automatically set by the character recognition device 10 based on the past record of character recognition processing.
  • the fact that the accuracy of the recognition result is higher than the first accuracy is an example of the "condition regarding the accuracy of the recognition result".
  • the terminal device 20 identifies, among a plurality of characters CR, a character CR whose accuracy of the recognition result is higher than the first accuracy as a protected character that satisfies the condition regarding the accuracy of the recognition result. Restrict operations such as modification, change and deletion by users.
  • the recognition result accuracy is higher than the first accuracy. It is not limited to being higher than accuracy.
  • Another example of the condition regarding the accuracy of the recognition result will be described in the first modified example and the like, which will be described later.
  • FIG. 3 in a character string (“090-0ab7-1171”) of a plurality of characters included in the character image CI, one character “1” and two characters “7”, which are the fourth character counted from the end, are shown. Assume that the accuracy of recognition results for a total of three characters including a character is less than or equal to the first accuracy.
  • the character recognition device 10 erroneously recognizes each of the two characters "7" in the character string of a plurality of characters included in the character image CI as the character CR "1". ing. Therefore, in the example shown in FIG. 3, the character string "090-0ab1-1111" is displayed in the editing area EDW as the plurality of characters CR.
  • the character CR selected by the cursor CS is a protected character whose manipulation by the user is restricted, even if the user erroneously performs a deletion operation for deleting the character CR, it will not be deleted. That is, when the character CR selected by the cursor CS is a protected character, the character CR (protected character) selected by the cursor CS does not reflect the user's operations such as deletion, modification, and change of the character CR. It should be noted that the protected character may be prevented from being selected by the cursor CS.
  • the cursor CS when the user operates the cursor CS to select a protected character, for example, the cursor CS skips the protected character and moves to the next character CR. This makes it easier for the user to recognize that the character CR is a protected character, and can reliably prevent erroneous operations on the protected character.
  • the user may erroneously change a character CR for which the character recognition result is correct.
  • the correction work of correcting the character CR of "1" which is the second character counted from the end, to the character "7" among the plurality of characters CR, the third character counted from the end is corrected.
  • the user erroneously moves the cursor CS to the position of the character CR of "1".
  • the character CR of "1" (the character CR selected by the cursor CS), which is the third character counted from the end among the plurality of characters CR, is It is a protected character. Therefore, even if the user does not notice that the character CR selected by the cursor CS is not the character CR to be corrected, the correction operation of correcting the character CR of "1" to the character of "7" is performed. , the character CR selected by the cursor CS does not reflect the correction operation. Therefore, in the present embodiment, it is possible to prevent the correct character recognition result from being changed to an incorrect character by the user's erroneous operation. As a result, in this embodiment, compared to the first comparison, it is possible to improve the working efficiency of checking and correcting the result of character recognition processing.
  • FIG. 4 is a functional block diagram showing an example of the configuration of the character recognition device 10 shown in FIG.
  • the character recognition device 10 performs communication between a control unit 120 that controls each unit of the character recognition device 10, a storage unit 140 that stores various information such as the control program PG1, and an external device such as the terminal device 20. and a communication unit 160 for
  • the control program PG1 includes, for example, an application program for the character recognition device 10 to perform character recognition processing.
  • the control program PG1 may include an operating system program for the control section 120 to control each section of the character recognition device 10, for example.
  • the control unit 120 has an image information acquisition unit 122 and a character recognition unit 124, for example.
  • the image information acquisition unit 122 acquires, for example, input image information indicating an input image IIMG to be subjected to character recognition processing from the terminal device 20 via the communication unit 160 .
  • the character recognition unit 124 performs character recognition processing using the input image information acquired by the image information acquisition unit 122, thereby recognizing characters included in the input image IIMG indicated by the input image information. For example, the character recognition unit 124 recognizes characters included in a predetermined character image CI in the input image IIMG. Thereby, a plurality of characters CR are read from each of the plurality of character images CI. That is, the character CR read from the character image CI is a character recognized by the character recognition process as a character included in the character image CI. In addition, the character recognition unit 124 calculates the accuracy (that is, the accuracy of the recognition result) indicating the likelihood of the plurality of characters CR read from each of the plurality of character images CI.
  • the character recognition unit 124 transmits recognition information about the results of character recognition processing for each of the plurality of character images CI and character image information indicating each of the plurality of character images CI to the terminal device 20 via the communication unit 160.
  • the recognition information includes character information indicating a plurality of characters CR read from each of the plurality of character images CI, and accuracy information indicating the accuracy of the recognition result for each of the plurality of characters CR.
  • the character image information may also include, for example, character portion information indicating a character portion separated as one character by character recognition processing in the character image CI.
  • the character portion information may indicate the range of the character portion in the character image CI using coordinates with a predetermined position in the character image CI as the origin.
  • the character recognition unit 124 may recognize characters included in the character image CI using a learning model that has learned the relationship between an image including characters and characters included in the image.
  • a learning model is, for example, a multilayer neural network. That is, the character recognition unit 124 may use this learning model to perform character recognition processing by AI (Artificial Intelligence)-OCR.
  • AI Artificial Intelligence
  • FIG. 5 is a diagram showing an example of the hardware configuration of the character recognition device 10 shown in FIG.
  • the character recognition device 10 has a processor 12 that controls each part of the character recognition device 10, a memory 14 that stores various information, and a communication device 16.
  • the memory 14 is, for example, a volatile memory such as a RAM (Random Access Memory) that functions as a work area for the processor 12, and a non-volatile memory such as an EEPROM (Electrically Erasable Programmable Read-Only Memory) that stores various information such as the control program PG1. It functions as a storage unit 140, including one or both of a physical memory.
  • the memory 14 may be detachable from the character recognition device 10 .
  • the memory 14 may be a storage medium such as a memory card that is detachable from the character recognition device 10 .
  • the memory 14 may be, for example, a storage device (for example, an online storage) communicably connected to the character recognition device 10 via a network NW or the like.
  • the processor 12 includes, for example, one or more CPUs (Central Processing Units).
  • the processor 12 functions as the control unit 120 by, for example, executing the control program PG1 stored in the memory 14 and operating according to the control program PG1.
  • the processor 12 that operates according to an application program (a program related to character recognition) included in the control program PG1 functions as a control section 120 including an image information acquisition section 122 and a character recognition section .
  • the control program PG1 may be transmitted from another device via the network NW.
  • the processor 12 when the processor 12 includes a plurality of CPUs, some or all of the functions of the control unit 120 are performed by the plurality of CPUs operating in cooperation according to a program such as the control program PG1. may be implemented.
  • the processor 12 includes a GPU (Graphics Processing Unit), a DSP (Digital Signal Processor), or an FPGA (Field It may be configured to include hardware such as Programmable Gate Array).
  • part or all of the control unit 120 implemented by the processor 12 may be implemented by hardware such as a DSP.
  • the communication device 16 is hardware for communicating with an external device existing outside the character recognition device 10 via one or both of a wired network and a wireless network, and functions as a communication unit 160 .
  • the configuration of the character recognition device 10 is not limited to the examples shown in FIGS.
  • the character recognition device 10 includes an operation device (an operation device similar to the operation device 28 of the terminal device 20 shown in FIG. 7 described later) that functions as an operation unit for receiving operations by an administrator or the like of the character recognition device 10. may have.
  • FIG. 6 the configuration of the terminal device 20 will be described with reference to FIGS. 6 and 7.
  • FIG. 6 the configuration of the terminal device 20 will be described with reference to FIGS. 6 and 7.
  • FIG. 6 is a functional block diagram showing an example of the configuration of the terminal device 20 shown in FIG.
  • the terminal device 20 includes a control section 220 that controls each section of the terminal device 20, a storage section 240 that stores various information, and a communication section 260 that performs communication with an external device such as the character recognition device 10. , and an operation unit 280 for receiving an operation by the user of the terminal device 20 .
  • the storage unit 240 stores, for example, the control program PG2 and the edit table TBL.
  • the control program PG2 includes, for example, an application program for the terminal device 20 to execute correction support processing for supporting correction of the result of character recognition processing.
  • the control program PG2 may include an operating system program for the control unit 120 to control each unit of the terminal device 20, for example.
  • the control program PG2 is an example of a "program”.
  • the editing table TBL stores, for example, recognition information (character information and accuracy information) transmitted from the character recognition device 10, and the like.
  • the edit table TBL will be described later with reference to FIGS. 8 and 9. FIG.
  • the control unit 220 has, for example, an acquisition unit 222, a display control unit 224, and a restriction unit 226.
  • the acquisition unit 222 acquires from the character recognition device 10 via the communication unit 260 recognition information about the result of character recognition processing on the character image CI and character image information indicating the character image CI. That is, the acquisition unit 222 obtains recognition information including character information indicating a plurality of characters CR read from the character image CI by character recognition processing, and accuracy information indicating the accuracy of recognition results for each of the plurality of characters CR. get. Then, the acquisition unit 222 stores the recognition information (character information and accuracy information) acquired from the character recognition device 10 in the edit table TBL.
  • the acquisition unit 222 may acquire input image information indicating the input image IIMG from an optical device such as a camera or an image scanner via the communication unit 260 .
  • the acquisition unit 222 may then transmit input image information indicating the input image IIMG to the character recognition device 10 via the communication unit 260 .
  • the function of acquiring the input image information and the function of transmitting the input image information may be realized by a functional block different from the acquiring section 222 .
  • the display control unit 224 causes the display device 30 to display the confirmation screen CHS based on, for example, the character information and the character image information. That is, the display control unit 224 causes the display device 30 to display a plurality of characters CR read from the character image CI by the character recognition process based on the character information.
  • the restriction unit 226 restricts operations on protected characters among the plurality of characters CR that satisfy the conditions regarding the accuracy of the recognition result, based on the accuracy indicated by the accuracy information stored in the edit table TBL.
  • the accuracy information stored in the edit table TBL is, for example, accuracy information included in the recognition information acquired by the acquiring unit 222 .
  • restricting operations on protected characters may mean, for example, preventing the contents of all or part of a plurality of operations on protected characters from being reflected.
  • restricting operations on protected characters may mean disabling all or part of a plurality of operations on protected characters.
  • a plurality of operations on a protected character include, for example, an operation of deleting the protected character, an operation of rewriting the protected character with another character, and the like. That is, restricting operations on protected characters may mean, for example, prohibiting modification of protected characters.
  • restricting operations on protected characters may mean, for example, prohibiting modification of protected characters until a user performs a predetermined operation (for example, an operation for canceling protection).
  • corrections to protected characters include, for example, deleting the protected characters and rewriting the protected characters with other characters.
  • the recognition result accuracy is higher than the first accuracy as the condition regarding the accuracy of the recognition result.
  • a character CR whose accuracy of the recognition result is higher than the first accuracy is specified as a protected character. That is, in the present embodiment, the restriction unit 226 restricts the operation by the user to characters CR (protected characters) whose accuracy of the recognition result is higher than the first accuracy among the plurality of characters CR.
  • FIG. 7 is a diagram showing an example of the hardware configuration of the terminal device 20 shown in FIG.
  • the terminal device 20 has a processor 22 that controls each part of the terminal device 20, a memory 24 that stores various information, a communication device 26, and an operation device 28.
  • the memory 24 includes, for example, one or both of a volatile memory such as a RAM that functions as a work area for the processor 22 and a nonvolatile memory such as an EEPROM that stores various information such as the control program PG2. function as Note that the memory 24 may be detachable from the terminal device 20 in the same manner as the memory 14 of the character recognition device 10 described with reference to FIG. It may be a stored storage device (eg, online storage).
  • a volatile memory such as a RAM that functions as a work area for the processor 22
  • a nonvolatile memory such as an EEPROM that stores various information such as the control program PG2.
  • the memory 24 may be detachable from the terminal device 20 in the same manner as the memory 14 of the character recognition device 10 described with reference to FIG. It may be a stored storage device (eg, online storage).
  • the processor 22 is configured similarly to the processor 12 of the character recognition device 10 described in FIG.
  • processor 22 includes, for example, one or more CPUs.
  • the processor 22 functions as the control unit 220 by executing the control program PG2 stored in the memory 24 and operating according to the control program PG2.
  • the processor 22 that operates according to an application program (a program related to correction support for the result of character recognition processing) included in the control program PG2 functions as a control unit 220 that includes an acquisition unit 222, a display control unit 224, and a restriction unit 226.
  • the control program PG2 may be transmitted from another device via the network NW.
  • the processor 22 when the processor 22 includes a plurality of CPUs, some or all of the functions of the control unit 220 are performed by the plurality of CPUs operating in cooperation according to a program such as the control program PG2. may be implemented.
  • the processor 22 includes hardware such as a GPU, DSP, or FPGA in addition to one or more CPUs, or in place of part or all of one or more CPUs. There may be.
  • part or all of the control unit 220 implemented by the processor 22 may be implemented by hardware such as a DSP.
  • the communication device 26 is hardware for communicating with an external device existing outside the terminal device 20 via one or both of a wired network and a wireless network, and functions as a communication unit 260 .
  • the operation device 28 is hardware for receiving operations by the user of the terminal device 20 and functions as an operation unit 280 .
  • the operation device 28 may consist of one or a plurality of devices including some or all of operation buttons, a touch panel, a keyboard, a mouse, and the like.
  • the configuration of the terminal device 20 is not limited to the examples shown in FIGS.
  • the terminal device 20 may have the display device 30 shown in FIG.
  • the terminal device 20 has a display unit 310 capable of displaying various images such as the confirmation screen CHS.
  • the terminal device 20 may have an optical device such as a camera and an image scanner for converting the input image IIMG into input image information, which is a digital signal.
  • FIG. 8 is an explanatory diagram showing an example of the edit table TBL shown in FIG.
  • the edit table TBL stores, for example, recognition information (character information and accuracy information) transmitted from the character recognition device 10, and the like.
  • the edit table TBL stores recognition information and the like regarding the result of character recognition processing for the character image CI corresponding to the remark entry column EC shown in FIG.
  • the editing table TBL includes, for example, text information including recognition information about the result of character recognition processing on the character image CI, and image information for specifying the character image information indicating the character image CI (for example, the file name of the character image information is information) and stored.
  • the text information includes, for example, information on characters associated with each of the plurality of characters CR, information on accuracy, and information on protection.
  • the number indicated by "No.” in the edit table TBL corresponds to the line number in the character string of a plurality of characters CR.
  • the number indicated by the "character position" in the edit table TBL corresponds to the column number in the character string of a plurality of characters CR. Note that the shaded portion in FIG. 8 indicates that there is no corresponding character in the character string of a plurality of characters CR.
  • the information about the character is character information indicating the one character CR
  • the information about the accuracy is the accuracy indicating the accuracy of the recognition result of the one character CR.
  • Information regarding protection of one character CR among the plurality of characters CR is information indicating whether the one character CR is a protected character, and is set by the restriction unit 226 .
  • the code T indicates that the character CR is a protected character
  • the code F indicates that the character CR is not a protected character.
  • the restricting unit 226 sets, among the plurality of characters CR, the characters CR whose recognition result accuracy is higher than 90 as protected characters. Specifically, the restricting unit 226 replaces the information on the protection of the character CR with recognition result accuracy higher than 90 among the plurality of characters CR with information indicating that the character is a protected character (symbol T in FIG. 8). set to In other words, among the plurality of characters CR, the characters CR whose recognition accuracy is 90 or less are not set as protected characters. In the example shown in FIG. 8, the character CR in the second row, eighth column, the second row, tenth column, and the second row, twelfth column of the character string composed of a plurality of characters CR are , is not a protected character.
  • the information about characters may reflect corrections made by the user. For example, each of the character CR in the 8th column of the 2nd row and the character CR in the 12th column of the 2nd row of the character string composed of a plurality of characters CR is correctly the character "7", but the character recognition It is not correctly recognized in the processing and is recognized as the character CR of "1". Therefore, on the confirmation screen CHS, the user confirms that each of the characters CR in the second row, eighth column and the second row, 12th column of the character string composed of a plurality of characters CR is a correct character. Correct to "7".
  • the character information for each of the character CR in the second row, eighth column, and the second row, twelfth column of the character string composed of a plurality of characters CR is "7 ” may be updated to character information indicating characters.
  • the edit table TBL stores character information indicating characters corrected by the user (for example, information about edited characters shown in FIG. 9 to be described later) in an area separate from the area where information about characters is stored. good too.
  • characters modified by the user may also be referred to as characters CR.
  • the restriction unit 226 may set the corrected character CR as a protected character.
  • FIG. 9 is an explanatory diagram showing another example of the edit table TBL shown in FIG.
  • the editing table TBL shown in FIG. 9 stores information about recognition results other than the first candidate by the character recognition process, and stores characters corrected by the user separately from the recognition results by the character recognition process. is the same as the edit table TBL shown in FIG.
  • the character recognition process identifies a plurality of candidate characters as candidates for characters included in the character image CI
  • the character with the highest probability among the plurality of candidate characters is the first candidate character.
  • the recognition results for each character in the 8th column of the 2nd row, the 10th column of the 2nd row, and the 12th column of the 2nd row of the character string by a plurality of characters CR are Includes second candidate characters that are characters other than the first candidate.
  • the second candidate character may be used for predictive conversion or the like when the user corrects the character CR.
  • the information about the edit character is, for example, character information indicating the character CR displayed in the edit area EDW of the confirmation screen CHS. If the character CR is not modified by the user, the information about the character and the information about the edited character are the same character information. Further, for example, among the information on edited characters, the information corresponding to the character CR corrected by the user is character information reflecting the correction by the user. For example, in the editing table TBL shown in FIG. 9, information about edited characters for each of the character CR in the second row, eighth column, and the second row, 12th column of the character string composed of a plurality of characters CR is updated to character information indicating the character "7".
  • the configuration of the edit table TBL is not limited to the examples shown in FIGS. 8 and 9.
  • information on protection may be omitted from the edit table TBL.
  • the restriction unit 226 can recognize whether or not one character CR is a protected character by referring to the accuracy of the recognition result of one character CR among the plurality of characters CR.
  • the edit table TBL may store a plurality of characters CR and the accuracy of the recognition results of the plurality of characters CR in association with each other.
  • FIG. 10 is an explanatory diagram for explaining the outline of the operation of the terminal device 20 shown in FIG.
  • FIG. 3 described above illustrates a case where a part of the character image CI and a part of the plurality of characters CR are not displayed on the confirmation screen CHS, but FIG. A case where all are displayed on the confirmation screen CHS is illustrated.
  • the entire character image CI is displayed in the character image area IW, and all of the plurality of characters CR are displayed in the edit area EDW.
  • FIG. 10 illustrates a case where two characters CH1 and CH2 are erroneously recognized as one character CH3 when the characters CH1 and CH2 are arranged next to each other.
  • FIG. 10 exemplifies a case where each character is Japanese. Specifically, FIG. 10 illustrates a case where the character CH1 is the hiragana character "shi”, the character CH2 is the hiragana character "ma”, and the character CH3 is the hiragana character "ho".
  • the character recognition device 10 recognizes two characters "shi” and "ma” among a plurality of characters included in the character image CI as one character "ho".
  • the number of characters (the number of columns) in the first row is 16 characters
  • the information about the character CR in the 14th column of the first row is is character information indicating the character CR of "ho".
  • the information about the character CR in the 15th column of the 1st line is the character information indicating the character CR of "su"
  • the character information of the character CR in the 16th column of the 1st line is is character information indicating the character CR of ".”
  • characters CR surrounded by broken lines are characters CR for which the accuracy of the result (recognition result) of the character recognition processing by the character recognition device 10 is higher than the first accuracy. Therefore, in the editing area EDW shown in FIG. 10, the user's operation is restricted to the characters CR surrounded by the dashed lines.
  • the character CR of "ho" selected by the cursor CS is not a protected character whose operation by the user is restricted. is corrected to For example, the user performs an operation to correct the character "ho" selected by the cursor CS to the character CR of "shi" and "ma". As a result, the first line of the character string composed of a plurality of characters CR is corrected to a correct character string ("Your mobile phone number is shown below.”).
  • the edit table TBL shown in FIGS. It becomes the text information of the eyes.
  • the character information about the eye character CR is updated to the character information indicating the character CR of "ma”.
  • the information about the edited character in the 14th column of the 1st line is updated to the character information indicating the character CR of "shi”, and the edited character information in the 15th column of the 1st line is updated.
  • the character information is updated to character information indicating the character CR of "ma”. That is, the edit table TBL is updated so that the number indicated by the "character position" corresponds to the column number of the corrected character string.
  • the first line of the character string of a plurality of characters CR displayed in the editing area EDW is a correct character string.
  • the second line of the character string composed of a plurality of characters CR as described with reference to FIG. 3, the erroneously recognized characters CR are not protected characters whose modification by the user is restricted. is corrected to Then, for example, when the user has finished correcting the plurality of characters CR, the user selects (for example, presses) the end button BT to end the processing related to confirmation and correction of the plurality of characters CR.
  • a character CR that has been corrected to a correct character in the process of confirming and correcting a plurality of characters CR may be newly set as a protected character whose correction is restricted.
  • the terminal device 20 when the character recognition device 10 recognizes one character among a plurality of characters included in the character image CI as a plurality of characters (for example, one character of "Ki" is 10), the terminal device 20 operates similarly to the operation shown in FIG. In this case also, the edit table TBL shown in FIGS. 8 and 9 is updated so that the number indicated by the "character position" corresponds to the column number of the corrected character string.
  • the text information about the deleted character CR among the plurality of characters CR may be deleted from the editing table TBL, and the text information about the deleted character CR may be the column number of the corrected character string. may be stored in an area different from the area corresponding to . Also, FIG.
  • each character is Japanese, but the present invention is not limited to the case where each character is Japanese.
  • the letters CH1, CH2 and CH3 may be Roman characters.
  • the letter CH1 may be the Roman letter "I”
  • the letter CH2 may be the Roman letter "C”
  • the letter CH3 may be the Roman letter "K”.
  • one character among a plurality of characters included in the character image CI is erroneously recognized as a plurality of characters, as an example of Roman characters
  • one character of "K" is "I" and "C”. is recognized as two characters.
  • FIG. 11 is a sequence chart showing an example of the operation of the character recognition system 1 shown in FIG.
  • the processing of steps S10 and S12 and the processing of steps S100 to S720 are executed by the terminal device 20 . Further, the processing from step S20 to step S24 is executed by the character recognition device 10.
  • FIG. Detailed descriptions of the processes similar to those described with reference to FIGS. 1 to 10 are omitted.
  • the operation of the character recognition system 1 will be explained by taking as an example the case where there is one character image CI which is a predetermined character image portion in the input image IIMG. .
  • step S10 the terminal device 20 acquires input image information indicating the input image IIMG from an optical device such as a camera and an image scanner.
  • step S12 the terminal device 20 transmits the input image information acquired in step S10 to the character recognition device 10 via the network NW. Then, the terminal device 20 waits for the processing after step S100 until the result of the character recognition processing for the input image IIMG is transmitted from the character recognition device 10 . Therefore, before explaining the processing of step S100, the processing of step S20 and the like executed by the character recognition device 10 will be explained.
  • step S20 the character recognition device 10 acquires the input image information transmitted from the terminal device 20 in step S12. Then, in step S22, the character recognition device 10 executes character recognition processing using the input image information acquired in step S10. Thereby, for example, the character recognition unit 124 recognizes a plurality of characters included in the character image CI, which is a predetermined character image portion of the input image IIMG indicated by the input image information.
  • step S24 the character recognition device 10 transmits recognition information about the result of character recognition processing on the character image CI and character image information indicating the character image CI to the terminal device 20 via the network NW. . With this, the character recognition processing by the character recognition device 10 ends. Also, since the result of the character recognition processing for the input image IIMG has been transmitted from the character recognition device 10, the terminal device 20 executes the processing of step S100.
  • step S100 the terminal device 20 acquires the recognition information and character image information transmitted from the character recognition device 10 in step S24.
  • step S200 the terminal device 20 sets protected characters based on the accuracy information included in the recognition information acquired in step S100. For example, the terminal device 20 sets, as a protected character, a character CR whose accuracy indicated by the accuracy information is higher than the first accuracy among the plurality of characters CR indicated by the character information included in the recognition information.
  • step S300 the terminal device 20 causes the display device 30 to display the confirmation screen CHS based on the recognition information and character image information acquired in step S100.
  • the terminal device 20 (more specifically, the display control unit 224) displays the character image CI and a plurality of characters CR read from the character image CI on the display device 30 based on the character information and the character image information. to display.
  • step S400 the terminal device 20 determines whether or not a user operation has been performed. If the determination result in step S400 is negative, the terminal device 20 returns the process to step S400. On the other hand, if the determination result in step S400 is affirmative, the terminal device 20 advances the process to step S500.
  • step S500 the terminal device 20 determines whether or not the user's operation is an end operation.
  • An end operation is, for example, a user operation of selecting the end button BT. If the result of determination in step S500 is affirmative, the terminal device 20 terminates the display of the confirmation screen CHS, and terminates the processing regarding confirmation and correction of the result of the character recognition processing. On the other hand, if the determination result in step S500 is negative, the terminal device 20 advances the process to step S600.
  • step S600 the terminal device 20 determines whether or not the user operation is a protected character correction operation.
  • a protected character correction operation is, for example, an operation for correcting a protected character among a plurality of characters CR. If the determination result in step S600 is negative, the terminal device 20 executes a process corresponding to the user's operation in step S700, and returns the process to step S400. On the other hand, if the determination result in step S600 is affirmative, the terminal device 20 advances the process to step S720.
  • step S720 the terminal device 20 notifies that correction is not possible.
  • the terminal device 20 causes the display device 30 to display information indicating that the protected characters are corrected.
  • the terminal device 20 returns the process to step S400.
  • step S300 may be performed prior to the process of step S200, or may be performed in parallel with the process of step S200.
  • the process of step S720 may be omitted.
  • a series of processes from step S200 to step S720 are executed for each of the plurality of character images CI.
  • the terminal device 20 has the acquisition unit 222, the display control unit 224, and the restriction unit 226.
  • the acquisition unit 222 obtains character information indicating a plurality of characters CR read from the character image CI by character recognition processing for recognizing characters included in the image, and accuracy information indicating the accuracy of recognition results for each of the plurality of characters CR.
  • Acquire recognition information including
  • the display control unit 224 causes the display device 30 to display a plurality of characters CR indicated by the character information. Based on the accuracy indicated by the accuracy information, the restricting unit 226 restricts operations on protected characters among the plurality of characters CR that satisfy the conditions regarding the accuracy of the recognition result.
  • the user's operation is restricted to the protected characters among the plurality of characters CR that satisfy the conditions regarding the accuracy of the recognition result.
  • the restricting unit 226 specifies, as a protected character, a character CR whose accuracy indicated by the accuracy information is higher than the first accuracy among the plurality of characters CR. That is, in the present embodiment, the user's operation is restricted to a character CR whose accuracy of recognition result is higher than the first accuracy (character CR which is highly likely to be correctly recognized) among a plurality of characters CR. As a result, in the present embodiment, it is possible to suppress the occurrence of an operational error in which the user erroneously changes a character CR whose recognition result accuracy is higher than the first accuracy among the plurality of characters CR.
  • FIG. 12 is an explanatory diagram for explaining the outline of the operation of the terminal device 20 according to the first modified example. Note that FIG. 12 exemplifies a case where the entire character image CI is displayed in the character image area IW and all of the plurality of characters CR are displayed in the editing area EDW, in order to make the explanation easier to understand.
  • the character image CI is divided into multiple areas AR (ARx and ARy).
  • ARx and ARy the area AR in the character image area IW is indicated by a one-dot chain line in order to facilitate understanding of the explanation, but the one-dot chain line indicating the area AR may be displayed in the character image area IW, It does not have to be displayed.
  • the plurality of characters CR are characters CR read from one of the plurality of areas AR (ARx and ARy), and the plurality of groups G (Gx and Gy) corresponding to the plurality of areas AR (ARx and ARy). belong to any of For example, among a plurality of character CRs, each character CR in the character string "Your mobile phone number is shown below.” belongs to Further, for example, among the plurality of characters CR, the character string "090-0ab1-1111" is the character CR read from the area ARy and belongs to the group Gy corresponding to the area ARy.
  • a group Gx corresponds to the first line of the plurality of characters CR
  • a group Gy corresponds to the second line of the plurality of characters CR.
  • the characters CR surrounded by dotted lines and the characters CR shaded have the accuracy of the result (recognition result) of the character recognition processing by the character recognition device 10 higher than the first accuracy.
  • High letter CR Furthermore, among the characters CR whose accuracy of the recognition result is higher than the first accuracy, the shaded characters CR are protected characters whose modification is restricted.
  • the confirmation screen CHS shown in FIG. 12 the protected characters among the plurality of characters CR are displayed in a manner that can be distinguished from the characters other than the protected characters (hatched in FIG. 12).
  • the display control unit 224 may cause the display device 30 to display the protected characters among the plurality of characters CR in a manner that can be distinguished from the characters CR other than the protected characters. In this case, the user can easily visually recognize the character CR whose modification is restricted.
  • the group Gx among the plurality of groups Gx and Gy is the group G that includes only the characters CR whose recognition result accuracy is higher than the first accuracy.
  • Group Gy among the plurality of groups Gx and Gy is a group G including characters CR whose recognition result accuracy is higher than the first accuracy and characters CR whose recognition result accuracy is equal to or lower than the first accuracy.
  • the group Gy is an example of the "first group”
  • the group Gx is an example of the "second group”.
  • the group Gy characters CR whose accuracy of the recognition result is higher than the first accuracy and characters CR whose accuracy is lower than the first accuracy are mixed, so only characters CR whose accuracy of the recognition result is higher than the first accuracy is more likely to be selected by the user in the correction work than the group Gx containing . Therefore, among all the characters CR belonging to the group Gy, the user's operation is restricted for the characters CR whose recognition result accuracy is higher than the first accuracy. It should be noted that it belongs to a group Gy in which characters CR whose recognition result accuracy is higher than the first accuracy and characters CR whose accuracy is lower than the first accuracy are mixed, and that the recognition result accuracy is higher than the first accuracy. , is another example of the "recognition result accuracy condition".
  • the limiting unit 226 selects a group Gy that includes characters CR whose recognition result accuracy is higher than the first accuracy and characters CR whose recognition result accuracy is equal to or lower than the first accuracy. Identify. Then, the restricting unit 226 specifies, as a protected character, a character CR whose recognition result accuracy is higher than the first accuracy among all the characters CR belonging to the group Gy.
  • a protected character a character CR whose recognition result accuracy is higher than the first accuracy among all the characters CR belonging to the group Gy.
  • the group Gx includes only characters CR whose recognition accuracy is higher than the first accuracy, characters CR whose recognition accuracy is higher than the first accuracy and characters CR whose recognition accuracy is lower than the first accuracy are mixed. It is less likely to be selected by the user in the correction work as compared to the group Gy that is in the group Gy. That is, in the correction work for a plurality of characters CR, the possibility that the correction work for the characters CR belonging to the group Gx will be performed is the same as the possibility that the correction work for the characters CR belonging to the group Gy will be performed. low in comparison. Therefore, the characters CR belonging to the group Gx are less likely to be erroneously corrected than the characters CR belonging to the group Gy even if the correction is not restricted. Therefore, in this modified example, modification of all characters CR belonging to group Gx may not be restricted.
  • the operation of the terminal device 20 according to this modification is not limited to the example shown in FIG.
  • the protected characters among the plurality of characters CR may not be displayed in a manner distinguishable from the characters CR other than the protected characters.
  • a character CR whose accuracy of the recognition result is higher than the first accuracy may be displayed in a manner distinguishable from characters CR whose accuracy of the recognition result is equal to or less than the first accuracy. .
  • the user can easily visually recognize the character CR whose accuracy of the recognition result is higher than the first accuracy.
  • the character image CI is divided into a plurality of areas AR, and each of the plurality of characters CR is a character CR read from one of the plurality of areas AR, and corresponds to the plurality of areas AR. belongs to one of a plurality of groups G Further, the restricting unit 226 selects characters CR whose accuracy indicated by the accuracy information acquired by the acquiring unit 222 is higher than the first accuracy and characters whose accuracy indicated by the accuracy information is equal to or less than the first accuracy among the plurality of groups G. Identify the group G (first group) containing the characters CR of .
  • the restricting unit 226 selects, among all characters CR belonging to a group G (first group) including characters CR whose accuracy indicated by the accuracy information is higher than the first accuracy and characters CR whose accuracy is equal to or lower than the first accuracy, A character CR whose accuracy indicated by the accuracy information is higher than the first accuracy is specified as a protected character.
  • the restriction unit 226 identifies, among the plurality of groups G, a group G (second group) that includes only the characters CR whose accuracy indicated by the accuracy information is higher than the first accuracy, and specifies User operations are not restricted for all characters belonging to group G.
  • a group G that includes only characters CR with a probability higher than the first probability is expected to have a very low possibility of being operated by the user, and there is little need to make the entire group G protected characters.
  • a group G that includes only characters CR with a probability higher than the first probability is not set as a protected character, thereby suppressing an unnecessary increase in the number of protected characters whose operations are restricted by the user. Therefore, it is possible to prevent the process of setting protected characters from becoming complicated.
  • the display control unit 224 causes the display device 30 to display the protected characters among the plurality of characters CR in a manner that can be distinguished from the characters CR other than the protected characters.
  • the user can easily visually recognize the character CR whose modification is restricted.
  • FIG. 13 is an explanatory diagram for explaining an overview of the operation of the terminal device 20 according to the second modified example. 13 have the same meanings as the one-dot chain lines, dotted lines and hatching in FIG. For example, in FIG. 13, characters CR shaded among a plurality of characters CR are protected characters.
  • group Gy is a group G including characters CR whose accuracy of recognition result is equal to or lower than the first accuracy.
  • a group G (for example, group Gy) including characters CR whose accuracy of recognition results is equal to or lower than the first accuracy is an example of the “first group”.
  • correction of the characters CR is restricted for each group G in a plurality of groups G corresponding to a plurality of areas AR.
  • the restriction unit 226 selects a group G (first group) including characters CR whose accuracy indicated by the accuracy information acquired by the acquisition unit 222 is equal to or lower than the first accuracy among the plurality of groups G. Identifies and does not limit operations on all characters belonging to the identified group G.
  • the restriction unit 226 identifies a group G (second group) that includes only characters CR whose accuracy indicated by the accuracy information is higher than the first accuracy among the plurality of groups G, and specifies all characters belonging to the identified group G character CR as a protected character.
  • this modified example it is possible to suppress a decrease in work efficiency when correcting a character string belonging to a group Gy (first group) including characters CR whose recognition result accuracy is equal to or lower than the first accuracy. can.
  • this modification there is no work mistake in which the user erroneously changes the character CR (protected character) belonging to the group Gx (second group) that includes only the character CR whose accuracy of the recognition result is higher than the first accuracy. The occurrence can be suppressed. That is, in this modification, in the correction work for correcting a character string including the character CR that has been erroneously recognized by the character recognition process, the reduction in work efficiency is suppressed, and the occurrence of correction work mistakes is suppressed. can do.
  • FIG. 14 is a diagram showing an example of a confirmation screen CHS according to the third modified example. 14 have the same meanings as the one-dot chain lines, dotted lines and hatching in FIG.
  • the confirmation screen CHS displays, for example, a plurality of character image areas IW corresponding to a plurality of character images CI included in the input image IIMG and one editing area EDW.
  • the entire corresponding character image CI out of the plurality of character images CI is displayed.
  • an image including a plurality of character images CI is another example of a "reading target image”.
  • the input image IIMG is divided into a plurality of character images CI as a plurality of areas AR (ARa, ARb, ARc, etc.) corresponding to a plurality of items of the application form. Therefore, each of the plurality of character images CI is an example of "area”.
  • each of the plurality of characters CR read from the input image IIMG is the character CR read from one of the plurality of character images CI, and the plurality of characters CR corresponding to the plurality of character images CI (the plurality of areas AR).
  • each code of a plurality of groups G is attached with the same lower-case alphabet as the lower-case alphabet attached to the end of the code of the corresponding area AR.
  • a plurality of characters CR belonging to group Ga are characters CR read from area ARa (character image CI corresponding to the application number) in input image IIMG.
  • a plurality of characters CR read from each of the plurality of character images CI are displayed in the editing area EDW.
  • a plurality of characters CR are displayed in accordance with the display positions of the corresponding character images CI on the confirmation screen CHS.
  • a plurality of character images CI are displayed in the order of application number, name (kana), name, zip code, address, E-mail, place of work, telephone number of work place and remarks. Therefore, in the editing area EDW, a plurality of characters CR are displayed in the order of application number, name (kana), name, zip code, address, E-mail, place of work, telephone number of work place and remarks.
  • all the characters CR (“180-3588”) read from the character image CI displayed at the top of the confirmation screen CHS (character image CI corresponding to the application number) are It is displayed on the first line in the EDW.
  • the restrictions on the user's operation on the character CR are not limited to the above example.
  • a user's operation may be restricted for characters CR whose recognition result accuracy is higher than the first accuracy.
  • the user's operation may be restricted, or the user's operation may not be restricted.
  • the character image CI may be divided into a plurality of areas AR.
  • FIG. 14 illustrates the case where each of the plurality of character images CI included in the input image IIMG is displayed in the corresponding character image region IW of the plurality of character image regions IW. It is not limited to such a mode. For example, all of the multiple character images CI included in the input image IIMG may be displayed in one character image area IW.
  • FIG. 15 is a diagram showing an example of a confirmation screen CHS according to the fourth modification. 15 have the same meanings as the one-dot chain lines, dotted lines and hatching in FIG.
  • the confirmation screen CHS includes, for example, a plurality of character image areas IW corresponding to a plurality of character images CI included in the input image IIMG, and a plurality of editing areas corresponding to the plurality of character image areas IW. EDW is displayed.
  • the confirmation screen CHS shown in FIG. 15 is the same as the confirmation screen CHS shown in FIG. 14 except that a plurality of edit areas EDW are displayed.
  • each of the plurality of editing areas EDW a plurality of characters CR read from the character image CI displayed in the corresponding character image area IW out of the plurality of character image areas IW are displayed.
  • the editing area EDW and the character image area IW corresponding to each other are arranged adjacent to each other on the confirmation screen CHS.
  • the user can easily compare a plurality of characters CR and a plurality of character portions for each item.
  • the plurality of items are, for example, the application number, name (kana), name, zip code, address, E-mail, work place, work phone number, remarks, etc., as explained in FIG.
  • the plurality of characters CR may be divided into a plurality of groups G, each of which is a character string or sentence unit that is a unit of meaning of words.
  • a plurality of characters CR may be divided into a plurality of groups G based on at least one of words, phrases and sentences by character recognition processing.
  • the restricting unit 226 analyzes a character string of a plurality of characters CR, and divides the plurality of characters CR into units of character strings or sentences based on the analysis results, thereby dividing the plurality of characters CR. It may be divided into a plurality of groups G. That is, the restriction unit 226 may divide the plurality of characters CR into a plurality of groups G based on at least one of words, clauses and sentences.
  • the restriction unit 226 may change the degree of restriction on operations on protected characters according to the accuracy of recognition results.
  • FIG. 16 is a flow chart showing an example of the operation of the terminal device 20 according to the fifth modified example. Note that FIG. 16 shows the operation of the terminal device 20 after the result of character recognition processing on the input image IIMG is transmitted from the character recognition device 10 . The operation of the terminal device 20 and the operation of the character recognition device 10 until the result of character recognition processing on the input image IIMG is transmitted from the character recognition device 10 are the operations shown in FIG. S22 and S24). Detailed descriptions of the processes similar to those described with reference to FIGS. 1 to 15 are omitted.
  • step S100 to step S700 is the same as the series of processes from step S100 to step S700 shown in FIG. However, in the operation shown in FIG. 16, if the determination result in step S600 is affirmative, the terminal device 20 advances the process to step S710.
  • step S710 the terminal device 20 determines whether the accuracy of the protected character targeted for the correction operation is higher than the second accuracy.
  • the second accuracy is higher than the first accuracy.
  • the first certainty is lower than the second certainty.
  • the second accuracy may be determined by the administrator of the character recognition device 10, the user of the terminal device 20, or the like, or may be automatically set by the character recognition device 10.
  • step S710 If the result of determination in step S710 is affirmative, the terminal device 20 notifies that correction is not possible in step S720, and returns the process to step S400. On the other hand, if the determination result in step S710 is negative, the terminal device 20 advances the process to step S712.
  • step S712 the terminal device 20 determines whether or not to correct the protected character that has been the target of the correction operation. For example, the terminal device 20 causes the display device 30 to display a GUI image for selecting whether to continue the correction of the protected character targeted for the correction operation or to cancel the correction operation. Then, when the user selects to continue the correction of the protected character, the terminal device 20 determines to execute the correction of the protected character. On the other hand, when the user selects to cancel the correction operation, the terminal device 20 determines not to correct the protected character.
  • an operation for continuing to correct protected characters is an example of a "predetermined operation."
  • step S712 If the determination result in step S712 is negative, the terminal device 20 returns the process to step S400 without correcting the protected character that was the target of the correction operation. On the other hand, if the determination result in step S712 is affirmative, the terminal device 20 advances the process to step S714.
  • step S714 the terminal device 20 corrects the protected character targeted for the correction operation based on the correction operation. Then, the terminal device 20 returns the process to step S400.
  • the degree of restriction on operations on protected characters is changed according to the accuracy of recognition results. Specifically, for a protected character whose accuracy of the recognition result is higher than the second accuracy, the content of the operation on the protected character is restricted so as not to be reflected. Further, when the user performs a predetermined operation on a protected character whose accuracy of recognition result is equal to or lower than the second accuracy and higher than the first accuracy, the operation on the protected character is not restricted. In other words, if the user does not perform a predetermined operation on a protected character whose accuracy of the recognition result is equal to or less than the second accuracy but higher than the first accuracy, the operation on the protected character is restricted so as not to be reflected. be done.
  • the operation of the terminal device 20 according to this modification is not limited to the example shown in FIG.
  • the terminal device 20 may execute a process related to lifting the restriction instead of the process of step S712.
  • the terminal device 20 determines whether or not to release the restriction on the protected character that is the target of the correction operation. For example, the terminal device 20 causes the display device 30 to display a GUI image for selecting whether to release the operation restriction on the protected character targeted for the correction operation or to cancel the correction operation. Then, when the user selects to release the restriction on the operation on the protected character, the terminal device 20 determines to release the restriction on the operation on the protected character, and releases the restriction on the operation on the protected character that is the target of the correction operation. do. After the restriction on the operation of the protected characters is lifted, the process of step S714 is executed.
  • the terminal device 20 determines not to release the restriction on the operation on the protected character, and proceeds to step processing without correcting the protected character targeted for the correction operation. Return to S400. Note that an operation for releasing restrictions on operations on protected characters (for example, an operation for selecting release of restrictions on operations on protected characters in a GUI image) is another example of a "predetermined operation.”
  • the restriction unit 226 changes the degree of restriction on the operation of the protected character according to the accuracy indicated by the accuracy information acquired by the acquisition unit 222 .
  • the restriction unit 226 changes the degree of restriction on the operation of the protected character according to the accuracy indicated by the accuracy information acquired by the acquisition unit 222 .
  • the restriction unit 226 restricts the content of the operation on the protected character to not be reflected on the character CR whose accuracy indicated by the accuracy information is higher than the second accuracy.
  • the restriction unit 226 restricts the operation on the protected character when the user performs a predetermined operation on the character CR whose accuracy indicated by the accuracy information is equal to or less than the second accuracy.
  • the content of the operation on the protected character is restricted so as not to be reflected.
  • the terminal device 20 sets protected characters, but the present invention is not limited to such an aspect.
  • the restriction unit 226 shown in FIG. 6 may be included in the character recognition device 10.
  • FIG. 17 is an explanatory diagram for explaining the outline of the character recognition system 1 according to the sixth modification.
  • a character recognition system 1 shown in FIG. 17 has a character recognition device 10A and a terminal device 20A instead of the character recognition device 10 and the terminal device 20 shown in FIG. is similar to
  • the character recognition device 10A includes a control unit 120 that controls each unit of the character recognition device 10A, a storage unit 140 that stores various information, and a communication unit 160 that executes communication with an external device such as the terminal device 20A. and That is, the character recognition device 10A is similar to the character recognition device 10 shown in FIG. However, the character recognition apparatus 10A is different from the character recognition apparatus 10 in that the control unit 120 executes the control program PG1a instead of the control program PG1. Therefore, the storage unit 140 stores the control program PG1a instead of the control program PG1.
  • the character recognition device 10A is another example of "information processing device", and the control program PG1a is another example of "program”.
  • control program PG1a includes, for example, an application program for the character recognition device 10A to execute a character recognition process and a correction support process that supports correction of the result of the character recognition process.
  • control program PG1a may include, for example, an operating system program for the control section 120 to control each section of the character recognition device 10A.
  • the control unit 120 has an image information acquisition unit 122, a character recognition unit 124, a display control unit 224a, and a restriction unit 226, for example.
  • the control unit 120 is similar to the control unit 120 shown in FIG. 4 except that it has a display control unit 224a and a restriction unit 226.
  • the limiting section 226 is the same as the limiting section 226 shown in FIG. Therefore, the description of the restriction unit 226 is omitted.
  • the display control unit 224a generates display information for displaying the confirmation screen CHS on the display unit 310 of the display device 30, and transmits the generated display information to the terminal device 20A via the communication unit 160.
  • the terminal device 20A displays the confirmation screen CHS indicated by the display information received from the character recognition device 10A on the display unit 310 of the display device 30.
  • the display control unit 224a causes the display device 30 to display the plurality of characters CR recognized by the character recognition unit 124 by, for example, transmitting display information indicating the confirmation screen CHS to the terminal device 20A.
  • the terminal device 20A includes a control section 220 that controls each section of the terminal device 20A, a storage section 240 that stores various information, and a communication section 260 that performs communication with an external device such as the character recognition device 10A. , and an operation unit 280 for receiving an operation by the user of the terminal device 20A. That is, the terminal device 20A is the same as the terminal device 20 shown in FIG. However, the terminal device 20A is different from the terminal device 20 in that the control unit 220 executes the control program PG2a instead of the control program PG2. Therefore, the storage unit 140 stores the control program PG2a instead of the control program PG2.
  • the control unit 220 has an acquisition unit 222, for example.
  • the control unit 220 is similar to the control unit 220 shown in FIG. 6, except that the display control unit 224 and the restriction unit 226 are omitted from the control unit 220 shown in FIG.
  • the acquisition unit 222 may transmit operation information indicating the content of the operation received by the operation unit 280 to the character recognition device 10A via the communication unit 260.
  • the function of transmitting the operation information to the character recognition device 10A may be realized by a functional block different from the acquisition unit 222, for example.
  • the character recognition device 10A generates display information and the like for displaying the confirmation screen CHS on the display unit 310 of the display device 30 based on the operation information received from the terminal device 20A.
  • the character recognition device 10A executes the processes of steps S20 and S22 shown in FIG. Execute a series of operations.
  • the character recognition device 10A transmits display information indicating the confirmation screen CHS and the like to be displayed on the display device 30 to the terminal device 20A.
  • the processing based on the content of the operation received by the operation unit 280 is executed based on the operation information received from the terminal device 20A.
  • the terminal device 20A executes the processing of steps S10 and S12 shown in FIG.
  • the screen CHS is displayed on the display unit 310 of the display device 30 .
  • the terminal device 20A transmits operation information indicating the details of the operation received by the operation unit 280 to the character recognition device 10A.
  • the hardware configuration of the character recognition device 10A is the same as that of the character recognition device 10 shown in FIG.
  • the processor 12 that operates according to an application program included in the control program PG1a functions as a control section 120 including an image information acquisition section 122, a character recognition section 124, a display control section 224a, and a restriction section 226.
  • the control program PG1a may be transmitted from another device.
  • the hardware configuration of the terminal device 20A is the same as that of the terminal device 20 shown in FIG.
  • the processor 22 that operates according to an application program included in the control program PG2a functions as a control section 220 including an acquisition section 222 .
  • the control program PG2a may be transmitted from another device.
  • the configurations of the character recognition device 10A and the terminal device 20A are not limited to the example shown in FIG.
  • the character recognition device 10A may have an operation device (for example, an operation device 18 shown in FIG. 19 to be described later) that functions as an operation unit for accepting operations by an administrator or the like of the character recognition device 10A.
  • the terminal device 20A may have an optical device such as a camera and an image scanner for converting the input image IIMG into input image information, which is a digital signal.
  • the terminal device 20A may have the display device 30 .
  • the same effects as those of the above-described embodiment and modified example can be obtained.
  • the character recognition device 10 and the terminal device 20 are separated from each other, but the present invention is not limited to this aspect.
  • the character recognition device 10 and the terminal device 20 may be integrated.
  • FIG. 18 is a functional block diagram showing an example of the configuration of a character recognition device 10B according to the seventh modified example.
  • the character recognition device 10B performs communication between a control unit 120 that controls each part of the character recognition device 10B, a storage unit 140 that stores various information, and an external device that exists outside the character recognition device 10B. communication unit 160, an operation unit 180, and an imaging unit 190.
  • the character recognition device 10B is the same as the character recognition device 10 shown in FIG.
  • the character recognition apparatus 10B differs from the character recognition apparatus 10 in that the control unit 120 executes the control program PG1b instead of the control program PG1. Therefore, the storage unit 140 stores the control program PG1b instead of the control program PG1.
  • the character recognition device 10B is another example of the "information processing device”
  • the control program PG1b is another example of the "program”.
  • control program PG1b includes, for example, an application program for the character recognition device 10B to execute a character recognition process and a correction support process that supports correction of the result of the character recognition process.
  • control program PG1b may include, for example, an operating system program for the control section 120 to control each section of the character recognition device 10B.
  • the control unit 120 has an image information acquisition unit 122, a character recognition unit 124, a display control unit 224, and a restriction unit 226, for example.
  • the image information acquisition unit 122 and the character recognition unit 124 are the same as the image information acquisition unit 122 and the character recognition unit 124 shown in FIG.
  • the display control unit 224 and the restriction unit 226 are the same as the display control unit 224 and the restriction unit 226 shown in FIG.
  • the operation unit 180 accepts an operation by a user or the like.
  • the imaging unit 190 captures an image of a subject and outputs image information indicating the captured image of the subject.
  • the imaging unit 190 may capture an image of an application form or the like, and convert an input image IIMG, which is an image of the captured application form, into input image information.
  • the imaging unit 190 may cause the storage unit 140 or the like to store input image information indicating the input image IIMG.
  • the image information acquisition unit 122 may acquire input image information indicating the input image IIMG to be subjected to character recognition processing from the storage unit 140, for example.
  • the image information acquisition section 122 may acquire the input image information from the imaging section 190 without going through the storage section 140 .
  • the image information acquisition unit 122 may acquire input image information from an external device that exists outside the character recognition device 10B.
  • step S200 to step S720 shown in FIG. 11 or 16 are executed. That is, the operation of the character recognition apparatus 10B is the same as that of the character recognition system shown in FIG. 11 except that the series of processes of steps S10, S12, S24 and S100 are omitted from the operation of the character recognition system 1 shown in FIG.
  • the operation is the same as that of 1.
  • the image information acquiring unit 122 acquires input image information indicating the input image IIMG to be subjected to character recognition processing from the imaging unit 190, the storage unit 140, or an external device.
  • step S22 shown in FIG. 11 the character recognition unit 124 executes character recognition processing using the input image information (the input image information acquired in step S20).
  • step S200 shown in FIG. 11 the restriction unit 226 sets protected characters based on the accuracy of the result of character recognition processing by the character recognition unit 124 (character recognition processing in step S22).
  • step S300 shown in FIG. 11 the display control unit 224 causes the display device 30 to display a confirmation screen CHS for confirming the result of the character recognition processing by the character recognition unit 124 (character recognition processing in step S22).
  • FIG. 19 is a diagram showing an example of the hardware configuration of the character recognition device 10B shown in FIG.
  • the character recognition device 10B has a processor 12 that controls each part of the character recognition device 10B, a memory 14 that stores various information, a communication device 16, an operation device 18, and an imaging device 19.
  • the character recognition device 10B is the same as the character recognition device 10 shown in FIG.
  • the processor 12 that operates according to the application programs included in the control program PG1b functions as the control section 120 including the image information acquisition section 122, the character recognition section 124, the display control section 224, and the restriction section 226, for example.
  • the control program PG1b may be transmitted from another device.
  • the operation device 18 is hardware for receiving operations by a user or the like, and functions as an operation unit 180 .
  • the operating device 18 is configured similarly to the operating device 28 shown in FIG.
  • the imaging device 19 is an optical device such as a camera and an image scanner, and functions as an imaging unit 190 .
  • the imaging device 19 captures an image of a subject and outputs image information indicating the captured image of the subject.
  • the imaging device 19 has, for example, an imaging optical system and an imaging device.
  • An imaging optical system is an optical system that includes at least one imaging lens.
  • the imaging optical system may have a zoom lens, a focus lens, or the like.
  • the imaging device is, for example, a CCD (Charge Coupled Device) image sensor or a CMOS (Complementary MOS) image sensor.
  • the configuration of the character recognition device 10B is not limited to the examples shown in FIGS. 18 and 19.
  • the character recognition device 10B may have a display device 30.
  • the character recognition device 10B may not include the imaging device 19 .
  • the display device 30 may be included in a terminal device such as a thin client terminal communicably connected to the character recognition device 10B via the network NW, or may be communicably connected to a terminal device such as a thin client terminal. may be
  • the character recognition device 10, 10A, or 10B may learn the content of corrections to the result of character recognition processing.
  • the same effects as those of the above-described embodiment and modified example can be obtained.
  • the deletion of the protected character by and the change (correction) of the protected character by the second operation may be confirmed. That is, if the user only performs the first operation, deletion of the protected character to be operated is tentatively decided, and if the user does not perform the second operation after that, the previously performed first operation is cancelled. Therefore, the operation (first operation) for deleting the protected character is not determined.
  • the character recognition device 10 can make necessary corrections and changes to protected characters while restricting easy operations on protected characters.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

端末装置は、画像に含まれる文字を認識する文字認識処理により文字画像から読み取られた複数の文字を示す文字情報と複数の文字の各々についての認識結果の確度を示す確度情報とを含む認識情報を、取得する取得部と、文字情報により示される複数の文字を表示装置に表示させる表示制御部と、確度情報により示される確度に基づいて、複数の文字のうち、認識結果の確度に関する条件が満たされた保護文字に対する操作を制限する制限部と、を備える。

Description

情報処理装置及びプログラム
 本発明は、情報処理装置及びプログラムに関する。
 文字認識装置等の情報処理装置では、一般的に、光学文字認識(OCR:Optical character recognition)技術が採用されている。OCR技術は、帳票等の媒体に記載された文字をカメラ及びイメージスキャナ等の光学的な手段により画像として取込み、取り込んだ画像内の文字をコンピュータ等が利用可能な文字情報(例えば、文字コード)に変換する技術である。なお、OCRによる文字認識の精度は100%ではないため、文字認識が行われた画像と文字認識の結果とを互いに目視により確認し、誤った文字を修正する確認作業が、オペレータにより行われる。特許文献1には、文字認識の結果の確度を複数の区分に分類し、複数の区分の1つを、文字認識の結果が絶対に誤っていない確度を示す区分にする文字認識方法が開示されている。この種の文字認識方法では、文字認識の結果が絶対に誤っていない確度を示す区分に属する文字に対しては、オペレータによる確認作業を省略することができる。
特開2007-156938号公報
 ところで、確認作業において、文字認識の結果が正しい文字をオペレータが誤って変更してしまう作業ミスが発生する場合がある。このため、文字認識の結果の確認及び修正を効率的に行うことが可能な情報処理装置が求められている。
 本発明の好適な態様に係る情報処理装置は、画像に含まれる文字を認識する文字認識処理により読取対象画像から読み取られた複数の文字を示す文字情報と前記複数の文字の各々についての認識結果の確度を示す確度情報とを含む認識情報を、取得する取得部と、前記文字情報により示される前記複数の文字を表示装置に表示させる表示制御部と、前記確度情報により示される確度に基づいて、前記複数の文字のうち、前記認識結果の確度に関する条件が満たされた保護文字に対する操作を制限する制限部と、を備える。
 本発明の好適な他の態様に係る情報処理装置は、画像を示す画像情報を取得する画像情報取得部と、前記画像情報により示される前記画像に含まれる複数の文字を認識し、前記複数の文字の各々について、認識結果の確度を算出する文字認識部と、前記文字認識部により認識された前記複数の文字を表示装置に表示させる表示制御部と、前記文字認識部により算出された確度に基づいて、前記複数の文字のうち、前記認識結果の確度に関する条件が満たされた保護文字に対する操作を制限する制限部と、を備える。
 本発明の好適な態様に係るプログラムは、プロセッサを、画像に含まれる文字を認識する文字認識処理により読取対象画像から読み取られた複数の文字を示す文字情報と前記複数の文字の各々についての認識結果の確度を示す確度情報とを含む認識情報を、取得する取得部と、前記文字情報により示される前記複数の文字を表示装置に表示させる表示制御部と、前記確度情報により示される確度に基づいて、前記複数の文字のうち、前記認識結果の確度に関する条件が満たされた保護文字に対する操作を制限する制限部と、として機能させる。
 本発明の好適な他の態様に係るプログラムは、プロセッサを、画像を示す画像情報を取得する画像情報取得部と、前記画像情報により示される前記画像に含まれる複数の文字を認識し、前記複数の文字の各々について、認識結果の確度を算出する文字認識部と、前記文字認識部により認識された前記複数の文字を表示装置に表示させる表示制御部と、前記文字認識部により算出された確度に基づいて、前記複数の文字のうち、前記認識結果の確度に関する条件が満たされた保護文字に対する操作を制限する制限部と、として機能させる。
 本発明によれば、文字認識の結果の確認及び修正を効率的に行うことが可能な情報処理装置を提供することができる。
実施形態に係る文字認識システムの概要を説明するための説明図である。 入力画像の一例を説明するための説明図である。 文字認識処理の結果を確認するための確認画面の概要の一例を説明するための説明図である。 図1に示した文字認識装置の構成の一例を示す機能ブロック図である。 図4に示した文字認識装置のハードウェア構成の一例を示す図である。 図1に示した端末装置の構成の一例を示す機能ブロック図である。 図6に示した端末装置のハードウェア構成の一例を示す図である。 図6に示した編集テーブルの一例を示す説明図である。 図6に示した編集テーブルの別の例を示す説明図である。 図1に示した端末装置の動作の概要を説明するための説明図である。 図1に示した文字認識システムの動作の一例を示すシーケンスチャートである。 第1変形例に係る端末装置の動作の概要を説明するための説明図である。 第2変形例に係る端末装置の動作の概要を説明するための説明図である。 第3変形例に係る確認画面の一例を示す図である。 第4変形例に係る確認画面の一例を示す図である。 第5変形例に係る端末装置の動作の一例を示すフローチャートである。 第6変形例に係る文字認識システムの概要を説明するための説明図である。 第7変形例に係る文字認識装置の構成の一例を示す機能ブロック図である。 図18に示した文字認識装置のハードウェア構成の一例を示す図である。
 以下、本発明を実施するための形態について図面を参照して説明する。なお、各図において、各部の寸法及び縮尺は、実際のものと適宜に異ならせてある。また、以下に述べる実施の形態は、本発明の好適な具体例であるから、技術的に好ましい種々の限定が付されているが、本発明の範囲は、以下の説明において特に本発明を限定する旨の記載がない限り、これらの形態に限られるものではない。
[1.実施形態]
 先ず、図1を参照しながら、実施形態に係る文字認識システム1の概要の一例について説明する。
 図1は、実施形態に係る文字認識システム1の概要を説明するための説明図である。
 図1に示す文字認識システム1は、文字認識装置10と、端末装置20と、端末装置20に対応して設けられた表示装置30とを有する。端末装置20は、「情報処理装置」の一例である。文字認識装置10及び端末装置20は、例えば、ネットワークNWを介して、互いに通信可能に接続されている。ネットワークNWは、インターネット及びローカルエリアネットワークを含み得る。例えば、ネットワークNWは、有線ネットワーク及び無線ネットワークの一方又は両方を含む。また、ネットワークNWと文字認識装置10との接続等は、例えば、複数の要素間を互いに通信可能にする接続であればよく、有線及び無線の一方を用いた接続であってもよいし、有線及び無線の両方を用いた接続であってもよい。
 文字認識装置10としては、ネットワークNWに接続可能な任意の情報処理装置を採用することができる。文字認識装置10は、例えば、光学文字認識(OCR:Optical character recognition)技術を用いて、画像に含まれる文字を認識する文字認識処理を実行する。文字認識処理の対象となる入力画像IIMGの一例は、後述する図2において説明される。また、文字認識装置10の構成は、後述する図4及び図5において説明される。
 端末装置20としては、ネットワークNWに接続可能な任意の情報処理装置を採用することができる。具体的には、端末装置20は、例えば、パーソナルコンピュータ等の据置型の情報機器であってもよいし、ノート型のパーソナルコンピュータ及びタブレット端末等の可搬型の情報端末であってもよい。端末装置20は、例えば、表示装置30と通信可能に接続され、表示装置30に設けられた表示部310に対して画像等を表示させることができる。端末装置20と表示装置30との接続は、有線及び無線の一方を用いた接続であってもよいし、有線及び無線の両方を用いた接続であってもよい。また、表示装置30は、端末装置20に含まれてもよい。端末装置20は、例えば、文字認識装置10による文字認識処理の結果をユーザ(例えば、オペレータ)が確認するための確認画面CHSを、表示装置30に表示させる。確認画面CHSの一例は、後述する図3において説明される。また、端末装置20の構成は、後述する図6及び図7において説明される。
 図2は、入力画像IIMGの一例を説明するための説明図である。本実施形態では、文字認識処理の対象となる入力画像IIMGが申込書の画像である場合を想定するが、入力画像IIMGは申込書の画像に限定されない。例えば、入力画像IIMGは、処方箋又は帳票等の画像でもよい。
 入力画像IIMGは、例えば、複数の項目に対応する複数の記入欄ECが設けられた申込書の画像である。図2に示す例では、申込書に記入される複数の項目は、申込番号、氏名(カナ)、氏名、郵便番号、住所、E-mail、勤務先、勤務先電話番号及び備考等である。入力画像IIMGは、例えば、カメラ及びイメージスキャナ等の光学的な手段により、デジタル信号である入力画像情報に変換される。そして、文字認識装置10は、入力画像IIMGを示す入力画像情報を用いて、入力画像IIMGに含まれる文字を認識する。
 入力画像IIMGのうちの、文字認識装置10による文字認識処理の対象となる文字画像部分(例えば、複数の記入欄ECの各々)は、ユーザにより手動で設定されてもよいし、文字認識装置10により自動的に設定されてもよい。例えば、文字認識装置10は、記入欄ECに手書き文字等が記入されていない申込書(空欄の申込書)の画像情報を基準画像情報として用いて、文字認識処理の対象となる範囲を基準画像情報上で予め特定し、特定した範囲を文字画像部分として設定してもよい。あるいは、入力画像IIMGのうちの文字画像部分は、文字認識装置10により自動的に設定された範囲をユーザが修正することにより、設定されてもよい。これにより、文字認識装置10は、ある入力画像情報が入力されると、記憶部に記憶された帳票辞書データの中から、所定の項目や罫線情報に基づいて入力画像情報の申込書と一致度が高い帳票(本実施形態では申込書)を取得する。そして、文字認識装置10は、取得した当該帳票において予め設定された文字画像部分のXY座標と同じXY座標で規定される入力画像情報のXY座標の範囲を文字画像部分として認識する。
 本実施形態では、入力画像IIMGのうちの、複数の記入欄ECに対応する複数の部分が、文字認識装置10による文字認識処理の対象となる複数の文字画像部分である場合を想定する。以下では、入力画像IIMGのうちの、文字認識装置10による文字認識処理の対象となる文字画像部分は、文字画像CIとも称される。本実施形態では、入力画像IIMGの複数の記入欄ECに対応する複数の部分の各々が文字画像CIである場合を想定する。例えば、図2において破線で囲んだ部分は、備考の記入欄ECに対応する文字画像CIを示す。なお、入力画像IIMG及び文字画像CIは、「読取対象画像」の一例である。以下では、特に断りがない場合、文字画像CIが「読取対象画像」に該当する場合を想定している。
 次に、図3を参照しながら、文字認識処理の結果を確認するための確認画面CHSについて説明する。
 図3は、文字認識処理の結果を確認するための確認画面CHSの概要の一例を説明するための説明図である。図3は、入力画像IIMGに含まれる複数の文字画像CIのうち、備考の記入欄ECに対応する文字画像CIから読み取られた複数の文字CRを確認するための確認画面CHSの一例を示す。なお、複数の文字CRは、「読取対象画像から読み取られた複数の文字」の一例である。以下では、文字認識処理の結果は、認識結果とも称される。
 確認画面CHSは、例えば、表示装置30の表示部310に表示される。例えば、確認画面CHSには、確認対象の項目を示す“備考”の文字列、文字画像領域IW、編集領域EDW、及び、終了ボタンBT等が表示される。終了ボタンBTは、例えば、確認画面CHSの表示を終了させるためのGUI(Graphical User Interface)用の画像である。
 文字画像領域IWには、文字画像CIが表示される。図3に示す例では、文字画像CIの一部(図2に示した“携帯電話の番号を、下記に示します。”の文字列)は、文字画像領域IWに表示されていない。このため、文字画像領域IWにおいて文字画像CIを水平方向(図の横方向)に移動させる水平スクロールバーHSと、文字画像領域IWにおいて文字画像CIを垂直方向(図の縦方向)に移動させる垂直スクロールバーVSiとが確認画面CHSに表示される。なお、文字認識装置10又は端末装置20は、文字画像CIの全体が文字画像領域IWに入るように、文字画像CIを縮小表示さてもよい。
 ここで、文字画像CIは、例えば、複数の文字部分(図3に示す文字画像領域IW内の点線で囲んだ部分)に区分される。例えば、複数の文字部分の各々は、文字画像CIのうち、文字認識処理により1文字として区切られた部分である。図3では、文字認識処理により、文字画像CIに含まれる複数の文字の各々が1文字として正しく区切られている場合が例示されている。また、図3では、説明を分かり易くするために、文字画像領域IWにおいて文字部分を点線で示しているが、文字部分を示す点線は、文字画像領域IWに表示されてもよいし、表示されなくてもよい。また、例えば、文字画像CIの元となった申込書等の原本と複数の文字CRとがユーザにより比較される場合等では、文字画像領域IWは、確認画面CHSに表示されなくてもよい。
 編集領域EDWには、文字画像CIから読み取られた複数の文字CRが表示される。図3に示す例では、複数の文字CRの一部(図2に示した“携帯電話の番号を、下記に示します。”の文字列)は、編集領域EDWに表示されていない。このため、編集領域EDWにおいて複数の文字CRを垂直方向(図の縦方向)に移動させる垂直スクロールバーVSeが確認画面CHSに表示される。また、編集領域EDWには、文字の入力位置を示すカーソルCSが表示される。編集領域EDWにおけるカーソルCSの表示位置は、例えば、ユーザ操作により移動する。なお、文字認識装置10又は端末装置20は、文字画像CIから読み取られた複数の文字CR全体が、編集領域EDWに入るように、文字CRを縮小表示させてもよい。
 ここで、図3に示す編集領域EDWにおいて、破線で囲まれた文字CRは、文字認識装置10による文字認識処理の結果(認識結果)の確度が予め決められた第1の確度より高い文字CRである。なお、認識結果の確度が第1の確度より高い文字CRの範囲を示す破線は、編集領域EDWに表示されてもよいし、表示されなくてもよい。認識結果の確度は、認識結果の確からしさを示す。認識結果の確度の高い文字CRは、認識結果の確度の低い文字CRに比べて、正しく認識されている確率が高い。なお、第1の確度は、例えば、文字認識装置10の管理者及び端末装置20のユーザ等により、文字認識処理の試行結果に基づいて決定されてもよい。あるいは、第1の確度は、文字認識処理の過去の実績等に基づいて、文字認識装置10により自動的に設定されてもよい。
 認識結果の確度が第1の確度より高いことは、「認識結果の確度に関する条件」の一例である。例えば、端末装置20は、複数の文字CRのうち、認識結果の確度が第1の確度より高い文字CRを、認識結果の確度に関する条件が満たされた保護文字として特定し、特定した保護文字に対するユーザによる修正や変更及び削除等の操作を制限する。なお、本実施形態では、認識結果の確度が第1の確度より高いことが認識結果の確度に関する条件である場合を想定するが、認識結果の確度に関する条件は、認識結果の確度が第1の確度より高いことに限定されない。認識結果の確度に関する条件の他の例は、後述する第1変形例等において説明される。
 図3では、文字画像CIに含まれる複数の文字による文字列(“090-0ab7-1171”)のうち、末尾から数えて4番目の文字である“1”の1文字と“7”の2文字との計3文字の認識結果の確度が第1の確度以下である場合を想定する。また、図3に示す例では、文字認識装置10は、文字画像CIに含まれる複数の文字による文字列のうち、“7”の2文字の各々を“1”の文字CRと誤って認識している。従って、図3に示す例では、複数の文字CRとして、文字列“090-0ab1-1111”が、編集領域EDWに表示される。編集領域EDWに表示された複数の文字CR(“090-0ab1-1111”)のうち、図3の破線で囲まれた10個の文字CRに対してはユーザによる操作が制限され、図3の破線で囲まれていない3個の“1”の文字CRに対するユーザによる操作は制限されない。
 例えば、図3において上側に示した確認画面CHSでは、カーソルCSは、複数の文字CR(“090-0ab1-1111”)のうち、末尾から数えて3番目の文字である“1”の文字CRの位置に表示されている。この場合、カーソルCSにより選択された文字CRは、ユーザによる操作が制限された保護文字であるため、文字CRを削除する削除操作をユーザが誤って行った場合でも、削除されない。すなわち、カーソルCSにより選択された文字CRが保護文字である場合、カーソルCSにより選択された文字CR(保護文字)には、ユーザによる文字CRの削除、修正及び変更等の操作は、反映されない。なお、保護文字に対しては、カーソルCSによる選択ができないようにしてもよい。この場合、ユーザがカーソルCSを操作して保護文字を選択しようとすると、例えば、カーソルCSが保護文字を飛ばして次の文字CRに移動する。これにより、ユーザによる当該文字CRが保護文字であることの認識をし易くすると共に、保護文字に対する誤操作を確実に防ぐことができる。
 また、例えば、図3において下側に示した確認画面CHSでは、カーソルCSの表示位置は、ユーザ操作により、複数の文字CRのうち、末尾から数えて2番目の文字である“1”の文字CRの位置に移動する。この場合、カーソルCSにより選択された文字CRは、ユーザによる修正が制限された保護文字でないため、誤った文字CRを正しい文字に修正する修正操作をユーザが行った場合、正しい文字に修正される。
 このように、本実施形態では、複数の文字CRのうち、認識結果の確度が第1の確度より高い文字CR(保護文字)に対する修正は、制限される。これにより、ユーザは、文字認識処理の結果の確認及び修正を効率的に行うことができる。
 例えば、認識結果の確度が第1の確度より高い文字CRに対するユーザによる操作が制限されない形態(以下、第1対比例とも称する)では、文字認識の結果が正しい文字CRをユーザが誤って変更してしまう作業ミスが発生する場合がある。具体的には、複数の文字CRのうち、末尾から数えて2番目の文字である“1”の文字CRを“7”の文字に修正する修正作業において、末尾から数えて3番目の文字である“1”の文字CRの位置にカーソルCSをユーザが誤って移動させた場合を想定する。この場合、ユーザが、カーソルCSにより選択されている文字CRが修正対象の文字CRでないことに気づかずに、“1”の文字CRを“7”の文字に修正する修正操作を行うと、文字認識の結果が正しい“1”の文字CRが“7”の文字(誤った文字)に変更される。
 これに対し、本実施形態では、上述したように、複数の文字CRのうちの末尾から数えて3番目の文字である“1”の文字CR(カーソルCSにより選択されている文字CR)は、保護文字である。このため、ユーザが、カーソルCSにより選択されている文字CRが修正対象の文字CRでないことに気づかずに、“1”の文字CRを“7”の文字に修正する修正操作を行った場合でも、カーソルCSにより選択されている文字CRには、修正操作は反映されない。従って、本実施形態では、文字認識の結果が正しい文字CRがユーザの誤った操作で誤った文字に変更されることを抑制することができる。この結果、本実施形態では、第1対比例に比べて、文字認識処理の結果に対する確認及び修正の作業効率を向上することができる。
 次に、図4から図7を参照しながら、文字認識装置10及び端末装置20の機能について説明する。
 図4は、図1に示した文字認識装置10の構成の一例を示す機能ブロック図である。
 文字認識装置10は、文字認識装置10の各部を制御する制御部120と、制御プログラムPG1等の各種情報を記憶する記憶部140と、端末装置20等の外部装置との間の通信を実行するための通信部160とを有する。本実施形態では、制御プログラムPG1は、例えば、文字認識装置10が文字認識処理を実行するためのアプリケーションプログラムを含む。但し、制御プログラムPG1は、例えば、制御部120が文字認識装置10の各部を制御するためのオペレーティングシステムプログラムを含んでもよい。
 制御部120は、例えば、画像情報取得部122及び文字認識部124を有する。画像情報取得部122は、例えば、文字認識処理の対象となる入力画像IIMGを示す入力画像情報を、通信部160を介して端末装置20から取得する。
 文字認識部124は、画像情報取得部122が取得した入力画像情報を用いて文字認識処理を実行することにより、入力画像情報により示される入力画像IIMGに含まれる文字を認識する。例えば、文字認識部124は、入力画像IIMGのうちの予め決められた文字画像CIに含まれる文字を認識する。これにより、複数の文字画像CIの各々から複数の文字CRが読み取られる。すなわち、文字画像CIから読み取られた文字CRは、文字画像CIに含まれる文字として、文字認識処理により認識された文字である。また、文字認識部124は、複数の文字画像CIの各々から読み取った複数の文字CRの確からしさを示す確度(すなわち、認識結果の確度)を算出する。
 また、文字認識部124は、複数の文字画像CIの各々に対する文字認識処理の結果に関する認識情報と、複数の文字画像CIの各々を示す文字画像情報とを、通信部160を介して端末装置20に送信する。例えば、認識情報は、複数の文字画像CIの各々から読み取った複数の文字CRを示す文字情報と、複数の文字CRの各々についての認識結果の確度を示す確度情報とを含む。また、文字画像情報は、例えば、文字画像CIのうち、文字認識処理により1文字として区切られた文字部分を示す文字部分情報を含んでもよい。文字部分情報は、文字画像CIにおける文字部分の範囲を、文字画像CI内の所定の位置を原点とする座標を用いて示してもよい。
 なお、文字認識部124は、文字を含む画像と、画像に含まれる文字との関係を学習した学習モデルを用いて、文字画像CIに含まれる文字を認識してもよい。学習モデルは、例えば、多層ニューラルネットワークである。すなわち、文字認識部124は、この学習モデルを用いることで、AI(Artificial Intelligence)-OCRによる文字認識処理を実行してもよい。
 次に、図5を参照しながら、文字認識装置10のハードウェア構成について説明する。
 図5は、図4に示した文字認識装置10のハードウェア構成の一例を示す図である。
 文字認識装置10は、文字認識装置10の各部を制御するプロセッサ12と、各種情報を記憶するメモリ14と、通信装置16とを有する。
 メモリ14は、例えば、プロセッサ12の作業領域として機能するRAM(Random Access Memory)等の揮発性メモリと、制御プログラムPG1等の各種情報を記憶するEEPROM(Electrically Erasable Programmable Read-Only Memory)等の不揮発性メモリとの、一方又は両方を含み、記憶部140として機能する。なお、メモリ14は、文字認識装置10に着脱可能であってもよい。具体的には、メモリ14は、文字認識装置10に着脱されるメモリカード等の記憶媒体であってもよい。また、メモリ14は、例えば、文字認識装置10とネットワークNW等を介して通信可能に接続された記憶装置(例えば、オンラインストレージ)であってもよい。
 プロセッサ12は、例えば、1又は複数のCPU(Central Processing Unit)を含んで構成される。プロセッサ12は、例えば、メモリ14に記憶された制御プログラムPG1を実行し、制御プログラムPG1に従って動作することで、制御部120として機能する。例えば、制御プログラムPG1に含まれるアプリケーションプログラム(文字認識に係るプログラム)に従って動作するプロセッサ12は、画像情報取得部122及び文字認識部124を含む制御部120として機能する。なお、制御プログラムPG1は、ネットワークNWを介して他の装置から送信されてもよい。
 また、例えば、プロセッサ12が複数のCPUを含んで構成される場合、制御部120の一部又は全部の機能は、これら複数のCPUが制御プログラムPG1等のプログラムに従って協働して動作することで実現されてもよい。また、プロセッサ12は、1又は複数のCPUに加え、又は、1又は複数のCPUのうち一部又は全部に代えて、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、又は、FPGA(Field Programmable Gate Array)等のハードウェアを含んで構成されるものであってもよい。この場合、プロセッサ12により実現される制御部120の一部又は全部は、DSP等のハードウェアにより実現されてもよい。
 通信装置16は、有線ネットワーク及び無線ネットワークの一方又は両方を介して、文字認識装置10の外部に存在する外部装置との通信を行うためのハードウェアであり、通信部160として機能する。
 なお、文字認識装置10の構成は、図4及び図5に示した例に限定されない。例えば、文字認識装置10は、文字認識装置10の管理者等による操作を受け付けるための操作部として機能する操作装置(後述する図7に示す端末装置20の操作装置28と同様な操作装置)を有してもよい。
 次に、図6及び図7を参照しながら、端末装置20の構成について説明する。
 図6は、図1に示した端末装置20の構成の一例を示す機能ブロック図である。
 端末装置20は、端末装置20の各部を制御する制御部220と、各種情報を記憶する記憶部240と、文字認識装置10等の外部装置との間の通信を実行するための通信部260と、端末装置20のユーザによる操作を受け付けるための操作部280とを有する。記憶部240は、例えば、制御プログラムPG2及び編集テーブルTBLを記憶している。本実施形態では、制御プログラムPG2は、例えば、文字認識処理の結果の修正等を支援する修正支援処理を端末装置20が実行するためのアプリケーションプログラムを含む。但し、制御プログラムPG2は、例えば、制御部120が端末装置20の各部を制御するためのオペレーティングシステムプログラムを含んでもよい。なお、制御プログラムPG2は、「プログラム」の一例である。編集テーブルTBLには、例えば、文字認識装置10から送信された認識情報(文字情報及び確度情報)等が記憶されている。編集テーブルTBLについては、後述する図8及び図9において説明される。
 制御部220は、例えば、取得部222、表示制御部224及び制限部226を有する。
 取得部222は、文字画像CIに対する文字認識処理の結果に関する認識情報と、文字画像CIを示す文字画像情報とを、通信部260を介して文字認識装置10から取得する。すなわち、取得部222は、文字認識処理により文字画像CIから読み取られた複数の文字CRを示す文字情報、及び、複数の文字CRの各々についての認識結果の確度を示す確度情報を含む認識情報を取得する。そして、取得部222は、文字認識装置10から取得した認識情報(文字情報及び確度情報)を編集テーブルTBLに記憶する。
 なお、取得部222は、入力画像IIMGを示す入力画像情報を、カメラ及びイメージスキャナ等の光学的な装置から通信部260を介して取得してもよい。そして、取得部222は、入力画像IIMGを示す入力画像情報を、通信部260を介して文字認識装置10に送信してもよい。なお、入力画像情報を取得する機能及び入力画像情報を送信する機能の一方又は両方は、取得部222とは別の機能ブロックにより実現されてもよい。
 表示制御部224は、例えば、文字情報及び文字画像情報に基づいて、確認画面CHSを表示装置30に表示させる。すなわち、表示制御部224は、文字情報に基づいて、文字認識処理により文字画像CIから読み取られた複数の文字CRを、表示装置30に表示させる。
 制限部226は、編集テーブルTBLに記憶されている確度情報により示される確度に基づいて、複数の文字CRのうち、認識結果の確度に関する条件が満たされた保護文字に対する操作を制限する。編集テーブルTBLに記憶されている確度情報は、例えば、取得部222が取得した認識情報に含まれる確度情報である。
 ここで、保護文字に対する操作を制限するとは、例えば、保護文字に対する複数の操作のうちの全部又は一部の操作の内容が反映されないようにすることであってもよい。あるいは、保護文字に対する操作を制限するとは、保護文字に対する複数の操作のうちの全部又は一部の操作自体をできないようにすることであってもよい。保護文字に対する複数の操作は、例えば、保護文字を削除する操作、及び、保護文字を他の文字に書き換える操作等である。すなわち、保護文字に対する操作を制限するとは、例えば、保護文字に対する修正を禁止することであってもよい。あるいは、保護文字に対する操作を制限するとは、例えば、ユーザによる所定の操作(例えば、保護を解除するための操作)が行われるまで、保護文字に対する修正を禁止することであってもよい。また、保護文字に対する修正は、例えば、保護文字を削除すること、及び、保護文字を他の文字に書き換えること等である。
 本実施形態では、上述したように、認識結果の確度が第1の確度より高いことが認識結果の確度に関する条件である場合を想定しているため、制限部226は、複数の文字CRのうち、認識結果の確度が第1の確度より高い文字CRを、保護文字として特定する。すなわち、本実施形態では、制限部226は、複数の文字CRのうち、認識結果の確度が第1の確度より高い文字CR(保護文字)に対して、ユーザによる操作を制限する。
 次に、図7を参照しながら、端末装置20のハードウェア構成について説明する。
 図7は、図6に示した端末装置20のハードウェア構成の一例を示す図である。
 端末装置20は、端末装置20の各部を制御するプロセッサ22と、各種情報を記憶するメモリ24と、通信装置26と、操作装置28とを有する。
 メモリ24は、例えば、プロセッサ22の作業領域として機能するRAM等の揮発性メモリと、制御プログラムPG2等の各種情報を記憶するEEPROM等の不揮発性メモリとの、一方又は両方を含み、記憶部240として機能する。なお、メモリ24は、図5において説明された文字認識装置10のメモリ14と同様に、端末装置20に着脱可能であってもよいし、端末装置20とネットワークNW等を介して通信可能に接続された記憶装置(例えば、オンラインストレージ)であってもよい。
 プロセッサ22は、図5において説明された文字認識装置10のプロセッサ12と同様に構成される。例えば、プロセッサ22は、例えば、1又は複数のCPUを含んで構成される。そして、プロセッサ22は、メモリ24に記憶された制御プログラムPG2を実行し、制御プログラムPG2に従って動作することで、制御部220として機能する。例えば、制御プログラムPG2に含まれるアプリケーションプログラム(文字認識処理の結果の修正支援に係るプログラム)に従って動作するプロセッサ22は、取得部222、表示制御部224及び制限部226を含む制御部220として機能する。なお、制御プログラムPG2は、ネットワークNWを介して他の装置から送信されてもよい。
 また、例えば、プロセッサ22が複数のCPUを含んで構成される場合、制御部220の一部又は全部の機能は、これら複数のCPUが制御プログラムPG2等のプログラムに従って協働して動作することで実現されてもよい。また、プロセッサ22は、1又は複数のCPUに加え、又は、1又は複数のCPUのうち一部又は全部に代えて、GPU、DSP、又は、FPGA等のハードウェアを含んで構成されるものであってもよい。この場合、プロセッサ22により実現される制御部220の一部又は全部は、DSP等のハードウェアにより実現されてもよい。
 通信装置26は、有線ネットワーク及び無線ネットワークの一方又は両方を介して、端末装置20の外部に存在する外部装置との通信を行うためのハードウェアであり、通信部260として機能する。
 操作装置28は、端末装置20のユーザによる操作を受け付けるためのハードウェアであり、操作部280として機能する。例えば、操作装置28は、操作ボタン、タッチパネル、キーボード、及び、マウス等の一部又は全部を含む、1又は複数の機器から構成されるものであってもよい。
 なお、端末装置20の構成は、図6及び図7に示した例に限定されない。例えば、端末装置20は、図1に示した表示装置30を有してもよい。この場合、端末装置20は、確認画面CHS等の各種画像を表示可能な表示部310を有する。また、端末装置20は、入力画像IIMGをデジタル信号である入力画像情報に変換するためのカメラ及びイメージスキャナ等の光学的な装置を有してもよい。
 次に、図8を参照しながら、編集テーブルTBLについて説明する。
 図8は、図6に示した編集テーブルTBLの一例を示す説明図である。編集テーブルTBLは、例えば、文字認識装置10から送信された認識情報(文字情報及び確度情報)等を記憶している。なお、図8に示す例では、編集テーブルTBLは、図2に示した備考の記入欄ECに対応する文字画像CIに対する文字認識処理の結果に関する認識情報等を記憶している。
 編集テーブルTBLは、例えば、文字画像CIに対する文字認識処理の結果に関する認識情報を含むテキスト情報と、文字画像CIを示す文字画像情報を特定するための画像情報(例えば、文字画像情報のファイル名を示す情報)とを記憶している。
 テキスト情報は、例えば、複数の文字CRの各々に対応付けられた文字に関する情報、確度に関する情報及び保護に関する情報を含む。例えば、編集テーブルTBLにおいて“No.”が示す番号は、複数の文字CRによる文字列における行番号に対応する。また、編集テーブルTBLにおいて“文字位置”が示す番号は、複数の文字CRによる文字列における列番号に対応する。なお、図8の網掛け部分は、複数の文字CRによる文字列において対応する文字がないことを示す。
 また、例えば、複数の文字CRのうちの一の文字CRにおいて、文字に関する情報は、一の文字CRを示す文字情報であり、確度に関する情報は、一の文字CRの認識結果の確度を示す確度情報である。また、複数の文字CRのうちの一の文字CRについての保護に関する情報は、一の文字CRが保護文字であるかを示す情報であり、制限部226により設定される。図8に示す編集テーブルTBLでは、符号Tは、文字CRが保護文字であることを示し、符号Fは、文字CRが保護文字でないことを示す。
 ここで、図8では、第1の確度が90である場合を想定する。この場合、例えば、制限部226は、複数の文字CRのうち、認識結果の確度が90より高い文字CRを、保護文字に設定する。具体的には、制限部226は、複数の文字CRのうち、認識結果の確度が90より高い文字CRについての保護に関する情報を、保護文字であることを示す情報(図8では、符号T)に設定する。換言すれば、複数の文字CRのうち、認識結果の確度が90以下の文字CRは、保護文字に設定されない。図8に示す例では、複数の文字CRによる文字列の2行目の8列目の文字CR、2行目の10列目の文字CR、及び、2行目の12列目の文字CRは、保護文字ではない。
 また、編集テーブルTBLにおいて、文字に関する情報は、ユーザによる修正が反映されてもよい。例えば、複数の文字CRによる文字列の2行目の8列目の文字CR、及び、2行目の12列目の文字CRの各々は、正しくは“7”の文字であるが、文字認識処理において正しく認識されず、“1”の文字CRと認識されている。このため、ユーザは、確認画面CHSにおいて、複数の文字CRによる文字列の2行目の8列目の文字CR、及び、2行目の12列目の文字CRの各々を、正しい文字である“7”に修正する。この場合、編集テーブルTBLにおいて、複数の文字CRによる文字列の2行目の8列目の文字CR、及び、2行目の12列目の文字CRの各々についての文字に関する情報は、“7”の文字を示す文字情報に更新されてもよい。
 なお、編集テーブルTBLは、文字に関する情報が記憶される領域とは別の領域に、ユーザにより修正された文字を示す文字情報(例えば、後述する図9に示す編集文字に関する情報)を記憶してもよい。以下では、ユーザにより修正された文字等も文字CRと称する場合がある。また、制限部226は、修正後の文字CRを保護文字に設定してもよい。
 次に、図9を参照しながら、編集テーブルTBLの別の例について説明する。
 図9は、図6に示した編集テーブルTBLの別の例を示す説明図である。図9に示す編集テーブルTBLは、文字認識処理による第1候補以外の認識結果に関する情報が記憶されること、及び、ユーザにより修正された文字が文字認識処理による認識結果とは別に記憶されることを除いて、図8に示した編集テーブルTBLと同様である。
 例えば、文字画像CIに含まれる文字の候補として複数の候補文字を文字認識処理が特定した場合、複数の候補文字のうちの最も確度が高い文字が、第1候補の文字である。図9に示す例では、複数の文字CRによる文字列の2行目の8列目、2行目の10列目、及び、2行目の12列目の各々の文字に対する認識結果が、第1候補以外の文字である第2候補の文字を含む。第2候補の文字は、ユーザが文字CRを修正する場合の予測変換等に用いられてもよい。
 編集テーブルTBLにおいて、編集文字に関する情報は、例えば、確認画面CHSの編集領域EDWに表示される文字CRを示す文字情報である。ユーザによる文字CRの修正がない場合、文字に関する情報と編集文字に関する情報は、互いに同じ文字情報である。また、例えば、編集文字に関する情報のうち、ユーザにより修正された文字CRに対応する情報は、ユーザによる修正が反映された文字情報である。例えば、図9に示す編集テーブルTBLでは、複数の文字CRによる文字列の2行目の8列目の文字CR、及び、2行目の12列目の文字CRの各々についての編集文字に関する情報は、“7”の文字を示す文字情報に更新されている。
 なお、編集テーブルTBLの構成は、図8及び図9に示した例に限定されない。例えば、保護に関する情報は、編集テーブルTBLから省かれてもよい。この場合においても、制限部226は、複数の文字CRのうちの一の文字CRの認識結果の確度を参照することにより、一の文字CRが保護文字であるか否かを認識できる。すなわち、編集テーブルTBLには、複数の文字CRと、複数の文字CRの認識結果の確度とが、互いに対応付けて記憶されていればよい。
 次に、図10を参照しながら、端末装置20の動作の概要について説明する。
 図10は、図1に示した端末装置20の動作の概要を説明するための説明図である。なお、上述の図3では、文字画像CIの一部及び複数の文字CRの一部が確認画面CHSに表示されない場合を例示したが、図10では、文字画像CIの全体及び複数の文字CRの全てが確認画面CHSに表示される場合を例示している。例えば、図10に示す確認画面CHSでは、文字画像CIの全体が文字画像領域IWに表示され、複数の文字CRの全てが編集領域EDWに表示されている。
 また、図10では、文字認識処理による文字の区切りに誤りがある場合を例にして、端末装置20の動作の概要を説明する。なお、文字認識処理による文字の区切りに誤りがない場合の例は、上述の図3に示されている。図10では、文字CH1と文字CH2とが隣り合って配置される場合に、2つの文字である文字CH1と文字CH2とが、1つの文字である文字CH3として誤認識される場合を例示している。なお、図10では、各文字が日本語である場合を例示して説明している。具体的には、図10では、文字CH1がひらがなの“し”であり、文字CH2がひらがなの“ま”であり、文字CH3がひらがなの“ほ”である場合を例示している。すなわち、図10では、文字画像CIに含まれる複数の文字のうち、“し”及び“ま”の2文字を文字認識装置10が“ほ”の1文字として認識した場合を想定している。この場合、例えば、図8及び図9に示した編集テーブルTBLにおいて、1行目の文字数(列の数)は、16文字であり、1行目の14列目の文字CRについての文字に関する情報は、“ほ”の文字CRを示す文字情報である。また、編集テーブルTBLにおいて、1行目の15列目の文字CRについての文字に関する情報は、“す”の文字CRを示す文字情報であり、1行目の16列目の文字CRについての文字に関する情報は、“。”の文字CRを示す文字情報である。
 また、図10に示す編集領域EDWにおいて、破線で囲まれた文字CRは、文字認識装置10による文字認識処理の結果(認識結果)の確度が第1の確度より高い文字CRである。従って、図10に示す編集領域EDWにおいて、破線で囲まれた文字CRに対しては、ユーザによる操作が制限されている。
 例えば、図10において上側に示した確認画面CHSでは、カーソルCSは、複数の文字CR(“携帯電話の番号を、下記に示ほす。”)のうちの、“ほ”の文字CRの位置に表示されている。この場合、カーソルCSにより選択された“ほ”の文字CRは、ユーザによる操作が制限された保護文字でないため、誤った文字CRを正しい文字に修正する修正操作をユーザが行った場合、正しい文字に修正される。例えば、ユーザは、カーソルCSにより選択された“ほ”の文字を、“し”及び“ま”の文字CRに修正する操作を実行する。これにより、複数の文字CRによる文字列の1行目は、正しい文字列(“携帯電話の番号を、下記に示します。”)に修正される。
 この場合、例えば、図8及び図9に示した編集テーブルTBLにおいて、修正前の1行目の15列目及び16列目のテキスト情報が、修正後の1行目の16列目及び17列目のテキスト情報になる。また、例えば、図8に示した編集テーブルTBLでは、1行目の14列目の文字CRについての文字に関する情報が“し”の文字CRを示す文字情報に更新され、1行目の15列目の文字CRについての文字に関する情報が“ま”の文字CRを示す文字情報に更新される。また、例えば、図9に示した編集テーブルTBLでは、1行目の14列目の編集文字に関する情報が“し”の文字CRを示す文字情報に更新され、1行目の15列目の編集文字に関する情報が“ま”の文字CRを示す文字情報に更新される。すなわち、編集テーブルTBLは、“文字位置”が示す番号が修正後の文字列の列番号に対応するように更新される。説明を図10に戻す。
 図10において下側に示した確認画面CHSでは、例えば、編集領域EDWに表示される複数の文字CRによる文字列の1行目は、正しい文字列である。なお、複数の文字CRによる文字列の2行目についても、図3において説明されたように、誤って認識された文字CRは、ユーザによる修正が制限された保護文字でないため、ユーザにより正しい文字に修正される。そして、例えば、ユーザは、複数の文字CRに対する修正が終了した場合、終了ボタンBTを選択(例えば、押下)することにより、複数の文字CRに対する確認及び修正に関する処理を終了させる。
 なお、端末装置20の動作は、図10に示した例に限定されない。例えば、複数の文字CRに対する確認及び修正に関する処理において正しい文字に修正された文字CRは、修正が制限される保護文字に新たに設定されてもよい。
 また、例えば、文字画像CIに含まれる複数の文字のうち、1つの文字を文字認識装置10が複数の文字として認識した場合(例えば、“記”の1文字を“言”及び“己”の2文字として認識した場合)も、端末装置20は、図10に示した動作と同様に動作する。この場合においても、図8及び図9に示した編集テーブルTBLは、“文字位置”が示す番号が修正後の文字列の列番号に対応するように、更新される。例えば、複数の文字CRのうちの削除された文字CRについてのテキスト情報は、編集テーブルTBLから削除されてもよいし、削除された文字CRについてのテキスト情報として、修正後の文字列の列番号に対応する領域とは別の領域に記憶されてもよい。また、図10では、各文字が日本語である場合を例示したが、本発明は各文字が日本語の場合に限定されるものではない。例えば、図10において、文字CH1、CH2及びCH3は、ローマ字であってもよい。具体的には、文字CH1がローマ字の“I”で、文字CH2がローマ字の“C”で、文字CH3がローマ字の“K”であってもよい。また、例えば、文字画像CIに含まれる複数の文字のうち、1つの文字が複数の文字として誤認識される場合のローマ字の例としては、“K”の1文字が“I”及び“C”の2文字として認識される場合等が該当する。
 次に、図11を参照しながら、文字認識システム1の動作の概要について説明する。
 図11は、図1に示した文字認識システム1の動作の一例を示すシーケンスチャートである。ステップS10及びS12の処理と、ステップS100からステップS720までの処理とは、端末装置20により実行される。また、ステップS20からステップS24までの処理は、文字認識装置10により実行される。図1から図10において説明された処理と同様の処理については、詳細な説明は省略される。なお、図11では、説明を分かり易くするために、入力画像IIMGのうちの予め決められた文字画像部分である文字画像CIが1つの場合を例にして、文字認識システム1の動作を説明する。
 先ず、ステップS10において、端末装置20は、入力画像IIMGを示す入力画像情報を、カメラ及びイメージスキャナ等の光学的な装置から取得する。
 次に、ステップS12において、端末装置20は、ステップS10において取得した入力画像情報を、ネットワークNWを介して、文字認識装置10に送信する。そして、端末装置20は、入力画像IIMGに対する文字認識処理の結果が文字認識装置10から送信されるまで、ステップS100以降の処理を待機する。従って、ステップS100の処理を説明する前に、文字認識装置10により実行されるステップS20等の処理を説明する。
 例えば、ステップS20において、文字認識装置10は、ステップS12において端末装置20から送信された入力画像情報を取得する。そして、ステップS22において、文字認識装置10は、ステップS10において取得した入力画像情報を用いて文字認識処理を実行する。これにより、例えば、文字認識部124は、入力画像情報により示される入力画像IIMGのうちの予め決められた文字画像部分である文字画像CIに含まれる複数の文字を認識する。次に、ステップS24において、文字認識装置10は、文字画像CIに対する文字認識処理の結果に関する認識情報と、文字画像CIを示す文字画像情報とを、ネットワークNWを介して、端末装置20に送信する。これにより、文字認識装置10による文字認識処理は終了する。また、入力画像IIMGに対する文字認識処理の結果が文字認識装置10から送信されたため、端末装置20は、ステップS100の処理を実行する。
 例えば、ステップS100において、端末装置20は、ステップS24において文字認識装置10から送信された認識情報及び文字画像情報を取得する。
 次に、ステップS200において、端末装置20は、ステップS100において取得した認識情報に含まれる確度情報に基づいて、保護文字を設定する。例えば、端末装置20は、認識情報に含まれる文字情報により示される複数の文字CRのうち、確度情報により示される確度が第1の確度より高い文字CRを、保護文字に設定する。
 次に、ステップS300において、端末装置20は、ステップS100において取得した認識情報及び文字画像情報に基づいて、確認画面CHSを表示装置30に表示させる。例えば、端末装置20(より詳細には、表示制御部224)は、文字情報及び文字画像情報に基づいて、文字画像CIと、文字画像CIから読み取られた複数の文字CRとを、表示装置30に表示させる。
 次に、ステップS400において、端末装置20は、ユーザ操作が行われたか否かを判定する。ステップS400における判定の結果が否定の場合、端末装置20は、処理をステップS400に戻す。一方、ステップS400における判定の結果が肯定の場合、端末装置20は、処理をステップS500に進める。
 ステップS500において、端末装置20は、ユーザ操作が終了操作であるか否かを判定する。終了操作は、例えば、終了ボタンBTを選択するユーザ操作である。ステップS500における判定の結果が肯定の場合、端末装置20は、確認画面CHSの表示を終了させて、文字認識処理の結果に対する確認及び修正に関する処理を終了する。一方、ステップS500における判定の結果が否定の場合、端末装置20は、処理をステップS600に進める。
 ステップS600において、端末装置20は、ユーザ操作が保護文字の修正操作であるか否かを判定する。保護文字の修正操作は、例えば、複数の文字CRのうちの保護文字を修正するための操作である。ステップS600における判定の結果が否定の場合、端末装置20は、ステップS700において、ユーザ操作に対応する処理を実行し、処理をステップS400に戻す。一方、ステップS600における判定の結果が肯定の場合、端末装置20は、処理をステップS720に進める。
 ステップS720において、端末装置20は、修正不可の旨を通知する。例えば、端末装置20は、保護文字に対する修正であることを示す情報を、表示装置30に表示させる。端末装置20は、ステップS720の処理を実行した後、処理をステップS400に戻す。
 なお、文字認識システム1の動作は、図10に示した例に限定されない。例えば、ステップS300の処理は、ステップS200の処理より先に実行されてもよいし、ステップS200の処理と並列に実行されてもよい。また、例えば、ステップS720の処理は、省かれてもよい。また、例えば、入力画像IIMGに複数の文字画像CIが含まれる場合、複数の文字画像CIの各々について、ステップS200からステップS720までの一連の処理が実行される。
 以上、本実施形態では、端末装置20は、取得部222、表示制御部224及び制限部226を有する。取得部222は、画像に含まれる文字を認識する文字認識処理により文字画像CIから読み取られた複数の文字CRを示す文字情報と複数の文字CRの各々についての認識結果の確度を示す確度情報とを含む認識情報を、取得する。表示制御部224は、文字情報により示される複数の文字CRを表示装置30に表示させる。制限部226は、確度情報により示される確度に基づいて、複数の文字CRのうち、認識結果の確度に関する条件が満たされた保護文字に対する操作を制限する。
 このように、本実施形態では、複数の文字CRのうち、認識結果の確度に関する条件が満たされた保護文字に対するユーザによる操作が制限される。これにより、本実施形態では、複数の文字CRのうちの文字認識の結果が正しい保護文字をユーザが誤って変更してしまう作業ミスの発生を抑制することができる。この結果、本実施形態では、文字認識の結果の確認及び修正を正確、かつ効率的に行うことが可能な端末装置20を提供することができる。
 また、本実施形態では、制限部226は、複数の文字CRのうち、確度情報により示される確度が第1の確度より高い文字CRを、保護文字として特定する。すなわち、本実施形態では、複数の文字CRのうち、認識結果の確度が第1の確度より高い文字CR(正しく認識されている確率が高い文字CR)に対するユーザによる操作が制限される。これにより、本実施形態では、複数の文字CRのうち、認識結果の確度が第1の確度より高い文字CRをユーザが誤って変更してしまう作業ミスの発生を抑制することができる。また、ユーザによる作業ミスは気が付かない恐れがあり、作業ミスを気が付かないまま放置すると、後工程に重大な悪影響を及ぼす可能性がある。本発明は、ユーザによる気が付かずに行った作業ミスを防止することができ、その結果、後工程への重大な悪影響をなくすことができる。
[2.変形例]
 本発明は、以上に例示した実施形態に限定されない。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を併合してもよい。
[第1変形例]
 上述した実施形態では、複数の文字CRのうち、認識結果の確度が第1の確度より高い文字CRに対するユーザによる操作が制限される場合を例示したが、本発明はこのような態様に限定されるものではない。例えば、図12に示すように、複数の文字CRが複数のグループG(Gx及びGy)に分けられる場合、認識結果の確度が第1の確度より高い文字CRのみを含むグループGについては、ユーザによる操作が制限されてもよいし、ユーザによる操作が制限されなくてもよい。
 図12は、第1変形例に係る端末装置20の動作の概要を説明するための説明図である。なお、図12では、説明を分かり易くするために、文字画像CIの全体が文字画像領域IWに表示され、複数の文字CRの全てが編集領域EDWに表示される場合を例示している。
 図12に示すように、文字画像CIは、複数の領域AR(ARx及びARy)に分けられる。なお、図12では、説明を分かり易くするために、文字画像領域IWにおいて領域ARを一点鎖線で示しているが、領域ARを示す一点鎖線は、文字画像領域IWに表示されてもよいし、表示されなくてもよい。
 また、複数の文字CRは、複数の領域AR(ARx及びARy)のいずれかから読み取られた文字CRであり、複数の領域AR(ARx及びARy)に対応する複数のグループG(Gx及びGy)のいずれかに属する。例えば、複数の文字CRのうち、“携帯電話の番号を、下記に示します。”の文字列の各文字CRは、領域ARxから読み取られた文字CRであり、領域ARxに対応するグループGxに属する。また、例えば、複数の文字CRのうち、“090-0ab1-1111”の文字列は、領域ARyから読み取られた文字CRであり、領域ARyに対応するグループGyに属する。グループGxは、複数の文字CRにおける1行目に対応し、グループGyは、複数の文字CRにおける2行目に対応する。
 ここで、図12に示す編集領域EDWにおいて、点線で囲まれた文字CR及び網掛けされた文字CRは、文字認識装置10による文字認識処理の結果(認識結果)の確度が第1の確度より高い文字CRである。さらに、認識結果の確度が第1の確度より高い文字CRのうち、網掛けされた文字CRは、修正が制限される保護文字である。図12に示す確認画面CHSでは、複数の文字CRのうち、保護文字は、保護文字以外の文字とは識別可能な態様(図12では網掛け)で表示されている。すなわち、表示制御部224は、複数の文字CRのうち、保護文字を、保護文字以外の文字CRとは識別可能な態様で表示装置30に表示させてもよい。この場合、修正が制限された文字CRをユーザが容易に視認することができる。
 図12に示す例では、複数のグループGx及びGyのうちのグループGxは、認識結果の確度が第1の確度より高い文字CRのみを含むグループGである。また、複数のグループGx及びGyのうちのグループGyは、認識結果の確度が第1の確度より高い文字CR、及び、認識結果の確度が第1の確度以下の文字CRを含むグループGである。なお、グループGyは、「第1グループ」の一例であり、グループGxは、「第2グループ」の一例である。
 例えば、グループGyは、認識結果の確度が第1の確度より高い文字CRと第1の確度以下の文字CRとが混在しているため、認識結果の確度が第1の確度より高い文字CRのみを含むグループGxに比べて、修正作業においてユーザにより選択される可能性が高い。このため、グループGyに属する全ての文字CRのうち、認識結果の確度が第1の確度より高い文字CRについては、ユーザによる操作が制限される。なお、認識結果の確度が第1の確度より高い文字CRと第1の確度以下の文字CRとが混在しているグループGyに属し、かつ、認識結果の確度が第1の確度より高いことは、「認識結果の確度に関する条件」の別の例である。
 例えば、制限部226は、複数のグループGx及びGyのうち、認識結果の確度が第1の確度より高い文字CR、及び、認識結果の確度が第1の確度以下の文字CRを含むグループGyを特定する。そして、制限部226は、グループGyに属する全ての文字CRのうち、認識結果の確度が第1の確度より高い文字CRを、保護文字として特定する。これにより、本変形例では、グループGyに属する文字CRの修正作業において、文字認識の結果が正しい文字CR(保護文字)をユーザが誤って変更してしまう作業ミスの発生を抑制することができる。
 また、グループGxは、認識結果の確度が第1の確度より高い文字CRのみを含むため、認識結果の確度が第1の確度より高い文字CRと第1の確度以下の文字CRとが混在しているグループGyに比べて、修正作業においてユーザにより選択される可能性が低い。すなわち、複数の文字CRの修正作業において、グループGxに属する文字CRを修正対象とする修正作業が行われる可能性は、グループGyに属する文字CRを修正対象とする修正作業が行われる可能性に比べて低い。このため、グループGxに属する文字CRは、修正が制限されなくても、誤って修正される可能性がグループGyに属する文字CRに比べて低い。従って、本変形例では、グループGxに属する全ての文字CRの修正は、制限されなくてもよい。
 なお、本変形例に係る端末装置20の動作は、図12に示した例に限定されない。例えば、複数の文字CRのうちの保護文字は、保護文字以外の文字CRから識別可能な態様で表示されなくてもよい。また、例えば、複数の文字CRのうち、認識結果の確度が第1の確度より高い文字CRが、認識結果の確度が第1の確度以下の文字CRから識別可能な態様で表示されてもよい。この場合、認識結果の確度が第1の確度より高い文字CRをユーザが容易に視認することができる。
 以上、本変形例においても、上述した実施形態と同様の効果を得ることができる。また、本変形例では、文字画像CIは、複数の領域ARに分けられ、複数の文字CRの各々は、複数の領域ARのいずれかから読み取られた文字CRであり、複数の領域ARに対応する複数のグループGのいずれかに属する。また、制限部226は、複数のグループGのうち、取得部222が取得した確度情報により示される確度が第1の確度より高い文字CR、及び、確度情報により示される確度が第1の確度以下の文字CRを含むグループG(第1グループ)を特定する。そして、制限部226は、確度情報により示される確度が第1の確度より高い文字CRと第1の確度以下の文字CRとを含むグループG(第1グループ)に属する全ての文字CRのうち、確度情報により示される確度が第1の確度より高い文字CRを、保護文字として特定する。
 これにより、本変形例では、認識結果の確度が第1の確度より高い文字CRと第1の確度以下の文字CRとを含むグループGyに属する文字CRの修正作業において、正しく認識された文字CR(保護文字)が誤って変更されることを抑制することができる。
 また、本変形例では、制限部226は、複数のグループGのうち、確度情報により示される確度が第1の確度より高い文字CRのみを含むグループG(第2グループ)を特定し、特定したグループGに属する全ての文字に対して、ユーザによる操作を制限しない。第1の確度よりも高い文字CRのみを含むグループGは、ユーザによる操作が行われる可能性が極めて低いことが期待され、グループG全体を保護文字にする必要性が少ない。これにより、本変形例では、第1の確度より高い文字CRのみを含むグループGに対しては保護文字としないことで、ユーザによる操作が制限される保護文字が必要以上に増加することを抑制することができるため、保護文字を設定する処理が煩雑になることを抑制することができる。
 また、本変形例では、表示制御部224は、複数の文字CRのうち、保護文字を、保護文字以外の文字CRから識別可能な態様で表示装置30に表示させる。これにより、本変形例では、修正が制限された文字CRをユーザが容易に視認することができる。
[第2変形例]
 上述した第1変形例では、グループGy(第1グループ)に属する全ての文字CRのうち、認識結果の確度が第1の確度より高い文字CRに対する操作が制限される場合を例示したが、本発明はこのような態様に限定されるものではない。例えば、図13に示すように、認識結果の確度が第1の確度より高い文字CRと第1の確度以下の文字CRとが混在しているグループGyに属する全ての文字CRについて、ユーザによる操作が制限されなくてもよい。
 図13は、第2変形例に係る端末装置20の動作の概要を説明するための説明図である。図13の一点鎖線、点線及び網掛けの意味は、図12の一点鎖線、点線及び網掛けの意味と同じである。例えば、図13において、複数の文字CRのうち、網掛けされた文字CRは、保護文字である。
 複数のグループGx及びGyのうちのグループGyは、認識結果の確度が第1の確度以下の文字CRを含むグループGである。なお、本変形例において、認識結果の確度が第1の確度以下の文字CRを含むグループG(例えば、グループGy)は、「第1グループ」の一例である。
 本変形例では、複数のグループGx及びGyのうち、認識結果の確度が第1の確度以下の文字CRを含むグループGyに属する全ての文字CRに対する操作は制限されない。すなわち、認識結果の確度が第1の確度以下の文字CRを含むグループGyでは、認識結果の確度に拘わらず、グループGyに属する全ての文字CRに対する操作が制限されない。これにより、ユーザは、例えば、認識結果の確度が第1の確度より高い文字CRと第1の確度以下の文字CRとが混在している文字列(例えば、図13のグループGyの“1111”)を、一括して、正しい文字列(例えば、“1171”)に修正できる。誤った文字CRを含む文字列をユーザが一括して修正する方が、誤った文字CRのみをユーザが修正する場合より、修正の作業効率が向上する場合がある。
 なお、複数のグループGx及びGyのうち、認識結果の確度が第1の確度より高い文字CRのみを含むグループGx(第2グループ)に属する全ての文字CRに対しては、ユーザによる操作が制限される。このため、本変形例では、認識結果の確度が第1の確度より高い文字CRのみを含むグループGxに属する文字CRをユーザが誤って変更してしまう作業ミスの発生を抑制することができる。なお、認識結果の確度が第1の確度より高い文字CRのみを含むグループGxに属することは、「認識結果の確度に関する条件」の別の例である。
 このように、本変形例では、複数の領域ARに対応する複数のグループGにおいて、文字CRの修正がグループG毎に制限される。
 以上、本変形例においても、上述した実施形態と同様の効果を得ることができる。また、本変形例では、制限部226は、複数のグループGのうち、取得部222が取得した確度情報により示される確度が第1の確度以下の文字CRを含むグループG(第1グループ)を特定し、特定したグループGに属する全ての文字に対する操作を制限しない。また、制限部226は、複数のグループGのうち、確度情報により示される確度が第1の確度より高い文字CRのみを含むグループG(第2グループ)を特定し、特定したグループGに属する全ての文字CRを保護文字として特定する。
 これにより、本変形例では、認識結果の確度が第1の確度以下の文字CRを含むグループGy(第1グループ)に属する文字列を修正する場合の作業効率が低下することを抑制することができる。また、本変形例では、認識結果の確度が第1の確度より高い文字CRのみを含むグループGx(第2グループ)に属する文字CR(保護文字)をユーザが誤って変更してしまう作業ミスの発生を抑制することができる。すなわち、本変形例では、文字認識処理により誤って認識された文字CRを含む文字列を修正する修正作業において、作業効率が低下することを抑制しつつ、修正の作業ミスが発生することを抑制することができる。
[第3変形例]
 上述した実施形態及び変形例では、入力画像IIMGに含まれる複数の文字画像CIの1つが1つの確認画面CHSに表示される場合を例示したが、本発明はこのような態様に限定されるものではない。例えば、入力画像IIMGに含まれる複数の文字画像CIの全てが1つの確認画面CHSに表示されてもよい。
 図14は、第3変形例に係る確認画面CHSの一例を示す図である。図14の一点鎖線、点線及び網掛けの意味は、図12の一点鎖線、点線及び網掛けの意味と同じである。
 図14に示すように、確認画面CHSには、例えば、入力画像IIMGに含まれる複数の文字画像CIに対応する複数の文字画像領域IWと、1つの編集領域EDWとが表示される。複数の文字画像領域IWの各々には、複数の文字画像CIのうちの対応する文字画像CIの全体が表示される。
 なお、図14に示す例では、複数の文字画像CIを含む画像(例えば、入力画像IIMG)は、「読取対象画像」の別の例である。例えば、図14では、入力画像IIMGは、申込書の複数の項目に対応する複数の領域AR(ARa、ARb及びARc等)として複数の文字画像CIに分けられる。従って、複数の文字画像CIの各々は、「領域」の一例である。また、入力画像IIMGから読み取られた複数の文字CRの各々は、複数の文字画像CIのいずれかから読み取られた文字CRであり、複数の文字画像CI(複数の領域AR)に対応する複数のグループG(Ga、Gb及びGc等)のいずれかに属する。複数のグループGの各々の符号の末尾には、対応する領域ARの符号の末尾に付された小文字のアルファベットと同じ小文字のアルファベットが付されている。例えば、グループGaに属する複数の文字CRは、入力画像IIMGのうちの領域ARa(申込番号に対応する文字画像CI)から読み取られた文字CRである。
 編集領域EDWには、複数の文字画像CIの各々から読み取られた複数の文字CRが表示される。編集領域EDWにおいて、複数の文字CRは、対応する文字画像CIの確認画面CHSにおける表示位置に合わせて、表示される。例えば、確認画面CHSにおいて、複数の文字画像CIは、申込番号、氏名(カナ)、氏名、郵便番号、住所、E-mail、勤務先、勤務先電話番号及び備考の順に表示される。このため、編集領域EDWにおいて、複数の文字CRは、申込番号、氏名(カナ)、氏名、郵便番号、住所、E-mail、勤務先、勤務先電話番号及び備考の順に表示される。具体的には、例えば、確認画面CHSにおいて一番上に表示される文字画像CI(申込番号に対応する文字画像CI)から読み取られた全ての文字CR(“180-3588”)は、編集領域EDWにおいて、1行目に表示される。
 図14に示す例では、認識結果の確度が第1の確度以下の文字CRを含むグループG(Gb、Gc、Gf及びGi)に属する全ての文字に対する操作は制限されない。また、認識結果の確度が第1の確度より高い文字CRのみを含むグループG(Ga、Gd、Ge、Gg及びGh)に属する全ての文字CRについての操作は制限される。このように、図14に示す例では、入力画像IIMGに含まれる複数の文字画像CIに対応する複数のグループGにおいて、文字CRの修正がグループG毎に制限される。すなわち、図14に示す例では、図2に示した申込書において、項目の記入欄EC毎に、文字CRの修正が制限される。
 なお、図14に示す例においても、ユーザによる文字CRに対する操作の制限は、上述の例に限定されない。例えば、グループGb、Gc、Gf及びGiの各々に属する複数の文字CRのうち、認識結果の確度が第1の確度より高い文字CRについては、ユーザによる操作が制限されてもよい。この場合、グループGa、Gd、Ge、Gg及びGhの各々に属する全ての文字CRについては、ユーザによる操作が制限されてもよいし、ユーザによる操作が制限されなくてもよい。また、図14に示す例においても、文字画像CIが複数の領域ARに分けられてもよい。
 また、図14では、入力画像IIMGに含まれる複数の文字画像CIの各々が複数の文字画像領域IWのうちの対応する文字画像領域IWに表示される場合を例示したが、本変形例はこのような態様に限定されるものではない。例えば、入力画像IIMGに含まれる複数の文字画像CIの全てが、1つの文字画像領域IWに表示されてもよい。
 以上、本変形例においても、上述した実施形態及び変形例と同様の効果を得ることができる。また、本変形例では、入力画像IIMGに含まれる複数の文字画像CIが1つの確認画面CHSに表示されるため、複数の文字画像CIから読み取られた複数の文字CRの確認及び修正の作業が煩雑になることを抑制することができる。
[第4変形例]
 上述した第3変形例において、入力画像IIMGに含まれる複数の文字画像CIに対応する複数の文字画像領域IWと、複数の文字画像領域IWに対応する複数の編集領域EDWとが確認画面CHSに表示されてもよい。
 図15は、第4変形例に係る確認画面CHSの一例を示す図である。図15の一点鎖線、点線及び網掛けの意味は、図12の一点鎖線、点線及び網掛けの意味と同じである。
 図15に示すように、確認画面CHSには、例えば、入力画像IIMGに含まれる複数の文字画像CIに対応する複数の文字画像領域IWと、複数の文字画像領域IWに対応する複数の編集領域EDWとが表示される。図15に示す確認画面CHSは、複数の編集領域EDWが表示される点を除いて、図14に示した確認画面CHSと同様である。
 例えば、複数の編集領域EDWの各々には、複数の文字画像領域IWのうちの対応する文字画像領域IWに表示された文字画像CIから読み取られた複数の文字CRが、表示される。
 また、本変形例では、確認画面CHSにおいて、互いに対応する編集領域EDW及び文字画像領域IWは、互いに隣接するように配置される。これにより、本変形例では、複数の文字CRと複数の文字部分との項目毎の比較をユーザが容易に行うことができる。なお、複数の項目は、図2において説明されたように、例えば、申込番号、氏名(カナ)、氏名、郵便番号、住所、E-mail、勤務先、勤務先電話番号及び備考等である。
 以上、本変形例においても、上述した実施形態及び変形例と同様の効果を得ることができる。なお、上述した第1変形例から第4変形例において、複数の文字CRは、言葉の意味の単位となる文字列又は文章単位をグループGとして、複数のグループGに分けられてもよい。例えば、複数の文字CRは、文字認識処理により、単語、文節及び文章のうちの少なくとも1つに基づいて複数のグループGに分けられてもよい。あるいは、制限部226が、複数の文字CRによる文字列を解析し、解析結果に基づいて複数の文字CRを言葉の意味の単位となる文字列又は文章単位で区切ることにより、複数の文字CRを複数のグループGに分けてもよい。すなわち、制限部226は、複数の文字CRを、単語、文節及び文章のうちの少なくとも1つに基づいて、複数のグループGに分けてもよい。
[第5変形例]
 上述した実施形態及び変形例において、制限部226は、保護文字に対する操作の制限の度合いを、認識結果の確度に応じて変更してもよい。
 図16は、第5変形例に係る端末装置20の動作の一例を示すフローチャートである。なお、図16は、入力画像IIMGに対する文字認識処理の結果が文字認識装置10から送信された後の端末装置20の動作を示している。入力画像IIMGに対する文字認識処理の結果が文字認識装置10から送信されるまでの端末装置20の動作及び文字認識装置10の動作は、上述した図11に示した動作(ステップS10、S12、S20、S22及びS24)と同様である。図1から図15において説明された処理と同様の処理については、詳細な説明は省略される。
 ステップS100からステップS700までの一連の処理は、図11に示したステップS100からステップS700までの一連の処理と同様である。但し、図16に示す動作では、ステップS600における判定の結果が肯定の場合、端末装置20は、処理をステップS710に進める。
 ステップS710において、端末装置20は、修正操作の対象となった保護文字の確度が第2の確度より高いか否かを判定する。なお、第2の確度は、第1の確度より高い。換言すれば、第1の確度は、第2の確度より低い。第2の確度は、第1の確度と同様に、文字認識装置10の管理者及び端末装置20のユーザ等により決定されてもよいし、文字認識装置10により自動的に設定されてもよい。
 ステップS710における判定の結果が肯定の場合、端末装置20は、ステップS720において修正不可の旨を通知し、処理をステップS400に戻す。一方、ステップS710における判定の結果が否定の場合、端末装置20は、処理をステップS712に進める。
 ステップS712において、端末装置20は、修正操作の対象となった保護文字に対する修正を実行するか否かを判定する。例えば、端末装置20は、修正操作の対象となった保護文字に対する修正を継続するか修正操作を取り消すかを選択するためのGUI用の画像を、表示装置30に表示させる。そして、端末装置20は、保護文字に対する修正の継続がユーザにより選択された場合、保護文字に対する修正を実行すると判定する。一方、端末装置20は、修正操作の取り消しがユーザにより選択された場合、保護文字に対する修正を実行しないと判定する。なお、保護文字に対する修正を継続するための操作(例えば、GUI用の画像において、保護文字に対する修正の継続を選択する操作)は、「所定の操作」の一例である。
 ステップS712における判定の結果が否定の場合、端末装置20は、修正操作の対象となった保護文字を修正せずに、処理をステップS400に戻す。一方、ステップS712における判定の結果が肯定の場合、端末装置20は、処理をステップS714に進める。
 ステップS714において、端末装置20は、修正操作の対象となった保護文字を、修正操作に基づいて修正する。そして、端末装置20は、処理をステップS400に戻す。
 このように、本変形例では、保護文字に対する操作の制限の度合いが、認識結果の確度に応じて変更される。具体的には、認識結果の確度が第2の確度より高い保護文字に対しては、保護文字に対する操作の内容が反映されないように制限される。また、認識結果の確度が第2の確度以下で第1の確度より高い保護文字に対しては、ユーザにより所定の操作が行われた場合、保護文字に対する操作は制限されない。換言すれば、認識結果の確度が第2の確度以下で第1の確度より高い保護文字に対しては、ユーザにより所定の操作が行われなかった場合、保護文字に対する操作が反映されないように制限される。
 なお、本変形例に係る端末装置20の動作は、図16に示した例に限定されない。例えば、端末装置20は、ステップS712の処理の代わりに、制限解除に関する処理を実行してもよい。
 制限解除に関する処理では、先ず、端末装置20は、修正操作の対象となった保護文字に対する操作の制限を解除するか否かを判定する。例えば、端末装置20は、修正操作の対象となった保護文字に対する操作の制限を解除するか修正操作を取り消すかを選択するためのGUI用の画像を、表示装置30に表示させる。そして、端末装置20は、保護文字に対する操作の制限の解除がユーザにより選択された場合、保護文字に対する操作の制限を解除すると判定し、修正操作の対象となった保護文字に対する操作の制限を解除する。保護文字に対する操作の制限が解除された後、ステップS714の処理が実行される。一方、端末装置20は、修正操作の取り消しがユーザにより選択された場合、保護文字に対する操作の制限を解除しないと判定し、修正操作の対象となった保護文字を修正せずに、処理をステップS400に戻す。なお、保護文字に対する操作の制限を解除するための操作(例えば、GUI用の画像において、保護文字に対する操作の制限の解除を選択する操作)は、「所定の操作」の別の例である。
 以上、本変形例においても、上述した実施形態及び変形例と同様の効果を得ることができる。また、本変形例では、制限部226は、保護文字に対する操作の制限の度合いを、取得部222が取得した確度情報により示される確度に応じて変更する。これにより、本変形例では、誤って認識された文字CRの修正ができなくなることを抑制しつつ、正しく認識された文字CRに対する操作が制限されなくなることを抑制することができる。
 また、本変形例では、制限部226は、保護文字において、確度情報により示される確度が第2の確度より高い文字CRに対しては、保護文字に対する操作の内容が反映されないように制限する。また、制限部226は、保護文字において、確度情報により示される確度が第2の確度以下の文字CRに対しては、ユーザにより所定の操作が行われた場合に、保護文字に対する操作を制限せず、ユーザにより所定の操作が行われなかった場合に、保護文字に対する操作の内容が反映されないように制限する。これにより、本変形例では、認識結果の確度が第2の確度以下で第1の確度より高い保護文字の認識結果が誤っていた場合に、認識結果が誤っている保護文字の修正ができなくなることを抑制することができる。
[第6変形例]
 上述した実施形態及び変形例では、保護文字の設定が端末装置20で実行される場合を例示したが、本発明はこのような態様に限定されるものではない。例えば、図6に示した制限部226は、文字認識装置10に含まれてもよい。
 図17は、第6変形例に係る文字認識システム1の概要を説明するための説明図である。図17に示す文字認識システム1は、図1に示した文字認識装置10及び端末装置20の代わりに文字認識装置10A及び端末装置20Aを有することを除いて、図1に示した文字認識システム1と同様である。
 文字認識装置10Aは、文字認識装置10Aの各部を制御する制御部120と、各種情報を記憶する記憶部140と、端末装置20A等の外部装置との間の通信を実行するための通信部160とを有する。すなわち、文字認識装置10Aは、図4に示した文字認識装置10と同様である。但し、文字認識装置10Aでは、制御プログラムPG1の代わりに制御プログラムPG1aを制御部120が実行する点が、文字認識装置10と相違する。このため、記憶部140は、制御プログラムPG1の代わりに制御プログラムPG1aを記憶する。なお、文字認識装置10Aは、「情報処理装置」の別の例であり、制御プログラムPG1aは、「プログラム」の別の例である。
 本変形例では、制御プログラムPG1aは、例えば、文字認識処理及び文字認識処理の結果の修正等を支援する修正支援処理を文字認識装置10Aが実行するためのアプリケーションプログラムを含む。但し、制御プログラムPG1aは、例えば、制御部120が文字認識装置10Aの各部を制御するためのオペレーティングシステムプログラムを含んでもよい。
 制御部120は、例えば、画像情報取得部122、文字認識部124、表示制御部224a及び制限部226を有する。このように、制御部120は、表示制御部224a及び制限部226を有することを除いて、図4に示した制御部120と同様である。なお、制限部226は、図6に示した制限部226と同様である。このため、制限部226については、説明を省略する。
 表示制御部224aは、確認画面CHSを表示装置30の表示部310において表示させるための表示情報を生成し、生成した表示情報を、通信部160を介して端末装置20Aに送信する。例えば、端末装置20Aは、文字認識装置10Aから受信した表示情報により示される確認画面CHSを表示装置30の表示部310に表示する。このように、表示制御部224aは、例えば、確認画面CHSを示す表示情報を端末装置20Aに送信することにより、文字認識部124により認識された複数の文字CRを表示装置30に表示させる。
 端末装置20Aは、端末装置20Aの各部を制御する制御部220と、各種情報を記憶する記憶部240と、文字認識装置10A等の外部装置との間の通信を実行するための通信部260と、端末装置20Aのユーザによる操作を受け付けるための操作部280とを有する。すなわち、端末装置20Aは、図6に示した端末装置20と同様である。但し、端末装置20Aでは、制御プログラムPG2の代わりに制御プログラムPG2aを制御部220が実行する点が、端末装置20と相違する。このため、記憶部140は、制御プログラムPG2の代わりに制御プログラムPG2aを記憶する。
 制御部220は、例えば、取得部222を有する。このように、制御部220は、図64に示した制御部220から表示制御部224及び制限部226が省かれることを除いて、図6に示した制御部220と同様である。
 なお、本変形例では、例えば、取得部222は、操作部280が受け付けた操作の内容を示す操作情報を、通信部260を介して文字認識装置10Aに送信してもよい。操作情報を文字認識装置10Aに送信する機能は、例えば、取得部222とは別の機能ブロックにより実現されてもよい。文字認識装置10Aは、端末装置20Aから受信した操作情報に基づいて、確認画面CHSを表示装置30の表示部310において表示させるための表示情報等を生成する。
 図17に示す文字認識システム1の動作では、例えば、文字認識装置10Aは、図11に示したステップS20及びS22の処理を実行した後に、図11又は図16に示したステップS200からステップS720の一連の処理を実行する。但し、確認画面CHS等を表示装置30に表示させる処理(例えば、ステップS300の処理等)では、文字認識装置10Aは、表示装置30に表示させる確認画面CHS等を示す表示情報を端末装置20Aに送信する。また、操作部280が受け付けた操作の内容に基づく処理(例えば、ステップS400の処理等)は、端末装置20Aから受信した操作情報に基づいて実行される。
 また、図17に示す文字認識システム1の動作では、例えば、端末装置20Aは、図11に示したステップS10及びS12の処理を実行した後に、文字認識装置10Aから受信した表示情報により示される確認画面CHSを表示装置30の表示部310に表示する。また、端末装置20Aは、操作部280がユーザによる操作を受け付けた場合、操作部280が受け付けた操作の内容を示す操作情報を文字認識装置10Aに送信する。
 ここで、文字認識装置10Aのハードウェア構成は、図5に示した文字認識装置10と同様である。例えば、制御プログラムPG1aに含まれるアプリケーションプログラムに従って動作するプロセッサ12は、画像情報取得部122、文字認識部124、表示制御部224a及び制限部226を含む制御部120として機能する。制御プログラムPG1aは、他の装置から送信されてもよい。また、端末装置20Aのハードウェア構成は、図7に示した端末装置20と同様である。例えば、制御プログラムPG2aに含まれるアプリケーションプログラムに従って動作するプロセッサ22は、取得部222を含む制御部220として機能する。制御プログラムPG2aは、他の装置から送信されてもよい。
 なお、文字認識装置10A及び端末装置20Aの構成は、図17に示した例に限定されない。例えば、文字認識装置10Aは、文字認識装置10Aの管理者等による操作を受け付けるための操作部として機能する操作装置(例えば、後述する図19に示す操作装置18)を有してもよい。また、端末装置20Aは、入力画像IIMGをデジタル信号である入力画像情報に変換するためのカメラ及びイメージスキャナ等の光学的な装置を有してもよい。あるいは、端末装置20Aは、表示装置30を有してもよい。以上、本変形例においても、上述した実施形態及び変形例と同様の効果を得ることができる。
[第7変形例]
 上述した実施形態及び変形例では、文字認識装置10と端末装置20とが互いに別体である場合を例示したが、本発明はこのような態様に限定されるものではない。例えば、文字認識装置10と端末装置20とは、一体として構成されてもよい。
 図18は、第7変形例に係る文字認識装置10Bの構成の一例を示す機能ブロック図である。
 文字認識装置10Bは、文字認識装置10Bの各部を制御する制御部120と、各種情報を記憶する記憶部140と、文字認識装置10Bの外部に存在する外部装置との間の通信を実行するための通信部160と、操作部180と、撮像部190とを有する。このように、文字認識装置10Bは、操作部180及び撮像部190を有することを除いて、図4に示した文字認識装置10と同様である。但し、文字認識装置10Bでは、制御プログラムPG1の代わりに制御プログラムPG1bを制御部120が実行する点が、文字認識装置10と相違する。このため、記憶部140は、制御プログラムPG1の代わりに制御プログラムPG1bを記憶する。なお、文字認識装置10Bは、「情報処理装置」の別の例であり、制御プログラムPG1bは、「プログラム」の別の例である。
 本変形例では、制御プログラムPG1bは、例えば、文字認識処理及び文字認識処理の結果の修正等を支援する修正支援処理を文字認識装置10Bが実行するためのアプリケーションプログラムを含む。但し、制御プログラムPG1bは、例えば、制御部120が文字認識装置10Bの各部を制御するためのオペレーティングシステムプログラムを含んでもよい。
 制御部120は、例えば、画像情報取得部122、文字認識部124、表示制御部224及び制限部226を有する。画像情報取得部122及び文字認識部124は、図4に示した画像情報取得部122及び文字認識部124と同様である。また、表示制御部224及び制限部226は、図6に示した表示制御部224及び制限部226と同様である。
 操作部180は、ユーザ等による操作を受け付ける。撮像部190は、被写体を撮像し、撮像した被写体の画像を示す画像情報を出力する。例えば、撮像部190は、申込書等を撮像し、撮像した申込書の画像である入力画像IIMGを入力画像情報に変換してもよい。そして、撮像部190は、入力画像IIMGを示す入力画像情報を記憶部140等に記憶させてもよい。この場合、画像情報取得部122は、例えば、記憶部140から、文字認識処理の対象となる入力画像IIMGを示す入力画像情報を取得してもよい。あるいは、画像情報取得部122は、記憶部140を介さずに、入力画像情報を撮像部190から取得してもよい。あるいは、画像情報取得部122は、文字認識装置10Bの外部に存在する外部装置から入力画像情報を取得してもよい。
 文字認識装置10Bの動作では、例えば、図11に示したステップS20及びS22の処理が実行された後に、図11又は図16に示したステップS200からステップS720の一連の処理が実行される。すなわち、文字認識装置10Bの動作は、図11に示した文字認識システム1の動作からステップS10、S12、S24及びS100の一連の処理が省かれることを除いて、図11に示した文字認識システム1の動作と同様である。例えば、画像情報取得部122は、図11に示したステップS20において、撮像部190、記憶部140又は外部装置から、文字認識処理の対象となる入力画像IIMGを示す入力画像情報を取得する。そして、文字認識部124は、図11に示したステップS22において、入力画像情報(ステップS20で取得された入力画像情報)を用いて文字認識処理を実行する。次に、制限部226は、図11に示したステップS200において、文字認識部124による文字認識処理(ステップS22の文字認識処理)の結果の確度等に基づいて保護文字を設定する。そして、表示制御部224は、図11に示したステップS300において、文字認識部124による文字認識処理(ステップS22の文字認識処理)の結果を確認する確認画面CHSを表示装置30に表示させる。
 次に、図19を参照しながら、文字認識装置10Bのハードウェア構成について説明する。
 図19は、図18に示した文字認識装置10Bのハードウェア構成の一例を示す図である。
 文字認識装置10Bは、文字認識装置10Bの各部を制御するプロセッサ12と、各種情報を記憶するメモリ14と、通信装置16と、操作装置18と、撮像装置19とを有する。このように、文字認識装置10Bは、操作装置18及び撮像装置19を有することを除いて、図5に示した文字認識装置10と同様である。なお、制御プログラムPG1bに含まれるアプリケーションプログラムに従って動作するプロセッサ12は、例えば、画像情報取得部122、文字認識部124、表示制御部224及び制限部226を含む制御部120として機能する。制御プログラムPG1bは、他の装置から送信されてもよい。
 操作装置18は、ユーザ等による操作を受け付けるためのハードウェアであり、操作部180として機能する。例えば、操作装置18は、図7に示した操作装置28と同様に構成される。撮像装置19は、カメラ及びイメージスキャナ等の光学的な装置であり、撮像部190として機能する。例えば、撮像装置19は、被写体を撮像し、撮像した被写体の画像を示す画像情報を出力する。撮像装置19は、例えば、撮像光学系及び撮像素子を有する。撮像光学系は、少なくとも1つの撮像レンズを含む光学系である。例えば、撮像光学系は、ズームレンズやフォーカスレンズ等を有してもよい。撮像素子は、例えば、CCD(Charge Coupled Device)イメージセンサー又はCMOS(Complementary MOS)イメージセンサー等である。
 なお、文字認識装置10Bの構成は、図18及び図19に示した例に限定されない。例えば、文字認識装置10Bは、表示装置30を有してもよい。また、文字認識装置10Bは、撮像装置19を含まなくてもよい。また、表示装置30は、ネットワークNWを介して文字認識装置10Bと通信可能に接続されるシンクライアント端末等の端末装置に含まれてもよいし、シンクライアント端末等の端末装置と通信可能に接続されてもよい。
 以上、本変形例においても、上述した実施形態及び変形例と同様の効果を得ることができる。
[第8変形例]
 上述した実施形態及び変形例において、文字認識装置10、10A又は10Bは、文字認識処理の結果に対する修正の内容を学習してもよい。以上、本変形例においても、上述した実施形態及び変形例と同様の効果を得ることができる。
[第9変形例]
 なお、上述した実施形態及び変形例において、確度の高い文字CRを保護文字として設定した場合、ユーザによる段階的な操作により保護文字に対する操作を許可するようにしてもよい。例えば、制限部226が確度の高い文字CRを保護文字として設定した場合であっても、文字認識装置10、10A又は10Bの認識精度が100%ではないため、保護文字として設定された文字CRの認識結果が間違っていることがある。また、保護文字に対してユーザが意図的に修正や変更を加えたい場合も想定される。このため、例えば、ユーザによる第1操作として、保護文字を削除する操作が行われ、その後で、ユーザによる第2操作として、保護文字を変更(修正)する操作が行われることで、第1操作による保護文字の削除と第2操作による保護文字の変更(修正)とが確定してもよい。すなわち、ユーザが第1操作を行っただけでは、操作対象の保護文字の削除は仮決め状態であり、その後、ユーザの第2操作が行われない場合、先に行われた第1操作は取り消しとなり、保護文字を削除する操作(第1操作)は確定しない。
 このように、本変形例では、文字認識装置10は、保護文字に対する安易な操作を制限しつつ、保護文字の必要な修正や変更を行えるようにすることができる。
 1…文字認識システム、10、10A、10B…文字認識装置、12…プロセッサ、14…メモリ、16…通信装置、18…操作装置、19…撮像装置、20…端末装置、22…プロセッサ、24…メモリ、26…通信装置、28…操作装置、30…表示装置、120…制御部、122…画像情報取得部、124…文字認識部、140…記憶部、160…通信部、180…操作部、190…撮像部、220…制御部、222…取得部、224、224a…表示制御部、226…制限部、240…記憶部、260…通信部、280…操作部、310…表示部、AR…領域、CI…文字画像、CR…文字、G…グループ、IIMG…入力画像、NW…ネットワーク。

Claims (11)

  1.  画像に含まれる文字を認識する文字認識処理により読取対象画像から読み取られた複数の文字を示す文字情報と前記複数の文字の各々についての認識結果の確度を示す確度情報とを含む認識情報を、取得する取得部と、
     前記文字情報により示される前記複数の文字を表示装置に表示させる表示制御部と、
     前記確度情報により示される確度に基づいて、前記複数の文字のうち、前記認識結果の確度に関する条件が満たされた保護文字に対する操作を制限する制限部と、
     を備える、
     情報処理装置。
  2.  前記制限部は、
     前記複数の文字のうち、前記確度情報により示される確度が第1の確度より高い文字を、前記保護文字として特定する、
     請求項1に記載の情報処理装置。
  3.  前記読取対象画像は、複数の領域に分けられ、
     前記複数の文字の各々は、前記複数の領域のいずれかから読み取られた文字であり、前記複数の領域に対応する複数のグループのいずれかに属し、
     前記制限部は、
     前記複数のグループのうち、前記確度情報により示される確度が第1の確度より高い文字、及び、前記確度情報により示される確度が前記第1の確度以下の文字を含む第1グループを特定し、前記第1グループに属する全ての文字のうち、前記確度情報により示される確度が前記第1の確度より高い文字を、前記保護文字として特定する、
     請求項1に記載の情報処理装置。
  4.  前記制限部は、
     前記複数のグループのうち、前記確度情報により示される確度が前記第1の確度より高い文字のみを含む第2グループを特定し、前記第2グループに属する全ての文字に対する操作を制限しない、
     請求項3に記載の情報処理装置。
  5.  前記読取対象画像は、複数の領域に分けられ、
     前記複数の文字の各々は、前記複数の領域のいずれかから読み取られた文字であり、前記複数の領域に対応する複数のグループのいずれかに属し、
     前記制限部は、
     前記複数のグループのうち、前記確度情報により示される確度が第1の確度以下の文字を含む第1グループを特定し、前記第1グループに属する全ての文字に対する操作を制限せず、
     前記複数のグループのうち、前記確度情報により示される確度が前記第1の確度より高い文字のみを含む第2グループを特定し、前記第2グループに属する全ての文字を前記保護文字として特定する、
     請求項1に記載の情報処理装置。
  6.  前記制限部は、
     前記保護文字に対する操作の制限の度合いを、前記確度情報により示される確度に応じて変更する、
     請求項1乃至5のいずれか1項に記載の情報処理装置。
  7.  前記第1の確度は、第2の確度より低く、
     前記制限部は、
     前記保護文字において、前記確度情報により示される確度が前記第2の確度より高い文字に対しては、前記保護文字に対する操作の内容が反映されないように制限し、
     前記保護文字において、前記確度情報により示される確度が前記第2の確度以下の文字に対しては、ユーザにより所定の操作が行われた場合に、前記保護文字に対する操作を制限せず、前記ユーザにより前記所定の操作が行われなかった場合に、前記保護文字に対する操作の内容が反映されないように制限する、
     請求項2乃至5のいずれか1項に記載の情報処理装置。
  8.  前記表示制御部は、
     前記複数の文字のうち、前記保護文字を、前記保護文字以外の文字から識別可能な態様で前記表示装置に表示させる、
     請求項1乃至7のいずれか1項に記載の情報処理装置。
  9.  画像を示す画像情報を取得する画像情報取得部と、
     前記画像情報により示される前記画像に含まれる複数の文字を認識し、前記複数の文字の各々について、認識結果の確度を算出する文字認識部と、
     前記文字認識部により認識された前記複数の文字を表示装置に表示させる表示制御部と、
     前記文字認識部により算出された確度に基づいて、前記複数の文字のうち、前記認識結果の確度に関する条件が満たされた保護文字に対する操作を制限する制限部と、
     を備える、
     情報処理装置。
  10.  プロセッサを、
     画像に含まれる文字を認識する文字認識処理により読取対象画像から読み取られた複数の文字を示す文字情報と前記複数の文字の各々についての認識結果の確度を示す確度情報とを含む認識情報を、取得する取得部と、
     前記文字情報により示される前記複数の文字を表示装置に表示させる表示制御部と、
     前記確度情報により示される確度に基づいて、前記複数の文字のうち、前記認識結果の確度に関する条件が満たされた保護文字に対する操作を制限する制限部と、
     として機能させる、
     プログラム。
  11.  プロセッサを、
     画像を示す画像情報を取得する画像情報取得部と、
     前記画像情報により示される前記画像に含まれる複数の文字を認識し、前記複数の文字の各々について、認識結果の確度を算出する文字認識部と、
     前記文字認識部により認識された前記複数の文字を表示装置に表示させる表示制御部と、
     前記文字認識部により算出された確度に基づいて、前記複数の文字のうち、前記認識結果の確度に関する条件が満たされた保護文字に対する操作を制限する制限部と、
     として機能させる、
     プログラム。
PCT/JP2022/025072 2021-06-25 2022-06-23 情報処理装置及びプログラム WO2022270575A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021-105617 2021-06-25
JP2021105617A JP2023004111A (ja) 2021-06-25 2021-06-25 情報処理装置及びプログラム

Publications (1)

Publication Number Publication Date
WO2022270575A1 true WO2022270575A1 (ja) 2022-12-29

Family

ID=84544393

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/025072 WO2022270575A1 (ja) 2021-06-25 2022-06-23 情報処理装置及びプログラム

Country Status (2)

Country Link
JP (1) JP2023004111A (ja)
WO (1) WO2022270575A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006099213A (ja) * 2004-09-28 2006-04-13 Mitsubishi Electric Information Systems Corp 文字認識支援システム及びプログラム
JP2014194694A (ja) * 2013-03-29 2014-10-09 Fujitsu Ltd 文字入力支援プログラムおよび文字入力支援装置
JP5661214B1 (ja) * 2014-09-02 2015-01-28 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
JP6462930B1 (ja) * 2018-03-28 2019-01-30 AI inside株式会社 文字認識装置、方法およびプログラム
JP2021064123A (ja) * 2019-10-11 2021-04-22 キヤノン株式会社 データ入力支援システム、データ入力支援方法、及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006099213A (ja) * 2004-09-28 2006-04-13 Mitsubishi Electric Information Systems Corp 文字認識支援システム及びプログラム
JP2014194694A (ja) * 2013-03-29 2014-10-09 Fujitsu Ltd 文字入力支援プログラムおよび文字入力支援装置
JP5661214B1 (ja) * 2014-09-02 2015-01-28 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
JP6462930B1 (ja) * 2018-03-28 2019-01-30 AI inside株式会社 文字認識装置、方法およびプログラム
JP2021064123A (ja) * 2019-10-11 2021-04-22 キヤノン株式会社 データ入力支援システム、データ入力支援方法、及びプログラム

Also Published As

Publication number Publication date
JP2023004111A (ja) 2023-01-17

Similar Documents

Publication Publication Date Title
US9589198B2 (en) Camera based method for text input and keyword detection
US6466694B2 (en) Document image processing device and method thereof
US7839541B2 (en) Image editing system and method therefor
US8897594B2 (en) Image reader, mobile terminal apparatus, and non-transitory computer readable medium
US11836442B2 (en) Information processing apparatus, method, and storage medium for associating metadata with image data
US8577826B2 (en) Automated document separation
WO2022270575A1 (ja) 情報処理装置及びプログラム
CN113935348A (zh) 一种二维码扫描方法、装置及电子设备
US20210279460A1 (en) Information processing system, information processing method, and non-transitory recording medium
JP4597644B2 (ja) 文字認識装置、プログラムおよび記録媒体
CN113449732A (zh) 信息处理装置、图像读取装置、记录介质、信息处理方法
JP4698308B2 (ja) 文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体
JP2023004108A (ja) 情報処理装置及びプログラム
JP2022010994A (ja) データ入力支援装置、データ入力支援方法及びプログラム
JP7271889B2 (ja) 情報処理装置及びプログラム
JP3930466B2 (ja) 文字認識装置、文字認識プログラム
JP4633773B2 (ja) 文書画像処理装置および方法
JPS5848180A (ja) 文字判定処理方式
JP2001067434A (ja) 文字修正装置および文字修正方法
JPH10171917A (ja) 文字認識装置、その文字認識方法およびその記録媒体
JPH1185899A (ja) 文字読み取り装置、その読み取り方法および記録媒体
JP4589370B2 (ja) 文書画像処理装置および方法
US20050108635A1 (en) Document processing apparatus and storage medium
JP2024081434A (ja) 計算機システム及びグラフ認識方法
JP2023102136A (ja) 情報処理装置、情報処理方法、及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22828491

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 22828491

Country of ref document: EP

Kind code of ref document: A1