WO2022202064A1 - 情報処理装置および情報入力システム - Google Patents

情報処理装置および情報入力システム Download PDF

Info

Publication number
WO2022202064A1
WO2022202064A1 PCT/JP2022/007306 JP2022007306W WO2022202064A1 WO 2022202064 A1 WO2022202064 A1 WO 2022202064A1 JP 2022007306 W JP2022007306 W JP 2022007306W WO 2022202064 A1 WO2022202064 A1 WO 2022202064A1
Authority
WO
WIPO (PCT)
Prior art keywords
input
information
image
additional information
interface
Prior art date
Application number
PCT/JP2022/007306
Other languages
English (en)
French (fr)
Inventor
昌孝 佐藤
一隆 朝日
Original Assignee
株式会社 東芝
東芝インフラシステムズ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社 東芝, 東芝インフラシステムズ株式会社 filed Critical 株式会社 東芝
Priority to CA3210736A priority Critical patent/CA3210736A1/en
Priority to AU2022244614A priority patent/AU2022244614A1/en
Priority to EP22774864.7A priority patent/EP4318412A1/en
Publication of WO2022202064A1 publication Critical patent/WO2022202064A1/ja
Priority to US18/465,291 priority patent/US20230419698A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/02Recognising information on displays, dials, clocks

Definitions

  • Embodiments of the present invention relate to information processing devices and information input systems.
  • an image of an article is displayed on a screen in order to acquire information indicating a destination such as an address written on the article, and a VCD ( Video Coding Desk). Furthermore, a technique for adding a new information input system for inputting information on behalf of an operator to an existing VCD has been devised.
  • the new information input system captures the image of the screen displayed by the existing VCD, and emulates the information indicating the destination of the article to be specified from the captured image into the operation signal of the input device in the existing VCD.
  • An information input system that connects to an existing VCD includes an OCR device that performs OCR (Optical Character Recognition) processing and a new input terminal for the operator to input information when recognition by the OCR device fails. That is, in an information input system connected to an existing VCD, an OCR device and a new input terminal input information such as a destination instead of the input device of the existing VCD.
  • OCR Optical Character Recognition
  • the present invention provides an information processing device and an information input system that can improve the efficiency of information input work.
  • the information processing device has an image interface, an input interface, an input terminal interface, a recognition unit, and a processor.
  • the image interface acquires a display image including an image to be processed that the external device causes the display device to display.
  • the input interface provides signals indicative of input information for the display image to the external device.
  • the input terminal interface connects to input terminals including display devices and input devices.
  • a recognition unit recognizes a character string in a processing target image included in a display image acquired by an image interface.
  • the processor requests the input terminal to input the first input information and the additional information based on the processing target image, when additional information is required for the first input information recognized from the processing target image by the recognition unit, Information indicating the first input information and the additional information input at the input terminal is supplied to the external device through the input interface.
  • FIG. 1 is a diagram schematically showing a configuration example of an information input system according to an embodiment.
  • FIG. 2 is a block diagram showing a configuration example of an existing VCD connected to the information input system according to the embodiment.
  • FIG. 3 is a block diagram showing a configuration example of an OCR device in the information input system according to the embodiment.
  • FIG. 4 is a diagram showing an example of a VCD screen captured by the OCR device in the information input system according to the embodiment.
  • FIG. 5 is a diagram showing an example when additional information is requested on the VCD screen captured by the OCR device in the information input system according to the embodiment.
  • FIG. 6 is a flowchart for explaining a first operation example of the OCR device in the information input system according to the embodiment.
  • FIG. 7 is a flowchart for explaining a second operation example of the OCR device in the information input system according to the embodiment.
  • FIG. 1 is a diagram showing a configuration example of an information input system 1 according to an embodiment.
  • the information input system 1 specifies information (for example, destination information) including a character string such as a postal code, an address, and an address in an image to be processed, and sends the specified information to a device such as a sorting device or an article processing device. It is connected to an existing VCD 10 to be supplied.
  • the information input system 1 captures an image of a display screen (VCD screen) including an image to be processed generated by the existing VCD 10, and based on the captured VCD screen, inputs information (destination information) through OCR processing or keystroke input processing. is supplied to the existing VCD 10.
  • VCD screen display screen
  • OCR processing or keystroke input processing is supplied to the existing VCD 10.
  • the information input system 1 includes a management PC 2, a network 3, an emulator 4, a capture board 5, an OCR device 20 and a new input terminal 30 (display device 7, operation device 8).
  • the OCR device 20 is an information processing device and recognition device.
  • OCR device 20 is connected to existing VCD 10 via emulator 4 and capture board 5 .
  • the display device 7 and the operation device 8 are devices that function as a new input terminal 30 for the operator to input information.
  • a display device 7 and an operation device 8 as a new input terminal 30 are connected to the OCR device 20 .
  • the OCR device 20 is also connected to the management PC 2 via the network 3 .
  • FIG. 1 shows a configuration example of an information input system 1 provided with OCR devices 20 (20a, 20b) and new input terminals 30 (30a, 30b) corresponding to the existing VCDs 10 (10a, 10b).
  • a plurality of OCR devices 20a, 20b are connected to existing VCDs 10a, 10b via a plurality of emulators 4a, 4b and capture boards 5a, 5b, respectively.
  • the new input terminals 30a, 30b are equipped with display devices 7a, 7b and operation devices 8a, 8b, respectively, and are connected to the OCR devices 20a, 20b.
  • the existing VCD 10 (10a, 10b) is an input device provided in an existing video coding system (VCS).
  • An existing VCD 10 is connected to an item processing device such as a sorting system that sorts items such as mail or parcels based on the destination written (displayed) on the item.
  • the existing VCD 10 obtains an image of an article to be sorted by an article processing apparatus read by a camera or a scanner, and displays a display image for inputting an address including the image of the article as the image to be processed on the display device. .
  • the existing VCD 10 supplies the input information indicating the destination to an article processing device such as a sorting system.
  • the management PC 2 connects to the network 3.
  • the management PC 2 manages the input system 1 as a whole.
  • the management PC 2 transmits and receives data to and from the OCR device 20 .
  • the management PC 2 transmits various signals and the like to the OCR device 20 and the like.
  • the management PC 2 also receives data (such as results of OCR processing) from the OCR device 20 .
  • the network 3 relays communication between the management PC 2 and the OCR device 20, communication between the OCR devices 20, and the like.
  • the network 3 is a LAN (Local Area Network) or the like.
  • the emulator 4 (4a, 4b) emulates an input device such as a keyboard or mouse connected to the existing VCD10.
  • the emulator 4 supplies the existing VCD 10 with a signal indicating the destination input from the OCR device 20 as an operation signal similar to the operation signal when input to the existing input device.
  • the emulator 4 converts a signal input from the OCR device 20 into an operation signal indicating mouse movement or clicking, or keyboard input, and supplies the operation signal to the existing VCD 10 .
  • the emulator 4a supplies the signal from the OCR device 20a to the existing VCDa as an operation signal for the input device of the existing VCD 10a.
  • the emulator 4b also supplies the signal from the OCR device 20b to the existing VCD 10b as an operation signal for the input device of the existing VCD 10b.
  • the capture board 5 (5a, 5b) captures the display image (VCD screen) including the processing target image displayed on the display device by the existing VCD 10 (10a, 10b).
  • the capture board 5 (5a, 5b) supplies the display image captured by the existing VCD 10 (10a, 10b) to the OCR device 20 (20a, 20b).
  • the capture board 5a captures a VCD screen generated by the existing VCD 10a and supplies the captured VCD screen to the OCR device 20a.
  • the capture board 5b captures a VCD screen generated by the existing VCD 10b and supplies the captured VCD screen to the OCR device 20b.
  • the OCR device 20 (20a, 20b) has a recognition unit that performs OCR processing (character recognition processing) for recognizing character strings in images of articles.
  • the OCR device 20 is connected to the capture board 5 (5a, 5b).
  • the OCR device 20 (20a, 20b) acquires the display image of the existing VCD 10 (10a, 10b) captured by the capture board 5 (5a, 5b).
  • the OCR device 20 performs OCR processing for recognizing the character string indicating the destination written on the item based on the image of the item included in the acquired display image of the existing VCD 10 (10a, 10b).
  • the OCR device 20 supplies information including the character string (destination) obtained as a result of the OCR processing to the existing VCD 10 via the emulator 4 . Further, when the OCR processing fails in recognition, the OCR device 20 causes the display device 7 as the new input terminal 30 to display the display image including the image of the article acquired from the existing VCD 10, and the operator presses the key to the operation device 8. Accept input. The OCR device 20 acquires information input by the operator through the operation device 8 as the new input terminal 30 . When the OCR device 20 acquires the information input to the operation device 8 , the OCR device 20 supplies the information input to the operation device 8 to the existing VCD 10 via the emulator 4 .
  • the display device 7 displays a VCD screen or the like.
  • the display device 7 displays the image requested by the OCR device 20 .
  • the display device 7 is, for example, a liquid crystal display or an organic EL display.
  • the display device 7a displays an image according to control from the OCR device 20a.
  • the display device 7b displays an image according to control from the OCR device 20b.
  • the operation device 8 receives input of operation instructions from the operator.
  • the operation device 8 transmits an operation signal indicating the input operation to the OCR device 20 .
  • the operation device 8 is composed of, for example, a keyboard or a mouse.
  • the operation device 8a supplies an operation signal indicating an input operation to the OCR device 20a.
  • the operation device 8b also supplies an operation signal indicating the input operation to the OCR device 20b.
  • the display device 7 and the operation device 8 function as an input terminal 30 in the information input system 1.
  • the display device 7 and the operation device 8 may be configured to be included in an information processing device such as a PC, or may be devices individually connected to the OCR device 20 . That is, the display device 7 may display an image supplied from the OCR device 20 , and the operation device 8 may supply information input by the operator to the OCR device 20 .
  • FIG. 2 is a block diagram showing a configuration example of the existing VCD 10 connected to the information input system 1 according to the embodiment.
  • the existing VCD 10 includes a processor 11, ROM 12, RAM 13, NVM 14, communication section 15, display interface 16, operation interface 17, and the like.
  • the existing VCD 10a and the existing VCD 10b have the same configuration, and will be described as the existing VCD 10.
  • FIG. 1 is a block diagram showing a configuration example of the existing VCD 10 connected to the information input system 1 according to the embodiment.
  • the existing VCD 10 includes a processor 11, ROM 12, RAM 13, NVM 14, communication section 15, display interface 16, operation interface 17, and the like.
  • the existing VCD 10a and the existing VCD 10b have the same configuration, and will be described as the existing VCD 10.
  • FIG. 1 is a block diagram showing a configuration example of the existing VCD 10 connected to the information input system 1 according to the embodiment.
  • the existing VCD 10 includes a processor 11, ROM 12, RAM 13, NVM 14, communication section 15, display interface 16, operation interface 17, and the
  • a ROM 12, a RAM 13, an NVM 14, a communication section 15, a display interface 16 and an operation interface 17 are connected to the processor 11 via a data bus or the like.
  • the existing VCD 10 may have a configuration other than the configuration shown in FIG. 2, or may have a specific configuration excluded from the existing VCD 10.
  • the processor 11 has a function of controlling the operation of the existing VCD 10 as a whole.
  • Processor 11 may include an internal cache, various interfaces, and the like.
  • the processor 11 implements various processes by executing programs pre-stored in the internal memory, ROM 12 or NVM 14 .
  • processor 11 controls the functions performed by the hardware circuits.
  • the ROM 12 is a non-volatile memory in which control programs, control data and the like are stored in advance.
  • the control program and control data stored in the ROM 12 are preinstalled in accordance with the specifications of the VCD 10 .
  • RAM 13 is a volatile memory.
  • the RAM 13 temporarily stores data being processed by the processor 11 .
  • RAM 13 stores various application programs based on instructions from processor 11 . Also, the RAM 13 may store data necessary for executing the application program, execution results of the application program, and the like.
  • the NVM 14 is a non-volatile memory in which data can be written and rewritten.
  • the NVM 14 may consist of, for example, an HDD, SSD, flash memory, or the like.
  • the NVM 14 stores control programs, applications, various data, etc. according to the operational use of the VCD 10 .
  • the communication unit 15 is an interface for transmitting and receiving data to and from a predetermined processing device.
  • the communication unit 15 is an interface that supports wired or wireless LAN connection.
  • the display interface 16 is connected to the capture board 5.
  • the display interface 16 is an interface that transmits and receives data to and from the capture board 5 .
  • the display interface 16 transmits the display screen (VCD screen) displayed on the display device to the capture board 5 under the control of the processor 11 .
  • the operation interface 17 is connected to the emulator 4.
  • the operation interface 17 is an interface for receiving input of operation instructions indicating information input to the input device.
  • the operation interface 17 receives operation signals indicating operations input to an operation device such as a keyboard or mouse.
  • the operation interface 17 supplies the received operation signal to the processor 11 .
  • the operation interface 17 supports USB (Universal Serial Bus) connection.
  • the operation interface 17 shown in FIG. 2 is connected to the emulator 4 and receives operation signals from the emulator 4 .
  • the processor 11 of the VCD 10 acquires the image of the article, which is the image to be processed, from an article processing device such as a sorting system through the communication unit 15 . After obtaining the image to be processed, the processor 11 generates a VCD screen for accepting input of a character string such as an address in the image of the article.
  • a VCD screen is a display image containing an image to be processed. The VCD screen is designed for display on an existing display device for viewing by an operator entering information such as an address.
  • the processor 11 outputs the generated VCD screen to the capture board 5 through the display interface 16 .
  • the processor 11 After outputting the VCD screen to the capture board 5, the processor 11 receives input of operation signals such as information indicating the destination through the operation interface 17.
  • the processor 11 acquires from the emulator 4 through the operation interface 17 a signal similar to the signal input from the existing operation device (an operation signal indicating key input or the like).
  • the processor 11 When the processor 11 receives an operation signal confirming the input through the operation interface 17 (for example, an operation signal indicating that an enter key is pressed), the input information is processed if the input information is sufficient as information indicating the destination. It is supplied to the article processing apparatus by the communication unit 15 . If the input information is not sufficient as the information indicating the destination, the processor 11 requests the OCR device 20 to input the information indicating the destination again.
  • an operation signal confirming the input through the operation interface 17 for example, an operation signal indicating that an enter key is pressed
  • the input information is processed if the input information is sufficient as information indicating the destination. It is supplied to the article processing apparatus by the communication unit 15 . If the input information is not sufficient as the information indicating the destination, the processor 11 requests the OCR device 20 to input the information indicating the destination again.
  • the processor 11 supplies information to the OCR device 20 as additional information indicating that the person indicated by the address is designated as the destination.
  • the processor 11 requests input of additional information by supplying a VCD screen including an additional instruction column requesting input of additional information (selection of address) to the OCR device 20 again via the capture board 5 .
  • FIG. 3 is a block diagram showing a configuration example of the OCR device 20 in the information input system 1 according to the embodiment.
  • the OCR device 20 includes a processor 21, a ROM 22, a RAM 23, an NVM 24, a communication unit 25, an emulator interface 26, an image interface 27, a display interface (display device interface) 28, and an operation interface (operation device interface) 29. etc.
  • the processor 21, ROM 22, RAM 23, NVM 24, emulator interface 26, image interface 27, display interface 28, and operation interface 29 are connected to each other via a data bus or the like. It should be noted that the OCR device 20 may have a configuration other than the configuration shown in FIG.
  • the processor 21 has a function of controlling the operation of the OCR device 20 as a whole.
  • Processor 21 may include an internal cache, various interfaces, and the like.
  • the processor 21 implements various processes by executing programs pre-stored in the internal memory, ROM 22 or NVM 24 .
  • processor 21 controls the functions performed by the hardware circuits.
  • the ROM 22 is a non-volatile memory in which control programs, control data, etc. are stored in advance.
  • the control program and control data stored in the ROM 22 are preinstalled according to the specifications of the OCR device 20 .
  • the RAM 23 is a volatile memory.
  • the RAM 23 temporarily stores data being processed by the processor 21 .
  • RAM 23 stores various application programs based on instructions from processor 21 . Also, the RAM 23 may store data necessary for executing the application program, execution results of the application program, and the like.
  • the NVM 24 (storage unit) is a non-volatile memory in which data can be written and rewritten.
  • the NVM 24 is composed of, for example, an HDD, SSD, flash memory, or the like.
  • the NVM 24 stores control programs, application programs, various data, and the like for realizing the operation of the OCR device 20, which will be described later.
  • the NVM 24 includes a program for acquiring a VCD screen from the existing VCD 10, a program for operating as a recognition unit, a program for supplying recognition results to the existing VCD 10, a program for detecting whether additional information is required, additional information stores a control program for inputting
  • the communication unit 25 (image interface, input interface) is an interface for transmitting and receiving data to and from the management PC 2 or other OCR device 20 .
  • a communication unit 25 connects to the network 3 .
  • the communication unit 25 is an interface that supports wired or wireless LAN connection.
  • the emulator interface 26 (input interface) is an interface that transmits and receives data to and from the emulator 4 .
  • the emulator interface 26 causes the emulator 4 to output an operation signal conforming to a predetermined operation device to the existing VCD 10 under the control of the processor 21 .
  • emulator interface 26 supports USB connectivity.
  • the image interface 27 is an interface that transmits and receives data to and from the capture board 5.
  • the image interface 27 acquires the VCD screen from the capture board 5 .
  • Image interface 27 supplies the captured VCD screen to processor 21 .
  • the display interface 28 is an interface that connects to the display device 7 .
  • the display interface 28 is an input terminal interface that connects to the display device 7 as the new input terminal 30 .
  • the display interface 28 transmits and receives data to and from the display device 7 as the new input terminal 30 .
  • the display interface 28 provides image information to be displayed on the display device 7 under control from the processor 21 .
  • the operation interface 29 is an interface that connects to the operation device 8 .
  • the operation interface 29 is an input terminal interface that connects to the operation device 8 as the new input terminal 30 .
  • the operation interface 29 transmits and receives data to and from the operation device 8 as the new input terminal 30 .
  • the operation interface 29 receives operation signals indicating operations input to the operation device 8 .
  • the operation interface 29 supplies the received operation signal to the processor 21 .
  • the operation interface 29 supports USB connection.
  • the emulator interface 26, the image interface 27, the display interface 28, and the operation interface 29 may be integrally formed. Also, the display interface 28 and the operation interface 29 may be one new input terminal interface for connecting to one computer terminal as the new input terminal 30 .
  • the functions of the OCR device 20 according to the embodiment are implemented by the processor 21 executing a program stored in the ROM 22, NVM 24, or the like. Various functions realized by the processor 21 executing the program will be described below.
  • the processor 21 realizes the function of acquiring the VCD screen generated by the existing VCD 10 by executing a program.
  • the existing VCD 10 acquires an image to be processed from an article processing apparatus or the like, it generates a VCD screen containing the image to be processed.
  • the existing VCD 10 outputs the generated VCD screen to the display interface 16 .
  • the VCD screen is a display screen for inputting a character string to be specified for coding.
  • FIG. 4 is a diagram showing an example of a VCD screen generated by the existing VCD 10.
  • the VCD screen displays a display field for an image to be processed, a first input field, an additional instruction field, an enter key, and the like.
  • a processing target image is an image including a character string to be coded.
  • the image to be processed is an image of an article in which a character string including an address (first character string as first input information) and an address (second character string as additional information) is described (displayed).
  • the first input field is a display field for displaying first input information such as an address that must be input.
  • the additional instruction column is a display column for entering additional information when it is necessary to enter it. If the information entered in the first entry field requires additional information, the user is prompted to enter the additional information in the additional instruction field. For example, in the additional instruction column, options to be selected as additional information are displayed when additional information is required.
  • the confirmation key is an icon that is indicated when confirming the information entered in the first input field or the additional display field.
  • the emulator 4 connected to the OCR device 20 inputs information into the first input field and the additional instruction field. Also, the enter key is instructed by the emulator 4 connected to the OCR device 20 .
  • the display interface 16 of the existing VCD 10 is connected with the capture board 5 connected to the OCR device 20 .
  • the capture board 5 captures the VCD screen output from the existing VCD 10 to the display interface.
  • the capture board 5 supplies the VCD screen captured by the existing VCD 10 to the image interface 27 of the OCR device 20 .
  • the processor 21 of the OCR device 20 acquires the VCD screen generated by the existing VCD 10 from the capture board 5 through the image interface 27. For example, the processor 21 acquires the VCD screen of the existing VCD 10 at predetermined intervals (for example, 1 second). Further, when the VCD screen changes (when the VCD image of the next image to be processed is displayed, or when an additional instruction (additional information input request) is displayed on the VCD screen), the processor 21 , the VCD screen may be acquired. For example, processor 21 may determine whether a change has occurred in the VCD screen according to an image processing algorithm or the like.
  • the processor 21 functions as a recognition section realized by executing a recognition program.
  • the processor 21 operates as a recognition unit by executing a recognition program for performing OCR processing for recognizing character strings in a processing target image stored in the NVM 24 or the like.
  • the recognition program executed by the processor 21 performs OCR (secondary OCR, offline OCR) with an algorithm different from the OCR (primary OCR, online OCR) processing performed by devices such as article processing devices connected to the existing VCD 10. ) to execute the process.
  • the processor 21 obtains destination information from the VCD screen by executing OCR processing as secondary OCR. Also, the processor 21 may execute a plurality of recognition programs for each piece of information to be authenticated.
  • the recognition programs include a first recognition program for recognizing a specific first character string (eg, an address) and a second recognition program for recognizing a second character string (eg, an address). and may be stored in the NVM 24 .
  • the processor 21 When a VCD screen is acquired from the existing VCD 10, the processor 21 as a recognition unit that executes a recognition program extracts an image area to be recognized (recognition target area) containing a target character string from the VCD screen in accordance with a pre-acquired format. Extract images.
  • the above-described first recognition program (first OCR processing) extracts the region in which the first character string is described as a recognition target region
  • the second recognition program extracts the second recognition program (second OCR processing).
  • a region in which the character string of is described may be extracted as a recognition target region.
  • the processor 21 After extracting the image of the recognition target area, the processor 21 performs OCR processing on the image of the recognition target area according to the above-described secondary OCR algorithm.
  • the secondary OCR algorithm can recognize at least a portion of the character image that the primary OCR algorithm cannot recognize.
  • the processor 21 acquires information indicating a character string (for example, the first character string) in the image to be processed based on the result of the OCR processing.
  • the processor 21 may perform predetermined processing on the VCD screen or the image of the authentication target area before performing the OCR processing. For example, the processor 21 may enlarge or reduce the image of the VCD screen or recognition target area. The processor 21 may also perform processing such as noise removal on the VCD screen or the image of the recognition target area.
  • the processor 21 has a function of supplying information acquired by OCR processing using the emulator 4 or information input to the new input terminal 30 to the existing VCD 10 .
  • the processor 21 uses the emulator 4 to supply the information obtained by the OCR processing to the existing VCD 10 . Further, when the operator inputs (keystroke input) information indicating a character string in the image to be processed by the operation device 8 as the new input terminal 30 connected to the OCR device 20, the processor 21 outputs the keystroke input information to the emulator. 4 to the existing VCD 10.
  • the emulator 4 performs emulation to convert information obtained by OCR processing or information input (keystroke input) by the operator into operation signals input to the operating device (for example, keyboard or mouse) of the existing VCD 10 .
  • the existing VCD 10 uses the emulator 4 to acquire information from the OCR device 20 (information obtained by OCR processing or keystroke input) from the operation interface 17 as a signal (operation signal) input to the operation device.
  • the processor 21 implements a function of allowing the operator to input information using the new input terminal 30 by executing a program. For example, the processor 21 accepts information input to the VCD screen using the new input terminal 30 when OCR processing fails.
  • the processor 21 displays the acquired VCD screen on the display device 7 as the new input terminal 30 .
  • a VCD screen displayed on the display device 7 is, for example, a screen as shown in FIG. With the VCD screen displayed on the display device 7, input of a character string (postal code, district, street, etc.) in the image to be processed by the operation device 8 is accepted.
  • the operator of the new input terminal 30 views the destination image on the VCD screen displayed on the display device 7 and inputs the destination to the operation device 8 . After completing the input of the destination, the operator inputs an operation to the operation device 8 to complete the input.
  • the processor 21 receives an operation signal indicating the key input from the operation device 8 through the operation interface 29 .
  • the processor 21 uses the emulator 4 to send an operation signal for inputting the key to the operation interface 17 of the VCD 10 .
  • Processor 11 of VCD 10 receives operation signals from emulator 4 through operation interface 17 . Upon receiving the operation signal, the processor 11 generates a VCD screen (display image) displaying a character string based on the operation signal in the input form. After generating the VCD screen, processor 11 supplies the VCD screen to capture board 5 through display interface 16 . The capture board 5 captures the VCD screen (display image) output to the display interface 16 of the existing VCD 10 and supplies the captured VCD image to the OCR device 20 .
  • Processor 21 of OCR device 20 acquires the VCD screen from capture board 5 through image interface 27 .
  • the processor 21 displays the VCD screen (VCD screen that displays the character string entered in the input form or the like) on the display device 7 through the display interface 28 .
  • the processor 21 of the OCR device 20 repeats the above-described operation and allows the operator to input information until the input of information requested by the existing VCD 10 is completed.
  • the OCR device 20 As a function of the OCR device 20 according to the embodiment, it has a function of detecting that additional information is required for the information obtained by the OCR processing.
  • the processor 21 implements a function of detecting the need for additional information to the information obtained by the OCR processing by executing a program.
  • the existing VCD 10 may require a second character string (e.g. address) as additional information in addition to a first character string (e.g. address) as first input information obtained by OCR processing.
  • a second character string e.g. address
  • the OCR processing may be temporarily cleared as described later. Therefore, the processor 21 has a function of detecting that additional information is required for information obtained by OCR processing.
  • the program for detecting the additional information may be an algorithm for detecting that the existing VCD 10 to which the recognition result of the OCR processing has supplied displays the additional information input field (additional instruction field).
  • FIG. 5 is a diagram showing an example when additional information is requested on the VCD screen generated by the existing VCD 10.
  • options indicating information to be selected as additional information are displayed in the additional instruction column on the VCD screen.
  • a selection screen for selecting a relocating person is displayed in the additional instruction column for the address entered in the first input column.
  • "1. Address A" and "2. Address B" are options for selecting the mover, and "3. Others" selects the current resident.
  • Such a mover database may store data indicating a mover (address corresponding to the second character string) associated with the address as the first input information (first character string). .
  • the processor 21 detects the need to input additional information from the VCD screen acquired from the existing VCD 10 . For example, when information to be selected (input) as additional information is displayed in the additional instruction column as shown in FIG. It should be possible to detect something.
  • the program for detecting additional information may be an algorithm in which the processor 21 of the OCR device 20 determines the presence or absence of additional information (second character string) according to the recognition result of the first character string by OCR processing.
  • the processor 21 needs to be configured to be able to access a database (for example, a relocating person database) for determining whether or not additional information is necessary for the recognition result of OCR processing.
  • the OCR device 20 has a database storing data indicating first input information (first character string such as address) to be recognized that requires additional information (second character string such as address) ( or a configuration that allows access to the database).
  • FIG. 6 is a flowchart for explaining a first operation example of the OCR device 20 according to the embodiment.
  • the processor 21 of the OCR device 20 acquires the VCD screen of the existing VCD 10 captured by the capture board 5 through the image interface 27 (ST11). For example, when the processor 21 acquires the VCD screen of the existing VCD 10, the processor 21 executes OCR processing for recognizing the information (first input information such as address) for the first input field to be recognized (ST12).
  • the information for the first input field is information of the first character string in the image to be processed, for example, information such as an address in the destination information.
  • the processor 21 proceeds to ST17 and performs keystroke input processing using the new input terminal 30, which will be described later. If the recognition of the first input information by the OCR processing is successful (ST13, YES), the processor 21 uses the emulator 4 to enter the first input information obtained by the OCR processing into the first input field of the VCD screen. An operation is performed (ST14). After inputting the first input information obtained by the OCR process into the first input field, the processor 21 acquires the VCD screen of the existing VCD 10 captured by the capture board 5 through the image interface, and checks whether there is an instruction to input additional information. Detect (ST15).
  • the processor 21 detects whether or not there is an input instruction for additional information based on whether or not a screen requesting input of additional information appears in the additional instruction column of the VCD screen generated by the existing VCD 10 . Also, the processor 21 may access a database such as a relocation information database and determine whether additional information needs to be input for the first input information obtained by OCR processing.
  • the processor 21 assumes that the information input processing for one processing target image has been completed. When the information input processing for one processing target image is completed, the processor 21 may proceed to ST11 again and perform the information input processing for the next processing target image.
  • the processor 21 uses the emulator 4 to clear the information input in the first input field on the VCD screen of the existing VCD (ST16). Here, the processor 21 may further clear the information displayed in the additional instruction column. Further, if the processor 21 is performing image processing such as enlargement or reduction on a part or the entire area of the VCD screen, the processor 21 may perform processing to return the image processing to the original state. .
  • the processor 21 After clearing the information input in the first input field, the processor 21 displays the VCD screen with the information input in the first input field (first input information) cleared on the display device 7 of the new input terminal 30. (ST17).
  • the processor 21 causes the operation device 8 operated by the operator to input the first input information (keystroke input) to the first input field. accept.
  • the processor 21 uses the emulator 4 to input the first input information input using the operation device 8 to the first input field on the VCD screen. emulation operation is performed (ST18).
  • the processor 21 After inputting the first input information key-inputted by the operation device 8 into the first input field, the processor 21 acquires the VCD screen of the existing VCD 10 captured by the capture board 5 through the image interface, and instructs input of additional information. is detected (ST19). If there is no input instruction for additional information (ST19, NO), the processor 21 assumes that the information input processing for one processing target image has ended.
  • the processor 21 updates the VCD screen with the first input information input in the first input field and the additional information input instruction displayed in the additional instruction field. It is displayed on the display device 7 of the input terminal 30, and the input of additional information (key input) to the additional instruction column by the operation device 8 operated by the operator is accepted.
  • the processor 21 uses the emulator 4 to perform an emulation operation of inputting the additional information keyed in with the operation device 8 into the additional instruction column on the VCD screen. (ST20).
  • the first input information and the additional information are input to the VCD screen of the existing VCD 10 connected to the OCR device 20, and the information input processing for the image to be processed is completed.
  • the first input information obtained by the OCR processing If additional information is required for the VCD screen, the VCD screen with the first input information entered in the first input field cleared by OCR processing is displayed on the display device of the new input terminal, and the first input information for the VCD screen and additional information.
  • the VCD screen can be displayed on the display device of the new input terminal in a state that makes it easier for the operator to input.
  • the operator of the new input terminal can continue the simple and repetitive work starting from the input of the first input information, thereby preventing the operator's work efficiency from deteriorating.
  • FIG. 7 is a flowchart for explaining a second operation example of the OCR device 20 according to the embodiment.
  • the processor 21 of the OCR device 20 acquires the VCD screen of the existing VCD 10 captured by the capture board 5 through the image interface 27 (ST31). For example, when the processor 21 acquires the VCD screen of the existing VCD 10, the processor 21 performs the first OCR processing for recognizing the information for the first input field (first input information such as address) which is the first recognition target information. Execute (ST32).
  • the information for the first input field is information of the first character string in the image to be processed. be.
  • the processor 21 proceeds to ST40 and shifts to keystroke input processing using the new input terminal 30. If the first input information is successfully recognized by the first OCR processing (ST33, YES), the processor 21 uses the emulator 4 to input the first input information obtained by the OCR processing to the first input field on the VCD screen. An emulation operation for input is performed (ST34). After inputting the first input information obtained by the OCR process into the first input field, the processor 21 acquires the VCD screen of the existing VCD 10 captured by the capture board 5 through the image interface, and checks whether there is an instruction to input additional information. Confirm (ST35).
  • the processor 21 If there is no input instruction for additional information (ST35, NO), the processor 21 assumes that the information input processing for one processing target image has been completed. When the information input processing for one processing target image is completed, the processor 21 advances to ST31 again to perform the information input processing for the next processing target image.
  • the processor 21 If there is an input instruction for additional information (ST35, YES), the processor 21 generates a second input for recognizing information for an additional instruction column (second character string such as an address), which is the second recognition target information. OCR processing is executed (ST36).
  • the information for the additional instruction field is information (additional information) whose addition is instructed in the additional instruction field.
  • the additional information is information of the second character string in the image to be processed. For example, the additional information is information such as an address for specifying whether the person is a mover as described above.
  • the processor 21 uses the emulator 4 to copy the additional information corresponding to the second character string obtained by the second OCR process to the VCD.
  • An emulation operation is performed to input data in the additional instruction column on the screen (ST38).
  • the first input information is input in the first input field and the additional information is input in the additional instruction field.
  • the information input processing for the VCD screen of the existing VCD 10 is completed.
  • the processor 21 uses the emulator 4 to clear the information entered in the first input field on the VCD screen of the existing VCD (ST39 ). Furthermore, the processor 21 may clear the information displayed in the additional instruction column. Further, if the processor 21 is performing image processing such as enlargement or reduction on a part or the entire area of the VCD screen, the processor 21 may perform processing to return the image processing to the original state. .
  • the processor 21 After clearing the information entered in the first input field, the processor 21 displays the VCD screen with the information in the first input field cleared on the display device 7 of the new input terminal 30 (ST40).
  • the processor 21 causes the operation device 8 operated by the operator to input the first input information to the first input field (keystroke input). accept.
  • the processor 21 uses the emulator 4 to input the first input information input using the operation device 8 as the first input on the VCD screen.
  • An emulation operation to be entered in the column is performed (ST41).
  • the processor 21 After inputting the first input information key-inputted by the operation device 8 into the first input field, the processor 21 acquires the VCD screen of the existing VCD 10 captured by the capture board 5 through the image interface, and instructs input of additional information. is detected (ST42). If there is no input instruction for additional information (ST42, NO), the processor 21 assumes that the information input processing for one processing target image has ended.
  • the processor 21 updates the VCD screen with the first input information input in the first input field and the additional information input instruction displayed in the additional instruction field. It is displayed on the display device 7 of the input terminal 30, and the input of additional information (key input) to the additional instruction column by the operation device 8 operated by the operator is accepted.
  • the processor 21 uses the emulator 4 to perform an emulation operation of inputting the additional information keyed in with the operation device 8 into the additional instruction column on the VCD screen. (ST43).
  • ST43 the processor 21 uses the emulator 4 to perform an emulation operation of inputting the additional information keyed in with the operation device 8 into the additional instruction column on the VCD screen.
  • the first input information obtained by the OCR processing If additional information is required for the image to be processed, a second OCR process is performed to recognize the additional information from the image to be processed.
  • the VCD screen in which the first input information entered in the first input field is cleared by OCR processing is displayed on the display device of the new input terminal, and the first input information and the addition to the VCD screen are displayed. Accepts input with information.
  • the VCD screen in a state where it is easy for the operator to input can be displayed on the display device of the new input terminal.
  • it is possible to reduce the work load of the operator of the new input terminal and prevent the operator's work efficiency from deteriorating by having the operator continue the simple repetitive work starting from the input of the first input information when the additional information cannot be recognized. can.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Computer And Data Communications (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

実施形態によれば、情報処理装置は、画像インターフェースと、入力インターフェースと、入力端末インターフェースと、認識部と、プロセッサと、を有する。画像インターフェースは、外部装置が表示装置に表示させる処理対象画像を含む表示画像を取得する。認識部は、画像インターフェースにより取得する表示画像に含まれる処理対象画像において文字列を認識する。プロセッサは、認識部が処理対象画像から認識した第1入力情報に対して追加情報が必要である場合、処理対象画像に基づく第1入力情報の入力および追加情報の入力を入力端末に要求し、入力端末で入力された第1入力情報および追加情報を示す情報を入力インターフェースにより外部装置へ供給する。

Description

情報処理装置および情報入力システム
 本発明の実施形態は、情報処理装置および情報入力システムに関する。
 従来、物品に記載された住所などの宛先を示す情報を取得するために物品の画像を画面に表示し、画面された画像に基づいてオペレータが物品に記載された情報を入力するためのVCD(Video Coding Desk)がある。さらに、既存のVCDに対して、オペレータに代わって情報を入力する新たな情報入力システムを増設する技術が考案されている。新たな情報入力システムは、既存のVCDが表示する画面の画像をキャプチャし、キャプチャした画像から特定する物品の宛先を示す情報を既存のVCDにおける入力装置の操作信号にエミュレートして既存のVCDに供給する。
 既存のVCDに接続する情報入力システムは、OCR(Optical Character Recognition)処理を行うOCR装置とOCR装置での認識が失敗した場合にオペレータが情報を入力するための新入力端末とを備える。すなわち、既存のVCDに接続する情報入力システムは、既存のVCDの入力デバイスに代わって、OCR装置と新入力端末とが宛先などの情報を入力するものである。
 既存のVCDでは、転居者が存在する住所である場合に宛名を示す情報などの追加情報の入力をオペレータに要求する機能がある。このような追加情報を入力させる機能をそのまま新情報入力システムに取り入れると、新情報入力システムの新入力端末のオペレータは、突発的にOCR処理で得られた住所などの所定の情報に対して追加情報(例えば、宛名)を入力する作業が生じる。新入力端末のオペレータは、OCR処理が失敗した処理対象画像を見て所定の情報を入力する作業を短時間で繰り返し実施しているため、突発的に所定の情報と異なる情報の入力が求められると作業に戸惑いが生じたり予期せぬ視線移動などの動作が余儀なくされたりすることで作業効率が低下することがある。
日本国特開2008-90536号公報
 本発明は、上記の課題を解決するため、情報の入力作業の効率化を図れる情報処理装置および情報入力システムを提供する。
 実施形態によれば、情報処理装置は、画像インターフェースと、入力インターフェースと、入力端末インターフェースと、認識部と、プロセッサと、を有する。画像インターフェースは、外部装置が表示装置に表示させる処理対象画像を含む表示画像を取得する。入力インターフェースは、表示画像に対する入力情報を示す信号を外部装置へ供給する。入力端末インターフェースは、表示デバイスおよび入力デバイスを含む入力端末に接続する。認識部は、画像インターフェースにより取得する表示画像に含まれる処理対象画像において文字列を認識する。プロセッサは、認識部が処理対象画像から認識した第1入力情報に対して追加情報が必要である場合、処理対象画像に基づく第1入力情報の入力および追加情報の入力を入力端末に要求し、入力端末で入力された第1入力情報および追加情報を示す情報を入力インターフェースにより外部装置へ供給する。
図1は、実施形態に係る情報入力システムの構成例を概略的に示す図である。 図2は、実施形態に係る情報入力システムに接続される既存のVCDの構成例を示すブロック図である。 図3は、実施形態に係る情報入力システムにおけるOCR装置の構成例を示すブロック図である。 図4は、実施形態に係る情報入力システムにおけるOCR装置が取り込むVCD画面の例を示す図である。 図5は、実施形態に係る情報入力システムにおけるOCR装置が取り込むVCD画面において追加情報が要求された場合の例を示す図である。 図6は、実施形態に係る情報入力システムにおけるOCR装置の第1の動作例を説明するためのフローチャートである。 図7は、実施形態に係る情報入力システムにおけるOCR装置の第2の動作例を説明するためのフローチャートである。
実施形態
 以下、実施形態について、図面を参照して説明する。 
 図1は、実施形態に係る情報入力システム1の構成例を示す図である。 
 実施形態に係る情報入力システム1は、処理対象画像において郵便番号、住所および宛名などの文字列を含む情報(例えば宛先情報)を特定し、特定した情報を区分装置や物品処理装置などの装置に供給する既存VCD10に接続される。情報入力システム1は、既存VCD10が生成する処理対象画像を含む表示画面(VCD画面)の画像をキャプチャし、キャプチャしたVCD画面に基づいてOCR処理又は打鍵入力処理で入力された情報(宛先情報)を既存VCD10に供給するシステムである。
 図1が示すように、情報入力システム1は、管理PC2、ネットワーク3、エミュレータ4、キャプチャボード5、OCR装置20および新入力端末30(表示デバイス7、操作デバイス8)を備える。 
 OCR装置20は、情報処理装置および認識装置である。OCR装置20は、エミュレータ4およびキャプチャボード5を介して既存のVCD10に接続される。表示デバイス7および操作デバイス8は、オペレータが情報を入力するための新入力端末30として機能するデバイスである。新入力端末30としての表示デバイス7および操作デバイス8は、OCR装置20に接続される。また、OCR装置20は、ネットワーク3を介して管理PC2にも接続される。
 また、図1は、各既存VCD10(10a、10b)に対応して、OCR装置20(20a、20b)および新入力端末30(30a、30b)を設けた情報入力システム1の構成例を示す。 
 複数のOCR装置20a、20bは、それぞれ複数のエミュレータ4a、4bおよびキャプチャボード5a、5bを介して既存VCD10a、10bに接続される。また、新入力端末30a、30bは、それぞれ表示デバイス7a、7bおよび操作デバイス8a、8bを備え、OCR装置20a、20bに接続される。
 既存のVCD10(10a、10b)は、既存のビデオコーディングシステム(VCS)に設けられる入力装置である。既存のVCD10は、郵便物又は荷物などの物品を物品上に記載(表示)された宛先に基づいて区分する区分システムなどの物品処理装置に接続される。既存VCD10は、物品処理装置がカメラやスキャナなどで読み取った区分処理の対象とする物品の画像を取得し、処理対象画像としての物品の画像を含む宛先入力用の表示画像を表示装置に表示させる。既存VCD10は、入力された宛先を示す情報を区分システムなどの物品処理装置へ供給する。
 管理PC2は、ネットワーク3に接続する。管理PC2は、入力システム1全体を管理する。管理PC2は、OCR装置20とデータを送受信する。管理PC2は、種々の信号などをOCR装置20などに送信する。また、管理PC2は、OCR装置20からのデータ(OCR処理の結果など)を受信する。ネットワーク3は、管理PC2とOCR装置20との間の通信およびOCR装置20間の通信などを中継する。例えば、ネットワーク3は、LAN(Local Area Network)などである。
 エミュレータ4(4a、4b)は、既存VCD10に接続するキーボード又はマウスなどの入力装置をエミュレーションする。エミュレータ4は、OCR装置20から入力する宛先を示す信号を既存の入力装置に入力された場合の操作信号と同様の操作信号として既存VCD10に供給する。例えば、エミュレータ4は、OCR装置20から入力する信号を、マウスの移動若しくはクリック、又は、キーボード入力などを示す操作信号に変換して既存VCD10に供給する。
 図1に示す構成例において、エミュレータ4aは、OCR装置20aからの信号を既存VCD10aにおける入力装置の操作信号として既存VCDaに供給する。また、エミュレータ4bは、OCR装置20bからの信号を既存VCD10bにおける入力装置の操作信号として既存VCD10bに供給する。
 キャプチャボード5(5a、5b)は、既存のVCD10(10a、10b)が表示装置に表示する処理対象画像を含む表示画像(VCD画面)をキャプチャする。キャプチャボード5(5a、5b)は、既存のVCD10(10a、10b)でキャプチャした表示画像をOCR装置20(20a、20b)へ供給する。図1に示す構成例において、キャプチャボード5aは、既存VCD10aが生成するVCD画面をキャプチャし、キャプチャしたVCD画面をOCR装置20aに供給する。キャプチャボード5bは、既存VCD10bが生成するVCD画面をキャプチャし、キャプチャしたVCD画面をOCR装置20bに供給する。
 OCR装置20(20a、20b)は、物品の画像における文字列を認識するOCR処理(文字認識処理)を行う認識部を有する。OCR装置20は、キャプチャボード5(5a、5b)に接続される。OCR装置20(20a、20b)は、キャプチャボード5(5a、5b)がキャプチャする既存VCD10(10a、10b)の表示画像を取得する。OCR装置20は、取得した既存VCD10(10a、10b)の表示画像に含まれる物品の画像に基づいて当該物品に記載された宛先を示す文字列を認識するためのOCR処理を行う。
 OCR装置20は、OCR処理が成功した場合、OCR処理の結果として得た文字列(宛先)を含む情報をエミュレータ4を介して既存のVCD10に供給する。また、OCR装置20は、OCR処理が認識に失敗した場合、既存VCD10から取得した物品の画像を含む表示画像を新入力端末30としての表示デバイス7に表示させ、オペレータによる操作デバイス8へのキー入力を受け付ける。OCR装置20は、新入力端末30としての操作デバイス8においてオペレータが入力した情報を取得する。OCR装置20は、操作デバイス8に入力された情報を取得すると、操作デバイス8に入力された情報をエミュレータ4を介して既存のVCD10に供給する。
 表示デバイス7は、VCD画面などを表示する。表示デバイス7は、OCR装置20が要求される画像を表示する。表示デバイス7は、例えば、液晶ディスプレイあるいは有機ELディスプレイなどである。図1に示す構成例において、表示デバイス7aは、OCR装置20aからの制御に従って画像を表示する。また、表示デバイス7bは、OCR装置20bからの制御に従って画像を表示する。
 操作デバイス8は、オペレータから操作指示の入力を受け付ける。操作デバイス8は、入力された操作を示す操作信号をOCR装置20へ送信する。操作デバイス8は、例えば、キーボード又はマウスなどで構成される。図1に示す構成例において、操作デバイス8aは、入力された操作を示す操作信号をOCR装置20aへ供給する。また、操作デバイス8bは、入力された操作を示す操作信号をOCR装置20bへ供給する。
 なお、表示デバイス7および操作デバイス8は、情報入力システム1における入力端末30として機能する。表示デバイス7および操作デバイス8は、PCなどの情報処理装置に含まれる構成であっても良いし、それぞれがOCR装置20に個別に接続されるデバイスであっても良い。即ち、表示デバイス7は、OCR装置20からの供給される画像を表示するものであれば良く、操作デバイス8は、オペレータが入力した情報をOCR装置20に供給するものであれば良い。
 次に、実施形態に係る情報入力システム1が接続される既存VCD10の構成について説明する。 
 図2は、実施形態に係る情報入力システム1に接続される既存VCD10の構成例を示すブロック図である。 
 図2が示すように、既存VCD10は、プロセッサ11、ROM12、RAM13、NVM14、通信部15、表示インターフェース16および操作インターフェース17などを備える。なお、既存VCD10aおよび既存VCD10bは、同様の構成であるものとし、既存VCD10として説明する。
 既存VCD10において、プロセッサ11には、ROM12、RAM13、NVM14、通信部15、表示インターフェース16および操作インターフェース17がデータバスなどを介して接続される。なお、既存VCD10は、図2が示すような構成の他に必要に応じた構成を具備したり、既存VCD10から特定の構成が除外されたりしてもよい。
 プロセッサ11は、既存VCD10全体の動作を制御する機能を有する。プロセッサ11は、内部キャッシュおよび各種のインターフェースなどを備えてもよい。プロセッサ11は、内部メモリ、ROM12又はNVM14が予め記憶するプログラムを実行することにより種々の処理を実現する。
 なお、プロセッサ11がプログラムを実行することにより実現する各種の機能のうちの一部は、ハードウエア回路により実現されるものであってもよい。この場合、プロセッサ11は、ハードウエア回路により実行される機能を制御する。
 ROM12は、制御プログラムおよび制御データなどが予め記憶された不揮発性のメモリである。ROM12に記憶される制御プログラムおよび制御データは、VCD10の仕様に応じて予め組み込まれる。 
 RAM13は、揮発性のメモリである。RAM13は、プロセッサ11の処理中のデータなどを一時的に格納する。RAM13は、プロセッサ11からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM13は、アプリケーションプログラムの実行に必要なデータおよびアプリケーションプログラムの実行結果などを格納してもよい。
 NVM14は、データの書き込みおよび書き換えが可能な不揮発性のメモリである。例えば、NVM14は、例えば、HDD、SSD又はフラッシュメモリなどから構成されるものであっても良い。NVM14は、VCD10の運用用途に応じて制御プログラム、アプリケーションおよび種々のデータなどを格納する。
 通信部15は、所定の処理装置とデータを送受信するためのインターフェースである。例えば、通信部15は、有線又は無線のLAN接続をサポートするインターフェースである。
 表示インターフェース16は、キャプチャボード5に接続される。表示インターフェース16は、キャプチャボード5とデータを送受信するインターフェースである。表示インターフェース16は、プロセッサ11からの制御に従って、表示装置に表示している表示画面(VCD画面)をキャプチャボード5に送信する。
 操作インターフェース17は、エミュレータ4に接続される。操作インターフェース17は、入力装置に入力された情報を示す操作指示の入力を受け付けるためのインターフェースである。例えば、操作インターフェース17は、キーボード又はマウスなどの操作デバイスに入力される操作を示す操作信号を受信する。操作インターフェース17は、受信された操作信号をプロセッサ11に供給する。例えば、操作インターフェース17は、USB(Universal Serial Bus)接続をサポートする。図2に示す操作インターフェース17は、エミュレータ4に接続されるものであり、エミュレータ4からの操作信号を受信する。
 VCD10のプロセッサ11は、通信部15を通じて処理対象画像である物品の画像を区分システムなどの物品処理装置から取得する。処理対象画像を取得すると、プロセッサ11は、物品の画像における住所などの文字列の入力を受け付けるVCD画面を生成する。VCD画面は、処理対象画像を含む表示画像である。VCD画面は、住所などの情報を入力するオペレータが視認する既存の表示装置に表示するために設計されている。本実施形態において、プロセッサ11は、生成したVCD画面を表示インターフェース16を通じてキャプチャボード5に出力する。
 VCD画面をキャプチャボード5に出力した後、プロセッサ11は、操作インターフェース17を通じて宛先を示す情報などの操作信号の入力を受け付ける。プロセッサ11は、操作インターフェース17を通じて、既存の操作装置から入力する信号と同様の信号(キー入力などを示す操作信号)をエミュレータ4から取得する。
 プロセッサ11は、操作インターフェース17を通じて入力が確定する操作信号(例えば、エンターキーが押された操作信号など)を受信すると、入力された情報が宛先を示す情報として十分であれば入力された情報を通信部15により物品処理装置へ供給する。プロセッサ11は、入力された情報が宛先を示す情報として十分でなければ、再度OCR装置20に宛先を示す情報の入力を依頼する。
 一例として、プロセッサ11は、入力された情報としての住所が転居者の存在する住所である場合、OCR装置20に対して追加情報として宛名が示す宛先とする人物を指定する旨の情報を供給する。例えば、プロセッサ11は、追加情報の入力(宛名の選択)を要求する追加指示欄を含むVCD画面をキャプチャボード5を介して再度OCR装置20に供給することで追加情報の入力を要求する。
 次に、実施形態に係る情報入力システム1におけるOCR装置20の構成について説明する。 
 図3は、実施形態に係る情報入力システム1におけるOCR装置20の構成例を示すブロック図である。 
 図3に示すように、OCR装置20は、プロセッサ21、ROM22、RAM23、NVM24、通信部25、エミュレータインターフェース26、画像インターフェース27、表示インターフェース(表示デバイスインターフェース)28および操作インターフェース(操作デバイスインターフェース)29などを備える。
 プロセッサ21と、ROM22、RAM23、NVM24、エミュレータインターフェース26、画像インターフェース27、表示インターフェース28および操作インターフェース29と、は、データバスなどを介して互いに接続する。なお、OCR装置20は、図3が示すような構成の他に必要に応じた構成を具備したり、OCR装置20から特定の構成が除外されたりしてもよい。
 プロセッサ21は、OCR装置20全体の動作を制御する機能を有する。プロセッサ21は、内部キャッシュおよび各種のインターフェースなどを備えてもよい。プロセッサ21は、内部メモリ、ROM22又はNVM24が予め記憶するプログラムを実行することにより種々の処理を実現する。
 なお、プロセッサ21がプログラムを実行することにより実現する各種の機能のうちの一部は、ハードウエア回路により実現されるものであってもよい。この場合、プロセッサ21は、ハードウエア回路により実行される機能を制御する。
 ROM22は、制御プログラムおよび制御データなどが予め記憶された不揮発性のメモリである。ROM22に記憶される制御プログラムおよび制御データは、OCR装置20の仕様に応じて予め組み込まれる。
 RAM23は、揮発性のメモリである。RAM23は、プロセッサ21の処理中のデータなどを一時的に格納する。RAM23は、プロセッサ21からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM23は、アプリケーションプログラムの実行に必要なデータおよびアプリケーションプログラムの実行結果などを格納してもよい。
 NVM24(記憶部)は、データの書き込みおよび書き換えが可能な不揮発性のメモリである。NVM24は、例えば、HDD、SSD又はフラッシュメモリなどから構成される。NVM24は、OCR装置20の後述する動作を実現するための制御プログラム、アプリケーションプログラムおよび種々のデータなどを格納する。
 例えば、NVM24は、既存VCD10からVCD画面を取得するためのプログラム、認識部として動作するためのプログラム、認識結果を既存VCD10へ供給するためのプログラム、追加情報が要否を検知するプログラム、追加情報が入力させるための制御プログラムなどを記憶する。
 通信部25(画像インターフェース、入力インターフェース)は、管理PC2又は他のOCR装置20とデータを送受信するためのインターフェースである。通信部25は、ネットワーク3に接続する。例えば、通信部25は、有線又は無線のLAN接続をサポートするインターフェースである。
 エミュレータインターフェース26(入力インターフェース)は、エミュレータ4との間でデータを送受信するインターフェースである。エミュレータインターフェース26は、プロセッサ21からの制御に従ってエミュレータ4に所定の操作デバイスに準じた操作信号を既存VCD10へ出力させる。例えば、エミュレータインターフェース26は、USB接続をサポートする。
 画像インターフェース27は、キャプチャボード5との間でデータを送受信するインターフェースである。画像インターフェース27は、キャプチャボード5からVCD画面を取得する。画像インターフェース27は、取得されたVCD画面をプロセッサ21に供給する。
 表示インターフェース28は、表示デバイス7に接続するインターフェースである。表示インターフェース28は、新入力端末30としての表示デバイス7に接続する入力端末インターフェースである。表示インターフェース28は、新入力端末30としての表示デバイス7との間でデータを送受信する。例えば、表示インターフェース28は、プロセッサ21からの制御に従って、表示デバイス7に表示させる画像情報を供給する。
 操作インターフェース29は、操作デバイス8に接続するインターフェースである。操作インターフェース29は、新入力端末30としての操作デバイス8に接続する入力端末インターフェースである。操作インターフェース29は、新入力端末30としての操作デバイス8との間でデータを送受信する。操作インターフェース29は、操作デバイス8に入力される操作を示す操作信号を受信する。操作インターフェース29は、受信した操作信号をプロセッサ21に供給する。例えば、操作インターフェース29は、USB接続をサポートする。
 なお、エミュレータインターフェース26、画像インターフェース27、表示インターフェース28および操作インターフェース29(又はこれらの一部)は、一体的に形成されるものであってもよい。また、表示インターフェース28および操作インターフェース29は、新入力端末30とする1つのコンピュータ端末に接続するための1つの新入力端末インターフェースであっても良い。
 次に、実施形態に係るOCR装置20が有する機能について説明する。 
 実施形態に係るOCR装置20が有する機能は、プロセッサ21がROM22又はNVM24などに格納されるプログラムを実行することで実現される。以下、プロセッサ21がプログラムを実行することで実現する種々の機能について説明する。
 まず、実施形態に係るOCR装置20の機能として、既存VCD10が生成するVCD画面を取得する機能について説明する。 
 実施形態に係るOCR装置20において、プロセッサ21は、プログラムを実行することにより既存VCD10が生成するVCD画面を取得する機能を実現する。 
 既存VCD10は、物品処理装置などから処理対象画像を取得すると、処理対象画像を含むVCD画面を生成する。既存VCD10は、生成したVCD画面を表示インターフェース16に出力する。VCD画面は、特定するコーディングの対象となる文字列を入力するための表示画面である。
 図4は、既存VCD10が生成するVCD画面の例を示す図である。 
 図4に示す例では、VCD画面には、処理対象画像の表示欄、第1入力欄、追加指示欄、確定キーなどが表示される。 
 処理対象画像は、コーディングの対象となる文字列を含む画像である。例えば、処理対象画像は、住所(第1入力情報としての第1の文字列)および宛名(追加情報としての第2の文字列)などを含む文字列が記載(表示)された物品の画像である。第1入力欄は、入力が必須となる住所などの第1入力情報を表示する表示欄である。
 追加指示欄は、追加情報の入力が必要な場合に追加情報を入力するための表示欄である。第1入力欄に入力した情報に追加情報が必要である場合、追加指示欄への追加情報の入力が求められる。例えば、追加指示欄には、追加情報が必要である場合に、追加情報として選択すべき選択肢が表示される。
 確定キーは、第1入力欄又は追加表示欄に入力された情報を確定する場合に指示されるアイコンである。本実施形態において、第1入力欄および追加指示欄には、OCR装置20に接続されるエミュレータ4によって情報が入力される。また、確定キーは、OCR装置20に接続されるエミュレータ4によって指示入力される。
 図1に示すように、既存VCD10の表示インターフェース16には、OCR装置20に接続されたキャプチャボード5が接続される。キャプチャボード5は、既存VCD10が表示インターフェースに出力したVCD画面をキャプチャする。キャプチャボード5は、既存VCD10でキャプチャしたVCD画面をOCR装置20の画像インターフェース27へ供給する。
 OCR装置20のプロセッサ21は、画像インターフェース27を通じて既存VCD10が生成するVCD画面をキャプチャボード5から取得する。例えば、プロセッサ21は、所定の間隔(例えば、1秒)で既存VCD10のVCD画面を取得する。また、プロセッサ21は、VCD画面に変化が生じた場合(次の処理対象画像のVCD画像が表示された場合、あるいは、VCD画面に追加指示(追加情報の入力要求)が表示された場合)に、VCD画面を取得するようにしてもよい。例えば、プロセッサ21は、画像処理アルゴリズムなどに従ってVCD画面に変化が生じたかを判定するようにすれば良い。
 次に、実施形態に係るOCR装置20の機能として、処理対象画像における文字列を認識する認識部としての機能について説明する。 
 実施形態に係るOCR装置20において、プロセッサ21は、認識プログラムを実行することにより実現する認識部として機能する。 
 プロセッサ21は、NVM24などに格納される処理対象画像における文字列を認識するOCR処理を行うための認識プログラムを実行することで認識部として動作する。OCR装置20において、プロセッサ21が実行する認識プログラムは、既存VCD10に接続される物品処理装置などの装置が実施するOCR(プライマリOCR、オンラインOCR)処理とは異なるアルゴリズムのOCR(セカンダリOCR、オフラインOCR)処理を実行する。
 プロセッサ21は、セカンダリOCRとしてのOCR処理を実行することによりVCD画面から宛先情報を得る。また、プロセッサ21は、認証対象とする情報ごとに複数の認識プログラムを実行するようにしても良い。例えば、認識プログラムとしては、特定の第1の文字列(例えば、住所)を認識するための第1の認識プログラムと第2の文字列(例えば、宛名)を認識するための第2の認識プログラムとをNVM24に格納するようにしても良い。
 認識プログラムを実行する認識部としてのプロセッサ21は、既存VCD10からVCD画面を取得すると、予め取得されたフォーマットなどに従ってVCD画面から対象となる文字列を含む認識対象の画像領域(認識対象領域)の画像を抽出する。上述したような第1の認識プログラム(第1のOCR処理)では第1の文字列が記載された領域を認識対象領域として抽出し、第2の認識プログラム(第2のOCR処理)では第2の文字列が記載された領域を認識対象領域として抽出するようにしても良い。
 認識対象領域の画像を抽出すると、プロセッサ21は、上述したセカンダリOCRとしてのアルゴリズムに従って認識対象領域の画像にOCR処理を行う。セカンダリOCRのアルゴリズムは、プライマリOCRのアルゴリズムが認識できない文字画像の少なくとも一部を認識することができる。このようなOCR処理を実行することにより、プロセッサ21は、OCR処理の結果に基づいて処理対象画像における文字列(例えば、第1の文字列)を示す情報を取得する。
 なお、プロセッサ21は、OCR処理を行う前に、VCD画面又は認証対象領域の画像に対して所定の処理を行うようにしても良い。例えば、プロセッサ21は、VCD画面又は認識対象領域の画像を拡大又は縮小してもよい。また、プロセッサ21は、VCD画面又は認識対象領域の画像に対してノイズを除去する処理などを行ってもよい。
 次に、実施形態に係るOCR装置20の機能として、エミュレータ4を用いて既存VCD10に情報を供給する機能について説明する。 
 実施形態に係るOCR装置20において、プロセッサ21は、エミュレータ4を用いてOCR処理により取得された情報又は新入力端末30に入力された情報を既存VCD10に供給する機能を有する。
 例えば、OCR処理による認識が成功すると、プロセッサ21は、エミュレータ4を用いてOCR処理によって得た情報を既存VCD10へ供給する。また、プロセッサ21は、OCR装置20に接続された新入力端末30としての操作デバイス8で処理対象画像における文字列を示す情報をオペレータが入力(打鍵入力)した場合、打鍵入力された情報をエミュレータ4経由で既存VCD10へ供給する。
 エミュレータ4は、OCR処理によって得た情報又はオペレータが入力(打鍵入力)した情報を既存VCD10の操作装置(例えば、キーボードやマウス)に入力された操作信号に変換するエミュレーションを行う。既存VCD10は、エミュレータ4によってOCR装置20からの情報(OCR処理で得た情報又は打鍵入力された情報)を操作装置に入力された信号(操作信号)として操作インターフェース17から取得する。
 次に、実施形態に係るOCR装置20の機能として、新入力端末30を用いてオペレータに情報を入力させる機能について説明する。 
 実施形態に係るOCR装置20において、プロセッサ21は、プログラムを実行することにより新入力端末30を用いてオペレータに情報を入力させる機能を実現する。例えば、プロセッサ21は、OCR処理に失敗した場合、新入力端末30を用いたVCD画面への情報入力を受け付ける。
 プロセッサ21は、既存VCD10から取得したVCD画面に対するOCR処理に失敗した場合、取得したVCD画面を新入力端末30としての表示デバイス7に表示する。表示デバイス7に表示させるVCD画面は、例えば、図4に示すような画面となっている。表示デバイス7にVCD画面を表示した状態において、操作デバイス8による処理対象画像における文字列(郵便番号、街区又はストリートなど)の入力を受け付ける。
 ここで、新入力端末30のオペレータは、表示デバイス7に表示されるVCD画面の宛先画像を目視して宛先を操作デバイス8に入力する。宛先の入力が完了すると、オペレータは、操作デバイス8に入力を完了する操作を入力する。 
 オペレータが操作デバイス8にキーの入力を行うと、プロセッサ21は、操作インターフェース29を通じて操作デバイス8から入力されたキーを示す操作信号を受信する。プロセッサ21は、エミュレータ4を用いて、当該キーを入力する操作信号をVCD10の操作インターフェース17に送信する。
 VCD10のプロセッサ11は、操作インターフェース17を通じて、エミュレータ4からの操作信号を受信する。操作信号を受信すると、プロセッサ11は、入力フォームに操作信号に基づく文字列を表示したVCD画面(表示画像)を生成する。VCD画面を生成すると、プロセッサ11は、表示インターフェース16を通じてVCD画面をキャプチャボード5に供給する。 
 キャプチャボード5は、既存VCD10の表示インターフェース16に出力されたVCD画面(表示画像)をキャプチャし、キャプチャしたVCD画像をOCR装置20に供給する。
 OCR装置20のプロセッサ21は、画像インターフェース27を通じてVCD画面をキャプチャボード5から取得する。VCD画面を取得すると、プロセッサ21は、表示インターフェース28を通じてVCD画面(入力フォームなどに入力された文字列を表示するVCD画面)を表示デバイス7に表示する。 
 OCR装置20のプロセッサ21は、上述した動作を繰り返し、既存VCD10が要求する情報の入力が完了するまで、オペレータによる情報の入力作業を実行させる。
 次に、実施形態に係るOCR装置20の機能として、OCR処理によって得た情報に対して、さらなる追加情報を必要とすること検知する機能を有する。 
 実施形態に係るOCR装置20において、プロセッサ21は、プログラムを実行することによりOCR処理で得た情報に対して追加情報が必要であることを検知する機能を実現する。
 例えば、既存VCD10は、OCR処理で得た第1入力情報としての第1の文字列(例えば、住所)に対して追加情報として第2の文字列(例えば、宛名)が必要であることがあるものとする。本実施形態に係るOCR装置20は、OCR処理で得た情報に対して追加情報が必要である場合、後述するようにOCR処理を一旦クリアするような処理を行うことがある。このため、プロセッサ21は、OCR処理で得た情報に対して追加情報が必要であることを検知する機能を有する。
 追加情報が必要であることを検知するアルゴリズムとしては、OCR処理による第1の文字列の認識結果を供給した既存VCD10から追加情報(第2の文字列の情報)が必要であることを示す情報を取得する。この場合、追加情報を検知するプログラムとしては、OCR処理の認識結果を供給した既存VCD10が追加情報の入力欄(追加指示欄)を表示したことを検知するアルゴリズムとすれば良い。
 図5は、既存VCD10が生成するVCD画面において追加情報が要求された場合の例を示す図である。 
 図5に示す例では、VCD画面における追加指示欄に追加情報として選択すべき情報を示す選択肢が表示されている。図5に示すVCD画面では、第1入力欄に入力された住所に対して、転居者を選択するような選択画面が追加指示欄に表示される。図5に示す例において、追加指示欄では、「1.宛名A」および「2.宛名B」が転居者を選択するための選択肢であり、「3.その他」が現在の居住者を選択する選択肢であるように構成されている。例えば、集合住宅等では、同一住所に複数の転居者が存在することが有り得る。このような同一住所に複数の転居者が設定されている場合、図5に示すような複数の転居者の候補から転居者を選択できる追加指示欄を表示することが考えられる。
 上記のような転居者を示す情報は、既存VCD10を含む既存のVCS(ビデオコーディングシステム)において既存VCD10がアクセス可能な転居者データベースに記録されている構成が想定される。このような転居者データベースとしては、第1入力情報(第1の文字列)としての住所に対応づけた転居者(第2の文字列に相当する宛名)を示すデータを格納したものが考えられる。
 上記のような構成を想定する場合、プロセッサ21は、既存VCD10から取得するVCD画面から追加情報の入力が必要であることを検知するようにする。例えば、プロセッサ21は、既存VCD10から取得するVCD画面において、図5に示すように追加指示欄に追加情報として選択(入力)すべき情報を表示されている場合に、追加情報の入力が必要であることを検知するようにすれば良い。
 また、追加情報を検知するプログラムは、OCR処理による第1の文字列の認識結果に応じて追加情報(第2の文字列)の有無をOCR装置20のプロセッサ21が判定するアルゴリズムとしても良い。この場合、プロセッサ21が、OCR処理の認識結果に対して追加情報の要否を判定するためのデータベース(例えば、転居者データベース)にアクセスできるような構成とする必要がある。例えば、OCR装置20は、追加情報(宛名などの第2の文字列)が必要な認識対象の第1入力情報(住所などの第1の文字列)を示すデータを格納したデータベースを具備する(又はデータベースにアクセス可能な構成とする)ようにすれば良い。
 次に、実施形態に係る情報入力システムにおけるOCR装置20の動作例について説明する。 
 図6は、実施形態に係るOCR装置20の第1の動作例について説明するためのフローチャートである。
 OCR装置20のプロセッサ21は、キャプチャボード5がキャプチャする既存VCD10のVCD画面を画像インターフェース27により取得する(ST11)。例えば、プロセッサ21は、既存VCD10のVCD画面を取得すると、認識対象情報とする第1入力欄用の情報(住所などの第1入力情報)を認識するためのOCR処理を実行する(ST12)。第1入力欄用の情報(第1入力情報)は、処理対象画像における第1の文字列の情報であり、例えば、宛先情報における住所などの情報である。
 OCR処理による第1入力情報の認識に失敗した場合(ST13、NO)、プロセッサ21は、ST17へ進み、後述する新入力端末30を用いた打鍵入力処理を行う。 
 OCR処理による第1入力情報の認識に成功した場合(ST13、YES)、プロセッサ21は、エミュレータ4を用いて、OCR処理で得た第1入力情報をVCD画面の第1入力欄に入力するエミュレーション操作を行う(ST14)。OCR処理で得た第1入力情報を第1入力欄に入力した後、プロセッサ21は、キャプチャボード5がキャプチャする当該既存VCD10のVCD画面を画像インターフェースにより取得し、追加情報の入力指示の有無を検知する(ST15)。
 例えば、プロセッサ21は、当該既存VCD10が生成するVCD画面の追加指示欄に追加情報の入力を要求する画面が発生したか否かにより追加情報の入力指示の有無を検知する。また、プロセッサ21は、転居情報データベースなどのデータベースにアクセスし、OCR処理で得た第1入力情報に対して追加情報の入力が必要か否かを判断するようにしても良い。
 追加情報の入力指示が無い場合(ST15、NO)、プロセッサ21は、1件の処理対象画像に対する情報入力処理が終了したものする。1件分の処理対象画像に対する情報入力処理が終了した場合、プロセッサ21は、再びST11へ進み、次の処理対象画像に対する情報入力処理を行うようにしても良い。
 追加情報の入力指示が有る場合(ST15、YES)、プロセッサ21は、エミュレータ4を用いて既存VCDのVCD画面における第1入力欄に入力した情報をクリアする(ST16)。ここで、プロセッサ21は、さらに、追加指示欄に表示された情報をクリアするようにしても良い。また、プロセッサ21は、VCD画面の一部又は全部の領域に対する拡大や縮小などの画像処理を行っている場合にはそれらの画像処理を元の状態に戻すような処理を行うようにしても良い。
 第1入力欄に入力した情報をクリアした後、プロセッサ21は、第1入力欄に入力した情報(第1入力情報)をクリアした状態のVCD画面を新入力端末30の表示デバイス7に表示する(ST17)。表示デバイス7に第1入力欄の情報をクリアした状態のVCD画面を表示した場合、プロセッサ21は、オペレータが操作する操作デバイス8による第1入力欄に対する第1入力情報の入力(打鍵入力)を受け付ける。
 第1入力欄に対する第1入力情報をオペレータが操作デバイス8で打鍵入力すると、プロセッサ21は、エミュレータ4を用いて、操作デバイス8で打鍵入力された第1入力情報をVCD画面の第1入力欄に入力するエミュレーション操作を行う(ST18)。
 操作デバイス8で打鍵入力された第1入力情報を第1入力欄に入力した後、プロセッサ21は、キャプチャボード5がキャプチャする当該既存VCD10のVCD画面を画像インターフェースにより取得し、追加情報の入力指示の有無を検知する(ST19)。追加情報の入力指示が無い場合(ST19、NO)、プロセッサ21は、1件の処理対象画像に対する情報入力処理が終了したものする。
 また、追加情報の入力指示が有る場合(ST19、YES)、プロセッサ21は、第1入力欄に第1入力情報が入力され、追加指示欄に追加情報の入力指示が表示されたVCD画面を新入力端末30の表示デバイス7に表示し、オペレータが操作する操作デバイス8による追加指示欄に対する追加情報の入力(打鍵入力)を受け付ける。
 オペレータが操作デバイス8で追加指示欄に追加情報を打鍵入力すると、プロセッサ21は、エミュレータ4を用いて、操作デバイス8で打鍵入力された追加情報をVCD画面の追加指示欄に入力するエミュレーション操作を行う(ST20)。これにより、OCR装置20に接続された既存VCD10のVCD画面には、第1入力情報および追加情報が入力され、当該処理対象画像に対する情報入力処理が終了したこととなる。
 以上のような第1の動作例によれば、OCR装置は、既存VCDから取得するVCD画像における処理対象画像に対する第1入力情報のOCR処理が成功した後、OCR処理で得た第1入力情報に対して追加情報が必要である場合、OCR処理によって第1入力欄に入力した第1入力情報をクリアした状態のVCD画面を新入力端末の表示デバイスに表示させ、VCD画面に対する第1入力情報と追加情報との入力を受け付ける。
 これにより、追加情報が必要である場合にオペレータが入力しやすい状態にしたVCD画面を新入力端末の表示デバイスに表示させることができる。この結果、新入力端末のオペレータは、追加情報が必要な場合であっても、第1入力情報の入力から始める単純な繰返作業を続けられ、オペレータの作業効率を低下させないようにできる。
 次に、実施形態に係る情報入力システムにおけるOCR装置20の第2の動作例について説明する。 
 図7は、実施形態に係るOCR装置20の第2の動作例を説明するためのフローチャートである。 
 OCR装置20のプロセッサ21は、キャプチャボード5がキャプチャする既存VCD10のVCD画面を画像インターフェース27により取得する(ST31)。例えば、プロセッサ21は、既存VCD10のVCD画面を取得すると、第1の認識対象情報である第1入力欄用の情報(住所などの第1入力情報)を認識するための第1のOCR処理を実行する(ST32)。上述した第1の動作例と同様に、第1入力欄用の情報(第1入力情報)は、処理対象画像における第1の文字列の情報であり、例えば、宛先情報における住所などの情報である。
 第1のOCR処理による第1入力情報の認識に失敗した場合(ST33、NO)、プロセッサ21は、ST40へ進み、新入力端末30を用いた打鍵入力処理へ移行する。  第1のOCR処理による第1入力情報の認識に成功した場合(ST33、YES)、プロセッサ21は、エミュレータ4を用いて、OCR処理で得た第1入力情報をVCD画面の第1入力欄に入力するエミュレーション操作を行う(ST34)。OCR処理で得た第1入力情報を第1入力欄に入力した後、プロセッサ21は、キャプチャボード5がキャプチャする当該既存VCD10のVCD画面を画像インターフェースにより取得し、追加情報の入力指示の有無を確認する(ST35)。
 追加情報の入力指示が無い場合(ST35、NO)、プロセッサ21は、1件の処理対象画像に対する情報入力処理が終了したものする。1件分の処理対象画像に対する情報入力処理が終了した場合、プロセッサ21は、再びST31へ進み、次の処理対象画像に対する情報入力処理を行う。
 追加情報の入力指示が有る場合(ST35、YES)、プロセッサ21は、第2の認識対象情報である追加指示欄用の情報(宛名などの第2の文字列)を認識するための第2のOCR処理を実行する(ST36)。追加指示欄用の情報とは、追加指示欄で追加が指示された情報(追加情報)である。追加情報は、処理対象画像における第2の文字列の情報である。例えば、追加情報は、上述したような転居者であるかを特定するための宛名などの情報である。
 第2のOCR処理による追加情報の認識に成功した場合(ST37、YES)、プロセッサ21は、エミュレータ4を用いて、第2のOCR処理で得た第2の文字列に応じた追加情報をVCD画面の追加指示欄に入力するエミュレーション操作を行う(ST38)。これにより、OCR装置20に接続された既存VCD10のVCD画面には、第1入力欄に第1入力情報が入力され、かつ、追加指示欄に追加情報が入力される。この結果、既存VCD10のVCD画面に対する情報入力処理が終了する。
 また、第2のOCR処理による追加情報の認識に失敗した場合(ST37、NO)、プロセッサ21は、エミュレータ4を用いて既存VCDのVCD画面における第1入力欄に入力した情報をクリアする(ST39)。さらに、プロセッサ21は、追加指示欄に表示された情報のクリアするようにしても良い。また、プロセッサ21は、VCD画面の一部又は全部の領域に対する拡大や縮小などの画像処理を行っている場合にはそれらの画像処理を元の状態に戻すような処理を行うようにしても良い。
 第1入力欄に入力した情報をクリアした後、プロセッサ21は、第1入力欄の情報をクリアした状態のVCD画面を新入力端末30の表示デバイス7に表示する(ST40)。表示デバイス7に第1入力欄の情報をクリアした状態のVCD画面を表示した場合、プロセッサ21は、オペレータが操作する操作デバイス8による第1入力欄への第1入力情報の入力(打鍵入力)を受け付ける。
 第1入力欄用の第1入力情報をオペレータが操作デバイス8で打鍵入力すると、プロセッサ21は、エミュレータ4を用いて、操作デバイス8で打鍵入力された第1入力情報をVCD画面の第1入力欄に入力するエミュレーション操作を行う(ST41)。
 操作デバイス8で打鍵入力された第1入力情報を第1入力欄に入力した後、プロセッサ21は、キャプチャボード5がキャプチャする当該既存VCD10のVCD画面を画像インターフェースにより取得し、追加情報の入力指示の有無を検知する(ST42)。追加情報の入力指示が無い場合(ST42、NO)、プロセッサ21は、1件の処理対象画像に対する情報入力処理が終了したものとする。
 また、追加情報の入力指示が有る場合(ST42、YES)、プロセッサ21は、第1入力欄に第1入力情報が入力され、追加指示欄に追加情報の入力指示が表示されたVCD画面を新入力端末30の表示デバイス7に表示し、オペレータが操作する操作デバイス8による追加指示欄に対する追加情報の入力(打鍵入力)を受け付ける。
 オペレータが操作デバイス8で追加指示欄に追加情報を打鍵入力すると、プロセッサ21は、エミュレータ4を用いて、操作デバイス8で打鍵入力された追加情報をVCD画面の追加指示欄に入力するエミュレーション操作を行う(ST43)。これにより、OCR装置20に接続された既存VCD10のVCD画面において、第1入力欄には第1入力情報が入力され、追加指示欄には追加情報が入力される。この結果、既存VCD10のVCD画面への情報入力処理が完了する。
 以上のような第2の動作例によれば、OCR装置は、既存VCDから取得するVCD画像における処理対象画像に対する第1入力情報のOCR処理が成功した後、OCR処理で得た第1入力情報に対して追加情報が必要であれば、処理対象画像から追加情報を認識する第2のOCR処理を実行する。追加情報の認識が失敗した場合、OCR処理によって第1入力欄に入力した第1入力情報をクリアした状態のVCD画面を新入力端末の表示デバイスに表示させ、VCD画面に対する第1入力情報と追加情報との入力を受け付ける。
 これにより、追加情報が必要である場合に第2のOCR処理によって追加情報が認識できなければ、オペレータが入力しやすい状態にしたVCD画面を新入力端末の表示デバイスに表示させることができる。この結果、新入力端末のオペレータの作業量を低減させつつ、追加情報が認識できない場合に第1入力情報の入力から始める単純な繰返作業を続けさせることでオペレータの作業効率を低下させないようにできる。
 本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

Claims (12)

  1.  外部装置が表示装置に表示させる処理対象画像を含む表示画像を取得する画像インターフェースと、
     前記表示画像に対する入力情報を示す信号を前記外部装置へ供給する入力インターフェースと、
     表示デバイスおよび入力デバイスを含む入力端末に接続する入力端末インターフェースと、
     前記画像インターフェースにより取得する前記表示画像に含まれる前記処理対象画像において文字列を認識する認識部と、
     前記認識部が前記処理対象画像から認識した第1入力情報に対して追加情報が必要である場合、前記処理対象画像に基づく前記第1入力情報の入力および前記追加情報の入力を前記入力端末に要求し、前記入力端末で入力された前記第1入力情報および前記追加情報を示す情報を前記入力インターフェースにより前記外部装置へ供給するプロセッサと、 を有する情報処理装置。
  2.  前記画像インターフェースは、前記外部装置が表示装置に表示させる処理対象画像を含む表示画像をキャプチャするキャプチャボードに接続するキャプチャボードインターフェースである、
     請求項1に記載の情報処理装置。
  3.  前記入力インターフェースは、前記表示画像に対する入力情報を示す信号を入力装置に入力された信号にエミュレートして前記外部装置に供給するエミュレータに接続するエミュレータインターフェースである、
     請求項1又は2の何れか1項に記載の情報処理装置。
  4.  前記第1入力情報は、宛先情報における住所であり、
     前記追加情報は、宛先情報における宛名であり、
     前記プロセッサは、前記認識部が前記処理対象画像から認識した住所に転居者が存在する場合に追加情報としての宛名が必要であるとし、前記処理対象画像に基づく住所および宛名の入力を前記入力端末に要求し、前記入力端末で入力された住所および宛名を前記外部装置へ供給する、
     請求項1乃至3の何れか1項に記載の情報処理装置。
  5.  前記プロセッサは、前記認識部が前記処理対象画像から第1入力情報を認識した結果を前記外部装置へ供給した後に前記外部装置から前記追加情報が要求された場合、前記処理対象画像に基づく前記第1入力情報の入力および前記追加情報の入力を前記入力端末に要求し、前記入力端末で入力された前記第1入力情報および前記追加情報を示す情報を前記外部装置へ供給する、
     請求項1乃至4の何れか1項に記載の情報処理装置。
  6.  前記プロセッサは、
     前記追加情報が必要である場合、前記認識部により前記処理対象画像における前記追加情報を認識させ、
     前記認識部が追加情報を認識できた場合には前記追加情報の認識結果に基づく前記追加情報を前記外部装置へ供給し、
     前記認識部が追加情報を認識できなかった場合には前記処理対象画像に基づく前記第1入力情報の入力および前記追加情報の入力を前記入力端末に要求し、前記入力端末で入力された前記第1入力情報および前記追加情報を示す情報を前記外部装置へ供給する、
     請求項1乃至5の何れか1項に記載の情報処理装置。
  7.  認識装置と表示デバイスと操作デバイスとを有する情報入力システムであって、
     前記認識装置は、
     外部装置が表示装置に表示させる処理対象画像を含む表示画像を取得する画像インターフェースと、
     前記表示画像に対する入力情報を示す信号を前記外部装置へ供給する入力インターフェースと、
     前記表示デバイスと接続する表示デバイスインターフェースと、
     前記操作デバイスと通信する操作デバイスインターフェースと、
     前記画像インターフェースにより取得する前記表示画像に含まれる前記処理対象画像において文字列を認識する認識部と、
     前記認識部が前記処理対象画像から認識した第1入力情報に対して追加情報が必要である場合、前記処理対象画像における前記第1入力情報の入力および前記追加情報の入力を要求する画面を前記表示デバイスに表示させ、前記操作デバイスで入力された前記第1入力情報および前記追加情報を示す情報を前記入力インターフェースにより前記外部装置へ供給するプロセッサと、を有する、
     を有する情報入力システム。
  8.  前記画像インターフェースは、前記外部装置が表示装置に表示させる処理対象画像を含む表示画像をキャプチャするキャプチャボードに接続するキャプチャボードインターフェースである、
     請求項7に記載の情報入力システム。
  9.  前記入力インターフェースは、前記表示画像に対する入力情報を示す信号を入力装置に入力された信号にエミュレートして前記外部装置に供給するエミュレータに接続するエミュレータインターフェースである、
     請求項7又は8の何れか1項に記載の情報入力システム。
  10.  前記第1入力情報は、宛先情報における住所であり、
     前記追加情報は、宛先情報における宛名であり、
     前記プロセッサは、前記認識部が前記処理対象画像から認識した住所に転居者が存在する場合に追加情報としての宛名が必要であるとし、前記処理対象画像に基づく住所および宛名の入力画面を前記表示デバイスに表示し、前記操作デバイスで入力された住所および宛名を前記外部装置へ供給する、
     請求項7乃至9の何れか1項に記載の情報入力システム。
  11.  前記プロセッサは、前記認識部が前記処理対象画像から第1入力情報を認識した結果を前記外部装置へ供給した後に前記外部装置から前記追加情報が要求された場合、前記処理対象画像に基づく前記第1入力情報の入力および前記追加情報の入力画面を前記表示デバイスに表示し、前記操作デバイスで入力された前記第1入力情報および前記追加情報を示す情報を前記外部装置へ供給する、
     請求項7乃至10の何れか1項に記載の情報入力システム。
  12.  前記プロセッサは、
     前記追加情報が必要である場合、前記認識部により前記処理対象画像における前記追加情報を認識させ、
     前記認識部が追加情報を認識できた場合には前記追加情報の認識結果に基づく前記追加情報を前記外部装置へ供給し、
     前記認識部が追加情報を認識できなかった場合には前記処理対象画像に基づく前記第1入力情報の入力および前記追加情報の入力画面を前記表示デバイスに表示し、前記操作デバイスで入力された前記第1入力情報および前記追加情報を示す情報を前記外部装置へ供給する、
     請求項7乃至11の何れか1項に記載の情報入力システム。
PCT/JP2022/007306 2021-03-22 2022-02-22 情報処理装置および情報入力システム WO2022202064A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CA3210736A CA3210736A1 (en) 2021-03-22 2022-02-22 Information processing device and information input system
AU2022244614A AU2022244614A1 (en) 2021-03-22 2022-02-22 Information processing device and information input system
EP22774864.7A EP4318412A1 (en) 2021-03-22 2022-02-22 Information processing device and information input system
US18/465,291 US20230419698A1 (en) 2021-03-22 2023-09-12 Information processing apparatus and information input system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021-047481 2021-03-22
JP2021047481A JP2022146490A (ja) 2021-03-22 2021-03-22 情報処理装置および情報入力システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/465,291 Continuation US20230419698A1 (en) 2021-03-22 2023-09-12 Information processing apparatus and information input system

Publications (1)

Publication Number Publication Date
WO2022202064A1 true WO2022202064A1 (ja) 2022-09-29

Family

ID=83397001

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/007306 WO2022202064A1 (ja) 2021-03-22 2022-02-22 情報処理装置および情報入力システム

Country Status (6)

Country Link
US (1) US20230419698A1 (ja)
EP (1) EP4318412A1 (ja)
JP (1) JP2022146490A (ja)
AU (1) AU2022244614A1 (ja)
CA (1) CA3210736A1 (ja)
WO (1) WO2022202064A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06170339A (ja) * 1992-12-04 1994-06-21 Toshiba Corp 郵便物処理装置
JP2001009381A (ja) * 1999-07-01 2001-01-16 Hitachi Ltd 情報処理型郵便区分システム
JP2003058813A (ja) * 2001-08-09 2003-02-28 Jis:Kk データエントリーシステム
JP2006171851A (ja) * 2004-12-13 2006-06-29 Nec Corp 文書ファイル解析システム、文書ファイル解析方法及びプログラム
JP2008090536A (ja) 2006-09-29 2008-04-17 Toshiba Solutions Corp 帳票処理システム及び帳票処理方法
JP2019032719A (ja) * 2017-08-08 2019-02-28 株式会社エス・エム・エス・データテック 情報処理システム、情報処理方法及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06170339A (ja) * 1992-12-04 1994-06-21 Toshiba Corp 郵便物処理装置
JP2001009381A (ja) * 1999-07-01 2001-01-16 Hitachi Ltd 情報処理型郵便区分システム
JP2003058813A (ja) * 2001-08-09 2003-02-28 Jis:Kk データエントリーシステム
JP2006171851A (ja) * 2004-12-13 2006-06-29 Nec Corp 文書ファイル解析システム、文書ファイル解析方法及びプログラム
JP2008090536A (ja) 2006-09-29 2008-04-17 Toshiba Solutions Corp 帳票処理システム及び帳票処理方法
JP2019032719A (ja) * 2017-08-08 2019-02-28 株式会社エス・エム・エス・データテック 情報処理システム、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP2022146490A (ja) 2022-10-05
AU2022244614A1 (en) 2023-09-21
CA3210736A1 (en) 2022-09-29
US20230419698A1 (en) 2023-12-28
EP4318412A1 (en) 2024-02-07

Similar Documents

Publication Publication Date Title
US10949662B2 (en) Image processing apparatus
JP2018124656A (ja) 画像処理装置とその制御方法、及びプログラム
WO2016121310A1 (en) Image processing device and electronic whiteboard
US9632696B2 (en) Presentation system to facilitate the association of handwriting input by a participant user with a page of a presentation
WO2022202064A1 (ja) 情報処理装置および情報入力システム
US10388257B2 (en) Information processing apparatus, method of controlling the same and non-transitory computer-readable storage medium
JP2018195022A (ja) 情報処理システム、制御方法、プログラム
JP7009904B2 (ja) 端末装置、情報処理システム、情報処理方法及びプログラム
WO2021182186A1 (ja) 認識装置及びプログラム
JP7413219B2 (ja) 情報処理装置及びシステム
JP6558145B2 (ja) 情報処理端末、情報処理システムと、その処理方法及びプログラム
JP6850323B2 (ja) 情報処理装置、その制御方法及びプログラム
US20200174732A1 (en) Electronic blackboard system, electronic blackboard, and electronic blackboard method
WO2023171622A1 (ja) 認識装置、プログラム及びシステム
JP2020067721A (ja) 情報処理装置、サーバ、電子文書の表示方法、電子文書の配信方法、電子文書生成システムおよびプログラム
JP2022045557A (ja) 情報処理装置及びプログラム
JP2575916B2 (ja) データ表示装置
EP4120128A1 (en) Information processing device, system, and control method
WO2023053950A1 (ja) システム及び情報処理方法
JP2023068489A (ja) 情報処理装置
JP2019068391A (ja) 情報処理装置及びその制御方法、並びにプログラム
WO2020039468A1 (ja) 電子マニュアルの作成装置および閲覧システム
JP2020126697A (ja) 情報処理装置、情報処理装置の制御方法、プログラム
JP2017120533A (ja) 情報処理装置、その制御方法、及びプログラム
JP2016119670A (ja) 画像処理システム、画像処理装置、その制御方法、及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22774864

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 3210736

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 2022244614

Country of ref document: AU

Ref document number: AU2022244614

Country of ref document: AU

ENP Entry into the national phase

Ref document number: 2022244614

Country of ref document: AU

Date of ref document: 20220222

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 2022774864

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 11202306604W

Country of ref document: SG

ENP Entry into the national phase

Ref document number: 2022774864

Country of ref document: EP

Effective date: 20231023