JP2023026154A - Information processing apparatus and program - Google Patents

Information processing apparatus and program Download PDF

Info

Publication number
JP2023026154A
JP2023026154A JP2021131869A JP2021131869A JP2023026154A JP 2023026154 A JP2023026154 A JP 2023026154A JP 2021131869 A JP2021131869 A JP 2021131869A JP 2021131869 A JP2021131869 A JP 2021131869A JP 2023026154 A JP2023026154 A JP 2023026154A
Authority
JP
Japan
Prior art keywords
processor
image
input
ocr
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021131869A
Other languages
Japanese (ja)
Inventor
杜朗 鳥居
Morio Torii
泰弘 大川
Yasuhiro Okawa
琢磨 赤木
Takuma Akagi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Infrastructure Systems and Solutions Corp filed Critical Toshiba Corp
Priority to JP2021131869A priority Critical patent/JP2023026154A/en
Publication of JP2023026154A publication Critical patent/JP2023026154A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

To provide an information processing apparatus and a program capable of displaying an image in which an operator can easily visually recognize character lines.SOLUTION: According to an embodiment, an information processing apparatus comprises an interface and a processor. The interface transmits and receives data to and from an external apparatus and input and output apparatuses. The processor receives OCR intermediate information generated in the process of OCR processing for an image containing a form on which text lines are written from the external apparatus through the interface; corrects a display method of the form image showing the form based on the OCR intermediate information; causes the input and output apparatus to display the corrected form image through the interface; obtains characters input to the input and output apparatus through the interface; and transmits character information based on the obtained characters to the external apparatus through the interface.SELECTED DRAWING: Figure 4

Description

本発明の実施形態は、情報処理装置及びプログラムに関する。 TECHNICAL FIELD Embodiments of the present invention relate to an information processing apparatus and a program.

OCR(optical character recognition)処理により宛先などの文字行を読み取る認識装置と、認識装置が文字行の認識に失敗した場合にオペレータから文字の入力を受け付けるVCS(video coding system)とを備える認識システムが提供されている。 A recognition system comprising a recognition device that reads a character line such as an address by OCR (optical character recognition) processing, and a VCS (video coding system) that receives character input from an operator when the recognition device fails to recognize the character line. provided.

VCSは、文字行を含む画像をオペレータに対して画面表示してオペレータによる文字の入力を受け付ける。
従来、VCSは、文字行の傾き又は大きさによっては、オペレータが文字行を視認しにくい画像を表示してしまうことがある。
The VCS displays an image including character lines on the screen for the operator and accepts input of characters by the operator.
Conventionally, the VCS may display an image in which the character line is difficult for the operator to visually recognize depending on the inclination or size of the character line.

特開2013-103163号公報JP 2013-103163 A

上記の課題を解決するため、オペレータが文字行を視認しやすい画像を表示することができる情報処理装置及びプログラムを提供する。 In order to solve the above problems, an information processing apparatus and a program are provided that can display an image in which the operator can easily visually recognize the character lines.

実施形態によれば、情報処理装置は、インターフェースと、プロセッサと、を備える。インターフェースは、外部装置及び入出力装置とデータを送受信する。プロセッサは、前記インターフェースを通じて、文字行が記載されている帳票を含む画像に対するOCR処理の過程で生成されるOCR中間情報を前記外部装置から受信し、前記OCR中間情報に基づいて、前記帳票が写る帳票画像の表示方法を補正し、前記インターフェースを通じて、前記入出力装置に補正後の前記帳票画像を表示させ、前記インターフェースを通じて、前記入出力装置に入力された文字を取得し、前記インターフェースを通じて、取得された前記文字に基づく文字情報を前記外部装置に送信する。 According to an embodiment, an information processing device includes an interface and a processor. The interface sends and receives data to and from external devices and input/output devices. The processor receives OCR intermediate information generated in the process of OCR processing for an image including a form on which text lines are described from the external device through the interface, and captures the form based on the OCR intermediate information. correcting the display method of the form image, causing the input/output device to display the corrected form image through the interface, acquiring characters input to the input/output device through the interface, and acquiring through the interface and transmitting character information based on the received characters to the external device.

図1は、第1の実施形態に係る認識システムの構成例を示すブロック図である。FIG. 1 is a block diagram showing a configuration example of a recognition system according to the first embodiment. 図2は、第1の実施形態に係るOCR装置の構成例を示すブロック図である。FIG. 2 is a block diagram showing a configuration example of the OCR device according to the first embodiment. 図3は、第1の実施形態に係る制御装置の構成例を示すブロック図である。FIG. 3 is a block diagram showing a configuration example of a control device according to the first embodiment. 図4は、第1の実施形態に係るVCSの構成例を示すブロック図である。FIG. 4 is a block diagram showing a configuration example of the VCS according to the first embodiment. 図5は、第1の実施形態に係る荷物画像の例を示す図である。FIG. 5 is a diagram showing an example of a package image according to the first embodiment. 図6は、第1の実施形態に係るOCR中間情報の構成例を示す図である。FIG. 6 is a diagram showing a configuration example of OCR intermediate information according to the first embodiment. 図7は、第1の実施形態に係る帳票画像の例を示す図である。FIG. 7 is a diagram showing an example of a form image according to the first embodiment. 図8は、第1の実施形態に係る補正後の帳票画像の例を示す図である。FIG. 8 is a diagram showing an example of a form image after correction according to the first embodiment. 図9は、第1の実施形態に係るVCSの動作例を示すフローチャートである。FIG. 9 is a flow chart showing an operation example of the VCS according to the first embodiment. 図10は、第2の実施形態に係る制御装置の動作例を示すフローチャートである。FIG. 10 is a flow chart showing an operation example of the control device according to the second embodiment. 図11は、第2の実施形態に係るVCSの動作例を示すフローチャートである。FIG. 11 is a flow chart showing an operation example of the VCS according to the second embodiment. 図12は、第3の実施形態に係る選択画面の例を示す図である。FIG. 12 is a diagram showing an example of a selection screen according to the third embodiment. 図13は、第3の実施形態に係るVCSの動作例を示すフローチャートである。FIG. 13 is a flow chart showing an operation example of the VCS according to the third embodiment.

以下、実施形態について、図面を参照して説明する。
(第1の実施形態)
実施形態に係る認識システムは、区分装置に投入される荷物から住所などの宛先を読み取る。認識システムは、読み取った宛先に基づいて荷物の仕分先(たとえば、区分装置のシュータなど)を設定する。認識システムは、宛先の読み取りに失敗した場合、宛先を目視したオペレータから宛先の入力を受け付ける。
Hereinafter, embodiments will be described with reference to the drawings.
(First embodiment)
A recognition system according to an embodiment reads a destination such as an address from a package put into a sorting device. The recognition system sets the sorting destination of the package (eg, the chute of the sorter) based on the read destination. If the recognition system fails to read the destination, the recognition system accepts the input of the destination from the operator who has visually observed the destination.

図1は、実施形態に係る認識システム1の構成例を示す。図1が示すように、認識システム1は、区分装置2、カメラ4、OCR装置10、制御装置20及びVCS30などを備える。OCR装置10は、カメラ4及び制御装置20に接続する。制御装置20は、区分装置2及びVCS30に接続する。 FIG. 1 shows a configuration example of a recognition system 1 according to an embodiment. As shown in FIG. 1, the recognition system 1 includes a segmentation device 2, a camera 4, an OCR device 10, a control device 20, a VCS 30 and the like. OCR device 10 connects to camera 4 and control device 20 . The controller 20 connects to the partitioning device 2 and the VCS 30 .

なお、認識システム1は、図1が示すような構成の他に必要に応じた構成をさらに具備したり、認識システム1から特定の構成が除外されたりしてもよい。 In addition to the configuration shown in FIG. 1 , the recognition system 1 may further include a configuration according to need, or a specific configuration may be excluded from the recognition system 1 .

区分装置2は、作業員、搬送ベルト又はロボットなどによって投入された荷物を区分する。区分装置2は、荷物の宛先に関連する宛先情報(文字情報)を制御装置20から受信する。区分装置2は、宛先情報に基づいて荷物を区分する。たとえば、区分装置2は、区分先としてのシュータ、ポケット、カート又はトレイなどに荷物を区分する。たとえば、区分装置2は、ソータ、搬送ベルト又はロボットなどから構成される。 The sorting device 2 sorts the articles put in by a worker, a conveyor belt, a robot, or the like. The sorting device 2 receives from the control device 20 destination information (character information) related to the destination of the parcel. The sorting device 2 sorts packages based on the destination information. For example, the sorting device 2 sorts packages into chutes, pockets, carts, trays, or the like as sorting destinations. For example, the sorting device 2 is composed of a sorter, a conveyor belt, a robot, or the like.

カメラ4は、区分装置2に投入される荷物を撮影する。カメラ4は、宛先が記載されている帳票を撮影する。たとえば、カメラ4は、帳票が添付されている面を撮影する。カメラ4は、撮影で得られた画像(荷物画像)をOCR装置10に供給する。 The camera 4 photographs the packages put into the sorting device 2. - 特許庁A camera 4 photographs a form on which an address is written. For example, the camera 4 takes an image of the side to which the form is attached. The camera 4 supplies the captured image (baggage image) to the OCR device 10 .

たとえば、カメラ4は、CCD(Charge Coupled Device)カメラである。また、カメラ4は、荷物を照らす光源を備えるものであってもよい。 For example, the camera 4 is a CCD (Charge Coupled Device) camera. Moreover, the camera 4 may be provided with a light source for illuminating the baggage.

OCR装置10は、カメラ4から荷物画像を取得する。OCR装置10は、OCR処理によって宛先情報を生成し、制御装置20に送信する。
また、OCR装置10は、OCR処理に失敗すると、OCR処理に関連するOCR中間情報を生成する。OCR装置10は、OCR中間情報と帳票画像とを制御装置20に送信する。
OCR装置10及びOCR中間情報については、後に詳述する。
The OCR device 10 acquires the parcel image from the camera 4 . The OCR device 10 generates destination information by OCR processing and transmits it to the control device 20 .
Further, when the OCR processing fails, the OCR device 10 generates OCR intermediate information related to the OCR processing. The OCR device 10 transmits the OCR intermediate information and the form image to the control device 20 .
The OCR device 10 and the OCR intermediate information will be detailed later.

制御装置20(外部装置)は、OCR装置10から宛先情報を取得し、区分装置2に送信する。
また、制御装置20は、OCR装置10からOCR中間情報及び荷物画像を取得し、VCS30に送信する。また、制御装置20は、VCS30から宛先情報を取得し、区分装置2に送信する。
制御装置20については、後述する。
The control device 20 (external device) acquires destination information from the OCR device 10 and transmits it to the sorting device 2 .
Also, the control device 20 acquires the OCR intermediate information and package image from the OCR device 10 and transmits them to the VCS 30 . Also, the control device 20 acquires destination information from the VCS 30 and transmits it to the sorting device 2 .
The control device 20 will be described later.

VCS30は、制御装置20からOCR中間情報及び帳票画像を取得する。VCS30は、OCR中間情報に基づいて荷物画像から帳票が写る帳票画像を抽出して表示する。VCS30は、表示された帳票画像を目視したオペレータから宛先の入力を受け付ける。VCS30は、入力された宛先を示す宛先情報を制御装置20に送信する。
VCS30については、後述する。
The VCS 30 acquires OCR intermediate information and form images from the control device 20 . The VCS 30 extracts and displays a form image showing a form from the parcel image based on the OCR intermediate information. The VCS 30 accepts input of a destination from an operator who views the displayed form image. The VCS 30 transmits destination information indicating the input destination to the control device 20 .
The VCS 30 will be described later.

次に、OCR装置10について説明する。
図2は、実施形態に係るOCR装置10の構成例を示す。図2は、OCR装置10の構成例を示すブロック図である。図2が示すように、OCR装置10は、プロセッサ11、ROM12、RAM13、NVM14、通信部15、操作部16、表示部17及びカメラインターフェース18などを備える。
Next, the OCR device 10 will be explained.
FIG. 2 shows a configuration example of the OCR device 10 according to the embodiment. FIG. 2 is a block diagram showing a configuration example of the OCR device 10. As shown in FIG. As shown in FIG. 2, the OCR device 10 includes a processor 11, a ROM 12, a RAM 13, an NVM 14, a communication section 15, an operation section 16, a display section 17, a camera interface 18, and the like.

プロセッサ11と、ROM12、RAM13、NVM14、通信部15、操作部16、表示部17及びカメラインターフェース18と、は、データバスなどを介して互いに接続する。
なお、OCR装置10は、図2が示すような構成の他に必要に応じた構成を具備したり、OCR装置10から特定の構成が除外されたりしてもよい。
The processor 11, ROM 12, RAM 13, NVM 14, communication section 15, operation section 16, display section 17 and camera interface 18 are connected to each other via a data bus or the like.
It should be noted that the OCR device 10 may have a configuration other than the configuration shown in FIG.

プロセッサ11は、OCR装置10全体の動作を制御する機能を有する。プロセッサ11は、内部キャッシュ及び各種のインターフェースなどを備えてもよい。プロセッサ11は、内部メモリ、ROM12又はNVM14が予め記憶するプログラムを実行することにより種々の処理を実現する。 The processor 11 has a function of controlling the operation of the OCR device 10 as a whole. Processor 11 may include an internal cache, various interfaces, and the like. The processor 11 implements various processes by executing programs pre-stored in the internal memory, ROM 12 or NVM 14 .

なお、プロセッサ11がプログラムを実行することにより実現する各種の機能のうちの一部は、ハードウエア回路により実現されるものであってもよい。この場合、プロセッサ11は、ハードウエア回路により実行される機能を制御する。 Note that some of the various functions realized by the processor 11 executing the program may be realized by hardware circuits. In this case, processor 11 controls the functions performed by the hardware circuits.

ROM12は、制御プログラム及び制御データなどが予め記憶された不揮発性のメモリである。ROM12に記憶される制御プログラム及び制御データは、OCR装置10の仕様に応じて予め組み込まれる。 The ROM 12 is a nonvolatile memory in which control programs, control data, and the like are stored in advance. The control program and control data stored in the ROM 12 are preinstalled according to the specifications of the OCR device 10 .

RAM13は、揮発性のメモリである。RAM13は、プロセッサ11の処理中のデータなどを一時的に格納する。RAM13は、プロセッサ11からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM13は、アプリケーションプログラムの実行に必要なデータ及びアプリケーションプログラムの実行結果などを格納してもよい。 RAM 13 is a volatile memory. The RAM 13 temporarily stores data being processed by the processor 11 . RAM 13 stores various application programs based on instructions from processor 11 . Also, the RAM 13 may store data necessary for executing the application program, execution results of the application program, and the like.

NVM14は、データの書き込み及び書き換えが可能な不揮発性のメモリである。NVM14は、たとえば、HDD(Hard Disk Drive)、SSD(Solid State Drive)又はフラッシュメモリなどから構成される。NVM14は、OCR装置10の運用用途に応じて制御プログラム、アプリケーション及び種々のデータなどを格納する。 The NVM 14 is a non-volatile memory in which data can be written and rewritten. The NVM 14 is composed of, for example, an HDD (Hard Disk Drive), SSD (Solid State Drive), flash memory, or the like. The NVM 14 stores control programs, applications, various data, etc. according to the operational use of the OCR device 10 .

たとえば、NVM14は、OCR処理を行うための辞書情報などを格納する。たとえば、辞書情報は、各文字の特徴量などを示す。また、辞書情報は、機械学習によって得られたネットワークなどであってもよい。辞書情報の構成は、特定の構成に限定されるものではない。 For example, the NVM 14 stores dictionary information and the like for performing OCR processing. For example, the dictionary information indicates the feature amount of each character. Also, the dictionary information may be a network or the like obtained by machine learning. The structure of dictionary information is not limited to a specific structure.

通信部15は、制御装置20などとデータを送受信するインターフェースである。たとえば、通信部15は、有線又は無線のLAN(Local Area Network)接続をサポートするインターフェースである。 The communication unit 15 is an interface that transmits and receives data to and from the control device 20 and the like. For example, the communication unit 15 is an interface that supports wired or wireless LAN (Local Area Network) connection.

操作部16は、オペレータから種々の操作の入力を受け付ける。操作部16は、入力された操作を示す信号をプロセッサ11へ送信する。操作部16は、タッチパネルから構成されてもよい。 The operation unit 16 receives input of various operations from the operator. The operation unit 16 transmits a signal indicating the input operation to the processor 11 . The operation unit 16 may be composed of a touch panel.

表示部17は、プロセッサ11からの画像データを表示する。たとえば、表示部17は、液晶モニタから構成される。操作部16がタッチパネルから構成される場合、表示部17は、操作部16と一体的に形成されてもよい。 The display unit 17 displays image data from the processor 11 . For example, the display unit 17 is composed of a liquid crystal monitor. When the operating section 16 is configured by a touch panel, the display section 17 may be formed integrally with the operating section 16 .

カメラインターフェース18は、カメラ4に接続するインターフェースである。カメラインターフェース18は、プロセッサ11からの信号をカメラ4に送信する。また、カメラインターフェース18は、カメラ4からの信号(荷物画像など)を取得しプロセッサ11に送信する。 A camera interface 18 is an interface that connects to the camera 4 . Camera interface 18 transmits signals from processor 11 to camera 4 . Also, the camera interface 18 acquires a signal (such as an image of luggage) from the camera 4 and transmits it to the processor 11 .

次に、制御装置20について説明する。
図3は、実施形態に係る制御装置20の構成例を示す。図3は、制御装置20の構成例を示すブロック図である。図3が示すように、制御装置20は、プロセッサ21、ROM22、RAM23、NVM24、通信部25、操作部26及び表示部27などを備える。
Next, the control device 20 will be explained.
FIG. 3 shows a configuration example of the control device 20 according to the embodiment. FIG. 3 is a block diagram showing a configuration example of the control device 20. As shown in FIG. As shown in FIG. 3, the control device 20 includes a processor 21, a ROM 22, a RAM 23, an NVM 24, a communication section 25, an operation section 26, a display section 27, and the like.

プロセッサ21と、ROM22、RAM23、NVM24、通信部25、操作部26及び表示部27と、は、データバスなどを介して互いに接続する。
なお、制御装置20は、図3が示すような構成の他に必要に応じた構成を具備したり、制御装置20から特定の構成が除外されたりしてもよい。
The processor 21, ROM 22, RAM 23, NVM 24, communication section 25, operation section 26 and display section 27 are connected to each other via a data bus or the like.
In addition to the configuration shown in FIG. 3, the control device 20 may have a configuration according to need, or a specific configuration may be excluded from the control device 20 .

プロセッサ21は、制御装置20全体の動作を制御する機能を有する。プロセッサ21は、内部キャッシュ及び各種のインターフェースなどを備えてもよい。プロセッサ21は、内部メモリ、ROM22又はNVM24が予め記憶するプログラムを実行することにより種々の処理を実現する。 The processor 21 has a function of controlling the operation of the control device 20 as a whole. Processor 21 may include an internal cache, various interfaces, and the like. The processor 21 implements various processes by executing programs pre-stored in the internal memory, ROM 22 or NVM 24 .

なお、プロセッサ21がプログラムを実行することにより実現する各種の機能のうちの一部は、ハードウエア回路により実現されるものであってもよい。この場合、プロセッサ21は、ハードウエア回路により実行される機能を制御する。 Note that some of the various functions realized by the processor 21 executing the program may be realized by hardware circuits. In this case, processor 21 controls the functions performed by the hardware circuits.

ROM22は、制御プログラム及び制御データなどが予め記憶された不揮発性のメモリである。ROM22に記憶される制御プログラム及び制御データは、制御装置20の仕様に応じて予め組み込まれる。 The ROM 22 is a nonvolatile memory in which control programs, control data, and the like are stored in advance. The control programs and control data stored in the ROM 22 are installed in advance according to the specifications of the control device 20 .

RAM23は、揮発性のメモリである。RAM23は、プロセッサ21の処理中のデータなどを一時的に格納する。RAM23は、プロセッサ21からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM23は、アプリケーションプログラムの実行に必要なデータ及びアプリケーションプログラムの実行結果などを格納してもよい。 RAM 23 is a volatile memory. The RAM 23 temporarily stores data being processed by the processor 21 . RAM 23 stores various application programs based on instructions from processor 21 . In addition, the RAM 23 may store data necessary for executing the application program, execution results of the application program, and the like.

NVM24は、データの書き込み及び書き換えが可能な不揮発性のメモリである。NVM24は、たとえば、HDD、SSD又はフラッシュメモリなどから構成される。NVM24は、制御装置20の運用用途に応じて制御プログラム、アプリケーション及び種々のデータなどを格納する。 The NVM 24 is a non-volatile memory in which data can be written and rewritten. The NVM 24 is composed of, for example, an HDD, SSD, flash memory, or the like. The NVM 24 stores control programs, applications, various data, and the like according to the operational use of the control device 20 .

通信部25は、区分装置2、OCR装置10及びVCS30などとデータを送受信するインターフェースである。たとえば、通信部25は、有線又は無線のLAN接続をサポートするインターフェースである。 The communication unit 25 is an interface that transmits and receives data to and from the sorting device 2, the OCR device 10, the VCS 30, and the like. For example, the communication unit 25 is an interface that supports wired or wireless LAN connection.

なお、通信部25は、区分装置2とデータを送受信するインターフェースと、OCR装置10とデータを送受信するインターフェースと、VCS30とデータを送受信するインターフェースと、から構成されるものであってもよい。 The communication unit 25 may be composed of an interface for transmitting/receiving data to/from the sorting device 2 , an interface for transmitting/receiving data to/from the OCR device 10 , and an interface for transmitting/receiving data to/from the VCS 30 .

操作部26は、オペレータから種々の操作の入力を受け付ける。操作部26は、入力された操作を示す信号をプロセッサ21へ送信する。操作部26は、タッチパネルから構成されてもよい。 The operation unit 26 receives input of various operations from the operator. The operation unit 26 transmits a signal indicating the input operation to the processor 21 . The operation unit 26 may be composed of a touch panel.

表示部27は、プロセッサ21からの画像データを表示する。たとえば、表示部27は、液晶モニタから構成される。操作部26がタッチパネルから構成される場合、表示部27は、操作部26と一体的に形成されてもよい。 The display unit 27 displays image data from the processor 21 . For example, the display unit 27 is composed of a liquid crystal monitor. When the operating section 26 is configured by a touch panel, the display section 27 may be formed integrally with the operating section 26 .

次に、VCS30について説明する。
図4は、実施形態に係るVCS30の構成例を示す。図4は、VCS30の構成例を示すブロック図である。図4が示すように、VCS30は、管理装置3及び入出力装置40などから構成される。管理装置3と入出力装置40とは、互いに接続する。
ここでは、VCS30は、3つの入出力装置40を備える。
Next, the VCS 30 will be explained.
FIG. 4 shows a configuration example of the VCS 30 according to the embodiment. FIG. 4 is a block diagram showing a configuration example of the VCS 30. As shown in FIG. As shown in FIG. 4, the VCS 30 comprises a management device 3, an input/output device 40, and the like. The management device 3 and the input/output device 40 are connected to each other.
Here, VCS 30 comprises three input/output devices 40 .

管理装置3(情報処理装置)は、VCS30全体を制御する。
管理装置3は、プロセッサ31、ROM32、RAM33、NVM34、通信部35及び入出力インターフェース36などを備える。
プロセッサ31と、ROM32、RAM33、NVM34、通信部35及び入出力インターフェース36と、は、データバスなどを介して互いに接続する。
The management device 3 (information processing device) controls the entire VCS 30 .
The management device 3 includes a processor 31, a ROM 32, a RAM 33, an NVM 34, a communication section 35, an input/output interface 36, and the like.
The processor 31, ROM 32, RAM 33, NVM 34, communication unit 35, and input/output interface 36 are connected to each other via a data bus or the like.

プロセッサ31は、管理装置3全体の動作を制御する機能を有する。プロセッサ31は、内部キャッシュ及び各種のインターフェースなどを備えてもよい。プロセッサ31は、内部メモリ、ROM32又はNVM34が予め記憶するプログラムを実行することにより種々の処理を実現する。 The processor 31 has a function of controlling the operation of the management device 3 as a whole. Processor 31 may include internal caches, various interfaces, and the like. The processor 31 implements various processes by executing programs pre-stored in the internal memory, ROM 32 or NVM 34 .

なお、プロセッサ31がプログラムを実行することにより実現する各種の機能のうちの一部は、ハードウエア回路により実現されるものであってもよい。この場合、プロセッサ31は、ハードウエア回路により実行される機能を制御する。 Note that some of the various functions realized by the processor 31 executing the program may be realized by hardware circuits. In this case, processor 31 controls the functions performed by the hardware circuits.

ROM32は、制御プログラム及び制御データなどが予め記憶された不揮発性のメモリである。ROM32に記憶される制御プログラム及び制御データは、管理装置3の仕様に応じて予め組み込まれる。 The ROM 32 is a nonvolatile memory in which control programs, control data, and the like are stored in advance. The control programs and control data stored in the ROM 32 are installed in advance according to the specifications of the management device 3 .

RAM33は、揮発性のメモリである。RAM33は、プロセッサ31の処理中のデータなどを一時的に格納する。RAM33は、プロセッサ31からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM33は、アプリケーションプログラムの実行に必要なデータ及びアプリケーションプログラムの実行結果などを格納してもよい。 RAM 33 is a volatile memory. The RAM 33 temporarily stores data being processed by the processor 31 . RAM 33 stores various application programs based on instructions from processor 31 . In addition, the RAM 33 may store data necessary for executing the application program, execution results of the application program, and the like.

NVM34は、データの書き込み及び書き換えが可能な不揮発性のメモリである。NVM34は、たとえば、HDD、SSD又はフラッシュメモリなどから構成される。NVM34は、管理装置3の運用用途に応じて制御プログラム、アプリケーション及び種々のデータなどを格納する。 The NVM 34 is a non-volatile memory in which data can be written and rewritten. The NVM 34 is composed of, for example, an HDD, SSD, flash memory, or the like. The NVM 34 stores control programs, applications, various data, and the like according to the operational use of the management device 3 .

通信部35は、制御装置20などとデータを送受信するインターフェースである。たとえば、通信部35は、有線又は無線のLAN接続をサポートするインターフェースである。 The communication unit 35 is an interface that transmits and receives data to and from the control device 20 and the like. For example, the communication unit 35 is an interface that supports wired or wireless LAN connection.

入出力インターフェース36は、入出力装置40とデータを送受信するインターフェースである。入出力インターフェース36は、帳票画像などを入出力装置40に送信する。また、入出力インターフェース36は、入出力装置40から宛先などを取得する。たとえば、入出力インターフェース36は、有線又は無線のLAN接続をサポートするインターフェースである。 The input/output interface 36 is an interface that transmits/receives data to/from the input/output device 40 . The input/output interface 36 transmits a form image and the like to the input/output device 40 . Also, the input/output interface 36 acquires the destination and the like from the input/output device 40 . For example, input/output interface 36 is an interface that supports wired or wireless LAN connection.

なお、通信部35と入出力インターフェース36とは、一体的に構成されるものであってもよい。 Note that the communication unit 35 and the input/output interface 36 may be configured integrally.

入出力装置40は、管理装置3からの帳票画像などを表示する。また、入出力装置40は、オペレータから宛先の入力を受け付ける。入出力装置40は、入力された宛先を管理装置3に送信する。 The input/output device 40 displays a form image or the like from the management device 3 . The input/output device 40 also receives an input of a destination from the operator. The input/output device 40 transmits the input destination to the management device 3 .

入出力装置40は、操作部41及び表示部42などを備える。
操作部41は、オペレータから種々の操作の入力を受け付ける。操作部26は、タッチパネルから構成されてもよい。入出力装置40は、操作部41に入力された操作を示す信号を管理装置3へ送信する。
The input/output device 40 includes an operation unit 41, a display unit 42, and the like.
The operation unit 41 receives inputs of various operations from the operator. The operation unit 26 may be composed of a touch panel. The input/output device 40 transmits a signal indicating the operation input to the operation unit 41 to the management device 3 .

表示部42は、管理装置3からの画像データ(帳票画像など)を表示する。たとえば、表示部27は、液晶モニタから構成される。操作部26がタッチパネルから構成される場合、表示部27は、操作部26と一体的に形成されてもよい。
たとえば、入出力装置40は、デスクトップPC又はノートPCなどである。
The display unit 42 displays image data (such as a form image) from the management device 3 . For example, the display unit 27 is composed of a liquid crystal monitor. When the operating section 26 is configured by a touch panel, the display section 27 may be formed integrally with the operating section 26 .
For example, the input/output device 40 is a desktop PC or a notebook PC.

なお、VCS30は、図4が示すような構成の他に必要に応じた構成を具備したり、VCS30から特定の構成が除外されたりしてもよい。 In addition to the configuration shown in FIG. 4, the VCS 30 may have a configuration according to need, or a specific configuration may be excluded from the VCS 30. FIG.

次に、OCR装置10が実現する機能について説明する。OCR装置10が実現する機能は、プロセッサ11が内部メモリ、ROM12又はNVM14などに格納されるプログラムを実行することで実現される。 Next, functions realized by the OCR device 10 will be described. The functions realized by the OCR device 10 are realized by the processor 11 executing a program stored in the internal memory, the ROM 12, the NVM 14, or the like.

まず、プロセッサ11は、荷物画像を取得する機能を有する。
ここでは、カメラ4は、区分装置2に投入される荷物を撮影可能な位置に設置されているものとする。
First, the processor 11 has a function of acquiring a parcel image.
Here, it is assumed that the camera 4 is installed at a position capable of photographing the packages thrown into the sorting device 2 .

プロセッサ11は、カメラインターフェース18を通じて、カメラ4に荷物を撮影させる。プロセッサ11は、カメラインターフェース18を通じて、荷物が写る荷物画像をカメラ4から取得する。 The processor 11 causes the camera 4 to photograph the baggage through the camera interface 18. - 特許庁The processor 11 acquires a parcel image showing the parcel from the camera 4 through the camera interface 18 .

図5は、プロセッサ11がカメラ4から取得した荷物画像200の例を示す。図5が示すように、荷物画像200は、荷物100の一面を含む。
また、荷物画像200は、荷物100の一面において、荷物100に添付されている帳票101乃至103を含む。帳票101乃至103には、宛先などの文字行が記載されている。
FIG. 5 shows an example package image 200 acquired by the processor 11 from the camera 4 . As FIG. 5 shows, package image 200 includes one side of package 100 .
Package image 200 also includes forms 101 to 103 attached to package 100 on one side of package 100 . Each of the forms 101 to 103 describes a character line such as an address.

また、プロセッサ11は、OCR処理によって荷物画像から宛先情報を取得する機能を有する。 The processor 11 also has a function of acquiring destination information from the parcel image by OCR processing.

まず、プロセッサ11は、所定の画像処理を用いて荷物画像200から帳票が写る領域(帳票領域)を抽出する。たとえば、プロセッサ11は、帳票のエッジ検出によって帳票領域を抽出する。また、プロセッサ11は、ニューラルネットワークなどの人工知能を用いて帳票領域を抽出してもよい。プロセッサ11が荷物画像200から帳票領域を抽出する方法は、特定の方法に限定されるものではない。 First, the processor 11 uses predetermined image processing to extract a region in which a form appears (a form region) from the parcel image 200 . For example, the processor 11 extracts the form area by edge detection of the form. Also, the processor 11 may extract the form area using artificial intelligence such as a neural network. The method by which the processor 11 extracts the form area from the parcel image 200 is not limited to a specific method.

また、プロセッサ11は、抽出された帳票領域のパラメータを取得する。ここでは、プロセッサ11は、帳票領域の座標(たとえば、中心座標)、サイズ及び角度(帳票領域の傾き)を取得する。 The processor 11 also acquires parameters of the extracted form area. Here, the processor 11 acquires the coordinates (for example, center coordinates), size and angle (inclination of the form area) of the form area.

帳票領域を抽出すると、プロセッサ11は、帳票領域から文字行(たとえば、1行の文字行)が写る領域(文字行領域)を抽出する。ここでは、プロセッサ11は、矩形の文字行領域(文字行を含む最小矩形領域)を抽出するものとする。 After extracting the form area, the processor 11 extracts an area (character line area) containing a character line (for example, one character line) from the form area. Here, the processor 11 extracts a rectangular character line area (minimum rectangular area including character lines).

プロセッサ11は、所定の画像処理を用いて帳票領域から宛先の文字行領域を抽出する。たとえば、プロセッサ11は、パターン認識によって文字行領域を検出して抽出する。また、プロセッサ11は、ニューラルネットワークなどの人工知能を用いて文字行領域を抽出してもよい。プロセッサ11が帳票領域から文字行領域を抽出する方法は、特定の方法に限定されるものではない。 The processor 11 extracts the destination text line area from the form area using predetermined image processing. For example, processor 11 detects and extracts character line regions by pattern recognition. Also, the processor 11 may extract the character line area using artificial intelligence such as a neural network. The method by which the processor 11 extracts the character line area from the form area is not limited to a specific method.

また、プロセッサ11は、抽出された文字行領域のパラメータを取得する。ここでは、プロセッサ11は、文字行領域の座標、サイズ及び角度(文字行領域の傾き)を取得する。また、プロセッサ11は、文字行領域に含まれる文字行が手書き又は印字であるかを示すフラグを取得する。たとえば、プロセッサ11は、所定の画像処理を用いて文字行領域に含まれる文字行が手書き又は印字であるかを判定する。 The processor 11 also obtains parameters of the extracted character line area. Here, the processor 11 acquires the coordinates, size and angle (inclination of the character line area) of the character line area. The processor 11 also obtains a flag indicating whether the character line included in the character line area is handwritten or printed. For example, the processor 11 uses predetermined image processing to determine whether the character line included in the character line area is handwritten or printed.

文字行領域を抽出すると、プロセッサ11は、文字行領域に含まれる文字行を認識する。 After extracting the character line area, the processor 11 recognizes the character lines included in the character line area.

たとえば、プロセッサ11は、文字行領域から1つの文字を含む領域(文字領域)を抽出する。文字領域を抽出すると、プロセッサ11は、文字領域の画像と辞書情報とをマッチングする。プロセッサ11は、マッチング処理によって、各文字領域に記載されている文字を認識する。 For example, the processor 11 extracts an area (character area) containing one character from the character line area. After extracting the character area, the processor 11 matches the image of the character area with the dictionary information. The processor 11 recognizes the characters written in each character area through matching processing.

各文字領域に記載されている文字を認識すると、プロセッサ11は、認識された文字に基づいて、帳票101乃至103に記載されている宛先を認識する。宛先を認識すると、プロセッサ11は、認識された宛先に基づいて宛先情報を生成する。 After recognizing the characters written in each character area, the processor 11 recognizes the destinations written on the forms 101 to 103 based on the recognized characters. Upon recognizing the destination, processor 11 generates destination information based on the recognized destination.

宛先情報を生成すると、プロセッサ11は、通信部15を通じて、生成された宛先情報を制御装置20に送信する。 After generating the destination information, the processor 11 transmits the generated destination information to the control device 20 through the communication unit 15 .

また、プロセッサ11は、宛先情報の取得に失敗すると、OCR中間情報及び荷物画像を制御装置20に送信する機能を有する。 The processor 11 also has a function of transmitting the OCR intermediate information and the parcel image to the control device 20 when acquisition of the destination information fails.

たとえば、プロセッサ11は、文字の認識に失敗すると、OCR中間情報を生成する。OCR中間情報は、OCR処理の過程で生成される情報から構成される。 For example, processor 11 generates OCR intermediate information when character recognition fails. The OCR intermediate information consists of information generated during the OCR process.

図6は、OCR中間情報の構成例を示す。図6が示すように、OCR中間情報は、荷物画像情報、帳票情報、文字行情報及び候補情報などから構成される。 FIG. 6 shows a configuration example of OCR intermediate information. As shown in FIG. 6, the OCR intermediate information consists of parcel image information, form information, character line information, candidate information, and the like.

荷物画像情報は、荷物画像に関連する。ここでは、荷物画像情報は、「画像のサイズ」から構成される。「画像のサイズ」は、荷物画像のサイズである。 Package image information relates to package images. Here, the package image information is composed of "image size". "Image size" is the size of the package image.

帳票情報は、帳票に関連する。ここでは、帳票情報は、「帳票の座標」、「帳票のサイズ」及び「帳票の角度」から構成される。 The form information is related to the form. Here, the form information is composed of "coordinates of form", "size of form" and "angle of form".

「帳票の座標」は、荷物画像における帳票領域の座標である。
「帳票のサイズ」は、荷物画像における帳票領域のサイズである。
「帳票の角度」は、荷物画像における帳票領域の角度である。
"Coordinates of form" are the coordinates of the form area in the parcel image.
"Size of form" is the size of the form area in the parcel image.
The "form angle" is the angle of the form area in the parcel image.

文字行情報は、文字行に関連する。ここでは、文字行情報は、「文字行の座標」、「文字行のサイズ」、「文字行の角度」及び「手書き・印活判定」から構成される。 Character line information relates to character lines. Here, the character line information is composed of "coordinates of character line", "size of character line", "angle of character line", and "handwriting/printing judgment".

「文字行の座標」は、荷物画像における文字行領域の座標である。
「文字行のサイズ」は、荷物画像における文字行領域のサイズである。
「文字行の角度」は、荷物画像における文字行領域の角度である。
「手書き・印活判定」は、文字行領域の文字行が手書き又は印字であるかを示す。
"Text line coordinates" are the coordinates of the text line area in the package image.
"Text line size" is the size of the text line area in the package image.
"Text line angle" is the angle of the text line area in the package image.
“Handwriting/printing judgment” indicates whether the character lines in the character line area are handwritten or printed.

候補情報は、宛先の候補に関連する。ここでは、候補情報は、「住所の候補」から構成される。「住所の候補」は、帳票に記載されている住所(宛先)の候補である。たとえば、プロセッサ11は、「住所の候補」として、確定はできないが宛先である可能性が高い文字行を含む候補情報を生成する。 The candidate information relates to candidate destinations. Here, the candidate information is composed of "address candidates". The “address candidate” is an address (destination) candidate described in the form. For example, the processor 11 generates candidate information including a character line that is highly likely to be the destination, although it cannot be determined, as an “address candidate”.

なお、帳票領域が複数ある場合には、OCR中間情報は、それぞれの帳票について、帳票情報、文字行情報及び候補情報を格納してもよい。
OCR中間情報の構成は、特定の構成に限定されるものではない。
Note that if there are a plurality of form areas, the OCR intermediate information may store form information, character line information, and candidate information for each form.
The configuration of the OCR intermediate information is not limited to a specific configuration.

また、プロセッサ11は、OCR処理の過程においてOCR中間情報を構成する情報の中で取得に失敗した情報がある場合、当該情報を含まないOCR中間情報を生成する。 In addition, if there is information that has failed to be acquired among the information that constitutes the OCR intermediate information in the course of the OCR processing, the processor 11 generates OCR intermediate information that does not include the information.

OCR中間情報を生成すると、プロセッサ11は、通信部15を通じて、OCR中間情報及び荷物画像を制御装置20に送信する。 After generating the OCR intermediate information, the processor 11 transmits the OCR intermediate information and the parcel image to the control device 20 through the communication unit 15 .

次に、制御装置20が実現する機能について説明する。制御装置20が実現する機能は、プロセッサ21が内部メモリ、ROM22又はNVM24などに格納されるプログラムを実行することで実現される。 Next, functions realized by the control device 20 will be described. The functions realized by the control device 20 are realized by the processor 21 executing a program stored in the internal memory, the ROM 22, the NVM 24, or the like.

プロセッサ21は、宛先情報を区分装置2に送信する機能を有する。
OCR装置10から宛先情報を受信した場合、プロセッサ21は、通信部25を通じて、受信された宛先情報を区分装置2に送信する。
The processor 21 has a function of transmitting destination information to the sorting device 2 .
When receiving destination information from the OCR device 10 , the processor 21 transmits the received destination information to the sorting device 2 through the communication unit 25 .

また、OCR装置10からOCR中間情報及び荷物画像を受信した場合、プロセッサ21は、通信部25を通じて、OCR中間情報及び荷物画像をVCS30に送信する。 Also, when receiving the OCR intermediate information and the package image from the OCR device 10 , the processor 21 transmits the OCR intermediate information and the package image to the VCS 30 through the communication unit 25 .

後述するように、VCS30は、荷物画像の帳票に記載されている宛先を示す宛先情報を制御装置20に送信する。 As will be described later, the VCS 30 transmits to the control device 20 destination information indicating the destination described in the form of the parcel image.

プロセッサ21は、通信部25を通じて、宛先情報をVCS30から受信する。VCS30から宛先情報を受信すると、プロセッサ21は、通信部25を通じて、受信された宛先情報を区分装置2に送信する。 The processor 21 receives destination information from the VCS 30 through the communication unit 25 . Upon receiving the destination information from the VCS 30 , the processor 21 transmits the received destination information to the sorting device 2 through the communication section 25 .

次に、VCS30が実現する機能について説明する。VCS30が実現する機能は、プロセッサ21が内部メモリ、ROM22又はNVM24などに格納されるプログラムを実行することで実現される。 Next, functions realized by the VCS 30 will be described. The functions realized by the VCS 30 are realized by the processor 21 executing programs stored in the internal memory, the ROM 22, the NVM 24, or the like.

まず、プロセッサ31は、荷物画像から帳票が写る画像(帳票画像)を抽出する機能を有する。 First, the processor 31 has a function of extracting an image showing a form (form image) from the parcel image.

ここでは、プロセッサ31は、通信部35を通じてOCR中間情報及び荷物画像を制御装置20から受信したものとする。 Here, it is assumed that the processor 31 has received the OCR intermediate information and the parcel image from the control device 20 through the communication unit 35 .

OCR中間情報及び荷物画像を受信すると、プロセッサ31は、OCR中間情報が帳票情報を含むかを判定する。OCR中間情報が帳票情報を含むと判定すると、プロセッサ31は、OCR中間情報の帳票情報に基づいて、荷物画像に帳票領域を設定する。帳票領域を設定すると、プロセッサ31は、帳票領域の内部の画像を帳票画像として取得する。 Upon receiving the OCR intermediate information and package image, processor 31 determines whether the OCR intermediate information includes form information. When determining that the OCR intermediate information includes the form information, the processor 31 sets the form area in the parcel image based on the form information of the OCR intermediate information. After setting the form area, the processor 31 acquires an image inside the form area as a form image.

図7は、プロセッサ31が抽出した帳票画像の例を示す。図7が示す例では、プロセッサ31は、帳票画像201乃至203を抽出する。帳票画像201乃至203は、それぞれ帳票101乃至103を含む。また、帳票画像201乃至203には、文字行領域301乃至303が設定されている。 FIG. 7 shows an example of the form image extracted by the processor 31 . In the example shown in FIG. 7, processor 31 extracts form images 201 to 203 . Form images 201 to 203 include forms 101 to 103, respectively. Character line areas 301 to 303 are set in the form images 201 to 203, respectively.

また、プロセッサ31は、OCR中間情報に基づいて、帳票画像201乃至203を補正する機能を有する。 The processor 31 also has a function of correcting the form images 201 to 203 based on the OCR intermediate information.

プロセッサ31は、オペレータの視認性が向上するように帳票画像の表示方法を補正した画像を生成する。ここでは、プロセッサ31は、帳票画像の大きさ及び角度を補正した画像を生成する。 The processor 31 generates an image in which the display method of the form image is corrected so as to improve the operator's visibility. Here, the processor 31 generates an image in which the size and angle of the form image are corrected.

たとえば、プロセッサ31は、OCR中間情報の文字行情報に基づいて、帳票画像における文字行領域の高さを取得する。たとえば、プロセッサ11は、「文字行のサイズ」などに基づいて、文字行領域の高さを取得する。 For example, the processor 31 acquires the height of the character line area in the form image based on the character line information of the OCR intermediate information. For example, the processor 11 acquires the height of the character line area based on the "character line size" or the like.

文字行領域の高さを取得すると、プロセッサ31は、文字行領域の高さが所定の値(たとえば、画面表示の基準となる文字行の高さ)となるように帳票画像を拡大又は縮小する倍率を算出する。倍率を算出すると、プロセッサ31は、当該倍率に従って帳票画像の大きさを補正する。 After obtaining the height of the character line area, the processor 31 enlarges or reduces the form image so that the height of the character line area becomes a predetermined value (for example, the height of the character line that is the reference for screen display). Calculate the magnification. After calculating the magnification, the processor 31 corrects the size of the form image according to the magnification.

帳票画像の大きさを補正すると、プロセッサ31は、「文字行の角度」に基づいて帳票画像の角度を補正する。ここでは、プロセッサ31は、文字行領域の一辺(たとえば、長辺)が所定の傾き、例えば水平となるように、帳票画像の傾き(角度)を補正する。なお、プロセッサ31は、「文字行の角度」と「帳票の角度」との相対角度に基づいて帳票画像の角度を補正してもよい。 After correcting the size of the form image, the processor 31 corrects the angle of the form image based on the "character line angle". Here, the processor 31 corrects the inclination (angle) of the form image so that one side (for example, the long side) of the character line area is inclined at a predetermined inclination, for example, horizontal. Note that the processor 31 may correct the angle of the form image based on the relative angle between the "character line angle" and the "form angle".

また、プロセッサ31は、帳票画像の角度を補正してから、帳票画像の大きさを補正してもよい。 Alternatively, the processor 31 may correct the angle of the form image and then correct the size of the form image.

図8は、プロセッサ31が補正した帳票画像の例を示す。図8が示す例では、プロセッサ31は、帳票画像201乃至203をそれぞれ補正して、補正後の帳票画像201’乃至203’を生成する。 FIG. 8 shows an example of a form image corrected by the processor 31. As shown in FIG. In the example shown in FIG. 8, the processor 31 corrects the form images 201 to 203 to generate post-correction form images 201' to 203'.

補正後の帳票画像201’乃至203’における文字行領域の高さは、所定の値に揃っている。また、補正後の帳票画像201’は、文字行領域の長辺が所定の傾き、例えば水平となるように補正されている。 The heights of the character line regions in the form images 201' to 203' after correction are uniform to a predetermined value. Further, the form image 201' after correction is corrected such that the long side of the character line area is inclined at a predetermined angle, for example, horizontal.

なお、1つの帳票画像に複数の文字行領域が設定されている場合、プロセッサ31は、複数の文字行領域の高さの平均又は最小値を文字行領域の高さとして取得してもよい。また、この場合、プロセッサ31は、複数の文字行領域の角度の平均値に基づいて、帳票画像の角度を補正してもよい。 Note that when a plurality of character line areas are set in one form image, the processor 31 may acquire the average or minimum value of the heights of the plurality of character line areas as the height of the character line area. Also, in this case, the processor 31 may correct the angle of the form image based on the average value of the angles of the plurality of character line regions.

また、プロセッサ31は、補正後の帳票画像を表示して、オペレータから宛先の入力を受け付ける機能を有する。 The processor 31 also has a function of displaying the corrected form image and receiving an input of the destination from the operator.

帳票画像を補正すると、プロセッサ31は、入出力インターフェース36を通じて入出力装置40の1つに補正後の帳票画像を表示させる。即ち、プロセッサ31は、入出力装置40の表示部42に補正後の帳票画像を表示させる。 After correcting the form image, the processor 31 causes one of the input/output devices 40 to display the corrected form image through the input/output interface 36 . That is, the processor 31 causes the display unit 42 of the input/output device 40 to display the corrected form image.

表示部42が補正後の帳票画像を表示させると、オペレータは、補正後の帳票画像を目視して帳票に記載されている宛先を入出力装置40の操作部41に入力する。 When the display unit 42 displays the corrected form image, the operator views the corrected form image and inputs the destination written on the form to the operation unit 41 of the input/output device 40 .

プロセッサ31は、入出力インターフェース36を通じて、操作部41に入力された宛先を取得する。 The processor 31 acquires the destination input to the operation unit 41 through the input/output interface 36 .

宛先を取得すると、プロセッサ31は、取得された宛先を示す宛先情報を生成する。宛先情報を生成すると、プロセッサ31は、通信部35を通じて、生成された宛先情報を制御装置20へ送信する。 After obtaining the destination, the processor 31 generates destination information indicating the obtained destination. After generating the destination information, processor 31 transmits the generated destination information to control device 20 through communication unit 35 .

なお、OCR中間情報が帳票情報を含まない場合、プロセッサ31は、入出力インターフェース36を通じて、入出力装置40の1つに荷物画像を表示させる。ここで、オペレータは、荷物画像を目視して帳票に記載されている宛先を入出力装置40の操作部41に入力する。 If the OCR intermediate information does not include the form information, the processor 31 causes one of the input/output devices 40 to display the parcel image through the input/output interface 36 . Here, the operator visually checks the parcel image and inputs the destination written on the form into the operation unit 41 of the input/output device 40 .

プロセッサ31は、入出力インターフェース36を通じて、操作部41に入力された宛先を取得する。宛先を取得すると、プロセッサ31は、取得された宛先を示す宛先情報を生成する。宛先情報を生成すると、プロセッサ31は、通信部35を通じて、生成された宛先情報を制御装置20へ送信する。 The processor 31 acquires the destination input to the operation unit 41 through the input/output interface 36 . After obtaining the destination, the processor 31 generates destination information indicating the obtained destination. After generating the destination information, processor 31 transmits the generated destination information to control device 20 through communication unit 35 .

次に、VCS30の動作例について説明する。
図9は、VCS30の動作例について説明するためのフローチャートである。
Next, an operation example of the VCS 30 will be described.
FIG. 9 is a flowchart for explaining an operation example of the VCS 30. FIG.

まず、VCS30のプロセッサ31は、通信部35を通じてOCR中間情報及び荷物画像を制御装置20から受信する(S11)。OCR中間情報及び荷物画像を制御装置20から受信すると、プロセッサ31は、OCR中間情報が帳票情報を含むかを判定する(S12)。 First, the processor 31 of the VCS 30 receives the OCR intermediate information and package image from the control device 20 through the communication section 35 (S11). Upon receiving the OCR intermediate information and package image from the control device 20, the processor 31 determines whether the OCR intermediate information includes form information (S12).

OCR中間情報が帳票情報を含むと判定すると(S12、YES)、プロセッサ31は、OCR中間情報が含む帳票情報に基づいて、荷物画像から帳票画像を抽出する(S13)。帳票画像を抽出すると、プロセッサ31は、OCR中間情報に基づいて帳票画像の大きさ及び傾きを補正する(S14)。 If it is determined that the OCR intermediate information includes the form information (S12, YES), the processor 31 extracts the form image from the parcel image based on the form information included in the OCR intermediate information (S13). After extracting the form image, the processor 31 corrects the size and inclination of the form image based on the OCR intermediate information (S14).

帳票画像の大きさ及び傾きを補正すると、プロセッサ31は、入出力インターフェース36を通じて入出力装置40の1つに補正後の帳票画像を表示させる(S15)。入出力装置40の1つに補正後の帳票画像を表示させると、プロセッサ31は、入出力インターフェース36を通じて、オペレータから宛先の入力を受け付ける(S16)。 After correcting the size and inclination of the form image, the processor 31 causes one of the input/output devices 40 to display the corrected form image through the input/output interface 36 (S15). When the corrected form image is displayed on one of the input/output devices 40, the processor 31 receives input of the destination from the operator through the input/output interface 36 (S16).

OCR中間情報が帳票情報を含まないと判定すると(S12、NO)、プロセッサ31は、入出力インターフェース36を通じて入出力装置40の1つに荷物画像を表示させる(S17)。入出力装置40の1つに荷物画像を表示させると、プロセッサ31は、入出力インターフェース36を通じて、オペレータから宛先の入力を受け付ける(S18)。 If it is determined that the OCR intermediate information does not contain the form information (S12, NO), the processor 31 causes one of the input/output devices 40 to display the parcel image through the input/output interface 36 (S17). When the package image is displayed on one of the input/output devices 40, the processor 31 accepts the input of the destination from the operator through the input/output interface 36 (S18).

オペレータから宛先の入力を受け付ける(S16又はS18)と、プロセッサ31は、通信部35を通じて、S16又はS18で入力された宛先を示す宛先情報を制御装置20に送信する(S19)。
宛先情報を制御装置20に送信すると、プロセッサ31は、動作を終了する。
Upon receiving the destination input from the operator (S16 or S18), the processor 31 transmits the destination information indicating the destination input in S16 or S18 to the control device 20 through the communication unit 35 (S19).
After transmitting the destination information to the control device 20, the processor 31 terminates its operation.

なお、プロセッサ31は、帳票情報に基づいて帳票画像を補正してもよい。たとえば、プロセッサ31は、帳票情報が示す「帳票のサイズ」及び「帳票の角度」に基づいて帳票画像の大きさ及び角度を補正してもよい。また、プロセッサ31は、帳票情報に基づいて帳票画像の大きさ及び角度を補正した後に、さらに文字行情報に基づいて帳票画像の大きさ及び角度を補正してもよい。 Note that the processor 31 may correct the form image based on the form information. For example, the processor 31 may correct the size and angle of the form image based on the "form size" and "form angle" indicated by the form information. Further, after correcting the size and angle of the form image based on the form information, the processor 31 may further correct the size and angle of the form image based on the character line information.

また、OCR中間情報は、文字行領域の頂点座標を示す文字行情報を含むものであってもよい。この場合、プロセッサ31は、文字行領域の頂点座標から文字行領域の高さ及び角度を算出してもよい。 Further, the OCR intermediate information may include character line information indicating vertex coordinates of the character line area. In this case, the processor 31 may calculate the height and angle of the character line area from the vertex coordinates of the character line area.

また、認識システム1は、複数のカメラ4及び複数のOCR装置10を備えるものであってもよい。また、認識システム1は、複数のVCS30を備えるものであってもよい。 The recognition system 1 may also include multiple cameras 4 and multiple OCR devices 10 . Also, the recognition system 1 may include a plurality of VCSs 30 .

以上のように構成された認識システムは、OCR処理の過程で生成されたOCR中間情報をVCSに送信する。認識システムは、OCR中間情報に基づいて、オペレータが視認しやすくなるように帳票画像を補正する。その結果、認識システムは、オペレータが文字行を視認しやすい画像を表示することができる。
(第2の実施形態)
次に、第2の実施形態について説明する。
第2の実施形態に係る認識システム1は、制御装置20が荷物画像から帳票画像を抽出する点で第1の実施形態に係るそれと異なる。従って、その他の点については同一の符号付して詳細な説明を省略する。
The recognition system configured as described above transmits OCR intermediate information generated in the course of OCR processing to the VCS. Based on the OCR intermediate information, the recognition system corrects the form image so that the operator can easily recognize it. As a result, the recognition system can display an image in which the operator can easily visually recognize the character lines.
(Second embodiment)
Next, a second embodiment will be described.
The recognition system 1 according to the second embodiment differs from that according to the first embodiment in that the control device 20 extracts the form image from the parcel image. Therefore, other points are denoted by the same reference numerals, and detailed description thereof is omitted.

第2の実施形態に係る認識システム1の構成は、第1の実施形態のそれと同様であるため説明を省略する。 Since the configuration of the recognition system 1 according to the second embodiment is the same as that of the first embodiment, the description thereof is omitted.

次に、制御装置20が実現する機能について説明する。制御装置20が実現する機能は、プロセッサ21が内部メモリ、ROM22又はNVM24などに格納されるプログラムを実行することで実現される。制御装置20が実現する機能は、第1の実施形態に係る制御装置20が実現する機能に加えて以下の機能を実現する。 Next, functions realized by the control device 20 will be described. The functions realized by the control device 20 are realized by the processor 21 executing a program stored in the internal memory, the ROM 22, the NVM 24, or the like. Functions implemented by the control device 20 implement the following functions in addition to the functions implemented by the control device 20 according to the first embodiment.

プロセッサ21は、OCR中間情報及び帳票画像をVCS30に送信する機能を有する。
前述の通り、プロセッサ21は、通信部25を通じて、OCR装置10からOCR中間情報及び荷物画像を受信する。OCR中間情報及び荷物画像を受信すると、プロセッサ21は、OCR中間情報が帳票情報を含むかを判定する。
The processor 21 has a function of transmitting OCR intermediate information and form images to the VCS 30 .
As described above, the processor 21 receives OCR intermediate information and parcel images from the OCR device 10 through the communication unit 25 . Upon receiving the OCR intermediate information and package image, processor 21 determines whether the OCR intermediate information includes document information.

OCR中間情報が帳票情報を含むと判定すると、プロセッサ21は、OCR中間情報の帳票情報に基づいて、荷物画像に帳票領域を設定する。帳票領域を設定すると、プロセッサ31は、帳票領域の内部の画像を帳票画像として取得する。 When determining that the OCR intermediate information includes the form information, the processor 21 sets the form area in the parcel image based on the form information of the OCR intermediate information. After setting the form area, the processor 31 acquires an image inside the form area as a form image.

帳票画像を取得すると、プロセッサ21は、通信部25を通じて、OCR中間情報及び帳票画像をVCS30に送信する。 After obtaining the form image, the processor 21 transmits the OCR intermediate information and the form image to the VCS 30 through the communication unit 25 .

なお、OCR中間情報が帳票情報を含まないと判定すると、プロセッサ21は、通信部25を通じて、荷物画像をVCS30に送信する。この場合、プロセッサ21は、OCR中間情報をVCS30に送信しなくともよい。 Note that when determining that the OCR intermediate information does not include the form information, the processor 21 transmits the parcel image to the VCS 30 through the communication section 25 . In this case, processor 21 may not send OCR intermediate information to VCS 30 .

次に、VCS30が実現する機能について説明する。VCS30が実現する機能は、プロセッサ21が内部メモリ、ROM22又はNVM24などに格納されるプログラムを実行することで実現される。VCS30が実現する機能は、第1の実施形態に係るVCS30が実現する機能に加えて以下の機能を実現する。 Next, functions realized by the VCS 30 will be described. The functions realized by the VCS 30 are realized by the processor 21 executing programs stored in the internal memory, the ROM 22, the NVM 24, or the like. Functions implemented by the VCS 30 implement the following functions in addition to the functions implemented by the VCS 30 according to the first embodiment.

プロセッサ31は、制御装置20からデータに応じて宛先情報を制御装置20に送信する機能を有する。 The processor 31 has a function of transmitting destination information to the control device 20 according to data from the control device 20 .

プロセッサ31は、通信部35を通じて、データを制御装置20から受信する。
データがOCR中間情報及び帳票画像を含む場合、プロセッサ31は、OCR中間情報に基づいて帳票画像を補正する。プロセッサ31が帳票画像を補正する動作例は、第1の実施形態のそれと同様であるため説明を省略する。
Processor 31 receives data from control device 20 through communication unit 35 .
If the data includes OCR intermediate information and a form image, processor 31 corrects the form image based on the OCR intermediate information. An example of the operation of the processor 31 correcting the form image is the same as that of the first embodiment, so the explanation is omitted.

帳票画像を補正すると、第1の実施形態と同様に、プロセッサ31は、補正後の帳票画像を表示して、オペレータから宛先の入力を受け付ける。宛先の入力を受け付けると、プロセッサ31は、通信部35を通じて、入力された宛先を示す宛先情報を制御装置20に送信する。 After correcting the form image, the processor 31 displays the corrected form image and accepts the input of the destination from the operator, as in the first embodiment. Upon receiving the input of the destination, processor 31 transmits destination information indicating the input destination to control device 20 via communication unit 35 .

また、データが荷物画像を含む場合、第1の実施形態と同様に、プロセッサ31は、荷物画像を表示して、オペレータから宛先の入力を受け付ける。宛先の入力を受け付けると、プロセッサ31は、通信部35を通じて、入力された宛先を示す宛先情報を制御装置20に送信する。 Also, when the data includes a parcel image, the processor 31 displays the parcel image and receives an input of the destination from the operator, as in the first embodiment. Upon receiving the input of the destination, processor 31 transmits destination information indicating the input destination to control device 20 via communication unit 35 .

次に、制御装置20の動作例について説明する。
図10は、制御装置20の動作例について説明するためのフローチャートである。
Next, an operation example of the control device 20 will be described.
FIG. 10 is a flowchart for explaining an operation example of the control device 20. As shown in FIG.

まず、制御装置20のプロセッサ21は、通信部25を通じてOCR中間情報及び荷物画像をOCR装置10から受信する(S21)。OCR中間情報及び荷物画像をOCR装置10から受信すると、プロセッサ21は、OCR中間情報が帳票情報を含むかを判定する(S22)。 First, the processor 21 of the control device 20 receives the OCR intermediate information and the parcel image from the OCR device 10 through the communication section 25 (S21). Upon receiving the OCR intermediate information and package image from the OCR device 10, the processor 21 determines whether the OCR intermediate information includes form information (S22).

OCR中間情報が帳票情報を含むと判定すると(S22、YES)、プロセッサ21は、OCR中間情報が含む帳票情報に基づいて、荷物画像から帳票画像を抽出する(S23)。帳票画像を抽出すると、プロセッサ21は、通信部25を通じて、OCR中間情報及び帳票画像をVCS30に送信する(S24)。 If it is determined that the OCR intermediate information includes the form information (S22, YES), the processor 21 extracts the form image from the parcel image based on the form information included in the OCR intermediate information (S23). After extracting the form image, the processor 21 transmits the OCR intermediate information and the form image to the VCS 30 through the communication unit 25 (S24).

OCR中間情報が帳票情報を含まないと判定すると(S22、NO)、プロセッサ21は、通信部25を通じて、荷物画像をVCS30に送信する(S25)。 When determining that the OCR intermediate information does not include the form information (S22, NO), the processor 21 transmits the package image to the VCS 30 through the communication section 25 (S25).

OCR中間情報及び帳票画像をVCS30に送信した場合(S24)、又は、荷物画像をVCS30に送信した場合(S25)、プロセッサ21は、通信部25を通じて宛先情報をVCS30から受信するまで待機する。 When the OCR intermediate information and the form image are transmitted to the VCS 30 (S24), or when the parcel image is transmitted to the VCS 30 (S25), the processor 21 waits until destination information is received from the VCS 30 through the communication unit 25.

宛先情報をVCS30から受信すると(S26)、プロセッサ21は、通信部25を通じて宛先情報を区分装置2に送信する(S27)。
宛先情報を区分装置2に送信すると、プロセッサ21は、動作を終了する。
Upon receiving the destination information from the VCS 30 (S26), the processor 21 transmits the destination information to the sorting device 2 through the communication section 25 (S27).
After sending the destination information to the sorting device 2, the processor 21 ends the operation.

次に、VCS30の動作例について説明する。
図11は、VCS30の動作例について説明するためのフローチャートである。
Next, an operation example of the VCS 30 will be described.
FIG. 11 is a flowchart for explaining an operation example of the VCS 30. As shown in FIG.

まず、VCS30のプロセッサ31は、通信部35を通じてデータを制御装置20から受信する(S31)。データを制御装置20から受信すると、プロセッサ31は、データがOCR中間情報及び帳票情報を含むかを判定する(S32)。 First, the processor 31 of the VCS 30 receives data from the control device 20 through the communication section 35 (S31). Upon receiving the data from the control device 20, the processor 31 determines whether the data includes OCR intermediate information and form information (S32).

データがOCR中間情報及び帳票情報を含むと判定すると(S32、YES)、プロセッサ31は、OCR中間情報に基づいて帳票画像の大きさ及び傾きを補正する(S33)。 When determining that the data includes OCR intermediate information and form information (S32, YES), the processor 31 corrects the size and tilt of the form image based on the OCR intermediate information (S33).

帳票画像の大きさ及び傾きを補正すると、プロセッサ31は、入出力インターフェース36を通じて入出力装置40の1つに補正後の帳票画像を表示させる(S34)。入出力装置40の1つに補正後の帳票画像を表示させると、プロセッサ31は、入出力インターフェース36を通じて、オペレータから宛先の入力を受け付ける(S35)。 After correcting the size and inclination of the form image, the processor 31 causes one of the input/output devices 40 to display the corrected form image through the input/output interface 36 (S34). When the corrected form image is displayed on one of the input/output devices 40, the processor 31 receives an input of the destination from the operator through the input/output interface 36 (S35).

データがOCR中間情報及び帳票情報を含まない(荷物画像を含む)と判定すると(S32、NO)、プロセッサ31は、入出力インターフェース36を通じて入出力装置40の1つに荷物画像を表示させる(S36)。入出力装置40の1つに荷物画像を表示させると、プロセッサ31は、入出力インターフェース36を通じて、オペレータから宛先の入力を受け付ける(S37)。 If it is determined that the data does not contain the OCR intermediate information and the form information (the package image is included) (S32, NO), the processor 31 causes one of the input/output devices 40 to display the package image through the input/output interface 36 (S36 ). When the package image is displayed on one of the input/output devices 40, the processor 31 accepts the input of the destination from the operator through the input/output interface 36 (S37).

オペレータから宛先の入力を受け付ける(S35又はS37)と、プロセッサ31は、通信部35を通じて、S35又はS37で入力された宛先を示す宛先情報を制御装置20に送信する(S38)。
宛先情報を制御装置20に送信すると、プロセッサ31は、動作を終了する。
Upon receiving the destination input from the operator (S35 or S37), the processor 31 transmits the destination information indicating the destination input in S35 or S37 to the control device 20 through the communication unit 35 (S38).
After transmitting the destination information to the control device 20, the processor 31 terminates its operation.

以上のように構成された認識システムは、制御装置において帳票画像を抽出してVCSに送信する。その結果、認識システムは、制御装置とVCSとの間の通信量を抑制することができる。
(第3の実施形態)
次に、第3の実施形態について説明する。
第3の実施形態に係る認識システム1は、オペレータに宛先を入力する帳票を選択させる点で第1の実施形態のそれと異なる。従って、その他の点については同一の符号付して詳細な説明を省略する。
In the recognition system configured as described above, the control device extracts the form image and transmits it to the VCS. As a result, the recognition system can reduce the amount of communication between the control device and the VCS.
(Third Embodiment)
Next, a third embodiment will be described.
The recognition system 1 according to the third embodiment differs from that of the first embodiment in that the operator selects a form for inputting the destination. Therefore, other points are denoted by the same reference numerals, and detailed description thereof is omitted.

第3の実施形態に係る認識システム1の構成は、第1の実施形態のそれと同様であるため説明を省略する。 Since the configuration of the recognition system 1 according to the third embodiment is the same as that of the first embodiment, the description thereof is omitted.

次に、VCS30が実現する機能について説明する。VCS30が実現する機能は、プロセッサ21が内部メモリ、ROM22又はNVM24などに格納されるプログラムを実行することで実現される。VCS30が実現する機能は、第1の実施形態に係るVCS30が実現する機能に加えて以下の機能を実現する。 Next, functions realized by the VCS 30 will be described. The functions realized by the VCS 30 are realized by the processor 21 executing programs stored in the internal memory, the ROM 22, the NVM 24, or the like. Functions implemented by the VCS 30 implement the following functions in addition to the functions implemented by the VCS 30 according to the first embodiment.

まず、プロセッサ31は、宛先を入力する帳票の選択を受け付ける機能を有する。
たとえば、帳票画像を補正すると、プロセッサ31は、入出力インターフェース36を通じて入出力装置40の1つに帳票の選択を受け付ける画面(選択画面)を表示させる。
First, the processor 31 has a function of accepting selection of a form for inputting destinations.
For example, when the form image is corrected, the processor 31 causes one of the input/output devices 40 to display a screen (selection screen) for accepting selection of a form through the input/output interface 36 .

図12は、入出力装置40が表示する選択画面の例を示す。図12が示すように、選択画面は、荷物画像200に帳票を選択するアイコン401乃至403を重ねて表示する。図12が示す例では、選択画面は、帳票101乃至103上にそれぞれ数値を含むアイコン401乃至403を表示する。 FIG. 12 shows an example of a selection screen displayed by the input/output device 40. As shown in FIG. As shown in FIG. 12, the selection screen displays icons 401 to 403 for selecting a form overlaid on a parcel image 200 . In the example shown in FIG. 12, the selection screen displays icons 401 to 403 containing numerical values on forms 101 to 103, respectively.

オペレータは、帳票を選択する操作として、操作部41を通じてアイコン401乃至403の何れかへのタップを入力又は数値を入力する。
プロセッサ31は、操作部41を通じて、オペレータから帳票を選択する操作の入力を受け付ける。
The operator taps any one of the icons 401 to 403 or inputs a numerical value through the operation unit 41 as an operation for selecting a form.
The processor 31 receives an operation input for selecting a form from the operator through the operation unit 41 .

また、プロセッサ31は、選択された帳票に対応する補正後の帳票画像を表示して、オペレータから宛先の入力を受け付ける機能を有する。 The processor 31 also has a function of displaying a corrected form image corresponding to the selected form and receiving an input of a destination from the operator.

帳票の選択を受け付けると、プロセッサ31は、入出力インターフェース36を通じて入出力装置40の1つに、選択された帳票に対応する補正後の帳票画像を表示させる。即ち、プロセッサ31は、入出力装置40の表示部42に、選択された帳票に対応する補正後の帳票画像を表示させる。 Upon receiving the selection of a form, the processor 31 causes one of the input/output devices 40 through the input/output interface 36 to display the corrected form image corresponding to the selected form. That is, the processor 31 causes the display unit 42 of the input/output device 40 to display the corrected form image corresponding to the selected form.

表示部42が選択された帳票に対応する補正後の帳票画像を表示させると、オペレータは、選択された帳票に対応する補正後の帳票画像を目視して帳票に記載されている宛先を入出力装置40の操作部41に入力する。 When the display unit 42 displays the corrected form image corresponding to the selected form, the operator views the corrected form image corresponding to the selected form and inputs/outputs the destination described in the form. Input to the operation unit 41 of the device 40 .

プロセッサ31は、入出力インターフェース36を通じて、操作部41に入力された宛先を取得する。 The processor 31 acquires the destination input to the operation unit 41 through the input/output interface 36 .

宛先を取得すると、プロセッサ31は、取得された宛先を示す宛先情報を生成する。宛先情報を生成すると、プロセッサ31は、通信部35を通じて、生成された宛先情報を制御装置20へ送信する。 After obtaining the destination, the processor 31 generates destination information indicating the obtained destination. After generating the destination information, processor 31 transmits the generated destination information to control device 20 through communication unit 35 .

次に、VCS30の動作例について説明する。
図13は、VCS30の動作例について説明するためのフローチャートである。
Next, an operation example of the VCS 30 will be described.
FIG. 13 is a flowchart for explaining an operation example of the VCS 30. FIG.

まず、VCS30のプロセッサ31は、通信部35を通じてOCR中間情報及び荷物画像を制御装置20から受信する(S41)。OCR中間情報及び荷物画像を制御装置20から受信すると、プロセッサ31は、OCR中間情報が帳票情報を含むかを判定する(S42)。 First, the processor 31 of the VCS 30 receives the OCR intermediate information and package image from the control device 20 through the communication section 35 (S41). Upon receiving the OCR intermediate information and the parcel image from the control device 20, the processor 31 determines whether the OCR intermediate information includes form information (S42).

OCR中間情報が帳票情報を含むと判定すると(S42、YES)、プロセッサ31は、OCR中間情報が含む帳票情報に基づいて、荷物画像から帳票画像を抽出する(S43)。帳票画像を抽出すると、プロセッサ31は、OCR中間情報に基づいて帳票画像の大きさ及び傾きを補正する(S44)。 If it is determined that the OCR intermediate information includes the form information (S42, YES), the processor 31 extracts the form image from the parcel image based on the form information included in the OCR intermediate information (S43). After extracting the form image, the processor 31 corrects the size and inclination of the form image based on the OCR intermediate information (S44).

帳票画像の大きさ及び傾きを補正すると、プロセッサ31は、入出力インターフェース36を通じて帳票を選択する操作の入力を受け付ける(S45)。帳票を選択する操作の入力を受け付けると、プロセッサ31は、入出力装置40の1つに選択された帳票に対応する補正後の帳票画像を表示させる(S46)。 After correcting the size and inclination of the form image, the processor 31 receives input of an operation for selecting a form through the input/output interface 36 (S45). When the input of the operation for selecting the form is accepted, the processor 31 causes the corrected form image corresponding to the selected form to be displayed on one of the input/output devices 40 (S46).

入出力装置40の1つに選択された帳票に対応する補正後の帳票画像を表示させると、プロセッサ31は、入出力インターフェース36を通じて、オペレータから宛先の入力を受け付ける(S47)。 When the corrected form image corresponding to the selected form is displayed on one of the input/output devices 40, the processor 31 receives the input of the destination from the operator through the input/output interface 36 (S47).

OCR中間情報が帳票情報を含まないと判定すると(S42、NO)、プロセッサ31は、入出力インターフェース36を通じて入出力装置40の1つに荷物画像を表示させる(S48)。入出力装置40の1つに荷物画像を表示させると、プロセッサ31は、入出力インターフェース36を通じて、オペレータから宛先の入力を受け付ける(S49)。 If it is determined that the OCR intermediate information does not contain the form information (S42, NO), the processor 31 causes one of the input/output devices 40 to display the parcel image through the input/output interface 36 (S48). When the package image is displayed on one of the input/output devices 40, the processor 31 accepts the input of the destination from the operator through the input/output interface 36 (S49).

オペレータから宛先の入力を受け付ける(S47又はS49)と、プロセッサ31は、通信部35を通じて、S47又はS49で入力された宛先を示す宛先情報を制御装置20に送信する(S50)。
宛先情報を制御装置20に送信すると、プロセッサ31は、動作を終了する。
Upon receiving the destination input from the operator (S47 or S49), the processor 31 transmits destination information indicating the destination input in S47 or S49 to the control device 20 through the communication unit 35 (S50).
After transmitting the destination information to the control device 20, the processor 31 terminates its operation.

なお、プロセッサ31は、複数の帳票を選択する操作の入力を受け付けてもよい。たとえば、プロセッサ31は、1つの帳票に記載されている宛先の入力を受け付けると、再度、帳票を選択する操作の入力を受け付けてもよい。即ち、プロセッサ31は、オペレータの操作に従って、S45乃至S47を複数回繰り返してもよい。 Note that the processor 31 may accept input of an operation for selecting a plurality of forms. For example, processor 31 may accept input of an operation to select a form again after accepting input of a destination described in one form. That is, the processor 31 may repeat S45 to S47 multiple times according to the operator's operation.

また、認識システム1は、第2の実施形態に係る認識システム1の特徴を備えるものであっても良い。 Also, the recognition system 1 may have the features of the recognition system 1 according to the second embodiment.

以上のように構成された認識システムは、オペレータの操作に従って帳票を選択する。認識システムは、選択された帳票に対応する補正後の帳票画像を表示してオペレータから宛先の入力を受け付ける。その結果、認識システムは、オペレータの入力効率を向上させることができる。 The recognition system configured as described above selects a form according to the operator's operation. The recognition system displays the corrected form image corresponding to the selected form and accepts the input of the destination from the operator. As a result, the recognition system can improve operator input efficiency.

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 While several embodiments of the invention have been described, these embodiments have been presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and modifications can be made without departing from the scope of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the scope of the invention described in the claims and equivalents thereof.

1…認識システム、2…区分装置、3…管理装置、4…カメラ、10…OCR装置、11…プロセッサ、12…ROM、13…RAM、14…NVM、15…通信部、16…操作部、17…表示部、18…カメラインターフェース、20…制御装置、21…プロセッサ、22…ROM、23…RAM、24…NVM、25…通信部、26…操作部、27…表示部、30…VCS、31…プロセッサ、32…ROM、33…RAM、34…NVM、35…通信部、36…入出力インターフェース、40…入出力装置、41…操作部、42…表示部、100…荷物、101…帳票、102…帳票、103…帳票、200…荷物画像、201…帳票画像、201’…帳票画像、202…帳票画像、203…帳票画像、203’…帳票画像、301…文字行領域、302…文字行領域、303…文字行領域、401…アイコン、402…アイコン、403…アイコン。 Reference Signs List 1 recognition system 2 sorting device 3 management device 4 camera 10 OCR device 11 processor 12 ROM 13 RAM 14 NVM 15 communication unit 16 operation unit 17... Display unit, 18... Camera interface, 20... Control device, 21... Processor, 22... ROM, 23... RAM, 24... NVM, 25... Communication unit, 26... Operation unit, 27... Display unit, 30... VCS, 31... Processor, 32... ROM, 33... RAM, 34... NVM, 35... Communication unit, 36... Input/output interface, 40... Input/output device, 41... Operation unit, 42... Display unit, 100... Package, 101... Form , 102... Form 103... Form 200... Package image 201... Form image 201'... Form image 202... Form image 203... Form image 203'... Form image 301... Character line area 302... Character Line area 303...Character line area 401...Icon 402...Icon 403...Icon.

Claims (10)

外部装置及び入出力装置とデータを送受信するインターフェースと、
前記インターフェースを通じて、文字行が記載されている帳票を含む画像に対するOCR処理の過程で生成されるOCR中間情報を前記外部装置から受信し、
前記OCR中間情報に基づいて、前記帳票が写る帳票画像の表示方法を補正し、
前記インターフェースを通じて、前記入出力装置に補正後の前記帳票画像を表示させ、
前記インターフェースを通じて、前記入出力装置に入力された文字を取得し、
前記インターフェースを通じて、取得された前記文字に基づく文字情報を前記外部装置に送信する、
プロセッサと、
を備える情報処理装置。
an interface for transmitting and receiving data to and from an external device and an input/output device;
receiving OCR intermediate information generated in the process of OCR processing for an image containing a form on which text lines are written from the external device through the interface;
correcting a display method of a form image showing the form based on the OCR intermediate information;
causing the input/output device to display the corrected form image through the interface;
Obtaining characters input to the input/output device through the interface;
Transmitting character information based on the obtained character to the external device through the interface;
a processor;
Information processing device.
前記プロセッサは、前記帳票画像の大きさ又は傾きを補正する、
請求項1に記載の情報処理装置。
wherein the processor corrects the size or tilt of the form image;
The information processing device according to claim 1 .
前記OCR中間情報は、前記画像において前記文字行が写る文字行領域のサイズ及び傾きを含む、
請求項1又は2に記載の情報処理装置。
The OCR intermediate information includes the size and inclination of the character line area in which the character line appears in the image,
The information processing apparatus according to claim 1 or 2.
前記プロセッサは、前記文字行領域の高さに基づいて、前記帳票画像の大きさを補正する、
請求項3に記載の情報処理装置。
wherein the processor corrects the size of the form image based on the height of the text line area;
The information processing apparatus according to claim 3.
前記プロセッサは、前記文字行領域の一辺が所定の傾きとなるように、前記帳票画像の傾きを補正する、
請求項3又は4に記載の情報処理装置。
The processor corrects the inclination of the form image so that one side of the text line area has a predetermined inclination.
The information processing apparatus according to claim 3 or 4.
前記OCR中間情報は、前記帳票が写る帳票領域に関する帳票情報を含み、
前記プロセッサは、
前記インターフェースを通じて、前記画像を前記外部装置から受信し、
前記帳票情報に基づいて、前記画像から前記帳票画像を抽出する、
請求項1乃至5の何れか1項に記載の情報処理装置。
The OCR intermediate information includes form information related to a form area in which the form appears,
The processor
receiving the image from the external device through the interface;
extracting the form image from the image based on the form information;
The information processing apparatus according to any one of claims 1 to 5.
前記プロセッサは、前記インターフェースを通じて、前記帳票画像を前記外部装置から受信する、
請求項1乃至5の何れか1項に記載の情報処理装置。
the processor receives the form image from the external device through the interface;
The information processing apparatus according to any one of claims 1 to 5.
前記プロセッサは、
前記インターフェースを通じて、前記帳票を選択する操作の入力を受け付け、
前記インターフェースを通じて、前記入出力装置に選択された前記帳票に対応する補正後の前記帳票画像を表示させる、
請求項1乃至7の何れか1項に記載の情報処理装置。
The processor
Receiving input of an operation to select the form through the interface,
displaying the corrected form image corresponding to the selected form on the input/output device through the interface;
The information processing apparatus according to any one of claims 1 to 7.
前記文字行は、宛先である、
請求項1乃至8の何れか1項に記載の情報処理装置。
the character line is a destination,
The information processing apparatus according to any one of claims 1 to 8.
プロセッサによって実行されるプログラムであって、
前記プロセッサに、
文字行が記載されている帳票を含む画像に対するOCR処理の過程で生成されるOCR中間情報を外部装置から受信する機能と、
前記OCR中間情報に基づいて、前記帳票が写る帳票画像の表示方法を補正する機能と、
入出力装置に補正後の前記帳票画像を表示させる機能と、
前記入出力装置に入力された文字を取得する機能と、
取得された前記文字に基づく文字情報を前記外部装置に送信する機能と、
を実現させるプログラム。
A program executed by a processor,
to the processor;
A function of receiving from an external device OCR intermediate information generated in the process of OCR processing for an image containing a form on which text lines are described;
a function of correcting a display method of a form image showing the form based on the OCR intermediate information;
a function of displaying the corrected form image on an input/output device;
a function of acquiring characters input to the input/output device;
a function of transmitting character information based on the acquired characters to the external device;
program to realize
JP2021131869A 2021-08-13 2021-08-13 Information processing apparatus and program Pending JP2023026154A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021131869A JP2023026154A (en) 2021-08-13 2021-08-13 Information processing apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021131869A JP2023026154A (en) 2021-08-13 2021-08-13 Information processing apparatus and program

Publications (1)

Publication Number Publication Date
JP2023026154A true JP2023026154A (en) 2023-02-24

Family

ID=85252406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021131869A Pending JP2023026154A (en) 2021-08-13 2021-08-13 Information processing apparatus and program

Country Status (1)

Country Link
JP (1) JP2023026154A (en)

Similar Documents

Publication Publication Date Title
US7787693B2 (en) Text detection on mobile communications devices
CN109409398B (en) Image processing apparatus, image processing method, and storage medium
US20090324081A1 (en) Method and apparatus for recognizing character in character recognizing apparatus
US9024953B2 (en) Image generating apparatus, projector, computer program, and image generating method
JP2015133049A (en) Image collation device, image sensor, processing system, and image collation method
JP2017069599A (en) Image processing apparatus and program
JP2018173818A (en) Portable information processing device and method utilizing the same and program
US20210158092A1 (en) Image processing system, image processing method, and storage medium
CN106373154B (en) Image processing apparatus and image processing method
US20220415068A1 (en) Recognition apparatus and program
JP2023026154A (en) Information processing apparatus and program
JP2017199288A (en) Image processing device, image processing method and program
CN115187987A (en) Method and device for recognizing text outside special area, electronic equipment and storage medium
CN110390323B (en) Information processing apparatus and computer readable medium
JP5985327B2 (en) Display device
JP2002049455A (en) Input interface device and portable information equipment equipped with the device
US20220413623A1 (en) Information processing apparatus, system, and control method
WO2023171622A1 (en) Recognition device, program, and system
JP2984267B1 (en) Object processing method
CN116930207B (en) Display method for synchronously amplifying field of view of display area and real-time area
US20240203148A1 (en) Workflow approval system, approval order setting method, and non-transitory computer-readable storage medium
WO2023120432A1 (en) Drawing assistance device and drawing assistance method
JP2020135272A (en) Information processor and program
JP2021068293A (en) Object identification device
JP2019159557A (en) Unread determination threshold value setting method and unread determination threshold value setting apparatus

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20230105

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240516