JP2020178168A - Image forming apparatus - Google Patents

Image forming apparatus Download PDF

Info

Publication number
JP2020178168A
JP2020178168A JP2019077116A JP2019077116A JP2020178168A JP 2020178168 A JP2020178168 A JP 2020178168A JP 2019077116 A JP2019077116 A JP 2019077116A JP 2019077116 A JP2019077116 A JP 2019077116A JP 2020178168 A JP2020178168 A JP 2020178168A
Authority
JP
Japan
Prior art keywords
unit
document
character
data
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019077116A
Other languages
Japanese (ja)
Inventor
隆一 奥村
Ryuichi Okumura
隆一 奥村
光利 中尾
Mitsutoshi Nakao
光利 中尾
忍 吉奥
Shinobu Yoshioku
忍 吉奥
大介 市川
Daisuke Ichikawa
大介 市川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2019077116A priority Critical patent/JP2020178168A/en
Publication of JP2020178168A publication Critical patent/JP2020178168A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

To provide an image forming apparatus that, when dividing an integrated image, can reduce time and effort to re-arrange divided images.SOLUTION: An image forming apparatus 100 comprises: a learning unit 218; an imaging unit 2; a division unit 211; and a first extraction unit 212. The learning unit 218 learns document data including documents to estimate relation between characters. The imaging unit 2 images a sheet formed through integration of a plurality of documents, to create imaging data. The division unit 211 divides the imaging data for each of the documents to create divided data. The divided data includes first divided data and second divided data different from the first divided data. The first extraction unit 212 extracts a first character from the first divided data and extracts a second character from the second divided data. Upon receiving input of the first character and the second character, the learning unit 218 outputs an estimation result indicating a degree of the relation between the first character and the second character.SELECTED DRAWING: Figure 2

Description

本発明は、画像形成装置に関する。 The present invention relates to an image forming apparatus.

特許文献1に記載の画像処理装置は、判定手段と、第1サムネイル生成手段と、表示手段とを備える。判定手段は、入力されたドキュメントが、その1ページにN(N≧2)ページ分の原稿内容がまとめられているN−upドキュメントであるか否かを判定する。第1サムネイル生成手段は、判定手段によってN−upドキュメントであると判定された場合に、Nページの各々のサムネイルである第1サムネイルを生成する。表示手段は、第1サムネイルをプレビュー表示する。特許文献1に記載の画像処理装置の表示手段は、1upドキュメントをプレビュー表示できる。 The image processing apparatus described in Patent Document 1 includes a determination means, a first thumbnail generation means, and a display means. The determination means determines whether or not the input document is an N-up document in which the contents of the manuscript for N (N ≧ 2) pages are summarized on one page thereof. The first thumbnail generation means generates a first thumbnail which is a thumbnail of each of N pages when the determination means determines that the document is an N-up document. The display means previews the first thumbnail. The display means of the image processing apparatus described in Patent Document 1 can preview and display a 1-up document.

特開2010−28205号公報Japanese Unexamined Patent Publication No. 2010-28205

しかしながら、N−upドキュメントのように複数の画像が集約された画像を、画像ごとに分割する場合、画像の順序が連続するように並ばないことがある。したがって、特許文献1に記載の画像形成装置では、ユーザーには、画像の順序を並び替える手間が発生する。 However, when an image in which a plurality of images are aggregated, such as an N-up document, is divided for each image, the images may not be arranged in a continuous order. Therefore, in the image forming apparatus described in Patent Document 1, the user has to take the trouble of rearranging the order of the images.

本発明は上記課題に鑑みてなされたものであり、集約された画像を分割する際に、分割された画像を並び替える手間を抑制できる画像形成装置を提供することを目的とする。 The present invention has been made in view of the above problems, and an object of the present invention is to provide an image forming apparatus capable of suppressing the trouble of rearranging the divided images when the aggregated images are divided.

本発明に係る画像形成装置は、文書を示す文書データに基づいて、シートに文書を形成する。画像形成装置は、学習部と、撮像部と、分割部と、第1抽出部とを備える。前記学習部は、文字と文字との繋がりを推定するために、前記文書を含む文書データを学習する。前記撮像部は、複数の文書が集約されて形成されたシートを撮像して、撮像データを生成する。前記分割部は、前記撮像データを1ページ分の前記文書ごとに分割して、複数の分割データを生成する。前記第1抽出部は、前記分割データの各々から文字を抽出する。前記分割データは、第1分割データと前記第1分割データと異なる第2分割データとを含む。前記第1抽出部は、前記第1分割データが含む第1文書から第1文字を抽出し、前記第2分割データが含む第2文書から第2文字を抽出する。前記第1文書は、前記1ページ分の分割データによって表される文書を示す。前記第2文書は、前記第1文書と異なる前記1ページ分の分割データによって表される文書を示す。前記第1文字は前記第1文書の記載が始まる位置を示す文頭又は前記第1文書の記載が終わる位置を示す文末のうち、いずれか一方の位置に含まれる文字である。前記第2文字は前記第2文書の記載が始まる位置を示す文頭又は前記第2文書の記載が終わる位置を示す文末のうち、前記第1文字が含まれる位置と異なる位置の文字である。前記学習部は、前記第1文字と前記第2文字とが入力されることで、前記第1文字と前記第2文字との繋がりの程度を示す推定結果を出力する。 The image forming apparatus according to the present invention forms a document on a sheet based on the document data indicating the document. The image forming apparatus includes a learning unit, an imaging unit, a dividing unit, and a first extraction unit. The learning unit learns document data including the document in order to estimate the connection between characters. The imaging unit captures a sheet formed by aggregating a plurality of documents to generate imaging data. The division unit divides the imaging data for each page of the document to generate a plurality of division data. The first extraction unit extracts characters from each of the divided data. The divided data includes a first divided data and a second divided data different from the first divided data. The first extraction unit extracts the first character from the first document included in the first divided data, and extracts the second character from the second document included in the second divided data. The first document indicates a document represented by the divided data for one page. The second document indicates a document represented by the divided data for one page different from the first document. The first character is a character included in either the beginning of a sentence indicating the position where the description of the first document starts or the end of the sentence indicating the position where the description of the first document ends. The second character is a character at a position different from the position including the first character at the beginning of the sentence indicating the position where the description of the second document starts or the end of the sentence indicating the position where the description of the second document ends. By inputting the first character and the second character, the learning unit outputs an estimation result indicating the degree of connection between the first character and the second character.

本発明の画像形成装置によれば、集約された画像を分割する際に、分割された画像を並び替える手間を抑制できる。 According to the image forming apparatus of the present invention, when the aggregated images are divided, it is possible to reduce the trouble of rearranging the divided images.

本発明の実施形態1に係る画像形成装置の構成を示す図である。It is a figure which shows the structure of the image forming apparatus which concerns on Embodiment 1 of this invention. 本実施形態1に係る制御部の構成を示す図である。It is a figure which shows the structure of the control part which concerns on this Embodiment 1. 本実施形態1におけるタッチパネル部に表示された選択画面を示す図である。It is a figure which shows the selection screen displayed on the touch panel part in Embodiment 1. 本実施形態1における分割データを示す分割画像を表示した表示画面を示す図である。It is a figure which shows the display screen which displayed the divided image which shows the divided data in Embodiment 1. 本実施形態1における分割データを示す分割画像を表示した表示画面を示す別の図である。It is another figure which shows the display screen which displayed the divided image which shows the divided data in Embodiment 1. FIG. 本実施形態1における制御部が実行する処理を示すフローチャートである。It is a flowchart which shows the process which the control part executes in 1st Embodiment. 本実施形態1における第1決定処理を示すフローチャートである。It is a flowchart which shows the 1st decision process in this Embodiment 1. 本発明の実施形態2に係る制御部の構成を示す図である。It is a figure which shows the structure of the control part which concerns on Embodiment 2 of this invention. 本実施形態2における分割データを示す分割画像を表示した表示画面を示す図である。It is a figure which shows the display screen which displayed the divided image which shows the divided data in Embodiment 2. 本実施形態2における分割データを示す分割画像を表示した表示画面を示す別の図である。It is another figure which shows the display screen which displayed the divided image which shows the divided data in Embodiment 2. 本実施形態2における制御部が実行する処理を示すフローチャートである。It is a flowchart which shows the process which the control part executes in 2nd Embodiment. 本実施形態2における制御部が実行する第2決定処理を示すフローチャートである。It is a flowchart which shows the 2nd decision process which a control part executes in 2nd Embodiment. 本実施形態2における制御部が実行する選択処理を示すフローチャートである。It is a flowchart which shows the selection process which the control part executes in 2nd Embodiment.

以下、本発明の実施形態について、図面を参照しながら説明する。なお、図中、同一又は相当部分については同一の参照符号を付して説明を繰り返さない。また、本発明の実施形態において、X軸、Y軸、及びZ軸は互いに直交し、X軸及びY軸は水平方向に平行であり、Z軸は鉛直方向に平行である。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the drawings, the same or corresponding parts are designated by the same reference numerals and the description is not repeated. Further, in the embodiment of the present invention, the X-axis, the Y-axis, and the Z-axis are orthogonal to each other, the X-axis and the Y-axis are parallel in the horizontal direction, and the Z-axis is parallel in the vertical direction.

[実施形態1]
まず、図1を参照して、本発明の実施形態1に係る画像形成装置100の構成について説明する。図1は、画像形成装置100の構成を示す図である。画像形成装置100は、カラー複合機である。また、画像形成装置100は、パーソナルコンピューターと通信可能に接続されていてもよい。
[Embodiment 1]
First, the configuration of the image forming apparatus 100 according to the first embodiment of the present invention will be described with reference to FIG. FIG. 1 is a diagram showing a configuration of an image forming apparatus 100. The image forming apparatus 100 is a color multifunction device. Further, the image forming apparatus 100 may be connected to the personal computer in a communicable manner.

図1に示すように、画像形成装置100は、画像形成ユニット1、画像読取ユニット2、原稿搬送ユニット3、及び操作表示部4を備える。画像形成ユニット1は、シートPに画像を形成する。 As shown in FIG. 1, the image forming apparatus 100 includes an image forming unit 1, an image reading unit 2, a document conveying unit 3, and an operation display unit 4. The image forming unit 1 forms an image on the sheet P.

画像読取ユニット2は、シートRに形成された画像を読み取り、画像を表す撮像データを生成する。具体的には、画像読取ユニット2は、シートRを撮像してシートRを表す撮像データを生成する。シートRは、原稿である。シートRは、画像が形成されたシートPを示す。画像は文書を含む。また、画像は複数の文書が集約された画像を含む。画像読取ユニット2は、「撮像部」の一例に相当する。画像読取ユニット2は、コンタクトガラス、LED(Light Emitting Diode)、ミラー、キャリッジ、結像レンズ、及び、CCD(Charge Coupled Device)を備えている。LED及びミラーは、キャリッジによって支持されている。 The image reading unit 2 reads the image formed on the sheet R and generates imaging data representing the image. Specifically, the image reading unit 2 images the sheet R and generates image data representing the sheet R. Sheet R is a manuscript. Sheet R indicates the sheet P on which the image was formed. The image contains a document. In addition, the image includes an image in which a plurality of documents are aggregated. The image reading unit 2 corresponds to an example of an “imaging unit”. The image reading unit 2 includes a contact glass, an LED (Light Emitting Mode), a mirror, a carriage, an imaging lens, and a CCD (Charge Coupled Device). The LEDs and mirrors are supported by carriages.

画像読取ユニット2によるシートRの画像読取方法には、フラットベッド読取モード、及び、ADF(Auto Document Feeder)読取モードの2種類の方法が存在する。フラットベッド読取モードでは、原稿載置用ガラス上に載置されたシートRの画像を読み取る。ADF読取モードでは、原稿搬送ユニット3によってシートRを搬送させ、シートRが読取位置を通過する際に、シートRの画像を読み取る。原稿搬送ユニット3がシートRを移動させながら、CCDがシートRの画像の読み取りを行い、画像を表す撮像データを生成する。シートRは、例えば、普通紙、コピー紙、再生紙、薄紙、厚紙、又は光沢紙、又はOHP(Overhead Projector)シートである。 There are two types of image reading methods for the sheet R by the image reading unit 2: a flatbed reading mode and an ADF (Auto Document Feeder) reading mode. In the flatbed scanning mode, the image of the sheet R placed on the document placing glass is read. In the ADF reading mode, the document transport unit 3 transports the sheet R, and when the sheet R passes through the scanning position, the image of the sheet R is read. While the document transport unit 3 moves the sheet R, the CCD reads the image on the sheet R and generates imaging data representing the image. The sheet R is, for example, plain paper, copy paper, recycled paper, thin paper, thick paper, glossy paper, or an OHP (Overhead Projector) sheet.

原稿搬送ユニット3は、シートRを画像読取ユニット2に搬送する。 The document transport unit 3 transports the sheet R to the image reading unit 2.

操作表示部4は、タッチパネル41と、操作ボタン42とを有する。タッチパネル41は、表示装置43とタッチセンサー45とを有する。表示装置43は種々の画像を表示する。表示装置43は、例えば液晶表示装置(Liquid Crystaal Display:LCD)である。タッチセンサー45はユーザーからの操作を受け付ける。また、操作ボタン42はユーザーからの操作を受け付ける。 The operation display unit 4 has a touch panel 41 and operation buttons 42. The touch panel 41 has a display device 43 and a touch sensor 45. The display device 43 displays various images. The display device 43 is, for example, a liquid crystal display device (Liquid Crystal Display: LCD). The touch sensor 45 receives an operation from the user. Further, the operation button 42 accepts an operation from the user.

タッチパネル41は、ユーザーからの操作を受け付ける度に、ユーザーからの操作の内容を示す操作情報を生成する。具体的には、タッチパネル41には、複数のアイコンが表示される。そして、ユーザーは、アイコンをタップする。タッチパネル41は、操作情報として、アイコンがタップされたことを示す情報を生成する。 Each time the touch panel 41 receives an operation from the user, the touch panel 41 generates operation information indicating the content of the operation from the user. Specifically, a plurality of icons are displayed on the touch panel 41. Then, the user taps the icon. The touch panel 41 generates information indicating that the icon has been tapped as operation information.

操作表示部4は、ユーザーからの操作に基づいて、タッチパネル41に表示する画像を変更する。具体的には、操作表示部4は、タッチパネル41に表示された複数のアイコンのうち、ユーザーによって操作されたアイコンに対応する画像をタッチパネル41に表示する。また、操作表示部4は、タッチパネル41に表示する画像に対応する情報を、記憶部22から読み出す。 The operation display unit 4 changes the image displayed on the touch panel 41 based on the operation from the user. Specifically, the operation display unit 4 displays on the touch panel 41 an image corresponding to the icon operated by the user among the plurality of icons displayed on the touch panel 41. Further, the operation display unit 4 reads out the information corresponding to the image displayed on the touch panel 41 from the storage unit 22.

画像形成ユニット1は、搬送機構11、給送部12、トナー供給部13、画像形成部14、定着部15、排出部16、制御部21及び記憶部22を含む。画像形成ユニット1は、搬送路Lを有する。 The image forming unit 1 includes a transport mechanism 11, a feeding unit 12, a toner supply unit 13, an image forming unit 14, a fixing unit 15, a discharging unit 16, a control unit 21, and a storage unit 22. The image forming unit 1 has a transport path L.

搬送路Lは、給送部12から排出部16までシートPを案内する。搬送路Lは、給送部12から排出部16まで延びる。 The transport path L guides the sheet P from the feeding section 12 to the discharging section 16. The transport path L extends from the feeding section 12 to the discharging section 16.

搬送機構11は、シートPを搬送する。具体的には、搬送機構11は、シートPを画像形成部14及び定着部15を経由して排出部16まで搬送する。また、搬送機構11は、定着部15で画像が定着されたシートPを反転して画像形成部14へ搬送できる。 The transport mechanism 11 transports the sheet P. Specifically, the transport mechanism 11 transports the sheet P to the discharge unit 16 via the image forming unit 14 and the fixing unit 15. Further, the transport mechanism 11 can invert the sheet P on which the image is fixed by the fixing portion 15 and convey it to the image forming portion 14.

給送部12は、シートPを搬送路Lへ供給する。シートPは、例えば、普通紙、コピー紙、再生紙、薄紙、厚紙、又は光沢紙、又はOHP(Overhead Projector)シートである。 The feeding unit 12 supplies the sheet P to the transport path L. The sheet P is, for example, plain paper, copy paper, recycled paper, thin paper, thick paper, glossy paper, or an OHP (Overhead Projector) sheet.

トナー供給部13には、複数のトナーコンテナが装着される。複数のトナーコンテナのうちの1つは、シアン色のトナーが収納される。複数のトナーコンテナのうちの1つは、マゼンタ色のトナーが収納される。複数のトナーコンテナのうちの1つは、イエロー色のトナーが収納される。複数のトナーコンテナのうちの1つは、黒色のトナーが収納される。 A plurality of toner containers are mounted on the toner supply unit 13. One of the plurality of toner containers stores cyan-colored toner. One of the plurality of toner containers stores magenta toner. One of the plurality of toner containers stores yellow toner. One of the plurality of toner containers stores black toner.

画像形成部14は、画像をシートPに形成する。具体的には、画像形成部14は、複数のシートPに複数の画像を形成する。画像形成部14は、転写部を含む。転写部は、画像をシートPに転写する。その結果、シートPに画像が形成される。 The image forming unit 14 forms an image on the sheet P. Specifically, the image forming unit 14 forms a plurality of images on the plurality of sheets P. The image forming unit 14 includes a transfer unit. The transfer unit transfers the image to the sheet P. As a result, an image is formed on the sheet P.

画像形成部14は、複数の画像形成部を含む。複数の画像形成部のうちの1つは、シアン色のトナー像を形成する。複数の画像形成部のうちの1つは、マゼンタ色のトナー像を形成する。複数の画像形成部のうちの1つは、イエロー色のトナー像を形成する。複数の画像形成部のうちの1つは、ブラック色のトナー像を形成する。 The image forming unit 14 includes a plurality of image forming units. One of the plurality of image forming portions forms a cyan toner image. One of the plurality of image forming portions forms a magenta toner image. One of the plurality of image forming portions forms a yellow toner image. One of the plurality of image forming portions forms a black toner image.

画像形成部14は、転写部と、像担持体と、帯電部と、露光部と、現像部とを含む。 The image forming unit 14 includes a transfer unit, an image carrier, a charging unit, an exposure unit, and a developing unit.

転写部は、トナー画像をシートPに転写する。転写部は、中間転写ベルトを含む。中間転写ベルトは、無端状のベルトである。中間転写ベルトには、複数色のトナー像が形成される。具体的には、中間転写ベルトには、複数の画像形成部14が中間転写ベルトにトナー像を形成する。この結果、複数色のトナー像が中間転写ベルト上で重畳され、中間転写ベルト上に画像が形成される。そして、中間転写ベルトに形成された画像は、シートPに転写される。その結果、シートPに画像が形成される。 The transfer unit transfers the toner image to the sheet P. The transfer section includes an intermediate transfer belt. The intermediate transfer belt is an endless belt. Toner images of a plurality of colors are formed on the intermediate transfer belt. Specifically, on the intermediate transfer belt, a plurality of image forming portions 14 form a toner image on the intermediate transfer belt. As a result, toner images of a plurality of colors are superimposed on the intermediate transfer belt, and an image is formed on the intermediate transfer belt. Then, the image formed on the intermediate transfer belt is transferred to the sheet P. As a result, an image is formed on the sheet P.

像担持体は、ドラム形状であり、回転軸を有する。像担持体は、回転軸を中心に時計回りに回転する。像担持体は、外周面側に感光層を有する。 The image carrier is drum-shaped and has a rotation axis. The image carrier rotates clockwise about the axis of rotation. The image carrier has a photosensitive layer on the outer peripheral surface side.

帯電部は像担持体の感光層を所定の電位に帯電する。露光部は、像担持体の感光層にレーザー光を照射して露光する。露光部は画像データに基づいて像担持体を露光する。この結果、像担持体に静電潜像が形成される。 The charged portion charges the photosensitive layer of the image carrier to a predetermined potential. The exposed portion irradiates the photosensitive layer of the image carrier with laser light to expose it. The exposed unit exposes the image carrier based on the image data. As a result, an electrostatic latent image is formed on the image carrier.

現像部は像担持体上の静電潜像を現像する。現像部は現像ローラーを有する。現像ローラーは、像担持体にトナーを供給し、像担持体上の静電潜像を現像してトナー画像を形成する。この結果、像担持体の外周面にトナー画像が形成される。 The developing unit develops an electrostatic latent image on the image carrier. The developing unit has a developing roller. The developing roller supplies toner to the image carrier and develops an electrostatic latent image on the image carrier to form a toner image. As a result, a toner image is formed on the outer peripheral surface of the image carrier.

転写部は、像担持体の外周面に形成されたトナー画像をシートPに転写する。その結果、シートPにトナー画像が転写される。 The transfer unit transfers the toner image formed on the outer peripheral surface of the image carrier to the sheet P. As a result, the toner image is transferred to the sheet P.

定着部15は、シートPを加熱及び加圧し、シートPに形成された画像をシートPに定着する。具体的には、定着部15は、シートPを加熱及び加圧し、シートPに形成されたトナー画像をシートPに定着する。 The fixing portion 15 heats and pressurizes the sheet P, and fixes the image formed on the sheet P to the sheet P. Specifically, the fixing unit 15 heats and pressurizes the sheet P, and fixes the toner image formed on the sheet P on the sheet P.

排出部16は、シートPを画像形成装置100の外部へ排出する。定着部15がトナー画像をシートPに定着させた後、搬送機構11はシートPを定着部15から排出部16まで搬送する。そして、排出部16はトナー画像の定着したシートPを画像形成装置100の外部に排出する。 The discharge unit 16 discharges the sheet P to the outside of the image forming apparatus 100. After the fixing section 15 fixes the toner image on the sheet P, the transport mechanism 11 transports the sheet P from the fixing section 15 to the discharging section 16. Then, the discharge unit 16 discharges the sheet P on which the toner image is fixed to the outside of the image forming apparatus 100.

制御部21は、画像形成装置100の動作を制御する。制御部21は、プロセッサーと記憶装置とを含む。プロセッサーは、例えばCPU(Central Processing Unit)を含む。プロセッサーは、記憶装置に記憶された制御プログラムを実行して、操作表示部4、搬送機構11、給送部12、画像形成部14、定着部15、及び排出部16を制御する。 The control unit 21 controls the operation of the image forming apparatus 100. The control unit 21 includes a processor and a storage device. The processor includes, for example, a CPU (Central Processing Unit). The processor executes a control program stored in the storage device to control the operation display unit 4, the transport mechanism 11, the feeding unit 12, the image forming unit 14, the fixing unit 15, and the discharging unit 16.

記憶部22は、記憶装置を含む。具体的には、記憶部22は、半導体メモリーのようなメモリーを備え、HDD(Hard Disk Drive)を備えてもよい。記憶部22は、制御プログラムを記憶している。 The storage unit 22 includes a storage device. Specifically, the storage unit 22 may include a memory such as a semiconductor memory, and may include an HDD (Hard Disk Drive). The storage unit 22 stores the control program.

次に図2を参照して、制御部21の構成を詳しく説明する。図2は、本実施形態に係る制御部21の構成を示す図である。制御部21は、学習部218、分割部211、及び第1抽出部212を含む。制御部21は、制御プログラムを実行することで、学習部218、分割部211、及び第1抽出部212として機能する。 Next, the configuration of the control unit 21 will be described in detail with reference to FIG. FIG. 2 is a diagram showing a configuration of a control unit 21 according to the present embodiment. The control unit 21 includes a learning unit 218, a division unit 211, and a first extraction unit 212. By executing the control program, the control unit 21 functions as a learning unit 218, a division unit 211, and a first extraction unit 212.

分割部211は、画像読取ユニット2が生成した撮像データを1ページ分の文書ごとに分割して、複数の分割データを生成する。分割データは、第1分割データと第2分割データとを含む。第2分割データは、第1分割データと異なる分割データを示す。 The division unit 211 divides the imaging data generated by the image reading unit 2 for each page of the document to generate a plurality of division data. The divided data includes the first divided data and the second divided data. The second divided data indicates divided data different from the first divided data.

第1抽出部212は、分割データの各々から文字を抽出する。具体的には、第1抽出部212は、第1分割データが含む第1文書から第1文字を抽出する。第1文書は、1ページ分の分割データによって表される文書を示す。第1文字は、第1文書の文頭又は文末のうち、いずれか一方の位置に含まれる文字である。具体的には、第1文字は第1文書の記載が始まる位置を示す文頭又は第1文書の記載が終わる位置を示す文末のうち、いずれか一方の位置に含まれる文字である。 The first extraction unit 212 extracts characters from each of the divided data. Specifically, the first extraction unit 212 extracts the first character from the first document included in the first partition data. The first document shows a document represented by one page of divided data. The first character is a character included in either the beginning or the end of the first document. Specifically, the first character is a character included in either the beginning of the sentence indicating the position where the description of the first document starts or the end of the sentence indicating the position where the description of the first document ends.

また、第1抽出部212は、第2分割データが含む第2文書から第2文字を抽出する。第2文書は、第1文書と異なる1ページ分の分割データによって表される文書を示す。第2文字は第2文書の記載が始まる位置を示す文頭又は第2文書の記載が終わる位置を示す文末のうち、第1文字が含まれる位置と異なる位置の文字である。 In addition, the first extraction unit 212 extracts the second character from the second document included in the second divided data. The second document shows a document represented by one page of divided data different from the first document. The second character is a character at a position different from the position including the first character at the beginning of the sentence indicating the position where the description of the second document starts or the end of the sentence indicating the position where the description of the second document ends.

また、第1文字と第2文字との各々は、単一の文字、単語、及び形態素を含む。形態素は、意味を持つ最小の単位の表現要素を示す。したがって、複数の言語に対応できる。この結果、複数の言語の文字と文字との繋がりを推定できる。 Also, each of the first and second letters includes a single letter, word, and morpheme. A morpheme represents the expression element of the smallest unit that has meaning. Therefore, it can support a plurality of languages. As a result, it is possible to estimate the connection between characters in a plurality of languages.

学習部218は、文字と文字との繋がりを推定するために、文書データを学習する。この結果、文書データに基づいて、文字と文字との繋がりを容易に推定できる。 The learning unit 218 learns the document data in order to estimate the connection between the characters. As a result, the connection between characters can be easily estimated based on the document data.

学習は、機械学習を含む。機械学習は、例えば教師あり学習、教師なし学習、及び強化学習を含む。機械学習は、例えば、ニューラルネットワーク(Neural Network)又はサポートベクターマシン(Support Vector Machine)によって実行される。ニューラルネットワークは、入力層、隠れ層(中間層)、及び出力層を有する。ニューラルネットワークは、誤差逆伝播法(バックプロパゲーション)により、出力層での出力値と最適解との誤差を少なくする。 Learning includes machine learning. Machine learning includes, for example, supervised learning, unsupervised learning, and reinforcement learning. Machine learning is performed, for example, by a neural network (Neural Network) or a support vector machine (Support Vector Machine). The neural network has an input layer, a hidden layer (intermediate layer), and an output layer. The neural network uses an error backpropagation method to reduce the error between the output value and the optimum solution in the output layer.

また、機械学習は、深層学習(ディープラーニング)であってもよい。深層学習は、入力層、2層以上の隠れ層、及び出力層を有するニューラルネットワークによって構成される。具体的には、深層学習は、例えば、畳み込みニューラルネットワーク(Convolutional Neural Network)、再帰型ニューラルネットワーク(Recurrent Neural Network)、ボルツマンマシン(Boltzman machine)によって構成される。 Further, the machine learning may be deep learning. Deep learning is composed of a neural network having an input layer, two or more hidden layers, and an output layer. Specifically, deep learning is composed of, for example, a convolutional neural network, a recurrent neural network, and a Boltzmann machine.

また、本実施形態の学習部218は、第1文字と第2文字とが入力されることで、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。したがって、文書に記載されている文字に基づいて、ユーザーが文書を並び変える必要がない。この結果、集約された画像を分割する際の、文書を並び変える手間を抑制できる。 Further, the learning unit 218 of the present embodiment outputs an estimation result indicating the degree of connection between the first character and the second character by inputting the first character and the second character. Therefore, the user does not have to reorder the document based on the characters in the document. As a result, it is possible to reduce the trouble of rearranging the documents when dividing the aggregated images.

例えば、一般的に、会議で使用した「2in1」のような集約された文書を保管する際に、ユーザーは画像形成装置の分割機能を利用する。複数の文書が集約された資料を分割する場合、画像読取ユニット2がシートRを読み取った方向などから、文書が順序通りに並ばないことがある。このような場合、ユーザーは文書を目視で確認し、文脈に基づいて、自ら文書の順序を並び替えて文書を保管する。しかしながら、学習部218が文字と文字との繋がりの程度を推定するため、ユーザーは、推定結果に基づいて、文書を並び替えることができる。この結果、文書を並び替える手間を抑制できる。 For example, in general, when storing an aggregated document such as "2in1" used in a conference, the user uses the division function of the image forming apparatus. When a document in which a plurality of documents are aggregated is divided, the documents may not be arranged in order due to the direction in which the image reading unit 2 reads the sheet R or the like. In such cases, the user visually checks the documents, rearranges the order of the documents based on the context, and stores the documents. However, since the learning unit 218 estimates the degree of connection between characters, the user can sort the documents based on the estimation result. As a result, it is possible to reduce the trouble of rearranging the documents.

また、本実施形態の学習部218が学習する文書データは、画像形成装置100がシートPに形成する文書を示すデータである。画像形成装置100が複数の文書を集約して1枚のシートPに形成する文書の文書データを学習部218が学習する。したがって、学習部218に入力される第1文字と第2文字とは、文書データに含まれるため、学習部218の学習精度は向上する。この結果、推定結果の精度が向上する。 Further, the document data learned by the learning unit 218 of the present embodiment is data indicating a document formed on the sheet P by the image forming apparatus 100. The learning unit 218 learns the document data of the documents that the image forming apparatus 100 aggregates a plurality of documents and forms on one sheet P. Therefore, since the first character and the second character input to the learning unit 218 are included in the document data, the learning accuracy of the learning unit 218 is improved. As a result, the accuracy of the estimation result is improved.

例えば、画像形成装置100は、会議で使用する文書をシートPに形成する。具体的には、画像形成装置100に入力される文書データに基づいて、画像形成装置100は、会議で使用する文書をシートPに形成する。シートPには、複数の文書が集約される。そして学習部218は、文書データを学習する。その後、画像読取ユニット2は、シートRを読み取って、撮像データを生成する。シートRは、複数の文書が集約されたシートPである。更に、撮像データの文書をもとに分割データは生成される。また、学習部218には、分割データから取得された第1文字と第2文字とが入力される。つまり、学習部218に入力される第1文字と第2文字とは、既に学習部218が学習した学習データに含まれる。したがって、学習部218は、精度の良い推定結果を出力できる。なお、学習データは、記憶部22に記憶されている。 For example, the image forming apparatus 100 forms a document to be used in a conference on a sheet P. Specifically, the image forming apparatus 100 forms a document to be used in the conference on the sheet P based on the document data input to the image forming apparatus 100. A plurality of documents are aggregated on the sheet P. Then, the learning unit 218 learns the document data. After that, the image reading unit 2 reads the sheet R and generates imaging data. Sheet R is a sheet P in which a plurality of documents are aggregated. Further, the divided data is generated based on the document of the imaging data. Further, the first character and the second character acquired from the divided data are input to the learning unit 218. That is, the first character and the second character input to the learning unit 218 are included in the learning data already learned by the learning unit 218. Therefore, the learning unit 218 can output an accurate estimation result. The learning data is stored in the storage unit 22.

なお、学習部218が学習する文書データは、画像形成装置100に入力された文書データを含んでもよい。したがって、実際にシートPに形成されなかった文書の画像データも、学習部218は学習できる。 The document data learned by the learning unit 218 may include the document data input to the image forming apparatus 100. Therefore, the learning unit 218 can learn the image data of the document that is not actually formed on the sheet P.

また、本実施形態の学習部218は、文書データと、文書データに対応するページ番号とを更に学習する。この結果、学習精度が向上し、文字と文字との繋がりを推定する精度が向上する。 In addition, the learning unit 218 of the present embodiment further learns the document data and the page number corresponding to the document data. As a result, the learning accuracy is improved, and the accuracy of estimating the connection between characters is improved.

また、学習部218は、文書データに対して、自然言語処理を実行する。自然言語処理は、自然言語をコンピューターに処理させる一連の技術である。自然言語は、人間と人間とが意思疎通のために使用する言語である。自然言語処理は、形態素解析、構文解析、意味解析及び文脈解析を含む。 In addition, the learning unit 218 executes natural language processing on the document data. Natural language processing is a series of technologies that allow a computer to process natural language. Natural language is the language used by humans for communication. Natural language processing includes morphological analysis, parsing, semantic analysis and context analysis.

学習部218は、文書データに対して、形態素解析を実行する。形態素解析は、意味を持つ最小の単位の形態素に区分する処理である。学習部218は、文書データに含まれるテキストを記憶部22に記憶された辞書データに基づいて、文書を形態素に区分する。そして、学習部218は、形態素解析の結果に基づいて、構文解析を実行する。構文解析は、形態素と形態素との関連性を解析する処理である。関連性は、例えば、形態素と形態素との修飾関係である。更に、学習部218は、構文解析の結果に基づいて、意味解析を実行する。意味解析は、構文解析の結果に基づいて、構文木を決定する処理である。構文木は、構文解析の経過及び結果を木構造で示すものである。更に、学習部218は、意味解析の結果に基づいて、文脈解析を実行する。文脈解析は、文と文との関連性を解析する処理である。文は、主語と述語を含み、完結した1つの陳述を示す。学習部218は、自然言語処理の結果に基づいて、学習する。自然言語処理の結果は、学習データとして記憶部22に記憶される。 The learning unit 218 executes morphological analysis on the document data. Morphological analysis is a process of classifying morphemes into the smallest unit of meaning. The learning unit 218 classifies the text included in the document data into morphemes based on the dictionary data stored in the storage unit 22. Then, the learning unit 218 executes the syntactic analysis based on the result of the morphological analysis. Parsing is the process of analyzing the relationship between morphemes. The relationship is, for example, a modification relationship between a morpheme and a morpheme. Further, the learning unit 218 executes the semantic analysis based on the result of the syntactic analysis. Semantic analysis is a process of determining a syntax tree based on the result of parsing. The syntax tree shows the progress and results of parsing in a tree structure. Further, the learning unit 218 executes the context analysis based on the result of the semantic analysis. Context analysis is a process of analyzing the relationship between sentences. The sentence contains the subject and the predicate and indicates one complete statement. The learning unit 218 learns based on the result of natural language processing. The result of natural language processing is stored in the storage unit 22 as learning data.

引き続き、図2を参照して、制御部21の構成を詳細に説明する。制御部21は、第1決定部213を更に含む。制御部21は、制御プログラムを実行することで、第1決定部213として機能する。 Subsequently, the configuration of the control unit 21 will be described in detail with reference to FIG. The control unit 21 further includes a first determination unit 213. The control unit 21 functions as the first determination unit 213 by executing the control program.

第1決定部213は、分割データの順序を決定する。具体的には、第1決定部213は、学習部218の推定結果に基づいて、分割データの順序を決定する。更に具体的には、第1決定部213は、第1文字と第2文字とを学習部218に入力し、学習部218が出力する第1文字と第2文字との繋がりの程度を示す推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。 The first determination unit 213 determines the order of the divided data. Specifically, the first determination unit 213 determines the order of the divided data based on the estimation result of the learning unit 218. More specifically, the first determination unit 213 inputs the first character and the second character to the learning unit 218, and estimates that the degree of connection between the first character and the second character output by the learning unit 218 is indicated. Based on the result, the order of the first divided data and the second divided data is determined.

したがって、文書に記載されている文字に基づいて、ユーザーが文書を並び変える必要がない。この結果、集約された画像を分割する際の、文書を並び変える手間を抑制できる。 Therefore, the user does not have to reorder the document based on the characters in the document. As a result, it is possible to reduce the trouble of rearranging the documents when dividing the aggregated images.

また、実施形態1の第1抽出部212は、第1文書の文末に位置する第1文字を抽出し、第2文書の文頭に位置する第2文字を抽出する。そして、第1決定部213は、第1文字と第2文字とを学習部218に入力し、学習部218から出力された推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。したがって、第1文書と第2文書と続けて読むことができる。この結果、集約されてばらばらになった文書を1つの繋がりのある文書とすることができる。 Further, the first extraction unit 212 of the first embodiment extracts the first character located at the end of the sentence of the first document and extracts the second character located at the beginning of the sentence of the second document. Then, the first determination unit 213 inputs the first character and the second character to the learning unit 218, and based on the estimation result output from the learning unit 218, the order of the first divided data and the second divided data. To determine. Therefore, the first document and the second document can be read in succession. As a result, the aggregated and disjointed documents can be made into one connected document.

また、実施形態1の第1抽出部212は、第1文字と第2文字とを抽出する。第1文字は、第1文書の文末に位置する。第2文字は、第2文書の文頭に位置する。そして、第1決定部213は、第1文字と第2文字とを学習部218に入力し、学習部218から出力された推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。したがって、第1文書と第2文書と続けて読むことができる。この結果、集約されてばらばらになった文書を1つの繋がりのある文書とすることができる。 In addition, the first extraction unit 212 of the first embodiment extracts the first character and the second character. The first character is located at the end of the first document. The second character is located at the beginning of the second document. Then, the first determination unit 213 inputs the first character and the second character to the learning unit 218, and based on the estimation result output from the learning unit 218, the order of the first divided data and the second divided data. To determine. Therefore, the first document and the second document can be read in succession. As a result, the aggregated and disjointed documents can be made into one connected document.

次に、図2と図3とを参照して、操作表示部4に表示された選択画面50を説明する。図3は、タッチパネル部41に表示された選択画面50を示す図である。選択画面50は、画像形成装置100のコピー機能を選択する操作ボタン42を操作することで、タッチパネル部41に表示される。選択画面50には、用紙選択アイコン51、縮小/拡大アイコン52、濃度設定アイコン53、両面/分割設定アイコン54、ページ集約設定アイコン55、ソート/仕分け設定アイコン56、機能一覧アイコン57、及び、お気に入りアイコン58が表示されている。 Next, the selection screen 50 displayed on the operation display unit 4 will be described with reference to FIGS. 2 and 3. FIG. 3 is a diagram showing a selection screen 50 displayed on the touch panel unit 41. The selection screen 50 is displayed on the touch panel unit 41 by operating the operation button 42 for selecting the copy function of the image forming apparatus 100. On the selection screen 50, the paper selection icon 51, the reduction / enlargement icon 52, the density setting icon 53, the double-sided / split setting icon 54, the page aggregation setting icon 55, the sort / sorting setting icon 56, the function list icon 57, and favorites The icon 58 is displayed.

用紙選択アイコン51は、シートPのサイズを選択する場合に、ユーザーによって操作される。縮小/拡大アイコン52は、シートPに形成された画像を拡大又は縮小する場合に、ユーザーによって操作される。濃度設定アイコン53は、コピー濃度を設定する場合に、ユーザーによって操作される。両面/分割設定アイコン54は、両面又は片面の設定、及び「2in1」のような複数の画像が集約された画像を、画像ごとに分割する場合にユーザーによって操作される。ページ集約設定アイコン55は、「2in1」のようなページ集約を設定する場合に、ユーザーによって操作される。ソート/仕分け設定アイコン56は、ソート有無のような仕分け条件を設定する場合に、ユーザーによって操作される。機能一覧アイコン57は、各種の機能を説明する機能一覧画面をタッチパネル41に表示する場合に、ユーザーによって操作される。お気に入りアイコン58は、ユーザーが使用する頻度が高いアイコンをタッチパネル41に表示する場合に、ユーザーによって操作される。 The paper selection icon 51 is operated by the user when selecting the size of the sheet P. The reduction / enlargement icon 52 is operated by the user when the image formed on the sheet P is enlarged or reduced. The density setting icon 53 is operated by the user when setting the copy density. The double-sided / split setting icon 54 is operated by the user when the double-sided or single-sided setting and an image in which a plurality of images such as "2in1" are aggregated are divided into images. The page aggregation setting icon 55 is operated by the user when setting page aggregation such as "2in1". The sort / sorting setting icon 56 is operated by the user when setting sorting conditions such as the presence / absence of sorting. The function list icon 57 is operated by the user when displaying a function list screen explaining various functions on the touch panel 41. The favorite icon 58 is operated by the user when displaying an icon frequently used by the user on the touch panel 41.

また、図3に示すように、ユーザーH1の手の指(例えば、人差し指)によって、両面/分割設定アイコン54がタップされる。この操作に応じて、タッチパネル部41は、両面/分割設定アイコン54に対応する画面を表示する。なお、手は、タッチパネル41に表示されない。 Further, as shown in FIG. 3, the double-sided / split setting icon 54 is tapped by the finger (for example, the index finger) of the user H1's hand. In response to this operation, the touch panel unit 41 displays the screen corresponding to the double-sided / split setting icon 54. The hand is not displayed on the touch panel 41.

次に、図2〜図4を参照して、両面/分割設定アイコン54に対応する画面を説明する。図4は、分割データを示す分割画像Dを表示した表示画面110を示す図である。図4に示すように、表示画面110は、第1表示領域111と第2表示領域112とを含む。 Next, the screen corresponding to the double-sided / split setting icon 54 will be described with reference to FIGS. 2 to 4. FIG. 4 is a diagram showing a display screen 110 displaying a divided image D showing divided data. As shown in FIG. 4, the display screen 110 includes a first display area 111 and a second display area 112.

第1表示領域111は、撮像データを示す撮像画像RG1を表示するプレビュー画像113と戻るボタン114とが表示される。図4に示す撮像画像RG1は、2つの画像を1枚のシートRに集約した「2in1」の画像である。撮像画像RG1は、撮像データが複数の文書を含む場合、撮像画像RG1も複数表示される。戻るボタン114は、図3に示す選択画面50に戻るためのボタンである。 In the first display area 111, a preview image 113 for displaying the captured image RG1 showing the captured data and a return button 114 are displayed. The captured image RG1 shown in FIG. 4 is a “2in1” image in which two images are aggregated on one sheet R. When the captured image RG1 includes a plurality of documents, the captured image RG1 is also displayed in a plurality. The back button 114 is a button for returning to the selection screen 50 shown in FIG.

第2表示領域112には、分割データを示す複数の分割画像Dが表示される。複数の分割画像Dの各々は、1ページ分の分割データによって表される画像を示す。図4に示す複数の分割画像Dは、第1分割画像D1と第2分割画像D2とを含む。 In the second display area 112, a plurality of divided images D showing the divided data are displayed. Each of the plurality of divided images D indicates an image represented by one page of divided data. The plurality of divided images D shown in FIG. 4 include a first divided image D1 and a second divided image D2.

第1分割画像D1は、例えば、複数のページのうちの2ページ目の文書を示す画像である。第1分割画像D1は、文書を含む。第1分割画像D1は、第1文頭領域BS1と第1文末領域ES1とを含む。 The first divided image D1 is, for example, an image showing a document on the second page of a plurality of pages. The first divided image D1 includes a document. The first divided image D1 includes a first sentence beginning region BS1 and a first sentence ending region ES1.

第1文頭領域BS1は、第1分割画像D1に含まれる文書のうち、文頭部分が位置する領域を示す。文頭部分は、1ページ分の分割データによって表される画像に含まれる文書のうち、文書の記載が始まる位置を含む。図4に示す第1文頭領域BS1には、「multifunction devices・・・・」という文字列が位置する。 The first sentence beginning area BS1 indicates an area in which the sentence beginning portion is located in the document included in the first divided image D1. The beginning of the sentence includes the position where the description of the document starts in the document included in the image represented by the divided data for one page. In the first sentence head region BS1 shown in FIG. 4, the character string "multifaction devices ..." is located.

第1文末領域ES1は、第1分割画像D1に含まれる文書のうち、文末部分が位置する領域を示す。文末部分は、1ページ分の分割データによって表される画像に含まれる文書のうち、文書の記載が終わる位置を含む。図4に示す第1文末領域ES1には、「・・・・optimally」という文字列が位置する。 The first sentence end area ES1 indicates an area in which the sentence end portion is located in the document included in the first divided image D1. The end of the sentence includes the position where the description of the document ends in the document included in the image represented by the divided data for one page. The character string "... optimally" is located in the first sentence end region ES1 shown in FIG.

第2分割画像D2は、例えば、複数のページのうちの1ページ目の文書を示す画像である。第2分割画像D2は、文書を含む。第2分割画像D2は、第2文頭領域BS2と第2文末領域ES2とを含む。 The second divided image D2 is, for example, an image showing a document on the first page of a plurality of pages. The second divided image D2 includes a document. The second divided image D2 includes the second sentence beginning region BS2 and the second sentence ending region ES2.

第2文頭領域BS2は、第2分割画像D2に含まれる文書のうち、文頭部分が位置する領域を示す。図4に示す第2文頭領域BS2には、「Tokkyo Co.,Ltd.・・・・」という文字列が位置する。 The second sentence beginning area BS2 indicates an area in which the sentence beginning portion is located in the document included in the second divided image D2. The character string "Tokyo Co., Ltd ....." is located in the second sentence head region BS2 shown in FIG.

第2文末領域ES2は、第2分割画像D2に含まれる文書のうちの文末部分が位置する領域を示す。図4に示す第2分割画像D2の第2文末領域ES2には、「・・・・printers and」という文字列が位置する。 The second sentence end area ES2 indicates an area in which the sentence end portion of the document included in the second divided image D2 is located. The character string "... printers and" is located in the second sentence end region ES2 of the second divided image D2 shown in FIG.

また、図4に示す第1分割画像D1は、第1表示領域111から第2表示領域112へ向かう方向の上流側に位置する。図4に示す第2分割画像D2は、第1表示領域111から第2表示領域112へ向かう方向の下流側に位置する。したがって、図4では2ページ目の第1分割画像D1が上流側に位置し、1ページ目の第2分割画像D2が下流側に位置する。 Further, the first divided image D1 shown in FIG. 4 is located on the upstream side in the direction from the first display area 111 to the second display area 112. The second divided image D2 shown in FIG. 4 is located on the downstream side in the direction from the first display area 111 to the second display area 112. Therefore, in FIG. 4, the first divided image D1 on the second page is located on the upstream side, and the second divided image D2 on the first page is located on the downstream side.

図4に示す第1分割画像D1と図4に示す第2分割画像D2とに撮像画像RG1を分割する場合、制御部21は、操作表示部4が分割設定を行う表示画面110を表示するように、操作表示部4を制御する。図4に示す表示画面110を操作表示部4のタッチパネル41に表示する場合、図3に示す両面/分割設定アイコン54のタッチ操作を2回行う。なお、タッチ操作が1回の場合、両面設定の画面が操作表示部4に表示される。分割設定アイコン54が2回タッチ操作された場合、画像読取ユニット2は、シートRを撮像してシートRを表す撮像データを取得する。シートRは、画像が形成されたシートである。シートRに形成された画像は、複数の画像が集約された画像である。画像読取ユニット2が撮像した撮像データは、制御部21に送信される。 When the captured image RG1 is divided into the first divided image D1 shown in FIG. 4 and the second divided image D2 shown in FIG. 4, the control unit 21 displays the display screen 110 on which the operation display unit 4 sets the division. In addition, the operation display unit 4 is controlled. When the display screen 110 shown in FIG. 4 is displayed on the touch panel 41 of the operation display unit 4, the double-sided / split setting icon 54 shown in FIG. 3 is touched twice. When the touch operation is performed once, the double-sided setting screen is displayed on the operation display unit 4. When the division setting icon 54 is touch-operated twice, the image reading unit 2 images the sheet R and acquires the imaging data representing the sheet R. The sheet R is a sheet on which an image is formed. The image formed on the sheet R is an image in which a plurality of images are aggregated. The imaged data captured by the image reading unit 2 is transmitted to the control unit 21.

制御部21は、撮像データを受信する。そして、制御部21は、撮像データの所定領域の輝度を取得する。所定領域は、複数の画像が集約された場合に、互いに隣り合う画像と画像との間に形成される領域を示す。また、集約する画像の数に応じて、所定領域のパターンが変更される。集約された画像が2つの場合、所定領域のパターンは、例えば、撮像画像を2つに分断する1本の直線の形状となる。集約された画像が4つの場合、所定領域のパターンは、例えば、撮像画像を4つに分断する十字の形状となる。 The control unit 21 receives the imaging data. Then, the control unit 21 acquires the brightness of a predetermined region of the imaging data. The predetermined region indicates a region formed between images adjacent to each other when a plurality of images are aggregated. In addition, the pattern of a predetermined area is changed according to the number of images to be aggregated. When there are two aggregated images, the pattern of the predetermined region is, for example, the shape of a straight line that divides the captured image into two. When there are four aggregated images, the pattern of the predetermined region is, for example, a cross shape that divides the captured image into four.

また、制御部21は、所定領域の輝度が所定の階調か否かを判定する。所定の階調は、例えば、白色を示す。そして、分割部211は、白色の階調を示す所定領域に基づいて、撮像データを分割する。例えば、分割部211は、撮像データを第1分割データと第2分割データとに分割する。 Further, the control unit 21 determines whether or not the brightness of the predetermined region has a predetermined gradation. The predetermined gradation indicates, for example, white. Then, the dividing unit 211 divides the imaging data based on a predetermined region showing the gradation of white. For example, the division unit 211 divides the imaging data into the first division data and the second division data.

更に、制御部21は、分割データに対して文字認識処理を実行する。文字認識処理は、典型的には、光学的文字認識(Optical Character Recognition:OCR)処理である。制御部21は、分割データに対して文字認識処理を実行して、文字画像を検索する。具体的には、制御部21は、複数の方向から分割データに対して文字認識処理を実行する。したがって、文字画像を検索する精度が向上する。この結果、制御部21は、検索した文字画像に基づいて、精度のよいテキスト情報を取得できる。 Further, the control unit 21 executes character recognition processing on the divided data. The character recognition process is typically an optical character recognition (OCR) process. The control unit 21 executes a character recognition process on the divided data to search for a character image. Specifically, the control unit 21 executes character recognition processing on the divided data from a plurality of directions. Therefore, the accuracy of searching the character image is improved. As a result, the control unit 21 can acquire accurate text information based on the searched character image.

また、複数の画像を集約する場合、画像データの向きを変更して集約される。そして、分割部211の分割データの向きは、撮像データが画像読取ユニット2に撮像された際の向きと同じになる。したがって、分割データに含まれる文書の向きは、一般的に認識される文字の向きと異なる。制御部21は、複数の方向から分割データに対して文字認識処理を行い、文字画像を最も多く検索できた向きに分割データの向きを修正する。この結果、ユーザーが分割データを確認する際に、分割データを認識することが容易となる。 Further, when a plurality of images are aggregated, the orientation of the image data is changed and the images are aggregated. Then, the orientation of the divided data of the dividing unit 211 is the same as the orientation when the captured data is captured by the image reading unit 2. Therefore, the orientation of the document contained in the divided data is different from the orientation of generally recognized characters. The control unit 21 performs character recognition processing on the divided data from a plurality of directions, and corrects the direction of the divided data in the direction in which the most character images can be searched. As a result, when the user confirms the divided data, it becomes easy to recognize the divided data.

そして、制御部21は、第1分割データを示す第1分割画像D1を図4に示す第2表示領域112に表示するように、操作表示部4を制御する。制御部21は、第1分割データを示す第2分割画像D2を図4に示す第2表示領域112に表示するように、操作表示部4を制御する。 Then, the control unit 21 controls the operation display unit 4 so that the first divided image D1 showing the first divided data is displayed in the second display area 112 shown in FIG. The control unit 21 controls the operation display unit 4 so that the second divided image D2 showing the first divided data is displayed in the second display area 112 shown in FIG.

次に、図2〜図5を参照して、第1決定部213が第1分割データと第2分割データとの順序を決定するまでの処理を説明する。図5は、分割データを示す分割画像Dを表示した表示画面110を示す別の図である。図5に示すように、表示画面110は、第1表示領域111と第2表示領域112とを含む。 Next, with reference to FIGS. 2 to 5, the process until the first determination unit 213 determines the order of the first division data and the second division data will be described. FIG. 5 is another view showing the display screen 110 displaying the divided image D showing the divided data. As shown in FIG. 5, the display screen 110 includes a first display area 111 and a second display area 112.

第1表示領域111には、撮像データを示す撮像画像RG1を表示する。撮像画像RG1は、プレビュー画像113と戻るボタン114とを含む。第2表示領域112には、分割データを示す複数の分割画像Dが表示される。図5に示す複数の分割画像Dは、第1分割画像D1と第2分割画像D2とを含む。 In the first display area 111, the captured image RG1 showing the captured data is displayed. The captured image RG1 includes a preview image 113 and a back button 114. In the second display area 112, a plurality of divided images D showing the divided data are displayed. The plurality of divided images D shown in FIG. 5 include a first divided image D1 and a second divided image D2.

図5に示す第1分割画像D1は、第1表示領域111から第2表示領域112へ向かう方向の下流側に位置する。図5に示す第2分割画像D2は、第1表示領域111から第2表示領域112へ向かう方向の上流側に位置する。したがって、図5では1ページ目の第2分割画像D2が上流側に位置し、2ページ目の第1分割画像D1が下流側に位置する。つまり、ページ番号が上流側から昇順に並んでいる。 The first divided image D1 shown in FIG. 5 is located on the downstream side in the direction from the first display area 111 to the second display area 112. The second divided image D2 shown in FIG. 5 is located on the upstream side in the direction from the first display area 111 to the second display area 112. Therefore, in FIG. 5, the second divided image D2 on the first page is located on the upstream side, and the first divided image D1 on the second page is located on the downstream side. That is, the page numbers are arranged in ascending order from the upstream side.

また、図5に示す第2分割画像D2の第2文末領域ES2に位置する文字と、第1分割画像D1の第1文頭領域BS1に位置する文字とは、文字と文字とを繋げて意味を成す文字列である。具体的には、図5に示すように、第2文末領域ES2に位置する「and」という単語と、第1分割画像D1の第1文頭領域BS1に位置する「multifunction」という単語とは、「and multifunction」という単語の列となっている。 Further, the characters located in the second sentence end region ES2 of the second divided image D2 and the characters located in the first sentence beginning region BS1 of the first divided image D1 have meanings by connecting the characters. It is a character string to be formed. Specifically, as shown in FIG. 5, the word "and" located in the second sentence end region ES2 and the word "multifaction" located in the first sentence beginning region BS1 of the first divided image D1 are "multifunction". It is a sequence of words "and partition".

図5に示すように、文字と文字とを繋げて意味をなす文字列とする場合、第1抽出部212は、分割データの各々から文字を抽出する。例えば、制御部21が分割データごとに生成したテキストデータに基づいて、第1抽出部212は、文字又は文字列を抽出する。具体的には、第1抽出部212は、図4に示す第1分割画像D1に含まれる文書の第1文頭領域BS1から「multifunction」という単語を抽出する。第1分割画像D1に含まれる文書は、「第1文書」の一例に相当する。第1文頭領域BS1から抽出した単語は、「第1文字」の一例に相当する。そして、第1抽出部212は、図4に示す第2分割画像D2に含まれる文書の第2文末領域ES2から「and」という単語を抽出する。第2分割画像D2に含まれる文書は、「第2文書」の一例に相当する。第2文末領域ES2から抽出した単語は、「第2文字」の一例に相当する。 As shown in FIG. 5, when connecting characters to form a meaningful character string, the first extraction unit 212 extracts characters from each of the divided data. For example, the first extraction unit 212 extracts a character or a character string based on the text data generated by the control unit 21 for each of the divided data. Specifically, the first extraction unit 212 extracts the word "multibunction" from the first sentence head region BS1 of the document included in the first divided image D1 shown in FIG. The document included in the first divided image D1 corresponds to an example of the "first document". The word extracted from the first sentence head area BS1 corresponds to an example of the "first character". Then, the first extraction unit 212 extracts the word "and" from the second sentence end region ES2 of the document included in the second divided image D2 shown in FIG. The document included in the second divided image D2 corresponds to an example of the "second document". The word extracted from the second sentence end region ES2 corresponds to an example of the "second character".

そして、第1決定部213は、学習部218に第1文字と第2文字とを入力する。更に学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。例えば、学習部218には、第2文末領域ES2の「and」と第1文頭領域BS1の「multifunction」とが入力される。そして、学習部218は、「and」と「multifunction」との繋がりの程度を示す推定結果を出力する。 Then, the first determination unit 213 inputs the first character and the second character to the learning unit 218. Further, the learning unit 218 outputs an estimation result indicating the degree of connection between the first character and the second character. For example, “and” of the second sentence end region ES2 and “multifunction” of the first sentence beginning region BS1 are input to the learning unit 218. Then, the learning unit 218 outputs an estimation result indicating the degree of connection between the “and” and the “multifunction”.

また、第1抽出部212は、図4に示す第1分割画像D1の第1文末領域ES1と第2分割画像D2の第2文頭領域BS2とから文字を抽出してもよい。具体的には、第1抽出部212は、図4に示す第1分割画像D1の第1文末領域ES1から「optimally」という単語を抽出する。第1抽出部212は、図4に示す第2分割データを示す第2分割画像D2の第2文頭領域BS2から「Tokkyo」という単語を抽出する。 Further, the first extraction unit 212 may extract characters from the first sentence end region ES1 of the first divided image D1 and the second sentence beginning region BS2 of the second divided image D2 shown in FIG. Specifically, the first extraction unit 212 extracts the word "optimally" from the first sentence end region ES1 of the first divided image D1 shown in FIG. The first extraction unit 212 extracts the word "Tokyo" from the second sentence head region BS2 of the second divided image D2 showing the second divided data shown in FIG.

そして、第1決定部213は、学習部218に第1文字と第2文字とを入力する。更に学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。例えば、学習部218には、第1文末領域ES1の「optimally」と第2文頭領域BS2の「Tokkyo」とが入力される。そして、学習部218は、「optimally」と「Tokkyo」との繋がりの程度を示す推定結果を出力する。 Then, the first determination unit 213 inputs the first character and the second character to the learning unit 218. Further, the learning unit 218 outputs an estimation result indicating the degree of connection between the first character and the second character. For example, the learning unit 218 is input with "optimally" of the first sentence end region ES1 and "Tokkyo" of the second sentence beginning region BS2. Then, the learning unit 218 outputs an estimation result indicating the degree of connection between the “optimally” and the “Tokyo”.

そして、第1決定部213は、学習部218が出力する第1文字と第2文字との繋がりの程度を示す推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。具体的には、「and」と「multifunction」との繋がりの程度を示す推定結果と「optimally」と「Tokkyo」との繋がりの程度を示す推定結果とを比較して、繋がりの程度が大きい推定結果に基づいて、第1決定部213は第1分割データと第2分割データとの順序を決定する。 Then, the first determination unit 213 determines the order of the first division data and the second division data based on the estimation result indicating the degree of connection between the first character and the second character output by the learning unit 218. .. Specifically, the estimation result indicating the degree of connection between "and" and "multifaction" is compared with the estimation result indicating the degree of connection between "optimally" and "Tokkyo", and the degree of connection is estimated to be large. Based on the result, the first determination unit 213 determines the order of the first division data and the second division data.

更に、制御部21は、第1決定部213の決定に基づいて、操作表示部4が第1分割画像D1と第2分割画像D2とを表示するように、操作表示部4を制御する。したがって、図5に示すように、第1分割画像D1と第2分割画像D2とは、ページの順に並ぶ。この結果、第1分割画像D1と第2分割画像D2とを続けて読むことができる。 Further, the control unit 21 controls the operation display unit 4 so that the operation display unit 4 displays the first divided image D1 and the second divided image D2 based on the determination of the first determination unit 213. Therefore, as shown in FIG. 5, the first divided image D1 and the second divided image D2 are arranged in the order of pages. As a result, the first divided image D1 and the second divided image D2 can be read continuously.

また、学習部218の推定結果と第1決定部213の決定結果とは、学習部218に学習される。したがって、学習部218は、文書データとページ番号と推定結果と決定結果とで再学習する。この結果、精度の良い推定結果を出力できる。 Further, the estimation result of the learning unit 218 and the determination result of the first determination unit 213 are learned by the learning unit 218. Therefore, the learning unit 218 relearns with the document data, the page number, the estimation result, and the determination result. As a result, an accurate estimation result can be output.

次に、図6を参照して、実施形態1の制御部21が実行する処理を説明する。図6は、制御部21が実行する処理のフローチャートを示す。制御部21が実行する処理は、ステップS101〜ステップS108を含む。 Next, the process executed by the control unit 21 of the first embodiment will be described with reference to FIG. FIG. 6 shows a flowchart of processing executed by the control unit 21. The process executed by the control unit 21 includes steps S101 to S108.

ステップS101において、制御部21は、操作表示部4が選択画面50を表示するように、操作表示部4を制御する。処理は、ステップS102に進む。 In step S101, the control unit 21 controls the operation display unit 4 so that the operation display unit 4 displays the selection screen 50. The process proceeds to step S102.

ステップS102において、制御部21は、操作表示部4から取得した信号が画像データを分割する指示を含むか否かを判定する。画像データを分割する指示を含まない場合(ステップS102において、No)、処理は終了する。画像データを分割する指示を含む場合(ステップS102において、Yes)、処理はステップS103に進む。 In step S102, the control unit 21 determines whether or not the signal acquired from the operation display unit 4 includes an instruction to divide the image data. If the instruction to divide the image data is not included (No in step S102), the process ends. When the instruction to divide the image data is included (Yes in step S102), the process proceeds to step S103.

ステップS102でYesの場合、ステップS103において、制御部21は、画像読取ユニット2が生成した撮像データを取得する。処理は、ステップS104に進む。 In the case of Yes in step S102, in step S103, the control unit 21 acquires the image pickup data generated by the image reading unit 2. The process proceeds to step S104.

ステップS104において、分割部211は、撮像データを文書ごとに分割して、分割データを生成する。処理は、ステップS105に進む。 In step S104, the division unit 211 divides the imaging data for each document to generate the divided data. The process proceeds to step S105.

ステップS105において、制御部21は、分割データに対して文字画像の検索を実行し、文書に対応するテキスト情報を取得する。処理は、ステップS106に進む。 In step S105, the control unit 21 executes a character image search for the divided data and acquires text information corresponding to the document. The process proceeds to step S106.

ステップS106において、制御部21は、文字画像の取得率に基づいて、分割データの向きを修正する。具体的には、制御部21は、文字画像を最も多く検索できた向きに分割データの向きを修正する。処理は、ステップS107に進む。 In step S106, the control unit 21 corrects the orientation of the divided data based on the acquisition rate of the character image. Specifically, the control unit 21 corrects the orientation of the divided data in the orientation in which the most character images can be searched. The process proceeds to step S107.

ステップS107において、制御部21は、第1決定処理を実行する。第1決定処理については、図7を参照して後述する。処理は、ステップS108に進む。 In step S107, the control unit 21 executes the first determination process. The first determination process will be described later with reference to FIG. 7. The process proceeds to step S108.

ステップS108において、学習部218は、文書データとページ番号と推定結果と決定結果とを学習する。処理は、終了する。 In step S108, the learning unit 218 learns the document data, the page number, the estimation result, and the determination result. The process ends.

次に、図7を参照して、制御部21が実行する第1決定処理を説明する。図7は、第1決定処理のフローチャートを示す図である。第1決定処理は、ステップS201〜ステップS210を含む。図7に示す第1決定処理は、図6に示すステップS107に対応する。 Next, the first determination process executed by the control unit 21 will be described with reference to FIG. 7. FIG. 7 is a diagram showing a flowchart of the first determination process. The first determination process includes steps S201 to S210. The first determination process shown in FIG. 7 corresponds to step S107 shown in FIG.

ステップS201において、第1抽出部212は、第1分割データが含む第1文書の第1文末領域ES1から第1文字を抽出する。処理は、ステップS202に進む。 In step S201, the first extraction unit 212 extracts the first character from the first sentence end region ES1 of the first document included in the first partition data. The process proceeds to step S202.

ステップS202において、第1抽出部212は、第2分割データが含む第2文書の第2文頭領域BS2から第2文字を抽出する。処理は、ステップS203に進む。 In step S202, the first extraction unit 212 extracts the second character from the second sentence beginning region BS2 of the second document included in the second divided data. The process proceeds to step S203.

ステップS203において、第1決定部213は、第1文書の文末に位置する第1文字と第2文書の文頭に位置する第2文字とを学習部218に入力する。処理は、ステップS204に進む。 In step S203, the first determination unit 213 inputs the first character located at the end of the sentence of the first document and the second character located at the beginning of the sentence of the second document to the learning unit 218. The process proceeds to step S204.

ステップS204において、学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。処理は、ステップS205に進む。 In step S204, the learning unit 218 outputs an estimation result indicating the degree of connection between the first character and the second character. The process proceeds to step S205.

ステップS205において、第1抽出部212は、第1分割データが含む第1文書の第1文頭領域BS1から第1文字を抽出する。処理は、ステップS206に進む。 In step S205, the first extraction unit 212 extracts the first character from the first sentence head region BS1 of the first document included in the first partition data. The process proceeds to step S206.

ステップS206において、第1抽出部212は、第2分割データが含む第2文書の第2文末領域ES2から第2文字を抽出する。処理は、ステップS207に進む。 In step S206, the first extraction unit 212 extracts the second character from the second sentence end region ES2 of the second document included in the second divided data. The process proceeds to step S207.

ステップS207において、第1決定部213は、第1文書の文頭に位置する第1文字と第2文書の文末に位置する第2文字とを学習部218に入力する。処理は、ステップS208に進む。 In step S207, the first determination unit 213 inputs the first character located at the beginning of the sentence of the first document and the second character located at the end of the sentence of the second document to the learning unit 218. The process proceeds to step S208.

ステップS208において、学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。処理は、ステップS209に進む。 In step S208, the learning unit 218 outputs an estimation result indicating the degree of connection between the first character and the second character. The process proceeds to step S209.

ステップS209において、制御部21は、他に分割データがあるか否かを判定する。他に分割データがある場合(ステップS209において、Yes)、処理はステップS201に戻る。他に分割データがない場合(ステップS209において、No)、処理はステップS210に進む。 In step S209, the control unit 21 determines whether or not there is other divided data. If there is other divided data (Yes in step S209), the process returns to step S201. If there is no other divided data (No in step S209), the process proceeds to step S210.

ステップS209でNoの場合、ステップS210において、第1決定部213は、第1分割データと第2分割データとの順序を決定する。処理は図6に示すステップS108に戻る。 If No in step S209, in step S210, the first determination unit 213 determines the order of the first division data and the second division data. The process returns to step S108 shown in FIG.

[実施形態2]
次に、図8を参照して、実施形態2の画像形成装置100を説明する。実施形態2の画像形成装置100は、第2抽出部214、第2決定部215、判定部216、及び選択部217を有する点で、実施形態1の画像形成装置100と異なる。以下、実施形態2について、実施形態1と異なる事項について説明し、実施形態1と重複する部分についての説明は割愛する。
[Embodiment 2]
Next, the image forming apparatus 100 of the second embodiment will be described with reference to FIG. The image forming apparatus 100 of the second embodiment is different from the image forming apparatus 100 of the first embodiment in that it has a second extraction unit 214, a second determination unit 215, a determination unit 216, and a selection unit 217. Hereinafter, the items different from the first embodiment will be described with respect to the second embodiment, and the description of the parts overlapping with the first embodiment will be omitted.

図8は、実施形態2の制御部21の構成を示す図である。制御部21は、分割部211、第1抽出部212、第1決定部213、学習部218、第2抽出部214、及び第2決定部215を含む。制御部21は、制御プログラムを実行することで、分割部211、第1抽出部212、第1決定部213、学習部218、第2抽出部214、及び第2決定部215として機能する。分割部211、第1抽出部212、第1決定部213、及び学習部218については、実施形態1と同様のため、説明を省略する。 FIG. 8 is a diagram showing the configuration of the control unit 21 of the second embodiment. The control unit 21 includes a division unit 211, a first extraction unit 212, a first determination unit 213, a learning unit 218, a second extraction unit 214, and a second determination unit 215. By executing the control program, the control unit 21 functions as a division unit 211, a first extraction unit 212, a first determination unit 213, a learning unit 218, a second extraction unit 214, and a second determination unit 215. The division unit 211, the first extraction unit 212, the first determination unit 213, and the learning unit 218 are the same as those in the first embodiment, and thus the description thereof will be omitted.

第2抽出部214は、文書の所定領域に位置する記号を抽出する。記号は、文字及び数字を含む。文書の所定領域は、文書のヘッダーの領域又は文書のフッターの領域を含む。したがって、第2抽出部214は、文書に付されたページ番号を取得できる。 The second extraction unit 214 extracts a symbol located in a predetermined area of the document. Symbols include letters and numbers. A predetermined area of the document includes a header area of the document or a footer area of the document. Therefore, the second extraction unit 214 can acquire the page number attached to the document.

第2決定部215は、第2抽出部214の抽出結果に基づいて、第1分割データと第2分割データとの順序を決定する。第1決定部213の結果に合わせて第2決定部215の結果も取得できる。この結果、精度良く第1分割データと第2分割データとの順序を決定できる。 The second determination unit 215 determines the order of the first division data and the second division data based on the extraction result of the second extraction unit 214. The result of the second determination unit 215 can be acquired in accordance with the result of the first determination unit 213. As a result, the order of the first divided data and the second divided data can be accurately determined.

次に、図8〜図10を参照して、第2決定部215が第1分割データと第2分割データとの順序を決定する処理を説明する。図9は、分割データを示す分割画像Dを表示した表示画面110を示す図である。図9に示すように、表示画面110は、第1表示領域111と第2表示領域112とを含む。 Next, a process in which the second determination unit 215 determines the order of the first division data and the second division data will be described with reference to FIGS. 8 to 10. FIG. 9 is a diagram showing a display screen 110 displaying a divided image D showing divided data. As shown in FIG. 9, the display screen 110 includes a first display area 111 and a second display area 112.

第1表示領域111は、撮像データを示す撮像画像RG2を表示するプレビュー画像113と戻るボタン114とが表示される。図9に示す撮像画像RG2は、4つの画像を1枚のシートRに集約した「4in1」の画像である。 In the first display area 111, a preview image 113 for displaying the captured image RG2 showing the captured data and a return button 114 are displayed. The captured image RG2 shown in FIG. 9 is a “4in1” image in which four images are aggregated on one sheet R.

第2表示領域112には、分割データを示す複数の分割画像Dが表示される。図9に示す複数の分割画像Dは、第1分割画像D1と第2分割画像D2と第3分割画像D3と第4分割画像D4とを含む。 In the second display area 112, a plurality of divided images D showing the divided data are displayed. The plurality of divided images D shown in FIG. 9 include a first divided image D1, a second divided image D2, a third divided image D3, and a fourth divided image D4.

第1分割画像D1は、例えば、複数のページのうちの3ページ目の文書を示す画像である。第1分割画像D1は、文書を含む。第1分割画像D1は、第1文頭領域BS1と第1文末領域ES1と第1抽出領域CT1とを含む。図9に示す第1分割画像D1の第1文頭領域BS1には、「arranges・・・・」という文字列が位置する。図9に示す第1分割画像D1の第1文末領域ES1には、「・・・which provides」という文字列が位置する。図9に示す第1分割画像D1の第1抽出領域CT1には、「3」という記号が位置する。 The first divided image D1 is, for example, an image showing a document on the third page of a plurality of pages. The first divided image D1 includes a document. The first divided image D1 includes a first sentence beginning region BS1, a first sentence ending region ES1, and a first extraction region CT1. The character string "arranges ..." is located in the first sentence head region BS1 of the first divided image D1 shown in FIG. The character string "... has products" is located in the first sentence end region ES1 of the first divided image D1 shown in FIG. The symbol "3" is located in the first extraction region CT1 of the first divided image D1 shown in FIG.

第2分割画像D2は、例えば、複数のページのうちの4ページ目の文書を示す画像である。第2分割画像D2は、文書を含む。第2分割画像D2は、第2文頭領域BS2と第2文末領域ES2と第2抽出領域CT2とを含む。図9に示す第2分割画像D2の第2文頭領域BS2には、「comprehensive services・・・・」という文字列が位置する。図9に示す第2分割画像D2の第2文末領域ES2には、「・・・・in the UK.」という文字列が位置する。図9に示す第2分割画像D2の第2抽出領域CT2には、「4」という記号が位置する。 The second divided image D2 is, for example, an image showing a document on the fourth page of a plurality of pages. The second divided image D2 includes a document. The second divided image D2 includes the second sentence beginning region BS2, the second sentence ending region ES2, and the second extraction region CT2. The character string "comprehensive services ..." is located in the second sentence head region BS2 of the second divided image D2 shown in FIG. The character string "... in the UK." Is located in the second sentence end region ES2 of the second divided image D2 shown in FIG. The symbol "4" is located in the second extraction region CT2 of the second divided image D2 shown in FIG.

第3分割画像D3は、例えば、複数のページのうちの1ページ目の文書を示す画像である。第3分割画像D3は、文書を含む。第3分割画像D3は、第3文頭領域BS3と第3文末領域ES3と第3抽出領域CT3とを含む。図9に示す第3分割画像D3の第3文頭領域BS3には、「Tokkyo Co.,Ltd.・・・・」という文字列が位置する。図9に示す第3分割画像D3の第3文末領域ES3には、「・・・・printers and」という文字列が位置する。図9に示す第3分割画像D3の第3抽出領域CT3には、「1」という記号が位置する。 The third divided image D3 is, for example, an image showing a document on the first page of a plurality of pages. The third divided image D3 includes a document. The third divided image D3 includes a third sentence beginning region BS3, a third sentence ending region ES3, and a third extraction region CT3. The character string "Tokyo Co., Ltd ...." is located in the third sentence head region BS3 of the third divided image D3 shown in FIG. The character string "... printers and" is located in the third sentence end region ES3 of the third divided image D3 shown in FIG. The symbol "1" is located in the third extraction region CT3 of the third divided image D3 shown in FIG.

第4分割画像D4は、例えば、複数のページのうちの2ページ目の文書を示す画像である。第4分割画像D4は、文書を含む。第4分割画像D4は、第4文頭領域BS4と第4文末領域ES4と第4抽出領域CT4とを含む。図9に示す第4分割画像D4の第4文頭領域BS4には、「multifunction devices・・・・」という文字列が位置する。図9に示す第4分割画像D4の第4文末領域ES4には、「・・・・optimally」という文字列が位置する。図9に示す第4分割画像D4の第4抽出領域CT4には、「2」という記号が位置する。 The fourth divided image D4 is, for example, an image showing a document on the second page of a plurality of pages. The fourth divided image D4 includes a document. The fourth divided image D4 includes the fourth sentence beginning region BS4, the fourth sentence ending region ES4, and the fourth extraction region CT4. The character string "multifunction devices ..." is located in the fourth sentence head region BS4 of the fourth divided image D4 shown in FIG. The character string "... optimally" is located in the fourth sentence end region ES4 of the fourth divided image D4 shown in FIG. The symbol "2" is located in the fourth extraction region CT4 of the fourth divided image D4 shown in FIG.

また、図9に示す第1分割画像D1と第3分割画像D3とは、第1表示領域111から第2表示領域112へ向かう方向の上流側に位置する。第2分割画像D2と第4分割画像D4とは、第1表示領域111から第2表示領域112へ向かう方向の下流側に位置する。したがって、3ページ目を示す第1分割画像D1は、2ページ目を示す第4分割画像D4よりも上流に位置する。 Further, the first divided image D1 and the third divided image D3 shown in FIG. 9 are located on the upstream side in the direction from the first display area 111 to the second display area 112. The second divided image D2 and the fourth divided image D4 are located on the downstream side in the direction from the first display area 111 to the second display area 112. Therefore, the first divided image D1 showing the third page is located upstream of the fourth divided image D4 showing the second page.

また、図9に示す第1分割画像D1と第2分割画像D2とは、プレビュー画像113から戻るボタン114へ向かう方向の上流側に位置する。第3分割画像D3と第4分割画像D4とは、プレビュー画像113から戻るボタン114へ向かう方向の下流側に位置する。したがって、3ページ目を示す第1分割画像D1及び4ページ目を示す第2分割画像D2は、1ページ目を示す第3分割画像D3及び2ページ目を示す第4分割画像D4よりも上流に位置する。したがって、3ページ目を示す第1分割画像D1は、1ページ目を示す第3分割画像D3よりも上流に位置する。つまり、図9に示す第1分割画像D1〜第4分割画像D4は、順序通り並んでいない。 Further, the first divided image D1 and the second divided image D2 shown in FIG. 9 are located on the upstream side in the direction from the preview image 113 toward the return button 114. The third divided image D3 and the fourth divided image D4 are located on the downstream side in the direction from the preview image 113 toward the return button 114. Therefore, the first divided image D1 showing the third page and the second divided image D2 showing the fourth page are upstream of the third divided image D3 showing the first page and the fourth divided image D4 showing the second page. To position. Therefore, the first divided image D1 showing the third page is located upstream of the third divided image D3 showing the first page. That is, the first divided images D1 to the fourth divided images D4 shown in FIG. 9 are not arranged in order.

図10は、分割データを示す分割画像Dを表示した表示画面110を示す別の図である。図10に示すように、表示画面110は、第1表示領域111と第2表示領域112とを含む。 FIG. 10 is another diagram showing a display screen 110 displaying a divided image D showing divided data. As shown in FIG. 10, the display screen 110 includes a first display area 111 and a second display area 112.

第1表示領域111は、撮像データを示す撮像画像RG2を表示するプレビュー画像113と戻るボタン114とが表示される。第2表示領域112には、分割データを示す複数の分割画像Dが表示される。図10に示す複数の分割画像Dは、第1分割画像D1と第2分割画像D2と第3分割画像D3と第4分割画像D4とを含む。 In the first display area 111, a preview image 113 for displaying the captured image RG2 showing the captured data and a return button 114 are displayed. In the second display area 112, a plurality of divided images D showing the divided data are displayed. The plurality of divided images D shown in FIG. 10 include a first divided image D1, a second divided image D2, a third divided image D3, and a fourth divided image D4.

また、図10に示す第3分割画像D3と第1分割画像D1とは、第1表示領域111から第2表示領域112へ向かう方向の上流側に位置する。第4分割画像D4と第2分割画像D2とは、第1表示領域111から第2表示領域112へ向かう方向の下流側に位置する。したがって、1ページ目を示す第3分割画像D3は、2ページ目を示す第4分割画像D4よりも上流に位置する。また、3ページ目を示す第1分割画像D1は、第4ページ目を示す第2分割画像D2よりも上流に位置する。 Further, the third divided image D3 and the first divided image D1 shown in FIG. 10 are located on the upstream side in the direction from the first display area 111 to the second display area 112. The fourth divided image D4 and the second divided image D2 are located on the downstream side in the direction from the first display area 111 to the second display area 112. Therefore, the third divided image D3 showing the first page is located upstream of the fourth divided image D4 showing the second page. Further, the first divided image D1 showing the third page is located upstream of the second divided image D2 showing the fourth page.

また、図10に示す第3分割画像D3と第4分割画像D4とはプレビュー画像113から戻るボタン114へ向かう方向の上流側に位置する。図10に示す第1分割画像D1と第2分割画像D2とはプレビュー画像113から戻るボタン114へ向かう方向の下流側に位置する。したがって、第2ページ目を示す第4分割画像D4は、第1分割画像D1及び第2分割画像D2よりも上流に位置する。つまり、図10に示す第1分割画像D1〜第4分割画像D4は、昇順に並んでいる。 Further, the third divided image D3 and the fourth divided image D4 shown in FIG. 10 are located on the upstream side in the direction from the preview image 113 toward the return button 114. The first divided image D1 and the second divided image D2 shown in FIG. 10 are located on the downstream side in the direction from the preview image 113 toward the return button 114. Therefore, the fourth divided image D4 showing the second page is located upstream of the first divided image D1 and the second divided image D2. That is, the first divided images D1 to the fourth divided images D4 shown in FIG. 10 are arranged in ascending order.

図10に示すように、第1分割画像D1〜第4分割画像D4を昇順に並べる場合、第2抽出部214は、分割データの各々から記号を抽出する。例えば、制御部21が分割データごとに生成したテキストデータに基づいて、第2抽出部214は、文字を抽出する。具体的には、第2抽出214は、図9に示す第1分割画像D1の第1抽出領域CT1から「3」という数字を抽出する。第2抽出214は、第2分割画像D2の第2抽出領域CT2から「4」という数字を抽出する。第2抽出214は、第3分割画像D3の第3抽出領域CT3から「1」という数字を抽出する。第2抽出214は、第4分割画像D4の第4抽出領域CT4から「2」という数字を抽出する。 As shown in FIG. 10, when the first divided images D1 to the fourth divided images D4 are arranged in ascending order, the second extraction unit 214 extracts symbols from each of the divided data. For example, the second extraction unit 214 extracts characters based on the text data generated by the control unit 21 for each of the divided data. Specifically, the second extraction 214 extracts the number "3" from the first extraction region CT1 of the first divided image D1 shown in FIG. The second extraction 214 extracts the number “4” from the second extraction region CT2 of the second divided image D2. The second extraction 214 extracts the number "1" from the third extraction region CT3 of the third divided image D3. The second extraction 214 extracts the number “2” from the fourth extraction region CT4 of the fourth divided image D4.

そして、第2決定部215は、第2抽出部214の抽出結果に基づいて、第1分割データ、第2分割データ、第3分割データ、及び第4分割データの順序を決定する。したがって、1分割データ、第2分割データ、第3分割データ、及び第4分割データが順番に並ぶ。この結果、ユーザーが分割データを並べる手間を抑制できる。 Then, the second determination unit 215 determines the order of the first division data, the second division data, the third division data, and the fourth division data based on the extraction result of the second extraction unit 214. Therefore, the 1-division data, the 2nd division data, the 3rd division data, and the 4th division data are arranged in order. As a result, the user can reduce the trouble of arranging the divided data.

引き続き、図9と図10とを参照して、分割データが2以上の場合の第1抽出部212と第1決定部213との処理を説明する。実施形態2の制御部21は、第1決定部213の決定結果と第2決定部215の決定結果とを取得できる。 Subsequently, with reference to FIGS. 9 and 10, the processing of the first extraction unit 212 and the first determination unit 213 when the divided data is two or more will be described. The control unit 21 of the second embodiment can acquire the determination result of the first determination unit 213 and the determination result of the second determination unit 215.

制御部21が分割データごとに生成したテキストデータに基づいて、第1抽出部212は、文字を抽出する。具体的には、第1抽出部212は、図9に示す第1分割画像D1に含まれる文書の第1文頭領域BS1から「arranges」という単語を抽出する。第1分割画像D1に含まれる文書は、「第1文書」の一例に相当する。第1文頭領域BS1から抽出した単語は、「第1文字」の一例に相当する。 The first extraction unit 212 extracts characters based on the text data generated by the control unit 21 for each of the divided data. Specifically, the first extraction unit 212 extracts the word "arranges" from the first sentence head region BS1 of the document included in the first divided image D1 shown in FIG. The document included in the first divided image D1 corresponds to an example of the "first document". The word extracted from the first sentence head area BS1 corresponds to an example of the "first character".

そして、第1抽出部212は、図9に示す第2分割画像D2に含まれる文書の第2文末領域ES2から「UK.」という単語を抽出する。第2分割画像D2に含まれる文書は、「第2文書」の一例に相当する。第2文末領域ES2から抽出した単語は、「第2文字」の一例に相当する。 Then, the first extraction unit 212 extracts the word "UK." From the second sentence end region ES2 of the document included in the second divided image D2 shown in FIG. The document included in the second divided image D2 corresponds to an example of the "second document". The word extracted from the second sentence end region ES2 corresponds to an example of the "second character".

そして、第1抽出部212は、図9に示す第3分割画像D3に含まれる文書の第3文末領域ES3から「and」という単語を抽出する。第3分割画像D3含まれる文書は、「第2文書」の一例に相当する。第3文末領域ES3から抽出した単語は、「第2文字」の一例に相当する。 Then, the first extraction unit 212 extracts the word "and" from the third sentence end region ES3 of the document included in the third divided image D3 shown in FIG. The document included in the third divided image D3 corresponds to an example of the "second document". The word extracted from the third sentence end region ES3 corresponds to an example of the "second character".

そして、第1抽出部212は、図9に示す第4分割画像D4に含まれる文書の第4文末領域ES4から「optimally」という単語を抽出する。第4分割画像D4含まれる文書は、「第2文書」の一例に相当する。第4文末領域ES4から抽出した単語は、「第2文字」の一例に相当する。 Then, the first extraction unit 212 extracts the word "optimally" from the fourth sentence end region ES4 of the document included in the fourth divided image D4 shown in FIG. The document included in the fourth divided image D4 corresponds to an example of the "second document". The word extracted from the fourth sentence end region ES4 corresponds to an example of the "second character".

そして、第1決定部213は、学習部218に第1文字と第2文字とを入力する。更に学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。 Then, the first determination unit 213 inputs the first character and the second character to the learning unit 218. Further, the learning unit 218 outputs an estimation result indicating the degree of connection between the first character and the second character.

例えば、学習部218には、第2文末領域ES2の「UK.」と第1文頭領域BS1の「arranges」とが入力される。そして、学習部218は、「UK.」と「arranges」との繋がりの程度を示す第1推定結果を出力する。 For example, "UK." In the second sentence end region ES2 and "arranges" in the first sentence beginning region BS1 are input to the learning unit 218. Then, the learning unit 218 outputs the first estimation result indicating the degree of connection between "UK." And "arranges".

例えば、学習部218には、第3文末領域ES3の「and」と第1文頭領域BS1の「arranges」とが入力される。そして、学習部218は、「and」と「arranges」との繋がりの程度を示す第2推定結果を出力する。 For example, “and” of the third sentence end region ES3 and “arranges” of the first sentence beginning region BS1 are input to the learning unit 218. Then, the learning unit 218 outputs a second estimation result indicating the degree of connection between "and" and "arranges".

例えば、学習部218には、第4文末領域ES4の「optimally」と第1文頭領域BS1の「arranges」とが入力される。そして、学習部218は、「optimally」と「arranges」との繋がりの程度を示す第3推定結果を出力する。 For example, “optimally” of the fourth sentence end region ES4 and “arranges” of the first sentence beginning region BS1 are input to the learning unit 218. Then, the learning unit 218 outputs a third estimation result indicating the degree of connection between the “optimally” and the “arranges”.

そして、第1決定部213は、学習部218が出力する第1文字と第2文字との繋がりの程度を示す推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。具体的には、第1推定結果、第2推定結果、及び第3推定結果を比較して、繋がりの程度が大きい推定結果に基づいて、第1決定部213は第1分割データと第2分割データとの順序を決定する。 Then, the first determination unit 213 determines the order of the first division data and the second division data based on the estimation result indicating the degree of connection between the first character and the second character output by the learning unit 218. .. Specifically, the first estimation result, the second estimation result, and the third estimation result are compared, and the first determination unit 213 performs the first division data and the second division based on the estimation result having a large degree of connection. Determine the order with the data.

更に、第1抽出部212は、分割画像Dごとに、同様の処理を繰り返す。また、第1抽出部212が処理を実行する毎に、第1決定部213は第1分割データと第2分割データとの順序を決定する。そして、制御部21は、第1決定部213の決定結果に基づいて、図10に示すように、第1分割画像D1〜第4分割画像D4をページの順序に表示する。この結果、第1分割画像D1〜第4分割画像D4を続けて読むことができる。 Further, the first extraction unit 212 repeats the same processing for each divided image D. Further, each time the first extraction unit 212 executes the process, the first determination unit 213 determines the order of the first division data and the second division data. Then, the control unit 21 displays the first divided image D1 to the fourth divided image D4 in the order of pages, as shown in FIG. 10, based on the determination result of the first determination unit 213. As a result, the first divided image D1 to the fourth divided image D4 can be continuously read.

引き続き、図8〜図10を参照して、実施形態2の制御部21について更に詳しく説明する。制御部21は、判定部216、及び選択部217を更に含む。制御部21は、制御プログラムを実行することで、判定部216、及び選択部217として機能する。 Subsequently, the control unit 21 of the second embodiment will be described in more detail with reference to FIGS. 8 to 10. The control unit 21 further includes a determination unit 216 and a selection unit 217. The control unit 21 functions as a determination unit 216 and a selection unit 217 by executing a control program.

判定部216は、第1決定部213の決定結果と第2決定部215の決定結果とが一致するか否かを判定する。したがって、第1決定部213の決定結果と第2決定部215の決定結果とが一致する場合は、第1決定部213と第2決定部215との精度が高いと判断できる。また、第1決定部213の決定結果と第2決定部215の決定結果とが一致しない場合は、第1決定部213と第2決定部215とのいずれか一方の精度が低いと判断できる。この結果、判定部216の判定結果をトリガーに、第1決定部213と第2決定部215の優劣を判断できる。 The determination unit 216 determines whether or not the determination result of the first determination unit 213 and the determination result of the second determination unit 215 match. Therefore, when the determination result of the first determination unit 213 and the determination result of the second determination unit 215 match, it can be determined that the accuracy of the first determination unit 213 and the second determination unit 215 is high. If the determination result of the first determination unit 213 and the determination result of the second determination unit 215 do not match, it can be determined that the accuracy of either the first determination unit 213 or the second determination unit 215 is low. As a result, the superiority or inferiority of the first determination unit 213 and the second determination unit 215 can be determined by using the determination result of the determination unit 216 as a trigger.

選択部217は、第1決定部213の決定結果と第2決定部215の決定結果とのうちのいずれか一方の決定結果を選択する。具体的には、決定結果が一致すると判定部216が判定する場合、選択部217は第1決定部213の決定結果を選択する。また、決定結果が一致しないと判定部216が判定する場合、選択部217は第1決定部213の決定結果と第2決定部215の決定結果とのうちのいずれか一方の決定結果を選択する。第1結果と第2結果とが異なる場合、第1結果と第2結果とのうち、どちらかの結果が優先される。したがって、精度よく第1文書と第2文書の順序を決定できる決定部の結果を採用できる。この結果、ユーザーが第1分割データと第2分割データとの順序を決定する手間を抑制できる。 The selection unit 217 selects the determination result of either the determination result of the first determination unit 213 or the determination result of the second determination unit 215. Specifically, when the determination unit 216 determines that the determination results match, the selection unit 217 selects the determination result of the first determination unit 213. When the determination unit 216 determines that the determination results do not match, the selection unit 217 selects one of the determination result of the first determination unit 213 and the determination result of the second determination unit 215. .. When the first result and the second result are different, one of the first result and the second result has priority. Therefore, the result of the determination unit that can accurately determine the order of the first document and the second document can be adopted. As a result, the user can reduce the trouble of determining the order of the first divided data and the second divided data.

例えば、ユーザーは、決定結果が一致しない場合、第2決定部215の決定結果を選択することを予め記憶部22に記憶させる。したがって、決定結果が一致しないと判定部216が判定する場合、選択部217は、第2決定部215の決定結果を選択する。この結果、学習部218の学習が進んでいない場合、第2決定部215の決定結果を選択することで精度良く分割データの順序を決定できる。 For example, when the determination results do not match, the user stores in advance in the storage unit 22 that the determination result of the second determination unit 215 is selected. Therefore, when the determination unit 216 determines that the determination results do not match, the selection unit 217 selects the determination result of the second determination unit 215. As a result, when the learning of the learning unit 218 has not progressed, the order of the divided data can be accurately determined by selecting the determination result of the second determination unit 215.

また、学習部218の学習が進んだ場合、ユーザーは第1決定部213の決定結果を選択することを予め記憶部22に記憶させる。したがって、決定結果が一致しないと判定部216が判定する場合、選択部217は、第1決定部213の決定結果を選択する。この結果、学習が進んで精度が向上した推定結果に基づいて決定された第1決定部213の決定結果を選択できるため、精度良く分割データの順序を決定できる。 Further, when the learning of the learning unit 218 progresses, the storage unit 22 stores in advance that the user selects the determination result of the first determination unit 213. Therefore, when the determination unit 216 determines that the determination results do not match, the selection unit 217 selects the determination result of the first determination unit 213. As a result, since the determination result of the first determination unit 213 determined based on the estimation result with advanced learning and improved accuracy can be selected, the order of the divided data can be determined with high accuracy.

次に、図11を参照して、実施形態2の制御部21が実行する処理を説明する。図11は、制御部21が実行する処理のフローチャートを示す。制御部21が実行する処理は、ステップS301〜ステップS310を含む。図11に示すステップS301〜ステップS307は、図6に示すステップS101〜ステップS107に対応しており、同様の処理を実行する。 Next, the process executed by the control unit 21 of the second embodiment will be described with reference to FIG. FIG. 11 shows a flowchart of processing executed by the control unit 21. The process executed by the control unit 21 includes steps S301 to S310. Steps S301 to S307 shown in FIG. 11 correspond to steps S101 to S107 shown in FIG. 6, and the same processing is executed.

ステップS307の後に、ステップS308において、制御部21は、第2決定処理を実行する。第2決定処理は、図12を参照して後述する。処理は、ステップS309に進む。 After step S307, in step S308, the control unit 21 executes the second determination process. The second determination process will be described later with reference to FIG. The process proceeds to step S309.

ステップS309において、制御部21は、選択処理を実行する。選択処理は、図13を参照して後述する。処理はステップS310に進む。 In step S309, the control unit 21 executes the selection process. The selection process will be described later with reference to FIG. The process proceeds to step S310.

ステップS310において、学習部218は、文書データとページ番号と推定結果と第1決定部213の決定結果と第2決定部215の決定結果とを学習する。処理は、終了する。 In step S310, the learning unit 218 learns the document data, the page number, the estimation result, the determination result of the first determination unit 213, and the determination result of the second determination unit 215. The process ends.

次に、図12を参照して、第2決定処理を説明する。図12は、制御部21が実行する第2決定処理のフローチャートを示す。制御部21が実行する第2決定処理は、ステップS401〜ステップS403を含む。第2決定処理は、図11に示すステップS308に対応する。 Next, the second determination process will be described with reference to FIG. FIG. 12 shows a flowchart of the second determination process executed by the control unit 21. The second determination process executed by the control unit 21 includes steps S401 to S403. The second determination process corresponds to step S308 shown in FIG.

ステップS401において、第2抽出部214は、分割データに含まれる文書の抽出領域CTに位置する記号を抽出する。処理はステップS402に進む。 In step S401, the second extraction unit 214 extracts the symbol located in the extraction area CT of the document included in the divided data. The process proceeds to step S402.

ステップS402において、制御部21は、他の分割データがあるか否かを判定する。他の分割データがある場合(ステップS402において、Yes)、処理はステップS401に戻る。他の分割データがない場合(ステップS402において、No)、処理はステップS403に進む。 In step S402, the control unit 21 determines whether or not there is other divided data. If there is other divided data (Yes in step S402), the process returns to step S401. If there is no other divided data (No in step S402), the process proceeds to step S403.

ステップS403において、第2決定部215は、第1分割データと第2分割データとの順序を決定する。処理は、図11に示すステップS309に戻る。 In step S403, the second determination unit 215 determines the order of the first division data and the second division data. The process returns to step S309 shown in FIG.

次に、図13を参照して、選択処理を説明する。図13は、制御部21が実行する選択処理のフローチャートを示す。制御部21が実行する選択処理は、ステップS501〜ステップS503を含む。選択処理は、図11に示すステップS309に対応する。 Next, the selection process will be described with reference to FIG. FIG. 13 shows a flowchart of the selection process executed by the control unit 21. The selection process executed by the control unit 21 includes steps S501 to S503. The selection process corresponds to step S309 shown in FIG.

ステップS501において、判定部216は、第1決定部213の決定結果と第2決定部215の決定結果とが一致するか否かを判定する。決定結果が一致する場合(ステップS501において、Yes)、処理はステップS502に進む。決定結果が一致しない場合(ステップS501において、No)、処理はステップS503に進む。 In step S501, the determination unit 216 determines whether or not the determination result of the first determination unit 213 and the determination result of the second determination unit 215 match. If the determination results match (Yes in step S501), the process proceeds to step S502. If the determination results do not match (No in step S501), the process proceeds to step S503.

ステップS502でNoの場合、ステップS503において、選択部217は予め定められた決定結果を選択する。処理は、図11に示すステップS310に戻る。 If No in step S502, in step S503, the selection unit 217 selects a predetermined determination result. The process returns to step S310 shown in FIG.

ステップS502でYesの場合、ステップS502において、選択部217は第1決定部213の決定結果を選択する。処理は、図11に示すステップS310に戻る。 In the case of Yes in step S502, in step S502, the selection unit 217 selects the determination result of the first determination unit 213. The process returns to step S310 shown in FIG.

以上、図面を参照しながら本発明の実施形態を説明した。但し、本発明は、上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲で種々の態様において実施することが可能である。また、上記の各実施形態に開示されている複数の構成要素を適宜組み合わせることによって、種々の発明の形成が可能である。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。図面は、理解しやすくするために、それぞれの構成要素を主体に模式的に示しており、図示された各構成要素の厚み、長さ、個数、間隔等は、図面作成の都合上から実際とは異なる。また、上記の実施形態で示す各構成要素の速度、材質、形状、寸法等は一例であって、特に限定されるものではなく、本発明の構成から実質的に逸脱しない範囲で種々の変更が可能である。 The embodiments of the present invention have been described above with reference to the drawings. However, the present invention is not limited to the above-described embodiment, and can be implemented in various embodiments without departing from the gist thereof. In addition, various inventions can be formed by appropriately combining the plurality of components disclosed in each of the above embodiments. For example, some components may be removed from all the components shown in the embodiments. Further, components over different embodiments may be combined as appropriate. In order to make the drawings easier to understand, each component is schematically shown, and the thickness, length, number, spacing, etc. of each component shown are actual for the convenience of drawing creation. Is different. Further, the speed, material, shape, dimensions, etc. of each component shown in the above embodiment are merely examples, and are not particularly limited, and various changes can be made without substantially deviating from the configuration of the present invention. It is possible.

(1)実施形態2の選択部217は、決定結果が一致しないと判定部216が判定する場合、選択部217は予め定められた決定部の決定結果を選択した。しかし、制御部21は、決定結果が一致しない場合、ユーザーに分割データの順序を決定させてもよい。そして、ユーザーが決定した順序を学習部218が学習する。したがって、学習部218は精度良く学習できる。この結果、学習部218は、精度の良い推定結果を出力できる。 (1) When the determination unit 216 determines that the determination results do not match, the selection unit 217 of the second embodiment selects the determination result of the predetermined determination unit. However, if the determination results do not match, the control unit 21 may let the user determine the order of the divided data. Then, the learning unit 218 learns the order determined by the user. Therefore, the learning unit 218 can learn with high accuracy. As a result, the learning unit 218 can output an accurate estimation result.

本発明は、画像形成装置の分野に利用可能である。 The present invention can be used in the field of image forming apparatus.

2 画像読取ユニット(撮像部)
21 制御部
100 画像形成装置
211 分割部
212 第1抽出部
213 第1決定部
214 第2抽出部
214 第2抽出
215 第2決定部
216 判定部
217 選択部
218 学習部
CT 抽出領域(所定領域)
P シート
R シート
2 Image reading unit (imaging unit)
21 Control unit 100 Image forming device 211 Dividing unit 212 First extraction unit 213 First determination unit 214 Second extraction unit 214 Second extraction 215 Second determination unit 216 Judgment unit 217 Selection unit 218 Learning unit CT extraction area (predetermined area)
P sheet R sheet

Claims (10)

文書を示す文書データに基づいて、シートに文書を形成する画像形成装置であって、
文字と文字との繋がりを推定するために、前記文書を含む文書データを学習する学習部と、
複数の文書が集約されて形成されたシートを撮像して、撮像データを生成する撮像部と、
前記撮像データを1ページ分の前記文書ごとに分割して、複数の分割データを生成する分割部と、
前記分割データの各々から文字を抽出する第1抽出部と、
を備え、
前記分割データは、第1分割データと前記第1分割データと異なる第2分割データとを含み、
前記第1抽出部は、
前記第1分割データが含む第1文書から第1文字を抽出し、
前記第2分割データが含む第2文書から第2文字を抽出し、
前記第1文書は、前記1ページ分の前記分割データによって表される文書を示し、
前記第2文書は、前記第1文書と異なる前記1ページ分の前記分割データによって表される文書を示し、
前記第1文字は前記第1文書の記載が始まる位置を示す文頭又は前記第1文書の記載が終わる位置を示す文末のうち、いずれか一方の位置に含まれる文字であり、
前記第2文字は前記第2文書の記載が始まる位置を示す文頭又は前記第2文書の記載が終わる位置を示す文末のうち、前記第1文字が含まれる位置と異なる位置の文字であり、
前記学習部は、前記第1文字と前記第2文字とが入力されることで、前記第1文字と前記第2文字との繋がりの程度を示す推定結果を出力する、画像形成装置。
An image forming apparatus that forms a document on a sheet based on document data indicating a document.
A learning unit that learns document data including the above documents in order to estimate the connection between characters,
An imaging unit that generates imaging data by imaging a sheet formed by aggregating multiple documents,
A division unit that divides the imaging data into one page of the document to generate a plurality of division data, and
A first extraction unit that extracts characters from each of the divided data,
With
The divided data includes a first divided data and a second divided data different from the first divided data.
The first extraction unit
The first character is extracted from the first document included in the first partition data,
The second character is extracted from the second document included in the second divided data, and
The first document indicates a document represented by the divided data for one page.
The second document indicates a document represented by the divided data for one page different from the first document.
The first character is a character included in either the beginning of a sentence indicating the position where the description of the first document starts or the end of the sentence indicating the position where the description of the first document ends.
The second character is a character at a position different from the position including the first character in the beginning of the sentence indicating the position where the description of the second document starts or the end of the sentence indicating the position where the description of the second document ends.
The learning unit is an image forming apparatus that outputs an estimation result indicating the degree of connection between the first character and the second character by inputting the first character and the second character.
前記学習部が学習する前記文書データは、前記画像形成装置がシートに形成する前記文書を含むデータである、請求項1に記載の画像形成装置。 The image forming apparatus according to claim 1, wherein the document data learned by the learning unit is data including the document formed by the image forming apparatus on a sheet. 前記学習部は、前記文書データと、前記文書データに対応するページ番号とを更に学習する、請求項1又は請求項2に記載の画像形成装置。 The image forming apparatus according to claim 1 or 2, wherein the learning unit further learns the document data and the page number corresponding to the document data. 前記第1文字と前記第2文字との各々は、単一の文字、単語、及び形態素を含む、請求項1又は請求項2に記載の画像形成装置。 The image forming apparatus according to claim 1 or 2, wherein each of the first character and the second character contains a single character, a word, and a morpheme. 前記第1抽出部は、
前記第1文書の文末に位置する前記第1文字を抽出し、
前記第2文書の文頭に位置する前記第2文字を抽出する、請求項1から請求項4のいずれか1項に記載の画像形成装置。
The first extraction unit
The first character located at the end of the first document is extracted and
The image forming apparatus according to any one of claims 1 to 4, which extracts the second character located at the beginning of the sentence of the second document.
前記第1抽出部は、
前記第1文書の文頭に位置する前記第1文字を抽出し、
前記第2文書の文末に位置する前記第2文字を抽出する、請求項1から請求項5のいずれか1項に記載の画像形成装置。
The first extraction unit
The first character located at the beginning of the first document is extracted and
The image forming apparatus according to any one of claims 1 to 5, which extracts the second character located at the end of the sentence of the second document.
前記学習部の推定結果に基づいて、前記第1分割データと前記第2分割データとの順序を決定する第1決定部を更に備える、請求項1から請求項6のいずれか1項に記載の画像形成装置。 The invention according to any one of claims 1 to 6, further comprising a first determination unit that determines the order of the first division data and the second division data based on the estimation result of the learning unit. Image forming device. 前記文書の所定領域に位置する記号を抽出する第2抽出部と、
前記第2抽出部の抽出結果に基づいて、前記第1分割データと前記第2分割データとの順序を決定する第2決定部と
を更に備える、請求項7に記載の画像形成装置。
A second extraction unit that extracts symbols located in a predetermined area of the document, and
The image forming apparatus according to claim 7, further comprising a second determination unit that determines the order of the first division data and the second division data based on the extraction result of the second extraction unit.
前記第1決定部の決定結果と前記第2決定部の決定結果とが一致するか否かを判定する判定部と、
前記第1決定部の決定結果又は前記第2決定部の決定結果を選択する選択部と
を更に備え、
前記第1決定部の決定結果と前記第2決定部の決定結果とが一致しないと前記判定部が判定する場合、前記選択部は前記第1決定部の決定結果と前記第2決定部の決定結果とのうちのいずれか一方の決定結果を選択する、請求項8に記載の画像形成装置。
A determination unit that determines whether or not the determination result of the first determination unit and the determination result of the second determination unit match.
Further provided with a selection unit for selecting the determination result of the first determination unit or the determination result of the second determination unit.
When the determination unit determines that the determination result of the first determination unit and the determination result of the second determination unit do not match, the selection unit determines the determination result of the first determination unit and the determination of the second determination unit. The image forming apparatus according to claim 8, wherein a determination result of either one of the results is selected.
前記学習部は、前記文書データと、前記文書データに対応するページ番号と、前記推定結果と、前記第1決定部の決定結果と、前記第2決定部の決定結果とを学習する、請求項8又は請求項9に記載の画像形成装置。 The claim that the learning unit learns the document data, the page number corresponding to the document data, the estimation result, the determination result of the first determination unit, and the determination result of the second determination unit. 8 or the image forming apparatus according to claim 9.
JP2019077116A 2019-04-15 2019-04-15 Image forming apparatus Pending JP2020178168A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019077116A JP2020178168A (en) 2019-04-15 2019-04-15 Image forming apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019077116A JP2020178168A (en) 2019-04-15 2019-04-15 Image forming apparatus

Publications (1)

Publication Number Publication Date
JP2020178168A true JP2020178168A (en) 2020-10-29

Family

ID=72937115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019077116A Pending JP2020178168A (en) 2019-04-15 2019-04-15 Image forming apparatus

Country Status (1)

Country Link
JP (1) JP2020178168A (en)

Similar Documents

Publication Publication Date Title
JP4311738B2 (en) Image forming apparatus, control method therefor, and computer program
US7797150B2 (en) Translation system using a translation database, translation using a translation database, method using a translation database, and program for translation using a translation database
JP5138736B2 (en) Character input device and character input method
US20100138757A1 (en) Display control apparatus, image forming apparatus, and computer-readable recording medium storing display control program
US10810383B2 (en) Image processing apparatus for comparing documents in different languages
JP5880052B2 (en) Document processing apparatus and program
JP5631925B2 (en) Image forming apparatus
US10902223B2 (en) Image processing apparatus
JP2020178168A (en) Image forming apparatus
US8970919B2 (en) Display/input device and image forming apparatus including display/input device
JP2011155548A (en) Device, program and method for creation of file
JP6601143B2 (en) Printing device
JP2006276918A (en) Translating device, translating method and program
JP2018077794A (en) Image processing device and image forming apparatus
JP5618921B2 (en) Character input device and image forming apparatus having the same
JP2007034430A (en) Translation device, translation method, and program
JP7409102B2 (en) Information processing device and image forming device
JP5742279B2 (en) Instruction execution apparatus, instruction execution program, and image forming system
JP5712327B2 (en) Display input device and image forming apparatus having the same
US11044372B2 (en) Image forming apparatus
JP2013030916A (en) Image processing apparatus and image forming apparatus including the same
US20230039512A1 (en) Image processing apparatus and image forming apparatus capable of classifying respective images of plurality of pages of original document based on plurality of topic words
JP2010067208A (en) Display controller, image forming apparatus, and display control program
JP2023031411A (en) Image forming apparatus
JP2024097247A (en) Image forming device