JP2020178168A - Image forming apparatus - Google Patents
Image forming apparatus Download PDFInfo
- Publication number
- JP2020178168A JP2020178168A JP2019077116A JP2019077116A JP2020178168A JP 2020178168 A JP2020178168 A JP 2020178168A JP 2019077116 A JP2019077116 A JP 2019077116A JP 2019077116 A JP2019077116 A JP 2019077116A JP 2020178168 A JP2020178168 A JP 2020178168A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- document
- character
- data
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
Description
本発明は、画像形成装置に関する。 The present invention relates to an image forming apparatus.
特許文献1に記載の画像処理装置は、判定手段と、第1サムネイル生成手段と、表示手段とを備える。判定手段は、入力されたドキュメントが、その1ページにN(N≧2)ページ分の原稿内容がまとめられているN−upドキュメントであるか否かを判定する。第1サムネイル生成手段は、判定手段によってN−upドキュメントであると判定された場合に、Nページの各々のサムネイルである第1サムネイルを生成する。表示手段は、第1サムネイルをプレビュー表示する。特許文献1に記載の画像処理装置の表示手段は、1upドキュメントをプレビュー表示できる。
The image processing apparatus described in
しかしながら、N−upドキュメントのように複数の画像が集約された画像を、画像ごとに分割する場合、画像の順序が連続するように並ばないことがある。したがって、特許文献1に記載の画像形成装置では、ユーザーには、画像の順序を並び替える手間が発生する。
However, when an image in which a plurality of images are aggregated, such as an N-up document, is divided for each image, the images may not be arranged in a continuous order. Therefore, in the image forming apparatus described in
本発明は上記課題に鑑みてなされたものであり、集約された画像を分割する際に、分割された画像を並び替える手間を抑制できる画像形成装置を提供することを目的とする。 The present invention has been made in view of the above problems, and an object of the present invention is to provide an image forming apparatus capable of suppressing the trouble of rearranging the divided images when the aggregated images are divided.
本発明に係る画像形成装置は、文書を示す文書データに基づいて、シートに文書を形成する。画像形成装置は、学習部と、撮像部と、分割部と、第1抽出部とを備える。前記学習部は、文字と文字との繋がりを推定するために、前記文書を含む文書データを学習する。前記撮像部は、複数の文書が集約されて形成されたシートを撮像して、撮像データを生成する。前記分割部は、前記撮像データを1ページ分の前記文書ごとに分割して、複数の分割データを生成する。前記第1抽出部は、前記分割データの各々から文字を抽出する。前記分割データは、第1分割データと前記第1分割データと異なる第2分割データとを含む。前記第1抽出部は、前記第1分割データが含む第1文書から第1文字を抽出し、前記第2分割データが含む第2文書から第2文字を抽出する。前記第1文書は、前記1ページ分の分割データによって表される文書を示す。前記第2文書は、前記第1文書と異なる前記1ページ分の分割データによって表される文書を示す。前記第1文字は前記第1文書の記載が始まる位置を示す文頭又は前記第1文書の記載が終わる位置を示す文末のうち、いずれか一方の位置に含まれる文字である。前記第2文字は前記第2文書の記載が始まる位置を示す文頭又は前記第2文書の記載が終わる位置を示す文末のうち、前記第1文字が含まれる位置と異なる位置の文字である。前記学習部は、前記第1文字と前記第2文字とが入力されることで、前記第1文字と前記第2文字との繋がりの程度を示す推定結果を出力する。 The image forming apparatus according to the present invention forms a document on a sheet based on the document data indicating the document. The image forming apparatus includes a learning unit, an imaging unit, a dividing unit, and a first extraction unit. The learning unit learns document data including the document in order to estimate the connection between characters. The imaging unit captures a sheet formed by aggregating a plurality of documents to generate imaging data. The division unit divides the imaging data for each page of the document to generate a plurality of division data. The first extraction unit extracts characters from each of the divided data. The divided data includes a first divided data and a second divided data different from the first divided data. The first extraction unit extracts the first character from the first document included in the first divided data, and extracts the second character from the second document included in the second divided data. The first document indicates a document represented by the divided data for one page. The second document indicates a document represented by the divided data for one page different from the first document. The first character is a character included in either the beginning of a sentence indicating the position where the description of the first document starts or the end of the sentence indicating the position where the description of the first document ends. The second character is a character at a position different from the position including the first character at the beginning of the sentence indicating the position where the description of the second document starts or the end of the sentence indicating the position where the description of the second document ends. By inputting the first character and the second character, the learning unit outputs an estimation result indicating the degree of connection between the first character and the second character.
本発明の画像形成装置によれば、集約された画像を分割する際に、分割された画像を並び替える手間を抑制できる。 According to the image forming apparatus of the present invention, when the aggregated images are divided, it is possible to reduce the trouble of rearranging the divided images.
以下、本発明の実施形態について、図面を参照しながら説明する。なお、図中、同一又は相当部分については同一の参照符号を付して説明を繰り返さない。また、本発明の実施形態において、X軸、Y軸、及びZ軸は互いに直交し、X軸及びY軸は水平方向に平行であり、Z軸は鉛直方向に平行である。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the drawings, the same or corresponding parts are designated by the same reference numerals and the description is not repeated. Further, in the embodiment of the present invention, the X-axis, the Y-axis, and the Z-axis are orthogonal to each other, the X-axis and the Y-axis are parallel in the horizontal direction, and the Z-axis is parallel in the vertical direction.
[実施形態1]
まず、図1を参照して、本発明の実施形態1に係る画像形成装置100の構成について説明する。図1は、画像形成装置100の構成を示す図である。画像形成装置100は、カラー複合機である。また、画像形成装置100は、パーソナルコンピューターと通信可能に接続されていてもよい。
[Embodiment 1]
First, the configuration of the
図1に示すように、画像形成装置100は、画像形成ユニット1、画像読取ユニット2、原稿搬送ユニット3、及び操作表示部4を備える。画像形成ユニット1は、シートPに画像を形成する。
As shown in FIG. 1, the
画像読取ユニット2は、シートRに形成された画像を読み取り、画像を表す撮像データを生成する。具体的には、画像読取ユニット2は、シートRを撮像してシートRを表す撮像データを生成する。シートRは、原稿である。シートRは、画像が形成されたシートPを示す。画像は文書を含む。また、画像は複数の文書が集約された画像を含む。画像読取ユニット2は、「撮像部」の一例に相当する。画像読取ユニット2は、コンタクトガラス、LED(Light Emitting Diode)、ミラー、キャリッジ、結像レンズ、及び、CCD(Charge Coupled Device)を備えている。LED及びミラーは、キャリッジによって支持されている。
The
画像読取ユニット2によるシートRの画像読取方法には、フラットベッド読取モード、及び、ADF(Auto Document Feeder)読取モードの2種類の方法が存在する。フラットベッド読取モードでは、原稿載置用ガラス上に載置されたシートRの画像を読み取る。ADF読取モードでは、原稿搬送ユニット3によってシートRを搬送させ、シートRが読取位置を通過する際に、シートRの画像を読み取る。原稿搬送ユニット3がシートRを移動させながら、CCDがシートRの画像の読み取りを行い、画像を表す撮像データを生成する。シートRは、例えば、普通紙、コピー紙、再生紙、薄紙、厚紙、又は光沢紙、又はOHP(Overhead Projector)シートである。
There are two types of image reading methods for the sheet R by the image reading unit 2: a flatbed reading mode and an ADF (Auto Document Feeder) reading mode. In the flatbed scanning mode, the image of the sheet R placed on the document placing glass is read. In the ADF reading mode, the
原稿搬送ユニット3は、シートRを画像読取ユニット2に搬送する。
The
操作表示部4は、タッチパネル41と、操作ボタン42とを有する。タッチパネル41は、表示装置43とタッチセンサー45とを有する。表示装置43は種々の画像を表示する。表示装置43は、例えば液晶表示装置(Liquid Crystaal Display:LCD)である。タッチセンサー45はユーザーからの操作を受け付ける。また、操作ボタン42はユーザーからの操作を受け付ける。
The
タッチパネル41は、ユーザーからの操作を受け付ける度に、ユーザーからの操作の内容を示す操作情報を生成する。具体的には、タッチパネル41には、複数のアイコンが表示される。そして、ユーザーは、アイコンをタップする。タッチパネル41は、操作情報として、アイコンがタップされたことを示す情報を生成する。
Each time the
操作表示部4は、ユーザーからの操作に基づいて、タッチパネル41に表示する画像を変更する。具体的には、操作表示部4は、タッチパネル41に表示された複数のアイコンのうち、ユーザーによって操作されたアイコンに対応する画像をタッチパネル41に表示する。また、操作表示部4は、タッチパネル41に表示する画像に対応する情報を、記憶部22から読み出す。
The
画像形成ユニット1は、搬送機構11、給送部12、トナー供給部13、画像形成部14、定着部15、排出部16、制御部21及び記憶部22を含む。画像形成ユニット1は、搬送路Lを有する。
The
搬送路Lは、給送部12から排出部16までシートPを案内する。搬送路Lは、給送部12から排出部16まで延びる。
The transport path L guides the sheet P from the
搬送機構11は、シートPを搬送する。具体的には、搬送機構11は、シートPを画像形成部14及び定着部15を経由して排出部16まで搬送する。また、搬送機構11は、定着部15で画像が定着されたシートPを反転して画像形成部14へ搬送できる。
The
給送部12は、シートPを搬送路Lへ供給する。シートPは、例えば、普通紙、コピー紙、再生紙、薄紙、厚紙、又は光沢紙、又はOHP(Overhead Projector)シートである。
The
トナー供給部13には、複数のトナーコンテナが装着される。複数のトナーコンテナのうちの1つは、シアン色のトナーが収納される。複数のトナーコンテナのうちの1つは、マゼンタ色のトナーが収納される。複数のトナーコンテナのうちの1つは、イエロー色のトナーが収納される。複数のトナーコンテナのうちの1つは、黒色のトナーが収納される。
A plurality of toner containers are mounted on the
画像形成部14は、画像をシートPに形成する。具体的には、画像形成部14は、複数のシートPに複数の画像を形成する。画像形成部14は、転写部を含む。転写部は、画像をシートPに転写する。その結果、シートPに画像が形成される。
The
画像形成部14は、複数の画像形成部を含む。複数の画像形成部のうちの1つは、シアン色のトナー像を形成する。複数の画像形成部のうちの1つは、マゼンタ色のトナー像を形成する。複数の画像形成部のうちの1つは、イエロー色のトナー像を形成する。複数の画像形成部のうちの1つは、ブラック色のトナー像を形成する。
The
画像形成部14は、転写部と、像担持体と、帯電部と、露光部と、現像部とを含む。
The
転写部は、トナー画像をシートPに転写する。転写部は、中間転写ベルトを含む。中間転写ベルトは、無端状のベルトである。中間転写ベルトには、複数色のトナー像が形成される。具体的には、中間転写ベルトには、複数の画像形成部14が中間転写ベルトにトナー像を形成する。この結果、複数色のトナー像が中間転写ベルト上で重畳され、中間転写ベルト上に画像が形成される。そして、中間転写ベルトに形成された画像は、シートPに転写される。その結果、シートPに画像が形成される。
The transfer unit transfers the toner image to the sheet P. The transfer section includes an intermediate transfer belt. The intermediate transfer belt is an endless belt. Toner images of a plurality of colors are formed on the intermediate transfer belt. Specifically, on the intermediate transfer belt, a plurality of
像担持体は、ドラム形状であり、回転軸を有する。像担持体は、回転軸を中心に時計回りに回転する。像担持体は、外周面側に感光層を有する。 The image carrier is drum-shaped and has a rotation axis. The image carrier rotates clockwise about the axis of rotation. The image carrier has a photosensitive layer on the outer peripheral surface side.
帯電部は像担持体の感光層を所定の電位に帯電する。露光部は、像担持体の感光層にレーザー光を照射して露光する。露光部は画像データに基づいて像担持体を露光する。この結果、像担持体に静電潜像が形成される。 The charged portion charges the photosensitive layer of the image carrier to a predetermined potential. The exposed portion irradiates the photosensitive layer of the image carrier with laser light to expose it. The exposed unit exposes the image carrier based on the image data. As a result, an electrostatic latent image is formed on the image carrier.
現像部は像担持体上の静電潜像を現像する。現像部は現像ローラーを有する。現像ローラーは、像担持体にトナーを供給し、像担持体上の静電潜像を現像してトナー画像を形成する。この結果、像担持体の外周面にトナー画像が形成される。 The developing unit develops an electrostatic latent image on the image carrier. The developing unit has a developing roller. The developing roller supplies toner to the image carrier and develops an electrostatic latent image on the image carrier to form a toner image. As a result, a toner image is formed on the outer peripheral surface of the image carrier.
転写部は、像担持体の外周面に形成されたトナー画像をシートPに転写する。その結果、シートPにトナー画像が転写される。 The transfer unit transfers the toner image formed on the outer peripheral surface of the image carrier to the sheet P. As a result, the toner image is transferred to the sheet P.
定着部15は、シートPを加熱及び加圧し、シートPに形成された画像をシートPに定着する。具体的には、定着部15は、シートPを加熱及び加圧し、シートPに形成されたトナー画像をシートPに定着する。
The fixing
排出部16は、シートPを画像形成装置100の外部へ排出する。定着部15がトナー画像をシートPに定着させた後、搬送機構11はシートPを定着部15から排出部16まで搬送する。そして、排出部16はトナー画像の定着したシートPを画像形成装置100の外部に排出する。
The
制御部21は、画像形成装置100の動作を制御する。制御部21は、プロセッサーと記憶装置とを含む。プロセッサーは、例えばCPU(Central Processing Unit)を含む。プロセッサーは、記憶装置に記憶された制御プログラムを実行して、操作表示部4、搬送機構11、給送部12、画像形成部14、定着部15、及び排出部16を制御する。
The
記憶部22は、記憶装置を含む。具体的には、記憶部22は、半導体メモリーのようなメモリーを備え、HDD(Hard Disk Drive)を備えてもよい。記憶部22は、制御プログラムを記憶している。
The
次に図2を参照して、制御部21の構成を詳しく説明する。図2は、本実施形態に係る制御部21の構成を示す図である。制御部21は、学習部218、分割部211、及び第1抽出部212を含む。制御部21は、制御プログラムを実行することで、学習部218、分割部211、及び第1抽出部212として機能する。
Next, the configuration of the
分割部211は、画像読取ユニット2が生成した撮像データを1ページ分の文書ごとに分割して、複数の分割データを生成する。分割データは、第1分割データと第2分割データとを含む。第2分割データは、第1分割データと異なる分割データを示す。
The
第1抽出部212は、分割データの各々から文字を抽出する。具体的には、第1抽出部212は、第1分割データが含む第1文書から第1文字を抽出する。第1文書は、1ページ分の分割データによって表される文書を示す。第1文字は、第1文書の文頭又は文末のうち、いずれか一方の位置に含まれる文字である。具体的には、第1文字は第1文書の記載が始まる位置を示す文頭又は第1文書の記載が終わる位置を示す文末のうち、いずれか一方の位置に含まれる文字である。
The
また、第1抽出部212は、第2分割データが含む第2文書から第2文字を抽出する。第2文書は、第1文書と異なる1ページ分の分割データによって表される文書を示す。第2文字は第2文書の記載が始まる位置を示す文頭又は第2文書の記載が終わる位置を示す文末のうち、第1文字が含まれる位置と異なる位置の文字である。
In addition, the
また、第1文字と第2文字との各々は、単一の文字、単語、及び形態素を含む。形態素は、意味を持つ最小の単位の表現要素を示す。したがって、複数の言語に対応できる。この結果、複数の言語の文字と文字との繋がりを推定できる。 Also, each of the first and second letters includes a single letter, word, and morpheme. A morpheme represents the expression element of the smallest unit that has meaning. Therefore, it can support a plurality of languages. As a result, it is possible to estimate the connection between characters in a plurality of languages.
学習部218は、文字と文字との繋がりを推定するために、文書データを学習する。この結果、文書データに基づいて、文字と文字との繋がりを容易に推定できる。
The
学習は、機械学習を含む。機械学習は、例えば教師あり学習、教師なし学習、及び強化学習を含む。機械学習は、例えば、ニューラルネットワーク(Neural Network)又はサポートベクターマシン(Support Vector Machine)によって実行される。ニューラルネットワークは、入力層、隠れ層(中間層)、及び出力層を有する。ニューラルネットワークは、誤差逆伝播法(バックプロパゲーション)により、出力層での出力値と最適解との誤差を少なくする。 Learning includes machine learning. Machine learning includes, for example, supervised learning, unsupervised learning, and reinforcement learning. Machine learning is performed, for example, by a neural network (Neural Network) or a support vector machine (Support Vector Machine). The neural network has an input layer, a hidden layer (intermediate layer), and an output layer. The neural network uses an error backpropagation method to reduce the error between the output value and the optimum solution in the output layer.
また、機械学習は、深層学習(ディープラーニング)であってもよい。深層学習は、入力層、2層以上の隠れ層、及び出力層を有するニューラルネットワークによって構成される。具体的には、深層学習は、例えば、畳み込みニューラルネットワーク(Convolutional Neural Network)、再帰型ニューラルネットワーク(Recurrent Neural Network)、ボルツマンマシン(Boltzman machine)によって構成される。 Further, the machine learning may be deep learning. Deep learning is composed of a neural network having an input layer, two or more hidden layers, and an output layer. Specifically, deep learning is composed of, for example, a convolutional neural network, a recurrent neural network, and a Boltzmann machine.
また、本実施形態の学習部218は、第1文字と第2文字とが入力されることで、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。したがって、文書に記載されている文字に基づいて、ユーザーが文書を並び変える必要がない。この結果、集約された画像を分割する際の、文書を並び変える手間を抑制できる。
Further, the
例えば、一般的に、会議で使用した「2in1」のような集約された文書を保管する際に、ユーザーは画像形成装置の分割機能を利用する。複数の文書が集約された資料を分割する場合、画像読取ユニット2がシートRを読み取った方向などから、文書が順序通りに並ばないことがある。このような場合、ユーザーは文書を目視で確認し、文脈に基づいて、自ら文書の順序を並び替えて文書を保管する。しかしながら、学習部218が文字と文字との繋がりの程度を推定するため、ユーザーは、推定結果に基づいて、文書を並び替えることができる。この結果、文書を並び替える手間を抑制できる。
For example, in general, when storing an aggregated document such as "2in1" used in a conference, the user uses the division function of the image forming apparatus. When a document in which a plurality of documents are aggregated is divided, the documents may not be arranged in order due to the direction in which the
また、本実施形態の学習部218が学習する文書データは、画像形成装置100がシートPに形成する文書を示すデータである。画像形成装置100が複数の文書を集約して1枚のシートPに形成する文書の文書データを学習部218が学習する。したがって、学習部218に入力される第1文字と第2文字とは、文書データに含まれるため、学習部218の学習精度は向上する。この結果、推定結果の精度が向上する。
Further, the document data learned by the
例えば、画像形成装置100は、会議で使用する文書をシートPに形成する。具体的には、画像形成装置100に入力される文書データに基づいて、画像形成装置100は、会議で使用する文書をシートPに形成する。シートPには、複数の文書が集約される。そして学習部218は、文書データを学習する。その後、画像読取ユニット2は、シートRを読み取って、撮像データを生成する。シートRは、複数の文書が集約されたシートPである。更に、撮像データの文書をもとに分割データは生成される。また、学習部218には、分割データから取得された第1文字と第2文字とが入力される。つまり、学習部218に入力される第1文字と第2文字とは、既に学習部218が学習した学習データに含まれる。したがって、学習部218は、精度の良い推定結果を出力できる。なお、学習データは、記憶部22に記憶されている。
For example, the
なお、学習部218が学習する文書データは、画像形成装置100に入力された文書データを含んでもよい。したがって、実際にシートPに形成されなかった文書の画像データも、学習部218は学習できる。
The document data learned by the
また、本実施形態の学習部218は、文書データと、文書データに対応するページ番号とを更に学習する。この結果、学習精度が向上し、文字と文字との繋がりを推定する精度が向上する。
In addition, the
また、学習部218は、文書データに対して、自然言語処理を実行する。自然言語処理は、自然言語をコンピューターに処理させる一連の技術である。自然言語は、人間と人間とが意思疎通のために使用する言語である。自然言語処理は、形態素解析、構文解析、意味解析及び文脈解析を含む。
In addition, the
学習部218は、文書データに対して、形態素解析を実行する。形態素解析は、意味を持つ最小の単位の形態素に区分する処理である。学習部218は、文書データに含まれるテキストを記憶部22に記憶された辞書データに基づいて、文書を形態素に区分する。そして、学習部218は、形態素解析の結果に基づいて、構文解析を実行する。構文解析は、形態素と形態素との関連性を解析する処理である。関連性は、例えば、形態素と形態素との修飾関係である。更に、学習部218は、構文解析の結果に基づいて、意味解析を実行する。意味解析は、構文解析の結果に基づいて、構文木を決定する処理である。構文木は、構文解析の経過及び結果を木構造で示すものである。更に、学習部218は、意味解析の結果に基づいて、文脈解析を実行する。文脈解析は、文と文との関連性を解析する処理である。文は、主語と述語を含み、完結した1つの陳述を示す。学習部218は、自然言語処理の結果に基づいて、学習する。自然言語処理の結果は、学習データとして記憶部22に記憶される。
The
引き続き、図2を参照して、制御部21の構成を詳細に説明する。制御部21は、第1決定部213を更に含む。制御部21は、制御プログラムを実行することで、第1決定部213として機能する。
Subsequently, the configuration of the
第1決定部213は、分割データの順序を決定する。具体的には、第1決定部213は、学習部218の推定結果に基づいて、分割データの順序を決定する。更に具体的には、第1決定部213は、第1文字と第2文字とを学習部218に入力し、学習部218が出力する第1文字と第2文字との繋がりの程度を示す推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。
The
したがって、文書に記載されている文字に基づいて、ユーザーが文書を並び変える必要がない。この結果、集約された画像を分割する際の、文書を並び変える手間を抑制できる。 Therefore, the user does not have to reorder the document based on the characters in the document. As a result, it is possible to reduce the trouble of rearranging the documents when dividing the aggregated images.
また、実施形態1の第1抽出部212は、第1文書の文末に位置する第1文字を抽出し、第2文書の文頭に位置する第2文字を抽出する。そして、第1決定部213は、第1文字と第2文字とを学習部218に入力し、学習部218から出力された推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。したがって、第1文書と第2文書と続けて読むことができる。この結果、集約されてばらばらになった文書を1つの繋がりのある文書とすることができる。
Further, the
また、実施形態1の第1抽出部212は、第1文字と第2文字とを抽出する。第1文字は、第1文書の文末に位置する。第2文字は、第2文書の文頭に位置する。そして、第1決定部213は、第1文字と第2文字とを学習部218に入力し、学習部218から出力された推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。したがって、第1文書と第2文書と続けて読むことができる。この結果、集約されてばらばらになった文書を1つの繋がりのある文書とすることができる。
In addition, the
次に、図2と図3とを参照して、操作表示部4に表示された選択画面50を説明する。図3は、タッチパネル部41に表示された選択画面50を示す図である。選択画面50は、画像形成装置100のコピー機能を選択する操作ボタン42を操作することで、タッチパネル部41に表示される。選択画面50には、用紙選択アイコン51、縮小/拡大アイコン52、濃度設定アイコン53、両面/分割設定アイコン54、ページ集約設定アイコン55、ソート/仕分け設定アイコン56、機能一覧アイコン57、及び、お気に入りアイコン58が表示されている。
Next, the
用紙選択アイコン51は、シートPのサイズを選択する場合に、ユーザーによって操作される。縮小/拡大アイコン52は、シートPに形成された画像を拡大又は縮小する場合に、ユーザーによって操作される。濃度設定アイコン53は、コピー濃度を設定する場合に、ユーザーによって操作される。両面/分割設定アイコン54は、両面又は片面の設定、及び「2in1」のような複数の画像が集約された画像を、画像ごとに分割する場合にユーザーによって操作される。ページ集約設定アイコン55は、「2in1」のようなページ集約を設定する場合に、ユーザーによって操作される。ソート/仕分け設定アイコン56は、ソート有無のような仕分け条件を設定する場合に、ユーザーによって操作される。機能一覧アイコン57は、各種の機能を説明する機能一覧画面をタッチパネル41に表示する場合に、ユーザーによって操作される。お気に入りアイコン58は、ユーザーが使用する頻度が高いアイコンをタッチパネル41に表示する場合に、ユーザーによって操作される。
The
また、図3に示すように、ユーザーH1の手の指(例えば、人差し指)によって、両面/分割設定アイコン54がタップされる。この操作に応じて、タッチパネル部41は、両面/分割設定アイコン54に対応する画面を表示する。なお、手は、タッチパネル41に表示されない。
Further, as shown in FIG. 3, the double-sided / split setting
次に、図2〜図4を参照して、両面/分割設定アイコン54に対応する画面を説明する。図4は、分割データを示す分割画像Dを表示した表示画面110を示す図である。図4に示すように、表示画面110は、第1表示領域111と第2表示領域112とを含む。
Next, the screen corresponding to the double-sided / split setting
第1表示領域111は、撮像データを示す撮像画像RG1を表示するプレビュー画像113と戻るボタン114とが表示される。図4に示す撮像画像RG1は、2つの画像を1枚のシートRに集約した「2in1」の画像である。撮像画像RG1は、撮像データが複数の文書を含む場合、撮像画像RG1も複数表示される。戻るボタン114は、図3に示す選択画面50に戻るためのボタンである。
In the
第2表示領域112には、分割データを示す複数の分割画像Dが表示される。複数の分割画像Dの各々は、1ページ分の分割データによって表される画像を示す。図4に示す複数の分割画像Dは、第1分割画像D1と第2分割画像D2とを含む。
In the
第1分割画像D1は、例えば、複数のページのうちの2ページ目の文書を示す画像である。第1分割画像D1は、文書を含む。第1分割画像D1は、第1文頭領域BS1と第1文末領域ES1とを含む。 The first divided image D1 is, for example, an image showing a document on the second page of a plurality of pages. The first divided image D1 includes a document. The first divided image D1 includes a first sentence beginning region BS1 and a first sentence ending region ES1.
第1文頭領域BS1は、第1分割画像D1に含まれる文書のうち、文頭部分が位置する領域を示す。文頭部分は、1ページ分の分割データによって表される画像に含まれる文書のうち、文書の記載が始まる位置を含む。図4に示す第1文頭領域BS1には、「multifunction devices・・・・」という文字列が位置する。 The first sentence beginning area BS1 indicates an area in which the sentence beginning portion is located in the document included in the first divided image D1. The beginning of the sentence includes the position where the description of the document starts in the document included in the image represented by the divided data for one page. In the first sentence head region BS1 shown in FIG. 4, the character string "multifaction devices ..." is located.
第1文末領域ES1は、第1分割画像D1に含まれる文書のうち、文末部分が位置する領域を示す。文末部分は、1ページ分の分割データによって表される画像に含まれる文書のうち、文書の記載が終わる位置を含む。図4に示す第1文末領域ES1には、「・・・・optimally」という文字列が位置する。 The first sentence end area ES1 indicates an area in which the sentence end portion is located in the document included in the first divided image D1. The end of the sentence includes the position where the description of the document ends in the document included in the image represented by the divided data for one page. The character string "... optimally" is located in the first sentence end region ES1 shown in FIG.
第2分割画像D2は、例えば、複数のページのうちの1ページ目の文書を示す画像である。第2分割画像D2は、文書を含む。第2分割画像D2は、第2文頭領域BS2と第2文末領域ES2とを含む。 The second divided image D2 is, for example, an image showing a document on the first page of a plurality of pages. The second divided image D2 includes a document. The second divided image D2 includes the second sentence beginning region BS2 and the second sentence ending region ES2.
第2文頭領域BS2は、第2分割画像D2に含まれる文書のうち、文頭部分が位置する領域を示す。図4に示す第2文頭領域BS2には、「Tokkyo Co.,Ltd.・・・・」という文字列が位置する。 The second sentence beginning area BS2 indicates an area in which the sentence beginning portion is located in the document included in the second divided image D2. The character string "Tokyo Co., Ltd ....." is located in the second sentence head region BS2 shown in FIG.
第2文末領域ES2は、第2分割画像D2に含まれる文書のうちの文末部分が位置する領域を示す。図4に示す第2分割画像D2の第2文末領域ES2には、「・・・・printers and」という文字列が位置する。 The second sentence end area ES2 indicates an area in which the sentence end portion of the document included in the second divided image D2 is located. The character string "... printers and" is located in the second sentence end region ES2 of the second divided image D2 shown in FIG.
また、図4に示す第1分割画像D1は、第1表示領域111から第2表示領域112へ向かう方向の上流側に位置する。図4に示す第2分割画像D2は、第1表示領域111から第2表示領域112へ向かう方向の下流側に位置する。したがって、図4では2ページ目の第1分割画像D1が上流側に位置し、1ページ目の第2分割画像D2が下流側に位置する。
Further, the first divided image D1 shown in FIG. 4 is located on the upstream side in the direction from the
図4に示す第1分割画像D1と図4に示す第2分割画像D2とに撮像画像RG1を分割する場合、制御部21は、操作表示部4が分割設定を行う表示画面110を表示するように、操作表示部4を制御する。図4に示す表示画面110を操作表示部4のタッチパネル41に表示する場合、図3に示す両面/分割設定アイコン54のタッチ操作を2回行う。なお、タッチ操作が1回の場合、両面設定の画面が操作表示部4に表示される。分割設定アイコン54が2回タッチ操作された場合、画像読取ユニット2は、シートRを撮像してシートRを表す撮像データを取得する。シートRは、画像が形成されたシートである。シートRに形成された画像は、複数の画像が集約された画像である。画像読取ユニット2が撮像した撮像データは、制御部21に送信される。
When the captured image RG1 is divided into the first divided image D1 shown in FIG. 4 and the second divided image D2 shown in FIG. 4, the
制御部21は、撮像データを受信する。そして、制御部21は、撮像データの所定領域の輝度を取得する。所定領域は、複数の画像が集約された場合に、互いに隣り合う画像と画像との間に形成される領域を示す。また、集約する画像の数に応じて、所定領域のパターンが変更される。集約された画像が2つの場合、所定領域のパターンは、例えば、撮像画像を2つに分断する1本の直線の形状となる。集約された画像が4つの場合、所定領域のパターンは、例えば、撮像画像を4つに分断する十字の形状となる。
The
また、制御部21は、所定領域の輝度が所定の階調か否かを判定する。所定の階調は、例えば、白色を示す。そして、分割部211は、白色の階調を示す所定領域に基づいて、撮像データを分割する。例えば、分割部211は、撮像データを第1分割データと第2分割データとに分割する。
Further, the
更に、制御部21は、分割データに対して文字認識処理を実行する。文字認識処理は、典型的には、光学的文字認識(Optical Character Recognition:OCR)処理である。制御部21は、分割データに対して文字認識処理を実行して、文字画像を検索する。具体的には、制御部21は、複数の方向から分割データに対して文字認識処理を実行する。したがって、文字画像を検索する精度が向上する。この結果、制御部21は、検索した文字画像に基づいて、精度のよいテキスト情報を取得できる。
Further, the
また、複数の画像を集約する場合、画像データの向きを変更して集約される。そして、分割部211の分割データの向きは、撮像データが画像読取ユニット2に撮像された際の向きと同じになる。したがって、分割データに含まれる文書の向きは、一般的に認識される文字の向きと異なる。制御部21は、複数の方向から分割データに対して文字認識処理を行い、文字画像を最も多く検索できた向きに分割データの向きを修正する。この結果、ユーザーが分割データを確認する際に、分割データを認識することが容易となる。
Further, when a plurality of images are aggregated, the orientation of the image data is changed and the images are aggregated. Then, the orientation of the divided data of the
そして、制御部21は、第1分割データを示す第1分割画像D1を図4に示す第2表示領域112に表示するように、操作表示部4を制御する。制御部21は、第1分割データを示す第2分割画像D2を図4に示す第2表示領域112に表示するように、操作表示部4を制御する。
Then, the
次に、図2〜図5を参照して、第1決定部213が第1分割データと第2分割データとの順序を決定するまでの処理を説明する。図5は、分割データを示す分割画像Dを表示した表示画面110を示す別の図である。図5に示すように、表示画面110は、第1表示領域111と第2表示領域112とを含む。
Next, with reference to FIGS. 2 to 5, the process until the
第1表示領域111には、撮像データを示す撮像画像RG1を表示する。撮像画像RG1は、プレビュー画像113と戻るボタン114とを含む。第2表示領域112には、分割データを示す複数の分割画像Dが表示される。図5に示す複数の分割画像Dは、第1分割画像D1と第2分割画像D2とを含む。
In the
図5に示す第1分割画像D1は、第1表示領域111から第2表示領域112へ向かう方向の下流側に位置する。図5に示す第2分割画像D2は、第1表示領域111から第2表示領域112へ向かう方向の上流側に位置する。したがって、図5では1ページ目の第2分割画像D2が上流側に位置し、2ページ目の第1分割画像D1が下流側に位置する。つまり、ページ番号が上流側から昇順に並んでいる。
The first divided image D1 shown in FIG. 5 is located on the downstream side in the direction from the
また、図5に示す第2分割画像D2の第2文末領域ES2に位置する文字と、第1分割画像D1の第1文頭領域BS1に位置する文字とは、文字と文字とを繋げて意味を成す文字列である。具体的には、図5に示すように、第2文末領域ES2に位置する「and」という単語と、第1分割画像D1の第1文頭領域BS1に位置する「multifunction」という単語とは、「and multifunction」という単語の列となっている。 Further, the characters located in the second sentence end region ES2 of the second divided image D2 and the characters located in the first sentence beginning region BS1 of the first divided image D1 have meanings by connecting the characters. It is a character string to be formed. Specifically, as shown in FIG. 5, the word "and" located in the second sentence end region ES2 and the word "multifaction" located in the first sentence beginning region BS1 of the first divided image D1 are "multifunction". It is a sequence of words "and partition".
図5に示すように、文字と文字とを繋げて意味をなす文字列とする場合、第1抽出部212は、分割データの各々から文字を抽出する。例えば、制御部21が分割データごとに生成したテキストデータに基づいて、第1抽出部212は、文字又は文字列を抽出する。具体的には、第1抽出部212は、図4に示す第1分割画像D1に含まれる文書の第1文頭領域BS1から「multifunction」という単語を抽出する。第1分割画像D1に含まれる文書は、「第1文書」の一例に相当する。第1文頭領域BS1から抽出した単語は、「第1文字」の一例に相当する。そして、第1抽出部212は、図4に示す第2分割画像D2に含まれる文書の第2文末領域ES2から「and」という単語を抽出する。第2分割画像D2に含まれる文書は、「第2文書」の一例に相当する。第2文末領域ES2から抽出した単語は、「第2文字」の一例に相当する。
As shown in FIG. 5, when connecting characters to form a meaningful character string, the
そして、第1決定部213は、学習部218に第1文字と第2文字とを入力する。更に学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。例えば、学習部218には、第2文末領域ES2の「and」と第1文頭領域BS1の「multifunction」とが入力される。そして、学習部218は、「and」と「multifunction」との繋がりの程度を示す推定結果を出力する。
Then, the
また、第1抽出部212は、図4に示す第1分割画像D1の第1文末領域ES1と第2分割画像D2の第2文頭領域BS2とから文字を抽出してもよい。具体的には、第1抽出部212は、図4に示す第1分割画像D1の第1文末領域ES1から「optimally」という単語を抽出する。第1抽出部212は、図4に示す第2分割データを示す第2分割画像D2の第2文頭領域BS2から「Tokkyo」という単語を抽出する。
Further, the
そして、第1決定部213は、学習部218に第1文字と第2文字とを入力する。更に学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。例えば、学習部218には、第1文末領域ES1の「optimally」と第2文頭領域BS2の「Tokkyo」とが入力される。そして、学習部218は、「optimally」と「Tokkyo」との繋がりの程度を示す推定結果を出力する。
Then, the
そして、第1決定部213は、学習部218が出力する第1文字と第2文字との繋がりの程度を示す推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。具体的には、「and」と「multifunction」との繋がりの程度を示す推定結果と「optimally」と「Tokkyo」との繋がりの程度を示す推定結果とを比較して、繋がりの程度が大きい推定結果に基づいて、第1決定部213は第1分割データと第2分割データとの順序を決定する。
Then, the
更に、制御部21は、第1決定部213の決定に基づいて、操作表示部4が第1分割画像D1と第2分割画像D2とを表示するように、操作表示部4を制御する。したがって、図5に示すように、第1分割画像D1と第2分割画像D2とは、ページの順に並ぶ。この結果、第1分割画像D1と第2分割画像D2とを続けて読むことができる。
Further, the
また、学習部218の推定結果と第1決定部213の決定結果とは、学習部218に学習される。したがって、学習部218は、文書データとページ番号と推定結果と決定結果とで再学習する。この結果、精度の良い推定結果を出力できる。
Further, the estimation result of the
次に、図6を参照して、実施形態1の制御部21が実行する処理を説明する。図6は、制御部21が実行する処理のフローチャートを示す。制御部21が実行する処理は、ステップS101〜ステップS108を含む。
Next, the process executed by the
ステップS101において、制御部21は、操作表示部4が選択画面50を表示するように、操作表示部4を制御する。処理は、ステップS102に進む。
In step S101, the
ステップS102において、制御部21は、操作表示部4から取得した信号が画像データを分割する指示を含むか否かを判定する。画像データを分割する指示を含まない場合(ステップS102において、No)、処理は終了する。画像データを分割する指示を含む場合(ステップS102において、Yes)、処理はステップS103に進む。
In step S102, the
ステップS102でYesの場合、ステップS103において、制御部21は、画像読取ユニット2が生成した撮像データを取得する。処理は、ステップS104に進む。
In the case of Yes in step S102, in step S103, the
ステップS104において、分割部211は、撮像データを文書ごとに分割して、分割データを生成する。処理は、ステップS105に進む。
In step S104, the
ステップS105において、制御部21は、分割データに対して文字画像の検索を実行し、文書に対応するテキスト情報を取得する。処理は、ステップS106に進む。
In step S105, the
ステップS106において、制御部21は、文字画像の取得率に基づいて、分割データの向きを修正する。具体的には、制御部21は、文字画像を最も多く検索できた向きに分割データの向きを修正する。処理は、ステップS107に進む。
In step S106, the
ステップS107において、制御部21は、第1決定処理を実行する。第1決定処理については、図7を参照して後述する。処理は、ステップS108に進む。
In step S107, the
ステップS108において、学習部218は、文書データとページ番号と推定結果と決定結果とを学習する。処理は、終了する。
In step S108, the
次に、図7を参照して、制御部21が実行する第1決定処理を説明する。図7は、第1決定処理のフローチャートを示す図である。第1決定処理は、ステップS201〜ステップS210を含む。図7に示す第1決定処理は、図6に示すステップS107に対応する。
Next, the first determination process executed by the
ステップS201において、第1抽出部212は、第1分割データが含む第1文書の第1文末領域ES1から第1文字を抽出する。処理は、ステップS202に進む。
In step S201, the
ステップS202において、第1抽出部212は、第2分割データが含む第2文書の第2文頭領域BS2から第2文字を抽出する。処理は、ステップS203に進む。
In step S202, the
ステップS203において、第1決定部213は、第1文書の文末に位置する第1文字と第2文書の文頭に位置する第2文字とを学習部218に入力する。処理は、ステップS204に進む。
In step S203, the
ステップS204において、学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。処理は、ステップS205に進む。
In step S204, the
ステップS205において、第1抽出部212は、第1分割データが含む第1文書の第1文頭領域BS1から第1文字を抽出する。処理は、ステップS206に進む。
In step S205, the
ステップS206において、第1抽出部212は、第2分割データが含む第2文書の第2文末領域ES2から第2文字を抽出する。処理は、ステップS207に進む。
In step S206, the
ステップS207において、第1決定部213は、第1文書の文頭に位置する第1文字と第2文書の文末に位置する第2文字とを学習部218に入力する。処理は、ステップS208に進む。
In step S207, the
ステップS208において、学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。処理は、ステップS209に進む。
In step S208, the
ステップS209において、制御部21は、他に分割データがあるか否かを判定する。他に分割データがある場合(ステップS209において、Yes)、処理はステップS201に戻る。他に分割データがない場合(ステップS209において、No)、処理はステップS210に進む。
In step S209, the
ステップS209でNoの場合、ステップS210において、第1決定部213は、第1分割データと第2分割データとの順序を決定する。処理は図6に示すステップS108に戻る。
If No in step S209, in step S210, the
[実施形態2]
次に、図8を参照して、実施形態2の画像形成装置100を説明する。実施形態2の画像形成装置100は、第2抽出部214、第2決定部215、判定部216、及び選択部217を有する点で、実施形態1の画像形成装置100と異なる。以下、実施形態2について、実施形態1と異なる事項について説明し、実施形態1と重複する部分についての説明は割愛する。
[Embodiment 2]
Next, the
図8は、実施形態2の制御部21の構成を示す図である。制御部21は、分割部211、第1抽出部212、第1決定部213、学習部218、第2抽出部214、及び第2決定部215を含む。制御部21は、制御プログラムを実行することで、分割部211、第1抽出部212、第1決定部213、学習部218、第2抽出部214、及び第2決定部215として機能する。分割部211、第1抽出部212、第1決定部213、及び学習部218については、実施形態1と同様のため、説明を省略する。
FIG. 8 is a diagram showing the configuration of the
第2抽出部214は、文書の所定領域に位置する記号を抽出する。記号は、文字及び数字を含む。文書の所定領域は、文書のヘッダーの領域又は文書のフッターの領域を含む。したがって、第2抽出部214は、文書に付されたページ番号を取得できる。
The
第2決定部215は、第2抽出部214の抽出結果に基づいて、第1分割データと第2分割データとの順序を決定する。第1決定部213の結果に合わせて第2決定部215の結果も取得できる。この結果、精度良く第1分割データと第2分割データとの順序を決定できる。
The
次に、図8〜図10を参照して、第2決定部215が第1分割データと第2分割データとの順序を決定する処理を説明する。図9は、分割データを示す分割画像Dを表示した表示画面110を示す図である。図9に示すように、表示画面110は、第1表示領域111と第2表示領域112とを含む。
Next, a process in which the
第1表示領域111は、撮像データを示す撮像画像RG2を表示するプレビュー画像113と戻るボタン114とが表示される。図9に示す撮像画像RG2は、4つの画像を1枚のシートRに集約した「4in1」の画像である。
In the
第2表示領域112には、分割データを示す複数の分割画像Dが表示される。図9に示す複数の分割画像Dは、第1分割画像D1と第2分割画像D2と第3分割画像D3と第4分割画像D4とを含む。
In the
第1分割画像D1は、例えば、複数のページのうちの3ページ目の文書を示す画像である。第1分割画像D1は、文書を含む。第1分割画像D1は、第1文頭領域BS1と第1文末領域ES1と第1抽出領域CT1とを含む。図9に示す第1分割画像D1の第1文頭領域BS1には、「arranges・・・・」という文字列が位置する。図9に示す第1分割画像D1の第1文末領域ES1には、「・・・which provides」という文字列が位置する。図9に示す第1分割画像D1の第1抽出領域CT1には、「3」という記号が位置する。 The first divided image D1 is, for example, an image showing a document on the third page of a plurality of pages. The first divided image D1 includes a document. The first divided image D1 includes a first sentence beginning region BS1, a first sentence ending region ES1, and a first extraction region CT1. The character string "arranges ..." is located in the first sentence head region BS1 of the first divided image D1 shown in FIG. The character string "... has products" is located in the first sentence end region ES1 of the first divided image D1 shown in FIG. The symbol "3" is located in the first extraction region CT1 of the first divided image D1 shown in FIG.
第2分割画像D2は、例えば、複数のページのうちの4ページ目の文書を示す画像である。第2分割画像D2は、文書を含む。第2分割画像D2は、第2文頭領域BS2と第2文末領域ES2と第2抽出領域CT2とを含む。図9に示す第2分割画像D2の第2文頭領域BS2には、「comprehensive services・・・・」という文字列が位置する。図9に示す第2分割画像D2の第2文末領域ES2には、「・・・・in the UK.」という文字列が位置する。図9に示す第2分割画像D2の第2抽出領域CT2には、「4」という記号が位置する。 The second divided image D2 is, for example, an image showing a document on the fourth page of a plurality of pages. The second divided image D2 includes a document. The second divided image D2 includes the second sentence beginning region BS2, the second sentence ending region ES2, and the second extraction region CT2. The character string "comprehensive services ..." is located in the second sentence head region BS2 of the second divided image D2 shown in FIG. The character string "... in the UK." Is located in the second sentence end region ES2 of the second divided image D2 shown in FIG. The symbol "4" is located in the second extraction region CT2 of the second divided image D2 shown in FIG.
第3分割画像D3は、例えば、複数のページのうちの1ページ目の文書を示す画像である。第3分割画像D3は、文書を含む。第3分割画像D3は、第3文頭領域BS3と第3文末領域ES3と第3抽出領域CT3とを含む。図9に示す第3分割画像D3の第3文頭領域BS3には、「Tokkyo Co.,Ltd.・・・・」という文字列が位置する。図9に示す第3分割画像D3の第3文末領域ES3には、「・・・・printers and」という文字列が位置する。図9に示す第3分割画像D3の第3抽出領域CT3には、「1」という記号が位置する。 The third divided image D3 is, for example, an image showing a document on the first page of a plurality of pages. The third divided image D3 includes a document. The third divided image D3 includes a third sentence beginning region BS3, a third sentence ending region ES3, and a third extraction region CT3. The character string "Tokyo Co., Ltd ...." is located in the third sentence head region BS3 of the third divided image D3 shown in FIG. The character string "... printers and" is located in the third sentence end region ES3 of the third divided image D3 shown in FIG. The symbol "1" is located in the third extraction region CT3 of the third divided image D3 shown in FIG.
第4分割画像D4は、例えば、複数のページのうちの2ページ目の文書を示す画像である。第4分割画像D4は、文書を含む。第4分割画像D4は、第4文頭領域BS4と第4文末領域ES4と第4抽出領域CT4とを含む。図9に示す第4分割画像D4の第4文頭領域BS4には、「multifunction devices・・・・」という文字列が位置する。図9に示す第4分割画像D4の第4文末領域ES4には、「・・・・optimally」という文字列が位置する。図9に示す第4分割画像D4の第4抽出領域CT4には、「2」という記号が位置する。 The fourth divided image D4 is, for example, an image showing a document on the second page of a plurality of pages. The fourth divided image D4 includes a document. The fourth divided image D4 includes the fourth sentence beginning region BS4, the fourth sentence ending region ES4, and the fourth extraction region CT4. The character string "multifunction devices ..." is located in the fourth sentence head region BS4 of the fourth divided image D4 shown in FIG. The character string "... optimally" is located in the fourth sentence end region ES4 of the fourth divided image D4 shown in FIG. The symbol "2" is located in the fourth extraction region CT4 of the fourth divided image D4 shown in FIG.
また、図9に示す第1分割画像D1と第3分割画像D3とは、第1表示領域111から第2表示領域112へ向かう方向の上流側に位置する。第2分割画像D2と第4分割画像D4とは、第1表示領域111から第2表示領域112へ向かう方向の下流側に位置する。したがって、3ページ目を示す第1分割画像D1は、2ページ目を示す第4分割画像D4よりも上流に位置する。
Further, the first divided image D1 and the third divided image D3 shown in FIG. 9 are located on the upstream side in the direction from the
また、図9に示す第1分割画像D1と第2分割画像D2とは、プレビュー画像113から戻るボタン114へ向かう方向の上流側に位置する。第3分割画像D3と第4分割画像D4とは、プレビュー画像113から戻るボタン114へ向かう方向の下流側に位置する。したがって、3ページ目を示す第1分割画像D1及び4ページ目を示す第2分割画像D2は、1ページ目を示す第3分割画像D3及び2ページ目を示す第4分割画像D4よりも上流に位置する。したがって、3ページ目を示す第1分割画像D1は、1ページ目を示す第3分割画像D3よりも上流に位置する。つまり、図9に示す第1分割画像D1〜第4分割画像D4は、順序通り並んでいない。
Further, the first divided image D1 and the second divided image D2 shown in FIG. 9 are located on the upstream side in the direction from the
図10は、分割データを示す分割画像Dを表示した表示画面110を示す別の図である。図10に示すように、表示画面110は、第1表示領域111と第2表示領域112とを含む。
FIG. 10 is another diagram showing a
第1表示領域111は、撮像データを示す撮像画像RG2を表示するプレビュー画像113と戻るボタン114とが表示される。第2表示領域112には、分割データを示す複数の分割画像Dが表示される。図10に示す複数の分割画像Dは、第1分割画像D1と第2分割画像D2と第3分割画像D3と第4分割画像D4とを含む。
In the
また、図10に示す第3分割画像D3と第1分割画像D1とは、第1表示領域111から第2表示領域112へ向かう方向の上流側に位置する。第4分割画像D4と第2分割画像D2とは、第1表示領域111から第2表示領域112へ向かう方向の下流側に位置する。したがって、1ページ目を示す第3分割画像D3は、2ページ目を示す第4分割画像D4よりも上流に位置する。また、3ページ目を示す第1分割画像D1は、第4ページ目を示す第2分割画像D2よりも上流に位置する。
Further, the third divided image D3 and the first divided image D1 shown in FIG. 10 are located on the upstream side in the direction from the
また、図10に示す第3分割画像D3と第4分割画像D4とはプレビュー画像113から戻るボタン114へ向かう方向の上流側に位置する。図10に示す第1分割画像D1と第2分割画像D2とはプレビュー画像113から戻るボタン114へ向かう方向の下流側に位置する。したがって、第2ページ目を示す第4分割画像D4は、第1分割画像D1及び第2分割画像D2よりも上流に位置する。つまり、図10に示す第1分割画像D1〜第4分割画像D4は、昇順に並んでいる。
Further, the third divided image D3 and the fourth divided image D4 shown in FIG. 10 are located on the upstream side in the direction from the
図10に示すように、第1分割画像D1〜第4分割画像D4を昇順に並べる場合、第2抽出部214は、分割データの各々から記号を抽出する。例えば、制御部21が分割データごとに生成したテキストデータに基づいて、第2抽出部214は、文字を抽出する。具体的には、第2抽出214は、図9に示す第1分割画像D1の第1抽出領域CT1から「3」という数字を抽出する。第2抽出214は、第2分割画像D2の第2抽出領域CT2から「4」という数字を抽出する。第2抽出214は、第3分割画像D3の第3抽出領域CT3から「1」という数字を抽出する。第2抽出214は、第4分割画像D4の第4抽出領域CT4から「2」という数字を抽出する。
As shown in FIG. 10, when the first divided images D1 to the fourth divided images D4 are arranged in ascending order, the
そして、第2決定部215は、第2抽出部214の抽出結果に基づいて、第1分割データ、第2分割データ、第3分割データ、及び第4分割データの順序を決定する。したがって、1分割データ、第2分割データ、第3分割データ、及び第4分割データが順番に並ぶ。この結果、ユーザーが分割データを並べる手間を抑制できる。
Then, the
引き続き、図9と図10とを参照して、分割データが2以上の場合の第1抽出部212と第1決定部213との処理を説明する。実施形態2の制御部21は、第1決定部213の決定結果と第2決定部215の決定結果とを取得できる。
Subsequently, with reference to FIGS. 9 and 10, the processing of the
制御部21が分割データごとに生成したテキストデータに基づいて、第1抽出部212は、文字を抽出する。具体的には、第1抽出部212は、図9に示す第1分割画像D1に含まれる文書の第1文頭領域BS1から「arranges」という単語を抽出する。第1分割画像D1に含まれる文書は、「第1文書」の一例に相当する。第1文頭領域BS1から抽出した単語は、「第1文字」の一例に相当する。
The
そして、第1抽出部212は、図9に示す第2分割画像D2に含まれる文書の第2文末領域ES2から「UK.」という単語を抽出する。第2分割画像D2に含まれる文書は、「第2文書」の一例に相当する。第2文末領域ES2から抽出した単語は、「第2文字」の一例に相当する。
Then, the
そして、第1抽出部212は、図9に示す第3分割画像D3に含まれる文書の第3文末領域ES3から「and」という単語を抽出する。第3分割画像D3含まれる文書は、「第2文書」の一例に相当する。第3文末領域ES3から抽出した単語は、「第2文字」の一例に相当する。
Then, the
そして、第1抽出部212は、図9に示す第4分割画像D4に含まれる文書の第4文末領域ES4から「optimally」という単語を抽出する。第4分割画像D4含まれる文書は、「第2文書」の一例に相当する。第4文末領域ES4から抽出した単語は、「第2文字」の一例に相当する。
Then, the
そして、第1決定部213は、学習部218に第1文字と第2文字とを入力する。更に学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。
Then, the
例えば、学習部218には、第2文末領域ES2の「UK.」と第1文頭領域BS1の「arranges」とが入力される。そして、学習部218は、「UK.」と「arranges」との繋がりの程度を示す第1推定結果を出力する。
For example, "UK." In the second sentence end region ES2 and "arranges" in the first sentence beginning region BS1 are input to the
例えば、学習部218には、第3文末領域ES3の「and」と第1文頭領域BS1の「arranges」とが入力される。そして、学習部218は、「and」と「arranges」との繋がりの程度を示す第2推定結果を出力する。
For example, “and” of the third sentence end region ES3 and “arranges” of the first sentence beginning region BS1 are input to the
例えば、学習部218には、第4文末領域ES4の「optimally」と第1文頭領域BS1の「arranges」とが入力される。そして、学習部218は、「optimally」と「arranges」との繋がりの程度を示す第3推定結果を出力する。
For example, “optimally” of the fourth sentence end region ES4 and “arranges” of the first sentence beginning region BS1 are input to the
そして、第1決定部213は、学習部218が出力する第1文字と第2文字との繋がりの程度を示す推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。具体的には、第1推定結果、第2推定結果、及び第3推定結果を比較して、繋がりの程度が大きい推定結果に基づいて、第1決定部213は第1分割データと第2分割データとの順序を決定する。
Then, the
更に、第1抽出部212は、分割画像Dごとに、同様の処理を繰り返す。また、第1抽出部212が処理を実行する毎に、第1決定部213は第1分割データと第2分割データとの順序を決定する。そして、制御部21は、第1決定部213の決定結果に基づいて、図10に示すように、第1分割画像D1〜第4分割画像D4をページの順序に表示する。この結果、第1分割画像D1〜第4分割画像D4を続けて読むことができる。
Further, the
引き続き、図8〜図10を参照して、実施形態2の制御部21について更に詳しく説明する。制御部21は、判定部216、及び選択部217を更に含む。制御部21は、制御プログラムを実行することで、判定部216、及び選択部217として機能する。
Subsequently, the
判定部216は、第1決定部213の決定結果と第2決定部215の決定結果とが一致するか否かを判定する。したがって、第1決定部213の決定結果と第2決定部215の決定結果とが一致する場合は、第1決定部213と第2決定部215との精度が高いと判断できる。また、第1決定部213の決定結果と第2決定部215の決定結果とが一致しない場合は、第1決定部213と第2決定部215とのいずれか一方の精度が低いと判断できる。この結果、判定部216の判定結果をトリガーに、第1決定部213と第2決定部215の優劣を判断できる。
The
選択部217は、第1決定部213の決定結果と第2決定部215の決定結果とのうちのいずれか一方の決定結果を選択する。具体的には、決定結果が一致すると判定部216が判定する場合、選択部217は第1決定部213の決定結果を選択する。また、決定結果が一致しないと判定部216が判定する場合、選択部217は第1決定部213の決定結果と第2決定部215の決定結果とのうちのいずれか一方の決定結果を選択する。第1結果と第2結果とが異なる場合、第1結果と第2結果とのうち、どちらかの結果が優先される。したがって、精度よく第1文書と第2文書の順序を決定できる決定部の結果を採用できる。この結果、ユーザーが第1分割データと第2分割データとの順序を決定する手間を抑制できる。
The
例えば、ユーザーは、決定結果が一致しない場合、第2決定部215の決定結果を選択することを予め記憶部22に記憶させる。したがって、決定結果が一致しないと判定部216が判定する場合、選択部217は、第2決定部215の決定結果を選択する。この結果、学習部218の学習が進んでいない場合、第2決定部215の決定結果を選択することで精度良く分割データの順序を決定できる。
For example, when the determination results do not match, the user stores in advance in the
また、学習部218の学習が進んだ場合、ユーザーは第1決定部213の決定結果を選択することを予め記憶部22に記憶させる。したがって、決定結果が一致しないと判定部216が判定する場合、選択部217は、第1決定部213の決定結果を選択する。この結果、学習が進んで精度が向上した推定結果に基づいて決定された第1決定部213の決定結果を選択できるため、精度良く分割データの順序を決定できる。
Further, when the learning of the
次に、図11を参照して、実施形態2の制御部21が実行する処理を説明する。図11は、制御部21が実行する処理のフローチャートを示す。制御部21が実行する処理は、ステップS301〜ステップS310を含む。図11に示すステップS301〜ステップS307は、図6に示すステップS101〜ステップS107に対応しており、同様の処理を実行する。
Next, the process executed by the
ステップS307の後に、ステップS308において、制御部21は、第2決定処理を実行する。第2決定処理は、図12を参照して後述する。処理は、ステップS309に進む。
After step S307, in step S308, the
ステップS309において、制御部21は、選択処理を実行する。選択処理は、図13を参照して後述する。処理はステップS310に進む。
In step S309, the
ステップS310において、学習部218は、文書データとページ番号と推定結果と第1決定部213の決定結果と第2決定部215の決定結果とを学習する。処理は、終了する。
In step S310, the
次に、図12を参照して、第2決定処理を説明する。図12は、制御部21が実行する第2決定処理のフローチャートを示す。制御部21が実行する第2決定処理は、ステップS401〜ステップS403を含む。第2決定処理は、図11に示すステップS308に対応する。
Next, the second determination process will be described with reference to FIG. FIG. 12 shows a flowchart of the second determination process executed by the
ステップS401において、第2抽出部214は、分割データに含まれる文書の抽出領域CTに位置する記号を抽出する。処理はステップS402に進む。
In step S401, the
ステップS402において、制御部21は、他の分割データがあるか否かを判定する。他の分割データがある場合(ステップS402において、Yes)、処理はステップS401に戻る。他の分割データがない場合(ステップS402において、No)、処理はステップS403に進む。
In step S402, the
ステップS403において、第2決定部215は、第1分割データと第2分割データとの順序を決定する。処理は、図11に示すステップS309に戻る。
In step S403, the
次に、図13を参照して、選択処理を説明する。図13は、制御部21が実行する選択処理のフローチャートを示す。制御部21が実行する選択処理は、ステップS501〜ステップS503を含む。選択処理は、図11に示すステップS309に対応する。
Next, the selection process will be described with reference to FIG. FIG. 13 shows a flowchart of the selection process executed by the
ステップS501において、判定部216は、第1決定部213の決定結果と第2決定部215の決定結果とが一致するか否かを判定する。決定結果が一致する場合(ステップS501において、Yes)、処理はステップS502に進む。決定結果が一致しない場合(ステップS501において、No)、処理はステップS503に進む。
In step S501, the
ステップS502でNoの場合、ステップS503において、選択部217は予め定められた決定結果を選択する。処理は、図11に示すステップS310に戻る。
If No in step S502, in step S503, the
ステップS502でYesの場合、ステップS502において、選択部217は第1決定部213の決定結果を選択する。処理は、図11に示すステップS310に戻る。
In the case of Yes in step S502, in step S502, the
以上、図面を参照しながら本発明の実施形態を説明した。但し、本発明は、上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲で種々の態様において実施することが可能である。また、上記の各実施形態に開示されている複数の構成要素を適宜組み合わせることによって、種々の発明の形成が可能である。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。図面は、理解しやすくするために、それぞれの構成要素を主体に模式的に示しており、図示された各構成要素の厚み、長さ、個数、間隔等は、図面作成の都合上から実際とは異なる。また、上記の実施形態で示す各構成要素の速度、材質、形状、寸法等は一例であって、特に限定されるものではなく、本発明の構成から実質的に逸脱しない範囲で種々の変更が可能である。 The embodiments of the present invention have been described above with reference to the drawings. However, the present invention is not limited to the above-described embodiment, and can be implemented in various embodiments without departing from the gist thereof. In addition, various inventions can be formed by appropriately combining the plurality of components disclosed in each of the above embodiments. For example, some components may be removed from all the components shown in the embodiments. Further, components over different embodiments may be combined as appropriate. In order to make the drawings easier to understand, each component is schematically shown, and the thickness, length, number, spacing, etc. of each component shown are actual for the convenience of drawing creation. Is different. Further, the speed, material, shape, dimensions, etc. of each component shown in the above embodiment are merely examples, and are not particularly limited, and various changes can be made without substantially deviating from the configuration of the present invention. It is possible.
(1)実施形態2の選択部217は、決定結果が一致しないと判定部216が判定する場合、選択部217は予め定められた決定部の決定結果を選択した。しかし、制御部21は、決定結果が一致しない場合、ユーザーに分割データの順序を決定させてもよい。そして、ユーザーが決定した順序を学習部218が学習する。したがって、学習部218は精度良く学習できる。この結果、学習部218は、精度の良い推定結果を出力できる。
(1) When the
本発明は、画像形成装置の分野に利用可能である。 The present invention can be used in the field of image forming apparatus.
2 画像読取ユニット(撮像部)
21 制御部
100 画像形成装置
211 分割部
212 第1抽出部
213 第1決定部
214 第2抽出部
214 第2抽出
215 第2決定部
216 判定部
217 選択部
218 学習部
CT 抽出領域(所定領域)
P シート
R シート
2 Image reading unit (imaging unit)
21
P sheet R sheet
Claims (10)
文字と文字との繋がりを推定するために、前記文書を含む文書データを学習する学習部と、
複数の文書が集約されて形成されたシートを撮像して、撮像データを生成する撮像部と、
前記撮像データを1ページ分の前記文書ごとに分割して、複数の分割データを生成する分割部と、
前記分割データの各々から文字を抽出する第1抽出部と、
を備え、
前記分割データは、第1分割データと前記第1分割データと異なる第2分割データとを含み、
前記第1抽出部は、
前記第1分割データが含む第1文書から第1文字を抽出し、
前記第2分割データが含む第2文書から第2文字を抽出し、
前記第1文書は、前記1ページ分の前記分割データによって表される文書を示し、
前記第2文書は、前記第1文書と異なる前記1ページ分の前記分割データによって表される文書を示し、
前記第1文字は前記第1文書の記載が始まる位置を示す文頭又は前記第1文書の記載が終わる位置を示す文末のうち、いずれか一方の位置に含まれる文字であり、
前記第2文字は前記第2文書の記載が始まる位置を示す文頭又は前記第2文書の記載が終わる位置を示す文末のうち、前記第1文字が含まれる位置と異なる位置の文字であり、
前記学習部は、前記第1文字と前記第2文字とが入力されることで、前記第1文字と前記第2文字との繋がりの程度を示す推定結果を出力する、画像形成装置。 An image forming apparatus that forms a document on a sheet based on document data indicating a document.
A learning unit that learns document data including the above documents in order to estimate the connection between characters,
An imaging unit that generates imaging data by imaging a sheet formed by aggregating multiple documents,
A division unit that divides the imaging data into one page of the document to generate a plurality of division data, and
A first extraction unit that extracts characters from each of the divided data,
With
The divided data includes a first divided data and a second divided data different from the first divided data.
The first extraction unit
The first character is extracted from the first document included in the first partition data,
The second character is extracted from the second document included in the second divided data, and
The first document indicates a document represented by the divided data for one page.
The second document indicates a document represented by the divided data for one page different from the first document.
The first character is a character included in either the beginning of a sentence indicating the position where the description of the first document starts or the end of the sentence indicating the position where the description of the first document ends.
The second character is a character at a position different from the position including the first character in the beginning of the sentence indicating the position where the description of the second document starts or the end of the sentence indicating the position where the description of the second document ends.
The learning unit is an image forming apparatus that outputs an estimation result indicating the degree of connection between the first character and the second character by inputting the first character and the second character.
前記第1文書の文末に位置する前記第1文字を抽出し、
前記第2文書の文頭に位置する前記第2文字を抽出する、請求項1から請求項4のいずれか1項に記載の画像形成装置。 The first extraction unit
The first character located at the end of the first document is extracted and
The image forming apparatus according to any one of claims 1 to 4, which extracts the second character located at the beginning of the sentence of the second document.
前記第1文書の文頭に位置する前記第1文字を抽出し、
前記第2文書の文末に位置する前記第2文字を抽出する、請求項1から請求項5のいずれか1項に記載の画像形成装置。 The first extraction unit
The first character located at the beginning of the first document is extracted and
The image forming apparatus according to any one of claims 1 to 5, which extracts the second character located at the end of the sentence of the second document.
前記第2抽出部の抽出結果に基づいて、前記第1分割データと前記第2分割データとの順序を決定する第2決定部と
を更に備える、請求項7に記載の画像形成装置。 A second extraction unit that extracts symbols located in a predetermined area of the document, and
The image forming apparatus according to claim 7, further comprising a second determination unit that determines the order of the first division data and the second division data based on the extraction result of the second extraction unit.
前記第1決定部の決定結果又は前記第2決定部の決定結果を選択する選択部と
を更に備え、
前記第1決定部の決定結果と前記第2決定部の決定結果とが一致しないと前記判定部が判定する場合、前記選択部は前記第1決定部の決定結果と前記第2決定部の決定結果とのうちのいずれか一方の決定結果を選択する、請求項8に記載の画像形成装置。 A determination unit that determines whether or not the determination result of the first determination unit and the determination result of the second determination unit match.
Further provided with a selection unit for selecting the determination result of the first determination unit or the determination result of the second determination unit.
When the determination unit determines that the determination result of the first determination unit and the determination result of the second determination unit do not match, the selection unit determines the determination result of the first determination unit and the determination of the second determination unit. The image forming apparatus according to claim 8, wherein a determination result of either one of the results is selected.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019077116A JP2020178168A (en) | 2019-04-15 | 2019-04-15 | Image forming apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019077116A JP2020178168A (en) | 2019-04-15 | 2019-04-15 | Image forming apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020178168A true JP2020178168A (en) | 2020-10-29 |
Family
ID=72937115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019077116A Pending JP2020178168A (en) | 2019-04-15 | 2019-04-15 | Image forming apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020178168A (en) |
-
2019
- 2019-04-15 JP JP2019077116A patent/JP2020178168A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4311738B2 (en) | Image forming apparatus, control method therefor, and computer program | |
US7797150B2 (en) | Translation system using a translation database, translation using a translation database, method using a translation database, and program for translation using a translation database | |
JP5138736B2 (en) | Character input device and character input method | |
US20100138757A1 (en) | Display control apparatus, image forming apparatus, and computer-readable recording medium storing display control program | |
US10810383B2 (en) | Image processing apparatus for comparing documents in different languages | |
JP5880052B2 (en) | Document processing apparatus and program | |
JP5631925B2 (en) | Image forming apparatus | |
US10902223B2 (en) | Image processing apparatus | |
JP2020178168A (en) | Image forming apparatus | |
US8970919B2 (en) | Display/input device and image forming apparatus including display/input device | |
JP2011155548A (en) | Device, program and method for creation of file | |
JP6601143B2 (en) | Printing device | |
JP2006276918A (en) | Translating device, translating method and program | |
JP2018077794A (en) | Image processing device and image forming apparatus | |
JP5618921B2 (en) | Character input device and image forming apparatus having the same | |
JP2007034430A (en) | Translation device, translation method, and program | |
JP7409102B2 (en) | Information processing device and image forming device | |
JP5742279B2 (en) | Instruction execution apparatus, instruction execution program, and image forming system | |
JP5712327B2 (en) | Display input device and image forming apparatus having the same | |
US11044372B2 (en) | Image forming apparatus | |
JP2013030916A (en) | Image processing apparatus and image forming apparatus including the same | |
US20230039512A1 (en) | Image processing apparatus and image forming apparatus capable of classifying respective images of plurality of pages of original document based on plurality of topic words | |
JP2010067208A (en) | Display controller, image forming apparatus, and display control program | |
JP2023031411A (en) | Image forming apparatus | |
JP2024097247A (en) | Image forming device |